[1]姬晓飞,谢旋,任艳.深度学习的双人交互行为识别与预测算法研究[J].智能系统学报,2020,15(3):484-490.[doi:10.11992/tis.201812029]
JI Xiaofei,XIE Xuan,REN Yan.Human interaction recognition and prediction algorithm based on deep learning[J].CAAI Transactions on Intelligent Systems,2020,15(3):484-490.[doi:10.11992/tis.201812029]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
15
期数:
2020年第3期
页码:
484-490
栏目:
学术论文—智能系统
出版日期:
2020-05-05
- Title:
-
Human interaction recognition and prediction algorithm based on deep learning
- 作者:
-
姬晓飞, 谢旋, 任艳
-
沈阳航空航天大学 自动化学院,辽宁 沈阳 110136
- Author(s):
-
JI Xiaofei, XIE Xuan, REN Yan
-
School of Automation, Shenyang Aerospace University, Shenyang 110136, China
-
- 关键词:
-
视频分析; 行为识别; 行为预测; 深度学习; 卷积神经网络; 长短期记忆网络; UT-interaction数据库; SBU Kinect interaction数据库
- Keywords:
-
video analysis; action recognition; action prediction; deep learning; convolutional neural network; long short term memory; UT-interaction dataset; SBU Kinect interaction dataset
- 分类号:
-
TP391.4
- DOI:
-
10.11992/tis.201812029
- 摘要:
-
基于卷积神经网络的双人交互行为识别算法存在提取的深度特征无法有效表征交互行为序列特性的问题,本文将长短期记忆网络与卷积神经网络模型相结合,提出了一种基于深度学习的双人交互行为识别与预测一体化方法。该方法在训练过程中,完成对卷积神经网络和长短期记忆网络模型的参数训练。在识别与预测过程中,将不同时间比例长度的未知动作类别的视频图像分别送入已经训练好的卷积神经网络模型提取深度特征,再将卷积神经网络提取的深度特征送入长短期记忆网络模型完成对双人交互行为的识别与预测。在国际公开的UT-interaction双人交互行为数据库进行测试的结果表明,该方法在保证计算量适当的同时对交互行为的正确识别率达到了92.31%,并且也可完成对未知动作的初步预测。
- Abstract:
-
A drawback of the human interaction recognition algorithm based on a convolutional neural network (CNN) is that the extracted depth features cannot effectively represent the characteristics of interaction sequences. Instead, this paper proposes a human interaction recognition and prediction algorithm based on deep learning, by combining the Long Short-Term Memory (LSTM) network with the CNN model. In the process, video images of unknown action categories of different time lengths are sent to a trained CNN model to extract the depth features. The depth features are then sent to a trained LSTM model to complete the recognition and prediction of the interaction behavior. When tested on the UT-interaction human interaction behavior dataset, the algorithm demonstrates a 92.31% correct human interaction recognition rate and can complete the preliminary prediction of unknown actions.
备注/Memo
收稿日期:2018-12-26。
基金项目:国家自然科学基金项目(61602321);辽宁省自然科学基金项目(201602557);辽宁省教育厅科学研究服务地方项目(L201708);辽宁省教育厅科学研究青年项目(L201745)
作者简介:姬晓飞,副教授,博士,主要研究方向为视频分析与处理、模式识别理论。承担国家自然科学基金、辽宁省自然科学基金等多项课题研究。发表学术论文40余篇,参与编著英文专著2部。;谢旋,硕士研究生,主要研究方向为生物特征识别与行为分析技术。;任艳,讲师,博士,主要研究方向为基于公理化模糊集的知识发现与表示、图像语义特征提取。承担国家自然科学基金、航空基金、辽宁省自然科学基金等课题研究。发表学术论文25篇
通讯作者:姬晓飞.E-mail:jixiaofei7804@126.com
更新日期/Last Update:
1900-01-01