CN109325440B - 人体动作识别方法及系统 - Google Patents
人体动作识别方法及系统 Download PDFInfo
- Publication number
- CN109325440B CN109325440B CN201811091488.8A CN201811091488A CN109325440B CN 109325440 B CN109325440 B CN 109325440B CN 201811091488 A CN201811091488 A CN 201811091488A CN 109325440 B CN109325440 B CN 109325440B
- Authority
- CN
- China
- Prior art keywords
- human body
- sequence
- lstm
- motion
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009471 action Effects 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 230000033001 locomotion Effects 0.000 claims description 48
- 238000000605 extraction Methods 0.000 claims description 8
- 239000013598 vector Substances 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 abstract description 3
- 238000011897 real-time detection Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人体动作识别方法及系统,方法包括:获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧;采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵;采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果。本发明用预训练好的深度模型能够充分提取图像的丰富特征,其次对于分类任务,传统机器学习算法对时序复杂问题表现力不足,本发明采用长短期记忆网络(LSTM)正是解决时序问题的有效方法。仅需一个摄像头,具有成本低、实时检测、准确性高等优点。
Description
技术领域
本发明涉及深度学习中人体动作识别技术领域,尤其涉及一种人体动作识别方法及系统。
背景技术
目前,在人体动作识别技术中,通常采用如下几种方式:
(1)对于接触式的识别广泛采用便携式的可穿戴工具传感器实时记录人体动作数据,包括加速度、角速度、GPS等,运用一定的数理统计方法进行识别判断。
(2)对于非接触式的识别一般先对识别目标ROI进行定位,然后用人工设计的特征对输入图像进行特征提取,然后采用一些分类算法(比如KNN、SVM算法)进行分类。
(3)近年来,随着深度学习技术的发展,基于预训练的深度网络、人体关节点坐标实时提取、长短期记忆网络深度技术,给人体动作识别带来了新的方向。
但是,现有的人体动作识别技术,存在以下缺点:
(1)以网球运动员为例,当网球运动员进行运动时,可穿戴设备对运动员会造成一种运动不便性,另外附带的传感器相对普通的摄像头价格高昂。
(2)网球运动员一个动作是一个多帧的连续时间序列,单帧图片无法判断球员的动作,使得人工设计的特征提取存在一定的局限性。
(3)人体关节点的2D坐标信息作为动作特征欠缺丰富性,不能够完全代表球员的整个动作过程,特征信息存在损失。
发明内容
本发明提供一种可以提高人体动作识别准确性,且成本低并能够实时检测的人体动作识别方法及系统。
为实现上述目的,本发明提供一种人体动作识别方法,所述人体动作识别方法包括以下步骤:
获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧;
采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵;
采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果。
其中,所述获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧的步骤包括:
获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,将分割后的动作序列输入预训练识别模型进行识别,提取动作序列,并获得预测分数,将预测分数低于预设分数阈值的动作序列舍弃,将预测分数高于预设分数阈值的动作序列保存,得到保存的动作序列的若干时序帧。
其中,所述采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵的步骤包括:
采用inception-v3网络模型对若干时序帧按照时间顺序进行图像特征提取,每张图像可以获得2048维特征向量,一个序列可以获得2048*S的特征矩阵,其中,S为该序列的总帧数。
其中,所述采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果的步骤包括:
所述LSTM网络模型包括若干LSTM单元,第一个LSTM单元采用初始网络状态和序列的第一个时间步进行预测,并将更新的网络状态输出到下一个LSTM单元,其中,每个LSTM单元从前一单元获取更新的网络状态并输出预测和新的更新的网络状态。
其中,所述获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧的步骤之前还包括:
设计LSTM网络模型。
其中,所述设计LSTM网络模型的步骤包括:
确定特征向量维度和LSTM隐含层单元个数;
根据预设的若干个动作类别进行监督训练,得到LSTM网络模型。
其中,所述人体动作识别至少包括:网球运动员动作识别。
本发明还提出一种人体动作识别系统,包括存储器、处理器、以及存储在所述存储器上的人体动作识别程序,所述人体动作识别程序被所述处理器运行时实现如上所述的人体动作识别方法的步骤。
本发明的有益效果为:对于球员的动作识别,用传统方法较难对球员的动作进行分析,主要在于特征的选择,在计算力和大数据的背景下,本发明用预训练好的深度模型能够充分提取图像的丰富特征,其次对于分类任务,传统机器学习算法对时序复杂问题表现力不足,本发明采用长短期记忆网络(LSTM)正是解决时序问题的有效方法。本发明基于深度学习技术,仅需一个摄像头,具有成本低、实时检测、准确性高等优点。
附图说明
图1是本发明人体动作识别方法实施例的流程示意图;
图2是本发明实施例中动作时间序列分割流程示意图;
图3是LSTM原理结构图;
图4是LSTM单元示意图;
图5是球员动作识别流程图;
图6是本发明的总流程示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,图1是本发明提出的人体动作识别方法实施例的流程示意图。
如图1所示,本发明实施例提出一种人体动作识别方法,所述人体动作识别方法包括以下步骤:
步骤S1,获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧;
步骤S2,采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵;
步骤S3,采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果。
其中,设计LSTM网络模型的步骤包括:
确定特征向量维度和LSTM隐含层单元个数;
根据预设的7个动作类别进行监督训练,得到LSTM网络模型。
其中,所述获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧的步骤包括:
获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,将分割后的动作序列输入预训练识别模型进行识别,提取动作序列,并获得预测分数,将预测分数低于预设分数阈值的动作序列舍弃,将预测分数高于预设分数阈值的动作序列保存,得到保存的动作序列的若干时序帧。
所述采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵的步骤包括:
采用inception-v3网络模型对若干时序帧按照时间顺序进行图像特征提取,每张图像可以获得2048维特征向量,一个序列可以获得2048*S的特征矩阵,其中,S为该序列的总帧数。
所述采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果的步骤包括:
所述LSTM网络模型包括若干LSTM单元,第一个LSTM单元采用初始网络状态和序列的第一个时间步进行预测,并将更新的网络状态输出到下一个LSTM单元,其中,每个LSTM单元从前一单元获取更新的网络状态并输出预测和新的更新的网络状态。
以下对本发明实施例方案进行详细阐述:
具体地,本发明方案应用场合广泛,包括但不仅限于网球运动员动作识别,其他运动项目识别分类,文本数据预测,语音识别等。本实施例以网球运动员动作识别进行举例。
网球运动员各类动作行为的识别,包括发球,单反,双反,反手截击,正手截击,正手,高压7个动作,其中,识别技术在其他智能领域也具有参考意义,动作类别根据实际情况设定。
本发明方案包含两个部分:CNN提取图像特征,LSTM预测分类结果。
主要概括为:对视频中的人体进行ROI分割,然后对其进行一段动作序列提取,获得的若干时序帧,用inception-v3网络进行特征提取,每张图像可以获得2048维特征向量,一个序列可以获得2048*S的特征矩阵。设计LSTM网络结构,主要是维度的确定和LSTM隐含层单元个数的确定,对于复杂任务,适当增加LSTM层数和隐含单元个数,最后根据7个动作类别进行有监督的训练。训练好后的网络对于新的样本特征输入到网络,即可进行识别。
更为具体地,对于动作时间序列分割:
一个比较完整的动作序列分割决定着识别的准确率,本发明中,通过视频自动识别分割和人工确认的方法进行。具体为输入一段视频,根据预训练的识别模型进行识别,给定一分数阈值,对于预测分数较低于阈值的就舍弃,高于分数阈值的就保存该序列。最后人工调整及确认该动作序列。流程如图2所示。
对于inception-v3提取图像序列特征:
针对上一步的结果,按照时间顺序提取图像特征,输入图像大小为299*299*3,提取“avg_pool”层的特征,使得这一层的特征reshape到2048*1大小,设第i个序列提取的特征矩阵大小为2048*S,每一列为单帧图像的特征,S为该序列的总长度。
对于LSTM网络分类:
LSTM是RNN网络中的一种,可以学习长期依赖的问题。一个LSTM单元中有4个不同的结构,分别为input gate、forget gate、input modulation gate、output gate,他们以一种非常特殊的方式进行交互,如图3、图4所示。
具体其交互方式为:图3是图5中LSTM层的具体内部结构,而图4是图3中LSTM单元的内部结构。图3中的X为特征矩阵,t为动作序列的时刻值,D为特征矩阵的维度,S为动作序列的长度,其余数学符号由以下公式所述。
其计算公式如下:
细胞状态(cell state):
ct=ft⊙ct-1+it⊙gt
输出状态(output state):
ht=ot⊙tanh(ct)
输入门(input gate):
it=σ(Wixt+Riht-1+bi)
遗忘门(forget gate):
ft=σ(Wfxt+Rfht-1+bf)
输入调制门(input modulation gate):
gt=σ(Wgxt+Rght-1+bg)
输出门(output gate):
ot=σ(Woxt+Roht-1+bo)
LSTM工作方式为:第一个LSTMUnit采用初始网络状态和序列的第一个时间步进行预测,并将更新的网络状态输出到下一个LSTM单元。每个LSTM单元从前一单元获取更新的网络状态并输出预测和新的更新的网络状态。
对于分类任务,其具体流程如图5所示。
分类网络的工作方式为:通过输入已知的动作序列图像到网络,网络将信息特征逐层传递到最后层,同时通过与最后层计算的误差进行反向传播,不断迭代调整各个层的权重和偏差,从而学习一个可以分类的深度网络。
本发明实施例的动作识别总流程如图6所示,主要包括动作序列分割、Inception-v3特征提取、LSTM学习网络分类三大部分。
相比现有技术,对于球员的动作识别,用传统方法较难对球员的动作进行分析,主要在于特征的选择,在计算力和大数据的背景下,本发明用预训练好的深度模型能够充分提取图像的丰富特征,其次对于分类任务,传统机器学习算法对时序复杂问题表现力不足,本发明采用长短期记忆网络(LSTM)正是解决时序问题的有效方法。本发明基于深度学习技术,仅需一个摄像头,具有成本低、实时检测、准确性高等优点。
此外,本发明还提出一种人体动作识别系统,包括存储器、处理器、以及存储在所述存储器上的人体动作识别程序,所述人体动作识别程序被所述处理器运行时实现如上所述的人体动作识别方法的步骤。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,电视机,电脑等)执行本发明各个实施例的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.一种人体动作识别方法,其特征在于,所述人体动作识别方法包括以下步骤:获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧;采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵;采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果;
所述获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧的步骤包括:获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,将分割后的动作序列输入预训练识别模型进行识别,并获得预测分数,将预测分数低于预设分数阈值的动作序列舍弃,将预测分数高于预设分数阈值的动作序列保存,得到保存的动作序列的若干时序帧。
2.根据权利要求1所述的人体动作识别方法,其特征在于,所述采用预设网络模型对若干时序帧进行特征提取,获得特征矩阵的步骤包括:采用inception-v3网络模型对若干时序帧按照时间顺序进行图像特征提取,每张图像可以获得2048维特征向量,一个序列可以获得2048*S的特征矩阵,其中,S为该序列的总帧数。
3.根据权利要求1所述的人体动作识别方法,其特征在于,所述采用预设的LSTM网络模型,对所述特征矩阵进行分类识别,得到人体动作识别结果的步骤包括:所述LSTM网络模型包括若干LSTM单元,第一个LSTM单元采用初始网络状态和序列的第一个时间步进行预测,并将更新的网络状态输出到下一个LSTM单元,其中,每个LSTM单元从前一单元获取更新的网络状态并输出预测和新的更新的网络状态。
4.根据权利要求1-3中任一项所述的人体动作识别方法,其特征在于,所述获取采集的人体视频图像,对所述人体视频图像中的人体进行动作序列分割,并提取分割后的动作序列,获得若干时序帧的步骤之前还包括:设计LSTM网络模型。
5.根据权利要求4所述的人体动作识别方法,其特征在于,所述设计LSTM网络模型的步骤包括:确定特征向量维度和LSTM隐含层单元个数;根据预设的若干个动作类别进行监督训练,得到LSTM网络模型。
6.根据权利要求4所述的人体动作识别方法,其特征在于,所述人体动作识别至少包括:网球运动员动作识别。
7.一种人体动作识别系统,其特征在于,包括存储器、处理器、以及存储在所述存储器上的人体动作识别程序,所述人体动作识别程序被所述处理器运行时实现如权利要求1-6中所述的人体动作识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811091488.8A CN109325440B (zh) | 2018-09-19 | 2018-09-19 | 人体动作识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811091488.8A CN109325440B (zh) | 2018-09-19 | 2018-09-19 | 人体动作识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109325440A CN109325440A (zh) | 2019-02-12 |
CN109325440B true CN109325440B (zh) | 2021-04-30 |
Family
ID=65265909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811091488.8A Active CN109325440B (zh) | 2018-09-19 | 2018-09-19 | 人体动作识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109325440B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871893B (zh) * | 2019-02-18 | 2020-10-16 | 清华大学 | 基于循环时域保持生成的行为预测方法和装置 |
CN110188654B (zh) * | 2019-05-27 | 2023-04-07 | 东南大学 | 一种基于移动未裁剪网络的视频行为识别方法 |
CN110390311A (zh) * | 2019-07-27 | 2019-10-29 | 苏州过来人科技有限公司 | 一种基于注意力和子任务预训练的视频分析算法 |
CN110705389A (zh) * | 2019-09-16 | 2020-01-17 | 全球能源互联网研究院有限公司 | 一种电网作业行为的识别方法及系统 |
CN110765896A (zh) * | 2019-10-08 | 2020-02-07 | 维沃移动通信有限公司 | 视频处理方法及装置 |
CN110781820B (zh) * | 2019-10-25 | 2022-08-05 | 网易(杭州)网络有限公司 | 游戏角色的动作生成方法、装置、计算机设备及存储介质 |
CN113033265A (zh) * | 2019-12-25 | 2021-06-25 | 株式会社日立制作所 | 人体行为识别方法、装置以及机器人 |
CN111141412A (zh) * | 2019-12-25 | 2020-05-12 | 深圳供电局有限公司 | 电缆温度和防盗的双监测方法、系统和可读存储介质 |
CN113395542B (zh) * | 2020-10-26 | 2022-11-08 | 腾讯科技(深圳)有限公司 | 基于人工智能的视频生成方法、装置、计算机设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104966052A (zh) * | 2015-06-09 | 2015-10-07 | 南京邮电大学 | 基于属性特征表示的群体行为识别方法 |
CN105354528A (zh) * | 2015-07-15 | 2016-02-24 | 中国科学院深圳先进技术研究院 | 基于深度图像序列的人体动作识别的方法及系统 |
CN106845351A (zh) * | 2016-05-13 | 2017-06-13 | 苏州大学 | 一种用于视频的基于双向长短时记忆单元的行为识别方法 |
CN107506712A (zh) * | 2017-08-15 | 2017-12-22 | 成都考拉悠然科技有限公司 | 一种基于3d深度卷积网络的人类行为识别的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9805255B2 (en) * | 2016-01-29 | 2017-10-31 | Conduent Business Services, Llc | Temporal fusion of multimodal data from multiple data acquisition systems to automatically recognize and classify an action |
US9977968B2 (en) * | 2016-03-04 | 2018-05-22 | Xerox Corporation | System and method for relevance estimation in summarization of videos of multi-step activities |
CN106650562A (zh) * | 2016-06-14 | 2017-05-10 | 西安电子科技大学 | 一种基于Kinect的在线连续人体行为识别方法 |
US9881208B2 (en) * | 2016-06-20 | 2018-01-30 | Machine Learning Works, LLC | Neural network based recognition of mathematical expressions |
CN108288015B (zh) * | 2017-01-10 | 2021-10-22 | 武汉大学 | 基于时间尺度不变性的视频中人体动作识别方法及系统 |
CN108229280B (zh) * | 2017-04-20 | 2020-11-13 | 北京市商汤科技开发有限公司 | 时域动作检测方法和系统、电子设备、计算机存储介质 |
CN107679522B (zh) * | 2017-10-31 | 2020-10-13 | 内江师范学院 | 基于多流lstm的动作识别方法 |
-
2018
- 2018-09-19 CN CN201811091488.8A patent/CN109325440B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104966052A (zh) * | 2015-06-09 | 2015-10-07 | 南京邮电大学 | 基于属性特征表示的群体行为识别方法 |
CN105354528A (zh) * | 2015-07-15 | 2016-02-24 | 中国科学院深圳先进技术研究院 | 基于深度图像序列的人体动作识别的方法及系统 |
CN106845351A (zh) * | 2016-05-13 | 2017-06-13 | 苏州大学 | 一种用于视频的基于双向长短时记忆单元的行为识别方法 |
CN107506712A (zh) * | 2017-08-15 | 2017-12-22 | 成都考拉悠然科技有限公司 | 一种基于3d深度卷积网络的人类行为识别的方法 |
Non-Patent Citations (3)
Title |
---|
基于岩石图像深度学习的岩性自动识别与分类方法;张野等;《岩石学报》;20180228;第34卷(第2期);第333-342页 * |
基于训练图 CNN 特征的视频人体动作识别算法;曹晋其等;《计算机工程》;20171130;第43卷(第11期);第234-238页 * |
曹晋其等.基于训练图 CNN 特征的视频人体动作识别算法.《计算机工程》.2017,第43卷(第11期),第234-238页. * |
Also Published As
Publication number | Publication date |
---|---|
CN109325440A (zh) | 2019-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325440B (zh) | 人体动作识别方法及系统 | |
US11195051B2 (en) | Method for person re-identification based on deep model with multi-loss fusion training strategy | |
US11704817B2 (en) | Method, apparatus, terminal, and storage medium for training model | |
CN110472554B (zh) | 基于姿态分割和关键点特征的乒乓球动作识别方法及系统 | |
CN109902546B (zh) | 人脸识别方法、装置及计算机可读介质 | |
CN111709311B (zh) | 一种基于多尺度卷积特征融合的行人重识别方法 | |
CN110120064B (zh) | 一种基于互强化与多注意机制学习的深度相关目标跟踪算法 | |
CN107122736B (zh) | 一种基于深度学习的人体朝向预测方法及装置 | |
CN110929848B (zh) | 基于多挑战感知学习模型的训练、跟踪方法 | |
CN113673510B (zh) | 一种结合特征点和锚框共同预测和回归的目标检测方法 | |
US11163989B2 (en) | Action localization in images and videos using relational features | |
CN112883896B (zh) | 一种基于bert网络的微表情检测方法 | |
CN113255557B (zh) | 一种基于深度学习的视频人群情绪分析方法及系统 | |
CN112418032B (zh) | 一种人体行为识别方法、装置、电子设备及存储介质 | |
CN111931654A (zh) | 一种人员跟踪智能监测方法、系统和装置 | |
Vainstein et al. | Modeling video activity with dynamic phrases and its application to action recognition in tennis videos | |
CN109272036B (zh) | 一种基于深度残差网络的随机蕨目标跟踪方法 | |
CN112560824B (zh) | 一种基于多特征自适应融合的人脸表情识别方法 | |
Babatunde et al. | Feature dimensionality reduction using a dual level metaheuristic algorithm | |
CN111814653B (zh) | 一种视频中异常行为的检测方法、装置、设备及存储介质 | |
WO2024012367A1 (zh) | 视觉目标跟踪方法、装置、设备以及存储介质 | |
CN111722717A (zh) | 手势识别方法、装置及计算机可读存储介质 | |
CN111571567A (zh) | 机器人转译技能训练方法、装置及电子设备和存储介质 | |
CN117112766A (zh) | 视觉对话方法、装置、电子设备和计算机可读存储介质 | |
CN111242114A (zh) | 文字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210712 Address after: 518000 whole building of Jindi tennis garden sports club at the intersection of Xiangmihu road and Qiaoxiang Road, Futian District, Shenzhen City, Guangdong Province Patentee after: Shenzhen hongjindi sports intelligence Co.,Ltd. Address before: 518000 Jindi Tennis Center, intersection of Xiangmihu road and Qiaoxiang Road, Xiangmihu street, Futian District, Shenzhen City, Guangdong Province Patentee before: SHENZHEN YINGSHI SPORTS TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |