CN102779268A - 基于方向运动历史图及竞争机制的手挥运动方向判定方法 - Google Patents
基于方向运动历史图及竞争机制的手挥运动方向判定方法 Download PDFInfo
- Publication number
- CN102779268A CN102779268A CN2012101906781A CN201210190678A CN102779268A CN 102779268 A CN102779268 A CN 102779268A CN 2012101906781 A CN2012101906781 A CN 2012101906781A CN 201210190678 A CN201210190678 A CN 201210190678A CN 102779268 A CN102779268 A CN 102779268A
- Authority
- CN
- China
- Prior art keywords
- motion
- tau
- skin
- gesture
- greaterequal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于方向运动历史图及竞争机制的手挥运动方向判定方法,包括以下步骤:A1、从视频流中获取当前运动图像,建立肤色概率模型,得到四个光流方向图;A3、根据步骤A2中的四个光流方向图,分别计算四个方向运动历史图;A4、根据手势运动历史图,获得四个方向运动能量图;A5、计算每帧图像的运动方向并编码;A6、判定整个运动序列的运动方向;由于采用帧差和肤色联合提取感兴趣区域,将减少背景和人脸肤色的干扰。由于采用四个方向运动历史图和能量图以方向统计的方式来计算整体运动方向,可以有效克服运动覆盖问题。由于采用了动作竞争机制确定运动方向,可大大降低动作噪声的影响,提高运动方向判定的准确性和稳定性。
Description
技术领域
本发明涉及计算机视觉手势识别技术领域,尤其涉及的是一种基于方向运动历史图及竞争机制的手挥运动方向判定方法。
背景技术
手势交互是一种自然、直观的人机交互方式,将手势直接作为计算机的输入,人机间的通讯将不再需要媒介。手势识别是手势交互的技术基础,视觉手势识别由于其简单易行,目前是手势识别技术的主流。
视觉手势识别虽然是手势识别的主要发展方向,但是还存在很多问题,比如易受背景变化、光照变化、运动噪声的影响,手本身也容易发生非刚体变形,手势中有很多冗余不必要的信息等。如何克服手势识别中这些技术困难,使其能充分应用以改变未来人机交互模式,是手势交互技术的关键问题。
视觉手势识别一般通过摄像头采集手势视频流数据。目前,视频摄像头分为2D摄像头和3D摄像头。3D摄像头获得的是手势的三维信息,比如微软推出的kinect就可以采集3D手势信息,但是其成本贵不利于普及。因此研发基于廉价的USB 2D摄像头的手势识别技术,具有积极意义
但是由于手是非刚体物体,且手势跟踪一般基于肤色进行,导致这种基于跟踪的方法不稳定,易受环境光照、及背景色的干扰,无法形成正确的跟踪轨迹。
目前,也出现了利用运动历史图来进行手势运动方向判定的方法。这种方法首先利用帧差法生成手挥运动历史图,然后计算其梯度向量来获取运动方向。这种方法的主要问题是:无法克服手挥动时的运动覆盖问题;容易受运动噪声的影响,导致方向判断及其不稳定。
通过手上下左右挥动来直接控制菜单或调节某些功能,是手势交互的一种快速广泛的应用模式。此时,正确判定手上下左右运动的方向将是该种手势交互的技术基础。
现有的手势运动方向判定主要是基于手势运动跟踪,通过跟踪手势,计算手位移距离从而判定其运动方向的方法。
1、方向判定依赖于手势跟踪的效果,而跟踪易受光照变化、人脸肤色及手变形的影响,效果差,不稳定;
2、跟踪算法复杂,速度慢,不能快速判定手挥方向。
利用运动历史图来进行手势运动方向判定的方法。这种方法首先利用背景差或帧差法生成运动历史图,然后计算其梯度向量来获取运动方向,优点是速度快。
1、无法克服手挥动时的运动覆盖问题;
2、容易受运动噪声的影响,导致方向判断不准确。
发明内容
本发明所要解决的技术问题是针对现有技术的不足提供一种基于方向运动历史图及竞争机制的手挥运动方向判定方法。
本发明的技术方案如下:
一种基于方向运动历史图及竞争机制的手挥运动方向判定方法,包括以下步骤:
A1、从视频流中获取当前运动图像,建立肤色概率模型,作为手挥过程中手肤色提取的依据,在HSV颜色空间,统计大量肤色与非肤色信息,建立归一化的H-S肤色直方图,用于后续视频帧图像的肤色分割,肤色提取的阈值概率设定为0.85,当前帧的肤色概率图 获取当前视频运动图像的三帧差图像,将肤色概率图与帧差结果相乘后的数据经中值滤波器进行滤波,得到当前的手势区域灰度图
A2、计算手势区域灰度图的光流矢量场F(x,y,t)后,首先将其分解成水平和垂直两个标量场Fx(x,y,t),Fy(x,y,t),然后进行半波整流,进一步分解成四个非负通道并进行高斯平滑和归一化,最终得到四个光流方向图
A3、根据步骤A2中的四个光流方向图,分别计算四个方向运动历史图,
A4、根据手势运动历史图,获得四个方向运动能量图:
A5、计算每帧图像的运动方向并编码:其中Sx+=size[Ex+(x,y,t)>0],Sx-=size[Ex-(x,y,t)>0],Sy+=size[Ey+(x,y,t)>0],Sy-=size[Ey-(x,y,t)>0],若Sx+-Sx-=0,或具体值根据Sy+-Sy-大于或小于0进行判断,若valy+-valy-也为0,则判定当前未动,编码为-1;其它情况时将根据计算得到的angle,将其值根据需要进行划分并编码,进行“上、下、左、右”四个方向判断;将(-500,500)编码为“0”,(500,1400)编码为“1”,(1400,2300)为“2”,(2300,3100)为“3”,不在这些区间的值,赋值为“-1”;分析一段手势运动视频,对每帧都进行上述计算并进行方向编码,从而得到运动方向编码序列O(o1,o2,…oN),其中oi∈{-1,0,1,2,3},i=1…N,N是有效编码序列长度;
A6、判定整个运动序列的运动方向;为克服运动噪声,将此运动方向编码序列中的每个编码依次送入竞争器进行竞争投票,最终溢出(获胜)的编码对应的方向就是本次手势挥动对应的运动方向;具体来说:首先建立4个小格,并标记0,1,2,3分别对应各个运动方向编码,同时设置票数极值Vmax及票数溢出阈值Vth;每个进入的方向编码将使其对应的小格加1,而使其它小格减1;每小格票数一直增长直到Vmax,而任一时刻,其票数达到了Vth,则就会溢出该小格对应的标号。
所述的方法,所述步骤A6中,设置Vth=6,Vmax=8。
所述的方法,所述步骤A1中,帧差的计算方法为:其中f(x,y,t)表示当前帧图像,t表示时间,x,y表示像素位置(下同),符号||表示取绝对值,函数min表示取最小值;为服噪声和光线变化,可设置一自适应阈值这里的和表示取φ0的最大和最小值,则最终计算帧差为最后根据肤色概率图Skin(x,y,t)和帧差图可得手势区域灰度图其中符号×表示相乘。
所述的方法,所述步骤A5中计算每帧图像运动方向并编码,也可以采用比较大小并直接编码的方法来进行,即oi=code(max(Sx+,Sx-,Sy+,Sy-)),其中code(Sx+)为“0”,code(Sx-)为“1”,code(Sy+)为“2”,code(Sy+)为“3”。
所述的方法,所述步骤A6中,得到运动方向编码序列后,判定整个序列最终运动方向,可以通过隐马尔科夫模型进行方向推定。
本发明具有以下有益效果:
1、由于采用帧差和肤色联合提取感兴趣区域,将减少背景和人脸肤色的干扰。;
2、由于采用四个方向运动历史图和能量图以方向统计的方式来计算整体运动方向,可以有效克服运动覆盖问题。
3。由于采用了动作竞争机制确定运动方向,可大大降低动作噪声的影响,提高运动方向判定的准确性和稳定性。
附图说明
图1为本发明方法流程图;
图2是实施例1中竞争投票胜出确定整体运动方向的方法的示意图。
具体实施方式
以下结合具体实施例,对本发明进行详细说明。
实施例1
参考图1,基于方向运动历史图及竞争机制的手挥运动方向判定方法,包括以下步骤:
A1、从视频流中获取当前运动图像,建立肤色概率模型,作为手挥过程中手肤色提取的依据,在HSV颜色空间,统计大量肤色与非肤色信息,建立归一化的H-S肤色直方图,用于后续视频帧图像的肤色分割,肤色提取的阈值概率设定为0.85,当前帧的的肤色概率图 获取当前视频运动图像的三帧差图像,将肤色概率图与帧差结果相乘后的数据经中值滤波器进行滤波,得到当前的手势区域灰度图
帧差的计算方法为:其中f(x,y,t)表示当前帧图像,t表示时间,x,y表示像素位置(下同),符号||表示取绝对值,函数min表示取最小值。为服噪声和光线变化,可设置一自适应阈值这里的和表示取φ0的最大和最小值,则最终计算帧差为最后根据肤色概率图Skin(x,y,t)和帧差图可得手势区域灰度图其中符号×表示相乘。
A2、计算手势区域灰度图的光流矢量场F(x,y,t)后,首先将其分解成水平和垂直两个标量场Fx(x,y,t),Fy(x,y,t),然后进行半波整流,进一步分解成四个非负通道并进行高斯平滑和归一化,最终得到四个光流方向图 其中
A3、根据上面四个光流方向图,分别计算四个方向运动历史图,
A4、根据手势运动历史图,获得四个方向运动能量图(MEI):
A5、计算每帧图像的运动方向并编码:其中Sx+=size[Ex+(x,y,t)>0],Sx-=size[Ex-(x,y,t)>0],Sy+=size[Ey+(x,y,t)>0],Sy-=size[Ey-(x,y,t)>0],若Sx+-Sx-=0,或具体值根据Sy+-Sy-大于或小于0进行判断,若valy+-valy-也为0,则判定当前未动,编码为-1;其它情况时将根据计算得到的angle,将其值根据需要进行划分并编码,进行“上、下、左、右”四个方向判断。将(-500,500)编码为“0”,(500,1400)编码为“1”,(1400,2300)为“2”,(2300,3100)为“3”,不在这些区间的值,赋值为“-1”。分析一段手势运动视频,对每帧都进行上述计算并进行方向编码,从而得到运动方向编码序列O(o1,o2,…oN),其中oi∈{-1,0,1,2,3},i=1…N,N是有效编码序列长度;
A6、判定整个运动序列的运动方向。如图2所示,为克服运动噪声,将此运动方向编码序列中的每个编码依次送入竞争器进行竞争投票,最终溢出(获胜)的编码对应的方向就是本次手势挥动对应的运动方向。具体来说:首先建立4个小格,并标记0,1,2,3分别对应各个运动方向编码,同时设置票数极值Vmax及票数溢出阈值Vth;每个进入的方向编码将使其对应的小格加1,而使其它小格减1。每小格票数一直增长直到Vmax,而任一时刻,其票数达到了Vth,则就会溢出该小格对应的标号。通过这种竞争机制,可以有效克服运动噪声,提高运动方向识别的准确性和稳定性。根据经验可设置Vth=6,Vmax=8。
实施例2
与实施例1不同的是:
A5,计算每帧图像运动方向并编码,也可采用比较大小并直接编码的方法来进行,即oi=code(max(Sx+,Sx-,Sy+,Sy-)),其中code(Sx+)为“0”,code(Sx-)为“1”,code(Sy+)为“2”,code(Sy+)为“3”。
实施例3
与实施例1不同的是:
A6:得到运动方向编码序列后,判定整个序列最终运动方向,可通过隐马尔科夫模型进行方向推定。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (5)
1.一种基于方向运动历史图及竞争机制的手挥运动方向判定方法,其特征在于,包括以下步骤:
A1、从视频流中获取当前运动图像,建立肤色概率模型,作为手挥过程中手肤色提取的依据,在HSV颜色空间,统计大量肤色与非肤色信息,建立归一化的H-S肤色直方图,用于后续视频帧图像的肤色分割,肤色提取的阈值概率设定为0.85,当前帧的肤色概率图 获取当前视频运动图像的三帧差图像,将肤色概率图与帧差结果相乘后的数据经中值滤波器进行滤波,得到当前的手势区域灰度图
A2、计算手势区域灰度图的光流矢量场F(x,y,t)后,首先将其分解成水平和垂直两个标量场Fx(x,y,t),Fy(x,y,t),然后进行半波整流,进一步分解成四个非负通道并进行高斯平滑和归一化,最终得到四个光流方向图 其中
A3、根据步骤A2中的四个光流方向图,分别计算四个方向运动历史图,
A4、根据手势运动历史图,获得四个方向运动能量图:
A5、计算每帧图像的运动方向并编码:其中Sx+=size[Ex+(x,y,t)>0],Sx-=size[Ex-(x,y,t)>0],Sy+=size[Ey+(x,y,t)>0],Sy-=size[Ey-(x,y,t)>0],若Sx+-Sx-=0,或具体值根据Sy+-Sy-大于或小于0进行判断,若valy+-valy-也为0,则判定当前未动,编码为-1;其它情况时将根据计算得到的angle,将其值根据需要进行划分并编码,进行“上、下、左、右”四个方向判断;将(-500,500)编码为“0”,(500,1400)编码为“1”,(1400,2300)为“2”,(2300,3100)为“3”,不在这些区间的值,赋值为“-1”;分析一段手势运动视频,对每帧都进行上述计算并进行方向编码,从而得到运动方向编码序列O(o1,o2,…oN),其中oi∈{-1,0,1,2,3},i=1…N,N是有效编码序列长度;
A6、判定整个运动序列的运动方向;为克服运动噪声,将此运动方向编码序列中的每个编码依次送入竞争器进行竞争投票,最终溢出(获胜)的编码对应的方向就是本次手势挥动对应的运动方向;具体来说:首先建立4个小格,并标记0,1,2,3分别对应各个运动方向编码,同时设置票数极值Vmax及票数溢出阈值Vth;每个进入的方向编码将使其对应的小格加1,而使其它小格减1;每小格票数一直增长直到Vmax,而任一时刻,其票数达到了Vth,则就会溢出该小格对应的标号。
2.根据权利要求1所述的方法,其特征在于,所述步骤A6中,设置Vth=6,Vmax=8。
4.根据权利要求1所述的方法,其特征在于,所述步骤A5中计算每帧图像运动方向并编码,也可以采用比较大小并直接编码的方法来进行,即oi=code(max(Sx+,Sx-,Sy+,Sy-)),其中code(Sx+)为“0”,code(Sx-)为“1”,code(Sy+)为“2”,code(Sy+)为“3”。
5.根据权利要求1所述的方法,其特征在于,所述步骤A6中,得到运动方向编码序列后,判定整个序列最终运动方向,可以通过隐马尔科夫模型进行方向推定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210190678.1A CN102779268B (zh) | 2012-02-06 | 2012-06-04 | 基于方向运动历史图及竞争机制的手挥运动方向判定方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210024717.0 | 2012-02-06 | ||
CN201210024717 | 2012-02-06 | ||
CN2012100247170 | 2012-02-06 | ||
CN201210190678.1A CN102779268B (zh) | 2012-02-06 | 2012-06-04 | 基于方向运动历史图及竞争机制的手挥运动方向判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102779268A true CN102779268A (zh) | 2012-11-14 |
CN102779268B CN102779268B (zh) | 2015-04-22 |
Family
ID=47124178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210190678.1A Expired - Fee Related CN102779268B (zh) | 2012-02-06 | 2012-06-04 | 基于方向运动历史图及竞争机制的手挥运动方向判定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102779268B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331151A (zh) * | 2014-10-11 | 2015-02-04 | 中国传媒大学 | 基于光流法的手势运动方向识别方法 |
CN107633252A (zh) * | 2017-09-19 | 2018-01-26 | 广州市百果园信息技术有限公司 | 肤色检测方法、装置及存储介质 |
CN108292362A (zh) * | 2016-01-05 | 2018-07-17 | 英特尔公司 | 用于光标控制的手势识别 |
CN111277780A (zh) * | 2018-12-04 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种改善插帧效果的方法和装置 |
CN113642493A (zh) * | 2021-08-20 | 2021-11-12 | 北京有竹居网络技术有限公司 | 一种手势识别方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236502A (zh) * | 2010-04-21 | 2011-11-09 | 上海三旗通信科技有限公司 | 一种移动终端压力触控手势识别的人机交互方式 |
CN102236412A (zh) * | 2010-04-30 | 2011-11-09 | 宏碁股份有限公司 | 三维手势识别系统以及基于视觉的手势识别方法 |
US20110320949A1 (en) * | 2010-06-24 | 2011-12-29 | Yoshihito Ohki | Gesture Recognition Apparatus, Gesture Recognition Method and Program |
-
2012
- 2012-06-04 CN CN201210190678.1A patent/CN102779268B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236502A (zh) * | 2010-04-21 | 2011-11-09 | 上海三旗通信科技有限公司 | 一种移动终端压力触控手势识别的人机交互方式 |
CN102236412A (zh) * | 2010-04-30 | 2011-11-09 | 宏碁股份有限公司 | 三维手势识别系统以及基于视觉的手势识别方法 |
US20110320949A1 (en) * | 2010-06-24 | 2011-12-29 | Yoshihito Ohki | Gesture Recognition Apparatus, Gesture Recognition Method and Program |
Non-Patent Citations (2)
Title |
---|
MD. ATIQUR RAHMAN AHAD: "Action Recognition by Employing Combined Directional Motion History and Energy Images", 《2010IEEE》, 31 December 2010 (2010-12-31), pages 73 - 78 * |
吕金刚等: "一种快速鲁棒的动态人手跟踪方法", 《微型机与应用》, vol. 31, no. 1, 10 January 2012 (2012-01-10), pages 33 - 36 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331151A (zh) * | 2014-10-11 | 2015-02-04 | 中国传媒大学 | 基于光流法的手势运动方向识别方法 |
CN104331151B (zh) * | 2014-10-11 | 2018-02-23 | 中国传媒大学 | 基于光流法的手势运动方向识别方法 |
CN108292362A (zh) * | 2016-01-05 | 2018-07-17 | 英特尔公司 | 用于光标控制的手势识别 |
CN108292362B (zh) * | 2016-01-05 | 2022-04-12 | 英特尔公司 | 用于光标控制的手势识别 |
CN107633252A (zh) * | 2017-09-19 | 2018-01-26 | 广州市百果园信息技术有限公司 | 肤色检测方法、装置及存储介质 |
CN107633252B (zh) * | 2017-09-19 | 2020-04-21 | 广州市百果园信息技术有限公司 | 肤色检测方法、装置及存储介质 |
US11080894B2 (en) | 2017-09-19 | 2021-08-03 | Bigo Technology Pte. Ltd. | Skin color detection method, skin color detection apparatus, and storage medium |
CN111277780A (zh) * | 2018-12-04 | 2020-06-12 | 阿里巴巴集团控股有限公司 | 一种改善插帧效果的方法和装置 |
CN111277780B (zh) * | 2018-12-04 | 2021-07-20 | 阿里巴巴集团控股有限公司 | 一种改善插帧效果的方法和装置 |
CN113642493A (zh) * | 2021-08-20 | 2021-11-12 | 北京有竹居网络技术有限公司 | 一种手势识别方法、装置、设备及介质 |
CN113642493B (zh) * | 2021-08-20 | 2024-02-09 | 北京有竹居网络技术有限公司 | 一种手势识别方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102779268B (zh) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sadegh Aliakbarian et al. | Encouraging lstms to anticipate actions very early | |
CN107679491B (zh) | 一种融合多模态数据的3d卷积神经网络手语识别方法 | |
CN102789568B (zh) | 一种基于深度信息的手势识别方法 | |
CN102609686B (zh) | 一种行人检测方法 | |
CN102332095B (zh) | 一种人脸运动跟踪方法和系统以及一种增强现实方法 | |
Kim et al. | Simultaneous gesture segmentation and recognition based on forward spotting accumulative HMMs | |
CN103279791B (zh) | 基于多特征的行人计算方法 | |
CN108830171B (zh) | 一种基于深度学习的智能物流仓库引导线视觉检测方法 | |
CN102298781B (zh) | 基于颜色和梯度特征的运动阴影检测方法 | |
CN103020992B (zh) | 一种基于运动颜色关联的视频图像显著性检测方法 | |
CN110781964A (zh) | 一种基于视频图像的人体目标检测方法及系统 | |
CN105528794A (zh) | 基于混合高斯模型与超像素分割的运动目标检测方法 | |
CN111523378B (zh) | 一种基于深度学习的人体行为预测方法 | |
CN103295016A (zh) | 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法 | |
CN110688965A (zh) | 基于双目视觉的ipt模拟训练手势识别方法 | |
CN112669350A (zh) | 一种自适应特征融合的智能变电站人体目标跟踪方法 | |
Elmezain et al. | Hand trajectory-based gesture spotting and recognition using HMM | |
CN102779268A (zh) | 基于方向运动历史图及竞争机制的手挥运动方向判定方法 | |
CN103020614B (zh) | 基于时空兴趣点检测的人体运动识别方法 | |
CN109886269A (zh) | 一种基于注意力机制的交通广告牌识别方法 | |
CN110197494A (zh) | 一种基于单目红外图像的受电弓接触点实时检测算法 | |
CN102147867A (zh) | 一种基于主体的国画图像和书法图像的识别方法 | |
CN106156695A (zh) | 出口和/或入口区域识别方法和装置 | |
US20140328516A1 (en) | Gesture Recognition Method, An Apparatus and a Computer Program for the Same | |
Bertasius et al. | Learning discriminative motion features through detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150422 Termination date: 20180604 |
|
CF01 | Termination of patent right due to non-payment of annual fee |