JP6051991B2 - 信号処理装置、信号処理方法、及び信号処理プログラム - Google Patents
信号処理装置、信号処理方法、及び信号処理プログラム Download PDFInfo
- Publication number
- JP6051991B2 JP6051991B2 JP2013058552A JP2013058552A JP6051991B2 JP 6051991 B2 JP6051991 B2 JP 6051991B2 JP 2013058552 A JP2013058552 A JP 2013058552A JP 2013058552 A JP2013058552 A JP 2013058552A JP 6051991 B2 JP6051991 B2 JP 6051991B2
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- section
- recognized
- signal processing
- operation content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 134
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 61
- 238000003860 storage Methods 0.000 claims description 50
- 230000008859 change Effects 0.000 claims description 33
- 238000001514 detection method Methods 0.000 description 80
- 238000000605 extraction Methods 0.000 description 44
- 230000000875 corresponding effect Effects 0.000 description 34
- 230000033001 locomotion Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
- Position Input By Displaying (AREA)
- Radar Systems Or Details Thereof (AREA)
- Measurement Of Current Or Voltage (AREA)
Description
図1は、本実施形態における信号処理装置の機能構成例を示す図である。図1に示す信号処理装置10は、入力手段11と、出力手段12と、記憶手段13と、時系列情報取得手段14と、特徴量抽出手段15と、認識手段16と、区間検出手段17と、同定手段18と、パラメータ変更手段(認証条件変更手段)19と、操作実行手段20と、送受信手段21と、制御手段22とを有する。
本実施形態は、各機能をコンピュータに実行させることができる実行プログラム(信号処理プログラム)を例えば汎用のPCや、スマートフォン等の通信端末等にインストールすることにより、本実施形態における信号処理を実現することができる。ここで、本実施形態における信号処理が実現可能なコンピュータ(信号処理装置10)のハードウェア構成例について図を用いて説明する。
本実施形態における信号処理装置10の処理の一例について、フローチャートを用いて説明する。図3は、本実施形態における信号処理装置の処理の一例を示すフローチャートである。
次に、上述した信号処理の具体例について、図を用いて説明する。なお、以下の説明では、例えば撮像手段30から撮影される映像(画像フレームの時系列情報)からユーザのジェスチャ動作を取得して操作内容を認識する例について説明する。その場合、出力される特徴は、ユーザの手の重心座標を表すものとする。
まず、上述した特徴量抽出処理の一例について具体的に説明する。図4は、フレームtでの入力画像の一例を示す図である。本実施形態では、信号処理装置10の特徴量抽出手段15は、入力される時系列の画像情報I(x,y,t)から特徴量を抽出する。
次に、上述した認識処理の一例について具体的に説明する。認識手段16では、上述したような特徴が時系列で生成されると、この時系列特徴を用いて、操作内容等の認識を行う。認識手段16では、例えばサポートベクタマシン等を使用すると、以下に示す(3)式で表すことができる。
次に、区間検出処理の一例について具体的に説明する。区間検出手段17は、上述した認識手段16で、特徴量を特定のクラス(例えば、操作内容等)に認識された場合に、その特徴時系列w(t)と、そのオフセット時刻zを取得する。更に、区間検出手段17は、時刻zからz+t'の特徴時系列w(t)をテンプレート特徴として切り出し、s(t)とする。すなわち、「s(t)=w(t+z)、t={0,…,t'}」とする。更に、区間検出手段17は、上述の処理により検出したフレームの前Nfフレーム、後ろNbフレームを含めたNf+Nb+1フレームの区間を取り出して、時系列の特徴量とする。
次に、区間検出手段17における候補区間検出処理の一例について具体的に説明する。例えば、区間検出手段17は、時刻z以前に現れるテンプレート特徴に類似した特徴を有する時系列を検出するための候補区間の範囲を設定する。候補区間は、例えば所定の時刻tを基準にして、±△tだけ離れた区間において、最大と最小との差(絶対値)が所定の閾値(Th)より大きい場合に、そのときの注目時刻tを候補区間点とする。この操作を順次、前の時刻に遡って行って候補区間点を抽出していく。
次に、区間検出手段17における特徴区間検出処理の一例について具体的に説明する。区間検出手段17は、上述した候補区間の検出で得られた結果から、テンプレート特徴量に対する類似度を数値化し、類似度の高い部分を特徴区間として検出する。
上述したパラメータ変更は、ユーザから音声が入力された場合にも同様に適用することができる。なお、音声の場合には、特徴量として、音声の振幅情報やケプストラム情報(例えば、MFCC)等を特徴量として抽出することができるが、これに限定されるものではない。
(付記1)
入力された操作の特徴量と、特徴量から操作内容を特定する認識条件を記憶した記憶手段とから、前記入力された操作の特徴量に対する操作内容を認識する認識手段と、
前記認識手段により操作内容が認識された特徴量に類似する特徴量を有する区間を、前記操作内容が認識された時系列よりも前の時系列から検出する区間検出手段と、
前記区間検出手段が検出をした区間の特徴量が、前記認識手段が認識をした操作内容と認識をされるように、前記認識条件を変更する認識条件変更手段と、
を有することを特徴とする信号処理装置。
(付記2)
前記区間検出手段は、
前記認識手段により操作内容が認識された特徴量との相関が、所定の閾値以上の特徴量が得られる区間を検出することを特徴とする付記1に記載の信号処理装置。
(付記3)
前記区間検出手段は、
時間を基準して最初又は最後に検出された区間、或いは前記操作内容が認識された特徴量に対する類似度を基準にした所定数の区間を検出することを特徴とする付記1又は2に記載の信号処理装置。
(付記4)
前記入力信号を入力したユーザを同定する同定手段を有し、
前記認識条件変更手段は、前記同定手段により同定されたユーザに対応して設定された認識条件を変更することを特徴とする付記1乃至3の何れか1項に記載の信号処理装置。
(付記5)
前記認識条件変更手段は、
所定時間の経過後、所定の動作終了後、及び前記ユーザからの指示のうち、少なくとも1つの条件を満たす場合に、前記認識条件を変更前のパラメータに戻すことを特徴とする付記1乃至4の何れか1項に記載の信号処理装置。
(付記6)
信号処理装置が、
入力された操作の特徴量と、特徴量から操作内容を認識する認識条件とを記憶した記憶手段とから、前記入力信号に対する操作内容を認識し、
認識をした特徴量に類似する特徴量を有する区間を、前記操作内容を認識した時系列よりも前の時系列から検出し、
検出をした区間の特徴量が、前記認識をした操作内容と認識をされるように、前記認識条件を変更することを特徴とする信号処理方法。
(付記7)
入力された操作の特徴量と、特徴量から操作内容を認識する認識条件とを記憶した記憶手段とから、前記入力信号に対する操作内容を認識し、
認識をした特徴量に類似する特徴量を有する区間を、前記操作内容を認識した時系列よりも前の時系列から検出し、
検出をした区間の特徴量が、前記認識をした操作内容と認識をされるように、前記認識条件を変更する、処理をコンピュータに実行させるための信号処理プログラム。
11 入力手段
12 出力手段
13 記憶手段
14 時系列情報取得手段
15 特徴量抽出手段
16 認識手段
17 区間検出手段
18 同定手段
19 パラメータ変更手段(認証条件変更手段)
20 操作実行手段
21 送受信手段
22 制御手段
30 撮像手段
41 入力装置
42 出力装置
43 ドライブ装置
44 補助記憶装置
45 主記憶装置
46 CPU
47 ネットワーク接続装置
48 記憶媒体
Claims (6)
- 入力された操作の特徴量と、特徴量から操作内容を特定する認識条件を記憶した記憶手段とから、前記入力された操作の特徴量に対する操作内容を認識する認識手段と、
前記認識手段により操作内容が認識された特徴量に類似する特徴量を有する区間を、前記操作内容が認識された時系列よりも前の時系列から検出する区間検出手段と、
前記区間検出手段が検出をした区間の特徴量が、前記認識手段が認識をした操作内容と認識をされるように、前記認識条件を変更する認識条件変更手段と、
を有することを特徴とする信号処理装置。 - 前記区間検出手段は、
前記認識手段により操作内容が認識された特徴量との相関が、所定の閾値以上の特徴量が得られる区間を検出することを特徴とする請求項1に記載の信号処理装置。 - 前記入力信号を入力したユーザを同定する同定手段を有し、
前記認識条件変更手段は、前記同定手段により同定されたユーザに対応して設定された認識条件を変更することを特徴とする請求項1又は2に記載の信号処理装置。 - 前記認識条件変更手段は、
所定時間の経過後、所定の動作終了後、及び前記ユーザからの指示のうち、少なくとも1つの条件を満たす場合に、前記認識条件を変更前のパラメータに戻すことを特徴とする請求項1乃至3の何れか1項に記載の信号処理装置。 - 信号処理装置が、
入力された操作の特徴量と、特徴量から操作内容を認識する認識条件とを記憶した記憶手段とから、前記入力信号に対する操作内容を認識し、
認識をした特徴量に類似する特徴量を有する区間を、前記操作内容を認識した時系列よりも前の時系列から検出し、
検出をした区間の特徴量が、前記認識をした操作内容と認識をされるように、前記認識条件を変更することを特徴とする信号処理方法。 - 入力された操作の特徴量と、特徴量から操作内容を認識する認識条件とを記憶した記憶手段とから、前記入力信号に対する操作内容を認識し、
認識をした特徴量に類似する特徴量を有する区間を、前記操作内容を認識した時系列よりも前の時系列から検出し、
検出をした区間の特徴量が、前記認識をした操作内容と認識をされるように、前記認識条件を変更する、処理をコンピュータに実行させるための信号処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013058552A JP6051991B2 (ja) | 2013-03-21 | 2013-03-21 | 信号処理装置、信号処理方法、及び信号処理プログラム |
EP14157952.4A EP2781991B1 (en) | 2013-03-21 | 2014-03-05 | Signal processing device and signal processing method |
US14/206,340 US9342152B2 (en) | 2013-03-21 | 2014-03-12 | Signal processing device and signal processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013058552A JP6051991B2 (ja) | 2013-03-21 | 2013-03-21 | 信号処理装置、信号処理方法、及び信号処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014182749A JP2014182749A (ja) | 2014-09-29 |
JP6051991B2 true JP6051991B2 (ja) | 2016-12-27 |
Family
ID=50272307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013058552A Expired - Fee Related JP6051991B2 (ja) | 2013-03-21 | 2013-03-21 | 信号処理装置、信号処理方法、及び信号処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9342152B2 (ja) |
EP (1) | EP2781991B1 (ja) |
JP (1) | JP6051991B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6486084B2 (ja) * | 2014-11-28 | 2019-03-20 | キヤノン株式会社 | 画像処理方法、画像処理装置、及びプログラム |
WO2016098228A1 (ja) * | 2014-12-18 | 2016-06-23 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
US20180060144A1 (en) * | 2015-01-15 | 2018-03-01 | Snapback S.R.L. | Control methods for mobile electronic devices in distributed environments |
EP3392740A4 (en) * | 2015-12-18 | 2018-12-19 | Sony Corporation | Information processing device, information processing method, and program |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4835680A (en) * | 1985-03-15 | 1989-05-30 | Xerox Corporation | Adaptive processor array capable of learning variable associations useful in recognizing classes of inputs |
US5473707A (en) * | 1993-08-16 | 1995-12-05 | Electro-Sensors, Inc. | Pattern processing system with weighted training codes |
JP2000132297A (ja) * | 1998-10-22 | 2000-05-12 | Nec Corp | 学習型ユーザインタフェースカスタマイズ法 |
US6873610B1 (en) * | 2000-05-01 | 2005-03-29 | Mobular Technologies, Inc. | System and method for efficiently accessing affiliated network addresses from a wireless device |
JP2003080484A (ja) | 2001-09-07 | 2003-03-18 | Tomy Co Ltd | 動作反応玩具 |
US20070100666A1 (en) * | 2002-08-22 | 2007-05-03 | Stivoric John M | Devices and systems for contextual and physiological-based detection, monitoring, reporting, entertainment, and control of other devices |
US7450736B2 (en) | 2005-10-28 | 2008-11-11 | Honda Motor Co., Ltd. | Monocular tracking of 3D human motion with a coordinated mixture of factor analyzers |
US20080103997A1 (en) * | 2006-10-31 | 2008-05-01 | Gene Fein | Archival learning and future performance projection |
JP4318056B1 (ja) * | 2008-06-03 | 2009-08-19 | 島根県 | 画像認識装置および操作判定方法 |
JP5169902B2 (ja) * | 2009-02-24 | 2013-03-27 | 日本電気株式会社 | 操作支援システム、操作支援方法、プログラム及び記録媒体 |
JP5715946B2 (ja) * | 2009-12-22 | 2015-05-13 | パナソニック株式会社 | 動作解析装置および動作解析方法 |
US9554111B2 (en) * | 2010-03-08 | 2017-01-24 | Magisto Ltd. | System and method for semi-automatic video editing |
JP2011209773A (ja) * | 2010-03-26 | 2011-10-20 | Seiko Epson Corp | ジェスチャ・コマンド処理装置、ジェスチャ・コマンド処理方法、およびプログラム |
US8396252B2 (en) * | 2010-05-20 | 2013-03-12 | Edge 3 Technologies | Systems and related methods for three dimensional gesture recognition in vehicles |
JP5423596B2 (ja) * | 2010-06-24 | 2014-02-19 | 富士通株式会社 | 情報処理装置および情報処理方法 |
US9152287B2 (en) * | 2010-08-05 | 2015-10-06 | Analog Devices, Inc. | System and method for dual-touch gesture classification in resistive touch screens |
CN103415825B (zh) * | 2010-12-29 | 2016-06-01 | 汤姆逊许可公司 | 用于手势识别的系统和方法 |
US9326082B2 (en) * | 2010-12-30 | 2016-04-26 | Dolby International Ab | Song transition effects for browsing |
JP2012155219A (ja) * | 2011-01-27 | 2012-08-16 | Nec Casio Mobile Communications Ltd | 演奏データ提供システム、方法、サーバ、携帯端末およびコンピュータプログラム |
US8306257B2 (en) * | 2011-01-31 | 2012-11-06 | Seiko Epson Corporation | Hierarchical tree AAM |
JP2012164158A (ja) * | 2011-02-07 | 2012-08-30 | Toyota Motor Corp | 可動物予測装置、可動物予測プログラム及び可動物予測方法 |
GB2489218A (en) * | 2011-03-17 | 2012-09-26 | Univ Strathclyde | Occupancy detection system |
JP2012256099A (ja) * | 2011-06-07 | 2012-12-27 | Sony Corp | 情報処理端末および方法、プログラム、並びに記録媒体 |
US20130212049A1 (en) * | 2012-02-15 | 2013-08-15 | American Gnc Corporation | Machine Evolutionary Behavior by Embedded Collaborative Learning Engine (eCLE) |
US8983442B2 (en) * | 2012-12-14 | 2015-03-17 | Intel Corporation | Techniques and apparatus to manage power in wireless device |
-
2013
- 2013-03-21 JP JP2013058552A patent/JP6051991B2/ja not_active Expired - Fee Related
-
2014
- 2014-03-05 EP EP14157952.4A patent/EP2781991B1/en not_active Not-in-force
- 2014-03-12 US US14/206,340 patent/US9342152B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP2781991A3 (en) | 2016-12-07 |
EP2781991B1 (en) | 2020-08-19 |
JP2014182749A (ja) | 2014-09-29 |
US20140285427A1 (en) | 2014-09-25 |
US9342152B2 (en) | 2016-05-17 |
EP2781991A2 (en) | 2014-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Raheja et al. | Robust gesture recognition using Kinect: A comparison between DTW and HMM | |
Kumar et al. | Coupled HMM-based multi-sensor data fusion for sign language recognition | |
US9104242B2 (en) | Palm gesture recognition method and device as well as human-machine interaction method and apparatus | |
US8204310B2 (en) | Feature design for HMM based Eastern Asian character recognition | |
WO2019120290A1 (zh) | 动态手势识别方法和装置、手势交互控制方法和装置 | |
Nair et al. | Hand gesture recognition system for physically challenged people using IOT | |
JP6066093B2 (ja) | 手指形状推定装置、手指形状推定方法、及び手指形状推定プログラム | |
US20160098594A1 (en) | Electronic apparatus, processing method and storage medium | |
JP6051991B2 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
Choudhury et al. | A CNN-LSTM based ensemble framework for in-air handwritten Assamese character recognition | |
Zahra et al. | Camera-based interactive wall display using hand gesture recognition | |
JP4348202B2 (ja) | 顔画像認識装置及び顔画像認識プログラム | |
CN116311526A (zh) | 图像区域确定方法、装置、电子设备及存储介质 | |
JP6225612B2 (ja) | プログラム、情報処理装置、および方法 | |
JP2014182748A (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
CN109725722B (zh) | 有屏设备的手势控制方法和装置 | |
CN109753154B (zh) | 有屏设备的手势控制方法和装置 | |
JP4060261B2 (ja) | 画像に含まれる身体形状を判定する方法及び非接触型ポインティング・デバイスの実現方法 | |
Dhamanskar et al. | Human computer interaction using hand gestures and voice | |
CN112118491A (zh) | 弹幕生成方法、装置及计算机可读存储介质 | |
Jian et al. | Real-time continuous handwritten trajectories recognition based on a regression-based temporal pyramid network | |
JP2005149302A (ja) | 顔画像認識装置及び顔画像認識プログラム | |
Rautaray et al. | Adaptive hand gesture recognition system for multiple applications | |
Ahmed et al. | Real-time, static and dynamic hand gesture recognition for human-computer interaction | |
CN116740737A (zh) | 手势识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6051991 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |