JP7489928B2 - 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム - Google Patents
音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム Download PDFInfo
- Publication number
- JP7489928B2 JP7489928B2 JP2021016731A JP2021016731A JP7489928B2 JP 7489928 B2 JP7489928 B2 JP 7489928B2 JP 2021016731 A JP2021016731 A JP 2021016731A JP 2021016731 A JP2021016731 A JP 2021016731A JP 7489928 B2 JP7489928 B2 JP 7489928B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- registered
- information processing
- processing device
- operation command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 94
- 238000004891 communication Methods 0.000 claims description 35
- 230000004044 response Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 230000015654 memory Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005401 electroluminescence Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Selective Calling Equipment (AREA)
Description
近年、音声認識エンジンやスマートスピーカーの開発により音声入力により機器の操作を行うことが増えつつある。しかし、施設内に複数配された機器を操作対象とする場合、次のような問題が生じる。
1-1-1.情報処理装置10の構成
図2は、情報処理装置10の主なハードウエア構成を示す。情報処理装置10は、例えばスマートフォンやタブレット端末等、ユーザーが操作可能な携帯端末である。情報処理装置10は、制御部11と、RAM12と、ROM13と、ストレージ14と、マイク15と、表示部16と、操作部17と、スピーカー18と、通信部19とを備える。各部は、バスラインBを介して相互に接続される。
図3に示す機器制御装置30は、制御部31と、RAM32と、ROM33と、ストレージ34と、機器接続部35と、入力部36と、表示部37と、通信部39とを備えるコンピューター装置である。各部は、バスラインBを介して相互に接続される。機器制御装置30は、監視カメラ50の撮像映像を出力したり記録したりするレコーダーとして機能する。
1-2-1.情報処理装置10の動作
図5を参照しながら、本実施の形態に係る情報処理装置10(図2)の動作について説明する。以下の動作においては、ユーザーは、「1階北側駐車場」(登録ワード)として登録された監視カメラ50のライブ映像を見る操作を行う場合を例とする。
図5のステップS107において指定ワードと一致する辞書ワードがない場合、制御部11は、図6に示す辞書ワード更新処理を実行する。以下、上述した指定ワード「北側1階駐車場」が、辞書ワードと一致しない場合を例にして説明する。
図7を参照しながら、本実施の形態に係る機器制御装置30(図3)の動作について説明する。
機器制御装置30による登録ワードの送信(S131)と情報処理装置10による登録ワードの受信(S102)は、両者の通信確立後、登録ワードリストを表示する(S1081)ために種々のタイミング、態様で実行されうる。例えば、情報処理装置10が機器制御装置30に対して登録ワードの要求メッセージを送信し、これに応答して機器制御装置30が情報処理装置10に対して登録ワード34bのリストを含むメッセージを送信(S131)してもよい。また例えば、機器制御装置30は、情報処理装置10からの明示的な要求に依らず、自発的に登録ワード34bのリストを含むメッセージを送信(S131)してもよい。例えば、機器制御装置30と情報処理装置10とが通信を確立したことに応答して登録ワードの送受信(S131、S102)が実行されてもよい。また例えば、音声入力時(S103~S105)に登録ワードの送受信(S131、S102)が実行されてもよい。この場合、情報処理装置10は、マイク15から入力された音声を認識してテキストを抽出する間(S103~S105)に、機器制御装置30に登録ワードの要求メッセージを送信し、機器制御装置30は、この要求メッセージに応答して登録ワード34bのリストを含むメッセージを送信する。
本実施の形態に係る情報処理装置10またはアプリ11aは、機器制御装置30に操作コマンドを送信する前に、予め機器制御装置30から取得される登録ワードを表示部16に表示させる。このため、音声入力の補助を効果的に提供することができ、音声による操作対象機器をより正確に特定することができる。また、本実施の形態に係る情報処理装置10またはアプリ11aは、機器制御装置30を含む機器側において機能の追加や変更を最小限に留めつつ実現できる。
上記実施の形態において、一例として、ユーザーが所望する監視カメラ50のライブ映像の受信や停止を行う操作コマンドを例にしているが、これに限定されない。例えば、所望の監視カメラ50に関して、録画映像の再生、停止、早送り、巻き戻し等の操作を実行することもできる。この場合、操作コマンド(例えば、「1階北側駐車場を再生して」)を受信した機器制御装置30は、同様に操作コマンドを解析し、登録ワードを照合した後(図7のステップS131~S134)、特定された監視カメラ50のストレージ34に記憶された録画映像を情報処理装置10に送信することにより、操作コマンドを実行する。
以上のように、本出願において開示する技術の例示として、実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略等を行った実施の形態にも適用可能である。また、上記実施の形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。例えば、以下の実施の形態が考えられる。
10 :情報処理装置
10a :クライアント端末
10b :サーバー
11 :制御部
11a :アプリ
12 :RAM
13 :ROM
14 :ストレージ
15 :マイク
16 :表示部
17 :操作部
18 :スピーカー
19 :通信部
30 :機器制御装置
31 :制御部
32 :RAM
33 :ROM
34 :ストレージ
35 :機器接続部
39 :通信部
50 :監視カメラ
Claims (8)
- 一つ以上の機器に関する操作を実行する機器制御装置と通信可能な情報処理装置を含むシステムであって、
前記情報処理装置は、音声入力を受け付ける音声入力部を備え、
前記情報処理装置は、前記音声入力部により受け付けられた音声を認識して、認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成する制御部を備え、
前記情報処理装置は、前記操作コマンドを前記機器制御装置に送信する通信部を備え、
前記情報処理装置は、前記制御部による制御に応じて情報を出力する出力部を備え、
前記機器制御装置は、前記一つ以上の機器を個別に識別するための名称の入力を受け付ける入力部を備え、
前記機器制御装置は、前記入力部により入力された名称を登録ワードとして記憶する記憶部を備え、
前記機器制御装置は、前記情報処理装置から送信された前記操作コマンドと前記登録ワードに基づいて前記一つ以上の機器のうち操作すべき機器を特定し、特定した機器を操作する制御部を備え、
前記機器制御装置は、前記情報処理装置が前記操作コマンドを送信する前に、前記登録ワードを前記情報処理装置に送信し、前記情報処理装置は、受信した前記登録ワードを前記出力部に出力させ、
前記情報処理装置は、前記登録ワードと対応付けられた辞書ワードを記憶する記憶部を備え、
前記情報処理装置は、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと前記登録ワードが一致しないが、前記指定ワードと前記辞書ワードとが一致する場合は、前記辞書ワードに対応付けられた登録ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードおよび辞書ワードのいずれとも一致しない場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成するとともに、前記指定ワードと選択された前記登録ワードとを対応付けて前記辞書ワードを記憶する、
システム。 - 一つ以上の機器に関する操作を実行する機器制御装置と通信可能な情報処理装置であって、
音声入力を受け付ける音声入力部と、
前記音声入力部により受け付けられた音声を認識して、認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成する制御部と、
前記操作コマンドを前記機器制御装置に送信する通信部と、
前記制御部による制御に応じて情報を出力する出力部と、
前記機器制御装置から取得される前記一つ以上の機器を特定する登録ワードと対応付けられた辞書ワードを記憶する記憶部と、
を備え、
前記機器制御装置に前記操作コマンドを送信する前に、前記制御部は、前記登録ワードを前記出力部に出力させ、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと前記登録ワードが一致しないが、前記指定ワードと前記辞書ワードとが一致する場合は、前記辞書ワードに対応付けられた登録ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードおよび辞書ワードのいずれとも一致しない場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成するとともに、前記指定ワードと選択された前記登録ワードとを対応付けて前記辞書ワードを記憶する、
情報処理装置。 - 前記制御部は、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致しなかった場合に、前記登録ワードを前記出力部に出力させる、請求項2に記載の情報処理装置。 - 前記登録ワードは、複数の機器をそれぞれ特定する複数の登録ワードを含み、
前記制御部は、前記複数の登録ワードのうち、前記指定ワードと所定レベル以上の類似度を有する登録ワードを判定し、判定された登録ワードを前記出力部に出力させる、請求項3に記載の情報処理装置。 - 前記制御部は、出力された前記登録ワードの選択入力に応じて前記操作コマンドを生成する、請求項3または4に記載の情報処理装置。
- 前記制御部は、
前記指定ワードが前記登録ワードと一致しなかった場合、前記指定ワードと前記登録ワードとを対応づけて前記記憶部に記憶し、
次に前記指定ワードを含む音声が認識された場合は、前記指定ワードに対応する前記登録ワードに基づき前記操作コマンドを生成する、請求項3から5のいずれかに記載の情報処理装置。 - 認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致しなかった場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成する、請求項2に記載の情報処理装置。 - 一つ以上の機器に関する操作を実行する機器制御装置と通信し、音声により機器を操作するためのコンピュータープログラムであって、
コンピュータである情報処理装置が、音声入力を受け付け、
前記情報処理装置が、受け付けられた音声を認識し、
前記情報処理装置が、認識した音声に基づき一つ以上の機器に関する操作を実行するための操作コマンドを生成し、
前記情報処理装置が、前記操作コマンドを前記機器制御装置に送信し、
前記情報処理装置が、前記機器制御装置から取得される前記一つ以上の機器を特定する登録ワードと対応付けられた辞書ワードを記憶する、
ことを含み、
前記情報処理装置が、前記機器制御装置に前記操作コマンドを送信する前に、予め前記機器制御装置から取得される前記一つ以上の機器を特定する登録ワードを出力部により出力させ、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードとが一致した場合は、前記指定ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと前記登録ワードが一致しないが、前記指定ワードと前記辞書ワードとが一致する場合は、前記辞書ワードに対応付けられた登録ワードに基づき前記操作コマンドを生成し、
認識した音声に含まれる前記一つ以上の機器を指定する指定ワードと、前記登録ワードおよび辞書ワードのいずれとも一致しない場合は、前記登録ワードを選択可能に前記出力部に出力させて、選択された前記登録ワードに基づき前記操作コマンドを生成するとともに、前記指定ワードと選択された前記登録ワードとを対応付けて前記辞書ワードを記憶する、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016731A JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016731A JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022119530A JP2022119530A (ja) | 2022-08-17 |
JP7489928B2 true JP7489928B2 (ja) | 2024-05-24 |
Family
ID=82848321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021016731A Active JP7489928B2 (ja) | 2021-02-04 | 2021-02-04 | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7489928B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259114A (ja) | 2001-03-05 | 2002-09-13 | Nec Corp | 音声認識コンピュータシステム |
JP2004023676A (ja) | 2002-06-20 | 2004-01-22 | Hitachi Kokusai Electric Inc | Cctv装置及びcctv装置の状態出力方法 |
JP2009003205A (ja) | 2007-06-22 | 2009-01-08 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
JP2010072098A (ja) | 2008-09-16 | 2010-04-02 | Internatl Business Mach Corp <Ibm> | 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP2020101778A (ja) | 2018-12-25 | 2020-07-02 | パナソニックIpマネジメント株式会社 | 音声認識システム、学習済みモデルの生成方法、音声認識システムの制御方法、プログラム、及び移動体 |
-
2021
- 2021-02-04 JP JP2021016731A patent/JP7489928B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002259114A (ja) | 2001-03-05 | 2002-09-13 | Nec Corp | 音声認識コンピュータシステム |
JP2004023676A (ja) | 2002-06-20 | 2004-01-22 | Hitachi Kokusai Electric Inc | Cctv装置及びcctv装置の状態出力方法 |
JP2009003205A (ja) | 2007-06-22 | 2009-01-08 | Nissan Motor Co Ltd | 音声認識装置、および音声認識方法 |
JP2010072098A (ja) | 2008-09-16 | 2010-04-02 | Internatl Business Mach Corp <Ibm> | 発話入力の音声認識のためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP2020101778A (ja) | 2018-12-25 | 2020-07-02 | パナソニックIpマネジメント株式会社 | 音声認識システム、学習済みモデルの生成方法、音声認識システムの制御方法、プログラム、及び移動体 |
Also Published As
Publication number | Publication date |
---|---|
JP2022119530A (ja) | 2022-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240046405A1 (en) | Picture display device, and setting modification method and setting modification program therefor | |
CN113168227B (zh) | 执行电子装置的功能的方法以及使用该方法的电子装置 | |
US11705120B2 (en) | Electronic device for providing graphic data based on voice and operating method thereof | |
WO2013122310A1 (en) | Method and apparatus for smart voice recognition | |
US20160063894A1 (en) | Electronic apparatus having a voice guidance function, a system having the same, and a corresponding voice guidance method | |
US10867603B2 (en) | Audio-video reproduction device setup using interview-based voice control | |
EP3971887A1 (en) | Apparatus and method for recognizing a plurality of wake-up words | |
US9491401B2 (en) | Video call method and electronic device supporting the method | |
AU2018432003B2 (en) | Video processing method and device, and terminal and storage medium | |
US20120242860A1 (en) | Arrangement and method relating to audio recognition | |
JP6973380B2 (ja) | 情報処理装置、および情報処理方法 | |
JP7489928B2 (ja) | 音声により機器を操作するための情報処理装置、システム、機器制御装置、およびプログラム | |
JP2024160320A (ja) | 映像表示装置 | |
CN111128145B (zh) | 电子设备、控制方法和存储介质 | |
CN112203125A (zh) | 语音播报方法、装置、视频播放设备及存储介质 | |
KR20190128516A (ko) | 전자 장치 및 그 동작방법 | |
JP2019135609A (ja) | 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム | |
CN111667822B (zh) | 语音处理装置、会议系统以及语音处理方法 | |
WO2021091063A1 (ko) | 전자장치 및 그 제어방법 | |
KR20220015306A (ko) | 전자장치 및 그 제어방법 | |
US11568866B2 (en) | Audio processing system, conferencing system, and audio processing method | |
US20240202231A1 (en) | Display apparatus, display method, and recording medium with display program recorded thereon | |
JP7349533B2 (ja) | 情報処理システム、及び情報処理方法 | |
CN114179083B (zh) | 一种引领机器人语音信息的生成方法、装置和引领机器人 | |
CN115550086B (zh) | 会议管理系统及控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7489928 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |