JP2877350B2 - 環境モニタ付音声認識装置 - Google Patents
環境モニタ付音声認識装置Info
- Publication number
- JP2877350B2 JP2877350B2 JP1128725A JP12872589A JP2877350B2 JP 2877350 B2 JP2877350 B2 JP 2877350B2 JP 1128725 A JP1128725 A JP 1128725A JP 12872589 A JP12872589 A JP 12872589A JP 2877350 B2 JP2877350 B2 JP 2877350B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- unit
- recognition device
- speech
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000007613 environmental effect Effects 0.000 title description 3
- 238000010586 diagram Methods 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Description
【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声認識装置にかかわり、特にノイズの多
い環境下で使用する環境モニタ付音声認識装置に関す
る。
い環境下で使用する環境モニタ付音声認識装置に関す
る。
(従来の技術) 近年、マンマシン・インターフェースとして音声認識
・合成の技術の向上が目覚しく、荷物の区分け、券売機
等に音声認識装置が使用されている。しかし、現在の音
声認識装置の多くは、使用する環境のノイズが大きくな
ると認識率が低下する。また、ノイズ対策としては、音
声が入力されていない時に、音声パワーによりノイズレ
ベルを判断する等があるが、どんな環境のノイズなの
か、発声者がマイクからどのくらいはなれているか等を
監視する機能を持つものはなく、ノイズに強い認識を行
なう事ができないという問題が生じた。
・合成の技術の向上が目覚しく、荷物の区分け、券売機
等に音声認識装置が使用されている。しかし、現在の音
声認識装置の多くは、使用する環境のノイズが大きくな
ると認識率が低下する。また、ノイズ対策としては、音
声が入力されていない時に、音声パワーによりノイズレ
ベルを判断する等があるが、どんな環境のノイズなの
か、発声者がマイクからどのくらいはなれているか等を
監視する機能を持つものはなく、ノイズに強い認識を行
なう事ができないという問題が生じた。
(発明が解決しようとする課題) この様に従来の音声認識装置では、マイクからの入力
情報のみでノイズの大きさ、種類などを判定し、ノイズ
対策を行なうという音のメディアのみで対応をしてい
た。この為、非定常的な雑音、例えば駅構内で列車の発
着にともなう人の移動の際のノイズ等をすばやく感知す
る事ができないという問題が生じた。
情報のみでノイズの大きさ、種類などを判定し、ノイズ
対策を行なうという音のメディアのみで対応をしてい
た。この為、非定常的な雑音、例えば駅構内で列車の発
着にともなう人の移動の際のノイズ等をすばやく感知す
る事ができないという問題が生じた。
本発明は、このような事情に鑑みてなされたもので、
その目的とするところは、カメラにより音声認識装置の
使用環境をモニタし、周囲の環境に適応した音声認識装
置を提供することにある。
その目的とするところは、カメラにより音声認識装置の
使用環境をモニタし、周囲の環境に適応した音声認識装
置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明に係る音声認識装置は、マイクからの音メディ
アの情報のみでノイズ対策を行なうのではなく、カメラ
のモニタからの画像メディアの情報も並用してノイズの
対策を行なう手段を備えている。
アの情報のみでノイズ対策を行なうのではなく、カメラ
のモニタからの画像メディアの情報も並用してノイズの
対策を行なう手段を備えている。
(作用) 本発明によれば、音声認識装置がカメラにより使用環
境、周囲の環境をモニタし、人通りが多くなりだした
り、多数の人が近づいてきたりした場合、ノイズが大き
くなる事を予想し、自動的に入力の音量をしぼったり、
その様な環境で使用しようとする人間がいた場合、近づ
いてしゃべる様に指示したり、人通りに合わせてノイズ
がふくまれたリファレンスパタンを用いて認識を行なう
事により認識誤りをへらすことができる。
境、周囲の環境をモニタし、人通りが多くなりだした
り、多数の人が近づいてきたりした場合、ノイズが大き
くなる事を予想し、自動的に入力の音量をしぼったり、
その様な環境で使用しようとする人間がいた場合、近づ
いてしゃべる様に指示したり、人通りに合わせてノイズ
がふくまれたリファレンスパタンを用いて認識を行なう
事により認識誤りをへらすことができる。
(実施例) 以下、図面を参照しながら本発明の実施例について説
明する。
明する。
第1図は本発明第1の実施例に係る音声認識装置のブ
ロック図、第2図は第1の実施例に係る処理の流れ図、
第3図は、表示部の概略図である。
ロック図、第2図は第1の実施例に係る処理の流れ図、
第3図は、表示部の概略図である。
本装置は、カメラ1,環境判定部2,ノイズ対策部3,音声
入力部4,音響分析部5,音声認識部6,辞書7,スイッチ部8,
文生成部9,音声合成部10,音声出力部11,表示部12,赤外
線センサ13より構成されている。
入力部4,音響分析部5,音声認識部6,辞書7,スイッチ部8,
文生成部9,音声合成部10,音声出力部11,表示部12,赤外
線センサ13より構成されている。
次に本音声認識装置の動きについて説明する。
まずカメラ1で装置の周囲の環境をモニタする。例え
ば駅の券売機に音声認識装置を考えた場合を考える。改
札口の様子をカメラ1でモニタし、例えば乗降客が多
数、改札口から券売機の方に向かってくるとモニタされ
た場合、環境判定部2で多数の人が近づいてくるのを察
知し、足音や話し声等、物音がふえると判定する。ま
た、一方音響分析部5では、パワー情報をノイズ対策部
へ送る。さらに近づいてくる人数が多いと判断される
と、ノイズ対策部3にその環境情報が送られる。一方、
券を買う為に人間が券売機に近づくと赤外線センサ13に
より人が近づき使用しようとしている事を感じ、その情
報を音声入力部4,環境判定部2,カメラ1に送る。この情
報に基づき、まずカメラ1では使用者の位置を測定し、
環境判定部2より位置情報をノイズ対策部3へ送る。ノ
イズ対策部3では上記環境情報とパワー情報と位置情報
よりノイズに対する対策を考える。例えば後ろを動いて
いる人間数が多く、かつ使用者がマイクから離れている
場合、ノイズ対策部3ではマイクの入力をしぼる一方、
文生成部9に近づく様にアナウンスする文、例えば「ま
わりがうるさいので近くによって下さい」の様な文を生
成し、音声合成部10で音声合成を行ない、音声出力部11
で音声出力を行ない、使用者に注意をうながす。
ば駅の券売機に音声認識装置を考えた場合を考える。改
札口の様子をカメラ1でモニタし、例えば乗降客が多
数、改札口から券売機の方に向かってくるとモニタされ
た場合、環境判定部2で多数の人が近づいてくるのを察
知し、足音や話し声等、物音がふえると判定する。ま
た、一方音響分析部5では、パワー情報をノイズ対策部
へ送る。さらに近づいてくる人数が多いと判断される
と、ノイズ対策部3にその環境情報が送られる。一方、
券を買う為に人間が券売機に近づくと赤外線センサ13に
より人が近づき使用しようとしている事を感じ、その情
報を音声入力部4,環境判定部2,カメラ1に送る。この情
報に基づき、まずカメラ1では使用者の位置を測定し、
環境判定部2より位置情報をノイズ対策部3へ送る。ノ
イズ対策部3では上記環境情報とパワー情報と位置情報
よりノイズに対する対策を考える。例えば後ろを動いて
いる人間数が多く、かつ使用者がマイクから離れている
場合、ノイズ対策部3ではマイクの入力をしぼる一方、
文生成部9に近づく様にアナウンスする文、例えば「ま
わりがうるさいので近くによって下さい」の様な文を生
成し、音声合成部10で音声合成を行ない、音声出力部11
で音声出力を行ない、使用者に注意をうながす。
第3図の様にマイクのすぐ上に位置した表示部12は、
第3図(a)の様に音声出力と同様な内容を表示し、視
覚的に注意をうながし、使用者をマイクの前に近づけ
る。使用者が近づいた事をカメラがモニタし、環境判定
部からの位置情報によりノイズ対策部がOKとすると表示
部の内容が第3図(b)の様に駅名をきく内容に変わ
る。ここで使用者が希望する駅名を発生してもらう事に
なる。また、マイク入力をしぼる、使用者に近づいても
らう事でもノイズが大きく認識が無理とノイズ対策部3
で判断された場合、ノイズ対策部3では上記の対策以外
にスイッチ部8により音声認識部6で認識する際に、使
用する辞書7を人の通りの多い場合のノイズをまぜた辞
書を使う様にスイッチングする。
第3図(a)の様に音声出力と同様な内容を表示し、視
覚的に注意をうながし、使用者をマイクの前に近づけ
る。使用者が近づいた事をカメラがモニタし、環境判定
部からの位置情報によりノイズ対策部がOKとすると表示
部の内容が第3図(b)の様に駅名をきく内容に変わ
る。ここで使用者が希望する駅名を発生してもらう事に
なる。また、マイク入力をしぼる、使用者に近づいても
らう事でもノイズが大きく認識が無理とノイズ対策部3
で判断された場合、ノイズ対策部3では上記の対策以外
にスイッチ部8により音声認識部6で認識する際に、使
用する辞書7を人の通りの多い場合のノイズをまぜた辞
書を使う様にスイッチングする。
一方、カメラ1で使用者が十分に音声入力部4のマイ
クに近づいているが、声が小さく、かつ周囲がうるさい
と判定されノイズ対策部3で音声入力部の入力をしぼっ
た場合、音声認識部6からノイズ対策部3に認識不可能
の情報が送られる。この情報をノイズ対策部では文生成
部9へ送り、文合成部9では「声が小さすぎます。もう
少し大きな声でもう1度御願いします」の様な文を生成
し、音声合成部10と、表示部12へ送り、使用者に目と耳
で注意をうながす。
クに近づいているが、声が小さく、かつ周囲がうるさい
と判定されノイズ対策部3で音声入力部の入力をしぼっ
た場合、音声認識部6からノイズ対策部3に認識不可能
の情報が送られる。この情報をノイズ対策部では文生成
部9へ送り、文合成部9では「声が小さすぎます。もう
少し大きな声でもう1度御願いします」の様な文を生成
し、音声合成部10と、表示部12へ送り、使用者に目と耳
で注意をうながす。
次に本発明の第2の実施例について第4図,第5図を
参照しながら説明する。第4図は第5図の模式図の様に
道端にある自動販売機に音声認識装置を付けた場合の音
声認識装置のブロック図である。全体の処理の流れは、
第1の実施例と同じだが、カメラ21で自動販売機の前に
ある道をモニタする。一方、使用者がコインを入力する
と、コイン入力部33で人がきた事をカメラ21,音声入力
部24に知らせる。ここで第5図(a),(b)の様に乗
用車あるいはトラックが近づいてきた事がモニタされる
と、車種・速度判定部22で例えば乗用車かトラックか緊
急車両かを判定し、その速度を判定する。これにより乗
用車がゆっくり走ってきた場合、ノイズがそれほど大き
くない事が予測される。一方逆にトラックが早いスピー
ドで走ってきた場合、ノイズが大きくなる事が予測され
る。さらに緊急車両がサイレンをならして近づいてきた
場合、その速度を判定する事により、サイレンの音がド
プラー効果によりどう変化するかそのスペクトルの変化
を推測する事ができる。これらの情報を基に、実施例1
と同様に使用者に注意をうながす等のノイズ対策を行な
う。
参照しながら説明する。第4図は第5図の模式図の様に
道端にある自動販売機に音声認識装置を付けた場合の音
声認識装置のブロック図である。全体の処理の流れは、
第1の実施例と同じだが、カメラ21で自動販売機の前に
ある道をモニタする。一方、使用者がコインを入力する
と、コイン入力部33で人がきた事をカメラ21,音声入力
部24に知らせる。ここで第5図(a),(b)の様に乗
用車あるいはトラックが近づいてきた事がモニタされる
と、車種・速度判定部22で例えば乗用車かトラックか緊
急車両かを判定し、その速度を判定する。これにより乗
用車がゆっくり走ってきた場合、ノイズがそれほど大き
くない事が予測される。一方逆にトラックが早いスピー
ドで走ってきた場合、ノイズが大きくなる事が予測され
る。さらに緊急車両がサイレンをならして近づいてきた
場合、その速度を判定する事により、サイレンの音がド
プラー効果によりどう変化するかそのスペクトルの変化
を推測する事ができる。これらの情報を基に、実施例1
と同様に使用者に注意をうながす等のノイズ対策を行な
う。
なお、表示部11を第3図(a)の様にマイクの上に取
付ける理由は、表示部を見る為、顔が正面をむき、マイ
クの近くに口がくる為である。
付ける理由は、表示部を見る為、顔が正面をむき、マイ
クの近くに口がくる為である。
上記実施例によれば、ノイズの発生の予想をマイクが
ノイズをひろう前に行なう事が可能であり、またノイズ
の種類を音のメディアだけでなく、画像のメディアから
も確認、推測が可能であり、従来の音メディアの情報の
みを用いたノイズ対策にくらべ1段とすぐれたものにな
る。
ノイズをひろう前に行なう事が可能であり、またノイズ
の種類を音のメディアだけでなく、画像のメディアから
も確認、推測が可能であり、従来の音メディアの情報の
みを用いたノイズ対策にくらべ1段とすぐれたものにな
る。
なお、本発明は上記実施例に限定されるものではな
い。たとえば赤外線センサーのかわりにタッチセンサー
等を用いる事が可能である。このほか、音声認識方式,
合成方式,動画像処理等は、従来より知られた方式を適
宜採用すればよい。
い。たとえば赤外線センサーのかわりにタッチセンサー
等を用いる事が可能である。このほか、音声認識方式,
合成方式,動画像処理等は、従来より知られた方式を適
宜採用すればよい。
[発明の効果] 以上の様に、本発明によれば、音声認識装置の使用環
境を音のメディアだけでなく、画像のメディアからも測
定し、認識誤りを起こす前にノイズ対策を行なう事が可
能であるので、非定常のノイズの多い環境下でも従来の
方式に比べ、高い認識率の得られる音声認識装置を提供
できる。
境を音のメディアだけでなく、画像のメディアからも測
定し、認識誤りを起こす前にノイズ対策を行なう事が可
能であるので、非定常のノイズの多い環境下でも従来の
方式に比べ、高い認識率の得られる音声認識装置を提供
できる。
第1図は本発明の第1の実施例に係る環境モニタ付音声
認識装置のブロック図、第2図は第1の実施例に係る処
理の流れの流れ図、第3図は表示部の概略図、第4図は
第2の実施例に係る環境モニタ付音声認識装置のブロッ
ク図、第5図は第2の実施例に係る使用環境の模式図で
ある。 1……カメラ、2……環境判定部、3……ノイズ対策
部、4……音声入力部、5……音響分析部、6……音声
認識部、7……辞書、8……スイッチ部、9……文生成
部、10……音声合成部、11……音声出力部、12……表示
部、13……赤外線センサ。
認識装置のブロック図、第2図は第1の実施例に係る処
理の流れの流れ図、第3図は表示部の概略図、第4図は
第2の実施例に係る環境モニタ付音声認識装置のブロッ
ク図、第5図は第2の実施例に係る使用環境の模式図で
ある。 1……カメラ、2……環境判定部、3……ノイズ対策
部、4……音声入力部、5……音響分析部、6……音声
認識部、7……辞書、8……スイッチ部、9……文生成
部、10……音声合成部、11……音声出力部、12……表示
部、13……赤外線センサ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−262199(JP,A) 特開 昭59−30138(JP,A) 特開 昭62−183499(JP,A) 特開 昭63−223795(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 571 G10L 3/00 531 JICSTファイル(JOIS)
Claims (1)
- 【請求項1】音声を入力する手段と、入力音声を分析す
る手段と、この分析結果から入力音声を認識する手段と
を備えた音声認識装置において、音声認識装置の使用環
境を画像情報としてモニタする手段と、音声認識の際に
入力音声からノイズレベルを測定する手段と、モニタ画
像情報及びノイズレベル情報からノイズレベルの増大が
予想される場合その対応指示を出力する手段と、前記モ
ニタ画像情報及びノイズレベル情報に従ってノイズ対策
を行なう手段とを具備したことを特徴とする環境モニタ
付音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1128725A JP2877350B2 (ja) | 1989-05-24 | 1989-05-24 | 環境モニタ付音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1128725A JP2877350B2 (ja) | 1989-05-24 | 1989-05-24 | 環境モニタ付音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02308299A JPH02308299A (ja) | 1990-12-21 |
JP2877350B2 true JP2877350B2 (ja) | 1999-03-31 |
Family
ID=14991902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1128725A Expired - Fee Related JP2877350B2 (ja) | 1989-05-24 | 1989-05-24 | 環境モニタ付音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2877350B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003208196A (ja) * | 2002-01-11 | 2003-07-25 | Matsushita Electric Ind Co Ltd | 音声対話方法および装置 |
JP2009192942A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | 音声対話装置及び支援方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003091299A (ja) * | 2001-07-13 | 2003-03-28 | Honda Motor Co Ltd | 車載用音声認識装置 |
CN106653058B (zh) * | 2016-10-28 | 2020-03-17 | 中国科学院计算技术研究所 | 基于双声道的脚步检测方法 |
-
1989
- 1989-05-24 JP JP1128725A patent/JP2877350B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003208196A (ja) * | 2002-01-11 | 2003-07-25 | Matsushita Electric Ind Co Ltd | 音声対話方法および装置 |
JP2009192942A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | 音声対話装置及び支援方法 |
US8155968B2 (en) | 2008-02-15 | 2012-04-10 | Kabushiki Kaisha Toshiba | Voice recognition apparatus and method for performing voice recognition comprising calculating a recommended distance range between a user and an audio input module based on the S/N ratio |
Also Published As
Publication number | Publication date |
---|---|
JPH02308299A (ja) | 1990-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6977004B2 (ja) | 車載装置、発声を処理する方法およびプログラム | |
KR101892028B1 (ko) | 음향 추적 정보 제공 방법, 차량용 음향 추적 장치, 및 이를 포함하는 차량 | |
WO2021169742A1 (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
CN112464661B (zh) | 模型训练方法、语音对话检测方法及相关设备 | |
CN110660201B (zh) | 到站提醒方法、装置、终端及存储介质 | |
CN111381673A (zh) | 双向车载虚拟个人助理 | |
US20130070928A1 (en) | Methods, systems, and media for mobile audio event recognition | |
CN111325386B (zh) | 交通工具运行状态的预测方法、装置、终端及存储介质 | |
CN107799126A (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
JPH01195499A (ja) | 音声入力装置 | |
KR20180066509A (ko) | 후방 차량의 시각화 정보 제공 장치 및 방법 | |
CN216014810U (zh) | 通知装置与穿戴装置 | |
CN108962241A (zh) | 位置提示方法、装置、存储介质及电子设备 | |
CN115171692A (zh) | 一种语音交互方法和装置 | |
CN114911449A (zh) | 音量控制方法、装置、存储介质和电子设备 | |
JP2877350B2 (ja) | 環境モニタ付音声認識装置 | |
US20240112677A1 (en) | Motor vehicle and method for summarizing a conversation in a motor vehicle | |
JP2018144534A (ja) | 運転支援システムおよび運転支援方法並びに運転支援プログラム | |
US20210082427A1 (en) | Information processing apparatus and information processing method | |
CN116959496A (zh) | 语音情感变化识别方法、装置、电子设备及介质 | |
CN115497478A (zh) | 一种车辆内外交流的方法、装置和可读存储介质 | |
CN115352361A (zh) | 一种车辆用隔窗对话方法、装置和车辆 | |
JP3926280B2 (ja) | 音声認識システム | |
JPH02262199A (ja) | 環境モニタ付音声認識装置 | |
CN111717754A (zh) | 基于安全警报语的轿厢式电梯的控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080122 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090122 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |