[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2877350B2 - 環境モニタ付音声認識装置 - Google Patents

環境モニタ付音声認識装置

Info

Publication number
JP2877350B2
JP2877350B2 JP1128725A JP12872589A JP2877350B2 JP 2877350 B2 JP2877350 B2 JP 2877350B2 JP 1128725 A JP1128725 A JP 1128725A JP 12872589 A JP12872589 A JP 12872589A JP 2877350 B2 JP2877350 B2 JP 2877350B2
Authority
JP
Japan
Prior art keywords
noise
unit
recognition device
speech
environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1128725A
Other languages
English (en)
Other versions
JPH02308299A (ja
Inventor
浩之 千本
博史 金澤
洋一 竹林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1128725A priority Critical patent/JP2877350B2/ja
Publication of JPH02308299A publication Critical patent/JPH02308299A/ja
Application granted granted Critical
Publication of JP2877350B2 publication Critical patent/JP2877350B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、音声認識装置にかかわり、特にノイズの多
い環境下で使用する環境モニタ付音声認識装置に関す
る。
(従来の技術) 近年、マンマシン・インターフェースとして音声認識
・合成の技術の向上が目覚しく、荷物の区分け、券売機
等に音声認識装置が使用されている。しかし、現在の音
声認識装置の多くは、使用する環境のノイズが大きくな
ると認識率が低下する。また、ノイズ対策としては、音
声が入力されていない時に、音声パワーによりノイズレ
ベルを判断する等があるが、どんな環境のノイズなの
か、発声者がマイクからどのくらいはなれているか等を
監視する機能を持つものはなく、ノイズに強い認識を行
なう事ができないという問題が生じた。
(発明が解決しようとする課題) この様に従来の音声認識装置では、マイクからの入力
情報のみでノイズの大きさ、種類などを判定し、ノイズ
対策を行なうという音のメディアのみで対応をしてい
た。この為、非定常的な雑音、例えば駅構内で列車の発
着にともなう人の移動の際のノイズ等をすばやく感知す
る事ができないという問題が生じた。
本発明は、このような事情に鑑みてなされたもので、
その目的とするところは、カメラにより音声認識装置の
使用環境をモニタし、周囲の環境に適応した音声認識装
置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明に係る音声認識装置は、マイクからの音メディ
アの情報のみでノイズ対策を行なうのではなく、カメラ
のモニタからの画像メディアの情報も並用してノイズの
対策を行なう手段を備えている。
(作用) 本発明によれば、音声認識装置がカメラにより使用環
境、周囲の環境をモニタし、人通りが多くなりだした
り、多数の人が近づいてきたりした場合、ノイズが大き
くなる事を予想し、自動的に入力の音量をしぼったり、
その様な環境で使用しようとする人間がいた場合、近づ
いてしゃべる様に指示したり、人通りに合わせてノイズ
がふくまれたリファレンスパタンを用いて認識を行なう
事により認識誤りをへらすことができる。
(実施例) 以下、図面を参照しながら本発明の実施例について説
明する。
第1図は本発明第1の実施例に係る音声認識装置のブ
ロック図、第2図は第1の実施例に係る処理の流れ図、
第3図は、表示部の概略図である。
本装置は、カメラ1,環境判定部2,ノイズ対策部3,音声
入力部4,音響分析部5,音声認識部6,辞書7,スイッチ部8,
文生成部9,音声合成部10,音声出力部11,表示部12,赤外
線センサ13より構成されている。
次に本音声認識装置の動きについて説明する。
まずカメラ1で装置の周囲の環境をモニタする。例え
ば駅の券売機に音声認識装置を考えた場合を考える。改
札口の様子をカメラ1でモニタし、例えば乗降客が多
数、改札口から券売機の方に向かってくるとモニタされ
た場合、環境判定部2で多数の人が近づいてくるのを察
知し、足音や話し声等、物音がふえると判定する。ま
た、一方音響分析部5では、パワー情報をノイズ対策部
へ送る。さらに近づいてくる人数が多いと判断される
と、ノイズ対策部3にその環境情報が送られる。一方、
券を買う為に人間が券売機に近づくと赤外線センサ13に
より人が近づき使用しようとしている事を感じ、その情
報を音声入力部4,環境判定部2,カメラ1に送る。この情
報に基づき、まずカメラ1では使用者の位置を測定し、
環境判定部2より位置情報をノイズ対策部3へ送る。ノ
イズ対策部3では上記環境情報とパワー情報と位置情報
よりノイズに対する対策を考える。例えば後ろを動いて
いる人間数が多く、かつ使用者がマイクから離れている
場合、ノイズ対策部3ではマイクの入力をしぼる一方、
文生成部9に近づく様にアナウンスする文、例えば「ま
わりがうるさいので近くによって下さい」の様な文を生
成し、音声合成部10で音声合成を行ない、音声出力部11
で音声出力を行ない、使用者に注意をうながす。
第3図の様にマイクのすぐ上に位置した表示部12は、
第3図(a)の様に音声出力と同様な内容を表示し、視
覚的に注意をうながし、使用者をマイクの前に近づけ
る。使用者が近づいた事をカメラがモニタし、環境判定
部からの位置情報によりノイズ対策部がOKとすると表示
部の内容が第3図(b)の様に駅名をきく内容に変わ
る。ここで使用者が希望する駅名を発生してもらう事に
なる。また、マイク入力をしぼる、使用者に近づいても
らう事でもノイズが大きく認識が無理とノイズ対策部3
で判断された場合、ノイズ対策部3では上記の対策以外
にスイッチ部8により音声認識部6で認識する際に、使
用する辞書7を人の通りの多い場合のノイズをまぜた辞
書を使う様にスイッチングする。
一方、カメラ1で使用者が十分に音声入力部4のマイ
クに近づいているが、声が小さく、かつ周囲がうるさい
と判定されノイズ対策部3で音声入力部の入力をしぼっ
た場合、音声認識部6からノイズ対策部3に認識不可能
の情報が送られる。この情報をノイズ対策部では文生成
部9へ送り、文合成部9では「声が小さすぎます。もう
少し大きな声でもう1度御願いします」の様な文を生成
し、音声合成部10と、表示部12へ送り、使用者に目と耳
で注意をうながす。
次に本発明の第2の実施例について第4図,第5図を
参照しながら説明する。第4図は第5図の模式図の様に
道端にある自動販売機に音声認識装置を付けた場合の音
声認識装置のブロック図である。全体の処理の流れは、
第1の実施例と同じだが、カメラ21で自動販売機の前に
ある道をモニタする。一方、使用者がコインを入力する
と、コイン入力部33で人がきた事をカメラ21,音声入力
部24に知らせる。ここで第5図(a),(b)の様に乗
用車あるいはトラックが近づいてきた事がモニタされる
と、車種・速度判定部22で例えば乗用車かトラックか緊
急車両かを判定し、その速度を判定する。これにより乗
用車がゆっくり走ってきた場合、ノイズがそれほど大き
くない事が予測される。一方逆にトラックが早いスピー
ドで走ってきた場合、ノイズが大きくなる事が予測され
る。さらに緊急車両がサイレンをならして近づいてきた
場合、その速度を判定する事により、サイレンの音がド
プラー効果によりどう変化するかそのスペクトルの変化
を推測する事ができる。これらの情報を基に、実施例1
と同様に使用者に注意をうながす等のノイズ対策を行な
う。
なお、表示部11を第3図(a)の様にマイクの上に取
付ける理由は、表示部を見る為、顔が正面をむき、マイ
クの近くに口がくる為である。
上記実施例によれば、ノイズの発生の予想をマイクが
ノイズをひろう前に行なう事が可能であり、またノイズ
の種類を音のメディアだけでなく、画像のメディアから
も確認、推測が可能であり、従来の音メディアの情報の
みを用いたノイズ対策にくらべ1段とすぐれたものにな
る。
なお、本発明は上記実施例に限定されるものではな
い。たとえば赤外線センサーのかわりにタッチセンサー
等を用いる事が可能である。このほか、音声認識方式,
合成方式,動画像処理等は、従来より知られた方式を適
宜採用すればよい。
[発明の効果] 以上の様に、本発明によれば、音声認識装置の使用環
境を音のメディアだけでなく、画像のメディアからも測
定し、認識誤りを起こす前にノイズ対策を行なう事が可
能であるので、非定常のノイズの多い環境下でも従来の
方式に比べ、高い認識率の得られる音声認識装置を提供
できる。
【図面の簡単な説明】
第1図は本発明の第1の実施例に係る環境モニタ付音声
認識装置のブロック図、第2図は第1の実施例に係る処
理の流れの流れ図、第3図は表示部の概略図、第4図は
第2の実施例に係る環境モニタ付音声認識装置のブロッ
ク図、第5図は第2の実施例に係る使用環境の模式図で
ある。 1……カメラ、2……環境判定部、3……ノイズ対策
部、4……音声入力部、5……音響分析部、6……音声
認識部、7……辞書、8……スイッチ部、9……文生成
部、10……音声合成部、11……音声出力部、12……表示
部、13……赤外線センサ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−262199(JP,A) 特開 昭59−30138(JP,A) 特開 昭62−183499(JP,A) 特開 昭63−223795(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 571 G10L 3/00 531 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声を入力する手段と、入力音声を分析す
    る手段と、この分析結果から入力音声を認識する手段と
    を備えた音声認識装置において、音声認識装置の使用環
    境を画像情報としてモニタする手段と、音声認識の際に
    入力音声からノイズレベルを測定する手段と、モニタ画
    像情報及びノイズレベル情報からノイズレベルの増大が
    予想される場合その対応指示を出力する手段と、前記モ
    ニタ画像情報及びノイズレベル情報に従ってノイズ対策
    を行なう手段とを具備したことを特徴とする環境モニタ
    付音声認識装置。
JP1128725A 1989-05-24 1989-05-24 環境モニタ付音声認識装置 Expired - Fee Related JP2877350B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1128725A JP2877350B2 (ja) 1989-05-24 1989-05-24 環境モニタ付音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1128725A JP2877350B2 (ja) 1989-05-24 1989-05-24 環境モニタ付音声認識装置

Publications (2)

Publication Number Publication Date
JPH02308299A JPH02308299A (ja) 1990-12-21
JP2877350B2 true JP2877350B2 (ja) 1999-03-31

Family

ID=14991902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1128725A Expired - Fee Related JP2877350B2 (ja) 1989-05-24 1989-05-24 環境モニタ付音声認識装置

Country Status (1)

Country Link
JP (1) JP2877350B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003208196A (ja) * 2002-01-11 2003-07-25 Matsushita Electric Ind Co Ltd 音声対話方法および装置
JP2009192942A (ja) * 2008-02-15 2009-08-27 Toshiba Corp 音声対話装置及び支援方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091299A (ja) * 2001-07-13 2003-03-28 Honda Motor Co Ltd 車載用音声認識装置
CN106653058B (zh) * 2016-10-28 2020-03-17 中国科学院计算技术研究所 基于双声道的脚步检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003208196A (ja) * 2002-01-11 2003-07-25 Matsushita Electric Ind Co Ltd 音声対話方法および装置
JP2009192942A (ja) * 2008-02-15 2009-08-27 Toshiba Corp 音声対話装置及び支援方法
US8155968B2 (en) 2008-02-15 2012-04-10 Kabushiki Kaisha Toshiba Voice recognition apparatus and method for performing voice recognition comprising calculating a recommended distance range between a user and an audio input module based on the S/N ratio

Also Published As

Publication number Publication date
JPH02308299A (ja) 1990-12-21

Similar Documents

Publication Publication Date Title
JP6977004B2 (ja) 車載装置、発声を処理する方法およびプログラム
KR101892028B1 (ko) 음향 추적 정보 제공 방법, 차량용 음향 추적 장치, 및 이를 포함하는 차량
WO2021169742A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN112464661B (zh) 模型训练方法、语音对话检测方法及相关设备
CN110660201B (zh) 到站提醒方法、装置、终端及存储介质
CN111381673A (zh) 双向车载虚拟个人助理
US20130070928A1 (en) Methods, systems, and media for mobile audio event recognition
CN111325386B (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN107799126A (zh) 基于有监督机器学习的语音端点检测方法及装置
JPH01195499A (ja) 音声入力装置
KR20180066509A (ko) 후방 차량의 시각화 정보 제공 장치 및 방법
CN216014810U (zh) 通知装置与穿戴装置
CN108962241A (zh) 位置提示方法、装置、存储介质及电子设备
CN115171692A (zh) 一种语音交互方法和装置
CN114911449A (zh) 音量控制方法、装置、存储介质和电子设备
JP2877350B2 (ja) 環境モニタ付音声認識装置
US20240112677A1 (en) Motor vehicle and method for summarizing a conversation in a motor vehicle
JP2018144534A (ja) 運転支援システムおよび運転支援方法並びに運転支援プログラム
US20210082427A1 (en) Information processing apparatus and information processing method
CN116959496A (zh) 语音情感变化识别方法、装置、电子设备及介质
CN115497478A (zh) 一种车辆内外交流的方法、装置和可读存储介质
CN115352361A (zh) 一种车辆用隔窗对话方法、装置和车辆
JP3926280B2 (ja) 音声認識システム
JPH02262199A (ja) 環境モニタ付音声認識装置
CN111717754A (zh) 基于安全警报语的轿厢式电梯的控制方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees