JPH0432900A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0432900A JPH0432900A JP2138879A JP13887990A JPH0432900A JP H0432900 A JPH0432900 A JP H0432900A JP 2138879 A JP2138879 A JP 2138879A JP 13887990 A JP13887990 A JP 13887990A JP H0432900 A JPH0432900 A JP H0432900A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- recognition
- vocalization
- recognition result
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 206010011224 Cough Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
夜虚芳M−
本発明は、音声認識装置、より詳細には、音声認識装置
における認識結果の判定方式に関する。
における認識結果の判定方式に関する。
史米投佐
音声認識は1機械、装置の音声による制御や音声による
データ入力等に広く利用されている。この場合、音声の
誤認識は制御入力の誤りやデータ入力の誤りとなって現
れるので、その影響は極めて重大である。特に、音声入
力によって機械の動作を指示する場合には、誤認識によ
る異常動作を防止しなければならない。このような場合
、従来、第1位の候補の認識結果の動作指示内容が危険
である場合には、第1位以外の上位候補の指示内容によ
って、無害な指示内容を持つ候補をL&識結果としたり
、音声入力を無効にして1機械の異常動作を防いだり、
或いは、第1位の候補をそのまま認識結果として出力し
、機械の動作を指示すると、異常動作を行なう可能性が
ある場合には、第1位の候補の認識信頼度に応じて、使
用者に確認を求めたり、第1位の候補を無効にしたりし
ていた。
データ入力等に広く利用されている。この場合、音声の
誤認識は制御入力の誤りやデータ入力の誤りとなって現
れるので、その影響は極めて重大である。特に、音声入
力によって機械の動作を指示する場合には、誤認識によ
る異常動作を防止しなければならない。このような場合
、従来、第1位の候補の認識結果の動作指示内容が危険
である場合には、第1位以外の上位候補の指示内容によ
って、無害な指示内容を持つ候補をL&識結果としたり
、音声入力を無効にして1機械の異常動作を防いだり、
或いは、第1位の候補をそのまま認識結果として出力し
、機械の動作を指示すると、異常動作を行なう可能性が
ある場合には、第1位の候補の認識信頼度に応じて、使
用者に確認を求めたり、第1位の候補を無効にしたりし
ていた。
而して、上述のごとき従来技術では、入力音声を照合し
て、第1位の候補が正しい結果であっても認識信頼度が
第2の閾値より小さい場合には、認識結果は無効となり
、使用者は、同じ発声を繰り返すことになる。
て、第1位の候補が正しい結果であっても認識信頼度が
第2の閾値より小さい場合には、認識結果は無効となり
、使用者は、同じ発声を繰り返すことになる。
このとき、認識信頼度の低い原因が、突発的な雑音や一
時的な声の変調(せき込み、声の裏返えりなど)の場合
には、言い直しによって、2回目の発声では有効な認識
結果が得られる可能性が高い。しかし、定常的な周囲の
騒音や、音声の経時変化などが原因の場合には、何回同
じ発声を繰り返しても有効な認識結果は得られない。
時的な声の変調(せき込み、声の裏返えりなど)の場合
には、言い直しによって、2回目の発声では有効な認識
結果が得られる可能性が高い。しかし、定常的な周囲の
騒音や、音声の経時変化などが原因の場合には、何回同
じ発声を繰り返しても有効な認識結果は得られない。
豆−一敗
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、機械の異常動作を防止しつつ、言い直しによる入
力に対しては、有効な認識結果が得られるような音声認
識装置を提供することを目的としてなされたものである
。
特に、機械の異常動作を防止しつつ、言い直しによる入
力に対しては、有効な認識結果が得られるような音声認
識装置を提供することを目的としてなされたものである
。
豊−一戒
本発明は、上記の目的を達成するために、入力された音
声パターンを登録された音声パターンと照合して第1位
の候補と該候補の認識信頼度を計算する照合部と、該認
識信頼度が第1の閾値より大きい場合には、第1位の候
補を認識結果とし、該認識信頼度が第2の閾値より大き
く、第1の閾値より小さい場合には、第1位の候補の確
認を促す表示を行ない、該認識信頼度が第2の閾値より
小さい場合には、第1位の候補を認識結果としない認識
結果判定部と、前発声の第1位の候補を記憶する候補記
憶部とを具備する音声認識装置において、現発声の第1
位の候補が前発声の第1位の候補と等しい場合には、前
記第1、第2の閾値の片方もしくは双方を下げて認識結
果を判定することを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
声パターンを登録された音声パターンと照合して第1位
の候補と該候補の認識信頼度を計算する照合部と、該認
識信頼度が第1の閾値より大きい場合には、第1位の候
補を認識結果とし、該認識信頼度が第2の閾値より大き
く、第1の閾値より小さい場合には、第1位の候補の確
認を促す表示を行ない、該認識信頼度が第2の閾値より
小さい場合には、第1位の候補を認識結果としない認識
結果判定部と、前発声の第1位の候補を記憶する候補記
憶部とを具備する音声認識装置において、現発声の第1
位の候補が前発声の第1位の候補と等しい場合には、前
記第1、第2の閾値の片方もしくは双方を下げて認識結
果を判定することを特徴としたものである。以下、本発
明の実施例に基づいて説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、1は音声入力部、2は音声パターン変換部、3
は標準パターン格納部、4は照合部、5は候補記憶部、
6は認識結果判定部で、マイクなどの音声入力部1から
入力された音声信号は、音声パターン変換部2で音声パ
ターンに変換される。音声認識に有効な変換方法として
は様々なものが知られているが、例えば、フレーム周期
10m5で15チヤンネルのバンドパスフィルタ群の出
力を取り出したものを用いれば良い。標準パターン格納
部3には、予め、認識対象語いを発声したものを音声パ
ターンに変換し、標準パターンとして格納しておく。照
合部4では、入力音声パターンXと標準パターンY1、
Y3、・・・YM(Mは。
、図中、1は音声入力部、2は音声パターン変換部、3
は標準パターン格納部、4は照合部、5は候補記憶部、
6は認識結果判定部で、マイクなどの音声入力部1から
入力された音声信号は、音声パターン変換部2で音声パ
ターンに変換される。音声認識に有効な変換方法として
は様々なものが知られているが、例えば、フレーム周期
10m5で15チヤンネルのバンドパスフィルタ群の出
力を取り出したものを用いれば良い。標準パターン格納
部3には、予め、認識対象語いを発声したものを音声パ
ターンに変換し、標準パターンとして格納しておく。照
合部4では、入力音声パターンXと標準パターンY1、
Y3、・・・YM(Mは。
登録しである標準パターン数)を照合する。照合の方法
は、例えば、DPマツチングを用いれば良い。例えば、
全ての標準パターンの中でYjが最もXと距離が小さか
ったとすれば、Yjに対応する単語名やコマンド名など
が第1位の候補となる。
は、例えば、DPマツチングを用いれば良い。例えば、
全ての標準パターンの中でYjが最もXと距離が小さか
ったとすれば、Yjに対応する単語名やコマンド名など
が第1位の候補となる。
この距離をDlとすると、認識信頼度りを1/D1とす
れば良い。もしくは、単語ごとに設定した正規化係数Z
jを用いてL=Zj/D□とすれば良い。
れば良い。もしくは、単語ごとに設定した正規化係数Z
jを用いてL=Zj/D□とすれば良い。
第2図は、認識結果判定部6の動作説明をするためのフ
ローチャートで、該認識結果判定部6では、各標準パタ
ーンごと、もしくは単語、コマンドごとに設定された2
種類の閾値T iJ t T z jを用いて、L>T
工jの場合には、第1位の候補を認識結果として出力す
る(ただし、第2図のフローチャートにおいて、L:認
識信頼度、j:第1位の候補、j−old :前回の第
1位の候補、Txj+ T2:J :単語ごとに設定さ
れた閾値、α□β:正の定数である) 6T2j<L<
TユJの場合には、使用者に、第1位の候補を認識結果
として出力して良いかどうかの確認を促す表示を行ない
、出力と−して良いという指示があった場合のみ、第1
位の候補を認識結果として出力する。指示の方法として
は、はい/いいえを音声で入力する方法や3秒間のうち
に中止ボタンが押されなかった場合はOKの指示が出さ
れたと見なすなどの方法を用いれば良い。
ローチャートで、該認識結果判定部6では、各標準パタ
ーンごと、もしくは単語、コマンドごとに設定された2
種類の閾値T iJ t T z jを用いて、L>T
工jの場合には、第1位の候補を認識結果として出力す
る(ただし、第2図のフローチャートにおいて、L:認
識信頼度、j:第1位の候補、j−old :前回の第
1位の候補、Txj+ T2:J :単語ごとに設定さ
れた閾値、α□β:正の定数である) 6T2j<L<
TユJの場合には、使用者に、第1位の候補を認識結果
として出力して良いかどうかの確認を促す表示を行ない
、出力と−して良いという指示があった場合のみ、第1
位の候補を認識結果として出力する。指示の方法として
は、はい/いいえを音声で入力する方法や3秒間のうち
に中止ボタンが押されなかった場合はOKの指示が出さ
れたと見なすなどの方法を用いれば良い。
L < T 2 Jの場合には、第1位の候補を拒否し
、認識結果を無効にして、次の音声の入方待ちの状態へ
入る。候補記憶部5では、第1位の候補を記憶し、次の
音声を照合した際、第1位の候補がYjに対応する単語
名やコマンド名が候補記憶部5で記憶されたものと等し
い場合にはTlj、T2jを下げて、認識結果判定部6
での処理を行なう。
、認識結果を無効にして、次の音声の入方待ちの状態へ
入る。候補記憶部5では、第1位の候補を記憶し、次の
音声を照合した際、第1位の候補がYjに対応する単語
名やコマンド名が候補記憶部5で記憶されたものと等し
い場合にはTlj、T2jを下げて、認識結果判定部6
での処理を行なう。
T工J+Tzjの変更は、
T工j=T1j−αL’ (
1)T 2 :J = T 2 j−βL’
(2)とすれば良い、ここでα、βは
正の定数、L′は前回の認識信頼度である。
1)T 2 :J = T 2 j−βL’
(2)とすれば良い、ここでα、βは
正の定数、L′は前回の認識信頼度である。
羞−一来
以上の説明から明らかなように、本発明によると、前回
の第1位の候補と、今回の第1位の候補が等しい場合に
は、2つの閾値T 1jt T 2 jの値を小さくし
ている。このため、前回と今回の第1位の候補が等しく
、この候補が正しい認識結果である可能性が高い場合は
、今回の認識信頼度が小さい場合でもそのまま、この候
補が出力される確率が大きくなり、何回も同じ発声を繰
り返しても入力できないという欠点が解消できる。
の第1位の候補と、今回の第1位の候補が等しい場合に
は、2つの閾値T 1jt T 2 jの値を小さくし
ている。このため、前回と今回の第1位の候補が等しく
、この候補が正しい認識結果である可能性が高い場合は
、今回の認識信頼度が小さい場合でもそのまま、この候
補が出力される確率が大きくなり、何回も同じ発声を繰
り返しても入力できないという欠点が解消できる。
第1図は、本発明による音声認識装置の一実施例を説明
するためのブロック図、第2図は、第1図に示した認識
結果判定部の動作説明をするためのフローチャートであ
る。 1・・・音声入力部、2・・・音声パターン変換部、3
標準パタ一ン格納部、4・・・照合部、訃・・候補記憶
部、6・・・認識結果判定部。 第2図 第1図 T2J=T1j−βT2コ 認識結果 認識結果無効
するためのブロック図、第2図は、第1図に示した認識
結果判定部の動作説明をするためのフローチャートであ
る。 1・・・音声入力部、2・・・音声パターン変換部、3
標準パタ一ン格納部、4・・・照合部、訃・・候補記憶
部、6・・・認識結果判定部。 第2図 第1図 T2J=T1j−βT2コ 認識結果 認識結果無効
Claims (1)
- 1、入力された音声パターンを登録された音声パターン
と照合して第1位の候補と該候補の認識信頼度を計算す
る照合部と、該認識信頼度が第1の閾値より大きい場合
には、第1位の候補を認識結果とし、該認識信頼度が第
2の閾値より大きく、第1の閾値より小さい場合には、
第1位の候補の確認を促す表示を行ない、該認識信頼度
が第2の閾値より小さい場合には、第1位の候補を認識
結果としない認識結果判定部と、前発声の第1位の候補
を記憶する候補記憶部とを具備する音声認識装置におい
て、現発声の第1位の候補が前発声の第1位の候補と等
しい場合には、前記第1、第2の閾値の片方もしくは双
方を下げて認識結果を判定することを特徴とする音声認
識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2138879A JPH0432900A (ja) | 1990-05-29 | 1990-05-29 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2138879A JPH0432900A (ja) | 1990-05-29 | 1990-05-29 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0432900A true JPH0432900A (ja) | 1992-02-04 |
Family
ID=15232250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2138879A Pending JPH0432900A (ja) | 1990-05-29 | 1990-05-29 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0432900A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002311991A (ja) * | 2001-04-19 | 2002-10-25 | Alpine Electronics Inc | 音声認識方法 |
JP2006251800A (ja) * | 2005-03-07 | 2006-09-21 | Samsung Electronics Co Ltd | ユーザ適応型の音声認識方法及び音声認識装置 |
JP2007322647A (ja) * | 2006-05-31 | 2007-12-13 | Funai Electric Co Ltd | 電子機器 |
JP2008046299A (ja) * | 2006-08-14 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2019015950A (ja) * | 2017-07-05 | 2019-01-31 | パナソニックIpマネジメント株式会社 | 音声認識方法、プログラム、音声認識装置、及びロボット |
-
1990
- 1990-05-29 JP JP2138879A patent/JPH0432900A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002311991A (ja) * | 2001-04-19 | 2002-10-25 | Alpine Electronics Inc | 音声認識方法 |
JP4565768B2 (ja) * | 2001-04-19 | 2010-10-20 | アルパイン株式会社 | 音声認識装置 |
JP2006251800A (ja) * | 2005-03-07 | 2006-09-21 | Samsung Electronics Co Ltd | ユーザ適応型の音声認識方法及び音声認識装置 |
JP4709663B2 (ja) * | 2005-03-07 | 2011-06-22 | 三星電子株式会社 | ユーザ適応型の音声認識方法及び音声認識装置 |
JP2007322647A (ja) * | 2006-05-31 | 2007-12-13 | Funai Electric Co Ltd | 電子機器 |
US7908146B2 (en) | 2006-05-31 | 2011-03-15 | Funai Electric Co., Ltd. | Digital television receiver controlled by speech recognition |
JP2008046299A (ja) * | 2006-08-14 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
JP2019015950A (ja) * | 2017-07-05 | 2019-01-31 | パナソニックIpマネジメント株式会社 | 音声認識方法、プログラム、音声認識装置、及びロボット |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5860059A (en) | Transaction system based on a bidirectional speech channel by status graph building and problem detection for a human user | |
JP3284832B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JPS603699A (ja) | 適応性自動離散音声認識方法 | |
JPS62239231A (ja) | 口唇画像入力による音声認識方法 | |
CN110060674B (zh) | 表格管理方法、装置、终端和存储介质 | |
JPH02163819A (ja) | テキスト処理装置 | |
JPH11194793A (ja) | 音声ワープロ | |
Noyes et al. | Errors and error correction in automatic speech recognition systems | |
JPH0432900A (ja) | 音声認識装置 | |
JPH0830290A (ja) | 音声入力可能な情報処理装置およびそれにおける誤処理検出方法 | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP4537755B2 (ja) | 音声対話システム | |
JPH064264A (ja) | 音声入出力システム | |
JPH07325597A (ja) | 情報入力方法およびその方法を実施するための装置 | |
JPH04254896A (ja) | 音声認識訂正装置 | |
JPH09230889A (ja) | 音声認識応答装置 | |
JPH08335094A (ja) | 音声入力方法およびこの方法を実施する装置 | |
KR20220144498A (ko) | 자동 응답 서비스에서의 사용자 음성 응답의 식별 정확도를 향상시키기 위한 자동 응답 서비스 운영 서버 및 그 동작 방법 | |
JPH0654503B2 (ja) | パタ−ン認識装置 | |
JPH0634234B2 (ja) | パターン認識装置 | |
JPS61165797A (ja) | 音声認識装置 | |
JPS60260094A (ja) | 音声認識装置 | |
JPH06289899A (ja) | 音声認識装置 | |
JPH02149900A (ja) | 音声認識応答装置 | |
JPS61231629A (ja) | 音声入力装置 |