JP2001343994A - 音声認識誤り検出装置および記憶媒体 - Google Patents
音声認識誤り検出装置および記憶媒体Info
- Publication number
- JP2001343994A JP2001343994A JP2000164233A JP2000164233A JP2001343994A JP 2001343994 A JP2001343994 A JP 2001343994A JP 2000164233 A JP2000164233 A JP 2000164233A JP 2000164233 A JP2000164233 A JP 2000164233A JP 2001343994 A JP2001343994 A JP 2001343994A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- recognition
- appearance position
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 abstract description 25
- 238000010586 diagram Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Abstract
し、認識誤り検出を迅速化する。 【解決手段】 音声認識装置5の音声入力4の元となる
原稿を集め、事前原稿データベース1とする。事前原稿
処理部2は、事前原稿データベース1から認識処理開始
前に単語出現位置辞書3を作成する。認識結果処理部7
は、単語出現位置辞書3を利用し、認識結果6に最も類
似した事前原稿データベース1の文を誤り検出の根拠
(正解文)とする。選んだ正解文と認識結果の各単語を
比較し、正解文に存在しない認識単語を認識誤りとみな
して、認識誤り検出結果8を検出する。事前原稿データ
ベース1の一文を正解文と仮定することで、認識誤り検
出手順を単純化した。
Description
置および記憶媒体に係り、特に、認識誤りを自動検出す
る音声認識誤り検出装置および当該音声認識誤り検出装
置に自動検出を行わせるためのプログラムを記憶した記
憶媒体に関するものである。
句について、以下の通りに定義する。 「文」 読点(。)で終了する単語列。 「音声認識装置」 音声入力を逐次、単語に変換して出力する装置。 「認識結果」 音声認識装置が逐次出力する単語列、および、音声 認識装置が最終的に出力する文。 「認識誤り」 音声入力の書き起こしと異なる認識結果の単語。 「正解文」 認識誤りを検出する根拠として利用する文。 「事前原稿データベース」 音声入力の元となる原稿の集合。 「単語出現位置辞書」 事前原稿データベースに出現した単語と、その出現 位置を記録したテーブル。
検出が可能な手法としては、例えば、正解文とのDPマ
ッチングによる方法(尾上和穂他、“記者原稿を用いた
ニュース音声認識結果の修正法”、日本音響学会講演論
文集,1−6−6,pp.11−12.1998.3)
を利用するものがある。この手法によれば、認識結果が
文末に到達した時点で、認識結果の文と最も多く単語が
一致する事前原稿データベースの文を「正解文」と仮定
して認識誤りを検出する。ここで、「正解文」の仮定
は、事前原稿データベースの文のうち、認識結果の一文
に対してDPマッチング(中川聖一、“確率モデルによ
る音声認識”、PP.18−20)のスコアが最も高い
文を選んで行っている。
グによる音声認識手法では、認識結果の一文に対する事
前原稿データベースの各々の文のマッチングスコアを正
解文の選択基準としている。このため、音声認識装置が
認識結果を逐次、出力可能であるにもかかわらず、認識
結果が文末に到達するまで認識誤りを検出することがで
きない。
解文を逐次仮定することで、迅速に認識誤りを検出する
ことのできる音声認識誤り検出装置および当該認識誤り
検出を行わせるためのプログラムを記憶した記憶媒体を
提供することである。
めに請求項1の発明は、音声入力の元となる原稿を保持
する事前原稿データベースから所定の原稿を読み出し、
前記所定の原稿における単語の情報を単語辞書に記録す
る単語辞書作成手段と、前記所定の原稿の音声入力の音
声認識手段による認識結果と前記単語辞書を入力し、前
記単語の情報に基づいて、前記認識結果に最も類似した
前記事前原稿データベース中の文を基準として前記認識
結果における認識誤りを検出する検出手段とを備えたこ
とを特徴とする音声認識誤り検出装置を提供する。
の音声認識誤り検出装置において、前記単語辞書作成手
段は、前記事前原稿データベース中の文を単語単位に分
割する手段と、前記分割した単語を、その出現する文番
号、出現位置とともに前記単語辞書に記録する手段とを
備えたことを特徴とする音声認識誤り検出装置を提供す
る。
の音声認識誤り検出装置において、前記検出手段は、前
記認識結果の単語について、連続する長さが最長の単語
出現位置の組の文番号、出現位置を前記認識結果の単語
とともに出現位置リストに記録する手段と、前記単語辞
書と前記出現位置リストを入力し、前記出現位置リスト
に最も多く出現する文番号を正解文の文番号と仮定する
手段と、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出手段とを備えたこと
を特徴とする音声認識誤り検出装置を提供する。
の音声認識誤り検出装置において、前記誤り検出手段
は、前記出現位置リストと前記正解文の各文番号が異な
る単語を誤り候補とし、前記誤り候補の前後の単語の出
現位置から前記誤り候補に対応する正解単語を前記単語
辞書を調べて正解文字列を作成することを特徴とする音
声認識誤り検出装置を提供する。
なる原稿を保持する事前原稿データベースから所定の原
稿を読み出し、前記所定の原稿における単語の情報を単
語辞書に記録する単語辞書作成ステップと、前記所定の
原稿の音声入力に対して音声認識処理を行う音声認識ス
テップと、前記音声認識ステップにおける認識結果と前
記単語辞書を入力し、前記単語の情報に基づいて、前記
認識結果に最も類似した前記事前原稿データベース中の
文を基準として前記認識結果における認識誤りを検出す
る検出ステップとを備えたプログラムをコンピュータに
読み取り可能に記憶したことを特徴とする記憶媒体を提
供する。
の記憶媒体において、前記単語辞書作成ステップは、前
記事前原稿データベース中の文を単語単位に分割するス
テップと、前記分割した単語を、その出現する文番号、
出現位置とともに前記単語辞書に記録するステップとを
備えたことを特徴とする記憶媒体を提供する。
の記憶媒体において、前記検出ステップは、前記認識結
果の単語について、連続する長さが最長の単語出現位置
の組の文番号、出現位置を前記認識結果の単語とともに
出現位置リストに記録するステップと、前記単語辞書と
前記出現位置リストを入力し、前記出現位置リストに最
も多く出現する文番号を正解文の文番号と仮定するステ
ップと、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出ステップとを備えた
ことを特徴とする記憶媒体を提供する。
の記憶媒体において、前記誤り検出ステップにおいて、
前記出現位置リストと前記正解文の各文番号が異なる単
語を誤り候補とし、前記誤り候補の前後の単語の出現位
置から前記誤り候補に対応する正解単語を前記単語辞書
を調べて正解文字列を作成することを特徴とする記憶媒
体を提供する。
明の実施の形態を詳細に説明する。図1は本発明に係る
音声認識誤り検出装置の一実施形態の全体構成を示す構
成図である。
認識結果処理部7と音声認識装置5で構成される。音声
認識装置5は認識結果を単語単位で逐次、出力可能な構
成のものであればよく、これにより、音声入力4から認
識結果6を出力して認識結果処理部7に供給する。
処理装置としてCPU,主記憶装置としてROM,CP
Uのワーキングエリアおよび補助記憶装置としてRA
M,補助記憶装置としてHDD等のディスク記憶装置、
および、外部記憶装置としてFDDその他のディスク記
憶装置を備える周知の構成を備え、例えばワークステー
ション、パーソナルコンピュータにより実施できる。こ
れらの構成を備えた本実施形態の装置は、各種記憶装置
(記憶媒体)からプログラムをロードし、このプログラ
ムにしたがって音声認識処理を行うことができる。
7について機能的に説明する。事前原稿処理部2は単語
分割器21と単語出現位置辞書作成部23で構成され、
音声入力4の元となる原稿の集合である事前事前原稿デ
ータベース1から、認識処理開始前に単語出現位置辞書
3を作成する。したがって、単語出現位置辞書3は認識
結果6に依存しない。単語分割器21の出力は、一度、
分割済みテキストデータ22として記録されてから単語
出現位置辞書作成部23の入力となる。
と認識誤り検出部73で構成され、認識処理開始後に認
識結果6を入力し、前もって作成された単語出現位置辞
書3を利用して認識結果6における認識誤りを検出し、
認識誤り検出結果8を出力する。一致単語列推定部71
の出力は、一旦、出現位置リスト72として記録された
後に認識誤り検出部73の入力となる。
憶されたプログラムにしたがった処理により、事前原稿
データベース1と音声入力4が与えられたとき、事前原
稿データベース1から単語出現位置辞書3を作成してお
き、音声入力4に対する認識結果6と一致する単語列を
単語出現位置辞書3を用いて調べ、この単語列の合計の
長さが最大となる文を正解文として選択/決定し、認識
誤り検出の根拠とすることで、迅速に認識誤り検出結果
8を出力することができる。
し、認識結果6が文末に到達した時点で全ての処理を一
旦終了する場合について詳細に説明する。
て、単語分割器21に関わる部分と単語出現位置辞書作
成部23に関わる部分に分けて説明する。
ートにしたがった手順で処理を行い、まずステップS2
10において、事前原稿データベース1の各文を形態素
解析し、単語単位に分割する。ここで利用可能な単語分
割ツールとしては、例えば、形態素解析ツール「茶筌」
ver.2.0(松本他、“日本語形態素解析システム
「茶筌」ver.2.0使用説明書”,NAIST−I
S−TR99008,参照)があるが、日本語文字列を
単語単位に分割することが可能なツールであれば他のツ
ールを用いても良い。
を、分割済みテキストデータ22に記録する。分割済み
テキストデータ22には、各文を識別する番号(文番
号)を、各単語列の先頭に併記しておく。図2の例の分
割済みテキストデータ22には、文番号として「23
0」が併記されている。
たフローチャートにしたがった手順で処理を行い、まず
ステップS230において、分割済みテキストデータ2
2から単語列を読み込む。次に、ステップS230で読
み込んだ単語列から、各単語が出現した位置(出現位
置)と出現した文の番号(文番号)を単語出現位置辞書
3に記録する。単語出現位置辞書3は、単語(例えば
「介護」)から出現位置(8610(230))を参照
するテーブル31と出現位置(例えば8611(23
0))から単語(「保険」)を参照するテーブル32の
二つを一組として作成する。
認識装置5による認識処理開始前に行われ、音声入力4
の元となる事前原稿データベース1から単語出現位置辞
書3が作成され、認識誤り検出の準備がなされる。一
方、認識結果処理部7は認識結果6を待ってこれを入力
し、単語出現位置辞書3を利用して以下の処理を行な
い、認識結果6における認識単語列の認識誤りを検出し
て、認識誤り検出結果8を出力する。
いて、一致単語列推定部71に関わる部分と認識誤り検
出部73に関わる部分に分けて説明する。
ーチャートにしたがった手順で処理を行い、まずステッ
プS710において、単語出現位置辞書3を読み込む。
次にステップS711で認識結果6を読み込む。
置5による情報を入力するとステップS712におい
て、認識結果6の各単語について、最長の一致する出現
位置と文番号を調べる。すなわち、認識結果6の各単語
の出現位置が前後の単語の出現位置と連続する出現位置
の組を調べ、見つかった出現位置の組の中で、連続する
長さが最長の組を探す。
位置の組(8610,8611,8612,8613)
が、認識結果6のそれぞれの認識単語「介護」、「保
険」、「制度」、および「で」について単語出現位置辞
書3から見つかる最長長さ(=4)の組である。また文
番号は、テーブル31から「230」が見つかる。
712で見つかった、最長長さの出現位置の組(861
0,8611,8612,8613)の各要素(出現位
置、文番号)を、それぞれ対応する認識単語とともに出
現位置リスト72に逐次、出力し記録する。
認識結果6の認識結果が文末に到達して一つ文の文とし
て完了したか判断し、文末に到達した場合は、ここで処
理を終了する。文末に到達していない場合はステップS
711の処理に戻り、次の新しい単語が認識されるまで
待ち、新しい認識単語について同様に出現位置リスト7
2を作成して記憶する。
チャートにしたがった手順で処理を行い、まずステップ
S730において、単語出現位置辞書3を読み込む。次
にステップS731では、一致単語列推定部71が作成
した出現位置リスト72を読み込む。
推定部71による情報を入力するとステップS732に
おいて、出現位置リスト72に記録された各文番号を調
べ、ここに最も多く出現した文番号を正解文の番号とし
て仮定する。図5の具体例では、出現位置リスト72中
の最多出現の文番号は合計6回出現の「230」(他は
「057」が合計2回)なので、文番号「230」を正
解文の文番号として選択する。
ベース1から正解文を選ぶ評価基準として、認識結果6
と一致する単語列の長さ(合計長)の最大値を用いてお
り、認識結果6に最も類似した事前原稿データベース1
の文を誤り検出の根拠(正解文)に用いている。このと
き、正解文を一意に決定する認識結果6の単語列は、必
ずしも文末まで認識されている必要がなく、認識された
分について作成されている出現位置リスト72にしたが
って認識誤り検出することができる。
み、この正解文の文番号を根拠として「誤り候補」を検
出する。すなわち、出現位置リスト72中の各単語の文
番号とステップS732で求めた正解文の文番号を比較
して、文番号が異なる認識単語を「誤り候補」とする。
一方、文番号が正解文の文番号と一致する認識単語は
「正解」とする。
の次の2つの要素; 和解 1508(057) 後 1509(057) の文番号「057」が、ステップS731で決定した正
解文の番号「230」と異なる。出現位置リスト72中
の他の要素の文番号「230」は正解文の番号と一致す
る。したがって、認識単語「和解」と「後」を誤り候補
76として検出し、それ以外の認識単語(「介護」、
「保険」、「制度」、「で」、「が」、「必要」)は正
解75,77とする。
は誤り候補の認識単語(または認識単語列)の前後に正
解単語列が存在するか判断し、前後に存在せず、誤り候
補の認識単語(または認識単語列)が正解単語列で挟ま
れていない場合はステップS731に戻り、さらにリス
ト読み込みを行って誤り候補を検出するためにステップ
S731〜S734を繰り返し行う。ステップS734
において正解単語列が前後に存在し、誤り候補の認識単
語(または認識単語列)が正解単語列で挟まれている場
合はステップS735以降に進む。
解−後)が正解単語列75(介護−保険−制度−で)と
正解単語列77(が−必要)に挟まれている。したがっ
て、ステップS735からステップS735へ進み、正
解単語列の出現位置を利用して正解文字列を作成する。
補の単語(または単語列)の前後の正解単語の出現位置
を補間して、単語出現位置辞書3を利用して正解文字列
を作る。
(和解−後)の前後の正解「で」の出現位置「861
3」と正解「が」の出現位置「8616」の間を連続す
る出現位置「8614」〜「8615」で補間する。そ
して、補間した出現位置「8614」,「8615」に
対応する単語を単語出現位置辞書3から調べて、正解文
字列を作る。出現位置「8614」に対応する単語は
「は」(図示せず)、出現位置「8615」に対応する
単語は「介護」(図示せず)であり、正解文字列「は介
護」を作成する。
ップS736に進み、正解文字列を根拠として誤り候補
の正誤判定を行う。すなわち、正解文字列に存在する誤
り候補の認識単語を「正解」とし、正解文字列に出現し
ない誤り候補の認識単語を「誤り」とする。この様に、
事前原稿データベース1の一文を前述の通りに正解文と
仮定し、正解文に存在しない認識単語を認識誤りとみな
すことで、誤り検出の手順を単純化している。
における「和解」と「後」は、ともに正解文字列「は介
護」に存在しない。したがって、ともに「誤り」として
検出する。
その判定結果を認識誤り検出結果8に出力する。文頭か
ら順に、「正解」または「誤り」と判定した単語を認識
誤り検出結果8に出力し、ここで「誤り」の単語には、
図示の通りに「正解」の単語と識別する記号85を併記
する。
で、認識結果6の認識結果が文末に到達して一つ文の文
として完了したか判断し、文末に到達した場合は、ここ
で処理を終了する。文末に到達していない場合はステッ
プS731の処理に戻り、出現位置リスト72が更新さ
れるまで待ち、更新された出現位置リスト72にしたが
って同様に認識誤り検出を行う。
を与える事前原稿データベース1の文が一つに特定され
る時点で正解文を決定できるので、必ずしも認識結果6
が文末に到達するまで待つ必要がない。すなわち、認識
結果6が文末に到達していなくても、正解文を決定した
時点で直ちに認識誤り検出結果8が得られるので、迅速
な処理を行うことができる。
認識手段による認識結果が文末に到達するのを待つこと
なく、事前原稿データベースの文から正解文が決定した
時点で逐次、認識誤りを検出することができるので、迅
速に認識誤り検出を行える効果がある。また、認識誤り
の逐次検出を行えるため、事前原稿にしたがって番組を
進行する生放送等において、原稿にしたがった発言を音
声認識してリアルタイムでスーパーインポーズを付与す
る場合にも、認識結果に含まれる誤りの発見作業を効率
化できる効果がある。
態の全体構成を示す構成図である。
態における単語分割器の処理手順を表すフローチャート
と動作説明図である。
態における出現位置辞書作成部の処理手順を表すフロー
チャートと動作説明図である。
態における一致単語列推定部の処理手順を表すフローチ
ャートと動作説明図である。
態における認識誤り検出部の処理手順を表すフローチャ
ートと動作説明図である。
Claims (8)
- 【請求項1】 音声入力の元となる原稿を保持する事前
原稿データベースから所定の原稿を読み出し、前記所定
の原稿における単語の情報を単語辞書に記録する単語辞
書作成手段と、 前記所定の原稿の音声入力の音声認識手段による認識結
果と前記単語辞書を入力し、前記単語の情報に基づい
て、前記認識結果に最も類似した前記事前原稿データベ
ース中の文を基準として前記認識結果における認識誤り
を検出する検出手段とを備えたことを特徴とする音声認
識誤り検出装置。 - 【請求項2】 請求項1に記載の音声認識誤り検出装置
において、 前記単語辞書作成手段は、 前記事前原稿データベース中の文を単語単位に分割する
手段と、 前記分割した単語を、その出現する文番号、出現位置と
ともに前記単語辞書に記録する手段とを備えたことを特
徴とする音声認識誤り検出装置。 - 【請求項3】 請求項2に記載の音声認識誤り検出装置
において、 前記検出手段は、 前記認識結果の単語について、連続する長さが最長の単
語出現位置の組の文番号、出現位置を前記認識結果の単
語とともに出現位置リストに記録する手段と、 前記単語辞書と前記出現位置リストを入力し、前記出現
位置リストに最も多く出現する文番号を正解文の文番号
と仮定する手段と、 前記正解文の文番号に基づいて前記認識結果における認
識誤りを検出する誤り検出手段とを備えたことを特徴と
する音声認識誤り検出装置。 - 【請求項4】 請求項3に記載の音声認識誤り検出装置
において、 前記誤り検出手段は、前記出現位置リストと前記正解文
の各文番号が異なる単語を誤り候補とし、前記誤り候補
の前後の単語の出現位置から前記誤り候補に対応する正
解単語を前記単語辞書を調べて正解文字列を作成するこ
とを特徴とする音声認識誤り検出装置。 - 【請求項5】 音声入力の元となる原稿を保持する事前
原稿データベースから所定の原稿を読み出し、前記所定
の原稿における単語の情報を単語辞書に記録する単語辞
書作成ステップと、 前記所定の原稿の音声入力に対して音声認識処理を行う
音声認識ステップと、 前記音声認識ステップにおける認識結果と前記単語辞書
を入力し、前記単語の情報に基づいて、前記認識結果に
最も類似した前記事前原稿データベース中の文を基準と
して前記認識結果における認識誤りを検出する検出ステ
ップとを備えたプログラムをコンピュータに読み取り可
能に記憶したことを特徴とする記憶媒体。 - 【請求項6】 請求項5に記載の記憶媒体において、 前記単語辞書作成ステップは、 前記事前原稿データベース中の文を単語単位に分割する
ステップと、 前記分割した単語を、その出現する文番号、出現位置と
ともに前記単語辞書に記録するステップとを備えたこと
を特徴とする記憶媒体。 - 【請求項7】 請求項6に記載の記憶媒体において、 前記検出ステップは、 前記認識結果の単語について、連続する長さが最長の単
語出現位置の組の文番号、出現位置を前記認識結果の単
語とともに出現位置リストに記録するステップと、 前記単語辞書と前記出現位置リストを入力し、前記出現
位置リストに最も多く出現する文番号を正解文の文番号
と仮定するステップと、 前記正解文の文番号に基づいて前記認識結果における認
識誤りを検出する誤り検出ステップとを備えたことを特
徴とする記憶媒体。 - 【請求項8】 請求項7に記載の記憶媒体において、 前記誤り検出ステップにおいて、前記出現位置リストと
前記正解文の各文番号が異なる単語を誤り候補とし、前
記誤り候補の前後の単語の出現位置から前記誤り候補に
対応する正解単語を前記単語辞書を調べて正解文字列を
作成することを特徴とする記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000164233A JP2001343994A (ja) | 2000-06-01 | 2000-06-01 | 音声認識誤り検出装置および記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000164233A JP2001343994A (ja) | 2000-06-01 | 2000-06-01 | 音声認識誤り検出装置および記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001343994A true JP2001343994A (ja) | 2001-12-14 |
Family
ID=18667879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000164233A Pending JP2001343994A (ja) | 2000-06-01 | 2000-06-01 | 音声認識誤り検出装置および記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001343994A (ja) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005227510A (ja) * | 2004-02-12 | 2005-08-25 | Ntt Docomo Inc | 音声認識装置及び音声認識方法 |
JP2006521578A (ja) * | 2003-03-26 | 2006-09-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システム |
JP2009532744A (ja) * | 2006-04-03 | 2009-09-10 | ヴォコレクト・インコーポレーテッド | 音声認識システムにモデルを適合させるための方法およびシステム |
KR100952974B1 (ko) * | 2003-06-26 | 2010-04-15 | 주식회사 케이티 | 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체 |
JP2012128188A (ja) * | 2010-12-15 | 2012-07-05 | Nippon Hoso Kyokai <Nhk> | テキスト修正装置およびプログラム |
US8374870B2 (en) | 2005-02-04 | 2013-02-12 | Vocollect, Inc. | Methods and systems for assessing and improving the performance of a speech recognition system |
JP2013083897A (ja) * | 2011-10-12 | 2013-05-09 | Fujitsu Ltd | 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法 |
US8612235B2 (en) | 2005-02-04 | 2013-12-17 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8756059B2 (en) | 2005-02-04 | 2014-06-17 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8868421B2 (en) | 2005-02-04 | 2014-10-21 | Vocollect, Inc. | Methods and systems for identifying errors in a speech recognition system |
US8914290B2 (en) | 2011-05-20 | 2014-12-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
JP2015125232A (ja) * | 2013-12-26 | 2015-07-06 | 日本放送協会 | 音声認識誤り修正装置 |
JP2016099515A (ja) * | 2014-11-21 | 2016-05-30 | 日本放送協会 | 音声認識誤り修正装置 |
US9978395B2 (en) | 2013-03-15 | 2018-05-22 | Vocollect, Inc. | Method and system for mitigating delay in receiving audio stream during production of sound from audio stream |
US10832679B2 (en) | 2018-11-20 | 2020-11-10 | International Business Machines Corporation | Method and system for correcting speech-to-text auto-transcription using local context of talk |
US11837253B2 (en) | 2016-07-27 | 2023-12-05 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
-
2000
- 2000-06-01 JP JP2000164233A patent/JP2001343994A/ja active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006521578A (ja) * | 2003-03-26 | 2006-09-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声認識システム |
KR100952974B1 (ko) * | 2003-06-26 | 2010-04-15 | 주식회사 케이티 | 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체 |
JP2005227510A (ja) * | 2004-02-12 | 2005-08-25 | Ntt Docomo Inc | 音声認識装置及び音声認識方法 |
US9202458B2 (en) | 2005-02-04 | 2015-12-01 | Vocollect, Inc. | Methods and systems for adapting a model for a speech recognition system |
US10068566B2 (en) | 2005-02-04 | 2018-09-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8374870B2 (en) | 2005-02-04 | 2013-02-12 | Vocollect, Inc. | Methods and systems for assessing and improving the performance of a speech recognition system |
US8612235B2 (en) | 2005-02-04 | 2013-12-17 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8756059B2 (en) | 2005-02-04 | 2014-06-17 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US8868421B2 (en) | 2005-02-04 | 2014-10-21 | Vocollect, Inc. | Methods and systems for identifying errors in a speech recognition system |
US9928829B2 (en) | 2005-02-04 | 2018-03-27 | Vocollect, Inc. | Methods and systems for identifying errors in a speech recognition system |
JP2009532744A (ja) * | 2006-04-03 | 2009-09-10 | ヴォコレクト・インコーポレーテッド | 音声認識システムにモデルを適合させるための方法およびシステム |
JP2012128188A (ja) * | 2010-12-15 | 2012-07-05 | Nippon Hoso Kyokai <Nhk> | テキスト修正装置およびプログラム |
US11810545B2 (en) | 2011-05-20 | 2023-11-07 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US11817078B2 (en) | 2011-05-20 | 2023-11-14 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US10685643B2 (en) | 2011-05-20 | 2020-06-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US9697818B2 (en) | 2011-05-20 | 2017-07-04 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US8914290B2 (en) | 2011-05-20 | 2014-12-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
JP2013083897A (ja) * | 2011-10-12 | 2013-05-09 | Fujitsu Ltd | 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法 |
US9082404B2 (en) | 2011-10-12 | 2015-07-14 | Fujitsu Limited | Recognizing device, computer-readable recording medium, recognizing method, generating device, and generating method |
US9978395B2 (en) | 2013-03-15 | 2018-05-22 | Vocollect, Inc. | Method and system for mitigating delay in receiving audio stream during production of sound from audio stream |
JP2015125232A (ja) * | 2013-12-26 | 2015-07-06 | 日本放送協会 | 音声認識誤り修正装置 |
JP2016099515A (ja) * | 2014-11-21 | 2016-05-30 | 日本放送協会 | 音声認識誤り修正装置 |
US11837253B2 (en) | 2016-07-27 | 2023-12-05 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
US10832679B2 (en) | 2018-11-20 | 2020-11-10 | International Business Machines Corporation | Method and system for correcting speech-to-text auto-transcription using local context of talk |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001343994A (ja) | 音声認識誤り検出装置および記憶媒体 | |
US7983915B2 (en) | Audio content search engine | |
JP4924950B2 (ja) | 質問応答データ編集装置、質問応答データ編集方法、質問応答データ編集プログラム | |
CN107305541B (zh) | 语音识别文本分段方法及装置 | |
US6961699B1 (en) | Automated transcription system and method using two speech converting instances and computer-assisted correction | |
EP1183680B1 (en) | Automated transcription system and method using two speech converting instances and computer-assisted correction | |
JP2836159B2 (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
US8150687B2 (en) | Recognizing speech, and processing data | |
US20080270344A1 (en) | Rich media content search engine | |
US20080270110A1 (en) | Automatic speech recognition with textual content input | |
US20040049385A1 (en) | Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP7060027B2 (ja) | Faq整備支援装置、faq整備支援方法、及びプログラム | |
JP2011113570A (ja) | 音声検索装置と音声検索方法 | |
WO2021051599A1 (zh) | 局部优化关键词的方法、装置、设备及存储介质 | |
CN113626573B (zh) | 一种销售会话异议及应对提取方法及系统 | |
JP3938096B2 (ja) | インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム | |
CN110853627B (zh) | 用于语音标注的方法及系统 | |
JP2000089786A (ja) | 音声認識結果の修正方法および装置 | |
US20190392005A1 (en) | Speech dialogue system, model creating device, model creating method | |
JP2011113426A (ja) | 辞書作成装置,辞書作成プログラムおよび辞書作成方法 | |
JP3907880B2 (ja) | 連続音声認識装置および記録媒体 | |
JP7163845B2 (ja) | 情報処理装置、およびプログラム | |
JPH0750486B2 (ja) | キ−ワ−ド抽出装置 | |
JPH11203318A (ja) | 文書分類方法および装置並びに文書分類処理プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050401 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080704 |