[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2506730B2 - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JP2506730B2
JP2506730B2 JP62059413A JP5941387A JP2506730B2 JP 2506730 B2 JP2506730 B2 JP 2506730B2 JP 62059413 A JP62059413 A JP 62059413A JP 5941387 A JP5941387 A JP 5941387A JP 2506730 B2 JP2506730 B2 JP 2506730B2
Authority
JP
Japan
Prior art keywords
voice
similarity
recognition method
reference point
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62059413A
Other languages
English (en)
Other versions
JPS63223798A (ja
Inventor
泰助 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62059413A priority Critical patent/JP2506730B2/ja
Publication of JPS63223798A publication Critical patent/JPS63223798A/ja
Priority to US07/385,525 priority patent/US4984275A/en
Priority to US07/777,713 priority patent/US5220609A/en
Application granted granted Critical
Publication of JP2506730B2 publication Critical patent/JP2506730B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は人間の声を機械に認識させる音声認識方法に
関するものである。
従来の技術 近年音声認識技術の開発が活発に行なわれ、商品化さ
れているが、これらのほとんどは声を登録した人のみを
認識対象とする特定話者用である。特定話者用の装置は
認識すべき言葉をあらかじめ装置に登録する手間を要す
るため、連続的に長時間使用する場合を除けば、使用者
にとって大きな負担となる。これに対し、声の登録を必
要とせず、使い勝手のよい不特定話者要の認識技術の研
究が最近では精力的に行なわれるようになった。
音声認識方法を一般的に言うと、入力音声と辞書中に
格納してある標準的な音声(これらはパラメータ化して
ある)のパターンマッチングを行なって、類似度が最も
高い辞書中の音声を認識結果として出力するということ
である。この場合、入力音声と辞書中の音声が物理的に
全く同じものならば問題はないわけであるが、一般には
同一音声であっても、人が違ったり、言い方が違ってい
るため、全く同じにはならない。
人の違い、言い方の違いなどは、物理的にスペクトル
の特徴の違いと時間的な特徴の違いとして表現される。
すなわち、調音器官(口、舌、のどなど)の形状は人ご
とに異なっているので、人が違えば同じ言葉でもスペク
トル形状は異なる。また早口で発声するが、ゆっくり発
声するかによって時間的な特徴は異なる。
不特定話者用の認識技術では、このようなスペクトル
およびその時間的変動を正規化して、標準パターンと比
較する必要がある。
不特定話者の音声認識に有効な方法として、本出願人
等は既にパラメータの時系列情報と統計的距離尺度を併
用する方法を提案している(二矢田他:“簡単な不特定
話者用音声認識方法”、日本音響学会講演論文集、1−
1−4(昭和61年3月))ので、その方法を以下に説明
する。
この方法は、パターンマッチング法を用いて、音声を
騒音中からスポッティングすることによって、音声の認
識を行なうと同時に音声区間をも検出することができ
る。
まず、パターンマッチングに用いている距離尺度(統
計的距離尺度)について説明する。
入力単語音声長をJフレームに線形伸縮し、Iフレー
ムあたりのパラメータベクトルを とすると、 は次のようになる。
ここで、各 はp次元のベクトルである。
単語ω(k=1,2,…,K)の標準パターンとして、 とすると、事後確率 を最大とする単語を認識結果とすればよい。
ベイズの定理より 右辺第1項のP(ω)は定数と見なせる。正規分布を
仮定とすると、第2項は は入力パラメータが同一ならば定数と見做せるが、異な
る入力に対して相互比較するときは、定数にならない。
ここでは、 の正規分布に従うものと仮定する。
(1)の対数をとり、定数項を省略して、これを と置くと、 ここで、 を全て共通と置き とする。すなわち、 として(4)式を展開すると、 ただし、 (6)式は計算量が少ない1次判別式がある。ここ
で、(6)式を次のように変形する。
すなわち、Lkはフレームごとの部分類似度 のJ回の加算と1回の減算で求められる。
次に、上記の距離尺度を用いて、騒音中から音声をス
ポッティングして認識する方法と、計算量の削減法につ
いて説明する。
音声を確実に含む十分長い区間を対象として、この中
に種々の部分区間を設定して、各単語との類似度を
(9)式によって求め、全ての部分区間を通して類似度
が最大となる単語を認識結果とすればよい。この類似度
計算をそのまま実行すると計算量が膨大となるが、単語
の持続時間を考慮して部分区間長を制限し、また計算の
途中で部分類似度▲d(K) j▼を共通に利用することによ
って、大幅に計算量を削減できる。第4図は本方法の説
明図である。入力と単語kの照合を行う場合、部分区間
長n(▲n(K) s▼<n<▲n(K) e▼)を標準パターン長
Jに線形伸縮し、フレームごとに終端固定で類似度を計
算していく様子を示している。類似度はQR上の点Tから
出発してPで終るルートに沿って(9)式で計算され
る。したがって、1フレームあたりの類似度計算はΔPQ
R内で行われる。ところで(9)式の は、区間長nを伸縮した後の第jフレーム成分なので、
対応する入力フレームi′が存在する。そこで入力ベク
トルを用いて、▲d(K) j▼を次のように表現できる。
ただし、i′=i−rn(j)+1 (11) ここで、rn(j)は単語長nとJの線形伸縮を関係づ
ける関数である。したがって、入力の各フレームと との部分類似度が予め求められていれば、(9)式は
i′の関係を有する部分類似度を選択して加算すること
によって簡単に計算できる。ところで、ΔPQRは1フレ
ームごとに右へ移動するので、PS上で の部分類似度を計算して、それを、ΔPQRに相当する分
だけメモリに蓄積し、フレームごとにシフトするように
構成しておけば、必要な類似度は全てメモリ内にあるの
で、部分類似度を求める演算が大幅に省略でき、計算量
が非常に少なくなる。
第5図は従来例の実現方法を説明した、機能ブロック
図である。未知入力音声信号はAD変換部10で、8KHzサン
プリングされて12ビットのディジタル信号に変換され
る。音響分析部11は10msec(1フレーム)ごとに入力信
号のLPC分析を行ない、10次の線形予測係数と残差パワ
ーを求める。特徴パラメータ抽出部12は、線形予測係数
と残差パワーを用いて、LPCケプストラム係数C1〜C5
パワー項Coを特徴パラメータとして求める。したがっ
て、フレームごとの特徴 である。なお、LPC分析とLPCケプストラム件数の抽出法
に関しては、例えばJ.D.マーケル,A.H.グレイ著,鈴木
久喜訳「音声の線形予測」に詳しく記述されているので
省略する。
フレーム同期信号発声部13は10msecごとのタイミング
信号(フレーム信号)を発声する部分であり、認識処理
はフレーム信号に同期して行なわれる。
標準パターン選択部18は、1フレームの期間に、標準
パターン格納部17に格納されている単語ナンバーk=1,
2,…Kを次々と選択してゆく。部分類似度計算部21で
は、選択された の部分類似度d(k)(i,j)を計算する。
計算した部分類似度は類似度バッファ22へ送出して蓄
積する。類似度バッファ22は、新しい入力が入ると、一
番古い情報が消滅する構成になっている。
区間候補設定部15は選択された単語ナンバーごとに、
その単語の最小長▲n(k) s▼と最大長▲n(k) e▼を設定
する。時間伸縮テーブル24には(11)式の関係がテーブ
ル形式で格納されており、単語長nとフレームjを指定
するとそれに対応するi′が求まる。▲n(k) s▼≦n≦
▲n(k) e▼の範囲の各々の単語長nに対してi′を読出
し、それに相当する部分類似度d(k)(i,j),j=1,2,…
Jを類似度バッファ22から読み出す。類似度加算部23は を計算し、(9)式によってLkを求める。類似度比較部
20は、求めたLkと一時記憶19の内容を比較し、類似度が
大きい(距離が小さい)方を一時記憶19に記録する。
このようにして、フレームi=i0から始め、標準パタ
ーンk=1に対して▲n(1) s▼n▲n(1) e▼の範囲
で最大類似度 を求め、次にk=2として▲n(2) s▼n▲n(2) e
の範囲で求めた と比較して類似度の最大値を求め、このようにしてk=
Kまで同様な手順を繰返して最大類似度 とその時の単語ナンバーk′を一時記憶19に記憶する。
次にi=i0+Δiとして同様な手順を繰返して、最終フ
レームi=Iに到達した時に一時記憶に残されている単
語ナンバーk=kmが認識結果である。また、最大類似度
が得られた時のフレームナンバーi=imと単語長n=nm
を一時記憶19に蓄積し、更新するようにしておけば、認
識結果と同時に、その時の音声区間を結果として求める
ことができる。音声区間はim−nm〜imである。
発明が解決しようとする問題点 かかる方法における問題点は、音声を確実に含む十分
長い区間を対象として、この中に取り得るすべての音声
区間とパターン・マッチングを実行させるため、例え
ば、数字音声の認識において、「ゼロ」と発声しても、
「ゼロ」の「ロ」の部分で「ゴ」と認識するような長い
発声単語の部分に、短い単語に認識される可能性が大き
い。
本発明の目的は上記問題点を解決するもので、音声を
確実に含む十分長い区間の中から取り得る音声区間をで
きるだけ、パワー情報を用いて、制限することによって
高い認識率を有する音声認識方法を提供するものであ
る。
問題点を解決するための手段 本発明は、上記目的を達成するもので、フレーム毎の
パワー値が、ノイズ学習したあるいき値θ以上で、N
フレーム連続する場合、N=Nd(一定)より以後のフレ
ームで、パワー値が、θ以上であるフレームが続く限
り、該当フレームを始端とする音声区間は、認識対象か
ら除外するものである。
作用 本発明は不特定話者用の音声区間を明確に定めないワ
ード・スポッテング手法を用いた認識方法において、パ
ワー情報によって、一部音声区間を制限することによ
り、長い発声単語が、短かい発声単語に、誤まる確率を
低くし、全体の認識率を向上させることができる。
実施例 以下に本発明の実施例を図面を用いて詳細に説明す
る。第1図は本発明の一実施例における音声認識方法の
具現化を示す機能ブロック図である。
まず本実施例の基本的な認識の考え方は、従来例に上
げた方式とほぼ同じである。すなわち、未知入力音声信
号はAD変換部110で、8KHzサンプリングされて、12ビッ
トのディジタル信号に変換される。音響分析部111は、1
0msec(1フレーム)ごとの入力信号のLPC分析を行な
い、10次の線形予測係数と残差パワーを求める。特徴パ
ラメータ抽出部112は、線形予測係数と残差パワーを用
いて、LPCケプストラム係数C1〜C9とパワー項C0を特徴
パラメータとして求める。したがって、フレーム毎の は、 である。なお、LPC分析とLPCケプストラム係数の抽出法
に関しては、例えばJ.D.マーケル,A.H.グレイ著,鈴木
久喜訳「音声の線形予測」に詳しく記述されているので
省略する。
フレーム同期信号発声部113は、10msecごとのタイミ
ング信号(フレーム信号)を発生する部分であり、認識
処理はフレーム信号に同期して行なわれる。
標準パターン選択部116は、1フレームの期間に、標
準パターン格納部115に格納されている単語ナンバーk
=1,2,……,Kを次々と選択してゆく。部分類似度計算部
114では、選択された の部分類似度d(k)(i,j)を計算する。
計算した部分類似度は類似度バッファ119へ送出して蓄
積する。類似度バッファ119は、新しい入力が入ると、
一番古い情報が消滅する構成になっている。なお、ここ
では統計的距離尺度が一次判別関数の場合について説明
したが、その他、事後確率に基づく尺度、二次判別関
数、マハラノビス距離、ベイズ判定又は複合類似度に基
づく尺度のうちいずれかでも良い。
区間候補設定部117は、選択された単語ナンバーごと
に、その単語の最小長▲n(k) s▼と最大長▲n(k) e▼を
設定する。時間伸縮テーブル118には(11)式の関係が
テーブル形式で格納されており、単語長n(▲n(k) s
≦n≦▲n(k) e▼)とフレームjを指定すると、それに
対応するi′が求まる。▲n(k) s▼≦n≦▲n(k) e▼の
範囲の各々の単語長nに対してi′を読み出し、それに
相当する部分類似度d(k)(i′,j),j=1,2,…Jを類似
度バッファ119から読み出す。類似度加算部120は、 を計算し、(9)式によってLkを求める。類似度比較部
121は、求めたLkと今までのフレームで最大の類似度を
格納している一時記憶122の内容と比較し、類似度が大
きい(距離が小さい)方を一時記憶122に記録する。
このようにして、フレームi=I0から始め、標準パタ
ーンk=1に対して、▲n(1) s▼≦n≦▲n(1) e▼の範
囲で最大類似度 を求め、次にk=2として▲n(2) s▼≦n≦▲n(2) e
の範囲で求めた を比較して類似度の最大値を求め、このようにしてk=
Kまで同様な手順を繰返して最大類似度 とその時の単語ナンバーk′を一時記憶122に記憶す
る。次にi=i0+Δiとして同様な手順を繰返して、最
終フレームi=Iに到達した時に一時記憶122に残され
ている単語ナンバーk=kmが認識結果である。
次に、上記説明におけるI0からIまでの走査区間決定
方法と音声区間制御法について説明する。
第2図は、走査開始(類似度加算部以後の開始)I0
レームと認識完了(走査終了)Iフレームと音声との関
係を表わしたものである。
本実施例においては、走査区間の始端はパワー情報で
求め、終端はパワー情報と類似度情報を併用して求め、
音声区間制御法は、パワー情報を利用用する。パワー情
報による方法は、人の声の方が周囲の騒音よりも大きい
ことを利用する方法であるが、人の声の大きさは環境に
影響されるので、声の大きさのレベルをそのまま利用し
ても良い結果は得られない。しかし、人の発声は、静か
な環境では小さく、やかましい環境では大きくなる傾向
があるので、信号対ノイズ比(S/N比)を用いれば、環
境騒音の影響をあまり受けずに発声を検出できる。
パワー計算部123は、フレーム毎にパワー(対数値)
を計算する。以下ノイズ・レベル学習部124、パワー比
較部125について説明する。
第3図において、実線はパワー(対数値)の時間変化
を示す。この例ではa,b,cの3つのパワーピークが生じ
ているが、このうちaはノイズによる不要なピークであ
るとする。破線はノイズの平均レベル(PN)、また一点
鎖線はノイズの平均レベルより常にθ(dB)だけ大き
い、閾値レベル(Pθ)である。ノイズの平均レベルPN
は次のようにして求める。パワー値をPとすると ただし、Pmは閾値レベル以下のパワーレベルを有する
第mフレームパワー値である。すなわちPNは閾値レべる
以下(ノイズレベル)のフレームの平均値である。この
ようにすると、第3図の破線で示すように、ノズルの平
均レベルPNはパワー値を平滑化した波形となる。また閾
値レベルPθ,Pには Pθ=PN+θ (17) である。
第3図を例として音声検出および音声区間制御の方法
を説明する。信号の始まり部におるパワーを初期ノイズ
レベルとし、式(16)によってノイズの平均レベルPN
求めながら、パワーレベルPと閾値レベルPθを比較し
てゆく。最初のパワーピークaはPθ以下であるので、
音声として検出されない。パワーピークbの立上りの部
分dでパワーレベルがPθ以上になると式(16)の操作
を中止し、以後P=PθになるまでPNおよびPθを一定
に保つ。そしてeからfにかけてP≦Pθとなるので式
(16)の操作を行なう。fからgまではP>Pθである
からPN,Pθは一定となる。結果としてP>Pθとなる区
間B,Dを音声が存在する区間とする。
音声区間制御法は、パワー比較部125でPとPθとの
比較を行ない、フレーム毎の比較結果を除外音声区間決
定部126へ送る。第3図において、d点までは、P<P
θの結果が送られる。d点を越えると、P>Pθの状態
が続く。ここで、除外音声区間決定部126では、連続す
るP>Pθの状態のフレーム数をカウントする機能を有
し、このカウンタは、P<Pθの結果でリセットされ
る。除外音声区間決定部126では、カウント数NがN
d(一定値)より大きい時、1を部分類似度計算部114へ
送る。よって第3図で説明すると、P>Pθとなる区間
B,Dを音声が存在する区間とし、BとDの内、d点およ
びf点よりNdフレーム後のF,Gの区間において、除外音
声区間決定部126が1を出力し、この区間は、音声の内
部であるため、音声区間の始端であり得ないことを示し
ている。
部分類似度計算部114では、通常は、部分類似度d(k)
(i,j)を(15)式で計算するが(iはフレーム番号、
kは標準パターン・ナンバー、jは線形伸縮・ナンバ
ー)、除外音声区間決定部126の出力が1の場合、d(k)
(i,j)は次式とする。
但し、一定値は負の小さな値とする。
このことにより、i番目のフレームを音声区間の始端
(j=1)とするすべての類似度は、一定値(CONS)を
含むため、他に比べて小さくなるため、最大類似度に該
当しないため、認識の対象からはずされることとなる。
このことにより、例えば、数字音声の「ゼロ」と
「ゴ」の認識の場合、「ゼロ」の「ロ」の部分で「ゴ」
が高い類似度を示し、「ゼロ」を「ゴ」と誤認識する場
合が多い。本手法を用いれば、「ゼロ」の発声において
は、殆んど「ゼ」の頭から「ロ」の終りまで、P>Pθ
の状態が続き、「ロ」を始端とする音声区間は存在しな
くなり(類似度が小さくなるため)、誤認識がさけられ
る。
走査区間設定部127では、第2図のI0走査開始を、P
>Pθの時点で行ない(第3図のd点)、Iは一度P>
θになってからP≦PθがHフレーム継続し、それま
での最大類似度が、あるいき値以上になっていれば、終
了Iに達する。
従来例に述べた音声区間を決定せず、音声らしき所の
周辺において考えられる音声区間すべての中から、最大
類似度を求める方法においては、一般的にパワー情報を
用いて、音声区間を決定し、標準パターンとマッチング
する方法よりも、騒音レベルが高い場合や非定常なノイ
ズが混入する場合は、強いと言えるが、逆に、認識対象
単語中に、長い単語の一部分を非常に似かよった短い単
語があった場合、非常に認識率が悪くなる。たとえば、
認識対象単語中に「新大阪」と「大阪」がある場合等で
ある。本実施例の場合、音声を確実に含む十分長い区間
の中から取り得る音声区間をできるだけパワー情報を用
いて制限することによりこの弱さを補う手法は、非常に
有効な手段である。
発明の効果 以上要するに本発明は、音声を確実に含む十分長い区
間の中から、パワー情報を用いて始端となり得ないこと
が明らかな音声区間を、認識対象から除外することによ
り、長い発声単語が短かい発声単語に誤まる確率を低く
でき、全体の認識率を向上させることができる利点を有
する。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識方法を具現
化する機能ブロック図、第2図は本実施例における標準
パターンとのマッチングを行う開始、終了時期と音声と
の関係図、第3図は本実施例におけるパワー情報を用い
たノイズ・パターンうめ込みタイミングと走査区間決定
のための音声有無決定法を説明するパワーレベル図、第
4図は標準パターンとのパターンマッチング法を説明し
た概念図、第5図は従来例の方法を説明した機能ブロッ
ク図である。 110……AD変換部、111……音響分析部、112……特徴パ
ラメータ抽出部、113……フレーム同期信号発声部、114
……部分類似度計算部、115……標準パターン格納部、1
16……標準パターン選択部、117……区間候補設定部、1
18……時間伸縮テーブル、119……類似度バッファ、120
……類似度加算部、121……類似度比較部、122……一時
記憶、123……パワー計算部、124……ノイズ・レベル学
習部、125……パワー比較部、126……除外音声区間決定
部、127……走査区間設定部。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声とその前後の騒音を含む未知入力信号
    からパワー情報を用いて音声の存在を検出し、検出した
    時点を基準点として、基準点と基準点からN(N1≦N≦
    N2)だけ離れた区間の未知入力信号を区間長Lに線形伸
    縮し、伸縮した区間の特徴パラメータを抽出し、この特
    徴パラメータと認識対象とする複数の音声の標準パター
    ンとの類似度又は距離をそれぞれ求めて比較し、N1から
    N2までの範囲において、基準点以前のパワー情報を用い
    て基準点毎に始端となり得る範囲を決定し、その範囲内
    でNを変化させながら前記操作を行ない、さらに基準点
    を単位区間ずつずらせながら同様の操作を行なって類似
    度又は距離を次々と求めて比較してゆき、パワー情報と
    類似度情報を併用して決定した処理終了時点へ基準点が
    到達した時における、全ての基準点そして全ての時間伸
    縮に対して最大類似度又は最小距離を得る標準パターン
    に対応する音声を認識結果として出力することを特徴と
    する音声認識方法。
  2. 【請求項2】音声信号とノイズの比率を用いて音声の有
    /無を検出することを特徴とする特許請求の範囲第1項
    記載の音声認識方法。
  3. 【請求項3】未知入力信号の特徴パラメータと各音声の
    標準パターンとの類似度又は距離を統計的距離尺度を用
    いて計算することを特徴とする特許請求の範囲第1項記
    載の音声認識方法。
  4. 【請求項4】統計的距離尺度が、事後確率に基づく尺
    度、一次判別関数、二次判別関数、マハラノビス距離、
    ベイズ判定、複合類似度に基づく尺度のうちいずれかで
    あることを特徴とする特許請求の範囲第3項記載の音声
    認識方法。
JP62059413A 1987-03-13 1987-03-13 音声認識方法 Expired - Lifetime JP2506730B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62059413A JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法
US07/385,525 US4984275A (en) 1987-03-13 1989-07-27 Method and apparatus for speech recognition
US07/777,713 US5220609A (en) 1987-03-13 1991-10-21 Method of speech recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62059413A JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法

Publications (2)

Publication Number Publication Date
JPS63223798A JPS63223798A (ja) 1988-09-19
JP2506730B2 true JP2506730B2 (ja) 1996-06-12

Family

ID=13112562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62059413A Expired - Lifetime JP2506730B2 (ja) 1987-03-13 1987-03-13 音声認識方法

Country Status (1)

Country Link
JP (1) JP2506730B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07122152B2 (ja) * 1990-06-19 1995-12-25 日本パーカライジング株式会社 アルミニウム用酸性洗浄液
JP2008107706A (ja) * 2006-10-27 2008-05-08 Yamaha Corp 話速変換装置およびプログラム

Also Published As

Publication number Publication date
JPS63223798A (ja) 1988-09-19

Similar Documents

Publication Publication Date Title
TWI396184B (zh) 一種語音辨認所有語言及用語音輸入單字的方法
US8271283B2 (en) Method and apparatus for recognizing speech by measuring confidence levels of respective frames
US7634401B2 (en) Speech recognition method for determining missing speech
JPH0968994A (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JP2745535B2 (ja) 音声認識装置
US7072750B2 (en) Method and apparatus for rejection of speech recognition results in accordance with confidence level
JP4461557B2 (ja) 音声認識方法および音声認識装置
JP2506730B2 (ja) 音声認識方法
JP3633254B2 (ja) 音声認識システムおよびそのプログラムを記録した記録媒体
JPH0643895A (ja) 音声認識装置
JP2002189487A (ja) 音声認識装置および音声認識方法
JP2705061B2 (ja) 音声認識方法
JP2853418B2 (ja) 音声認識方法
JPH0451037B2 (ja)
JP2004139049A (ja) 話者正規化方法及びそれを用いた音声認識装置
JPH054680B2 (ja)
JP2882088B2 (ja) 音声認識方法
KR100304788B1 (ko) 연속 음성 인식을 이용한 전화번호 안내 방법
JP2001013988A (ja) 音声認識方法及び装置
JP3029654B2 (ja) 音声認識装置
JP3357752B2 (ja) パターンマッチング装置
JP3704080B2 (ja) 音声認識方法及び音声認識装置並びに音声認識プログラム
JPH0455518B2 (ja)
Inbanila et al. Enhancement of substitution voices using F1 formant deviation analysis and DTW based template matching
JPH054678B2 (ja)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term