[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH05249990A - パターンマッチング方法およびパターン認識装置 - Google Patents

パターンマッチング方法およびパターン認識装置

Info

Publication number
JPH05249990A
JPH05249990A JP4082831A JP8283192A JPH05249990A JP H05249990 A JPH05249990 A JP H05249990A JP 4082831 A JP4082831 A JP 4082831A JP 8283192 A JP8283192 A JP 8283192A JP H05249990 A JPH05249990 A JP H05249990A
Authority
JP
Japan
Prior art keywords
pattern
distance
standard
standard pattern
input pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4082831A
Other languages
English (en)
Inventor
Masao Watari
雅男 渡
Miyuki Tanaka
幸 田中
Yasuhiko Kato
靖彦 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP4082831A priority Critical patent/JPH05249990A/ja
Priority to DE69329354T priority patent/DE69329354T2/de
Priority to EP93301537A priority patent/EP0559415B1/en
Publication of JPH05249990A publication Critical patent/JPH05249990A/ja
Priority to US08/414,046 priority patent/US5561722A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 認識率を向上させるとともに、装置を安価に
製作する。 【構成】 距離計算部1において、例えば画像信号や音
声信号より作成された入力パターンと、あらかじめ標準
パターン格納部2に格納された標準パターン(テンプレ
ート)との距離が計算される。パターン選択部3におい
て、距離計算部1で現在入力パターンとの距離が計算さ
れている標準パターンに対応する、距離尺度を補正する
重み係数を、重み係数格納部5より読み出す制御が行わ
れ、重み補正部4に供給される。重み補正部4におい
て、距離計算部1より供給される入力パターンと標準パ
ターンとの距離に、重み係数格納部5より供給された重
み係数が乗じられ、距離判定部6に出力される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば音声や画像を認
識する場合に用いて好適なパターンマッチング方法、並
びにパターン認識装置に関する。
【0002】
【従来の技術】例えば音声認識装置においては、入力さ
れた音声(入力パターン)が属する単語(標準パター
ン)のカテゴリを識別することにより、音声を認識する
ようになっている。
【0003】ところで、同じ単語を同じ話者が発声して
も、その単語のパターンがまったく同一になるとは限ら
ず、従って単語のカテゴリは、識別空間に少なからず拡
がった領域を有する。このように、識別空間に拡がった
カテゴリを識別する方法として、例えば一つの単語に対
して標準パターンを複数用意するマルチテンプレート方
式などがある。
【0004】従来のマルチテンプレート方式において
は、入力パターンとテンプレート(標準パターン)との
距離が、すべて同じ距離尺度で計算され、その距離を最
小にするテンプレート(標準パターン)が認識結果とさ
れる。このように、すべてのテンプレートに対し、同じ
距離尺度を用いてパターンの認識を行うことは、パラメ
ータ平面(空間)において、入力パターンとしての点
が、テンプレート(標準パターン)である点を中心とし
た同一半径の円(球)に含まれるか、または接するか否
かを判定することであり、従って、識別平面(空間)に
おいて、例えば図7に示すような単語のカテゴリを同一
半径の円(球)で、それぞれ過不足なく囲むことが認識
性能を向上させることになる。
【0005】
【発明が解決しようとする課題】図8は、図7に示す単
語Aまたは単語Bのカテゴリを3または6の同一半径の
円で、それぞれ囲んだ図である。即ち、図8は、単語A
に対して3つのテンプレート(3つの円の中心に対応す
る)、単語Bに対して6つのテンプレート(6つの円の
中心に対応する)を用意したことを示す図である。単語
Aを囲む3つの円は、そのカテゴリをすべて網羅してい
るが、その外側にまでおよんでおり、図中単語Aを囲む
最上部の円においては、単語Bのカテゴリを含んでしま
っている。
【0006】従って、従来の装置では、例えば単語Bを
単語Aと認識してしまい、他の単語に対する棄却能力が
劣化するとともに、認識率が劣化する課題があった。
【0007】そこで、図9に示すように、図8と比べて
小さな半径の円で単語AおよびBのカテゴリを網羅する
ように囲むことにより、即ち単語AおよびBに対して充
分な数のテンプレートを用意することにより、音声の認
識率の劣化を防止する方法がある。しかしながら、この
方法においては、多数のテンプレートを記憶するために
多くのメモリが必要になり、装置の製作コストが高価に
なるだけでなく、入力パターンと標準パターン(テンプ
レート)との距離を計算するときの演算量が増加し、認
識結果を出力するのに時間がかかる課題があった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、認識率を向上させるだけでなく、装置を
安価に製作することができるようにするものである。
【0009】
【課題を解決するための手段】請求項1に記載のパター
ンマッチング方法は、入力パターンと標準パターンとの
距離により入力パターンを認識するパターンマッチング
方法において、標準パターンごとに用意した距離尺度を
補正する重み係数を距離に乗ずることを特徴とする。
【0010】請求項2に記載のパターン認識装置は、入
力パターンを作成する入力パターン作成手段としての音
響分析部12またはNAT処理部14と、標準パターン
とともに、標準パターンごとに用意された距離尺度を補
正する重み係数を記憶する記憶手段としての標準パター
ン格納部16と、標準パターン格納部16に記憶された
標準パターンと、音響分析部12またはNAT処理部1
4により作成された入力パターンとの距離を計算する距
離計算手段としての距離計算部15と、距離計算部15
により計算された距離により入力パターンを認識する認
識手段としての距離判定部17とを備え、距離計算部1
5は、入力パターンとの距離を計算する標準パターンに
対応して、標準パターン格納部16に記憶された重み係
数を距離に乗ずることを特徴とする。
【0011】
【作用】請求項1に記載のパターンマッチング方法にお
いては、標準パターンごとに用意した距離尺度を補正す
る重み係数を、入力パターンと標準パターンとの距離に
乗ずるようにしたので、標準パターンのカテゴリの形状
に対応した距離を求めることができ、入力パターンの認
識率を向上させることができる。
【0012】請求項2に記載のパターン認識装置におい
ては、標準パターンとともに、標準パターンごとに用意
された距離尺度を補正する重み係数が標準パターン格納
部16に記憶され、記憶された標準パターンと、音響分
析部12またはNAT処理部14により作成された入力
パターンとの距離が計算される。そして、入力パターン
との距離を計算する標準パターンに対応して、標準パタ
ーン格納部16に記憶された重み係数が距離に乗ざれ
る。従って、標準パターンをマルチテンプレート化する
場合、テンプレートの数を少なくすることができ、さら
に入力パターンの認識率を向上させることができる。
【0013】
【実施例】図1は、本発明のパターンマッチング方法を
応用したパターン認識装置の一実施例の構成を示すブロ
ック図である。距離計算部1は、例えば画像信号や音声
信号より作成された入力パターンと、あらかじめ標準パ
ターン格納部2に格納された標準パターン(テンプレー
ト)との距離(例えばユークリッド距離など)を計算す
る。標準パターン格納部2は、画像信号や音声信号より
あらかじめ作成された標準パターンを記憶している。重
み係数格納部5は、標準パターン格納部2に記憶された
標準パターンごとに、あらかじめ用意された距離尺度を
補正する重み係数を記憶している。
【0014】ここで、図2は、識別平面におけるカテゴ
リAまたはBを、過不足ないようにそれぞれ円で囲んだ
図である。識別平面における各円は、その中心、即ちテ
ンプレート(標準パターン)からの等距離面を表す。従
って、半径の大きい円のテンプレート(標準パターン)
については、相対的に(半径の小さい円のテンプレート
の重み係数に比べて)小さな値の重み係数が重み係数格
納部5に記憶されており、半径の小さい円のテンプレー
ト(標準パターン)については、相対的に(半径の大き
な円のテンプレートの重み係数に比べて)大きな値の重
み係数が重み係数格納部5に記憶されている。
【0015】パターン選択部3は、標準パターン格納部
2に記憶された標準パターンを距離計算部1に供給する
制御を行うとともに、重み係数格納部5に記憶された重
み係数を重み補正部4に供給する制御を行う。重み補正
部4は、距離計算部1より供給される入力パターンと標
準パターンとの距離に、重み係数格納部5に記憶された
重み係数を乗ずる。距離判定部6は、重み補正部4より
供給される、重み係数が乗じられた距離、即ち補正され
た入力パターンと標準パターンとの距離の中から最小の
ものを検出し、検出した入力パターンとの距離を最小に
する標準パターンを認識結果として出力する。
【0016】次に、重み係数格納部5への重み係数の登
録について説明する。あらかじめ標準パターン(テンプ
レート)が標準パターン格納部2に登録されている場
合、認識しようとするカテゴリからはみ出す円(例え
ば、図8における単語Aのカテゴリの上部を囲む2つの
円)の中心に対応する標準パターンにおいては、相対的
に(単語のカテゴリを網羅することができない円の中心
に対応する標準パターンの重み係数に比べ)大きい重み
係数を重み係数格納部5に登録し、認識しようとするカ
テゴリを網羅することができない円の中心に対応する標
準パターンにおいては、相対的に(単語のカテゴリから
はみ出す円の中心に対応する標準パターンの重み係数に
比べ)小さい重み係数を重み係数格納部5に登録する。
【0017】また、新規に標準パターンを標準パターン
格納部2に登録する場合、新規に登録する標準パターン
を中心とする円が、その標準パターンに対応するカテゴ
リを過不足なく網羅するように重み係数を決定し、重み
係数格納部5に登録する。
【0018】次に、その動作について説明する。距離計
算部1において、例えば画像信号や音声信号より作成さ
れた入力パターンと、あらかじめ標準パターン格納部2
に格納された標準パターン(テンプレート)との距離
(ユークリッド距離)が計算される。パターン選択部3
において、距離計算部1で現在入力パターンとの距離が
計算されている標準パターンに対応する、距離尺度を補
正する重み係数を、重み係数格納部5より読み出す制御
が行われ、重み補正部4に供給される。重み補正部4に
おいて、距離計算部1より供給される入力パターンと標
準パターンとの距離に、重み係数格納部5より供給され
た重み係数が乗じられ、距離判定部6に出力される。
【0019】なお、標準パターン格納部2に記憶された
すべての標準パターンに対して、以上の処理が行われ
る。
【0020】距離判定部6において、重み補正部4より
出力された、重み係数が乗じられた距離、即ち補正され
た入力パターンと標準パターンとの距離の中から最小の
ものが検出され、検出された入力パターンとの距離を最
小にする標準パターンが認識結果として出力される。
【0021】以上のように、標準パターンごとに用意し
た距離尺度を補正する重み係数を、入力パターンと標準
パターンとの距離に乗ずるようにしたので、標準パター
ンのカテゴリの形状に対応した距離を求めることがで
き、入力パターンの認識率を向上させることができる。
【0022】さらに、図3は、本発明のパターン認識装
置を応用した音声認識装置の一実施例の構成を示すブロ
ック図である。マイク11は入力された音声を電気信号
である音声信号に変換し、音響分析部12に供給する。
音響分析部12は、マイク11より供給された音声信号
に音響分析処理を施し、音声信号のパワーおよびゼロク
ロス数を抽出して音声区間検出部13に供給するととも
に、例えば所定の周波数帯域ごとのスペクトル特性(パ
ワー)を特徴パラメータとして抽出してNAT処理部1
4に供給する(このときの周波数帯域数が特徴パラメー
タの次元数になる)。音声区間検出部13は、音響分析
部12より供給される音声信号のパワーまたはゼロクロ
ス数から、マイク11より出力された音声信号の音声区
間、即ち音声信号の始点フレームと終点フレームを検出
し、NAT処理部14に供給する。
【0023】NAT(Normalization A
long Trajectory)処理部14は、例え
ば特開昭60−249198などに記載されているNA
T処理を行う。NAT処理部14は、図4に示すよう
に、軌跡長算出器14a、補間間隔算出器14b、およ
び補間点抽出器14cより構成され、音声区間検出部1
3より供給される音声区間において、音響分析部12よ
り供給される特徴パラメータ系列にNAT処理を施す。
NAT処理部14の軌跡長算出器14aは、音響分析部
12より供給された特徴パラメータが、そのパラメータ
空間内に描く直線近似による軌跡長SLを算出する。即
ち、軌跡長算出器14aは、例えば2つの(2次元の)
特徴パラメータのみを考えた場合、この2つのパラメー
タが、図5に示すような2次元のパラメータ空間(2次
元平面)に描く軌跡長を算出する(特徴パラメータの軌
跡を、図中・印で示す)。
【0024】補間間隔算出器14bは、パラメータ空間
内に描かれた特徴パラメータの軌跡を再サンプリングす
るための間隔(再サンプリング間隔)Tを、あらかじめ
設定されたサンプリング点数K、および軌跡長算出器1
4aにより算出された軌跡長SLから、次式にしたがっ
て算出し、補間点抽出器14cに供給する。 T=SL/(K−1) (1)
【0025】補間点抽出器14cは、音響分析部2より
供給された特徴パラメータがパラメータ空間内に描く軌
跡を直線近似した軌跡に沿って、図5に○印で示すよう
に、補間間隔算出器14bにより算出された再サンプリ
ング間隔Tで、特徴パラメータの軌跡を再サンプリング
し、入力パターンとしての新たな特徴パラメータ系列q
(j,k)(j=1,2,・・・,J:Jは特徴パラメ
ータの次元数)(k=1,2,・・・,K:K=SL/
T+1)を算出し、距離計算部15に供給する。
【0026】標準パターン格納部16は、後述する方法
で作成された、標準パターンpi(j,k)(i=1,
2,・・・,I:Iは標準パターン数)および標準パタ
ーンpi(j,k)ごとの重み係数wiを記憶する。距離
計算部15は、NAT処理部14より供給される入力パ
ターンq(j,k)と標準パターン格納部16に記憶さ
れた標準パターンpi(j,k)との距離Diを、次式に
したがって計算する。
【数1】
【0027】なお、距離計算部15は、標準パターン格
納部16に記憶されたすべての標準パターンp1(j,
k)乃至pI(j,k)に対して、入力パターンq
(j,k)との距離を計算する。
【0028】距離判定部17は、距離計算部15により
計算された、入力パターンq(j,k)とすべての標準
パターンp1(j,k)乃至pI(j,k)の距離D1
至DIの中から、最小の距離Di(MIN)を検出し、距離D
i(MIN)が、所定の基準値RTHより大きいか否かを判定す
る。そして、距離判定部17は、距離Di(MIN)が、所定
の基準値RTHより大きいと判定した場合(Di(MIN)>R
TH)、入力パターンq(j,k)を認識することができ
なかったとして、何も出力しない(入力パターンq
(j,k)をリジェクト(棄却)する)。
【0029】ここで、所定の基準値RTHを、以下リジェ
クト閾値と呼ぶ。
【0030】また、距離判定部17は、距離D
i(MIN)が、リジェクト閾値RTH以下であると判定した場
合(Di(MIN)≦RTH)、入力パターンq(j,k)を認
識した結果として、入力パターンq(j,k)との距離
を最小にする標準パターンpi(MIN)(j,k)に対応す
る単語を出力する。
【0031】次に、標準パターンpi(j,k)および
標準パターンpi(j,k)ごとの重み係数wiを作成す
るアルゴリズムについて、図6を参照して説明する。図
6に示す処理を行う前に、あらかじめ、後述する入力パ
ターンが作成される場合(音声を認識する場合)と同様
の処理がマイク11、音響分析部12、音声区間検出部
13およびNAT処理部14において行われ、標準パタ
ーンが作成される。なお、標準パターン作成用に用意さ
れた、不特定話者により発声された音声データS個に対
してこの処理が行われ、S個の標準パターンQs(1≦
s≦S)が作成される。
【0032】さらに、このようにして作成されたS個の
標準パターン(以下、候補パターンと呼ぶ)Qsの中か
ら、標準パターンとして登録する各単語のカテゴリを、
例えば上述したリジェクト閾値RTHを半径とする円で覆
い尽くすことができる、必要最小限の数の標準パターン
が選択される。このとき、選択された標準パターンの数
が、例えばI個であるとする。即ち、選択された最小限
の標準パターンをP1乃至PI(Pi(1≦i≦I))と
する。
【0033】そして、図6に示すステップS1におい
て、標準パターンをP1乃至PIの各重み係数w1乃至wI
に初期値Wがセットされるとともに、あらかじめ設定さ
れたステップS2乃至S12の処理を繰り返す反復回数
Cが、変数cntにセットされ、ステップS2に進む。
ステップS2において、候補パターンQsのサフィック
スである変数sに1がセットされる。さらに、ステップ
S2において、後述するステップS8で、重み係数wi
を更新(補正)する場合に1がセットされる変数swi
(1≦i≦I)に0がセットされる。
【0034】そして、ステップS3に進み、あらかじめ
選択された必要最小限の標準パターンPiのサフィック
スである変数iに1がセットされ、ステップS4におい
て、候補パターンQsと標準パターンPiとの距離d
si(d(Qs,Pi))が計算され、さらに距離dsiに重
み係数wiを乗じた距離、即ち重み補正した距離D
si(=ds i×wi)が計算され、ステップS5に進む。
ステップS5において、変数iが標準パターン数Iに等
しいか否かが判定される。ステップS5において、変数
iが標準パターン数Iに等しくないと判定された場合、
ステップS4に戻り、ステップS5において、変数iが
標準パターン数Iに等しいと判定されるまで、ステップ
S4,S5の処理を繰り返す。
【0035】以上ステップS3乃至S5の処理により、
I個の各標準パターンP1乃至PIと、候補パターンQs
との組み合わせに関して、重み補正した距離(Ds1乃至
sIが計算される。
【0036】ステップS5において、変数iが標準パタ
ーン数Iに等しいと判定された場合、ステップS6に進
み、重み補正した距離Ds1乃至DsIの中から、最小の距
離Dsmが検出される。ステップS7において、候補パタ
ーンQsとの距離が、ステップS6で検出された最小の
距離Dsmになる標準パターンPmのカテゴリ、即ち候補
パターンQsとの距離を最小にする標準パターンPmのカ
テゴリと、候補パターンQsのカテゴリとが、同じカテ
ゴリに属すか否かが判定される。
【0037】ここで、標準パターンP1乃至PIは、候補
パターンQ1乃至QSの中から、標準パターンとして登録
する各単語のカテゴリを、リジェクト閾値RTHを半径と
する円で覆い尽くすことができる、必要最小限の数のパ
ターンを選択したものである。従って、候補パターンQ
sとの距離がステップS6で検出された最小の距離Ds m
になる標準パターンPmのカテゴリと、候補パターンQs
のカテゴリとは、同じカテゴリに属するはずであり、ス
テップS7において、標準パターンPmのカテゴリと、
候補パターンQsのカテゴリとが、同じカテゴリに属さ
ないと判定された場合、即ち、候補パターンQsが標準
パターンPmとして認識されない場合、候補パターンQs
は誤認識されたことになる。
【0038】よって、ステップS7において、標準パタ
ーンPmのカテゴリと、候補パターンQsのカテゴリと
が、同じカテゴリに属さないと判定された場合、ステッ
プS8に進み、誤認識された候補パターンQsが標準パ
ターンPmとして認識されるように重み係数wiを補正す
るために、変数swiに1がセットされ、ステップS9
に進む。ステップS7において、標準パターンPmのカ
テゴリと、候補パターンQsのカテゴリとが、同じカテ
ゴリに属すると判定された場合、ステップS8をスキッ
プして、ステップS9に進む。
【0039】ステップS9において、候補パターンQs
のサフィックスである変数sが、候補パターン数Sに等
しいか否かが判定される。ステップS9において、候補
パターンQsのサフィックスである変数sが、候補パタ
ーン数Sに等しくないと判定された場合、ステップS3
に戻り、ステップS9において、候補パターンQsのサ
フィックスである変数sが、候補パターン数Sに等しい
と判定されるまで、ステップS3乃至S9の処理を繰り
返す。
【0040】ステップS9において、候補パターンQs
のサフィックスである変数sが、候補パターン数Sに等
しいと判定された場合、ステップS10に進み、ステッ
プS8で変数SWiに1がセットされたiをサフィック
スとする重み係数wiが、次式にしたがって更新(補
正)される。 wi=wi+δ (3) 但し、δは、Wより充分小さな値とする。
【0041】さらに、ステップS9において、重み係数
iとともに、ステップS7における、標準パターンPm
のカテゴリと、候補パターンQsのカテゴリとが、同じ
カテゴリに属すか否かが判定された結果、即ち候補パタ
ーンQsの認識結果が所定の保存エリアに記憶され、ス
テップS11に進む。ステップS11において、変数c
ntが1だけデクリメントされ、ステップS12に進
み、変数cntが0に等しいか否かが判定される。ステ
ップS12において、変数cntが0に等しくないと判
定された場合、ステップS2に戻り、ステップS12に
おいて、変数cntが0に等しいと判定されるまで、ス
テップS2乃至S12の処理を繰り返す。
【0042】ステップS12において、変数cntが0
に等しいと判定された場合、ステップS13に進み、ス
テップS10で記憶された認識結果が参照され、例えば
最も認識率の高いときの重み係数w1乃至wIが、最終的
な重み係数として決定され、処理を終了する。
【0043】以上のようにして、例えば図2に示すよう
な、識別平面における単語としてのカテゴリAまたはB
を、過不足ないようにそれぞれ円で囲むことができる重
み係数が決定される。
【0044】次に、音声を認識する場合の動作について
説明する。マイク11に入力された音声は、電気信号で
ある音声信号に変換され、音響分析部12に供給され
る。音響分析部12において、マイク11より供給され
た音声信号に音響分析処理が施され、音声信号のパワー
およびゼロクロス数が抽出されて音声区間検出部13に
供給されるとともに、所定の周波数帯域ごとのスペクト
ル特性(パワー)が特徴パラメータとして抽出されてN
AT処理部14に供給される。音声区間検出部13にお
いて、音響分析部12より供給される音声信号のパワー
またはゼロクロス数から、マイク11より出力された音
声信号の音声区間、即ち音声信号の始点フレームと終点
フレームが検出され、NAT処理部14に供給される。
【0045】NAT処理部14では、音声区間検出部1
3より供給される音声区間において、音響分析部12よ
り供給される特徴パラメータ系列にNAT処理が施され
る。即ち、NAT処理部14の軌跡長算出器14aにお
いて、音響分析部12より供給された特徴パラメータ
が、そのパラメータ空間内に描く直線近似による軌跡長
SLが算出される。補間間隔算出器14bにおいて、パ
ラメータ空間内に描かれた特徴パラメータの軌跡を再サ
ンプリングするための間隔(再サンプリング間隔)T
が、あらかじめ設定されたサンプリング点数K、および
軌跡長算出器14aにより算出された軌跡長SLから、
式(1)にしたがって算出され、補間点抽出器14cに
供給される。
【0046】補間点抽出器14cにおいて、音響分析部
2より供給された特徴パラメータがパラメータ空間内に
描く軌跡を直線近似した軌跡に沿って、図5に○印で示
すように、補間間隔算出器14bにより算出された再サ
ンプリング間隔Tで、特徴パラメータの軌跡が再サンプ
リングされ、入力パターンとしての新たな特徴パラメー
タ系列が算出される。
【0047】距離計算部15において、NAT処理部1
4より供給される入力パターンq(j,k)と標準パタ
ーン格納部16に記憶された標準パターンpi(j,
k)との距離Diが、式(2)にしたがい、標準パター
ンpi(j,k)ごとに用意した距離尺度を補正する重
み係数wiが、入力パターンq(j,k)と標準パター
ンpi(j,k)との単純な距離に乗じられて計算され
る。
【0048】なお、距離計算部15において、標準パタ
ーン格納部16に記憶されたすべての標準パターンp1
(j,k)乃至pI(j,k)に対して、入力パターン
q(j,k)との距離が計算される。
【0049】距離判定部17において、距離計算部15
により計算された、入力パターンq(j,k)とすべて
の標準パターンp1(j,k)乃至pI(j,k)の距離
1乃至DIの中から、最小の距離Di(MIN)が検出され、
距離Di(MIN)が、リジェクト閾値RTHより大きいか否か
が判定される。そして、距離判定部17において、距離
i(MIN)が、リジェクト閾値RTHより大きいと判定され
た場合(Di(MIN)>RTH)、入力パターンq(j,k)
を認識することができなかったとして、入力パターンq
(j,k)がリジェクト(棄却)される。また、距離判
定部17において、距離Di(MIN)が、リジェクト閾値R
TH以下であると判定された場合(Di( MIN)≦RTH)、入
力パターンq(j,k)を認識した結果として、入力パ
ターンq(j,k)との距離を最小にする標準パターン
i(MIN)(j,k)に対応する単語が出力される。
【0050】以上のように、標準パターンごとに用意し
た距離尺度を補正する重み係数を、入力パターンと標準
パターンとの距離に乗じて、標準パターンのカテゴリの
形状に対応した距離を求めるようにしたので、音声の認
識率を向上させることができる。
【0051】なお、本実施例においては、あらかじめ与
えられたS個の候補パターンからI個の標準パターンを
選択して、このI個の標準パターンの重み係数を、単語
のカテゴリの形状に合うように更新(補正)するように
したが、カテゴリの形状に合わせて標準パターン(テン
プレート)とともに重み係数(例えば図2におけるカテ
ゴリAまたはBを覆う円の中心と半径に対応する)を決
定するようにすれば、標準パターン(テンプレート)数
を減らすことができる。
【0052】
【発明の効果】請求項1に記載のパターンマッチング方
法によれば、標準パターンごとに用意した距離尺度を補
正する重み係数を、入力パターンと標準パターンとの距
離に乗ずるようにしたので、標準パターンのカテゴリの
形状に対応した距離を求めることができ、入力パターン
の認識率を向上させることができる。
【0053】請求項2に記載のパターン認識装置によれ
ば、標準パターンとともに、標準パターンごとに用意さ
れた距離尺度を補正する重み係数が記憶手段に記憶さ
れ、記憶された標準パターンと、入力パターン作成手段
により作成された入力パターンとの距離が計算される。
そして、入力パターンとの距離を計算する標準パターン
に対応して、記憶手段に記憶された重み係数が距離に乗
ざれる。従って、標準パターンをマルチテンプレート化
する場合、テンプレートの数を少なくすることができ、
さらに入力パターンの認識率を向上させることができ
る。
【図面の簡単な説明】
【図1】本発明のパターンマッチング方法を応用したパ
ターン認識装置の一実施例の構成を示すブロック図であ
る。
【図2】識別平面におけるカテゴリの形状を、過不足な
いように重み係数を補正した標準パターン(テンプレー
ト)で被覆した平面図である。
【図3】本発明のパターン認識装置を応用した音声認識
装置の一実施例の構成を示すブロック図である。
【図4】図3の実施例のNAT処理部14のより詳細な
ブロック図である。
【図5】音声の特徴パラメータの軌跡を示す平面図であ
る。
【図6】図3の実施例の標準パターン格納部16に記憶
される重み係数を作成するアルゴリズムを説明するため
のフローチャートである。
【図7】識別平面における単語のカテゴリの分布を示す
平面図である。
【図8】従来のテンプレート方式における標準パターン
(テンプレート)による単語のカテゴリを被覆した平面
図である。
【図9】従来のテンプレート方式における標準パターン
(テンプレート)による単語のカテゴリを被覆した平面
図である。
【符号の説明】
1 距離計算部 2 標準パターン格納部 3 パターン選択部 4 重み補正部 5 重み係数格納部 6 距離判定部 11 マイク 12 音響分析部 13 音声区間検出部 14 NAT処理部 15 距離計算部 16 標準パターン格納部 17 距離判定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力パターンと標準パターンとの距離に
    より前記入力パターンを認識するパターンマッチング方
    法において、 前記標準パターンごとに用意した距離尺度を補正する重
    み係数を前記距離に乗ずることを特徴とするパターンマ
    ッチング方法。
  2. 【請求項2】 入力パターンを作成する入力パターン作
    成手段と、 標準パターンとともに、前記標準パターンごとに用意さ
    れた距離尺度を補正する重み係数を記憶する記憶手段
    と、 前記記憶手段に記憶された標準パターンと、前記入力パ
    ターン作成手段により作成された入力パターンとの距離
    を計算する距離計算手段と、 前記距離計算手段により計算された距離により前記入力
    パターンを認識する認識手段とを備え、 前記距離計算手段は、前記入力パターンとの距離を計算
    する前記標準パターンに対応して、前記記憶手段に記憶
    された重み係数を前記距離に乗ずることを特徴とするパ
    ターン認識装置。
JP4082831A 1992-03-04 1992-03-04 パターンマッチング方法およびパターン認識装置 Withdrawn JPH05249990A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP4082831A JPH05249990A (ja) 1992-03-04 1992-03-04 パターンマッチング方法およびパターン認識装置
DE69329354T DE69329354T2 (de) 1992-03-04 1993-03-01 Verfahren und Gerät zur Mustererkennung
EP93301537A EP0559415B1 (en) 1992-03-04 1993-03-01 A pattern matching method and a pattern recognition apparatus
US08/414,046 US5561722A (en) 1992-03-04 1995-03-03 Pattern matching method and pattern recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4082831A JPH05249990A (ja) 1992-03-04 1992-03-04 パターンマッチング方法およびパターン認識装置

Publications (1)

Publication Number Publication Date
JPH05249990A true JPH05249990A (ja) 1993-09-28

Family

ID=13785354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4082831A Withdrawn JPH05249990A (ja) 1992-03-04 1992-03-04 パターンマッチング方法およびパターン認識装置

Country Status (4)

Country Link
US (1) US5561722A (ja)
EP (1) EP0559415B1 (ja)
JP (1) JPH05249990A (ja)
DE (1) DE69329354T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090867A1 (ja) * 2003-04-09 2004-10-21 Toyota Jidosha Kabushiki Kaisha 変化情報認識装置および変化情報認識方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167390A (en) * 1993-12-08 2000-12-26 3M Innovative Properties Company Facet classification neural network
JP2738403B2 (ja) * 1995-05-12 1998-04-08 日本電気株式会社 音声認識装置
JP2982689B2 (ja) * 1996-04-19 1999-11-29 日本電気株式会社 情報量基準を用いた標準パターン作成方式
US5789726A (en) * 1996-11-25 1998-08-04 Eastman Kodak Company Method and apparatus for enhanced transaction card compression employing interstitial weights
US6006186A (en) * 1997-10-16 1999-12-21 Sony Corporation Method and apparatus for a parameter sharing speech recognition system
US5983224A (en) * 1997-10-31 1999-11-09 Hitachi America, Ltd. Method and apparatus for reducing the computational requirements of K-means data clustering
US6330353B1 (en) * 1997-12-18 2001-12-11 Siemens Corporate Research, Inc. Method of localization refinement of pattern images using optical flow constraints
US6223150B1 (en) 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6356865B1 (en) 1999-01-29 2002-03-12 Sony Corporation Method and apparatus for performing spoken language translation
US6278968B1 (en) 1999-01-29 2001-08-21 Sony Corporation Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6243669B1 (en) 1999-01-29 2001-06-05 Sony Corporation Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6266642B1 (en) 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
US6442524B1 (en) 1999-01-29 2002-08-27 Sony Corporation Analyzing inflectional morphology in a spoken language translation system
US6374224B1 (en) 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation
US7363311B2 (en) * 2001-11-16 2008-04-22 Nippon Telegraph And Telephone Corporation Method of, apparatus for, and computer program for mapping contents having meta-information
FR2892846A1 (fr) * 2005-11-03 2007-05-04 France Telecom Procede et dispositif de calcul de mesure de similarite entre une representation d'un segment audio de reference et une representation d'un segment audio a tester et procede et dispositif de suivi d'un locuteur de reference
CN101154379B (zh) * 2006-09-27 2011-11-23 夏普株式会社 定位语音中的关键词的方法和设备以及语音识别系统
US9471873B1 (en) * 2012-09-20 2016-10-18 Amazon Technologies, Inc. Automating user patterns on a user device

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4414566A (en) * 1981-04-03 1983-11-08 Industrial Automation Corporation Sorting and inspection apparatus and method
US4608708A (en) * 1981-12-24 1986-08-26 Nippon Electric Co., Ltd. Pattern matching system
JPH0778825B2 (ja) * 1983-02-09 1995-08-23 株式会社日立製作所 画像処理プロセツサ
JPS59172700A (ja) * 1983-03-22 1984-09-29 中川 聖一 パタ−ン比較装置
JPH0668678B2 (ja) * 1984-06-25 1994-08-31 ソニー株式会社 音声認識装置
JPH0632022B2 (ja) * 1984-06-15 1994-04-27 ソニー株式会社 音声認識装置
JPH0792674B2 (ja) * 1984-07-04 1995-10-09 ソニー株式会社 音声認識装置
JPS625299A (ja) * 1985-06-29 1987-01-12 ソニー株式会社 音声認識装置
US4802224A (en) * 1985-09-26 1989-01-31 Nippon Telegraph And Telephone Corporation Reference speech pattern generating method
JPS62105199A (ja) * 1985-10-31 1987-05-15 ソニー株式会社 音声認識装置
JPS62113197A (ja) * 1985-11-13 1987-05-25 ソニー株式会社 音声認識装置
WO1987006371A1 (en) * 1986-04-10 1987-10-22 Hewlett Packard Limited Expert system using pattern recognition techniques
JPH0638195B2 (ja) * 1987-01-30 1994-05-18 日本電気株式会社 パタンマッチング装置
US5041733A (en) * 1987-03-20 1991-08-20 Agency Of Industrial Science & Technology Method and apparatus for identifying chromosomes or cells
US4905285A (en) * 1987-04-03 1990-02-27 American Telephone And Telegraph Company, At&T Bell Laboratories Analysis arrangement based on a model of human neural responses
JPS63305396A (ja) * 1987-06-05 1988-12-13 ソニー株式会社 音声認識装置
JP2658104B2 (ja) * 1987-12-24 1997-09-30 ソニー株式会社 音声認識装置
JP2745535B2 (ja) * 1988-05-24 1998-04-28 日本電気株式会社 音声認識装置
US5109431A (en) * 1988-09-22 1992-04-28 Hitachi, Ltd. Pattern discrimination method and apparatus using the same
GB8914843D0 (en) * 1989-06-28 1989-08-16 British Aerospace A method of processing video image data for use in the storage or transmission of moving digital images
US5040133A (en) * 1990-01-12 1991-08-13 Hughes Aircraft Company Adaptive clusterer
US5214717A (en) * 1990-02-26 1993-05-25 Fujitsu Limited Pattern recognition data processing device using an associative matching method
US5199543A (en) * 1990-08-22 1993-04-06 Oki Electric Industry Co., Ltd. Apparatus for and method of discriminating bill
US5276771A (en) * 1991-12-27 1994-01-04 R & D Associates Rapidly converging projective neural network

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090867A1 (ja) * 2003-04-09 2004-10-21 Toyota Jidosha Kabushiki Kaisha 変化情報認識装置および変化情報認識方法
US7302086B2 (en) 2003-04-09 2007-11-27 Toyota Jidosha Kabushiki Kaisha Change information recognition apparatus and change information recognition method
US7508959B2 (en) 2003-04-09 2009-03-24 Toyota Jidosha Kabushiki Kaisha Change information recognition apparatus and change information recognition method

Also Published As

Publication number Publication date
EP0559415B1 (en) 2000-09-06
DE69329354T2 (de) 2001-03-29
EP0559415A2 (en) 1993-09-08
EP0559415A3 (en) 1995-06-21
US5561722A (en) 1996-10-01
DE69329354D1 (de) 2000-10-12

Similar Documents

Publication Publication Date Title
JPH05249990A (ja) パターンマッチング方法およびパターン認識装置
JP3664739B2 (ja) 話者の音声確認用の自動式時間的無相関変換装置
US4400828A (en) Word recognizer
EP1141939B1 (en) System and method for segmentation of speech signals
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
US5828998A (en) Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system
US4790017A (en) Speech processing feature generation arrangement
JPH05224693A (ja) 音声認識装置
JP3458285B2 (ja) 音声認識装置
JPH06301395A (ja) 音声認識装置
JPH05216498A (ja) 音声認識装置
JP2543584B2 (ja) 音声標準パタン登録方式
JP2000122693A (ja) 話者認識方法および話者認識装置
JPH10171488A (ja) 音声認識方法及び装置及び記憶媒体
JPH05313692A (ja) 音声認識装置
JPS6346496A (ja) 音声認識装置
JP3003136B2 (ja) 音声認識方法および音声応答システム
JPH0419700A (ja) 音声パターンマッチング方法
JPH06289893A (ja) 音声認識装置
JPH0683383A (ja) 音声認識装置
JPH05249991A (ja) 重み係数決定方法
JPH1185182A (ja) 話者認識方法及び装置
WO1991002348A1 (en) Speech recognition using spectral line frequencies
JPS6287993A (ja) 音声認識装置
JPS6364100A (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990518