JPS63501603A

JPS63501603A - スピ−チ処理装置および方法

Info

Publication number: JPS63501603A
Application number: JP61505889A
Authority: JP
Inventors: ミラー，ジェームズ　ディ
Original assignee: セントラル　インステイチユ−ト　フオ　ザ　デフ
Priority date: 1985-10-30
Filing date: 1986-10-29
Publication date: 1988-06-16
Also published as: US4809332A; EP0243479A1; WO1987002816A1; US4813076A; EP0243479A4

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】スピーチ処理装置および方法〈発明の背景〉この発明は、スピーチ処理装置および方法に関するものである。さらに詳しく言えば、この発明は自動スピーチ認識への適用および研究て使用する装置および方法に関する。感知されるスピーチは、セグメントあるいはスピーチ音から成り立っていると考えることかできる。これらは話し言葉の音素すなわちホーニーム（音韻）で、これらは国際音声学協会（Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｐｈｏｎｅｔｉｃ　Ａｓ５ｏｃｉａ−ｔｉｏｎ）の記号のような１組の記号によって表わすことができる。これらのセグメントは言語単位で、感知されまた話されるスピーチ中にそれらの基礎をもっている。言語のすべての音節（シラブル）および語（ワード）は比較的少数の音素から成っている。例えば英語の場合、音声学のテキストには僅か２５個の子音と１２個の母音の合計３７個のホーニームがリストアツブされているにすぎない、もしより細かい音声学的識別が含まれていると、識別可能なスピーチあるいは音は５０あるいは６０の高さにまで伸ばされる。話し言葉のホーニームは、約１２個の少数の組の明確な特徴によって理解することがてきるということが提案されている。これらの特徴は、発声的、知覚的、および言語学的解析をその基礎とするものである。このような特徴による方法は、音およびホーニームが発音の場所および発音のし方の形で説明されている音声学の教科書中でしばしば使用される。聴取者がスピーチの入力音響波形をどのように処理し、この波形をホーニームや語のような一連の言語素子に変換するかという点に関する幾つかの理論がある。スピーチの感知に含まれる正確なメカニズムおよび処理は未だ充分には解明されていない。音、ホーニームおよび推測される特徴についての簡単て信頼性のある音響的聴覚の相関関係を発見することはとらえどころがないことであるということが判った。言語の感知に関する研究発表の説明は、音響的聴覚パターンとホーニームの感知との間の関係についての複雑て高度に条件付けられたものになっているが、それでもその説明は依然としてしばしば狭い範囲に制限された上ての一般論ということになっている０例えば、聴取者がどのようにして音響入力を言語学的感知に関連するセグメントに分けることができるかという問題は解明されていない、このセグメント化についての解決が得られたと　□しても、ホーニームあるいは特徴についての聴覚的音響表現は、音声学的関係、特定の話者、スピーチの速さに依存するように思われる。これらの問題の結果、言語感知についての幾つかの実行可能な理論がある。現在のすべての理論は一般的な３段階のモデルに集約され、音響入力は上昇形（ボトム・アップ）シーケンスで３段階の処理を受ける。第１段階は入力音響波形の聴覚的解析であり、それによって信号が聴覚的な関係をもって表わされる。第２段階で聴覚−知覚変換が行なわれ、それによって第１段階段階のスペクトル出力は音響学的認識に関連する知覚形式に変換される。ここでスペクトル表現は知覚により一層直接関連するディメンジョンに変換される。例えば、各種の理論において、知覚的形態はスピーチ生成、あるいは聴覚的特徴、あるいはパターン・シーケンスの発声の相関関係に関連する可能性がある。最後の第３段階において、第２段階の感知ディメンジョンは発声−言語変換によって一連のホーニーム、音節、あるいは語に変換される。第２段階および第３段階はトップダウン処理による影響を受ける。この場合言語や事象、言語と同様に他の感覚からの入力を含む最新の入力に関する知識も使用されるようになる。自動スピーチ認識におけるある仕事には、時間窓処理されたスピーチ波形に関して実行される狭帯域スペクトル解析が含まれる。「アイ・イー・イー・イー・スペクトラム」の１９８３年１１月号、第８４頁乃至第８７頁のレディ氏（Ｒ，Ｒｅｄｄｙ）他の論文“連続的スピーチの認識には未だゴールが不明である（Ｒｅｃｏｇｎｉｚｉｎｇ　ｃｏｎｔｉｎｕｏｕｓ　ｓｐｅｅｃｈ−ｒｅｍａｉｎｓ　ａｎ　ｅｌｕｓｉｖｅ　ｇｏａｌ）”に述べられている方式では、入力デジタル化信号は１００分の１秒のスライスに分割され、スペクトル的に解析される。各スライス音の原形の集合と比較され、各スライスに最も近い原形はシーケンスに入る。次に原形シーケンスは語の初期音を大ざっばに分類するために使用され、次いてこれは語の推定を行なうために使用される。それから各語は確率マトリックスを作り出すことによって試験され、動作サイクルは全センテンスが識別されるまで次の語に対してくり返される。〈発明の概要〉とりわけ、この発明の目的は、異なる速さて生ずるスピーチを処理する改良されたスピーチ処理装置および方法を提供すること、異なる話し手からのスピーチを有効に処理する改良されたスピーチ処理装置および方法を提供すること、スピーチ内の音素を識別するためにスピーチをセグメントに分ける改良されたスピーチ処理装置３よび方法を提供すること、音の明らかな聴覚的重畳が存在するスピーチ音生の音素を認識する改良されたスピーチ処理装置および方法を提供すること、無音（サイレンス）や変移のようなキューを集積する改良されたスピーチ処理装置および方法を提供すること、破裂および閉鎖音素を識別する改良されたスピーチ処理装置および方法を提供すること、通常ホーニームに付帯するスピーチ音が実際に生じない時にあたかもそれか生じたかのようにホーニームを認識するためにホーニーム的回復を行なうことのできる改良されたスピーチ処理装置および方法を提供すること、異なる方言、言語の話者のスピーチ中の音素を認識する改良されたスピーチ処理装置および方法を提供すること、スピーチを記憶および表示用の記号に変換するための改良されたスピーチ処理装置および方法を提供すること、およびスピーチに対応する書かれたテキスト材料を発生するのに使用するために、スピーチを一連の音素に変換する改良されたスピーチ処理装置および方法を提供することにある。他の目的、特徴は以下でその一部が明らかにされ、またその一部が指摘されている。この発明の一形式では、スピーチ処理装置は、メモリ中の各々のアドレス群に対応する異なる発声表現（Ｒｈｏ−ｎｅｔｉｃ　ｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ）を表わす予め記憶された情報を保持するメモリ手段と、各々連続する時間間隔で生ずるスピーチの周波数スペクトルから数学的空間中の径路中の点の一連の座標値を電気的に引出し、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似する座標値を識別し１位置の座標値の関数としてメモリ・アドレスを発生し、そのメモリ・アドレスに予め記憶された発生表現情報を上記メモリ手段から得る回路とを含んでいる。この発明の他の形式では、スピーチ処理装置はスピーチのアナログ波形のサンプルを生成し、そのサンプルをデジタル形式に変換する回路を含んでいる。また、デジタル形式のサンプルからスピーチの周波数スペクトルを表わすデジタル値の群を引出し、各デジタル値の群から決定される数学的空間中の一連のポインタ値を発生し。この一連のポインタ値から、どの聴覚状態コードか発生されるかに依存して決定される複数の異なる計算処理のうちの１つによって、数学的空間の径路上の点の一連の座標値を計算するための回路が含まれている。他の回路が径路上の点の計算された座標値をデジタル形式て一時的に記憶する。この発明の方法では、スピーチ処理方法は、各々連続する時間間隔で生じるスピーチの周波数スペクトルから数学的空間の点の座標値であって、その数学的空間の点の径路を特定する一連の座標値を電気的に引出し、加速度の大きさてピークの径路に沿う少なくとも１つの位置を近似する座標値を電気的に識別し、上記通路上の位置の座標値の関数としてメモリ・アドレスを発生し、メモリの各アドレス群に相当する異なる発生表現を表わす予め記憶された情報を有するメモリ手段から、そのメモリ・アドレスに予め記憶された上記発生表現情報を得る段階を含んでいる。この発明の他の形式ては、スピーチ処理装置はメモリ回路と、スピーチのアナログ波形のサンプルを発生し、このサンプルをデジタル形式に変換するための回路網を含んでいる。さらに他の回路は、デジタル形式のサンプルからスピーチの周波数スペクトルを表わすデジタル値群を引出し、メモリの個々の位置にスペクトル中の１あるいはそれ以上のピークの周波数の値を選択的に記憶させ、周波数の記憶された値およびこの周波数の記憶された値の個々の位置の双方に依存する数学的空間中の座標値に対応する１組のデジタル値を発生する。この場合、所定のピークの周波数が記憶され選択されたｌあるいはそれ以上の個々のメモリ位置は、そのピークが周波数の第１の予め定められた帯域にあるか、および任意の他のピークが第１の帯域とこの第１の帯域とオーバーラツプする第２の帯域の双方にあるか否か依存している。〈図面の簡単な説明〉第１図はこの発明のスピーチ処理装置のブロック図、第２図は代表的なスピーチ波形の電圧対時間の関係を示すグラフを示す図、第３図は第１図のＣＰＵＩユニットの割込みルーチンの動作を示すフローチャート図、第４図はこの発明の方法による第１図のＣＰ旧の主ルーチンの動作を示すフローチャート図、第５図は第２図のスピーチ波形の周波数スペクトルを示す１０ミリ秒サンプルの振幅対対数で表わされた周波数のグラフを示す図。第５Ａ図は基本周波数の倍数Ｋに相当する１組のスペクトル値を保持するＣＰＵＩに対するメモリ中の表の概略図。第６．７．８．９図はスピーチの種々の周波数スペクトルを解析するためのこの発明の詳細な説明するデシベのグラフを示す図、第１０図は数量で呼ばれるスピーチの良さがどのようにスペクトルの形に依存するかを示すデシベル対対数で表わされた周波数における３つのスペクトル包結線を示す図、第１１図はこの発明の方法によりこの発明の装置の動作を説明するためのスペクトルにおけるスピーチの良さと１あるいはそれ以上のピークの幅との関係のグラフを示す図、第１２図はこの発明の方法により、この発明の動作によって生成される数量で呼ばれるスピーチの大きさ対デシベル和の関係をグラフで示す図、第１３Ａ図および第１３Ｂ図はこの発明の装置によってスペクトルを解析するためのこの発明の方法による第４図の主ルーチン中の動作をさらに詳細に説明するための２つのフローチャート図、第１４図はスペクトル基準値を発生するためのこの発明の方法による動作のフローチャート図。第１５図は感覚ポインタの座標値から知覚上の重要度をもワた径路上の座標値に変換するための第１図のＣＰＵ２ユニツトにおけるこの発明の方法による動作を示すフローチャート図、第１５Ａ図は第１５図の動作におけるＣＰＵ２によって使用される表を示す図。第１６図は感覚ポインタ座標から３次元数学的空間中の知覚ポインタの座標ｘ、、ｙ、、ｚ、に変換する数学的モデルを示す図、第１７図は２つの音素に対するターゲット領域を示し、また数学的空間中の知覚ポインタによって描かれた軌道あるいは通路を示す第１６図の数学的空間の簡略化された図、第１８図は数学的空間におけるｘ、ｙ、ｚ座標系およびＸ’、Ｙ’、Ｚ’座標系を示す図。第１９図および第２０図は第１８図のｘ’、ｙ’、ｚ’座標系に関連する数学的空間で、第１９図てはＸ′軸に沿って、第２０図ては２′軸に沿って見た数学的空間における母音に対するターゲット帯域をもった母音数の２つの異なる観測状態を示す図、第２１図は第１８図のＹ軸に沿って見たときの無声閉鎖音に対する数学的空間のターゲット帯域を示す図、第２２図は第１８図のＹ軸に沿って見たときの有声閉鎖音、非気息音無声閉鎖音、および鼻子音に対する数学的空間におけるターゲット帯域を示す図、第２３図は第１８図のＹ軸に沿って見たときのアメリカ英語の無声摩擦音に対する数学的空間におけるターゲット帯域を示す図、第２４図は第１８図のｘ’　、ｙ′、ｚ’座標系のＺ′軸に沿って見たときの有声摩擦音と音声学的近似に対する数、学的空間におけるターゲット帯域を示す図、第２５図は第１８図のｘ’　、ｙ’　、ｚ’座標系のＸ′軸に沿って見たときの第２４図の有声摩擦音と音声学的近似に対する数学的空間におけるターゲット帯域を示す図。第２６図は音声学的に重要な事象が生じたときに数学的空間における径路を解析し、音素を得るためのこの発明による装置の第１図のＣＰＵ３のこの発明の詳細な説明するフローチャート図、第２７図は第２６図の動作で使用するための表を示す図である。幾つかの図面を通じて、同じ対応参照文字は対応する部分を示している。〈好ましい実施例の詳細な説明〉第１図において、この発明のスピーチ処理装置１は、スピーチによる音響波形の音圧変化を線路１３上の電気的信号に変換するマイクロホン１１を有している。装置１は、数ミリ秒ごとに入力スピーチのスペクトルの形および聴覚状態を表わすことのできるスピーチ波形に関する短期間の解析を行なう、この感覚上の処理はより高レベルの知覚的電子装設部分への入力として作用する。知覚的電子装置部分は、聴覚的情報を時間について積分し、聴覚的知覚事象（すなわちサウンド）を識別し、聴覚的入力を人間の言語の音素に相当する一連の記号あるいは分類コードに変換する。線路１３上の電気信号はアンチェリアシング低減通過フィルタ１５によって濾波され、サンプル・ホールド（Ｓ／）Ｉ）回路１７に供給される。Ｓ／日回路１７は発振器１９によって、例えば２０　ＫＨｚのサンプリング周波数て付勢され、アナログ電気信号のサンプルをアナログ・デジタル変換器（ＡＤＣ）２１に供給し、ここてサンプルは発振器１９に応答して並列デジタル形式に変換され、これを第１の中央処理ユニ・ントＣＰＵＩのデータ入力にｍ統された１組のデジタル線路２３上に送り出す、　ＣＰＵＩは５０マイクロ秒毎に割込みピンＩＲＱにおける発振器１９によって割込みか行なわれたときにデジタル形式の最後のサンプルを読込む。ＣＰＵＩは第１図における４個の中央処理ユニットＣＰＵＩ。ＣＰＵ２、ＣＰＵ３およびＣＰＵ４のうちの１つで、各々はプログラム可能読出し専用メモ’Ｊ　（ＲＯ１＋！１．　ＲＯＭ２、ＲＯＭ３、ＲＯＭ４）、ランダム・アクセス・メモリ（ＲＡＭＩ、ＲＡＭ２、ＲＡＭ３、ＲＡＭ４）、およびビデオ端末キーボードユニット（ＴＥＲＭＫＢＤＩ、ＴＥＲＭＫＢＤ２．　ＴＥＲＭＫＢＤ３、ＴＥＲＭＫＢＤ４　）を具備している。　ＣＰＵＩはデータ・バッファ２５によってバッファ作用を受けるＣＰＵ２に対するデータを発生する。ＣＰＵ２はデータ・バッファ２７によってバッファ作用を受けるＣＰＵ３に対するデータを発生する。　ＣＰＵ３は約２メガバイトの容量を具えたメモリ３１を有し、該メモリ３１はメモリ中の各アドレス群に対応する異なった発生表現を表わす予め記憶された情報を保持する。　ＣＰＵ３にはプリンタ３３か設けられており、このプリンタによりメモリ３１から得られた順序て音素情報を記録する。　ＣＰＵ４は語粂素アクセス・プロセッサで、音素情報を元の平常文に変換し、また自動書取りを行なうためにプリンタ３５上にそれをプリントする。第２図はスピーチの電気的波形５１の一部を示す、波形５１は一般に約１０ミリ秒の時間間隔、すなわち窓全体にわたって幾つかのピークと谷間、およびより高い周波数成分を持っている。ＣＰＵＩは毎秒２０００回割込みを受け、それによりて各１０ミリ秒の時間間隔毎にＡＤＣ２１から２００の組のサンプルが得られる。第３図において、ＣＰ旧の割込みルーチン７０の動作は“開始７１”でビンＩＲＱの割込みが開始され、ステップ７３に進んてＲＡＭＩにおけるＮｌ（例えば８０）のアドレスのセクションにあるアドレス位置に最新のサンプルを読込む。次にステップ７５においてアドレスおよびサンプル計数Ｎは１づつ増加する０判定段階７７において、計数Ｎは数値Ｎ１と比較されて、最新のサンプルの組が完全であるか否かを決定する。もし完全であれば、ステップ７９においてサンプル計数Ｎは０にリターンし、最新のサンプル組か完了した信号としてフラッグＦＬＧはｌにセットされる。また１次のサンプルに対するアドレス位置はＮｌアドレスのセクションの開始時に予め定められた位置ＡＤＲＯにリセットされ、ここてリターン８１に到達する。もし、最新のサンプルの組が完了していないと、ステップ７７からリターン８１へ動作が分岐し１割込みが生じた動作で主プログラムがＣＰＵＩで再開する。この主プログラムによるＣＰＵＩの動作は第４図に示されており、スタート１０１て開始し、ステップ１０３で入カー出カバウスキーピングと初期化が行なわれる。また、ステップ１０３でサンプル組のサイズＮ１は８０にセットされ。サンプル・フラッグＦＬＧおよび可変ＦＩＬは０にセットされる。感覚上の基準周波数ＳＲおよび可変ＧＭＴＰＯは共に人間が話すときの声の相乗平均座高（ピッチ）に近い一定値１６８　Ｈｚに初期化される。変数Ｎ２は１００にセットされる０次にステップ１０５で、１組の周波数値５ＦＩＬ、　５ＦＩＨ。ＳＦ２　、　ＳＦ３と同様にここでは聴覚状態コードと称される１組の変数すなわち数量はすべて０に初期化される。この発明の実施例による聴覚的状態コードの変数は、破裂−摩擦音８Ｆ、声門原音ＧＳ、鼻音ＮＳ、破裂−摩擦音および声門原音にそれぞれ対応する大きさ指数ＬＩＢＦおよびＬＩＧＳ、破裂−摩擦音および声門原音にそれぞれ対応するスピーチの良さの値ＧＢＦ　、　ＧＧＳである。他の実施例では、他の変数は鼻音、有声音化、摩擦音、気合、ささやき、大きさおよび良さの各種の音声源の特徴の全部または幾つかに対する聴覚的状態コード中に含まれる。次のステップ１０７において、Ｎｌサンプルのすべての組が利用できるかどうかを確認するためにフラッグＦＬＧがチェックされる。第４図の動作が実行されるとき、第３図の割込み動作で次のＮｌサンプルの組を集めつつある。装置ｌが丁度ターンオンされると、ＣＰＬＩＩは第１の組のサンプルが得られ、ＦＬＧが割込みルーチン中で１にセットされるまで待機する。この待機はステップ１０７からそれ自身への分岐によって行なわれる。　ＦＬＧか１になると、サンプルのすべての組が存在し、ＦＬＧはステップ１０９中でＯにリセットされる０次のステップ１１１て、ＡＤＣ２１からの最新のＮ１サンプルに対応する周波数スペクトルを表わす１組のデジタル値が離散フーリエ変換（ＤＦＴ）処理に従って計算される。換言すれば、このような各デジタル値の組は各連続するｌＯミリ秒におけるスピーチの周波数スペクトルを表わす。周波数スペクトルの例が第５図の縦線１１３によって示されている６周波数スペクトルは次のようにして計算される。サンプルのデジタル値は５（Ｎ）て表わされる。ここでＮは０からＮ１−１まで変化する。これらのＤＦＴは次のここでｅは自然対数の底てあり、ｊは−１の平方根であり、πは円の円周と直径との比である。ｆは１組のＮ１サンプルを集めるに必要とする時間の逆数に等しい基本周波数（時間が１０ミリ秒であれば、ｆは１００　）１ｚ）に等しく、ｋｆはスペクトル中の線１１３に１つか計算される周波数の整数倍である。Ｃ０１ｌ　１は周波数逓倍技術では周知の高速フーリエ変換算法によって１から数値ＭまてのＫの値についてＤＦＴを計算する。数値Ｍはサンプリング率の２分の１に１組のＮ１サンプルを集めるのに必要とする時間を掛けたもの（２０００ＨｚＸ　Ｏ，５Ｘ　Ｏ，０１秒＝　１００）である。Ｄ（ｋｆ）の値は第５Ａ図に示すように、Ｋの各値に対応する連続するアドレスにおいて、ＲＡＭ中のスペクトル表に記憶される。スピーチ波形のスペクトル包絡線を引出すための他の方法ては、スピーチの波形は５乃至４０ミリ秒の持続時間を持ち、１．０乃至２．５ミリ秒のステップでシフトされた時間窓重み付は関係によって逓倍される。従って、窓を特定する連続する時間間隔はオーバーラツプすることもあれば区別されることもある。破裂音、変移、および比較的定常状態のセグメントに関連する窓持続時間およびステップの大きさは最高の性能が得られるように調整される。短期間スペクトルは各セグメントについてＤＦＴあるいは線形予測解析（ＬＰＡ）のいずれかによって計算され。ＤＦＴは勿論窓の長さの逆数の整数倍に成分をもった線スペクトルを発生し、一方ＬＰＡは選択されたＬＰパラメータの数に依存する細部をもった平滑化スペクトル包絡線（変換関数）を発生する。いずれのスペクトルも大きさ、周波数が共に対数のディメンションで表わされている。動作は次のようにして行なわれる、または近似される。スペクトルは対数周波数領域で窓通過処理を受け、それによって振幅は感覚レベルあるいは大きさのレベルて表わされる。スペクトルは平滑化フィルタによる処理を受ける。そのフィルタの１つは臨界帯域に類似したものである。他はわずられしい小スペクトル・ピークを減少させる。最後にスペクトル包絡線は対数周波数単位で高域通過濾波な受け、スペクトル・チルトを減少させる。得られたスペクトルは殆ど一様な高さの形のピークを持ち、チルトは除かれ、また平滑フィルタによって小さな不規則性は除去される。ａ音波は、弱められた広帯域化された第１のホーマットを捜すことによって、あるいは対数周波数単位の適当な範囲内て処理されたスペクトル包結線を窓通過処理し、鼻音波を捜しているそのセグメントを帯域通過処理することによって、あるいは相関信号処理技術を使用することによって、スピーチ・スペクトルの下側半分中て検出することができる。さらに他の実施例では、ＣＰＵＩに対するスペクトルを生成するために、リアルタイム・フィルタ積層回路が使用される。このような積層回路によればＣＰＵＩが必要とする計算を減少する効果があり、またこのような実施例では、スペクトル表はリアルタイム・フィルタ積層体からｌθミリ秒毎、あるいはさらに短い周期、例えばｌ乃至２．５ミリ秒毎の規則正しい間隔で更新される。また、スペクトルを安価に且つ急速に計算するための信号処理チップとして例えばテキサス・インストルメンツ（ＴｅｘａｓＩｎｓｔｒｕｍｅｎｔｓ）　７ＭＳ３２０を使用することができる。第５図で、スペクトルは周波数が高くなるにつれて高さが減少、すなわち“チルト”する幾つかのピーク１】５．１１６　、１１７をもっている。第５図では図を判り易くするために包絡線１１９の包絡線は同じピーク１１５　、１１６゜１１７をもっている。包Ｍｍｌ１９は第６図に再度点線て示されており、第６図では図を判り易くするためにスペクトル線は抑圧されていることを理解すべきである。第４図のステップ１２１におけるＣＰＵＩはスペクトルを次の（２）式に従って感覚レベルのデシベル（ｄＢ）に変換する。Ｄ（ｋｆ）ｄａ　＝　２（Ｌ　ＩＯｇ＋ｏ　Ｄ（ｋｆ／ｒｅｆ）　（２）ここて、Ｄ（ｋｆ）は周波数ｋｆにおける各スペクトル値、ｒｅｆはその周波数に対する音圧の正常な人間のＥ偵である。スペクトル対数周波数あるいは座高状軸に沿ワて臨界帯域状重み付は関数をスライドすることに平滑化され、スペクトル・チルトあるいは“コーミング（＜シすき）″もまた対数周波数あるいは座高状領域て特定された高域通過リフタを平滑化されたスペクトルを通過させることにより除去される。得られた平滑包絡線は、最高スペクトル・ピーク以下の幾つかの一定デジベルの振れおよび聴取の閾値以下の振れを含む低レベルの振れを。これらは音声知覚には関係がないことから除去するために、整流（しわを伸ばすように調整）される。処理されたスペクトル包結線は鼻音波の存在、位置、強度を知るために試験される。幾つかの実施例ては、さらにスペクトル処理することによって除去することのてきる鼻音化の決定後、スペクトル包絡線は高周波数および低周波数のカットオフについて、および重要なスペクトルについて検査される。ステップ１２３ては、第６図の点線１２５によって示されたチルトは１周波数か１０倍高くなる毎にＣｄＢの割合て周、波数と共に増大するスペクトルに値を加えることによって上記のスペクトルから除去することがてきる。定数Ｃの値はスペクトルの直線回帰解析を使用することによって決定される。スペクトルからチルトを除去することによって、比較的平坦な形が得られる。この場合、エネルギの特徴はほぼ同じ振幅をもっているということである。チルトを除去するための高域通通りフタに対する値は次の（３）式から決定される。ＤＩ　＝　Ｃｘ　ｌｏｇ　Ｋ　（３）具体的に言えば、チルトを除去するために、デシベルで表わされたスペクトルの各Ｍの値（Ｍは例えば４０）は、１からＭの各Ｋに対して（３）式に従って計算された対応する値に加算される。これによって得られたスペクトルが第６図の包絡線１２７によって示されており１周波数が増加する方向の順序で３つのピークＰ１、Ｐ２．　Ｐ３をもっている。時間窓処理されたスピーチ波形の上述の短期間スペクトル解析により、スピーチ波形中の音色成分の振幅と周波数を識別し、同時にスピーチ波形中のすべての重要な非周期性エネルギあるいは他の未解決の高周波成分を生成する。この情報は、非周期性１周期性および混合されたセグメントを区別し、また周期性および混合されたセグメントの有効低周波数ＦＯあるいは低座高を設定するために使用される。この同し短期間スペクトル情報はさらに処理されて、感覚上の刺激パターン、聴覚−感覚スペクトル、あるいは聴覚スペクトル包絡線と呼ばれる聴覚スペクトル・パターンを発生する。有声座高はａ（ア）、ｅ（１）、ｉ（イ）、０（オ）、Ｕ（つ）のような母音の有声音声セグメントを識別する役割を果たす、スピーチの非周期的エネルギの検出は、ｈ、Ｐ、に、ｔのような気合の認識、ｓ、ｆ等の摩擦音の認識に極めて重要である。　ｚ、　ｚｈ、　ｖのような有声摩擦音は１周期的エネルギと非周期的エネルギの混合であり、声門音源と破裂−摩擦音スペクトルの双方の組合せである。第７図、第８図、第９図は異なる形式のスピーチ源に関連する異なる形式のスペクトルを示す包結線を示す。これらのスペクトルは第６図の包絡線１２７と比べた場合、異なる周波数で、異なる数の形の特徴、すなわちピークを持っている。異なる組のスピーチ・サンプルがＣＰＵＩによって処理されると、第４図のステップ１１１゜１２１　、１２３によって得られたスペクトルは明らかに広範囲にわたって変化する。比較的少数の変数でこれらのスペクトルを特徴ずけるために、各最新のスペクトルはステップ１３１で解析される。このステップて、これらのスペクトル周波数ＳＦＩ、ＳＦ２　、　ＳＦ３が計算される。スペクトル周波数ＳＦＩ　、　ＳＦ２、ＳＦ３は幾つかの場合は第６図におけるＰＩ、　Ｐ２、Ｐ３のようなピークが生ずる周波数で、これらを決定する方法については特に第１３Ａ図、１３Ｂ図によって後程さらに詳しく説明する。明確なより低い値ＳＦＩ　ｌとより高い値５ＦＩＨは鼻音が存在するときにＳＦＩに対して計算される。スペクトル周波数の基準ＳＲもまたスピーチの全体の一般的な音の高低（音質）を表わすために計算され、それによって高い音のズ子（音質）をもった声と低い音の調子（音質）をもった声は装置ｌによって容易に処理される。ステップ１３１ではまた聴覚の状態コートの数量ＢＦ、　ＧＳ、　ＮＳ。ＬＩＧＳ、　ＬＩＢＦ、　ＧＧＳ　、　ＧＢＦがスペクトルから決定される。次の判定ステップ１３３では、スピーチの良さの値ＧＧＳおよびＧＢＦが試験され、また大きさ指数値ＬＩＧＳおよびＬＩＢＦが試験され、もし正の値がなければ動作はステップ１３５に分岐する。ステップ１３５ては、ＣＰＵＩ中の１組のレジスタ（感覚上のポインタ座標Ｘ、、Ｙ、およびＺ、と称される１組の３座標に対応する）は座標が限定されていないことを示すコード“＊”てローディングされる。次のステップ１３７において、ｘ、、ｙ、、ｚ、に対するレジスタの内容は第１図のバファ２５を通ってＣＰｔ１２に送られる。判定ステップ１３３において、もしスピーチの良さが正であれば、感覚ポインタの座標値Ｘ、がＳＦ３　、　ＳＦ２の比の対数値に等しくセットされ、ポインタ値Ｙ、が５ＦＩＬとＳＲの比の対数値に等しくセットされ、ポインタの値Ｚ、がＳＦ２と５ＦＩＨの比の対数値に等しくセットされるステップ１４３へ動作か進み、それからステップ１３７へ到達する。有声摩擦音におけるように声門音源と破裂−摩擦音スペクトルが同時に存在するときを除いてステップ１４３の式は１回計算され、そして上記の場合はステップ１４３は声門音源スペクトルに対するポインタの座標Ｘ□、Ｙｌｌ、Ｚ□、および破裂−摩擦音スペクトルに対するＸ　ｂｒ、　Ｙ　ｂｒ、　Ｚ　ｂｙを計算するためにステップ１４３は２回計算される。ステップ１３７において、感覚ポインタ座標値Ｘ１、Ｙ、およびＺ、がＣＰＵ２に送られた後、聴覚状態コード数量ＢＦ、　ＧＳ、　ＮＳ、　ＬＩＧＳ、　ＬＩＢＦ、　ＧＧＳおよびＧＢＦまたはステップ１４５においてバッファ２５を経てＣＰＵ２に送られる。ステップ１４７において、オン−オフ・スイッチがオン状態にあるか否かの判定が行なわれ、もしオンでなければ終了１４９において動作は終了する０通常の状態におけるようにもしスイッチがオンであると、動作はステップ１０５に戻り、次のスペクトルを得てそれを解析し、前述のように情報をＣＰＵ２に送る。このようにして、ＣＰＵＩはリアルタイムで到達するスピーチのサンプルについてのスペクトル情報を得るために連続的に動作を実行する。第５図に示すように、何時いかなる時でも聴覚的スペクトル・パターンは対数周波数に対するｄＢ（音あるいは感覚レベル、あるいはそれに相当する）の形て聴覚包絡線によって与えられる。この包ｋＰＩｍを適当に処理した後、ＳＲ，ＳＦＩ　、　ＳＦ２　、　ＳＦ３の周波数値はスピーチの母音の部分に対して見出される。母音の部分は１通常は声門における音響源から得られたセグメントあるいはスペクトル成分て、外界への伝送路として鼻声管を伴なうかあるいは伴なうことなく声帯管をもっている。従って、周期的スペクトルを持った有声音スピーチ、および非周期的スペクトルを持ったささやきあるいは気合はスピーチの母音成分てあり、ここでは声門音源（ＣＳ）スペクトルと呼ばれるスペクトルをもっている。母音セグメントの存在の１つのサインは有声管の第１の共振に関連することのてきる低周波数成分（Ｐｌ）である。スピーチの母音部分の感覚ポインタは第４図のステップ１４３内で計算された数学的空間内、あるいは発声学的に関連する聴覚−知覚空間内の位置をもっている。このポインタは声門音源感費ポインタ（ｃｓｓｐ）と呼ばれている６通常ＳＦＩ　、　ＳＦ２　、３Ｆ３は第６図の聴覚スペクトル包絡線１２７内の最初の３つのスペクトル成分の中心周波数である。しかしながら、時には、ピークＰ２とＰ３か軟ロ蓋音セグメント期間中に合併し、あるいはＰ３が存在しないときＳＲ全全体わたる一定の対数距離として扱われる場合のように、ＳＦ３がはっきりとしたピークＰ３が観察されない時のスペクトル包結線の上側端縁として解釈されることがある。一般にスペクトル周波数ＳＦＩは声道の第１の重要な共振の中心周波数に対応している。しかしながら、鼻音化期間中は２つのピークあるいは１つの広帯域化ビークが第９図および第８図にそれぞれ示すように第１の重要な共振の近くで現われる。第４図のこのようなスペクトル変化ステップ１３１および１４３を注意することは、鼻音化スペクトルに対して他のスペクトルとは異った感覚ポインタ位置を計算するのに充分に柔軟性をもたせることがてきる。第９１２Ｉの包結線によって示されるスペクトルの他の重要な階級のものには、第６図のピークＰ１の領域に重要な成分がない、換言すれば、第６図の３つの成分の後の２つはこの階級のスペクトル中の第１の成分なしに生ずる可能性がある。このようなスペクトルは破裂音および持続摩擦音に伴っており、話者か声門上部の音源で発声するものである。これには例えば舌が軟口蓋、口蓋、あるいは歯に接触するかこれらに接近して発声される場合や歯と唇自身て発声される場合がある。これらのスペクトルはここては破裂−摩擦音（ＢＦ）スペクトルを称す、　ＢＦスペクトルはｃｐｕｉによって６８スペクトルとは相違して解析されてスペクトル周波数値ＳＦＩ　、　ＳＦ２およびＳＦ３　、感覚基準値ＳＲが生成され、また、第４図のステップ１４３て計算された得られた感覚ポインタ値の位置は一般にＸ、、Ｚ、面内にある。これらのポインタ値は、ｃｓｓｐとは区別される破裂−摩擦音感覚ポインタ（ＢＦＳＰ）と称されるポインタの位置を特定するものと考えられる。入力スピーチ第４図のステップ１３１で解析されると。声門音源スペクトルが聴覚閾値以上にあるときは常に聴覚状態コード中で１にセットされる。　ＳＲ，ＳＦＩ　、　ＳＦ２およびＳＦ３の値が変化したとき、ｃｓｓｐは数学的空間、あるいは聴覚−知覚空間を通して動くと考えられる。　ｃｓｓｐの径路は無音によって、および破裂−摩擦音スペクトルによりて中断される０次いて、聴覚状態コードでＧＳ値は０にセットされ、ＢＦ値は１にセットされる。このような場合、Ｇ５５ＰはＢＦＳＰに置換えられる。声門音源スペクトルが形を変えたとき、　ｃｓｓｐは数学的空間を通って動くと考えることがてき、時にはこのような動きは、例えば“Ｗｈｅｒｅ　ｗｅｒｅ　ｙｏｕ　ａ　ｙｅａｒ　ａｇｏ　？　（１午前貴方は何処にいましたか）”という文章の場合、殆ど連続的に存在する。この場合、唯一の中断は“Ａｇｏ”中の“ｇ″の摩擦−破裂音中に生ずる。換言すれば、聴覚状態コード中の数値ＧＳは、各種のスピーチの多くのスペクトルを通じてｌの値に留まっているが、ｌにセットされた聴覚状態コート中の数値ＢＦは通常極めて単時間後に０にリセットされる。というのは、破裂−摩擦音形式てはないスペクトルがすぐ後に生ずるからである。数学的空間に関しては、破裂−摩擦音感覚ポインタＢＦＳＰは、一般に摩擦音がスピーチ系中に挿入された短時間後に現われ、消滅する。破裂−摩擦音スペクトルが安定していないとき、ＢＦＳＰはかなり大きなジッタを呈し、通常は数学的空間内で滑らかな且つ連続した形態では動かない。数値ＧＳが０のときは聴覚状態コートの数値ＢＦはしばしばｌであり、逆もまた真である。しかしながら有声摩擦音の場合には、　ＢＦおよびＧＳは共に同時に１になる。数学的空間に関しては、感覚ポインタの双方が同時に存在し、一方は有声摩擦スピーチ音の有声部分の声門音源に関連しており、他方は音の摩擦部分の破裂−摩擦スペクトルに関連している。ＣＰＵＩはＧＳおよびＢＦスペクトルに対する聴覚状態コード中の良さの値および大きさの値を計算する。スピーチの良さは、最新のスペクトルによって表わされる音がスピーチの音に似ている程度の測定された値であり、また所定のスピーチ音に対する理想的なスペクトルとその音の最新の実際のスペクトルとの間の相互相関と見做すことがてきる。相互相関それ自体の計算はコンピュータに対して大きな負荷をかけるので、良さの値は好ましい実施例ては！＋！１算される。第１θ図に示すように、実際のスペクトルか非常に狭いピーク１７１　、１７３および１７５として現われる２〜３の音色からなるときスピーチの良さは低い、またスペクトルが包絡線１７７におけるように小さなこぶ状ピークをもった非常に広い帯域のものであるときも良さの値は低い。これに対して、はっきりとしてしかも適当に広い成分１８１　、１８：ｌ　、　１８５を有し、これら成分相互間にはっきりとした谷間のある高忠実度の注意深く生成された自然なスピーチに対しては良さの値は高い。Ｆ２に示すように、例えば、周波数スペクトル中の少なくとも１個のピークの幅が何時予め定められた範囲内にあるかを決定することによって良さの値か概算される。上記の幅は、デシベルで表わされるＤＦＴ値かピークの最大デシベル値よりも低い少なくとも予め定められたデシベル値（例えば１ｓｄＢ）にあるピークの中心周波数よりも低い周波数と高い周波数の最も接近した２つの周波数の、差として定義される。計算に１以上のピークか用いられるときは、平均あるいは重みの付けられた平均ピーク幅が適当に決定される。従って、第１１図に示すように、幅が範囲外にあると良さの値は０にセ・ントされる０幅が範囲内にあるときの良さの値は、３角形の関数１９１になり、最良の幅の値におけるピーク値はｌであり、図示のように最良の値の両側に直線的に減少して、０の幅てその値が０．２５になり、範囲の上限でＯの値になっている。良さの指数は、少なくとも１つ（好ましくは全部）の特徴すなわちピーク幅内のスペクトルの線のデシベル値の合計（すなわち全パワー）から概算される。この場合、幅は上のバラグラフで述べたように定義される。第１２図のグラフに示すように、このデシベル和は聴取りの閾値を表わす偵Ｔと比較されて、もし和がＴ以下であれば大きさ指数りは０である。デシベル和は毎日の通常のスピーチに関して充分な大きさを表わす値Ｕと比較されて、もし和がＵを越えると、大きさの指数りは１になる。レベルＴとＵとの間てデシベル和は次の関数によって大きさの指数りに変換される。Ｌ　−（ｄＢ　Ｓ、、　−Ｔ）／（Ｕ　−Ｔ）　（４）第４図のステップ１３１中の各スペクトルを解析するに当ってＣＰＵて実行される動作を第１３Ａ図、第１３Ｂ図を参照して順次説明する。 “開始２０１″後、ステップ２０３でＣＰＵはスペクトルの最大値ＭＡＸ　、すなわち最も高いピークを発見する。これは例えば予め定められた閾値デシベル・レベルよりも小さいすべてのスペクトル値を最初０にセットすることによって行なわれ、そのため、低音レベル、ノイズおよび無音の期間は明らかなピークをもたない、もし存在すれば、非０値のままにあるものをチェックして、値ＭＡＸを発見するためにそれらの間の最大値を見つける。ステップ２０５で大きさしは第１２図に関して前に説明したように計算される０次にステップ２０７において、最大値ＭＡＸから１５ｄＢの値を減算して基準レベルＲＥＦを生成する０次のステップ２０９において、レベルＲＥＦはＤＦＴスペクトル中のＭの値のすべてから減算され、得られたすべての負の値はスペクトルを規格化するためにＯにセットされ、それによって基準線はＯｄＢになって、基準値以下に低下するスペクトル値はすべてＯｄＢにセットされる。動作のこの点におけるスペクトルの値は規格化されたスペクトル値を称され、第６図のＲＦＥと示された水平の点線より上にある包絡線１２７の部分によって表わされている。ステップ２０９に統〈ステップ２１１において、基本周波数が座高抽出算法にによって見出され、この基本周波数はスペクトル周波数ＳＦＯとして記憶される。上記の算法は、［ジャーナル　アコウスティック　ソサイエテイアメリカ（Ｊｏｕｒｎａｌ　Ａｃｏｕｓｔｉｃ　５ｏｃｉｅｔｙ　Ａｍｅｒｉｃａ）Ｊ　７４゜１９７６−２５　（第６図）に示されているシエファース、エム・エイ・エム（Ｓｃｈｅｆｆｅｒｓ、Ｍ４−Ｍ）　（１９８３）の論文「座高の聴覚的解析のシミュレーション、　ＯＷＳ声高座高タの生成（Ｓｉｍｕｌａｔｉｏｎ　ｏｆ　ａｕｄｉｔｏｒｙ　ａｎａｌｙｓｉｓ　ｏｆ　ｐｉｔｃｈ；　Ａｎｅｌａｂｏｒａｔｉｏｎ　ｏｆ　ｔｈｅ　ＤＷＳ　ｐｉｔｃｈ　ｍｅｔｅｒ）　Ｊに示されている。次にもしスペクトルが第８図の下に示すように声門音源スペクトルであると、そのスペクトルは３つの周波数帯Ｂ１．　Ｂ２、Ｂ３の各々で解析され、そうでなければ第９図の下に示すように異なる数値限界をもって２つの周波数帯Ｂ２およびＢ３て解析される。これらの周波数帯はＰＩ。Ｐ２、Ｐ３のピークを弁別するための方法として使用され、各帯域を特定するために選択された周波数値は各種の話し声によって最良の結果が得られるように調整される。判定ステップ２１３において、ｃｐｕｉは、　Ｏ，ａＯより小さいか、あるいはこれに等しいＩＯｇ＋ｏ　（ｆ／　ＳＲ）より小さいか、あるいはこれに等しい０と定義される正の規格化されたスペクトル値か帯域Ｂｌ内にあるか否かを判定する。ここで、ＳＲはスペクトル基準てあり、ｆはＨｚで表わされる周波数である。もしこのような正の規格化されたスペクトル値が存在しなければ、スペクトルは破裂−摩擦音スペクトル（これはまた無音の期間であるかも知れないが）であると結論づけられ、ステップ２１５に分岐し、ここでＢＦは聴覚状態コードの１にセットされ、より高いスペクトル値およびより高いスペクトル値５ＦＩＬ、　５ＦＩＨは共にＳＲに等しくセットされる。破裂−摩擦音の太き、さ指数ＬＩＢＦはステップ２０５で計算された大きさしに等し・くセットされる。（無音期間中は、大きさは０で、１に等ｉしいＢＦをもっている場合に次の動作に障害はない）０周波数帯Ｂ２は、１．４５より小さいかこれに等しい１０ｇ＋ｏ　（ｆ／　ＳＲ）より小さいか、あるいはこれに等しい０．６として４設定９され２周波数帯Ｂ３は１．６５より小さいかこれに等し□い“ＬＯ，’ｇ、＋　、。（ｆ／ＳＲ）より小さいか、あるいはこれに等しい１．０として設定される。一方、ステップ２１３において、帯域Ｂ１で正の規格化されたスペクトル値が存在すれば、動作はステップ２１７に進み、そこで最初に規格化されたスペクトル値が発見され、それにＫの次に高い値における低い規格化されたスペクトル値が後続するまでＣＰＵＩは周波数の倍数Ｋに対応するアドレスの値が増加する順序で規格化されたスペクトル値を走査する。最初の修正されたスペクトル値は周波数帯Ｂｌにおける最も低い周波数のピークと考えられ、スペクトル周波数値ＳＦＩ　、　５ＦＩＬはこのピークの周波数を表わすＫに等しい値にセットされる。またステップ２１７において声門音源の数値ＧＳは聴覚状態コードで１にセットされる。声門音源の大きさ指数ＬＩＧＳはステップ２０５で計算された大きさしに等しい値にセットされる０周波数帯Ｂ２は１．１８より小さいかこれに等しいｌｏｇ、。（ｆ／　ＳＲ）より小さいか、あるいはこれに等しい０．６として設定され、周波数帯Ｂ３は１．３０より小さいかこれに等しい１０ｇ１゜（ｆ／ＳＲ）より小さいか、あるいはこれに等しい１．０として設定される。ステップ２１７に続く判定ステップ２１９において１周波数８１における５ＦＩＬより高い周波数で第２のピークがあるか否かを判定する。もし存在すれば動作はステップ２２１１に分岐し、ここで鼻音性ＮＳは聴覚コード１にセットされ、さらにステ・ツブ２２３に進み、ここで第２のピークの周波数が決定されて位置５ＦＩＨに記憶される。判定ステップ２１９で、帯域Ｂｌ中で第２のピークが発見されなければ、動作は他の判定ステップ２２５に進み、ここてピークの幅は予め定められたＷｔ（例えば１０ｄＢ低下で３００１（ｚ　）と比較され、そのピークがもし鼻音性がないとした場合の代表的なＧＳのピークより広いかどうかを判定する。もし予め定められた幅を超過すると、ステップ　２２７に分岐し、ここで鼻音性ＮＳが１にセットされる。またステップ２２７において、鼻音によって広くされたＰ１ピークの端縁はより低い周波数５ＦＬＬをＳＦＯにセットし、より高い周波数５ＦＩＨをＰ１ビークの上側端における周波数にセットすることによって特定され、ここて規格化されたスペクトル値は再びにＯになる。しかしながら、ステップ２２５において予め定められた幅Ｗ１を超過しなければ、動作はステップ２２９に進み、ここて値５ＦＩ）ｌは５ＦＩＬに等しくセットされる。なぜならＰ１ピークのみか存在し、鼻音性は存在しないからである。ＣＰＵＩ（７）動作は第１３Ａ図ノステップ２１５　、２２３　、２２７あるいは２２９のいずれかから点Ｘを通って第１３Ｂ図の判定ステップ２３１に進む、ステップ２３１において、ＣＰＵＩは規格化されたスペクトル値を試験して、値５ＦＩＨを持つピークより上の帯域Ｈｚ中にピークＰ２があるかどうかを判定する。帯域Ｂ２はスペクトルＢＦあるいはＧＳの性質に調和するように既に設定されている。　５ＦＩＩ（か帯域Ｂ２中にあれば、値５ＦＩＨ以上の試験か開始され、捜し出されたピークが先に発見されたピークと混同するのを防止する。もしピークＰ２か存在すれば、動作はステップ２３３に進み、ここて、第２のスペクトル周波数値ＳＦ２は、帯域Ｂ２中の周波数５ＦＩＨより上の第１のピークの周波数にの値にセットされる。そして判定ステップ２３７に到達する。ステップ２３１てピークが発見されなければ、動作はステップ２３１から判定ステップ２３８に分岐し、ここて５ＦＩＨの値が試験されて、それが帯域Ｂ２内にあるかどうかを判定する。もし存在しなければ、動作はステップ２３９に分岐し、ここで値ＳＦ２は５ＦＩＨに等しくセットされ、５ＦＩＨは影響を受けない、ここて動作はステップ２３７に到達する０判定ステップ２３８において５ＦＩＨの値が帯域Ｂ２内にあると、動作はステップ２４０に進み、ここで値ＳＦ２は５ＦＩＨに等しくセットされる。また、ステップ２４０で５ＦＩＨは値５ＦＩＬに等しくセットされ、また結局のところ鼻音性が存在するとは認められないことから、鼻音性ＮＳは０にリセットされる。ここで動作はステップ２４０からステップ２３７へ戻る。このようにデジタル形式のサンプルからスピーチの周波数スペクトルを表わす１組のデジタル値を引出す手段が設けられており、スペクトル中の１あるいはそれ以上の周波数のピークの周波数の値をメモリの別々の位置に選択的に記憶させる。この場合、所定のピークの周波数の値が記憶されるｌあるいはそれ以上の選択された個々のメモリ位置は、ピークが周波数の第１の予め定められた帯域にあるか否か、および他の任意のピークが第１の帯域とこの第１の帯域と重畳する第２の帯域の双方に存在するか否かに基いており、周波数の記憶された値および周波数の記憶された値の個々の位置の双方に依存する数学的空間の座標値に相当する１組のデジタル値を発生する。さらに第２の帯域とこの第２の帯域とオーバーラツプする第３の帯域の双方の帯域に対する端部周波数を選択するための手段が設けられており、この選択された値はピークが第１の予め定められた周波数帯域にあるか否かに依存している。さらに、この方法では第２の帯域とこの第２の帯域とオーバーラツプする第３の帯域の双方に対する端部周波数の値を判定し、ピークの１つが第３帯域中にあるピークのみか、また第２帯域と第３帯域の双方にあるか否かを決定し、もしそうであれば上記１つのピークの上側周波数帯に対応する他の周波数の値を各別の位置の１つに記憶させる手段が設けられている。他の特徴として、ピークの１つが一般に第２の帯域よりも高く、しかもこの第２の帯域とオーバーラツプする一般により高い周波数の第３帯域にあるか否かを判定し、各別の位置の１つに他の周波数値を記憶させる手段が設けられている。他の周波数値は第３の帯域にあり、スペクトルの少なくとも２つから決定された基準周波数値の関数となる。また、より低い第１の周波数として予め定められた第１の周波数奇中の任意の最も低い周波数を記憶し、より高い第１の周波数として第１の帯域中の任意の次に高い周波数ビークの周波数の値を記憶し、また第２の周波数として、もしより高い第１の周波数がまた第２の帯域にあれば上記より高い第１の周波数よりも高い第２の周波数帯域中の任意のピークの周波数の値を記憶させ、さらにそれか第２の帯域にあるときより高い第１の周波数よりも高い周波数の第２の周波数帯にピークがなければ。第２の周波数として最初より高い第１の周波数として記憶された周波数の値を記憶させ、より高い第１の周波数としてより低い第１の周波数として記憶された周波数の値を記憶させる手段が設けられている。また少なくとも１つの鼻声性の発生時に広域化されあるいは分割されたピークを表わすより低いおよび高い第１の周波数を識別し、鼻声性の発生を表わす信号を生成するための手段が設けられている。ステップ２３７ては、ＣＰ旧は増加する周波数にの値にわたって規格化されたスペクトル値を試験し、帯域Ｂ３中の値ＳＦ２を有する任意のピークより上のピークＰ３が存在するか否かを判定する。帯域Ｂ３は既にスペクトルのＢＦまたはＧＳの特性に一致するように設定されている。　ＳＦ２が帯］Ｂ３中にあれば、値ＳＦ２以上て試験か開始され、探索されたピークか先に発見された任意のピークＰ２と混同するのを防止している。ピークＰ３が発見されると、動作はステップ２４１に進み、第３スペクトルの周波数値ＳＦ３が帯域Ｂ３中の周波数ＳＦ２以上の第１のピークの周波数にの値にセットされる。次にステップ２４３において、上に述べた方法で第１１図の関数を使ってピークＰ２およびＰ３の双方の幅の重み付けられた平均に基いてステップ２３４からのスピーチの良さが計算され、　ＳＲに対する計算ステップ２４５に達する。ステップ２３７でＰ３ピークが発見されなければ、動作はステップ２４７に分岐して、そこでスペクトル周波数ＳＦ２が帯域Ｂ３にあるかどうかを判定するために上記スペクトル周波数ＳＦ２が試験される。もし帯域Ｂ３にあれば、動作はステップ２４９に進み、そこてＳＦ３はスペクトル包結線の上側端にセットされ、次いでステップ２４３に達する。もしＳＦ２が帯域Ｂ３になければ、動作はステップ２５１に分岐し、そこて値ＳＦ３は基準値ＳＲに１０’・１６を乗じた値に等しい値にセットされ１次いでステップ２４３に達する。ステップ２４５で、もしスペクトルがＧＳスペクトルであり、ＳＦＯが０より大きければ、スペクトル基準値ＳＲは例えばステップ２１１で決定された第１の非Ｏスペクトル値ＳＦＯの周波数に等しくセットされる。ステップ２４５に対する値ＳＲのさらに精巧な別の計算法を第１４図を参照してさらに詳細に説明する。ステップ２４５の後、動作は“復帰（リターン）２５７”に進む。第１４図て、ＣＰ旧はスペクトル基準値ＳＲを自動的に計算する（第１３Ｂ図のステップ２４５　）　、値ＳＲは、成人集団全体にわたるＳＦＯの相乗平均（約１６８　）１ｚ）によって、現在の話者の声高の相乗平均によって、また声高の偏差に付帯する変化のようなゆっくりとした声高の変化を除去し且つ音声のオンセットおよびオフセット時の極めて急速な変化を除去するように濾波された現在の話者の声高の抑揚によって影響されるように特定される。特に、ＳＲ−（Ｋｌ）　（ＧＭＴＦＯ／Ｋｌ）”◆ＦＩＬ（ＳＦＯｉ）　（５）ここで、　Ｋｌは約１６８の定数、ＧＭＴＰＯは現在の話者の声高の相乗平均値、ａは約１／３に等しい定数、　ＦＩＬ（ＳＦＯｉ）はＧＳスペクトルに対する話者のＳＦＯの濾波された抑揚の瞬時値である。これらのパラメータは話者全体についてのＹ、＝　ｌｏｇ、。（５ＦＩＬ／ＳＲ）定数の平均値をとるように選択されており、これによって話者相互間の差を除去し。また感覚ポインタの位置に影響を与え、音声学的な重要度を持つと信じられている上記ＳＦＯの抑揚を許容するように選択されている。約１．５　Ｈｚと５０Ｈｚとの間の座高抑揚のみがソフトウェア帯域通過フィルタによって通過させられる。さらに正確に言えば、声高の偏差のゆワ〈りとした変化および声高のオンセットおよびオフセット時の極めて急速な変化が効果的に除去されるようにフィルタの帯域幅の値が選択されている。第１４図で動作“開始３０１″で開始され、判定ステップ３０９に進む。この判定ステップでスペクトルが周期性成分を含むか否かを判定するために上記スペクトルが試験される。この試験は、例えば［アイ・イー・イー・イートランザクションズ　アコウスティック　スピーチシグナル　プロセシング（ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ＡｃｏｕｓｔｉｃＳｐｅｅｃｂ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ）　Ｊ　、　１９８２．　Ａｓ５ｐ−３０、第４５１乃至第４６０頁に掲載されたシーゲル氏（Ｌ、Ｊ。Ｓｉｅｇｅｌ）他の論文「スピーチの有声／無声／混合刺激の分類（Ｖｏｉｃｅｄ　／　ｕｎｖｏｉｃｅｄ／　ｍ１ｘｅｄ　ｅｘｃｉｔａｔｉｏｎ　ｃｌａｓｓｉ−ｆｉｃａｔｉｏｎ　ｏｆ　５ｐｅｅｃｈ）　Ｊに示されているスペクトル解析のような任意の適当な処理によって実行される。もし周期性成分がなければ、動作はステップ３０９から直接“リターン３１１”に進む、もしＧＳが１であると、ステップ３１５て次の式に従ワてＳＨの値の再計算が開始される。ＧＭＴＦＯ＝　ＥＸＰ　（（Ｉｎ　ＳＦＯ十Ｎ２　Ｉｎ　ＧＭＴＦＯ）／（８２＋１）＞　（Ｅｉ＾）ＳＲ−１６８（ＧＭ丁ＦＯ／　１５８）ｌ／’　（６Ｂ）ここでＥＸＰは指数関数ｅＸてあり、１ｎは自然対数関数である。簡単に言えば、ＧＭＴＦＯはＳＦＯの最後のＮ２の値に基づくものであり、１６８　Ｈｚのその初期値から話者の声高へ徐々に適合させる。基準値ＳＲ（声高の抑揚に対して未だ調整されていない）が更新された相乗平均ＧＭＴＰＯからの実験式（６Ｂ）によって計算される。動作はステップ３１５からステップ３１９へ進む。ステップ３１９では、座高抑揚に対するソフトウェア帯域通過フィルタは、例えば声門音源形式の周期性スペクトルの値ＳＦＯの表を維持することによって構成されている。この表は、１．５　Ｈｚ乃至５ＯＨｚの間の周波数範囲の識別てきる任意の座高抑揚に対して解析される。最初０に初期化された値ＦＩＬは座高抑揚ソフトウェア・フィルタの出力から決定された座高抑揚の大きさに伴って更新される。第４図の動作を通る各通路がステップ２４５をアクセスし、それによって声門音源スピーチ音が進行中であるとき、表は規則的に加算された記載事項をもっている。ステップ３１９の後、ＳＲの値はＦＩＬの値によってステップ３２１て増加する６次いで、リターン３１１に到達する。このようにしてＣＰＨは、少なくとも２個のスペクトルから決定された周波数値（例えばＳＦＯの値）の関数である基準周波数値の関数として、第１の指定された座標値（例えば感覚ポインタの値）の組における値の少なくとも１つで計算するための手段を構成している。　ｃｐｕｉはまた時間全体にわたって少なくとも幾つかの声門音源スペクトルから決定された周波数値の相乗平均の関数である基準周波数値の関数として第１の指定された座標値の組の少なくとも１つの値で計算するための手段を構成している。　ＣＰＵＩはさらに（Ａ）スピーチの座高抑揚の周波数と、（Ｂ）時間全体にわたるスピーチのスペクトルの少なくとも幾つかから決定された周波数の平均の関数である基準周波数の関数としての第１の指定された座標値の組の値の少なくとも１つで計算するための手段を構成している。ＣＰＬＩＩを構成するために使用されるハードウェアにより、ｌあるいはそれ以上のプロセッサがＣＰＨについて説明した動作を実行するのに必要となる。動作を実行するのに単一のプロセッサで充分である場合は、第１図のＣＰＨと示されたブロックが単一のプロセッサを表わすものと考えられる。当業者か遅い形式のプロセッサを使用する場合は、このような幾つかのプロセッサを、同時に幾つかのスペクトルを計算し、スピーチ波形のリアルタイム解析を実行するために得られたスペクトルを解析するための多処理（マルチプロセシング）構成で使用すると考えられる。このような構成では、第１図のＡＤＣ２１からの線路２３に対して幾つかのプロセッサが多重化されており、それによってこれらのマイクロプロセッサは例えばオーバーラツプされた態様てＮ１サンプルのうちの最後の組を代わるがわる入力する。９個のマイクロプロセッサを使用すると、各マイクロプロセッサはＮ１サンプルのうちの各Ｐ番目の組のスペクトルのみの入力と計算を必要とする０次いでスペクトルはｌあるいはそれ以上の付加プロセッサに供給され、聴覚状態コードおよび感覚ポインタ値Ｘ、、Ｙ、およびＺ、を解析し、出力する。第１５図で、感覚座標から知覚座標へ変換するためのＣＰＵＩ２の動作の流れが詳細に示されている。この処理において、ベクトル差分方程式、あるいはそれぞれの座標に対する３つの差分方程式の組は、ループを連続して実行することによって点ごとにＣＰｔ１２によって解かれる。差分方程式は以下に述べる３つの微分式の数値計算の形のものである。差分方程式を解くことは、感覚−知覚変換、あるいは統合的予測関数として感覚座標から知覚座標への変換と考えることかてきる。感覚−知覚変換の基本概念は、第１５図に示すような感覚ポインタｃｓｓｐおよびＢＦＳＰが３次元数学的空間内て、あるいは互いに直角な３軸ｘ、ｙ、ｚによって指定される座標系を有する聴覚−知覚空間て知覚ポインタＰＰを吸引し、知覚ポインタを聴覚−知覚空間を通って移動させ、また知覚径路を描かせることである。知覚ポインタＰＰは座標値ｘ、、ｙ、、ｚ、をもっている。知覚ポインタＰＰは殆ど瞬間的であり、すなわち数ミリ秒内てあり、感覚ポインタｃｓｓｐおよびＢＦＳＰの加算された大きさを呈する。しかしながら、感覚ポインタがなくなると、知覚ポインタの大きさは１００乃至２００ミリ秒の周期にわたってゆっくりと減衰する。このようにして、知覚的応答は音響入力の短期間の無声期間中維持される。感覚ポインタと同様に知覚ポインタは何時ても聴覚状態を持つと考えられ、これについて知覚的聴覚状態コートが計算される。知覚ポインタの聴覚状態コートは、ある長さの時間が状態の切換えのために必要とされることを除けば感覚ポインタの状態コードと整合している０例えば、もし感覚ポインタと知覚ポインタの双方が摩擦音状８（ＢＦ）にあれば、感覚ポインタは突然に有声、鼻音状ｇ（ｃｓ　−１、ＮＳ　＝　０）に切換わり、知覚ポインタが新しい状態に切換わる前にある時間を必要とする。また、中立点ＮＰＧＳおよびＮＰＢＦと称される固定されたポインタは感覚ポインタの不存在時に知覚ポインタＰＰの動きに影響を与える。少なくとも１個の中心点を使用すると、長期間の無音状態が生じたときに知覚ポインタに対するホーム位置を与えるという効果がある。このような無音の期間中、中立点ＮＰＧＳからの吸引力により知覚ポインタＰＰをその中立点に向けて移動させる。さらに、少なくとも１個の中立点を使用すると、人間のスピーチの感知と同じ態様て音声学的に適切な方法て、装置がはっきりと同じ無音期間を分析できるようにする０例えば、話者か“Ｓ”を発音し、それに続いて短期間の無音と。それに統〈“ｌｉｔ”を発音したとき、多くの聴者は５ｐｌｉｔ”を聴取る。第１６図で、ＢＦが既にＯであると、　ＧＳが聴覚状態コードてｌから０に変化すると直ちに中立点ＮＰＧＳは知覚ポインタを吸引する。ＮＰＧＳによる吸引は、無音期間が統〈限り続き、中立点ＮＰＢＦはポインタＰＰを全く吸引しない。一方、ＧＳがすてにＯで、聴覚状態コートでＢＦが１で、モして０に変化すると、上記ＢＦが１からＯに変化すると直ちに中立点ＮＰＢＦは知覚ポインタを吸引する。ＮＰＢＦによる吸引は約１２０ミリ秒続き、１２０ミリ秒・の終了時に、ＧＳあるいはＢＦのいずれかが再びｌになるまでの無音期間の残りの期間中継続する中立点ＮＰＧＳからの吸引と置換される。感覚ポインタｃｓｓｐおよびＢＦＳＰは、質量と慣性を持つと考えられる知覚ポインタＰＰにスプリングによって吸引されていると考えられる。スプリングの強さはその関連する感覚ポインタの良さの値と大きさの値に依存している。このようにして、スピーチに殆ど似ていない近間値スペクトルは知覚的応答に殆ど影響を与えないか、適度の大きさのスピーチに類似したスペクトルは知覚的応答に強い影響を与える。感覚ポインタあるいは中立ポインタの吸引力は知覚ポインタＰＰからの距離の増加と共に大きくなることから、スプリングとの類似性が使用される。しかしながら物理的な系と違って感覚ポインタあるいは中立点の位置はスプリングによる影響を受けず、すべての力は知覚ポインタＰＰ上に作用する。さらに、聴覚−知覚空間は粘性媒体であると考えられ、また知覚ポインタは速度に伴なう変化のみならず顕著な方法で知覚ポインタの位置と共に変化する抵抗を受ける。感覚−知覚変換について特定の数学的モデルを説明したが、聴覚的感知処理についての別の実験的情報が得られるときは当業者はこの発明の実施に当って上記の数学的モデルを変更することがてきる。上述の概念は、感覚−知覚変換を行なうためにＣＰＵ２によって解かれる差分方程式による数学的な形で説明したものである。別の見方ては、差分方程式を、指数化した座標値である変数の項で表わすことができる。第１６図の感覚ポインタは、第４図のステップ１４３で周波数比の対数関数の形て表わされる座標をもっているのて、第１６図の数学的空間をここでは対数空間と呼ぶことにする。座標か差分方程式で指数化されるので、周波数比のみか残り、“死空間”の表現はここては差分方程式が表現される領域を表わすために使用されている。幾つかの実施例ては、比自体を回復するためにＣＰＵＺ中て引続いて指数化するのを避けるために、第４図のステップ１４３ては非対数が計算される。しかしながら、ＣＰＵ３による後続する解析は対数空間で行なわれる。次のチャートは死空間と対数空間における変数に対する用語の一覧表を示す。対数空間から死空間への変換式％式％知覚ポインタ座標ＸＲＰ　−１０×ｐＸ、　Ｘ、＝　ＰＦ３／ＰＦ２ＹＲＰ　−１０Ｙ１１Ｙ、　Ｙ、＝　ＰＦＩＬ／ＰＲＺＲＰ　−１０ＺｐＺ、　Ｚ、＝　ＰＥ２／ＰＦＩＨここで、０．１あるいは２の適用可能な数値サフィックスは、異なる時間における同じ変数に対する値を示すためにＸＲＰ　、　ＹＲＰ　、　ＺＲＰ　、　Ｘ、　、　Ｙ、およびｚ、に付される。破裂−摩擦音感覚ポインタＢＦＳＰ座標ＸＲ３ＢＦ　−１０””’　Ｘ−ＢｒＹＲ３ＢＦ　＝　１０”″”　ＹＩＩＢＦＺＲ３ＢＦ　＝　１０””　Ｚ−ｓｒ声門音源ポインタＧ５５Ｐ座標ＸＲ３Ｇ５　＝　１０””　Ｘ、ｃｓＹＲ８ＧＳ　＝　１０”ＧＳＹ、ａｓＺＲ３ＧＳ　−１０”ｌｌ＋ｓＺ、ａｓ破裂−摩擦音中立点（ＮＰＢＦ）座標ＸＲＮＢＦ　＝　１０×”’　Ｌａｒ　ＸＮａｒ　”　０．５ＹＲＮＢＦ　＝　１０ＹＮ”　Ｙ、、ａｒ　ＹＮ！ＩＦ　−０ＺＲＮＢＦ　＝　１０２”’　ＺＮＢＦ　ＺＮＢＦ　−０，６声門音源中立点（ＧＳＳＰ）座標ＸＲＮＧＳ−１０””　Ｌａｓ　ＸＮＧ５−０．４ＹＲＮＧＳ　＝　１０ＹＮａＳＹＮａｓ　Ｙｘａｓ　”　０．４ＺＲＮＧＳ　＝　１０２”５ＺＮＧＳ　Ｌｃｓ　−０，４ＣＰ旧およびＣＰＵ２は一緒にそれぞれ連続する時間間隔で生ずるスピーチの周波数スペクトルから数学的空間での径路上の点の一連の座標値を電気的に引出す。第１５図において、ＣＰＵ２の動作は“開始４０１”で馴始し、ステップ４０３に進んで比重間における座標の組ＸＲＰ、ＹＲＰ　、　ＺＲＰ　（７）組に対して２個の３組の初期値ＸＲＰＯ１ＹＲＰＯ１ＺＲＰＯ１ＸＲＰ１．　ＹＲＰｌ、　ＺＲＰＩをもッテ第１ＳＡ図の表４０５を初期化する０表４０５において、行の０（変数のサフィックス０）は時間的に最も早いと考えられ、行の１は時間的に次で、行の２は時間的に最も遅いと考えられ、解決されるべきものである。初期位置の座標は行０て、　１０を中立点ポインタＮＰＧＳの各座標の値て幕乗したもの、すなわち１０°４である。比重間および対数空間の双方て初期速度はＯであると仮定され、そのため初期位置に変化はないから行１のすべての入力もまた１ｏ０４である。次ぎのステップ４０７で、　ＣＰＵ２はＢＦ感覚ポインタ、あるいはＧＳ感覚ポインタのいずれか、あるいはその双方に対する感覚ポインタ値Ｘ、、Ｙ、、Ｚ、、およびｃＰ旧から聴覚状態コート値ＢＦ、　ＧＳ、　ＬＩＢＦ、　ＬＩＧＳ、　ＧＢＦ　、　ＧＧＳ　ｇＪ：びＮＳを読取る。次いで計算ステップ４１３が開始し、ここて比重間における感覚ポインタ値を含む差分方程式を解いて、数学的空間における径路上の次の一連の座標値ｘ、、ｙ、、ｚ、を得る。さらに詳しく言えば、差分方程式は表４０５の行２に対する入力に対して解かれて１次いで行２における入力の対数が計算され、対数空間における知覚ポインタ座標ｘ、、ｙｐ、ｚｐが得られる。知覚ポインタ座標ｘ、、ｙ、、ｚ、は、径路が知覚的な意義をもった第１６図の数学的空間における径路を追跡する。次にステップ４１３で解かれる差分方程式について説明する。知覚ポインタＰＰの位置ベクトル（ＸＲＰ、　ＹＲＰ　、　ＺＲＰ）の各比重間成分についての微分方程式はポインタの質量にその加速度（比重間位置の２次導関数）を乗じたものと、速度（比重間位置の１次導関数）の関数としての粘性抵抗と、スプリングを通して作用する感覚ポインタと中立点による力との和が０であると書くことができる。ＣＰＵ２によって差分方程式を数値的に解くには、表４０５の行０と１とによって表わされる２個のすぐ先行する時間間隔からの座標ＸＲＰ　、　ＹＲＰ　、　ＺＲＰの値と比重間における聴覚状態コードおよび感覚ポインタ座標からの数値とを使用する。第１５Ａ図の表の行２は、差分方程式を解くことによって得られる比重間における知覚ポインタの径路上の未知の最新の座標値を表わしている０表４０５の行ｌは一般にＣＰＵ２によって第１５１２１の計算ループをすぐ先行する通路中で発見された知覚ポインタのすぐ先行する座標値を表わしている０行０は一般にＣＰＵ２によって第１５図の計算ループを２番目に先行する径路中で発見された知覚ポインタの２番目の先行する座標値を表わしている。ＸＲＰの導関数は次の（７）式によって表わされる。ＸＲＰ丁−Ｈ（ＸＲＰ２−　ＸＲＰＩ）　（７）ここて、Ｈはスペクトル相互間の時間間隔の逆数て１例えば１／２ミリ秒すなわち５００　Ｈｚである。　ＸＲＰ２は解かれるべき比重間における最新のＸ座標値を表わし、ＸＲＰＩはすぐに先行するこのようなＸ座標値を表わしている。このような座標値は周波数的に発生されるスペクトルからＣＰＵＩによって引出され、それによって計数Ｈは（７）式中に含まれている。Ｘ、の２次導関数は次の（８）式によって表わされる。（８）式中のＨの値は（７）式中のそれと同じである。ＸＲＰ２（表４０５の行２、列ＸＲＰ　）は解かれるべき最新のＸ座標値であり、　ＸＲＰＩ　Ｃ表４０５　ノ行ｌ１列Ｘ）ＩＰ　）　ハす＜”　先行するＸ座標値である。ＸＲＰＯ（表４０５　）行０、列ＸＲＰ　）は２番目に先行するＸ座標値である。２次導関数は１次導関数の導関数であるから、（８）式中に係数Ｈの２乗Ｈ２が現われている。前の概念的な説明に基いて、また（７）式、（８）式の関係を使用してＣＰＵ２によって解かれる１組の差分方程式を次に示す。０−　Ｈ’（ＸＲＰ２−２ＸＲＰ１　＋ＸＲＰＯ）＄　、Ｈ（ＸＲＰ２−　ＸＲＰＩ）　／３ＡＲ５ｉＸＲＰ２−ＸＩＩＮＧＳＩ＋　１ＪＧｓｘＧＧｓ　ｘＫＧＳ（ＸＲＰ２−　ＸＲ３ＧＳ）＋　ＬＩＢＦＸＧＢＦ　ＸＫＢＦ（ＸＲＰ２−　ＸＲ３ＢＦ）＋　ＮＦｘ　（（１−ＧＳ）ｘ（１−ＢＦ））　ｘＫＮＧＳｘ（ＸＲＰ２−ＸＲＮＧＳ）＾”　（１−ＮＦ）　（１−ＧＳ）　（１−ＢＦ）　Ｘ　ＫＮＢＦ　Ｘ　（ＸＲＰ２−ＸＲＮＢＦ）＾−−−−−　（９Ａ）Ｏｊ　）Ｉ２（ＹＲＰ２−２ＹＲＰ１　＋ＹＲＰＯ）＋　ｒＨ（ＹＲＰ２−　ＹＲＰＩ）　／Ｂ””ＹＲ”ＹＲ””＋　ＬＩＧＳｘＧＧＳ　ｘＫＧＳ（ＹＲＰ２−　ＹＲ３ＧＳ）十ＬＩＢＦＸＧＢＦ　ＸＫＢＦ（ＹＲＰ２−　ＹＲ５ＢＦ）十ＮＦＸ　（（１−ＧＳ）Ｘ（１−ＢＦ））　ＸＫＮＧＳＸ（ＹＲＰ２−ＹＲＮＧＳ）＾＋　（１−ＮＦ）（１−ＧＳ）（］−ＢＦ）Ｘ　ＫＮＢＦＸ　（ＹＲ１２−ＹＲＮＢＦ）Ａ・・・・・（９Ｂ）０−　Ｈ”（ＺＲＰ２−２２ＲＰ１　＋　ＺＲＰＯ）＋、Ｈ（ＺＲＰ２−　ＺＲＰＩ）　／３ＡＢＳ（ＺＲＰ２−２１′Ｉ）ｉＧｓｌ十ＬＩＧＳｘＧＧＳ　ｘＫＧＳ（ＺＲＰ２−　ＺＲ３ＧＳ）＋Ｌ！ＢＦＸＧＢＦ　ＸＫＢＦ（ＺＲＰ２−２Ｒ８ＢＦ）◆ＮＦｘ　（（１−ＧＳ）ｘ（１−ＢＦ））　ｘＫＮＧＳｘ（ＺＲＰ２−ＺＲＮＧＳ）＾＋　（１−ＮＦ）（＋−ＧＳ）（１ −ＢＰ）ＸＫＮＢＦＸ（ＺＲＰ２−２ＲＮＢＦ）＾−−−−−　（９Ｃ）ＣＰＵＩ２は、数学的空間における知覚ポインタＰＰの最新の座標値、ＸＲＰ２．　ＹＲＰ２、ＺＲＰ２ニツいテノ３つノ式（９Ａ）、（９Ｂ）、（９Ｃ）を解くための反覆あるいは他の適当な計算法を実行するようにプログラムされている。絶対値関数はＡＢＳによって表わされる。座標値ＸＲＰ１．　ＹＲＰＩ、ＺＲＰＩおよびＸＲＰＯｌＹＲＰＯｌＺＲＰＯは先に式（９Ａ）、　（９Ｂ）、　（９Ｃ）カラ計算され、第１５Ａ図の表４０５で使用される。定数の値は例えば次に示す通りである。定　数　値ｒ　４６５ＫＧＳ　３０００ＫＢＦ　６０００ＫＮＧＳ　３［１００ＫＮＢＦ　３０口０粘性抵抗項は式（９Ｂ）ては、項ｒｌ（ＹＲｐ２−１／）Ｊｐｌ）　／３ＡＢＳ（ＹＲＰ２−ＹＲＮに５１によって代表され、これは速度に、／ＢＡＩＩｆ（ＹＲＰ２−ＹＩＩＮＧＳ）を乗じた大きさになる。Ｂは指数に対する底であり、粘性抵抗係数は、Ｂに対する指数値が０であることから中立点ＮＰＧＳ　（比重量てＹＲＮＧＳのＹ座標をもっている）の定数ｒにほぼ等しい、Ｂの値は、知覚ポインタＰＰが対数空間で面Ｙ＝Ｏに移動すると、粘性抵抗係数が幾分か、例えば定数ｒのほぼ１／２に低下するように選択される。ＹＲＰ２か１０°＝１のとき、分母はＢＡＢＳ（１−１０’°４）すなわちほぼＢ２に低下する。変数ＬＩＧＳ、　ＧＧＳ　、　ＧＳ、　ＬＩＢＦ、　ＧＢＦ　、　ＢＦはＣＰＵＩによって供給される聴覚状態コートにある。これらの変数は感覚ポインタあるいは中立点のどちらが知覚ポインタＰＰに吸引力を及ぼしているかによって式（９Ａ）、　（９Ｂ）、（９Ｃ）中の適当な項を付勢あるいは消勢（状態スイッチ）する、破裂−摩擦音フラッグＢＦおよび声門音源フラッグＧＳが各々０かｌのいずれかであり、良さは無音期間中０であるのて、式（９Ａ）、（９Ｂ）、（９Ｃ）の適当な項は解析の計算で計算に入れられ、また周囲の要求によって無視される場合もある。中立フラッグＮＦは中立点項（各差分方程式中の最後の２項）中に含まれている。中立フラッグＮＦは、聴覚状態コード中のＢＦとＧＳの状態をモニタするＣＰＵＺ中のタイマによって制御される。もしＢＦあるいはＧＳのいずれかが１であると、フラッグＮＦは０である。もしＢＦが０であると、ＧＳは１から０に変化し、フラッグＮＦはＧＳあるいはＢＦのいずれかが１になるまて１になる。もしＢＦがｌてＧＳが０であると、ＢＦはステップ４０７によって検出されると１から０に変化し、Ｃ１’ｔ１２中の１２０ミリ秒のタイマが付勢されて１２０ミリ秒か経過するまでフラッグＮＦをＯに維持し、次いでフラッグＮＦは１にセットされる。このようにして、各差分方程式中の中立点ＮＰＢＦに対する最後の項か１２０ミリ秒間付勢されて、各差分方程式中の中立点ＮＰＧＳに対する最後から第２項の項に置換される。感覚ポインタあるいは中立・点に対する各項は、知覚ポインタＰＰの位置に寄与するものと考えられる。この方法では、デジタル形式のサンプルからスピーチの周波数スペクトルを表わすデジタル値の組を引出し。デジタル値の組の各々に対する複数の聴覚状態コートのうちの１つを発生し、数学的空間における少なくとも２組の座標値を供給し、どの聴覚状態コードか発生されるかによって最初に指定された座標値の１あるいはそれ以上の組から選択された貢献要素をもって、径路を特定する点の他の一連の座標値を計算する手段が設けられている。ＣＰＩＩＩはまた有声摩擦音あるいは他のスピーチ音の同じスペクトルの声門音源および破裂−摩擦音部分に特有の個々の大きさおよび良さの計算動作を実行するようにプログラムされており、それらの値ＬＩＢＦ、　ＬＩＧＳ、　ＧＧＳおよびＧＢＦかＣＰＵＩからＣＰＵ２へ転送され、２組の感覚ポインタ値Ｘ＊ａｓ＋　Ｙ＊ａｓ＋　Ｚ＊ａｓ、　Ｌｍｒ、ＹｔＢＦ、ＺｔＢＦが、１つの３組であるｘ、、ｙ、、ｚ、の代りに声門音源ポインタＧ５５Ｐ、破裂−摩擦音ポインタＢＦＳＰのためにおくられる。この方法では、聴覚状態コードが声門音源聴覚状態を表わすときデジタル値を表わすスペクトルの組の１つから２組の最初に指定された座標値の最初のものを発生し、聴覚状態コートが同時に破裂−摩擦音聴覚状態を表わすとき同じ１組のデジタル値から２組の最初に指定された座標値の第２のものを発生する手段か設けられている。Ｃ，ＰＯ２中て少なくとも１個の感覚ポインタと同様に少なくとも１個の中立点を使用することにより、スペクトルを表わすデジタル値の組から２組の最初に指定された座標値の最初のものを発生する手段を与え、このときは最初に指定された座標値の第２の組（例えば中立点の値）はスペクトルを表わすデジタル値の組には無関係である。式（９Ａ）、　（９Ｂ）、（９Ｃ）において、値Ａは指数で、例えば０であり、中立点が距離と共に変化しない力でもって知覚ポインタＰＰを吸引することを示す。実験による観察により、力が距離と共にその大きくなるべきであることを示すと、Ａの値はより正になり、力が距離と共に減少すべきであるなら、Ａは負にされる。目下のところはＡの最適値はＯであると信じられている。説明の都合上、式（９Ａ）、　（９Ｂ）、（９Ｃ）は全体として知覚ポインタＰＰのベクトル位置に対する１つのベクトル差分方程式を表わすと考えられる。好都合なことには、破裂音、変化、定常状態、音声を含む第１図のマイクロホン１１へのすべての感覚的入力は、感覚−知覚変換によって単一の知覚的応答に積分される。さらに有利な点は、知覚ポインタＰＰの位置は感覚ポインタの位置のみならずそれらの変動にも依存する０式か不足制動（アンダーダンプ）系に対応しておれば、感覚ポインタは急速にターゲット位置に接近しまた方向を転じて離れ、さらに知覚ポインタにオーバーシュートを誘起させ、さらに数学的空間におけるその所望の位置に到達する。差分方程式を解くときのＣＰＬ１２の動作は、オーバーシュートの性質、特に閉鎖子音および非常に速いスピーチの場合に類似するように構成されている。第１５図のステップ４１５で、式（９Ａ）、　（９Ｂ）、　（９Ｃ）を解いて得られた最初の値ＸＲＰ２、ＹＲＰ２、ＺＲＰ２は第１ＳＡ図の表４０５の行２に記憶される０次いてステップ４１７て、これらの最新の値の共通対数値はｘ、、ｙ、、ｚ、としてＣＰＵ３に送られる。動作は判定ステップ４１９に進み、ＣＰＵ３がオンのままにあるかどうかを決定する。もしオンであれば、ステップ４０７に戻ってループが作られる。感覚ポインタの座標値と聴覚状態コート情報の新しい組がステップ４０７に供給される。表４０５は計算ステップ４１３を通って次の径路への準備をする循環形態のままにあり、それによッテ表４０５テ、それぞれＸＲＰｌ、　ＹＲＰｌ、　ＺＲＰＩ、およびＸＲＰＯｌＹＲＰＯ，ＺＲＰＯのために行２の値はすぐ先行する値になり１行ｌの値は２番目に先行する値になる０式（９Ａ）、　（９Ｂ）、（９Ｃ）はステップ４１３テ再び解かれて、ＣＰＵ３が判定ステップ４】９てオンてなくなるまて動作は第１５図のループ中て継続する。そして終了４２１で動作は終了する。ＣＰＵ３の動作は最初第１７図によって概略的に説明する。知覚ポインタＰＰの作用がある規準に合致すると、聴覚的−知覚的事象、あるいは感知された音が生ずる。これらは（ａ）知覚ポインタが低速の期間に会うと聴覚的−知覚的事象か生じ、（ｂ）知覚ポインタが鋭い減速に会うと聴覚的−知覚的事象が生じ、（Ｃ）知覚ポインタが大きな曲線を持っていると聴覚的−知覚的事象が生ずる。　ＣＰＵ３はこのような事象を決定するように適当にプログラムされている。計算は任意の１あるいはそれ以上に規準を含むことがてき、また速度が予め定められたミリ秒の間維持・されねばならないように、また径路あるいはある軌跡および曲率がある時間制限内て横切られなければならないように時間的制限を加えることがてきる。これらの色々な場合に、聴覚的−知覚的事象は知覚ポインタＰＰの加速度の大きさのピーク（好ましい実施例てはここでは対数空間で決定され、比重量では決定されない）の対数空間における径路に沿う位置に関連すると考えられる。対数空間における知覚ポインタＰＰの位置は座標値ｘ、、ｙｐ、ｚ、によって特定されるベクトルである。その速度は規準のｘ、ｙ、ｚフレームに関連する特定の方向の速さに等しいベクトル量である。速度は。ｘ、、ｙ、、ｚ、の時間導関数である成分ｄＸ、／　ｄｔ、ｄＹ、／ｄｔ、ｄＺ、／ｄｔをもっている。速さは任意の所定時間における速度ベクトルの大きさ、すなわち長さで、速度成分ｄＸ、／ｄｔ、ｄＹ、／ｄｔ、ｄＺ、／ｄｔノ２乗の和ノ平方根に等しい。一般に、任意のベクトルの大きさ、あるいは長さは、その成分の２乗の和の平方根に等しい、加速度は、速さあるいは方向のいずれか、あるいはその双方と考えられるこのような変化の速度あるいは割合の変化を表わすベクトルである。加速度の成分は速度ベクトルのそれぞれの成分の時間導関数である。数学的には、加速度は成分　ｄ２Ｘ、／ｄｔ、ｄ２Ｙ、／ｄｔ、ｄ２Ｚ、／ｄｉと表わされ、これらはｄＸ、／ｄｔ、ｄＹ、／ｄｔ、ｄＺ、／ｄｔ（７）時間導関数である。聴覚的−知覚的事象に減速度が含まれているときても、低速の期間は加速度の大きさのピークに等しい減速度から得られるのて、その事象は知覚ポインタＰＰの加速度の大きさのピークの径路に沿う位置に関連している。また、減速度は負の加速度て、２乗の和を含む大きさに影響を与えないので、鋭い減速度は加速度のピ一つてある。知覚ポインタの径路か曲率なもっているとき、加速度は大きさのピークを示し、径路から中心を指すベクトルである。ＣＰＵ３は次に示すＡ乃至りの少なくとも１つあるいはそれ以上の手段として作用する。すなわち、Ａ）加速度の大きさのピークの径路に沿う少なくとも１つの位置に近似する座標値を識別し、位置の座標値の関数としてメモリのアドレスを発生し、そのメモリアドレスに予め記憶された発声表現情報をそのメモリ手段から得る手段。Ｂ）径路の曲率な近似するパラメータを計算し、パラメータが径路上の点の予め定められた大きさを超過するとき、加速度の大きさのピークの位置に近似するその点の座標値を識別する手段。Ｃ）径路に沿う速さを計算し、速さか予め定められた時間内で少なくとも予め定められた大きさたけ減少位置の座標値を識別して、加速度の大きさのピークの位置の近似値をめる手段。Ｄ）径路に沿う速さを計算し、予め定められた時間内て前後に速さの増加があるそれらの間て速さの減少が生ずる位置の座標値を識別し、加速度の大きさのピークの位置の近似値をめる手段。各聴覚的−知覚的事象は時間内て減衰する痕跡あるいはチック・マーク（ｔｉｃｋ　ｍａｒｋ（ｖ’））を残すと言われている。チックの大群か生したとき、すなわち低密度の領域によって囲まれた高密度のチックの領域が形成されたとき、例えばスピーチ音かしばしばくり返されるような場合、人間の場合、神経系がチック・マークの大群の周囲に自動的に包絡線を形成し、中立シンボルあるいは分類コードを与えることのてきるターゲット領域を作り出すと仮定する。大抵の場合、このようなターゲット領域は一時的なもので、時間と共に消失する。母国語および方言の音に対するターゲット領域のような他のターゲット領域は、ある場合には幼児および子供の頃に形成され、そのためそれらは殆ど永久的で修正することが困難である。ターゲット領域の概念は知覚である。好ましい実施例てはターゲット空間の記憶用の大きなメモリ３１は、メモリ中のアドレスの各組に対する別々の発声表現を表わす予め記憶された情報を保持するためのメモリ手段である。ＣＰＵ１．　ＣＰＵ２およびＣＰＵ３は全体て各連続する時間間隔て生ずるスピーチの周波数スペクトルから数学的空間における径路上の点の一連の座標値を電気的に引出し、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似する座標値を識別し、位δの座標値の関数としてメモリ・アドレスを発生し、そのメモリ手段からそのメモリ・アドレスに予め記憶された発声表現情報を得る手段を構成している。／ｂ／　、　／ｄ／　、　／ｇ／　、　／に／　、　／ｐ／　、　／ｌ／のような閉鎖音ホーニームにたいするターゲット領域は、感覚−知覚変換における不足制動のために、感覚ポインタ値Ｘ１、Ｙ、、Ｚ、によって入力されないか、座標値Ｘｐ、Ｙｐ、Ｚ、によって入力することのてきる数学的空間の領域に相当するメモリ中の各アドレス群に関連している。ＣＰ１１３で加速度の大きさのピークが発見される。最新のピークか生ずる径路上の加速度は、各軸ｘ、ｙ、ｚに沿う整数値に変換される。第４図のステップ１４３に起因すると予測することのできる感覚ポインタに対する座標値に関して、ターゲット領域はＯ乃至２の間のＸ、−〇、５乃至１．５の間のＹ、Ｏ乃至２の間のＺ内にある。好ましい実施例では、例えば各軸は正のＹ軸に沿う１５０の区分と、負のＹ軸に沿う５０の区分とを含む２００の区分を有すると考えられている。このようにして、各ターゲット領域は極めて正確に特定できる。従って、最新のピークが生ずるＸｐ　、Ｙｐ　、Ｚｐの値は１００倍され、関数ＩＮＴによって最も近い整数にまるめられる。ピークはその範囲内の任意の場所で生ずるのて、２００の３乗すなわち８メガバイトに等しい数のメモリ・アドレスが使用される。換言すれば、２２３は約８００万であるので、２進値の各メモリ・アドレスを表わすために２３ビツトが使用される。座標は次式によってメモリ・アドレスに変換される。ＡＤＨ＝ＩＮＴ（１００Ｘ）＋２００ｘ　ＩＮＴ　（１００Ｙ＋ＳＯ）＋４０００ｘ　ＩＮＴ（１００２）・・・・・（１０）換言すれば、速度解析、曲率解析、あるいは加速度解析によってＣＰＵ３が加速度の大きさのピークを発見すると、上記の式あるいは等両式に従ってメモリ・アドレスＡＤＨを発生し、そのアドレスに予め記憶された発声表現情報をそのメモリ３１から得る。一般に各ホーニームあるいは音素を表わす言語の２進コードはメモリ中の１組のアドレスの各々に記憶される。バイト中の８ビツトは所定の人間の言葉における異なるホーニームに対する個々の明確な２進表現を与えるのに充分な柔軟性を与える。ＣＰＵ３かメモリ・アドレスＡＤＨを決定すると、メモリ３１はそのアドレスに記憶された２進コートを供給する。ＣＰＵ３は２進コートなホーニームを表わす文字あるいは他の符号に変換し、それをその端末のビデオ・スクリーン上に表示させ、またそれをプリンタ３３にプリントさせる。非サスティン・スピーチ音に対するターゲットは正のｘ、ｙ、ｚの八分円の外側に配置されている。第１７図て、感覚ポインタＢＦＳＰは、“Ｐ′のような音声に対するターゲット領域にのみ近づくことかでき、また知覚ポインタか実際に負のＹ領域中のターゲット領域に到達するような適当な動きをもって近づかなければならない。例えば１話者か単語“５ｔｏｐ”を丁度言い終ったと仮定する。知覚ポインタは、今は存在しない声門音源感覚ポインタＧ５５Ｐの影響のもとて、 “５ｔｏｐ”中の母音に対するターゲット領域４５３を通過する間に鋭い湾曲を形成し、そして突然に破裂−摩擦音感覚ポインタＢＦＳＰか現われる。鋭い湾曲のために、ポインタ４５５の座標のためのメモリのルックアップか生じ、例えば“ｆａｔｈｅｒ”中の／ａ／の音素はメモリ３１から得られる。“Ｐ” 音はＢＦＳＰに向かう知覚ポインタＰＰを吸引するのて、破裂−摩擦音感覚ポインタＢＦＳＰはＸ−２面内に現われる。知覚ポインタＰＰはＢＦＳＰが生ずる面Ｙ＝Ｏをオーバーシュートし、“Ｐ″に対するターゲット領域に到達する。ＢＦＳＰとそれに順次に続く中立点ＮＰＢＦとＮＰＧＳの吸引力によって知覚ポインタＰＰはターゲット領域４５１中の点４５７においてその動きの方向を反転し、加速度の大きさの他のピークが生ずる。今度は点４５７の座標に対するメモリ・クックアップが再び生し、メモリ３１から“Ｐ”に対する音素が得られる。このようにして、ある場合には、知覚ポインタＰＰをより遠い知覚ターゲット領域に到達させるようなやり方で、感覚ポインタがその領域に近づくにすぎない。しかしながら、母音に対する４５３のようなターゲット領域には、感覚ボ、インク、知覚ポインタの双方か入り込むことがてきる。知覚的応答は約５０ミリ秒の中立点ＮＰＧＳから開始するとき母音ターゲットに達する。第１８図は数学的空間に対する座標系の軸ｘ、ｙ、ｚを示す。母音に対するターゲット領域を説明するに当って、ｘ、ｙ、ｚ系の第１の八分円の点て文運し、軸Ｘ。Ｙ、Ｚに関して傾けられた別の軸ｘ’、ｙ’、ｚ’を特定するのが有効である。ｘ’　、ｙ′、ｚ’座標を特定する式は次の通りである。Ｘ、’　＝　０．７０７１１’（Ｙ−Ｘ　’）　（ＩＩＡ）Ｙ’　＝　０．８１６２”Ｚ　−０，４０８１”（Ｘ−Ｙ　）　（ＩＩＢ）Ｚ’　＝　０．５７７２ ”（Ｘ＋Ｙ＋Ｚ）　（ＩＩＣ）第１９図は母音に対するターゲット領域を保持するために発見されたｘ’、ｙ’、ｚ’座標中のほぼ平板状の厚板４６５を示す、第１９図はＸ′軸に沿って見たときの厚板４６５の端部な示す。中立点ＮＰＧＳは母音厚板のほぼ中心にある。母音の厚板が薄いときても、同番は母音を厚板の後方へ移動させ、一方“ｒ”気味の音を発するときのように舌を後へ反らせるとその位置を原点に向けてさらに後退させ、それによって母音単独の場合でも３次元を使用することは有効である。子音は母音厚板の中あるいは近くに位置し、あるいは母音厚板に直交する他の厚板中に位置し、これも３次元空間を使用することを支持している。しかしながら、この発明のある実施例ては、２次元空間を使用する場合のように厚板を折り返したり、折り畳んだり出来ないと考えられている。また、厚板は。利用可能なメモリ容量がその厚板に対してのみ有効に使用されるような態様てメモリ３１のアドレスに書込まれると考えられている。第２０図は、Ｘ’　、Ｙ’　、Ｚ’座標系におけるｚ’軸に沿って対面して見たときの厚板４６５を示す図である。母音のターゲット領域に対する輪郭が示されており、それからアドレスの輪郭群が第１図のメモリ３１中の母音符号の各々を表わす符号を予め記憶するために引出される。するアドレスの各々に対してそれらの符号を手動で入力することによって予め記録される。また、この符号はコネチカット州バーノン（Ｖｅｒｎｏｎ　Ｃｏｎｎｅｃｔｉｃｕｔ）にあるマイクロ　コントロール　システム　インコーボレーテット（Ｍｉｃｒｏ　Ｃｏｎｔｒｏｌ　Ｓｙｓｔｅｍ、　Ｉｎｃ、）から市販されているバーセプタ（知覚）ユニットのような３次元位置捕捉装置４６７を使用することによって予め記憶することがてきる。そのユニットはテフロン被覆された機械的に精密なアルミニウム基準板をもち、その上に精密に機械加工されたデジタル化アームが設けられている。電気的データの捕捉機能を実行する回路は、その基準板の下に収容されている。２重Ｒ３−２３２ボートはそのユニットによりデータを転送させる。そのデジタル化アームは、そのアームを動かす予め装荷された５個のボールベアリング支持ジヨイントを有する。そのジヨイント内に設けられたポテンショメータはそのアームの各セグメントの回転角に関する電気的情報を伝送する。次いでユニット中のＺ　−８０Ａマイクロプロセツサはアームのポインタ先端の位置のｘ、ｙ、ｚ座標を計算する。このようにして、ターゲット領域の形は、第１図のメモリ３１を自動的にプログラムするに当って使用するために比較的急速に記録される。第２１図は第１８図のＹ軸に沿って見たときの無声閉鎖音に対する数学的空間におけるターゲット領域を示す。この図中の記号は後程表１に示されている。第２１図によって特定されるターゲット領域の形状はｘ−２面上に投影されているか、それらは実際には３１　＝−０，０１とｙ−−０，０４との間の負のＹ領域を占めるにすぎない。第２２図は第１８図のＹ軸に沿って見たときの有声閉鎖音、非帯気−無声閉鎖音、および鼻声子音に対する数学的空間のターゲット領域を示す、この図中の記号は表２中に示されている。第２２図の上側の部分に示された４個の有声閉鎖音および非帯気無声閉鎖音に対するターゲット領域の形状はｘ−２面上に投影されているか、それらは実際にはｙ−−０，０４とｙ−−０，０２との間の負のＹ領域を占めるにすぎない。同様に第２２図の下側の部分に特定された３個の鼻声子音に対するターゲット領域の形状はＸ−２面上に投影されているが、それらは実際にはｙ−◆０．０５とｙ−＋０．３４との間の正のＹ領域を占めるにすぎない。第２３図は第１８図のＹ軸に沿って見たときのアメリカ英語の無声摩擦音に対する数学的空間のターゲット領域を示す、この図中の記号は表３に示されている。第２１図によって特定されてし・るターゲット領域の形状はｘ−２面上に投影されるが、それらは実際にはｙ−−０，０２とｙ−◆０．０２との間のＹ領域を占める。第２４図は、第１８図のｘ’　、ｙ’　、ｚ’座標系のＺ′軸に沿って見たときの有声摩擦音および音声学的近似に対する数学的空間のターゲット領域を示す。第２５図は、第１８図のＸ’、Ｙ’、Ｚ’座標系のＸ′軸に沿って見たときの第２４図の有声破裂音および音声学的近似に対する数学的空間に３けるターゲット領域を示す。第２４図および第２５図中の記号は表４に示されている。これらのターゲット領域は一般に母音中あるいは母音の近くでは並置されており、そのためｘ’　、ｙ”　、ｚ’座標系か使用される。第２４図および第２５図はターゲット領域の３次元形状を特定するために正射影投影の態様て示されている。第２０図と第２４図の見かけ上の比較により、第２４図の／Ｃ「／および／ｒ／についてのターゲット領域は第２０図の母音の幾つかのターゲット領域とかち合っているように見えるが、それは事実ではない。第２５図は／ｅｒ／および／ｒ／は対数空間における母音の背後に入ることを明確にしている。一般にはターゲット領域はオーバーラツプしていない。第１９図および第２０図の記号は表５に示されている。表　１無声（帯気）閉鎖音（破裂音）ｋｖ＝／ｋｈ／−軟口蓋音に、ｉｓ／ｋｈ／−口蓋音Ｐ　ミ／ｐｈ／表　２有声破裂音（閉鎖音）および非帯気無声破裂音（閉鎖音）ｇ１ミ／ｇ／−軟口蓋音ｇ２ミ／ｇ／−口蓋音注：これらはアメリカ英語の非帯気合に、ｔ、ｄを含んている。鼻声子音ｍ　ミ／ｍ／ｎ　二／　ｎ　／７１　＝／Ｔ）／　−ｓｉｎｇ中のｎｇ表　３無声摩擦音（アメリカ英語）ｗｈ＝／呂／表　４有声摩擦音および近似表　５母　音ｂｅｅｔ中の　ｉ　＝／ｉ／ｂｉｔ中の　Ｉ　Ｅ／Ｉ／ｂｅｔ中の　ε　ミ／ε／ｂａｔ中の　ａｅ　＝／；ｌｅ／ｂｕｔ中の　人　＝／人／ｆａｔｈｅｒ中の　ａ　＝／ａ／ｂｏｕｇｈｔ中の　３　＝／Ｄ／ｂｏｏｋ中の　Ｕ　ｅ／Ｕ／ｂｏｏｔ中の　ｕ＝／ｕ／ｂｏａｔ中の　Ｏｗ　ミ１０／ｂｏｙ中の　Ｏｙ　ミ１０／好ましい実施例を構成するに当って、メモリ３１をローディングするために、熟練した技術者は第１９図乃至第２５図に含まれている形状および座標情報を使用する。第２６図において、第１図のＣＰＵ３の動作は“開始５０１″で始まり、ステップ５０３に進む。ステップ５０３で数学的空間における径路上の最新の点における座標値Ｘ２゜Ｙ、、Ｚ、はＣＰＵ２から入力されて第２７図の表５０４に記憶される。次のステップ５０５において、軌道の重要なパラメータは計算され、それによって続いてステップ５０７て何時重要なスピーチ事象が生ずるかを決定することができる。座標値は等しい時間間隔で第１図のＳ／Ｈ１７によってスペクトルをサンプリングし、上記の数値Ｈで示されるくり返し率で上記スペクトルを解析することによって得られる。従って、加速度の大きさは、最新の座標値と表５０４から得られる座標値の２個の先行する３組から計算される。下付文字０．１．２は最新の３組、すぐ先行する３組、その前の３組を表わすために使用される。加速度の大きさは例えば次式によって計算される。ＭＡＧＡＣＣＥＬ　＝　Ｈ”５ＱＲＴ　（（Ｘｐｓ　−２Ｘｐ＋　十Ｘ−ｚ）” ＋（Ｙ９゜−２Ｙ、Ｉ　＋ＹＰ２）” ＋（Ｚｐｏ　−２１−＋　＋Ｚｐ２）２）　（１２）ある実施例ては、湾曲ＣＵＲＶはまた上記のＭＡＧＡＣＣＥＬおよび次式による速度の２乗の大きさから計算される。ＣＵＲＶ　−ＭＡＧＡＣＣＥＬ　／　ＶＥｌ、ＳＱココテ、ＶＥＬＳＱ　−（Ｘｐｏ　−Ｘｐｓ）２＋（ｙ、ｏ　−ｙ、＋）２◆（ｚｐｏ　−ｚｐ＋）２・・・・・（１３）加速度ＭＡＧＡＣＣＥＬの大きさの各最新値は、ステップ５０５の期間中にそれとＭＡＧＡＣＣＥＬの４個の先行する値を保持する表５０４に記憶される。湾曲ＣＵＲＶについての同様な表解析か湾曲が使用される場所に適用される。平方根５ＱＲＴ関係の論法はまた加速度の大きさに関連するパラメータとして使用するのに充分である。数学的空間における知覚ポインタの径路についての等価解析を行なうために重要な軌跡パラメータを計算する多くの方法かあることを強調しておく。次のステップ５０７て、ＭＡＧＡＣＣＥＬの５個の値を保持する表５０４は、重要なピークが表わされるか否かを決定する。表がその中に予め定められたレベルを超過する入力された試験値をもち、しかもその表５０４中に上記試験値よりも小さい値が先行し且つ後続すると、ピークが生じたとするのが適当な試験法である。もしこの試験がステップ５０７から判定ステップ５０９への動作通路を通過しなければ、ＣＰＵ３はそれが継続すべきか否かを決定するために０Ｎ１０ＦＦスイツチをチェックし、またステップ５０７から判定ステップ５０９への動作径路を通過すれば動作はステップ５０３に戻るループを形成する。最終的に音声学的に重要な事象がステップ５０７て生ずると、動作はステップ５１１に進み、上述のＡＤＲ式（１０）に従ってアドレスＡＤＨを発生する。次いてステップ５１３てアドレスＡＤＨがＣＰＵ３によって第１図のメモリ３１に挿入され、重要なｘ、、ｙ、、ｚｐ座標値が存在するターゲット領域の音素を特定する予め記憶された音素コートＰＨＥバイトを得る。ステップ５１５てこのＰＨＥは、このＰＨＥ値を保持するメモリ・スペースにそれが得られた順次て記憶される。ステップ５１７で、ＰＨＥ値すなわちバイトは、対応する音声学的符号あるいは言語音に対応する類別コードを第１図のプリンタ３３に書込むための命令を与える表中でルックアップされる。次のステップ５１９で、得られた順序で記憶されたすべてのＰＨＥは第１図のＣＰＵ４に送られる。　ＣＰＵ４は、ＰＨＥを選ばれた言語に従って綴られた一連の語に変換する語変アクセス・プロセッサである。ステップ５１９が完了すると、動作はオン決定ステップ５０９に進み、ＣＰＵ３かもはやＯＮてはないと決定するとループはステップ５０３に戻り、動作は“終了５２１”で終了する。話し手のスピーチの例から装置ｌをリファインするためにターゲット領域をステディする装置（図示せず）か数学的空間の３次元表示中のターゲット領域を表示し、解析する。このような装置は、エバンズ　アントサザーラントＰ８３００グラフィック　システム（Ｅｖａｎｓ　ａｎｄＳｕｔｈｅｒｌａｎｄ　ＰＳ　３００　Ｇｒａｐｈｉｃ　Ｓｙｓｔｅｍ）、ＶＡＸ−７５０またはｕＶＡＸ　−Ｕコンピュータ、および線図を３次元で見ることのてきる適当な周辺装置をもっている。表示の特徴には、ズーム用のつまみ制御、装置の軸に対する回転あるいは変換のつまみ制御が含まれている。数学的空間あるいは聴覚−知覚空間は軸と共に表示される。３次元のターゲット領域は装置中でプログラムで作り出される。ターゲット領域は特定の色、位置、寸法、さらに必要に応じてその近くに配置される音声記号と共に空間中に配置してもよい。感覚ポインタの径路を表示させるために、各時間ｔの間、４つの組の値ＦＯ５Ｆ１．　Ｆ２、Ｆ３か入力され、その時点で基本および初めの３つのスペクトルの突出部が現在のスピーチ解析技術を使用して概算される。これら４つの組はファイルを構成している。次に定数ａの値が選択されて、４つの組ｔ、　ｌｏｇ（Ｆ３／Ｆ２）、ｌｏｇ（Ｆｌ／Ｒ）、ｌｏｇ（Ｆ２／Ｆｌ）が形成される。これらは基準である。これらはホルマント此の対数であり、第２のファイルを構成するＦｌが特定されていないと、ｌｏｇ（Ｆｌ／Ｒ）は随意に０にセットされる。次にコンピュータによって線形補間か実行されて。５乃至ｌＯミリ秒の間隔て４つの組のファイルか供給される。各座標の群を接続するセグメントは使用者の選択により表示される。このような各セグメントの先端上には、適当に配置されたピラミッドが感覚ポインタを表わすために表示される。線セグメントおよびピラミッドは第３のファイルに記憶される。数学的空間はターゲット領域の適当な選択に伴フて表示される。使用者は、感覚通路、例えば特定の話者か発した例えば音節“ｄｕｄ”を選択する。そこで、リアルタイムの５倍のような表示の速さが選択され、動作が開始される。表示装置は数学的空間を通って移動する感覚ポインタを示し、その通路はセグメントによって示される。補間された対数比ファイルは、感覚−知覚変換を感覚座標に施すことによって知覚座標を表わす表に変換される。ｎ−共振器（２次）は変換器として作用する。このようにして、スベク１〜ル変化のある周波数は強調され、他は減衰される。これらは４番目のファイルに記憶される。知覚径路は感覚径路と同様に表示される。感覚ポインタあるいは知覚ポインタのいずれかが空間を通って移動すると、別のプログラムか速度Ｖ、加速度ａ、曲率にの大きさをスタディすることかてきる。適当な倍率の表示装置は、時間の関数としてｘ、ｙ、ｘ、ｖ、ａ、ｋを表示させ、また時間の関数として同様にｌｏｇ（Ｆ３）　、　ｌｏｇ（Ｆ２）　、　ｌｏｇ（Ｆｌ）　、　ｌｏｇ（ＦＤ）　、　ｖ、ａ、ｋを表示させる。このようにして、ホーニームおよび音節の相互関係を発見するために感覚および知覚径路をスタディすることかできる。カーソルの制御つまみによって、興味のある点のマーキング、およびその座標の値の決定、それらの点における動的パラメータの決定が可能になる。　５ＳＨｚの中心周波数、ダンピング係数０．６をもった単一の２次共振器として感覚−知覚変換−器を作ることにより、実験的な補強を行なうことができるが、通常の且つ分相応な知覚通路が得られる。次にトップ−タウン処理を含む別の特徴について説明する。極めて多数の聴取状態でのトップ−タウン処理は極めて重要て、また音声処理における知覚と感覚とを分離することによりＣＰＵ２．　ＣＰＵ３およびまたはＣＰＵ４によるトップ −ダウン処理を行なうことかてきるという利点かある。例えば、パターン認識装置、予め記憶する装置、あるいは他の手段によって装置から取出される情報は、知覚パターンを特定のターゲット領域に向けて引きつける式（９Ａ）、（９Ｂ）、（９Ｃ）中に他の貢献要素を生じさせるのに有利に使用される。このようにして、知覚ポインタは感覚ポインタおよび前述の他の要素によってのみならず、言語についての文脈や知識等によって制御される装置によって引出される他の情報によっても引出される。トップ−ダウン処理の他の形式には、知覚ポインタに吸引力あるいは反発力を生じさせる他の感覚からの可視キュー（合図）や情報のような他の情報も含まれる。例えば口の動きはパターン認識装置によって観察され、知覚ポインタＰＰを各種の知覚ポインタＰＰに引付けて音声知覚に影響を与える力を付加するために使用される。さらに複雑な形式のトップ−ダウン処理も考えられる。例えば、外国アクセント、難聴スピーチ等の話者のスピーチの特徴に基づいてターゲット領域の寸法や形状か変えられる。さらに他の種類のトップ−ダウン処理か、語や意味の識別のために要求される付加処理を受ける聴覚−知覚空間の出力として導入される。例えば、このような実施例におけるＣＰＵ３のメモリ３１において、メモリに予め記憶されたＰＨＥ情報は、０と１との間の信頼度を表わす信頼度レベル情報ビットに伴って生ずる。ターゲット領域の内側深くにある音量要素に対するＰＩＦ情報は高い信頼度があり、またターゲット・領域の表面近くの音量要素に対するＰＨＥ情報の信頼度は低い。加速度の大きさのピークが生じたときにターゲット領域から引出された信頼度情報はパターン認識装置から引出された信頼度情報と比較され、そのスピーチについての最も可能性のある解釈についての決定がなされる。語および意味を識別するためのＣＰＵ４による語変アクセス・レベルにおいて、同様な解析がこの発明の実施例において実行される。この発明の他の実施例ては、ＣＰＵ３はメモリ３１中のターゲット領域を自動的に形成し且つリファインする。スピ−チの流れは装置１に供給され、音声学的に重要な事象がメモリ３１中のアドレスを指定する。　ＣＰＵ３はメモリの領域中の事象の周波数を表にし、個々の２進類別コードを事象の集団を有する領域に割り当てる。類別コードは表にリストして示されており、熟練した技術者は通常の音声符号をその装置によって発生された表に作られた類別コードに割り当て、それによって装置に音素レベルて綴ることを指示するのと同様な方法で、装置はこの装置によって発生された類別コードを人間が解釈するのに必要とする通常の符号として印刷するようになる。上述の点から明らかなようにこの発明の幾つかの目的が達成され、他の効果が得られる。この発明の範囲内て上述の構成を種々変形することかできる０図示され、この図を参照して行った上述の説明に含まれるすべては単なる一例として解されるべきものて、この発明の範囲をそれに制限するものてはない。（：”ＰＵ／のり“ｊ込とルーナンＦｌ（３，１０Ｆ　Ｉ　Ｇ、　＋５△　ＦＩＣ７，２７ＦＩＧ、Ｉ６ＦＩＧ、２＋ＸもＩＬｏｙ卆ノＦＩＧ、２２Ｘ＝ｉｏｇρりｆり２ＦＩＧ、２３Ｘ；ノーぴＣそ妨ｆ４ＦＩＧ、２４Ｙ′ ＦＩＧ、２５

Claims

【特許請求の範囲】

（１）メモリ中のアドレスの各組に対応する各別の発声表現を表わす予め記憶された情報を保持するメモリ手段と、連続する時間間隔でそれぞれ生ずるスピーチの周波数スペクトルから数学的空間における径路を上の点の一連の座標値を電気的に引出し、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似する座標値を識別し、位置の座標値の関数としてメモリ・アドレスを発生し、上記メモリからそのメモリ・アドレスに予め記憶された発声表現情報を得る手段と、からなるスピーチ処理装置。
（２）一連の座標値を電気的に引出す手段は、上記径路の湾曲を近似するパラメータを計算し、そのパラメータが上記径路上の点における予め定められた大きさを超過すると、加速度の大きさのピークの位置を近似するためにその点の座標値を識別する手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（３）一連の座標値を電気的に引出す手段は、上記径路に沿う速さを計算し、予め定められた時間内に速さが少なくとも予め定められた量だけ低下する位置の座標値を識別して加速度の大きさのピークの位置を近似する手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（４）一連の座標値を電気的に引出す手段は、上記径路に沿う速さを計算し、予め定められた時間内で速さの上昇が後続して生ずる速さの低下が生ずる位置の座標値を識別して加速度の大きさのピークの位置を近似する手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（５）一連の座標値を電気的に引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を生成し、上記デジタル値の組の各々に対する複数の聴覚状態コードの１つを発生し、数学的空間における少なくとも２組の座標値を供給し、どの聴覚状態コードが発生されるかに基づいて上記座標値の組の１あるいはそれ以上のものから選択された貢献要素でもって上記径路を特定する点の一連の引出された座標値を計算する手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（６）一連の座標値を電気的に引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を生成し、デジタル値の各組から決定され、数学的空間内における感覚ポインタの値の組を生成し、感覚ポインタ値の組から径路を特定する点の一連の引出された座標値を計算する手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（７）上記メモリ手段は、感覚ポインタ値の組によって入力することのできない数学的空間の領域に対応するアドレスにおける少なくとも１個の閉鎖音ホーニームを表わす予め記憶された情報を保持するための手段を含む、請求の範囲（１）記載のスピーチ処理装置。
（８）メモリ中のアドレスの各祖に対応する各別の発声表現を表わす予め記憶された情報を保持するメモリ手段と、連続する時間間隔でそれぞれ発生するスピーチの周波数スペクトルから数学的空間内における点の径路を特定する各点の一連の座標値を電気的に引出し、径路の湾曲を近似するパラメータを電気的に計算し、パラメータが径路上の点における予め定められた大きさを超過すると、径路上のその点の座標値の関数としてメモリ・アドレスを発生し、上記メモリ手段からそのメモリ・アドレスに予め記憶された発声表現情報を得る手段と、からなるスピーチ処理装置。
（９）上記一連の座標値を電気的に引出す手段に接続されていて、連続する時間間隔で生ずるスピーチの周波数スペクトルを発生する手段をさらに含む、請求の範囲（８）記載のスピーチ処理装置。
（１０）上記スペクトル発生手段で使用するためにスピーチの音響波形を電気的な形に変換するためのマイクロホンをさらに含む、請求の範囲（９）記載のスピーチ処理装置。
（１１）少なくとも１つの周波数スペクトルは複数のスペクトル・ピークを有し、上記一連の座標値を電気的に引出す手段はスペクトルのピークの周波数の値から数学的空間における径路上の点の一連の座標値を計算するための手段を含む、請求の範囲（９）記載のスピーチ処理装置。
（１２）上記一連の座標値を電気的に引出す手段に接続されていて、メモリ手段から得られた順序で発声表現情報を記録する手段をさらに含む、請求の範囲（８）記載のスピーチ処理装置。
（１３）スピーチのアナログ波形のサンプルを生成し、そのサンプルをデジタル形式に変換する手段と、デジタル形式のサンプルからスピーチの周波数スペクトルを表わすデジタル値の組を引出し、デジタル値の組の各々に対する複数の聴覚状態コードのうちの１つを発生し、数学的空間における座標値の少なくとも２つの組を供給し、どの聴覚状態コードが発生されるかに基づいて第１の指定された座標値の１あるいはそれ以上の組からの選択された貢献要素によって、径路を特定する一連の他の座標値を計算する手段と、径路上の点の計算された座標値をデジタルの形で一時的に記憶する手段と、からなるスピーチ処理装置。
（１４）上記デジタル値の組を引出す手段は、スペクトルを表わすデジタル値の組から２組の第１の指定された座標値の第１の組を発生する手段を含み、上記第１の指定された座標値の第２の組はスペクトルを表わすデジタル値の組とは無関係である、請求の範囲（１３）記載のスピーチ処理装置。
（１５）上記デジタル値の組を引出す手段は、聴覚状態コードが声門音源聴覚状態を表わすとき、スペクトルを表わすデジタル値の組の１つから２組の第１の指定された座標値の第１のものを生成し、聴覚状態コードが同時に破裂−摩擦音聴覚状態を表わすとき、上記と同じ組のデジタル値から２組の第１の指定された座標値の第２のものを生成する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（１６）周波数スペクトルの１つは周波数が高くなる順序で第１、第２および第３の周波数をもった１組の３つのスペクトル突起を有し、上記デジタル値の組を引出す手段は、上記１つのスペクトルに対する声門音源状態を表わす聴覚状態コードを発生し、第３周波数対策２周波数の比、第１周波数対基準周波数の比、第２周波数対第１周波数の比を含む各値を持つように２組の座標値の第１のものを発生する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（１７）周波数スペクトルの１つは周波数が高くなる順序で第１、第２、第３の周波数をもった１組の３つのスペクトル突起を有し、他の周波数スペクトルは３つのスペクトル突起の第１のものを欠いており、上記デジタル値を引出す手段は、他の周波数スペクトルに対する破裂−摩擦音状態を表わす聴覚状態コードを発生し、また第３の周波数対策２の周波数の比を含む第１の値、実質的に一定の第２の値、第２の周波数対基準周波数の比を含む第３の値をもった２組の座標値の１つを発生する手段を含む、スピーチ処理装置。
（１８）周波数スペクトルはピークを有し、上記デジタル値を引出す手段は、ピークの少なくとも１つの幅がスピーチの良さを表わす予め定められた範囲内にあるとき少なくとも１つの貢献要素を増加する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（１９）周波数スペクトルはピークを有し、上記デジタル値を引出す手段は上記ピークの少なくとも１つの全パワーの関数として貢献要素の少なくとも１つを変化させる手段を含み、上記全パワーはスピーチの大きさを表わすものである請求の範囲（１３）記載のスピーチ処理装置。
（２０）上記デジタル値を引出す手段は、少なくとも２つのスペクトルから決定された周波数値の関数である基準周波数の関数として第１の指定された座標値の組の少なくとも１つの値を計算する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（２１）上記デジタル値を引出す手段は、時間を通じて少なくとも幾つかの周期的声門音源スペクトルから決定された周波数値の相乗平均の関数である基準周波数の関数として、第１の指定された座標値の組の少なくとも１つの値を計算する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（２２）上記デジタル値を引出す手段は、Ａ）スピーチの声高変調の周波数と、Ｂ）時間を通じてスピーチのスペクトルの少なくとも幾つかから決定された周波数値の平均の関数である基準周波数の関数として第１の指定された座標値の組の値の少なくとも１つを計算する手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（２３）上記デジタル値を引出す手段は、径路を特定する点の座標値を計算する手段を含み、それによって少なくとも１つの破裂音の発生時に、上記径路は上記２組の座標値が入り込むことのできない数学的空間の領域を通過する、請求の範囲（１３）記載のスピーチ処理装置。
（２４）上記デジタル値を引出す手段は、上記２組の座標値を含む１組の差分方程式をデジタル的に解いて、径路を特定する点の他の一連の座標値を得る手段を含む、請求の範囲（１３）記載のスピーチ処理装置。
（２５）デジタル形式のスピーチのサンプルからスピーチの周波数スペクトルを表わすデジタル値の組を引出し、デジタル値の組の各々に対する複数の聴覚状態コードの１つを発生し、デジタル値の各組から決定される声門音源感覚ポインタ値と破裂−摩擦音感覚ポインタ値を生成する手段と、声門音源感覚ポインタ値、破裂−摩擦音感覚ポインタ値、およびスペクトルには無関係な中立点の座標値から、どの聴覚状態コードが発生されたかに依存する選択された貢献要素を含む１組の差分方程式をデジタル的に解くことによって数学的空間における知覚ポインタの通路を特定する一連の座標値を、声門音源ポインタ値と破裂−摩擦音感覚ポインタ値とから計算する手段と、メモリ中のアドレスの各組に対応する各別の発声表現を表わす予め記憶された情報を保持する手段と、加速度の大きさが顕著になる径路に沿う少なくとも１つの位置を近似する座標値を識別し、識別された位置の座標の関数としてメモリ・アドレスを発生し、上記メモリ手段から、そのメモリ・アドレスに予め記憶された発声表現情報を得る手段と、からなるスピーチ処理装置。
（２６）周波数スペクトルの１つは、周波数が高くなる順序で第１、第２、第３の周波数をもつ１組の３つの突出点を有し、他の周波数スペクトルは上記３つの突出点のうちの第１のものを欠いており、上記デジタル値を引出す手段は、他のスペクトルに対する破裂−摩擦音状態を表わす聴覚状態コードを発生し、第３の周波数対策２の局波数の比を含む第１の値、実質的に一定の第２の値、第２の周波数対基準周波数値の比を含む第３の値をもつように破裂−摩擦音感覚ポインタを生成する手段を含む、請求の範囲（２５）記載のスピーチ処理装置。
（２７）基準周波数は、時間を通じて声門音源スペクトルの少なくとも幾つかから上記デジタル値を引出す手段によって決定された周波数値の相乗平均の関数である、請求の範囲（２６）記載のスピーチ処理装置。
（２８）周波数スペクトルの第１のものは周波数が高くなる順序で第１、第２、第３の周波数をもつ１組の３つの突出点を有し、周波数スペクトルの第２のものは上記３つの突出点のうちの第１のものを欠き、上記デジタル値を引出す手段は、上記第１の周波数スペクトルに対する声門音源状態と第２の周波数スペクトルに対する破裂−摩擦音状態とを表わす聴覚状態コードを発生する手段を含む、請求の範囲（２５）記載のスピーチ処理装置。
（２９）上記の計算を行なう手段は、知覚ポインタの座標値を計算する手段を含み、それによって少なくとも１つの破裂音の発生時に、上記知覚ポインタは、声門音源感覚ポインタ値と破裂−摩擦音感覚ポインタ値が入り込まない数学的空間の領域を通過する、請求の範囲（２５）記載のスピーチ処理装置。
（３０）連続する時間間隔においてそれぞれ生ずるスピーチの周波数スペクトルから、数学的空間中の点の径路を特定する当該数学的空間中の点の一連の座標値を電気的に引出す段階と、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似する座標値を時間的に識別し、その径路の位置の関数としてメモリ・アドレスを発生し、メモリ中の各アドレス群に相当する各別の発声表現を表わす予め記憶された情報を有する上記メモリ手段からそのメモリ・アドレスに予め記憶された発声表現情報を得る段階と、からなるスピーチ処理方法。
（３１）デジタル形式のスピーチのサンプルからそのスピーチの周波数スペクトルを表わすデジタル値の組を引出す段階と、上記デジタル値の組の各々に対する複数の聴覚状態コードの１つを発生し、数学的空間における少なくとも２組の座標値を供給する段階と、どの聴覚状態コードが発生されるかに依存して第１の指定された座標値の１あるいはそれ以上の組からの選択された貢献要素でもって径路を特定する一連の他の座標値を電気的に計算する段階と、からなるスピーチ処理方法。
（３２）メモリ手段と、スピーチのアナログ波形のサンプルを生成し、そのサンプルをデジタル形式に変換する手段と、デジタル形式のサンプルからスピーチの周波数スペクトルを表わす１組のデジタル値を引出し、メモリの個々の位置にスペクトル中の１あるいはそれ以上の周波数のピークの値を選択的に記憶させ、周波数の記憶された値および周波数の記憶された値の個々の位置の双方に依存する数学的空間の座標値に対応する１組のデジタル値を発生する手段と、からなり、上記所定のピークの周波数値が記憶される選択された１あるいはそれ以上の個々のメモリ位置は、第１の所定周波数帯にピークが存在するかどうか、および他のいずれかのピークが上記第１の周波数帯とこの第１の周波数帯とオーバーラップする第２の周波数帯の双方に存在するか否かに基づいている、スピーチ処理装置。
（３３）上記デジタル値を引出す手段は、より低い第１の周波数として予め定められた第１の周波数帯におけるすべての最も低い周波数ピークの周波数の値を記憶し、第２の周波数として、もしより高い第１の周波数がまた第２の周波数帯にあれば、上記より高い第１の周波数よりも高い第２の周波数帯におけるすべてのピークの周波数の値を記憶し、またピークが第２の周波数帯にあるときに、より高い第１の周波数よりも高い第２の周波数帯中にピークが存在しなければ、第２の周波数として、最初、より高い第１の周波数として記憶された周波数の値を記憶し、より高い第１の周波数としてまた最初、より低い第１の周波数として記憶された周波数の値を記憶する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３４）上記デジタル値を引出す手段は、スピーチの周波数スペクトル（この場合、周波数スペクトルの１つは、周波数が高くなる順序で第１、第２、および第３の周波数をもつ１組の３つのスペクトル突出点を有する）を表わすデジタル値の組を連続的に引出し、上記１つのスペクトルに対する声門音源状態を表わす聴覚状態コードを発生し、第３の周波数と第２の周波数の比、第１の周波数と基準周波数値の比、および第２の周波数と第１の周波数の比を含む各値をもつように座標値の組を生成する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３５）上記デジタル値を引出す手段は、少なくとも１つの鼻音の発生時に広げられあるいは分割されるピークを表わすより低いおよびより高い第１の周波数を識別し、また鼻音の発生を表わす信号を発生する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３６）上記デジタル値を引出す手段は、スピーチの周波数スペクトル（この場合、周波数スペクトルの１つは周波数が高くなる順序で第１、第２、および第３の周波数をもつ１組の３つのスペクトル突出点を有し、周波数スペクトルの他のものは上記３つの突出点のうちの１つを欠いている）を表わすデジタル値の組を連続的に引出し、また他の周波数スペクトルに対する破裂−摩擦音状態を表わす聴覚状態コードを発生し、第３の周波数と第２の周波数の比を含む第１の値、実質的に一定の第２の値、および、第２の周波数と基準周波数値の比を含む第３の値をもつ座標値の組を生成する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３７）上記デジタル値を引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を連続的に引出し、少なくとも２つのスペクトルから決定された周波数の値の関数である基準周波数値の関数として、座標値の組における値の少なくとも１つを計算する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３８）上記デジタル値を引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を連続的に引出し、時間を通じて少なくとも幾つかの周期的声門音源スペクトルから決定された周波数値の相乗平均の関数として、座標値の組における少なくとも１つの値を計算する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（３９）上記デジタル値を引出す手段は、Ａ）スピーチの声高変調の周波数と、Ｂ）時間を通じてスピーチから決定された周波数値の平均の関数である座標値の組の中の少なくとも１つの値を計算するための手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（４０）上記デジタル値を引出す手段は、第２周波数帯に対する端部周波数の値を選択するための手段を含み、選択された値はピークが予め定められた第１の周波数帯に存在するか否かに依存する、請求の範囲（３２）記載のスピーチ処理装置。
（４１）上記デジタル値を引出す手段は、第２の周波数帯とこの第２の周波数帯とオーバーラップする第３の周波数帯の双方に対する端部周波数の値を選択するための手段を含み、選択された値は第１の予め定められた周波数帯にピークが存在するか否かに依存する、請求の範囲（３２）記載のスピーチ処理装置。
（４２）上記デジタル値を引出す手段は、第２の周波数帯とこの第２の周波数帯とオーバーラップする第３のより高い周波数帯の双方に対する端部周波数の値を選択し、ピークの１つが第３の周波数帯における唯一のピークであって、しかも第２の周波数帯と第３の周波数帯の双方の中にあるか否かを決定し、もしそこにあれば個々の位置の１つに１個のピークの上側の周波数端に相当する他の周波数値を記憶させる手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（４３）上記デジタル値を引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を連続的に引出し、少なくとも２つのスペクトルから決定された基準周波数値の関数として第２の周波数帯に対する端部周波数の値を選択する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（４４）上記デジタル値を引出す手段は、スピーチの周波数スペクトルを表わすデジタル値の組を連続的に引出し、ピークの１つが一般に第２の周波数帯よりも高くしかもこの第２の周波数帯とオーバーラップする周波数帯である第３の周波数帯にあるか否かを決定し、もし第３の周波数帯中にピークが存在しなければ、各別の位置の１つに他の周波数値を記憶させる手段を含み、上記他の周波数値は第３の周波数帯中にあり且つ少なくとも２つのスペクトルから決定された基準周波数の関数である、請求の範囲（３２）記載のスピーチ処理装置。
（４５）上記デジタル値を引出す手段は、スピーチが時間を通じて継続するとき数学的空間における座標値に対応するデジタル値の別の組を連続的に発生する手段を含み、さらに、第２のメモリにおけるアドレスの各組に対応する各別の発声表現を表わす予め記憶された情報を保持する上記第２のメモリ手段と、第１の指定された座標値から数学的空間における径路上の点の一連の第２の座標値を電気的に発生し、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似するこれらの第２の座標値を識別し、位置の座標値の関数としてメモリ・アドレスを発生し、上記メモリ手段からそのメモリ・アドレスに予め記憶された発声表現を得る手段と、を具備した請求の範囲（３２）記載のスピーチ処理装置。
（４６）上記デジタル値を引出す手段は、スピーチが時間を通じて継続するとき数学的空間における座標値に対応するデジタル値の別の組を連続的に発生し、デジタル値の上記組の各々に対する複数の聴覚状態コードのうちの１つを発生し、どの聴覚状態コードが発生されたかに基づいてデジタル座標値の上記第１の指定された組の１あるいはそれ以上のものから選択された貢献要素でもって、数学的空間における径路を特定する点の一連の第２の座標値を計算する手段を含む、請求の範囲（３２）記載のスピーチ処理装置。
（４７）上記デジタル値を引出す手段は、スピーチが時間を通じて継続するとき数学的空間における座標値に対応するデジタル値の別の組を連続的に発生し、デジタル値の上記組の各々に対する複数の聴覚状態コードのうちの１つを発生する手段を含み、さらに、第２のメモリにおけるアドレスの各組に対応する各別の発声表現を表わす予め記憶された情報を保持する上記第２のメモリ手段と、どの聴覚状態コードが発生されたかに基づいてデジタル座標値の上記第１の指定された組の１あるいはそれ以上のものから選択された貢献要素でもって、数学的空間における径路上の点の一連の第２の座標値を電気的に発生し、加速度の大きさのピークの径路に沿う少なくとも１つの位置を近似するこれら第２の座標値を識別し、位置の座標値の関数としてメモリ・アドレスを発生し、上記メモリ手段からそのメモリ・アドレスに記憶された発声表現情報を得る手段と、を具備するスピーチ処理装置。