JP3996213B2

JP3996213B2 - 入力標本列処理方法

Info

Publication number: JP3996213B2
Application number: JP15812993A
Authority: JP
Inventors: チェンジュアン−フェイ
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1992-06-04
Filing date: 1993-06-04
Publication date: 2007-10-24
Anticipated expiration: 2022-10-24
Also published as: US5327520A; EP0573216A3; JPH0683400A; EP0573216A2; CA2095883C; EP0573216B1; CA2095883A1; DE69331079T2; DE69331079D1

Description

【０００１】
【産業上の利用分野】
本発明は、音声の符号化および復号化に関し、特に、蓄積伝送のための音声信号のデジタル符号化、および、音声信号を再生するためのデジタル信号の復号化に関する。
【０００２】
【従来の技術】
デジタル信号プロセッサ（ＤＳＰ）素子の性能対価格比の劇的上昇と結びついた音声符号化における最近の進歩は、音声蓄積交換システム、または、音声メッセージ送信システムのような音声処理システムにおける圧縮音声の聴覚品質を著しく改善した。このような音声処理システムの典型的な適用は、ＡＴ＆Ｔテクノロジー、１９９０年、５巻４号に掲載されたエス・ラングネカー（Ｓ．Ｒａｎｇｎｅｋａｒ）およびエム・ホッサイン（Ｍ．Ｈｏｓｓａｉｎ）の「ＡＴ＆Ｔ音声メールサービス」、および、ニューヨーク・タイムズ、１９９２年５月３日付のエイ・ラミレッツ（Ａ．Ｒａｍｉｒｅｚ）の「音声メールの果実から、依然伸びつづけるオーク」に記載されている。
【０００３】
音声メッセージ送信システムに使用される音声符号化器は、音声波形を表現するのに必要なビット数を減らすための音声圧縮を行う。音声符号化は、遠い場所に音声メッセージを伝送するのに使用しなければならないビットの数を減らすことにより、または、将来、音声メッセージを回復するのに蓄積しなければならないビットの数を減らすことにより、音声メッセージ送信に適用されている。このようなシステム内の復号化器は、原音声信号の再生を可能とするような方法で蓄積され、または、伝送された符号化音声信号を伸張する相補的機能を与える。伝送に最適な音声符号化器の顕著な性質は、低ビット速度、高聴覚品質、低遅延、多重符号化（タンデム化）に対する堅牢さ、ビット誤りに対する堅牢さ、実施の低コストであることである。他方、音声メッセージ送信に最適な符号化器は、同一低ビット速度、高聴覚品質、多重符号化（タンデム化）に対する堅牢さ、および、実施の低コストを強調するが、耐混合符号化（変換符号化）性も有する。
【０００４】
これらの相違は、音声メッセージ送信において、音声が後の回復のために大量記憶媒体を使用することにより、符号化され蓄積されるために生じる。符号化または復号化における数１００ミリ秒までの遅延は、音声メッセージ送信システムの使用者には、識別されえない。しかし、伝送業務におけるこのような大きな遅延は、エコー消去に対して多大の困難を引起すとともに、双方向実時間会話の自然なやりとりを中断する虞がある。また、信頼性の高い大量記憶媒体は、多くの現代伝送施設において見られるビット誤りよりも数倍低いビット誤り率を達成する。このため、ビット誤りに対する堅牢さは、音声メッセージ送信システムにとって第一の関心事ではない。
【０００５】
従来技術にかかる音声蓄積システムは、一般的に、国際電信電話諮問委員会（ＣＣＩＴＴ）Ｇ．７２１標準３２ｋｂ／ｓ適応差分パルス符号変調方式音声符号化器またはＡＴ＆Ｔ技術ジャーナル６５巻、５号１９８６年９月／１０月、６５巻、５号２３〜３３ページに掲載された、ジェイ・ジー・ジョーセンハンス（Ｊ．Ｇ．Ｊｏｓｅｎｈａｎｓ）、ジェイ・エフ・リンチ（Ｊ．Ｆ．Ｌｙｎｃｈ）、ジュニア，エム・アール・ロジャーズ（Ｊｒ．，Ｍ．Ｒ．Ｒｏｇｅｒｓ）、アール・アール・ロシンスキー（Ｒ．Ｒ．Ｒｏｓｉｎｓｋｉ）、および、ダブリュー・ピー・ヴァンダーメ（Ｗ．Ｐ．ＶａｎＤａｍｅ）の「報告：音声処理適用業務標準」に記載された１６ｋｂ／ｓサブバンド符号化器（ＳＢＣ）を使用している。サブバンド符号化器のより一般化された諸点は、例えば、エヌ・エス・ジェイヤント（Ｎ．Ｓ．Ｊａｙａｎｔ）およびピー・ノル（Ｐ．Ｎｏｌｌ）の「波形基準デジタル符号化と音声および画像への適用」、および、１９７７年９月１３日付で、アール・イー・クロシーレ（Ｒ．Ｅ．Ｃｒｏｃｈｉｅｒｅ）その他の者に対して発行された米国特許第４，０４８，４４３号に記載されている。
【０００６】
３２ｋｂ／ｓ適応差分パルス符号変調方式（ＡＤＰＣＭ）は、非常に良い音声品質を生じるが、そのビット速度は、望ましい速度より大きい。他方、１６ｋｂ／ｓサブバンド符号化器は、上記ビット速度の１／２の速度を有し、従来システムにおいて、コストと性能との間の理由のあるトレードオフを提供しているが、音声符号化およびデジタル信号プロセッサ技術の最近の進歩は、サブバンド符号化器を多くの現適用業務に適さないものとした。特に、新しい音声符号化器は、聴覚品質およびタンデム化／変換符号化性能に関連して、サブバンド符号化器よりも優れていることが多い。この様な新しい符号化器の典型は、いわゆる符号励振形線形予測符号化器（ＣＥＬＰ）であり、これは、例えば、ジェイ−エッチチェン（Ｊ−ＨＣｈｅｎ）により１９８９年１月１７日付で出願され、現在放棄されている米国特許出願第０７／２９８４５１号、ジェイ−エッチチェンにより１９９１年９月１０日付で出願され本件出願人に譲渡された米国特許出願第０７／７５７，１６８号、ジェイ−エッチチェンその他の者により１９９２年２月１８日付で出願され本件出願人に譲渡された米国特許出願第０７／８３７，５０９号、および、ジェイ−エッチチェンその他の者により１９９２年２月１８日付で出願され本件出願人に譲渡された米国特許出願第０７／８３７，５２２号に開示されている。関連する符号化器および復号化器は、プロクグローベコム（Ｐｒｏｃ．ＧＬＯＢＥＣＯＭ）の１２３７〜１２４１頁（１９８９年１１月）に掲載されたジェイ−エッチチェンの「１６ｋｂ／ｓの堅牢な低遅延符号励振形線形音声符号化器、プロクイカッスプ（Ｐｒｏｃ．ＩＣＡＳＳＰ）の４５３〜４５６頁（１９９０年４月）に掲載されたジェイ−エッチチェンの「２ミリ秒未満の一方向遅延を伴う高品質１６ｋｂ／ｓ音声符号化」、プロクイカッスプの１８１〜１８４頁（１９９０年４月）に掲載されたジェイ−エッチチェン、エム・ジェイ・メルヒナ−（Ｍ．Ｊ．Ｍｅｌｃｈｎｅｒ）、アール・ブイ・コックス（Ｒ．Ｖ．Ｃｏｘ）およびディ・オー・ボウカー（Ｄ．Ｏ．Ｂｏｗｋｅｒ）の「１６ｋｂ／ｓ低遅延符号励振形線形音声符号化器の実時間実施形態」に記載されている。１６ｋｂ／ｓ低遅延符号励振形線形予測標準システム候補のこれ以上の説明は、１９９１年１１月１１〜２２日のスイス、ジュネーブでの会議において国際電信電話諮問委員会研究グルームＸＶに提出された標題「１６ｋｂ／ｓ音声符号化に関する勧告案」の書類（以下、国際電信電話諮問委員会標準案という）に掲載されている。上記国際電信電話諮問委員会標準案に記載された型のシステムは、以下、低遅延符号励振形線形予測システムという。
【０００７】
【発明が解決しようとする課題】
本発明の目的は、複雑な計算が軽減された高品質な音声メッセージ符号化および復号化方法を提供することである。
【０００８】
【課題を解決するための手段】
複数個の標本順列のそれぞれを処理する音声メッセージ符号化および復号化方法において、複数個のコードベクトルのそれぞれを後向き適応利得制御器内で利得制御し、上記コードベクトルのそれぞれが対応する指標によって識別される利得調整ステップと、複数個のフィルタパラメタにより特徴付けられた合成フィルタ内で、上記利得調整されたコードベクトルのそれぞれをろ波することにより、対応するコードベクトル候補を生成するステップと、上記入力標本順列に応答して、上記合成フィルタのパラメタを調整するステップと、逐次標本順列を上記コードベクトル候補のそれぞれと比較するステップと、（ｉ）上記順列のそれぞれに対して最短距離を有するコードベクトル候補の指標と、（ii）上記合成フィルタのパラメタを出力するステップとからなることを特徴とする。
【０００９】
音声メッセージ送信システムを含めて、本発明の代表的実施例にかかる音声蓄積伝送システムは、従来の音声処理システムに対して、聴覚品質とコストとにおいて顕著な利得を達成する。本発明にかかる幾つかの実施例は、特に、音声蓄積適用業務に適しており、国際電信電話諮問委員会（伝送用）標準に一致した用途に主として適するシステムと対照されるべきであるが、本発明の実施例では、適切な伝送業務にも用いられる。
【００１０】
本発明の代表的実施例は、音声メッセージ送信符号化器として公知である。１６ｋｂ／ｓの実施例によれば、音声メッセージ送信符号化器は、１６ｋｂ／ｓ低遅延符号励振形線形予測または３２ｋｂ／ｓＡＤＰＣＭ（国際電信電話諮問委員会Ｇ．７２１）に比すべき音声品質を生じ、タンデム符号化中に良好な性能を発揮する。また、音声メッセージ送信符号化器は、音声メッセージ送信産業または音声メール産業において使用される他の音声符号化器による混合符号化（変換符号化）（例えば、ＡＤＰＣＭ，ＣＶＳＤ等）の品質低下を最小限とする。重要なことは、１６ｋｂ／ｓ音声メッセージ送信符号化器アルゴリズムの複数の符号化器・復号化器実施対は、プログラム制御に基づく１個のみのＡＴ＆Ｔデジタル信号プロセッ３２Ｃを使用して実施できることである。
【００１１】
音声メッセージ送信符号化器は、最近採用され国際電信電話諮問委員会標準案に記載された国際電信電話諮問委員会標準１６ｋｂ／ｓ低遅延符号励振形線形予測符号化器（国際電信電話諮問委員会勧告Ｇ．７２８）と共通する多くの特徴を有する。しかし、所期の目標を達成するためには、音声メッセージ送信符号化器は、代表的には低遅延符号励振形線形予測で使用される後向き適応線形予測符号化（線形予測符号化）分析法と対立する前向き適応線形予測符号化分析法を使用するのが有利である。また、音声メッセージ送信符号化器の代表的実施例は、低遅延符号励振形線形予測用５０次モデルより低い次式（代表的な場合１０次）の線形予測符号化モデルを使用するのが有利である。代表的な場合、音声メッセージ送信符号化器は、従来の符号励振形線形予測に使用される１タップ予測器よりも３タップピッチ予測器を組込む。音声メッセージ送信符号化器は、低遅延符号励振形線形予測用１０次予測器と対立する１次後向き適応利得予測器を使用する。
【００１２】
また、音声メッセージ送信符号化器は、安定度および種々のハードウェアプラットフォーム上に設けられた手段との操作互換性を高めるために、利得予測器を量子化する。本発明の実施例によれば、音声メッセージ送信符号化器は、低遅延符号励振形線形予測で使用される５次元励振ベクトルより４次元励振ベクトルを使用する。これにより、重要で複雑な計算を達成できる効果がある。また、５ビットが形状に割当てられ１ビットが利得に割当てられた６ビット利得・形状励振コードブックを説明のため使用する。他方、低遅延符号励振形線形予測は、７ビットが形状に割当てられ３ビットが利得に割当てられる１０ビット利得形状コードブックを使用する。
【００１３】
【実施例】
１．音声メッセージ送信符号化器の概要
図１の実施例において示された音声メッセージ送信符号化器は、符号化器の複雑さを軽減し１６ｋｂ／ｓで高音声品質を達成するように特別に設計された予測符号化器である。この予測符号化器は、励振コードブック１０１から励振列を利得基準化器１０２を通し、ついで、長期合成フィルタ１０３および短期合成フィルタ１０４を通すことにより、図１中のリード１００に合成音声を生じる。両合成フィルタは、図１に示されているように、それぞれ、帰還ループ内において長期予測器または短期予測器を含む適応全極フィルタである。音声メッセージ送信符号化器は、入力音声標本が１１０の入力であるときに、これら入力音声標本をフレーム毎に符号化する。各フレームについて、音声メッセージ送信符号化器は、リード１１０の入力音声と合成音声との聴覚重み付き２乗平均誤差が最小化される最良予測器、最良利得および最良励振を発見しようと、上記誤差は、比較器１１５内で確定され、聴覚重み付けフィルタ１２０内で重み付けされる。最小化は、励振コードブック１０１内の励振ベクトルに対する結果に基づいて、ブロック１２５により表示される通りに決定される。
【００１４】
長期合成フィルタ１０３は、説明の便宜のため、発声音声のため、基本ピッチ周期またはその倍数に対応する長大遅延を伴う３タイプ予測器である。このために、上記長大遅延は、ピッチ遅れといわれることもある。上記のような長期予測器は、その主要機能が発声音声におけるピッチ周期性を利用することであるので、ピッチ予測器といわれることも多い。短期合成フィルタ１０４は、説明のため、１０次予測器である。短期合成フィルタ１０４は、代表的な場合として、２．４ｋｂ／ｓ以下で動作する周知の線形予測符号化ボコーダ内で最初に使用されたので、線形予測符号化予測器いわれることがある。
【００１５】
長期予測器および短期予測器は、それぞれ、分析量子化要素１３０および１３５内で一定速度で更新される。各更新時に、新しい予測器パラメタが符号化され、要素１３７内で多重化され符号化された後、チャネル／蓄積要素１４０へ伝送される。説明を容易とするため、伝送の用語は、（１）通信チャネルを通じて復号化器へビットストリームを伝送するか、（２）復号化器による後の回復のため記憶媒体（例えば、コンピュータディスク）内にビットストリームを蓄積することを意味するのに使用される。長期合成フィルタ１０３および短期合成フィルタ１０４のパラメタの更新に対して、利得基準化器１０２により与えられた励振利得は、予め量子化された励振に埋込まれた利得情報を使用することにより、後向き利得アダプタ１４５内で更新される。
【００１６】
上記励振ベクトル量子化（ＶＱ）コードブック１０１は、説明のため、３２個の線形独立コードブックベクトル（すなわち、コードベクトル）からなる表を格納している。上記３２個の励振コードベクトルのうち各ベクトルの正負符号を決定する追加ビットにより、コードブック１０１は、各４標本励振ベクトルの候補として機能する６４個のコードベクトルからなる等価物を与える。したがって、総数６ビットは、量子化された各励振ベクトルを特定するのに使用される。したがって、励振情報は、６／４＝１．５ビット／標本＝１２ｋｂｉｔ／ｓ（例示として、８ｋＨｚ標本化が仮定される）で符号化される。長期予測器情報および短期予測器情報（副情報ともいう）は、０．５ビット／標本すなわち４ｋｂｉｔ／ｓの速度で符号化される。
【００１７】
以下、図１に示された符号化器の例示としてのデータ編成について説明する。
【００１８】
必要により、μ則パルス符号変調（ＰＣＭ）から均一パルス符号変調へ変換した後、入力音声標本は、適宜、緩衝装置に入れられ、１９２個の連続した入力音声標本（８ｋＨｚ標本化率で２４ミリ秒の音声に対応する）からなるフレームに区分される。各入力音声フレームについて、符号化器は、まず、図１に示された分析量子化要素１３５内で入力音声に線形予測分析（すなわち、線形予測符号化分析）を行うことにより、新しい反射係数集合を生じる。これらの反射係数は、以下に詳述するように、適宜、量子化され、４４ビットに符号化される。ついで、１９２標本音声フレームは、さらに、各４８個の音声フレーム（６ミリ秒）からなる４個のサブフレームに分割される。量子化された反射係数は、各サブフレームについて線形補間され、線形予測符号化予測器係数に変換される。ついで、１０次極零重み付けフィルタが、各サブフレームについて、補間された線形予測符号化予測器係数に基づいて生成される。
【００１９】
各サブフレームについて、補間された線形予測符号化予測器が線形予測符号化予測残差を生じるために使用される。線形予測符号化予測残差は、ピッチ推定器により、ピッチ予測器の大容量遅延（すなわち、ピッチ遅れ）を決定するために使用されるとともに、ピッチ予測器の３個のタップ重みを決定するため、ピッチ予測器係数ベクトル量子化器により使用される。ピッチ遅れは、例示として、７ビットに符号化され、３個のタップは、例示として、６ビットにベクトル量子化される。線形予測符号化予測器（１フレーム毎に符号化し伝送する）と異なり、ピッチ予測器は、サブフレーム毎に量子化され、符号化され、伝送される。したがって、各１９２標本フレームについて、図１に示された実施例中の副情報に対して総数４４＋４×（７＋６）＝９６ビットが割当てられる。
【００２０】
２個の予測器が量子化され符号化されると、各４８標本サブフレームは、さらに、各４標本長さの１２個の音声ベクトルに分割される。各４標本音声ベクトルについて、符号化器は、６４個の可能励振ベクトルのそれぞれを図１に示された利得基準化器および２個の合成フィルタ（予測器長期合成フィルタ１０３および短期合成フィルタ１０４、それぞれ加算器を有する）に通す。結果として生じた６４個の合成音声ベクトル候補から、および、聴覚重み付けフィルタ１２０の助けにより、符号化器は、入力信号ベクトルに関連して、周波数重み付き２乗平均誤差を最小にする合成音声ベクトルを識別する。最良合成音声ベクトル候補を生じる最良コードベクトルの６ビットコードブック指標が復号化器へ伝送される。ついで、最良コードベクトルは、次の信号ベクトルの符号化の準備において、正しいフィルタメモリを設定するため、利得基準化器および合成フィルタに通される。励振利得は、予め量子化され利得基準化された励振ベクトルに埋め込まれた利得情報に基づく後向き適応アルゴリズムにより、ベクトル毎に１回更新される。励振励振ベクトル量子化出力ビットストリームと副情報ビットストリームとは、５節で詳述されるように、図１に示された要素１３７内で一緒に多重化され、出力１３８（記憶媒体を介して直接または間接に）により、チヤネル／蓄積要素１４０により示された音声メッセージ送信符号化復号化器へ伝送される。
【００２１】
２．音声メッセージ送信符号化復号化器の概要
符号化の階段と同様に、復号化もフレーム毎基準で行われる。音声メッセージ送信符号化復号化器は、入力１５０に音声メッセージ送信符号化されたビットからなる完全なフレームを受信または回復すると、まず、副情報ビットと励振ビットとを図１に示された分離化復号化要素１５５内で分離する。ついで、分離化復号化要素１５５は、反射係数を復号化し、線形補間することにより、各サブフレームについて補間された線形予測符号化予測器を得る。ついで、得られた予測器情報は、短期予測器１７５に供給される。ピッチ遅れ、および、ピッチ予測器の３個のタップも、各サブフレームについて復号化され長期予測器１７０に供給される。ついで、復号化器は、表探索を使用して励振コードブック１６０から、伝送された励振コードベクトルを抽出する。ついで、抽出された励振コードベクトル（順に配列された）は、図１に示された利得調整ユニット１６５と２個の合成フィレタ１７０および１７５とに通されることにより、リード１８０に復号化された音声標本を生じる。ついで、復号化された音声標本は、線形パルス符号変調書式からμ則パルス符号変調符号復号化器（ＣＯＤＥＣ）内でのＤ／Ａ変換に適したμ則パルス符号変調書式に変換される。
【００２２】
３．音声メッセージ送信符号化器の動作
図２は、音声メッセージ送信符号化器の詳細なブロック線図である。図２に示された符号化器は、論理的に、図１に示された符号化器と同等のものであるが、図２に示されたシステム構成は、幾つかの適用業務のための実施形態において、計算効率が高いことを示す。
【００２３】
以下の詳細な説明において、
１．記載される各変数について、ｋは、標本化指標であり、標本は、１２５μｓの時間間隔で採られる。
２．定められた信号内の４個の連続した標本からなる群は、信号のベクトルと呼ばれる。
３．ｎは、標本指標ｋと異なるベクトル指標を指すのに使用される。
４．ｆは、フレーム指標を指すのに使用される。
【００２４】
音声メッセージ送信符号化器は、主として音声を符号化するのに使用されるので、以下の記載において、入力信号は、例えば、デュアルトーン多周波（ＤＴＭＦ）トーンを信号として伝送する通信に使用される多周波トーンのような非音声信号を含めて、音声である（非音声信号であることができるが）と仮定される。図２に示されたシステム内の種々の機能ブロックは、その機能が符号化プロセスにおいて行われる順序とほぼ同一の順序で以下記載される。
【００２５】
３．１入力パルス符号変調書式変換１
この入力ブロック１は、入力６４ｋｂｉｔ／ｓ μ則パルス符号変調信号ＳO （ｋ）を、当業者に周知の均一パルス符号変調信号Ｓ_U （ｋ）に変換する。
【００２６】
３．２フレーム緩衝記憶装置２
本ブロックは、ｓU （１９２ｆ＋１），ｓU （１９２ｆ＋２），ｓU （１９２ｆ＋３），…，ｓU （１９２ｆ＋２６４）（ただし、ｆは、フレーム指標）と名づけられた２６４個の連続した音声標本を含む緩衝装置である。フレーム緩衝装置内の最初の１９２個の音声標本は、現フレームと呼ばれる。フレーム緩衝装置内の後の７２個の標本は、次フレームの最初の７２個の標本（または、最初の１個と１／２サブフレーム）である。これら７２個の標本は、線形予測符号化分析のために使用されるハミング窓が現フレームの中央に置かれていないが、現フレームの４番目のサブフレームの中央に置かれるのが有利なので、現フレームの符号化に必要である。これは、反射係数が現フレームの最初の３個のサブフレームのために線形補間されうるように、なされる。
【００２７】
符号化器が一のフレームの符号化を完了し、次フレームの符号化の準備が整う毎に、フレーム緩衝装置は、緩衝装置内容を１９２個の標本（最古の標本は、装置外へ移動される）づつ移動し、ついで、空位置を次フレームの１９２個の新線形パルス符号変調音声標本によって充填する。例えば、符号化器の始動後の最初のフレームは、フレーム０（ｆ＝０）と指定される。フレーム緩衝装置２は、フレーム０を符号化する一方、ｓU （１），ｓU （２），…ｓU （２６４）を格納する。次フレームは、フレーム１と指定され、フレーム緩衝装置は、フレーム１を符号化する一方、ｓU （１９３），ｓU （１９４），…ｓU （４５６）を格納する。以下、同様。
【００２８】
３．３線形予測符号化予測器分析、量子化および補間３
本ブロックは、現フレームの反射係数を導出し、量子化し、符号化する。また、サブフレーム毎に１回、反射係数は、前フレームの反射係数により補間され、線形予測符号化予測器係数に変換される。符号化器初期化（リセット）に続く最初のフレームについての補間は、補間を行うための前フレームの反射係数が存在しないので、禁止される。線形予測符号化ブロック（図２中のブロック３）は、図４において展開されている。以下、図４を参照して、上記線形予測符号化ブロックを詳細に説明する。
【００２９】
ハミング窓モジュール（図４中のブロック６１）は、１９２ポイントのハミング窓をフレーム緩衝装置に蓄積された最後の１９２標本に適用する。換言すれば、ハミング窓の出力（すなわち、窓重み付き音声）は、ｗｓ（１），ｗｓ（２），…ｗｓ（１９２）と名付けられる。ついで、重み付き標本は、以下の等式（１）にしたがって、計算される。
【数１】

【００３０】
自己相関算出モジュール（ブロック６２）は、以下の等式（２）に基づいて自己相関係数Ｒ（０），Ｒ（１），Ｒ（２），…，Ｒ（１０）を算出するために、上記窓重み付き音声標本を使用する。
【数２】

【００３１】
後のレビンソン−ダービィン（Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ）再帰での潜在的に間違った条件付けを避けるために、Ｒ（０），Ｒ（１），Ｒ（２），…Ｒ（１０）に基づくパワースペクトル密度のスペクトルダイナミックレンジが制御される。これを達成する容易な方法は、白色雑音訂正による方法である。原則として、少量の白色雑音は、自己相関係数を算出する前に、｛ｗｓ（ｋ）｝順列に加えられる。これは、白色雑音でスペクトルの谷を満し、それによって、スペクトルダイナミックレンジを狭め、不適当な条件付けを軽減する。しかし、このような演算は実際には、僅かな％だけＲ（０）の値を増加することと数学的に等価である。白色雑音モジュール（ブロック６３）は、係数ＷだけＲ（０）を僅かに増加することにより、上記機能を行う。
【数３】

【００３２】
この演算は、符号化器内でのみ行われるので、音声メッセージ符号化器の種々の実施形態には、符号化器の実施形態の操作互換性に影響を与えることなく、種々の白色雑音係数を使用することができる。したがって、固定少数点実施形態は、例えば、より良い条件付けのため、より大きな白色雑音係数を使用してもよい。他方、浮動小数点実施形態は、白色雑音訂正から生じるスペクトル歪みを少なくするため、より小さい白色雑音係数を使用してもよい。３２ビット浮動小数点実施形態のために提案される白色雑音係数値は、１＋１／２５６である。この（１＋１／２５６）の値は、平均音声パワーより低い２４ｄＢレベルで白色雑音を加えることに対応する。これは、多過ぎる白色雑音訂正は、線形予測符号化器合成フィルタ（線形予測符号化器スペクトルと呼ばれることもある）の周波数応答を顕著に歪め、そのため、符号化器性能は低下するので、最大の妥当の白色雑音係数値と考えられる。
【００３３】
周知のレビンソン−ダービィン再帰モジュール（ブロック６４）は、１次から１０次まで、予測器係数を再帰的に算出する。ｉ次予測器のｊ番目の係数をａj (i) とし、ｉ番目の反射係数をｋi とする。これにより、再帰手順は、以下の式（４ａ）〜式（４ｅ）の通りに特定されうる。
【数４】

【００３４】
等式（４ｂ）〜（４ｅ）は、ｉ＝１，２，…，１０に対して再帰的に値が決定され、最終解は、式（４ｆ）で与えられる。
波記号付ａ0 ＝１と定義すると、１０次予測器誤差フィルタ（逆フィルタと呼ばれることもある）は、上記の伝達関式（４ｇ）を有する。
また、対応する１０次線形予測器は、上記の伝達関式（４ｈ）で定義される。
【００３５】
帯域幅拡大モジュール（ブロック６５）は、対応する線形予測符号化器合成フィルタの１０個の極がγ＝０．９９４１の一定の定数だけ原点の方へ径方向へ基準化されるように、量器化されていない線形予測符号化器予測器係式（数４（ｆ）内の波記号付きａi ）を基準化する。これは、線形予測符号化器スペクトルのピークの帯域幅を約１５Ｈｚだけ拡大することに対応する。このような演算は、線形予測符号化器スペクトル内の極めて鋭いピークによって引起される符号化音声内の時たまの甲高い音を避けるのに有用である。帯域幅拡大演算は、以下の式（５）で定義される。
【数５】

【００３６】
式（５）中、γ＝０．９９４１である。次のステップは、帯域幅が拡大された線形予測符号化器予測器係数を量子化のため反射係数へ変換することである（ブロック６６で行われる）。これは、標準再帰手順により行われ、１０次から１次へ戻る。山記号付ｋｍをｍ番目の反射係数とし、山記号付ａi ^(m) をｍ次予測器のｉ番目の係数とする。再帰は、以下の様になる。ｍ＝１０，９，８，…，１について、以下の２個の式（６ａ）および（６ｂ）の数値を求める。
【数６】

【００３７】
ついで、結果として生じた１０個の反射係数は、反射係数量子化モジュール（ブロック６７）により量子化され、４４ビットに符号化される。ビット割当ては、第１から第１０までの反射係数について、６，６，５，５，４，４，４，４，３，３ビットとなる（１０個のスカラー量子化器を使用して）。１０個のスカラー量子化器の各スカラー量子化器は、これと関連する予め算出され格納された２個の表を有する。第１表は、量子化器出力レベルを格納し、第２表は、隣合う量子化器出力レベル（すなわち、隣合う量子化器セル間の境界値）を格納する。１０個の量子化器のそれぞれについて、２個の表は、アークサイン変換された反射係数を指図データとして使用する最適不均一量子化器をまず設計し、ついで、サイン関数を適用して、アークサイン定義域量子化器出力レベルとセル境界とを正規反射係数定義域に逆変換することにより、有利な方法で得られる。２個の反射係数量子化器データ群のそれぞれのための、例示としての、表は、表２および３に与えられている。
【００３８】
表の使用は、各反射係数について通常のアークサイン変換計算と対照して理解されるはずである。したがって、目標とする値に対して最小値を有する量子化レベルを決定するため、反射係数が量子化器レベルと比較されるアークサイン変換定義域へ反射係数を変換することは、本発明の実施態様によれば回避される。同様に、サイン変換を使用して、選択された量子化レベルを反射係数定義域へ逆変換することも回避される。
【００３９】
代りに、使用された量子化技術は、表２および３に現われたタイプの表（量子化器出力レベルと、隣合う量子化器レベル間の境界レベル（すなわち、しきい値）とを表わす）の創製を準備する。
【００４０】
符号化期間中、１０個の反射係数のそれぞれは、その個別の量子化器セル境界表の全要素と直接比較されることにより、量子化器セルへ写像される。最適セルが識別されると、セル指標は、出力レベル表内の対応する量子化器出力レベルを探索するのに使用される。また、量子化器セル境界表内の各項目との逐次比較よりも、量子化過程を加速するため２進樹探索を使用することができる。
【００４１】
例えば、６ビット量子化器は、６４個の表示レベルと６３個の量子化器セル境界を有する。セル境界を逐次探索するよりも、反射係数が上半部に存在するか下半部に存在するかを決定するため、まず、３２個の境界を比較することができる。反射係数が下半部に存在すると仮定すると、続いて、下半部の中間境界（１６番目の境界）と比較し、６番目の比較が終了するまで、このユニットと同様に続行する。これにより、反射係数が存在するセルを告知するはずである。これは、逐次探索における６３個の最悪の場合よりも相当速い。
【００４２】
上述された量子化方法は、アークサイン量子化器と同一の最適性を達成するため、厳格に遂行されるべきである。一般的に、量子化器出力レベル表のみを使用し、より一般的な、距離算出および最小化方法を使用するときは、他の量子化器出力が得られるはずである。これは、量子化器セル境界内の項目が隣合う量子化器出力レベル間の中点でないためである。
【００４３】
全１０個の反射係数が量子化され、４４ビットに符号化されると、結果として生じた４４ビットは、４４ビットが符号化されたピッチ予測器と励振情報とにより多重化される出力ビットストリームマルチプレクサに送給される。４８個の音声標本からなる各サブフレーム（６ｍｓ）について、反射係数補間モジュール（ブロック６８）は、現フレームの量子化された反射係数と前フレームの量子化された反射係数との間で線形補間を行う。反射係数は、４番目のサブフレームの中央に配置されたハミング窓を使用して得られるので、各フレームの最初の３個のサブフレームについて、反射係数を補間するだけでよい。バー記号付ｋm と波記号付ｋm とを前フレームと現フレームのｍ番目の量子化された反射係数とし、ｋm （ｊ）をｊ番目のサブフレームのための補間されたｍ番目の反射係数とする。このとき、ｋm （ｊ）は、以下の式（７）の通り算出される。
【数７】

【００４４】
補間は、符号化器初期化（リセット）に続く最初のフレームについては禁止される。最終ステップは、各サブフレームについて補間された反射係数を対応する線形予測符号化器予測器係数に変換するため、ブロック６９を使用することである。これも、公知の再帰手順により行われる。が、このとき、再帰は、１次から１０次の方へ行われる。表記を簡単にするため、サブフレーム指標ｊを落し、ｍ番目の反射係数をｋm と名づける。また、ａi ^(m) をｍ次線形予測符号化器予測器のｉ番目の係数とする。これにより、再帰は、以下の様になる。ａ0 ⁽⁰⁾ を１と定義したとき、ｍ＝１，２，…，１０について、以下の等式に従うａi ^(m) の数値を求める。
【数８】

【００４５】
最終解は、式（９）で与えられる。
【数９】

【００４６】
結果として生じたａi は、現サブフレームについて、量子化され補間された線形予測符号化器予測器係数である。これらの係数は、ピッチ予測器分析量子化モジュール、聴覚重み付けフィルタ更新モジュール、線形予測符号化器合成フィルタおよびインパルス応答ベクトル計算器に送給される。
【００４７】
量子化され補間された線形予測符号化器係数に基づいて、線形予測符号化器逆フィルタの伝達関数を以下の式（１０）の通り定義しうる。
【数１０】

【００４８】
また、対応する線形予測符号化器は、以下の式（１１）の伝達関数により定義される。
【数１１】

【００４９】
線形予測符号化器合成フィルタは、以下の式（１２）で示された伝達関数を有する。
【数１２】

【００５０】
３．４ピッチ分析量子化、４
図２にピッチ予測器分析量子化ブロック４は、ピッチ遅れを抽出し、これを７ビットに符号化する。ついで、ベクトルは、３個のピッチ予測器タップを量子化し６ビットに符号化する。このブロックの動作は、各サブフレームについて１回行われる。このブロック（図２中のブロック４）は、図５で詳細に説明されている。以下、図５中の各ブロックについて、詳しく説明する。
【００５１】
現サブフレームの４８個の入力音声標本（フレーム緩衝装置から出力された）は、まず、等式（１０）で定義された線形予測符号化器逆フィルタ（ブロック７２）に通される。これにより、４８個の線形予測符号化器予測残差標本からなるサブフレームが生じる。
【数１３】

【００５２】
ついで、これら４８個の残差標本は、線形予測符号化器予測残差緩衝装置７３内のサブフレームを占有する。
【００５３】
線形予測符号化器予測残差緩衝装置（ブロック７３）は、１６９個の標本を格納する。最後の４８個の標本は、上記のようにして得られた（量子化されていない）線形予測符号化器予測残差標本からなる現サブフレームである。しかし、最初の１２１個の標本ｄ（−１２０），ｄ（−１１９），…，ｄ（０）は、図５中の１サブフレーム遅延ブロック７１により表示されている通り、前サブフレームの量子化された線形予測符号化器予測残差標本により占有される（量子化された線形予測符号化器予測残差は、線形予測符号化器合成フィルタへの入力として定義される）。前サブフレームを占有するために量子化された線形予測符号化器残差を使用する理由は、この占有が符号化過程中にピッチ予測器が見るものであることである。したがって、量子化された線形予測符号化器残差を使用してピッチ遅れ、および、３個のピッチ予測器タップを生じることが意味あるものとなる。他方、量子化された線形予測符号化器残差は、現サブフレームについて今だ入手不能なので、容易に理解できるように、線形予測符号化器残差緩衝装置の現サブフレームを占有するために、上記量子化された線形予測符号化器残差を使用することができない。したがって、現サブフレームについて量子化されていない線形予測符号化器残差を使用しなければならない。
【００５４】
この混合線形予測符号化器残差緩衝装置がロードされると、ピッチ遅れ抽出符号化モジュール（ブロック７４）は、ピッチ予測器のピッチ遅れを決定するため、量子化されていない線形予測符号化器残差を使用する。妥当な性能を有する種々のピッチ抽出アルゴリズムが使用できるが、以下、有利なことが判明し、実施が複雑でない効率的なピッチ抽出アルゴリズムについて説明する。
【００５５】
この効率的なピッチ抽出アルゴリズムは、以下の通り動作する。まず、線形予測符号化器残差の現サブフレームは、上記の式（１３ａ）で表わされる形を有する３次楕円フィルタによって低域通過ろ波される（例えば、１ｋＨｚしゃ断周波数）。
【００５６】
ついで、４対１で間引き標本化される（すなわち、係数４によりダウン標本化される）。これにより、バー記号付ｄ（１），ｄ（２），…，ｄ（１２）と名付けられた１２個の低域通過ろ波され間引き標本化された線形予測符号化器残差標本が生じる。これらの線形予測符号化器残差標本は、間引き標本化された線形予測符号化器残差標本の現サブフレーム（１２個の標本からなる）内に格納される。これら１２個の標本の前に、緩衝装置内に間引き標本化された複数の線形予測符号化器残差標本からなる前サブフレームを移動させることにより得られる３０個の標本、バー記号付ｄ（−２９），ｄ（−２８），…，ｄ（０）が存在する。これにより、間引き標本化された線形予測符号化器残差標本のｉ番目の相互相関は、（２０〜１２０個の標本から生じるピッチ遅れに対応する）時間遅れｉ＝５，６，７，…，３０に対して、以下の式（１４）の通り算出される。
【数１４】

【００５７】
ついで、２６個の算出相互相関値からなる最大値を与える遅れτが定義される。この遅れτは、間引き標本化された残差定義域内の遅れなので、初期未間引き標本化残差定義域内に最大相関を生じる対応する遅れは、４τ−３と４τ＋３との間に存在するべきである。ついで、初期時間分解能を得るため、未間引き標本化線形予測符号化器残差が使用され、７個の遅れｉ＝４τ−３，４τ−２，…４τ＋３について未間引き標本化線形予測符号化器残差の相互相関を以下の式（１５）の通り算出する。
【数１５】

【００５８】
７個の可能な遅れのうち、最大相互相関Ｃ（ｐ）を生じる遅れｐは、ピッチ予測器で使用される出力ピッチ遅れである。このようにして得られたピッチ遅れは、真基本ピッチ周期の倍数となり得るが、これは、ピッチ予測器がピッチ遅れとしてのピッチ周期の倍数を伴って好調に動作し続けるので、重要ではない。
【００５９】
例示の具体例によれば、１０１個の可能なピッチ周期（２０〜１２０個）しか存在しないので、このピッチ遅れを歪みなしに符号化するのに７ビットで十分である。７個のピッチ遅れ符号化ビットは、サブフレーム毎に１回、出力ビットストリームマルチプレクサに送給される。
【００６０】
ピッチ遅れ（２０〜１２０）は、ピッチ予測器タップベクトル量子化モジュール（ブロック７５）に送給される。このモジュールは、３個のピッチ予測器タップを量子化し、６４項目を含む励振ベクトル量子化コードブックを使用して、６ビットに符号化される。励振ベクトル量子化コードブック探索の歪み基準は、３個のタップ自体のより完全な２乗平均誤差よりも開ループピッチ予測残差のエネルギである。残差エネルギ基準は、係数の２乗平均誤差（ＭＳＥ）基準よりも優れたピッチ予測利得を与える。しかし、高速探索法が使用されなければ、残差エネルギ基準は、正常な場合、励振ベクトル量子化コードブック探索よりも、はるかに複雑となる。以下、音声メッセージ符号化器で使用される高速探索法の原理について説明する。
【００６１】
ｂ1 ，ｂ2 およびｂ3 を３個のピッチ予測器タップとし、ｐを上記の方法で決定されたピッチ遅れとする。これにより、３タップピッチ予測器は、以下の式（１６）で表わされる伝達関数を有する。
【数１６】

【００６２】
開ループチップ予測残差のエネルギは、以下の式（１７）で表わされる。
【数１７】

【００６３】
Ｄは、以下の式（２１）のように表現することができる。
【数１８】

【００６４】
（肩字Ｔは、ベクトルまたは行列式の転置行列を示す）したがって、Ｄを最小化することは、ＣT ｙ（すなわち、２個の９次元ベクトルの内積）を最大化することと同等である。６ビットコードブック内の６４個のピッチ予測器タップ集合候補のそれぞれについて、これと関連する９次元ベクトルｙが存在する。６４個の有りうる９次元ｙベクトルを予め算出し格納することができる。これにより、ピッチ予測器タップのためのコードブック探索において、まず、９次元ベクトルＣが算出される。ついで、６４個の格納ｙベクトルについて６４個の内積が算出され、最大内積を有するｙベクトルが識別される。ついで、ｙベクトルの最初の３個の元に０．５を乗じることにより、量子化された３個の予測器タップが得られる。このコードベクトルｙの６ビット指標は、サブフレーム毎に１回、出力ビットストリームマルチプレクサに送給される。
【００６５】
３．５聴覚重み付けフィルタ係数更新モジュール
図２中の聴覚重み付け行進ブロック５は、以下の３個の等式（２４）〜（２６）に従って、サブフレーム毎に１回、聴覚重み付けフィルタ係数を算出し更新する。
【数１９】

【００６６】
式（２５）および（２６）中、ａi は、量子化され補間された線形予測符号化器予測器係数である。聴覚重み付けフィルタは、例示として、等式（２４）中の伝達関数Ｗ（ｚ）で定義された１０次の極零フィルタである。分器分母多項式の係数は、等式（２５）および式（２６）に定義されているように、線形予測符号化器予測器係数について帯域幅拡大を行うことにより得られる。γ1 およびγ2 の代表的値は、それぞれ、０．９および０．４である。算出された係数は、３個の聴覚重み付けフィルタ（ブロック６，１０および２４）およびインパルス応答ベクトル計算器（ブロック１２）に送給される。
【００６７】
線形予測符号化器、ピッチ予測器および聴覚重み付けフィルタのフレーム毎更新またはサブフレーム毎更新までは、全て説明した。次のステップで、各サブフレーム内の１２個の４次元励振ベクトルのベクトル毎符号化を説明する。
【００６８】
３．６聴覚重み付けフィルタ
同一係数を有するが他と異なるフィルタメモリを備えた図２中の３個の聴覚重み付けフィルタ（ブロック６，１０および２４）が存在する。まず、ブロック６について説明する。図２によれば、現入力音声ベクトルｓ（ｎ）は、聴覚重み付けフィルタ（ブロック６）に通され、重み付き音声ベクトルｖ（ｎ）となる。聴覚重み付けフィルタの係数は、時間的に変動するので、直接形ＩＩデジタルフィルタ構成は、もはや、直接Ιデジタルフィルタ構成と等価ではない。したがって、入力音声ベクトルｓ（ｎ）は、まず、聴覚重み付けフィルタの有限長インパルス応答（ＩＩＲ）部によってろ波されるべきである。また、初期化（リセット）時を除いて、ブロック６のフィルタメモリ（すなわち、内部状態変数、または、フィルタの遅延ユニット内に保持された値）は、いずれの時にも０にリセットされるべきでない。他方、他の２個の聴覚重み付けフィルタ（ブロック１０および２４）のメモリは、後述する特殊な取扱いを必要とする。
【００６９】
３．７ピッチ合成フィルタ
図２には、同一の係数を有し他と異なるフィルタメモリを備えた２個のピッチ合成フィルタ（ブロック８および２２）が示されている。これらは、帰還分岐内に３タップピッチ予測器を備えた帰還ループからなる、可変次数全極フィルタである。このフィルタの伝達関数は、以下の式（２７）で表わされる。
【数２０】

【００７０】
式（２７）中、Ｐ1 （Ｚ）は、等式（１６）で定義された３タップピッチ予測器の伝達関数である。ろ波およびフィルタメモリ更新は、後述する特殊な取扱いを必要とする。
【００７１】
３．８線形予測符号化器合成フィルタ
図２に示されているように、同一係数を有し他と異なるフィルタメモリを備えた２個の線形予測符号化器合成フィルタ（ブロック９および２３）が設けられている。これらの線形予測符号化器合成フィルタは、帰還分岐（図１参照）内に１０次線形予測符号化器を備えた帰還ループからなる１０次全極フィルタである。これらのフィルタの伝達関数は、以下の式（２８）により定義される。
【数２１】

【００７２】
式（２８）中、Ｐ2 （Ｚ）およびＡ（Ｚ）は、それぞれ、等式（１０）および（１１）で定義された線形予測符号化器および線形予測符号化器逆フィルタの伝達関数である。ろ波およびフィルタメモリ更新は、以下に述べる特殊な取扱いを必要とする。
【００７３】
３．９零入力応答ベクトル算出
計算効率の高い励起励振ベクトル量子化コードブック探索を行うために、重み付け合成フィルタ（ピッチ合成フィルタ、線形予測符号化器合成フィルタおよび聴覚重み付けフィルタからなる縦続フィルタ）の出力ベクトルを２個の成分（すなわち、零入力応答（ＺＩＲ）ベクトルと零状態応答（ＺＳＲ）ベクトル）に分解することが必要である。零入力応答ベクトルは、ブロック８（非零フィルタメモリを有しない）の入力端に零信号が入力される下方一のフィルタ分岐（ブロック８、９，および１０）により算出される。零状態応答ベクトルは、零フィルタ状態（フィルタメモリ）を有し、励振がブロック２２の入力端に入力された量子化され利得基準化される上方位置のフィルタ分岐（ブロック２２，２３および２４）により算出される。２個のフィルタ分岐間の３個のフィルタメモリ制御ユニットは、そこで、上方位置（零状態応答）分岐のフィルタメモリを０にリセットし、下方位置（零入力応答）分岐のフィルタメモリを更新する。零入力応答ベクトルおよび零状態応答ベクトルの輪は、上方位置フィルタ分岐がフィルタメモリリセット端子を有しないときは、上方位置フィルタ分岐の出力ベクトルと同一となる。
【００７４】
符号化過程において、零入力応答ベクトルがまず算出され、ついで、励振ベクトル量子化コードブック探索が行われ、ついで、零状態応答ベクトル算出とフィルタメモリ更新とが行われる。この順序で、上記タスクを説明するのが自然の手順である。したがって、本節では、零入力応答ベクトル算出のみを説明し、零状態応答ベクトル算出およびフィルタメモリ更新の説明は、以下の節に延期する。
【００７５】
現零入力応答ベクトルｒ（ｎ）を算出するため、ノード７において零入力信号を入力する。また、零入力応答分岐内の３個のフィルタ（ブロック８，９および１０）をして、いずれの標本についても、前ベクトルについてなされたメモリ更新の後のフィルタメモリが残されている４標本（１個のベクトル）についてリングを形成させる。これは、零信号がノード７において入力された４標本についてのろ波を継続することを意味する。結果として生じたブロック１０の出力は、所望の零入力応答ベクトルｒ（ｎ）である。
【００７６】
フィルタ９および１０のメモリは、一般的非零である（初期化後を除いて）。したがって、ノード７からのフィルタ入力が０であっても、出力ベクトルｒ（ｎ）も、一般的に、非零である。見掛け上、このベクトルｒ（ｎ）は、利得基準化された前励振ベクトルｅ（ｎ−１），ｅ（ｎ−２），…．に対する３個のフィルタの応答である。このベクトルは、時刻（ｎ−１）までのフィルタメモリと関連する非強制的応答を表わす。
【００７７】
３．１０励振ベクトル量子化目標ベクトル算出１１
本ブロックは、励振ベクトル量子化コードブック探索目標ベクトルｘ（ｎ）を得るため、重み付き音声ベクトルｖ（ｎ）から零入力応答ベクトルｒ（ｎ）を減算する。
【００７８】
後向き利得アダプタ２０は、全ベクトル時間指標ｎについて、励振利得σ（ｎ）を更新する。励振利得σ（ｎ）は、選択された励振ベクトルｙ（ｎ）を基準化するために使用される基準化係数である。本ブロックは、選択された励振コードブック指標を入力とみなし、出力として励振利得σ（ｎ）を生じる。本機能ブロックは、対数利得定義域内で適応１次線形予測を使用することにより、利得ｅ（ｎ−１）に基づいて利得ｅ（ｎ）を予測しようとする。明細書中、ベクトルの利得は、ベクトルの２乗平均平方根値（ＲＭＳ）として定義され、対数利得は、２乗平均平方根値のｄＢレベルである。後向きベクトル利得アダプタ２０の詳細は、図６に示されている。
【００７９】
図６を参照すれば判るように、ｊ（ｎ）は、時刻ｎについて選択された勝利の５ビット励振形状コードブック指標を示すとする。この場合、１ベクトル遅延ユニット８１は、前励振ベクトルｙ（ｎ−１）の指標であるｊ（ｎ−１）を利用できるものとする。この指標ｊ（ｎ−１）により、励振形状コードブック対数利得表（ブロック８２）は、ｙ（ｎ−１）の２乗平均平方根値のｄＢ値を探索するのに表探索を行う。この表は、便宜上、まず、３２個の形状コードベクトルのそれぞれの２乗平均平方根値を算出することにより得られる。ついで、底が１０の対数をとり、その結果に２０を乗ずる。
【００８０】
σe （ｎ−１）およびσy （ｎ−１）をそれぞれｅ（ｎ−１）およびｙ（ｎ−１）の２乗平均平方根値とする。また、これらσe （ｎ−１）およびσy （ｎ−１）のｄＢ値を以下の式（２９）および式（３０）で表わすものとする。
【００８１】
【数２２】

【００８２】
また、以下の式（３１）で表わされるように定義する。
【数２３】

【００８３】
定義により、利得基準化された励振ベクトル（ｎ−１）は、以下の式（３２）で与えられる。
【数２４】

【００８４】
したがって、以下の式（３３）または式（３４）が得られる。
【数２５】

【００８５】
したがって、ｅ（ｎ−１）の２乗平均平方根のｄＢ値（または、対数利得）は、前対数利得ｇ（ｎ−１）および前励振コードベクトルｙ（ｎ−１）の対数利得ｇy （ｎ−１）の和である。
【００８６】
形状コードベクトル対数利得表８２は、ｇy （ｎ−１）を発生させ、１ベクトル遅延ユニット８３は、前対数利得ｇ（ｎ−１）を利用可能とする。ついで、加算器８４は、２個の期間を加算してｇe （ｎ−１）、すなわち、前利得基準化励振ベクトルｅ（ｎ−１）の対数利得を得る。
【００８７】
図６によれば、３２ｄＢの対数利得オフセット値は、対数利得オフセット値保持器８５に格納されている。この値は、入力音声がμ則符号化されており、飽和値より小さい−２２ｄＢのレベルを有すると仮定すると、発声された音声の期間中のｄＢ単位の平均励振利得レベルとほぼ等しいことを意味する。加算器８６は、上記３２ｄＢ対数オフセット値を減算する。ついで、結果として生じたオフセット除去対数利得δ（ｎ−１）は、対数線形予測器９１に送給される。オフセット除去対数利得δ（ｎ−１）は、再帰形窓付けモジュール８７にも送給され、対数利得線形予測器９１の係数を更新する。
【００８８】
再帰形窓付けモジュール８７は、標本毎に動作する。再帰形窓付けモジュール８７は、一連の遅延ユニットを経てδ（ｎ−１）を供給し、ｉ＝０，１について、積δ（ｎ−１）δ（ｎ−１−ｉ）を算出する。ついで、結果として生じた複数の積項は、２個の固定係数フィルタ（各項について１個のフィルタ）に供給され、ｉ番目のフィルタの出力は、ｉ番目の自己相関係数Ｒg （ｉ）である。上記２個の固定係数フィルタは、その出力として、自己相関係数を算出するので、再帰形自己相関フィルタと呼ぶ。
【００８９】
これら２個の再帰形自己相関フィルタのそれぞれは、３個の縦続接続された１次フィルタからなる。最初の２段は、以下の数式で表わされる伝達関数を有する同一の全極フィルタである。
１／［１ーα²ｚ^ー1］、ただし、α＝０．９４
【００９０】
また、第３段は、下記数式で表わされる伝達関数を有する極零フィルタである。［Ｂ（０，１）＋Ｂ（１，１）ｚ^ー1］／［１ーα²ｚ^ー1］
ただし、
Ｂ（０，ｉ）＝（ｉ＋１）αⁱ
Ｂ（１，ｉ）＝ー（ｉー１）αⁱ⁺²
【００９１】
Ｍij（ｋ）を時刻ｔにおけるｉ番目の再帰形自己相関フィルタのｊ番目の１次部のフィルタ状態変式（メモリ）とする。また、ａr ＝α² を全極部の係数とする。２個の再帰形自己相関フィルタの全状態変数は、符号化器始動（リセット）において０に初期化される。再帰形窓付けモジュールは、以下の式（３５ａ）〜（３５ｄ）に示す再帰に従って、ｉ番目の自己相関係数Ｒ（ｉ）を算出する。
【数２６】

【００９２】
初期化に続く最初のサブフレームを除いて、サブフレーム毎に１回、利得予測器係数が更新される。最初のサブフレームについて、予測器係数の初期値（１）が使用される。各サブフレームは、１２個のベクトルを含むので、サブフレーム内の最初値を処理するとき（自己関連係数が必要とされるとき）を除いて、２個のフィルタの全零部と関連する２個の乗加算を行わないことにより、計算を節約することができる。換言すれば、等式（３５ｄ）は、１２個の音声ベクトル毎に１回、値が求められる。しかし、等式（３５ａ）〜（３５ｃ）を使用して、各音声ベクトルの３個の全極部のフィルタメモリを更新する必要は、ない。
【００９３】
２個の自己相関係数Ｒｇ（ｉ），ｉ＝０，１が算出されると、図６中のブロック８８，８９および９０を使用して、１次対数利得予測器係数が算出され、量子化される。音声メッセージ符号化器の実時間実施形態によれば、後述する単一の動作により、３個のブロック８８，８９および９０が実行される。これら３個のブロックは、それぞれ、図６に示されており、理解を容易とするため、以下、それぞれ検討される。
【００９４】
対数利得係数を算出する前に、対数利得予測器係数計算器（ブロック８８）は、まず、（１＋１／２５６）の白色雑音係数をＲg （０）に適用する。すなわち、以下の式（３６）によって表わされる。
【数２７】

【００９５】
浮動小数点実施形態でさえも、操作互換性、（インタオペラビリティ）を確保するために２５７／２５６の白色雑音相関係数を使用する必要がある。これにより、１次対数予測器係数は、以下の式（３７）の通り算出される。
【数２８】

【００９６】
ついで、帯域幅拡大モジュール８９は、以下の式（３８）の値を求める。
【数２９】

【００９７】
帯域幅拡大は、後向きベクトル利得アダプタ（図２中のブロック２０）がチャネル誤りに対する符号化器堅牢性を増強するのに重要なステップである。乗数値０．９は、単なる例示である。他の具体例においては、他の値が有用であった。
【００９８】
ついで、対数利得予測器係数量子化モジュール９０は、代表的な場合として、標準的な方法で対数利得予測量子化器レベル表を使用して、波記号付α1 を量子化する。量子化は、符号化および伝送が第１目的でなく、むしろ、符号化器と復号化器との間の利得予測器の誤追跡が起きる確率を減らし、デジタル信号プロセッサの実施形態を簡単にするのが目的である。
【００９９】
ブロック８８，８９および９０の機能を上述したので、以下、一の動作において、これらのブロックを具体化する具体化手続について説明する。代表的デジタル信号プロセッサ内での除算の具体化は、乗算よりも、多くの命令サイクルを必要とするので、等式（３７）に明記された除算は、最良の方法で回避される。これは、等式（３６）〜（３８）を組合わせることによりなされ、以下の等式（３９）を得る。
【数３０】

【０１００】
Ｂi を対数利得予測器係数量子化器のｉ番目の量子化器セル境界（すなわち、決定しきい値）とする。波記号付α1 （数３９の左の記号を表す）の量子化は、標準的な場合、いずれの波記号付量子化器セルα1 が内在するかを決定するため、波記号付α1 を複数のＢi と比較することにより行われる。しかし、波記号付α1 とＢi との比較は、Ｒg （１）を１．１１５Ｂi Ｒg （０）と直接比較することと同等である。したがって、ブロック８８，８９および９０の機能を一の動作で行うことができ、等式（３７）中の除算は、回避される。この手順により、効率は、（基準化された）係数量子化器セル境界表として、Ｂi よりも１．１１５Ｂi を格納することにより、最良の方法で達成される。
【０１０１】
波記号付α1 の量子化版（α1 と名付けられる）は、各サブフレームについて１回、対数利得線形予測器９１の係数を更新する。また、この係数更新は、全てのサブフレームの最初の音声ベクトルについて生じる。更新は、符号化器初期化（リセット）後の最初のサブフレームの間、禁止されされる。１次対数利得線形予測器９１は、δ（ｎ−１）に基づいてδ（ｎ）を予測しようとする。δ（ｎ）の予測版（山記号付δ（ｎ）と名付けられる）は、以下の式（４０）で与えられる。
【数３１】

【０１０２】
山記号付δ（ｎ）が対数利得線形予測器９１によって生成された後、ブロック８５内に格納された３２ｄＢの対数オフセット値が加算される。ついで、対数利得リミッタは、生じた対数利得値を検査し、この値が不合理なほど大きいか小さいときは、この値の切落しを行う。切落しの下限および上限は、それぞれ、０ｄＢおよび６０ｄＢに設定される。利得リミッタは、線形定義域内の利得が１〜１０００であるのを保証する。
【０１０３】
対数線形出力は、現対数利得ｇ（ｎ）である。この対数利得値は、遅延ユニット８３に供給される。ついで、逆対数計算器９４は、以下の等式（４０ａ）を使用して、対数利得ｇ（ｎ）を線形利得σ（ｎ）に逆変換する。
σ（ｎ）＝１０^g(n)/20
【０１０４】
３．１２励振コードブック探索モジュール
図２に示されているように、ブロック１２〜ブロック１８は、共動してコードブック探索モジュール１００を形成する。このモジュールは、励振ベクトル量子化ベクトルコードブック（ブロック１９）内の６４個のコードベクトル候補を探索し、聴覚重み付き２乗平均誤差距離に関連して入力音声ベクトルに最も近い量子化音声ベクトルを生成するコードベクトルの指標を識別する。
【０１０５】
励振コードブックは、６４個の４次元コードベクトルを格納する。６個のコードブック指標ビットは、１個の符号ビットと５個の形状ビットとからなる。換言すれば、３２個の線形独立形状コードベクトルを格納する５ビット形状コードブックと、正負符号ビットが０か１かによって、＋１か−１の正負符号乗数が存在する。この正負符号ビットは、コードブック探索の複雑さを倍加することなく、コードブックサイズを効果的に倍加する。正負符号ビットは、６ビットコードブックを４次元ベクトル空間の原点に対して対称とする。したがって、６ビット励振コードブック内の各コードベクトルは、コードブック内の一のコードベクトルでもある原点に対して鏡像を有する。５ビット形状コードブックは、例えば、指図過程において記録音声資料を使用する指図形コードブックであるのが効果的である。
【０１０６】
コードブック探索手順を詳細に説明する前に、まず、有利なコードブック探索法の一般的面を簡単に説明する。
【０１０７】
３．１２．１励振コードブック探索の概要
原則として、コードブック探索モジュールは、現励振利得σ（ｎ）によって６４個の候補コードベクトルのそれぞれを基準化し、ついで、結果として生じた６４個のベクトルを一時に１個づつピッチ合成フィルタＦ1 （ｚ）、ＬＰＣ合成フィルタＦ2 （ｚ）および聴覚重み付けフィルタＷ（ｚ）からなる縦続フィルタに通す。フィルタメモリは、コードブック探索モジュールが縦続フィルタ（伝達関数Ｈ（ｚ）＝Ｆ1 （ｚ）Ｆ2 （ｚ）Ｗ（ｚ））に新しいコードベクトルを供給する毎に、０にリセットされる。
【０１０８】
励振ベクトル量子化コードベクトルのこのタイプの零状態ろ波は、行列ベクトル乗算との関係で表現されうる。ｙj を５ビット形状コードブック内のｊ番目のコードベクトルとし、ｇi を１ビット正負符号乗数コードブック（ｇ0 ＝＋１およびｇ1 ＝−１）内のｉ番目の正負符号乗数とする。｛ｈ（ｋ）｝は、縦続フィルタＨ（ｚ）のインパルス応答順列を示すとする。この場合、コードブック指標ｉおよびｊで特定されたコードベクトルが縦続フィルタＨ（ｚ）に供給されたときは、フィルタ出力は、以下の式（４１）および（４２）のように表現することができる。
【数３２】

【０１０９】
コードブック探索モジュールは、以下の式（４３）で表わされるように、以下の２乗平均誤差（ＭＳＥ）歪みを最小にする指標ｉおよびｊの最良の組合わせを探索する。
【数３３】

【０１１０】
式（４３）中、山記号付ｘ（ｎ）＝ｘ（ｎ）／σ（ｎ）は、利得正規化されたベクトル量子化目標ベクトルであり、記号式‖ｘ‖は、ベクトルｘのユークリッドノルムを意味する。項を展開すると式（４４）が得られる。
【数３４】

【０１１１】
ｇi ² ＝１並びに‖山記号付ｘ（ｎ）‖² およびσ² （ｎ）の値は、コードブック探索中一定なので、Ｄを最小とすることは、以下の式（４５）で表わされる最小化と同等である。
【数３５】

【０１１２】
Ｅj は、実際には、ｊ番目のろ波された形状コードベクトルのエネルギであって、励振ベクトル量子化目標ベクトル、波記号付ｘ（ｎ）に依存しない。また、形状コードベクトルｙj は一定であり、行列Ｈは、縦続フィルタＨ（ｚ）（各サブフレームについて一定である）のみに依存する。したがって、Ｅj も各サブフレームについて一定である。この観察に基づいて全フィルタが各サブフレームの始めに更新されたときは、３２個のエネルギ項Ｅj ，ｊ＝０，１，２，…，３１（３２個の形状コードベクトルに対応する）を算出し格納することができる。ついで、サブフレーム内の１２個の励振ベクトルのコードブック探索のため、これらのエネルギ項を使用することができる。エネルギ項Ｅj を予め算出することによりコードブック探索の複雑さを軽減する。
【０１１３】
与えられた形状コードブック指標ｊについて、等式（４５）で定義された歪み項は、正負符号項ｇi が内積項ｐ^T （ｎ）ｙj と同一正負符号を有するように選択されたとき、最小となる。したがって、各形状コードブック探索のための最良正負符号ビットは、内積ｐ^T （ｎ）ｙj の正負符号により決定される。したがって、コードブック探索において、ｊ＝０，１，２，…，３１について等式（４５）の数値を求め、形状指標ｊ（ｎ）と山記号付Ｄを最小とする、対応する正負指標ｉ（ｎ）を選択する。最良指標ｉとｊとが識別されると、これらの指標は、連結され、コードブック探索モジュールの出力（単一の６ビット励振コードブック指標）を形成する。
【０１１４】
３．１２．２励振コードブック探索モジュールの動作
コードブック探索の原理について上述したので、以下、コードブックモジュール１００の動作について説明する。図２を参照のこと。ＬＰＣ合成フィルタと聴覚重み付けフィルタの係数が各サブフレームの始めにおいて更新される毎に、インパルス応答ベクトル計算器１２は、縦続フィルタＦ2 （ｚ）Ｗ（ｚ）のインパルスの最初の４個の標本を計算する。ただし、ピッチ合成フィルタのピッチ遅れは、少なくとも２０標本となり、そのため、Ｆ1 （ｚ）は、２０番目の標本の前ではＨ（ｚ）のインパルス応答に影響を及ぼすことができないので、ここでは、省略される。インパルス応答ベクトルを算出するため、まず、縦続フィルタＦ2 （ｚ）Ｗ（ｚ）のメモリは、０に設定され、ついで、縦続フィルタは、入力列｛１，０，０，０｝により励振される。縦続フィルタの対応する４個の出力標本は、ｈ（０），ｈ（１），…，ｈ（３）となり、所望のインパルス応答ベクトルを構成する。インパルス応答ベクトルは、サブフレーム毎に１回、算出される。
【０１１５】
ついで、形状コードベクトル繰込みモジュール１３は、３２個のベクトルＨｙj （ただし、ｊ＝０，１，２，…，３１）を算出する。換言すれば、モジュール１３は、各形状コードベクトルｙj （ただし、ｊ＝０，１，２，…，３１）にインパルス応答順列ｈ（０），ｈ（１），…，ｈ（３）を繰込む。繰込みは、最初の４個の標本についてのみ行われる。ついで、結果として生じた３２個のベクトルのエネルギは、等式（４７）に従って、エネルギ表計算器１４により算出され格納される。ベクトルのエネルギは、ベクトルの全ての元の２乗の合計として定義される。
【０１１６】
ブロック１２，１３および１４内の計算は、サブフレーム毎に１回のみ行われる。他方、コードブック探索モジュール１００内の他のブロックは、各４次元音声ベクトルについて計算を行う。
【０１１７】
励振ベクトル量子化目標ベクトル正規化モジュール１５は、利得正規化された励振ベクトル量子化目標ベクトル山記号付ｘ（ｎ）＝ｘ（ｎ）／σ（ｎ）を計算する。デジタル信号プロセッサの具体化においては、まず、１／σ（ｎ）を算出し、ついで、ｘ（ｎ）の各元に１／σ（ｎ）を乗じるのが、より効率的である。
【０１１８】
ついで、時間反転繰込みモジュール１６は、ベクトルｐ（ｎ）＝２Ｈ^T ・山記号付ｘ（ｎ）を算出する。この演算は、まず、山記号付ｘ（ｎ）の全ての元の順序を逆転し、ついで、生じたベクトルにインパルス応答ベクトルを繰込み、ついで、再び、出力の元の順序を逆転することと同等である（これにより、時間反転繰込みと名付けられる）。
【０１１９】
Ｅj 表が予め算出され格納され、ベクトルｐ（ｎ）が算出されると、誤差計算器１７およびコードブック指標選択器１８は、共動して、以下の効率的なコードブック探索アルゴリズムを実行する。
【０１２０】
１．山記号付Ｄｍｉｎを、音声メッセージ送信符号化器を具体化した目標機械によって表わされうる最大数に初期化する。
２．形状コードブック指標ｊ＝０を設定する。
３．内積Ｐj ＝ｐ^T （ｎ）ｙj を算出する。
４．Ｐj ＜０のときは、ステップ６に進む。その他の場合は、山記号付Ｄ＝−Ｐj ＋Ｅj を算出し、ステップ５へ進む。
５．山記号付Ｄ≧山記号付Ｄｍｉｎのときは、ステップ８に進む。その他の場合は、山記号付Ｄｍｉｎ＝山記号付Ｄ，ｉ（ｎ）＝０，およびｊ（ｎ）＝ｊと設定する。
６．山記号付Ｄ＝Ｐj ＋Ｅj を算出し、ステップ７へ進む。
７．山記号付Ｄ≧山記号付Ｄｍｉｎのときは、ステップ８に進む。その他の場合は、山記号付Ｄｍｉｎ＝山記号付Ｄ，ｉ（ｎ）＝１，およびｊ（ｎ）＝ｊと設定する。
８．ｊ＜３１のときは、ｊ＝ｊ＋１と設定し、ステップ３へ進む。その他の場合は、ステップ９へ進む。
９．最適形状指標ｉ（ｎ）と最適利得指標ｊ（ｎ）とを結合し、結果として生じた出力を出力ビットストリームマルチプレクサに送給する。
【０１２１】
３．１３零状態応答ベクトル計算とフィルタメモリ更新
現ベクトルについて励振コードベクトル探索がなされた後、選択されたコードベクトルは、零状態応答ベクトル（図２中のブロック８，９および１０内のフィルタメモリを更新するのに使用される）を得るのに使用される。
【０１２２】
まず、以下の式（４８）で表わされる、対応する量子化された励振コードベクトルを抽出するため、励振ベクトル量子化コードベクトル（ブロック１９）に供給される。
【数３６】

【０１２３】
ついで、利得基準化ユニット（ブロック２１）は、上記量子化された励振コードベクトルを現励振利得σ（ｎ）によって基準化する。結果として生じた量子化利得基準化励振ベクトルは、ｅ（ｎ）＝σ（ｎ）ｙ（ｎ）（等式（３２））として算出される。零状態応答ベクトルを算出するため、３個のフィルタメモリ制御ユニット（ブロック２５，２６および２７）は、まず、ブロック２２，２３および２４内のフィルタメモリを０にリセットする。ついで、縦続フィルタ（ブロック２２，２３および２４）が量子化利得基準化励振ベクトルｅ（ｎ）をろ波するため使用される。ｅ（ｎ）は、４標本だけの長さであり、フィルタは、零メモリを有するので、ブロック２２のろ波動作のみがそのフィルタメモリ内へｅ（ｎ）の元の移動を含む。また、フィルタ２３および２４の乗加算の数は、それぞれ、４標本期間において０〜３回となる。これは、フィルタメモリが０でないとすれば、必要となるはずの標本毎に３０回の乗加算という複雑さと比較して、かなり簡単である。
【０１２４】
フィルタ２２，２３および２４によるｅ（ｎ）のろ波は、これら３個のフィルタのそれぞれのフィルタメモリの最初に４個の非零元を生成する。ついで、フィルタメモリ制御ユニット（ブロック２５）は、ブロック２２の最初の４個の非零フィルタメモリ元を受入れ、これらの元を１個づつブロック８の対応する４個のフィルタメモリ元に加える。この点で、ブロック８，９および１０のフィルタメモリは、零入力応答ベクトルｒ（ｎ）を生じるため以前に行われたろ波動作の後まで残されたものである。同様に、フィルタメモリ制御ユニット（ブロック２６）は、ブロック２３の最初の４個の非零フィルタメモリ元を受入れ、これらの元をブロック９の対応するフィルタメモリ元に加える。また、フィルタメモリ制御ユニット３（ブロック２７）は、ブロック２４の最初の４個の非零フィルタメモリ元を受入れ、これらの元をブロック１０の対応するフィルタメモリ元に加える。これにより、効果として、零状態応答がフィルタ８，９および１０の零入力応答に加えられ、フィルタメモリ更新動作が完了する。フィルタ８，９および１０内に結果として生じたフィルタメモリは、次の音声ベクトル符号化時に零入力応答ベクトルを算出するのに使用される。
【０１２５】
フィルタメモリ更新後は、線形予測符号化器合成フィルタ（ブロック９）のメモリの最初の４個の元は、復号化器出力（量子化された）音声ベクトルｓq （ｎ）の元と正確に同一である。したがって、符号化器内で、フィルタメモリ更新動作の副産物として、量子化された音声が得られる。
【０１２６】
これにより、ベクトル毎符号化過程の最後のステップが完了する。ついで、符号化器は、フレーム緩衝装置から次の音声ベクトルｓ（ｎ＋１）を受入れ、これを同一の方法で符号化する。これにより、ベクトル毎符号化過程は、現フレーム内の全４８個の音声ベクトルが符号化されるまで、繰返される。ついで、符号化器は、後続のフレームの期間中、全フレーム毎符号化過程を繰返す。
【０１２７】
３．１４出力ビットストリームマルチプレクサ
各１９２標本フレームの期間中、出力ビットストリームマルチプレクサブロック２８は、５節でより完全に記載されるように、４４個の反射係数符号化ビット、（１３×４）個のピッチ予測器符号化ビットおよび（４×４８）個の励振符号化ビットを特別フレーム書式に多重化する。
【０１２８】
４．音声メッセージ送信符号化復号化器の動作
図３は、音声メッセージ送信符号化復号化器の詳細なブロック線図である。各ブロックの機能に関する説明は、以下の分節において与えられる。
【０１２９】
４．１入力ビットストリームデマルチプレクサ４１
本ブロックは、入力４０に現われた入力ビットストリームを緩衝し、ビットフレーム境界を見出し、符号化された３種のデータ（すなわち、反射係数、ピッチ予測器パラメタ、および、５節に記載されたビットフレーム書式に従う励振ベクトル）を分離する。
【０１３０】
４．２反射係数復号化器４２
本ブロックは、入力ビットストリームデマルチプレクサから４４個の反射係数符号化ビットを受入れ、１０個の反射係数について、１０個のビット群に分離し、ついで、量子化反射係数を得るため、表２に示されたタイプの反射係数量子化器出力レベル表を使用して、表探索を実行する。
【０１３１】
４．３反射係数補間モジュール４３
このブロックは、節３．３において説明されている（等式（７）参照）。
【０１３２】
４．４線形予測符号化予測器係数変換モジュール４４
本ブロックの機能は、節３．３に記載されている（等式（８）および（９）参照）。結果として生じた線形予測符号化予測器係数は、２個の線形予測符号化合成フィルタ（ブロック５０および５２）に送給され、サブフレーム毎に１回、これらフィルタの係数を更新する。
【０１３３】
４．５ピッチ予測器復号化器４５
本ブロックは、入力ビットストリームデマルチプレクサから１３個のピッチ予測器符号化ビットからなる４個の集合（各フレームの４個のサブフレームについて）を受入れる。ついで、本ブロックは、各サブフレームについて、７個のピッチ遅れ符号化ビットと６個のピッチ予測器タップ符号化ビットに分離し、各サブフレームについて、ピッチ遅れを算出し、３個のピッチ予測器タップを復号化する。３個のピッチ予測器タップは、ピッチ予測器タップ励振ベクトル量子化コードブック表での番地において対応する９次元コードベクトルの最初の３個の元を抽出するため、上記の番地として６個のピッチ予測器タップ符号化ビットを使用して復号化され、ついで、一の実施例によれば、上記３個の元に０．５を乗じる。復号化ピッチ遅れと復号化ピッチ予測器タップとは、２個のピッチ合成フィルタ（ブロック４９および５１）に送給される。
【０１３４】
４．６後向きベクトル利得アダプタ４６
本ブロックは、節３．１１に記載されている。
【０１３５】
４．７励振ベクトル量子化コードブック４７
本ブロックは、音声メッセージ送信符号化器内のコードブック１９と同一の励振ベクトル量子化コードブック（形状コードブックおよび正負符号乗数コードブックを含む）を格納する。現フレーム内の４８個のベクトルのそれぞれについて、本ブロックは、入力ビットストリームデマルチプレクサ４１から、対応する６ビット励振コードブック指標を得て、この６ビット励振コードブック指標を使用して、表検索を行うことにより、音声メッセージ送信符号化器内で選択された励振コードベクトルｙ（ｎ）を抽出する。
【０１３６】
４．８利得基準化ユニット４８
本ブロックの機能は、３．１３節において記載されたブロック２１と同一のものである。本ブロックは、ｅ（ｎ）＝σ（ｎ）ｙ（ｎ）として利得基準化励振ベクトルを算出する。
【０１３７】
４．９ピッチ合成フィルタおよび線形予測符号化合成フィルタ
ピッチ合成フィルタ４９および５１と線形予測符号化合成フィルタ５０および５２とは、音声メッセージ送信符号化器内の相補物と同一の伝達関数を有する（無誤り伝送と仮定して）。上記フィルタ４９，５０，５１，５２は、利得基準化励振ベクトルｅ（ｎ）をろ波することにより、復号化音声ベクトルｓｄ（ｎ）を生成する。切捨て数値誤差が重要でないときは、理論的に言えば、ｅ（ｎ）を、ピッチ合成フィルタと線形予測符号化合成フィルタとからなる簡単な縦続フィルタに通すことにより、復号化された音声ベクトルを生成することができる。数学的に同等であるが算術的に他と異なる方法で復号化器ろ波動作を実行すれば、有限精度効果のため、復号化された音声が摂動されることになる虞がある。復号化時の切捨て誤差の累積を回避するため、復号化器がｓｑ（ｎ）を得るため符号化器内で使用される手続を正確に繰返すことが強く勧められる。換言すれば、復号化器も、符号化器内で行われたように、零入力応答と零状態応答の和としてｓｄ（ｎ）を算出すべきである。
【０１３８】
これは、図３中の復号化器に示されている。図３に示されているように、ブロック４９〜５４は、符号化器内のブロック８，９，２２，２３，２５および２６の正確なコピーであることが有利である。これらのブロックの機能は、３節に記載されている。
【０１３９】
４．１０出力パルス符号変調書式変換
本ブロックは、復号化音声ベクトルｓｄ（ｎ）の４個の元を、対応する４個のμ則パルス符号変調標本に変換し、これら４個のμ則パルス符号変調標本を１２５μｓ時間間隔で逐次出力する。これにより、復号化過程が完了する。
【０１４０】
５．圧縮データ書式
５．１フレーム構成
音声メッセージ送信符号化器は、例示として、１９２個のμ則標本（１９２バイト）を圧縮データフレーム（４８バイト）に圧縮するブロック符号化器である。１９２個の入力標本からなる各ブロックについて、音声メッセージ送信符号化器は、１２バイトの副情報と３６バイトの励振情報とを生成する。本節において、圧縮データフレームを生成するために副情報と励振情報とが組立てられる方法を説明する。
【０１４１】
副情報は、長期予測フィルタおよび短期予測フィルタのパラメタを制御する。音声メッセージ送信符号化器において、長期予測器は、ブロック毎（４８標本毎）に４回更新され、短期予測器は、ブロック毎（１９２標本毎）に１回更新される。長期予測器のパラメタは、ピッチ遅れ（期間）と３個のフィルタ係式（タップ重み）からなる集合からなる。フィルタタップは、ベクトルとして符号化される。音声メッセージ送信符号化器は、ピッチ遅れを２０と１２０との間の整数に制限する。圧縮データフレーム内に蓄積するため、ピッチ遅れは、正負符号なし７ビット２進整数に写像される。音声メッセージ送信符号化器によりピッチ遅れに課された制限は、０×０から０×１３（０〜１９）に至るおよび、０×７９から０×７ｆ（１２０〜１２７）に至る符号化された遅れが許容されないことを意味する。音声メッセージ送信符号化器は、各４８標本サブフレームのピッチフィルタを特定するため、６ビットを割当てている。したがって、総計２⁶＝６４個の項目がピッチフィルタ励振ベクトル量子化コードブック内に存在する。ピッチフィルタ係数は、コードブック内の、選択されたフィルタの指標と等価の６ビット正負符号なし２進数として符号化される。この議論のため、４個のサブフレームについて算出されたピッチ遅れは、ＰL ［０］，ＰL ［１］，…，ＰL ［３］と名付けられ、ピッチフィルタ指標は、ＰF ［０］，ＰF ［１］，…，ＰF ［３］と名付けられる。
【０１４２】
短期予測器によって生成された副情報は、量子化された１０個の反射係数からなる。各反射係数は、該係数に対して最適化された特有の非均一スカラーコードブックを使用して量子化される。短期予測器副情報は、１０個のスカラーコードブックのそれぞれの出力レベルを正負符号なし２進整数に写像することにより、符号化される。Ｂ個のビットが割当てられたスカラーコードブックについて、コードブックの項目は、最小から最大へと配列され、正負符号なし２進整数がコードブック指標として、各項目に関連付けられる。したがって、整数０は、最低量子化器レベルとして写像され、整数２^B −１は、最大量子化器レベルとして写像される。以下の議論において、符号化された１０個の反射係数は、ｒｃ［１］、ｒｃ［２］，…，ｒｃ［１０］と名付けられる。各反射係数の量子化のために割当てられたビットの数は、表１に列挙されている。
【表１】

【０１４３】
例示としての各音声メッセージ送信符号化器フレームは、４８個の励振ベクトルを定義する３６バイトの励振情報を含む。励振ベクトルは、音声メッセージを再構成するため、逆長期予測器フィルタと逆短期予測器フィルタとに入力される。６ビットが各励振ベクトルに割当てられ、５ビットが形状に割当てられ、１ビットが利得に割当てられる。形状成分は、３２個の項目を含む形状コードブックに索引を付ける０〜３１の範囲の正負符号なし整数である。１ビットが利得に割当てられるので、利得元は、励振ベクトルの代数符号を簡単に特定する。２進法の０は、正の代数符号を指示し、２進法の１は、負の代数符号を指示する。各励振ベクトルは、６ビットの正負符号なし２進数によって特定される。
【０１４４】
フレーム内の励振ベクトル順列をｖ［０］，ｖ［１］，…，ｖ［４７］と名付ける。音声メッセージ送信符号化器により生成された２進データは、伝送と蓄積とのために、図８に示された順序でバイト順列としてパックされる。符号化された２進化量の最下位ビットがまずパックされる。
【０１４５】
音声メッセージ送信符号化器符号化されたデータは、図９に示されている。図９に示されているように、４８バイトの２進データは、１２個の３バイト語が後続する３個の４バイト語からなる順列に配列されている。副情報は、最初の３個の４バイト語（プリアンブル）を占有し、励振情報は、残りの１２個の３バイト語（本体）を占有する。符号化された副情報量のそれぞれは、プリアンブル内の１個の４バイト語内に格納されている（すなわち、いずれのビットフィールドも一の語から次の語へ折返さない）。また、フレーム本体内の３バイト語のそれぞれは、３個の符号化励振ベクトルを含む。
【０１４６】
フレーム境界は、同期ヘッダにより確定される。一の現存の標準メッセージ書式は、以下の形式の同期ヘッダを特定する。すなわち、０×ＡＡ０×ＦＦＮＬ（Ｎは、データ書式を一つ特定する８ビットのタグを示す。Ｌ（これも、８ビットの量である）は、ヘッダに後続する制御フィールドの長さである。
【０１４７】
音声メッセージ送信符号化器の符号化されたデータフレームは、励振情報と副情報との混合情報を含む。フレームの復号化は、フレーム内のデータの正しい解釈による。復号化器内で、フレーム境界の誤追跡は、音声品質のいずれかの測度に悪影響を及ぼし、メッセージを理解できなくする虞がある。したがって、本発明を適用したシステムに使用される同期プロトコルの主目的は、フレーム境界の不明瞭でない識別を行うことである。基本構成において考慮された他の目的を以下に列挙する。
【０１４８】
１）現行標準との互換性を維持すること。
２）同期ヘッダにより消費されるオーバヘッドを最小にすること。
３）符号化音声メッセージ内のランダム点で開始する復号化器の同期に必要な最長時間を最小にすること。
５）符号化器または復号化器に不必要な処理タスクを負担させるのを回避するため、同期プロトコルの複雑さを最小にすること。
６）記憶媒体の信頼性が高く、いずれの誤り訂正方法も蓄積伝送に使用されると仮定して、復号化時の誤追跡の確率を最小とすること。
【０１４９】
現行標準との互換性は、音声メール網のような適用業務での操作互換性にとって重要である。このような互換性（少なくとも一つの広く使用されている適用業務に対して）は、オーバヘッド情報（同期ヘッダ）が符号化データストリーム内に注入されること、および、これらのヘッダが形式０×ＡＡ０×ＦＦＮＬ（ただし、Ｎは、符号化書式を特定する唯一の符号であり、Ｌは、任意制御フィールドの長さ（２バイト語単位で）である。
【０１５０】
一のヘッダを挿入することにより４バイトのオーバヘッドを負荷する。ヘッダが各音声メッセージ送信符号化器フレームの始まりに挿入されたときは、オーバヘッドは、圧縮データ率を２．２ｋＢ／ｓ増大させる。オーバヘッド率は、各フレームよりもヘッダ挿入回数を減らすことにより最小とすることができる。しかし、ヘッダ間のフレームの数を増大させることは、圧縮音声メッセージ内のランダム点からの同期に必要な時間間隔を長くすることになる。したがって、オーバヘッドを最小にする必要と同期遅れとの間の均衡が達成されなければならない。同様に、目的（４）と（５）との間で均衡を取らなければならない。ヘッダが音声メッセージ送信符号化器フレーム内に生じるのを禁止されたときは、フレーム境界の誤識別の確率は、０である（ビット誤りのない音声メッセージについて）。しかし、データフレーム内のヘッダの禁止は、必ずしも常に可能でない強制を必要とする。ビット操作戦略（例えば、ビット詰め）は、重要な処理用資源を消費し、バイト境界を乱して、後縁孤立ビットなしにディスクにメッセージを格納するのに困難を生じる。幾つかのシステムに使用されるデータ操作戦略は、ヘッダのランダム生起を予防するため、符号化されたデータを変更する。このような予防戦略は、音声メッセージ送信符号化器内では魅力的でない。種々のクラスの符号化されたデータ（励振情報に対する副情報等）における摂動効果は、種々の条件下で数値が求められる必要がある。また、隣合う２進パターンが最近接−近接サブバンド励振に対応する帯域分割符号化（ＳＢＣ）と違って、上記のような特性は、いずれも、音声メッセージ送信符号化器内の励振コードブックまたはピッチコードブックによって禁止されない。したがって、再構成された音声波形に及ぼす効果を最小とするため、圧縮データを乱す方法は、明らかでない。
【０１５１】
上述した目的と考察とに基づいて、以下の同期化ヘッダ構成が音声メッセージ送信符号化器について選択された。
１）同期ヘッダは、０×ＡＡ０×ＦＦ０×４０｛０×００，０×０１｝である。
２）ヘッダ０×ＡＡ０×ＦＦ０×４００×０１には、２バイトの長さの制御フィールドが後続する。制御フィールド内の０×０００×０１の値は、符号化器状態のリセットを特定する。制御フィールドの他の値は、当業者であれば、気づくように、他の制御関数のために留保される。
３）制御語０×０００×０１が後続するリセットヘッダ０×ＡＡ０×ＦＦ０×４００×０１は、符号化器初期（またはリセット）状態から開始することによって生成された圧縮メッセージに先行しなければならない。
４）０×ＡＡ０×ＦＦ０×４００×００の形式の後続のヘッダは、４番目のフレーム毎の終りにおいてよりも以上の回数で音声メッセージ送信符号化器フレーム間に導入されなければならない。
５）制限なしに、複数のヘッダが音声メッセージ送信符号化器フレーム間に導入されうる。しかし、いずれのヘッダも音声メッセージ送信符号化器フレーム内に導入されえない。
６）いずれのビット操作またはデータ摂動も、音声メッセージ送信符号化器フレーム内にヘッダが生じるのを防止するためには実行されない。
【０１５２】
音声メッセージ送信符号化器フレーム内でのヘッダの生起の防止が欠けているが、ヘッダパターン（０×ＡＡ０×ＦＦ０×４００×００および０×ＡＡ０×ＦＦ０×４００×０１）がいずれか可能な音声メッセージ送信符号化器フレームの始め（最初の４バイト）から区別できることは、不可欠である。これは、プロトコルのみがヘッダ間の最長時間間隔を特定し、隣合う音声メッセージ送信符号化器フレーム間に複数のヘッダが出現することを防止しないので特に重要である。ヘッダ密度のあいまいさの受入れは、音声メッセージが伝送または蓄積前に編集されうる音声メール産業においては、重要である。代表的シナリオによれば、電話加入者は、メッセージを録音し、ついで、このメッセージを編集のため再戻し、メッセージ内の一のランダム点において元メッセージの始まり全部を再録音する。メッセージ内へのヘッダの導入に関する厳格な仕様は、重要なオーバヘッドロードとなる、全フレームの前に１個のヘッダまたは厳密接点（編集の開始にかかわらず、符号化器／復号化器またはファイルの後処理により、ヘッダ密度が調整される不必要な複雑さを追加的に生じる点）を必要とする。フレームプリアンブルは、音声メッセージ送信符号化器フレームの始めにおけるヘッダの生起を防止するため、ピッチ遅れ情報の公称冗長性を利用する。圧縮データフレームがヘッダ０×ＡＡ０×ＦＦ０×４０｛０×００，０×０１｝から始まるときは、最初のピッチ遅れＰL ［０］は、１２６の非許容値を有することになる。したがって、ビット誤り、または、フレーム指示誤りによってなまることのない圧縮データフレームは、ヘッダパターンから始まることがない。この結果、復号化器は、ヘッダとデータフレームとを区別することができる。
【０１５３】
５．２同期プロトコル
本節において、音声メッセージ送信符号化器および音声メッセージ送信符号化復号化器を同期するのに必要なプロトコルを定義する。プロトコルの簡単な記載は、以下の定義によって容易となる。圧縮データストリーム（符号化器出力／復号化器入力）内のバイト順列を以下の式（４９）で表わす。
【数３７】

【０１５４】
式（４９）中、圧縮メッセージの長さは、Ｎバイトである。同期プロトコルを説明するのに使用される状態図において、ｋは、圧縮バイト順列の指標として使用される。すなわち、ｋは、処理されるべき、ストリーム内の次のバイトを指示する。
【０１５５】
指標ｉは、圧縮バイト順列内のデータフレームＦ［ｉ］を計数する。バイト順列ｂｋは、以下の数式で表わされ、Ｈで指示されたヘッダによって区切られたデータフレーム集合からなる。
Ｆ［ｉ］_i=0 ^M-1
【０１５６】
リセット制御語０×０００×０１が後続する０×ＡＡ０×ＦＦ０×４００×０１の形式のヘッダは、リセットヘッダと称せられ、Ｈｒで表わす。他のヘッダ（０×ＡＡ０×ＦＦ０×４００×００）は、Ｈｃで表わされ、続きヘッダと称せられる。符号Ｌｈは、制御フィールドを含む圧縮バイトストリーム内で検出された最近のヘッダが存在するときは、そのバイト長さを示す。リセットヘッダ（Ｈｒ）について、Ｌｈ＝６であり、続きヘッダ（Ｈｃ）についてＬｈ＝４である。
【０１５７】
ｉ番目のデータフレームＦ［ｉ］は、以下の式（５０）で示された４８バイトの配列と見ることができる。
【数３８】

【０１５８】
同期プロトコルの説明の便宜上、他の２個の作用ベクトルを定義する。最初の作用ベクトルは、圧縮データストリームとして以下の式（５１）で示された６バイトを含む。
【数３９】

【０１５９】
次の作用ベクトルは、圧縮データストリームとして以下の式（５２）で示された４８バイトを含む。
【数４０】

【０１６０】
ベクトルＶ［ｋ］は、ヘッダ候補（任意の制御フィールドを含む）である。以下の式（６１）で示される論理命題は、ベクトルがいずれかのタイプのヘッダを含むときは、真である。
【数４１】

【０１６１】
より正式には、式（５３）または式（５４）が成立するときは、上記論理命題は、真である。
【数４２】

【０１６２】
最後に、符号Ｉは、集合｛１，２，３，４｝内の整数を指示する。
【０１６３】
６．２．１同期プロトコル−−符号化器用規則
符号化器について、同期プロトコルは、２，３の要求を行う。
１）各圧縮音声メッセージの始めにリセットヘッダＨｒを導入すること。
２）４番目毎の圧縮データフレームの終りに続きヘッダＨｃを導入すること。符号化器の動作は、図１０に示された状態機械によってより完全に説明される。状態図によれば、状態遷移を刺激する条件は、定幅フォントで書かれる。他方、状態遷移の結果として実行される演算は、イタリック体で書かれる。
【０１６４】
符号化器は、遊び、初期および稼動の３個の状態を有する。休止状態の符号化器は、符号化を開始するように命令されるまで、遊び状態にある。遊び状態から初期状態への遷移は、コマンドに基づいて実行され、以下の動作を行う。
・符号化器がリセットされる。
・リセットヘッダが圧縮バイトストリームに付加される。
・フレーム（ｉ）指標とバイトストリーム（ｋ）指標とが初期化される。
初期状態中に１回、符号化器は、最初の圧縮フレーム（Ｆ［０］）を出力する。初期状態中に、平均を取るべき前係数が存在しないので反射係数の補間が禁止される。符号化がコマンドによって終了されない限り、初期状態から稼動状態への無条件遷移が行われる。初期から稼働への状態遷移は、以下の演算により達成される。
・出力バイトストリームにＦ［０］を追加する。
・フレーム指標を増分する（ｉ＝ｉ＋１）。
・バイト指標を更新する（ｋ＝ｋ＋４８）。
【０１６５】
符号化器は、コマンドにより遊び状態へ戻るように命令されない限り、稼働状態のままである。稼働状態にある符号化器の動作は、以下の通り要約される。
・出力バイトストリームに現フレームを追加する。
・フレーム指標を増分する（ｉ＝ｉ＋１）。
・バイト指標を更新する（ｋ＝ｋ＋４８）。
・ｉが４で割切れるときは、続きヘッダＨｃを出力バイトストリームに追加し、これにより、バイトの計数を更新する。
【０１６６】
６．２．２同期プロトコル…復号化器のための規則
復号化器は、フレーム境界を画定するのでなく検出しなければならないので、同期プロトコルは、符号化器よりも復号化器に多く要求する。復号化器の動作は、図１１に示された状態機械によって制御される。圧縮バイトストリームを復号する状態制御器の動作は以下の様に行われる。まず、復号化器は、２個のヘッダが整数（２と４との間）個の圧縮データフレームによって分離された状態で見出されるまで、バイトストリームの始めのヘッダを見出すことにより、または、バイトストリーム全体を走査することにより、同期を達成する。同期が達成されると、圧縮データフレームは、復号化器により展開される。状態制御器は、各フレーム間に１個以上のヘッダを捜索する。そして、ヘッダを検出することなく、４個のフレームが復号されたときは、状態制御器は、同期が失われたものと仮定し、同期を再度獲得するため、走査手順に戻る。
【０１６７】
復号化器の動作は、遊びとして開始される。復号化器は、動作開始のコマンドを受けると遊び状態から抜ける。圧縮データストリームの最初の４バイトは、ヘッダとして検査される。ヘッダが見出されたときは、復号化器は、（同期−１）状態へ遷移する。その他のときは、復号化器は、（探索−１）状態に入る。バイト指標ｋとフレーム指標ｉとは、いずれの初期遷移が生じたかにかかわらず初期化され、復号化器は、ファイルの始めで検出されるヘッダの型式にかかわらず（同期−１）状態へ入ったことにより、リセットされる。正常動作によれば、圧縮データストリームは、リセットヘッダ（Ｈｒ）から始まるべきである。したがって、復号化器をリセットすることにより、該復号化器の初期状態は、圧縮メッセージを生じた復号化器の初期状態に強制的に一致させられる。他方、データストリームが続きヘッダ（Ｈｃ）ではじまったきは、符号化器の初期状態は、認められない。また、符号化器状態に関する優先順位情報が存在しないときは、妥当なフォールバックがリセット状態から復号を開始することになる。
【０１６８】
ヘッダが圧縮データストリームの始めに見出されないときは、復号化器入力端内でのデータフレームとの同期は、保証されえない。そのため、復号化器は、整数個の圧縮データフレームによって分離された入力ファイル内に２個のヘッダを配置することにより同期を達成するように求める。復号化器は、ヘッダが入力ストリーム内で検出されるまで、（探索−１）状態のままである。ヘッダが入力ストリーム内で検出されることにより、（探索−２）状態に強制的に遷移される。バイトカウンタｄは、この遷移が行われると、クリアされる。バイト計数ｋは、復号化器が入力ストリームを走査して最初のヘッダを探索するにつれて、増分されなければならない。（探索−２）状態において、復号化器は、次のヘッダが見出されるまで、入力ストリーム全体を走査する。走査時に、バイト指標ｋとバイト計数ｄとは、増分される。次のヘッダが見出されると、バイト計数ｋは、検査される。バイト計数ｄが４８，４９，１４４または１９２に等しいときは、入力ストリーム内に見出された最後の２個のヘッダは、整数個のデータフレームによって分離され、同期が達成される。復号化器は、（探索−２）から（探索−１）へ遷移し、それにより、復号化器状態をリセットし、バイト指標ｋを更新する。次のヘッダが前ヘッダに対して許容オフセットで見出されないときは、復号化器は、（探索−２）状態のままであり、それにより、バイト計数ｄをリセットし、バイト指標ｋを更新する。
【０１６９】
復号化器は、データフレームが検出されるまで、（同期−１）状態のままである。プロトコルは、入力ストリーム内に隣合うヘッダを受入れるので、上記状態への遷移は、ヘッダが検出されたことを意味するにもかかわらず、復号化器は、ヘッダを検査し続ける。連続したヘッダが検出されたときは、復号化器は、（同期−１）状態のままであり、これにより、バイト指標ｋを更新する。データフレームが見出されると、復号化器は、このデータフレームを処理し、（同期−２）状態へ遷移する。（同期−１）状態にあるとき、反射係数の補間は、禁止される。同期障害が存在しないときは、復号化器は、遊び状態から（同期−１）状態へ、ついで、（同期−２）状態へ遷移し、補間が禁止された状態で処理された第１フレームは、同様に補間が禁止された状態で復号化器により生成された第１フレームと対応する。バイト指標ｋとフレーム指標ｉとは、この遷移により更新される。
【０１７０】
正常動作状態の復号化器は、復号が終了するまで、（同期−２）状態のままである。この状態において、復号化器は、データフレーム間でヘッダを検査する。ヘッダが検出されないとき、および、ヘッダカウンタｊが４より小さいときは、復号化器は、入力ストリームから新しいフレームを抽出し、バイト指標ｋ、フレーム指標ｉおよびヘッダカウンタｊを更新する。ヘッダカウンタが４に等しいときは、ヘッダは、最長の特定時間間隔内で検出されていず、同期は、すでに、失われている。これにより、復号化器は、（探索−１）状態へ遷移し、バイト指標ｋを増分する。続きヘッダが見出されたときは、復号化器は、バイト指標ｋを更新し、ヘッダカウンタｊをリセットする。リセットカウンタが検出されたときは、復号化器は、（同期−１）状態へ戻り、バイト指標ｋを更新する。いずれかの復号化器状態から遊び状態への遷移は、コマンドにより生じうる。これらの遷移は、一層明瞭とするため、状態図から省略されている。
【０１７１】
正常動作によれば、復号化器は、遊び状態から（同期−１）へ、ついで、（同期−２）へ遷移し、復号化器動作が完了するまで、（同期−２）状態のままである。しかし、復号化器が圧縮音声メッセージ内のランダム点から圧縮音声メッセージを処理しなければならない実際的応用業務が存在する。このような場合、同期は、整数個のフレームによって分割された入力ストリーム内に２個のヘッダを配置することにより達成されなければならない。同期は、入力ファイル内に１個のヘッダを配置することにより達成されうる。しかし、プロトコルは、データフレーム内に複数個のヘッダが生じることを排除しないので、１個のヘッダによる同期は、はるかに高い誤同期の機会を防止する。また、圧縮されたファイルは、蓄積時または伝送中分割してもよい。したがって、復号化器は、ヘッダが同期障害損失を迅速に検出するよう常時監視するべきである。
【０１７２】
詳述された例示としての実施例は、本発明の及ぶ多くの特徴および技術の単なる１個の適用例と理解されるべきである。同様に、上述された多くのシステム要素および方法のステップは、例示として記載されたシステムおよび方法での使用と異なる有用性（個別に、および、組合わせて）を有する。特に、当業者であれば、気づくように、標本化率およびコードベクトル長さのような種々のシステムパラメタ値は、本発明の適用例において変化する。
【表２】

【表３】

【０１７３】
【発明の効果】
本発明によれば、複雑な計算が軽減された高品質な音声メッセージ送信符号化および復号化が行われる。
【図面の簡単な説明】
【図１】本発明の一実施例にかかる符号化器・復号化器対の代表的実施例の全体ブロック線図である。
【図２】図１に示されたタイプの符号化器の詳細ブロック線図の一部であり、同符号化器の詳細ブロック線図の他の部分である図１２と図１３のように組み合わせることにより、符号化器の全体が構成される。
【図３】図２に示されたタイプの復号化器の詳細ブロック線図である。
【図４】図１に示されたシステム内で行われる動作のフローチャートである。
【図５】図１に示されたシステムの予測器分析および量子化要素の詳細ブロック線図である。
【図６】図１に示された代表的実施例に使用される後向き利得アダプタのブロック線図である。
【図７】図１に示された実施例に使用された符号化励振情報の代表的書式の模式図である。
【図８】図１に示されたシステムでの符号化および復号に使用された圧縮データフレームの代表的パッキング順序を示す模式図である。
【図９】図１に示されたシステムにおいて説明のため使用された一のデータフレームの模式図である。
【図１０】図１に示されたシステム内の符号化器の動作の諸相を理解するのに有用な符号化器状態制御線図である。
【図１１】図１に示されたシステム内の復号化器の動作の諸相を理解するのに有用な復号化器状態制御線図である。
【図１２】図１に示されたタイプの符号化器の詳細ブロック線図の一部であり、同符号化器の詳細ブロック線図の他の一部である図２と図１３のように組み合わせることにより、符号化器の全体が構成される。
【図１３】図２と図１２との組み合わせ方法を示す図である。
【符号の説明】
１０１：励振ベクトル量子化コードブック
１０２：利得基準化器
１０３：長期合成フィルタ
１０４：短期合成フィルタ
１１５：比較器
１２０：聴覚重み付けフィルタ
１３０：ピッチ予測分析量子化器
１３５：線形予測分析量子化器
１４０：チャネル／蓄積要素
１４５：後向き利得アダプタ
１５５：分離化復号化器
１６０：励振ベクトルコードブック
１６５：利得基準化器
１７０：長期予測器
１７５：短期予測器

Claims

ａ．後向き適応利得制御器内で、それぞれが対応する指標によって識別される複数のコードベクトルを利得調整して、各コードベクトルに対応する利得調整済みコードベクトルを生成するステップと、
ｂ．短期合成フィルタと、前向き適応型の長期合成フィルタとを有し、複数のフィルタパラメタにより特徴付けられる合成フィルタ内で、各利得調整済みコードベクトルをフィルタリングして、複数の候補コードベクトルを生成するステップと、
ｃ．入力標本列を各候補コードベクトルと比較して、該入力標本列を近似する１つの候補コードベクトルを決定するステップと、
ｄ．前記１つの候補コードベクトルに対応する指標と、前記長期合成フィルタのパラメタとを出力するステップとを有する入力標本列処理方法であって、
前記後向き適応利得制御器は、前記ステップｄで出力された指標に対応するコードベクトルに関係した利得情報によって適応調整され、該適応調整された後向き適応利得制御器がその後に続く入力標本列に用いられている入力標本列処理方法。
前記合成フィルタの複数のパラメタの調整は、前記入力標本列の線形予測分析に基づいて、各フィルタのフィルタパラメタを調整することを含むことを特徴とする請求項１に記載の方法。
前記入力標本列は、連続する複数の入力標本列における現入力標本列であり、該複数の入力標本列は、現入力標本列に先行する少なくとも１つの入力標本列を含み、
前記入力標本列の線形予測分析は、
各入力標本列がそれぞれ１つのサブフレームとなるように前記複数の入力標本列を１つの入力標本フレームに群化するステップと、
前記入力標本フレームに対応するＮ個の予測器係数からなるＮ次予測器係数集合を決定するステップとを有することを特徴とする請求項２に記載の方法。
前記Ｎ次予測器係数集合を決定するステップは、
前記入力標本フレームの自己相関分析を行うことにより、自己相関係数集合を生成するステップと、
前記自己相関係数に基づいて、前記予測器係数を再帰的に形成するステップとを有することを特徴とする請求項３に記載の方法。
前記Ｎ次予測器係数集合を決定するステップの前に、前記入力標本フレームを重み付けすることにより、重み付き入力標本フレームを形成するステップをさらに有し、
前記Ｎ次予測器係数集合を決定するステップは、
前記重み付き入力標本フレームの自己相関分析を行うことにより、自己相関係数の順序集合を生成するステップと、
前記自己相関係数に基づいてレビンソン−ダービン再帰を行うことにより、前記予測器係数集合を決定するステップとを含むことを特徴とする請求項３に記載の方法。
前記自己相関係数を修正することにより、少量の白色雑音の追加を反映させるステップをさらに有することを特徴とする請求項５に記載の方法。
前記修正は、小さい因数により前記自己相関係数のうち第１自己相関係数を変化させるステップを含むことを特徴とする請求項６に記載の方法。
前記予測器係数集合の帯域幅を修正することにより、前記合成フィルタのスペクトルピークを拡大するステップをさらに有することを特徴とする請求項７に記載の方法。
ｍ＝１０，９，８，...，１に対して、ｍ番目の反射係数を山記号付ｋ_mで表し、ｍ次予測器のｉ番目の係数を山記号付ａ_i ^(m)で表すとして、

に従って、前記予測器係数集合を反射係数集合に再帰的に変換するステップをさらに有することを特徴とする請求項３に記載の方法。
各入力標本フレームはＳ個のサブフレームを含み、
前記Ｎ次予測器係数集合を決定するステップの前に、前記入力標本フレームを重み付けすることにより、重み付き入力標本列を形成する重み付けステップと、
現入力標本フレームについて決定された反射係数と直前の入力標本フレームの反射係数との補間に基づいて、重み付きされたサブフレームの各々について予測器係数を決定するステップとをさらに有することを特徴とする請求項９に記載の方法。
Ｓ＝４であることにより、各入力標本フレームは４個のサブフレームを有し、
前記重み付けステップは、４番目のサブフレームを中心とする重み付け窓関数に従って行われ、
ｍ＝１，２，...，１０、および、ｊ＝１，２，３，４に対して、前入力標本フレームおよび現入力標本フレームのｍ番目の量子化反射係数をそれぞれバー記号付ｋ_mおよび波記号付ｋ_mで表し、ｊ番目の重み付きサブフレームについて補間されたｍ番目の反射係数をｋ_m（ｊ）で表すとして、前記補間は、

に従って行われることを特徴とする請求項１０に記載の方法。
さらに、前記反射係数集合を量子化するステップを有し、該反射係数集合を量子化するステップは、
量子化器セル境界を識別するしきい値の指標付元と、各反射係数とを比較することにより、量子化器セルを識別する指標を決定する比較ステップと、
各反射係数について識別された指標に基づいて、量子化器セルに対応する量子化器出力値を割り当てるステップとを有することを特徴とする請求項９に記載の方法。
各しきい値は、量子化器セル境界値の、変換定義域の値からの逆変換値であることを特徴とする請求項１２に記載の方法。
前記しきい値の指標付元は、しきい値の順序付表に格納され、各しきい値は、１つの指標に一意的に対応し、
前記ステップｃは、前記表内で値を探索することにより、所定基準を満たす値を見出す探索ステップを含むことを特徴とする請求項１２に記載の方法。
前記探索ステップは、前記反射係数の値に基づく、前記表の２分木探索を含むことを特徴とする請求項１４に記載の方法。
前記長期合成フィルタのフィルタパラメタの調整は、さらに、
各入力標本列の前記線形予測分析に基づいて、ピッチ遅れパラメタを抽出するステップを含み、
前記長期合成フィルタのパラメタの出力は、各入力標本列について前記ピッチ遅れパラメタの符号化された表現を出力するステップを含むことを特徴とする請求項２に記載の方法。
前記長期合成フィルタのフィルタパラメタの調整は、
各入力標本列がそれぞれ１つのサブフレームとなるように前記複数の入力標本列を１つの入力標本フレームに群化するステップと、
サブフレームの前記線形予測分析に基づいて、ピッチ遅れパラメタを抽出するステップとを含み、
前記長期合成フィルタのフィルタパラメタの出力は、各サブフレームについて前記ピッチ遅れパラメタの符号化された表現と複数のピッチ予測器タップ重みとを出力するステップを含むことを特徴とする請求項２に記載の方法。
前記ピッチ遅れパラメタの抽出は、
現サブフレームについて、線形予測符号化残差を表現する信号集合を生成するステップと、
現サブフレームの前記線形予測符号化残差と、複数の前サブフレームの線形予測符号化残差とに基づいて、遅れ値の範囲のそれぞれについて相互相関を形成するステップと、
最大値を有する前記相互相関の遅れ値に基づいて、ピッチ遅れパラメタを選択するステップとを含むことを特徴とする請求項１７に記載の方法。
前記相互相関を形成する前に、現サブフレームおよび前サブフレームの前記線形予測符号化残差は、時間間引きされ、
さらに、前記遅れパラメタの選択値を調整することにより、前記時間間引きを反映させることを特徴とする請求項１８に記載の方法。
前記複数のピッチ予測器タップ重みは、３個のタップ重みを含み、
前記長期合成フィルタは、

によって与えられる伝達関数を有し、
量子化された複数のタップ重みの各可能集合に対応する１個以上のピッチタップベクトルを格納する格納ステップをさらに有し、該格納ステップは、
ｙ＝［２ｂ₁，２ｂ₂，２ｂ₃，−２ｂ₁ｂ₂，−２ｂ₂ｂ₃，−２ｂ₃ｂ₁，−ｂ₁ ²，−ｂ₂ ²，−ｂ₃ ²］^T
で与えられるベクトルを格納するステップを含むことを特徴とする請求項１７に記載の方法。
前記入力標本列は、連続する複数の入力標本列における現入力標本列であり、該複数の入力標本列は、現入力標本列に先行する少なくとも１つの入力標本列を含み、前記合成フィルタはメモリを有し、該メモリは、現入力標本列に先行する少なくとも１つの入力標本列の少なくとも一部に対応するコードベクトル情報を反映する残差信号を格納し、該残差信号は前記候補コードベクトルに寄与し、
前記ステップｃの前に、入力標本列から前記候補コードベクトルへの寄与を除去するステップをさらに有することを特徴とする請求項１に記載の方法。
前記ステップｃは、該比較の前に、前記入力標本列および前記候補コードベクトルを聴覚的に重み付けするステップを含むことを特徴とする請求項１に記載の方法。
前記入力標本列は、連続する複数の入力標本列における現入力標本列であり、該複数の入力標本列は、現入力標本列に先行する少なくとも１つの入力標本列を含み、前記合成フィルタはメモリを有し、該メモリは、現入力標本列に先行する少なくとも１つの入力標本列の少なくとも一部に対応するコードベクトル情報を反映する残差信号を格納し、該残差信号は前記候補コードベクトルに寄与し、
前記ステップｃの前に、入力標本列から前記候補コードベクトルへの寄与を除去するステップをさらに有することを特徴とする請求項２２に記載の方法。
利得調整済コードベクトルの個数をＭとして、前記複数のコードベクトルは、Ｍ／２個の線形独立コードベクトルを含み、
前記ステップｃは、Ｍ個のコードベクトルを比較するステップを含み、該Ｍ個のコードベクトルは、前記Ｍ／２個の線形独立コードベクトルと、該コードベクトルの２個の正負符号値とに基づくことを特徴とする請求項１に記載の方法。
出力される指標およびフィルタパラメタを格納するステップをさらに有することを特徴とする請求項１に記載の方法。
出力される指標およびフィルタパラメタを通信媒体へ伝送するステップをさらに有することを特徴とする請求項１に記載の方法。
前記方法は、既に処理された入力標本列の後に続く追加入力標本列の集合を処理し、
ｅ．前の入力標本列に応答して、前記合成フィルタのフィルタパラメタを調整するステップと、
ｆ．前記追加入力標本列の集合内の次の入力標本列について前記ステップａ〜ｄを繰り返すステップと、
ｇ．前記追加入力標本列の集合内の各列が処理されるまで前記ステップｅおよびｆを繰り返すステップとを有することを特徴とする請求項１に記載の方法。
前記ステップｃは、入力標本列との差が最小の候補コードベクトルを決定するステップを含むことを特徴とする請求項１に記載の方法。