JP2016528539A5

JP2016528539A5 -

Info

Publication number: JP2016528539A5
Application number: JP2016524867A
Authority: JP
Filing date: 2014-07-04
Publication date: 2017-10-26
Anticipated expiration: 2034-07-04

Description

音声周波数信号復号器における周波数帯域拡張のため最適化スケール因子

本発明は、送信または記憶のための音声周波数信号（会話、音楽、または他のそのような信号など）の符号化／復号化および処理の分野に関する。

特に、本発明は、励起信号のレベル、または均等な方式で、復号器もしくは音声周波数信号を改善するプロセッサにおける周波数帯域拡張の一部としてのフィルタのレベルを調節するために使用することができる最適化スケール因子を判定する方法およびデバイスに関する。

会話または音楽などの音声周波数信号を圧縮する（損失を伴う）多数の技術が存在する。

会話アプリケーションのための従来の符号化方法は概して、波形符号化（「パルス符号変調」を表すＰＣＭ、「適応差分パルス符号変調」を表すＡＤＣＰＭ、変換符号化など）、パラメトリック符号化（「線形予測符号化」を表すＬＰＣ、正弦符号化など）、およびそのＣＥＬＰ（「符号励振線形予測」）符号化が最も知られている例である、「合成による分析」によるパラメータの量子化でのパラメトリックハイブリッド符号化として分類される。

非会話アプリケーションの場合、（モノラルの）音声信号符号化のための従来技術は、帯域レプリケーションによる高周波数のパラメトリック符号化での、変換による知覚的符号化、またはサブ帯域における知覚的符号化から構成される。

従来の会話および音声符号化方法の概要を、（非特許文献１）、（非特許文献２）、（非特許文献３）による研究において発見することができる。

ここでの焦点はより具体的に、１６ｋＨｚの入力／出力周波数において動作する、３ＧＰＰの標準化されたＡＭＲ−ＷＢ（「適応マルチレートワイドバンド」コーデック（符号器および復号器）であり、３ＧＰＰ標準ＡＭＲ−ＷＢでは、１２．８ｋＨｚにおいてサンプリングされ、およびＣＥＬＰモデルによって符号化される低帯域（０〜６．４ｋＨｚ）と、カレントフレームのモードに応じた追加情報を伴い、もしくは追加情報なしで、「帯域拡張」（または、「帯域幅拡張」を表すＢＷＥ」）によってパラメータ的に再構築される高帯域（６．４〜７ｋＨｚ）と、の２つのサブ帯域に信号が分割される。ここで、７ｋＨｚにおけるＡＭＲ−ＷＢコーデックの符号化された帯域の制限は、ＩＴＵ−Ｔ標準の３４１ページで定義された周波数マスクに従って、より具体的には、７ｋＨｚを超える周波数をカットするＩＴＵ−Ｔ標準Ｇ．１９１で定義されたいわゆる「Ｐ３４１」フィルタ（このフィルタは、３４１ページで定義されたマスクを観察する）を使用することよって、標準化（ＥＴＳＩ／３ＧＰＰ次いでＩＴＵ−Ｔ）の時に広帯域端末の送信における周波数応答が近似していた事実に本来関連付けられることに留意されたい。しかしながら、理論的には、１６ｋＨｚにおいてサンプリングされた信号は、０〜８０００Ｈｚの定義された音声帯域を有することができ、したがって、ＡＭＲ−ＷＢコーデックは、８ｋＨｚの理論上の帯域幅との比較によって高帯域の制限をもたらす。

３ＧＰＰＡＭＲ−ＷＢ会話コーデックは、主にＧＳＭ（登録商標）（２Ｇ）およびＵＭＴＳ（３Ｇ）上の回路モード（ＣＳ）電話アプリケーションのために２００１年に標準化された。この同一のコーデックはまた、勧告Ｇ．７２２．２「適応マルチレートワイドバンド（ＡＭＲ−ＷＢ）を使用した約１６キロビット／秒における広帯域符号化会話」の形式でＩＴＵ−Ｔによって２００３年に標準化された。

それは、９のビットレート、６．６〜２３．８５キロビット／秒の呼モードを備え、ならびに音声区間検出（ＶＡＤ：ｖｏｉｃｅａｃｔｉｖｉｔｙｄｅｔｅｃｔｉｏｎ）、およびサイレンス記述フレーム（ｓｉｌｅｎｃｅｄｅｓｃｒｉｐｔｉｏｎｆｒａｍｅ）（「ＳｉｌｅｎｃｅＩｎｓｅｒｔｉｏｎＤｅｓｃｒｉｐｔｏｒ」を表すＳＩＤ）からの快適雑音生成（ＣＮＧ：ｃｏｍｆｏｒｔｎｏｉｓｅｇｅｎｅｒａｔｉｏｎ）を有する連続送信機構（「不連続送信」を表すＤＴＸ）と、損失フレーム補正機構（「ＦｒａｍｅＥｒａｓｕｒｅＣｏｎｃｅａｌｍｅｎｔ」を表すＦＥＣ、時に「ＰａｃｋｅｔＬｏｓｓＣｏｎｃｅａｌｍｅｎｔ」を表すＰＬＣと称される）とを備える。

ＡＭＲ−ＷＢ符号化および復号化アルゴリズムの詳細は、ここでは繰り返されず、このコーデックの詳細な説明を、（非特許文献４）、（非特許文献５）（および対応する付属文書および附録）、（非特許文献６）による論文、および関連する３ＧＰＰとＩＴＵ−Ｔ標準のソースコードにおいて発見することができる。

ＡＭＲ−ＷＢコーデックにおける帯域拡張の原理は、非常に基礎的である。実際に、時間（サブフレームごとのゲインの形式で適用される）および周波数（線形予測合成フィルタまたは「線形予測符号化」を表すＬＰＣの適用によって）エンベロープを通じてホワイトノイズを形成することによって、高帯域（６．４〜７ｋＨｚ）が生成される。この帯域拡張技術は図１に示される。

ホワイトノイズｕ_ＨＢ１（ｎ）、ｎ＝０，・・・，７９は、線形合同ジェネレータによって５ミリ秒のサブフレームごとに１６ｋＨｚにおいて生成される（ブロック１００）。このノイズｕ_ＨＢ１（ｎ）は、サブフレームごとにゲインを適用することによって時間でフォーマットされ、この動作は、２つの処理ステップ（ブロック１０２、１０６または１０９）に分解される。
・第１の因子が算出されて（ブロック１０１）、低帯域で１２．８ｋＨｚにおいて復号化された、励起ｕ（ｎ）、ｎ＝０，・・・，のレベルと同様のレベルでホワイトノイズｕ_ＨＢ１（ｎ）を設定する（ブロック１０２）。

ここで、異なるサイズ（ｕ（ｎ）に対して６４、およびｕ_ＨＢ１（ｎ）に対して８０）のブロックを比較することによって、サンプリング周波数（１２．８または１６ｋＨｚ）における差異の補償をすることなく、エネルギーの正規化が行われることに留意されたい。
・次いで、高帯域における励起が

の形式で取得され（ブロック１０６または１０９）、ゲイン

は、ビットレートに応じて異なって取得される。カレントフレームのビットレートが２３．８５キロビット／秒を下回る場合、

が「分かりにくく」（すなわち、追加情報なしで）評価され、このケースでは、ブロック１０３は、信号

ここで、ｎ＝０，・・・，６３を取得するために４００Ｈｚにおけるカットオフ周波数を有するハイパスフィルタによって、低帯域で復号化された信号をフィルタリングし、このハイパスフィルタは、ブロック１０４においてなされた評価を歪めることがある超低周波数の影響を除去し、次いで、信号

のｅ_ｔｉｌｔで表される「傾斜」（スペクトル傾斜のインジケータ）が、正規化自己相関によって算出され（ブロック１０４）、

最後に、

が

の形式で算出され、ｇ_ＳＰ＝１−ｅ_ｔｉｌｔは、活性会話（ＳＰ）フレームに適用されるゲインであり、ｇ_ＢＧ＝１．２５ｇ_ＳＰは、背景（ＢＧ）ノイズと関連付けられた非活性会話フレームに適用されるゲインであり、およびｗ_ＳＰは、音声区間検出（ＶＡＤ）に依存した重み付け関数である。傾斜（ｅ_ｔｉｌｔ）の評価によって、信号のスペクトルの性質に応じて高帯域のレベルを適合させることが可能になり、この評価は、ＣＥＬＰ復号化信号のスペクトル傾斜によって、周波数が増加するときに（よって、ｅ_ｔｉｌｔが１に近く、よって、ｇ_ＳＰ＝１−ｅ_ｔｉｌｔが減少する音声信号のケース）平均エネルギーが減少することになるときに特に重要であることが理解される。また、ＡＭＲ−ＷＢ復号化における因子

が範囲［０．１、１．０］内での値をとるように境界を付けられることに留意されたい。実際に、そのエネルギーが増大する信号の場合、周波数が増加するときに（−１に近いｅ_ｔｉｌｔ、２に近いｇ_ＳＰ）、ゲイン

は通常、過小評価される。

２３．８５キロビット／秒において、サブフレームごとに（５ミリ秒ごとに４ビット、または０．８キロビット／秒）評価されたゲインを改善するために、補正情報項目がＡＭＲ−ＷＢ符号器によって伝達され、および復号化される（ブロック１０７、１０８）。次いで、人工励起ｕ_ＨＢ（ｎ）が、伝達関数１／Ａ_ＨＢ（ｚ）のＬＰＣ合成フィルタ（ブロック１１１）によってフィルタリングされ、１６ｋＨｚのサンプリング周波数において動作している。このフィルタの構築は、カレントフレームのビットレートに依存し、
・６．６キロビット／秒において、フィルタ１／Ａ_ＨＢ（ｚ）は、因子γ＝０．９によって次数１６のＬＰＣフィルタ

を「推定する」、次数２０のＬＰＣフィルタ

を重み付けすることによって取得され、低帯域（１２．８ｋＨｚ）で復号化され、ＩＳＦ（ＩｍｉｔｔａｎｃｅＳｐｅｃｔｒａｌＦｒｅｑｕｅｎｃｙ）の領域における推定の詳細は、第６．３．２．１章における標準Ｇ．７２２．２で説明されており、このケースでは、

である。
・ビットレートが６．６キロビット／秒を上回る場合、フィルタ１／Ａ_ＨＢ（ｚ）は、次数１６のフィルタであり、および単純に

に相当し、γは０．６である。このケースでは、フィルタ

（［０、６．４ｋＨｚ］〜［０、８ｋＨｚ］のこのフィルタの周波数応答の拡散（比例変換による）をもたらす）が１６ｋＨｚにおいて使用されることに留意するべきである。

最後に、結果Ｓ_ＨＢ（ｎ）が、ＦＩＲ（「有限インパルス応答」）タイプのバンドパスフィルタ（ブロック１１２）によって処理されて、６〜７ｋＨｚの帯域のみを維持し、２３．８５キロビット／秒においては、ＦＩＲタイプのローパスフィルタ（ブロック１１３）がまた、７ｋＨｚを上回る周波数をさらに減衰させるために処理に追加される。最後に、高周波数（ＨＦ）合成は、ブロック１２０〜１２２で取得された低周波数（ＬＦ）合成に追加され（ブロック１３０）、および１６ｋＨｚにおいてリサンプリングされる（ブロック１２３）。よって、ＡＭＲ−ＷＢコーデックにおいて、高帯域が理論的に６．４から７ｋＨｚまでに拡張する場合でさえ、ＨＦ合成はむしろ、ＬＦ合成での追加の前に６〜７ｋＨｚ帯域に含まれる。

ＡＭＲ−ＷＢコーデックの帯域拡張技術における多数の欠点を特定することができ、特に、
・サブフレームごとのゲインの評価（ブロック１０１、１０３〜１０５）が最適でない。部分的に、それは、異なる周波数における信号、１６ｋＨｚにおける人工励起（ホワイトノイズ）および１２．８ｋＨｚにおける信号（復号化ＡＣＥＬＰ励起）の間のサブフレームごとの「絶対」エネルギーの等化（ブロック１０１）に基づいている。特に、このアプローチは、高帯域励起（１２．８／１６＝０．８の比率により）の減衰を黙示的に誘導することに留意することができ、また、実際に、０．６に比較的近い減衰（６４００Ｈｚにおける１／（１−０．６８ｚ^−１））の周波数応答の値に相当する）を黙示的に誘導する、ＡＭＲ−ＷＢコーデックにおける高帯域上でデエンファシスが実行されないことに留意されたい。実際に、１／０．８の因子および０．６の因子が近似して補償される。
・会話に関して、３ＧＰＰレポートＴＲ２６．９７６において文書化された３ＧＰＰＡＭＲ−ＷＢコーデックの特性化試験は、２３．８５キロビット／秒におけるモードが２３．０５キロビット／秒よりも劣る品質を有し、実際にその品質が１５．８５キロビット／秒におけるモードの品質と同様であることを示している。これは特に、品質が２３．８５キロビット／秒に低下し、フレームごとの４ビットが元の高周波数のエネルギーに近似させることを可能にするのに最良であると考えられるため、人工ＨＦ信号のレベルが非常に慎重に制御されるべきであることを示す。
・７ｋＨｚにおけるローパスフィルタ（ブロック１１３）は、低帯域と高帯域との間で約１ミリ秒のシフトをもたらし、それは、２３．８５キロビット／秒における２つの帯域をわずかに非同期化することによって一定の信号の品質を低下させることがあり、この非同期化はまた、ビットレートを２３．８５キロビット／秒から他のモードに切り替えるときに問題を引き起こすことがある。

一時的なアプローチを介した帯域拡張の例は、ＡＭＲ−ＷＢ＋コーデックを説明した３ＧＰＰ標準ＴＳ２６．２９０（２００５年に標準化された）において説明されている。この例は、３ＧＰＰｓｐｅｃｉｆｉｃａｔｉｏｎＴＳ２６．２９０の図１６および１０にそれぞれ対応する、図２ａ（全体的なブロック図）および２ｂ（応答レベル補正によるゲイン予測）のブロック図で示される。

ＡＭＲ−ＷＢ＋コーデックでは、周波数Ｆｓ（Ｈｚ）においてサンプリングされた（モノラルの）入力信号が、２つの別個の周波数帯域に分割され、そこでは２つのＬＰＣフィルタが別個に算出および符号化され、
・低帯域（０〜Ｆｓ／４）におけるＡ（ｚ）で表される１つのＬＰＣフィルタ、その量子化されたバージョンが

で表され、
・スペクトル的に生じる高帯域（Ｆｓ／４〜Ｆｓ／２）におけるＡ_ＨＦ（ｚ）で表される別のＬＰＣフィルタ、その量子化されたバージョンが

で表される。

３ＧＰＰｓｐｅｃｉｆｉｃａｔｉｏｎＴＳ２６．２９０の第５．４章（ＨＦ符号化）および６．２章（ＨＦ復号化）で詳述されるようなＡＭＲ−ＷＢ＋コーデックにおいて、帯域拡張が行われる。その原理がここで要約され、拡張は、低周波数（ＬＦＣ励起）において復号化された励起を使用すること、ならびにサブフレームごとの一時ゲインによるこの励起（ブロック２０５）およびＬＰＣ合成フィルタリング（ブロック２０７）をフォーマットすることにあり、励起を改善し（後処理）（ブロック２０６）、および再構築されたＨＦ信号のエネルギーを平滑化する（ブロック２０８）ための動作を処理することがさらに、図２ａで示されるように実装される。

ＡＭＲ−ＷＢ＋におけるこの拡張が追加情報の伝達、２０４におけるフィルタ

の係数、およびサブフレームごとのゲインを一時的にフォーマットする（ブロック２０１）ことを必要とすることに留意することが重要である。ＡＭＲ−ＷＢ＋における帯域拡張アルゴリズムの１つの特定の機能は、サブフレームごとのゲインが予測的アプローチによって量子化されることであり、言い換えると、ゲインが直接符号化されず、むしろｇ_{ｍａｔｃｈ}で表されるゲインの評価に相対的なゲイン補正である。この評価ｇ_{ｍａｔｃｈ}は実際には、低帯域と高帯域（Ｆｓ／４）との間の分離の周波数におけるフィルタ

と、

との間のレベル等化因子に相当する。因子ｇ_{ｍａｔｃｈ}の算出（ブロック２０３）は、図２ｂにおいてここで複製される３ＧＰＰｓｐｅｃｉｆｉｃａｔｉｏｎＴＳ２６．２９０の図１０で詳述される。この図は、ここではこれ以上詳述されない。

のインパルス応答のエネルギーを算出するために、ブロック２１０〜２３０が使用されることに単純に留意されるとともに、フィルタ

がスペクトル的に生じた高帯域（低帯域および高帯域を分離するフィルタバンクのスペクトル特性を理由に）をモデル化することが想起される。フィルタがサブフレームによって補間されるため、ゲインｇ_{ｍａｔｃｈ}がフレームごとに１回のみ算出され、およびそれはサブフレームによって補間される。

ＡＭＲ−ＷＢ＋における帯域拡張ゲイン符号化技術、より具体的には、それらの分岐におけるＬＰＣフィルタのレベルの補償が、低帯域および高帯域におけるＬＰＣモデルによる帯域拡張に関連して適切な方法であり、ならびにＬＰＣフィルタの間のそのようなレベル補償がＡＭＲ−ＷＢコーデックの帯域拡張には存在しないことに留意されたい。しかしながら、実際には、別個の周波数における２つのＬＰＣフィルタの間のレベルの直接等化が最適な方法でなく、ならびに一部のケースでは、高帯域におけるエネルギーの過大評価、および可聴アーチファクトを引き起こすことがあることを立証することが可能であり、ＬＰＣフィルタは、スペクトルエンベロープ、および２つのＬＰＣエンベロープの相対レベルを調整することになる所与の周波数に対する２つのＬＰＣフィルタの間のレベルの等化の原理が想起される。ここで、正確な周波数において実行されるそのような等化は、等化ポイントの周辺においてエネルギー（周波数における）の完全な連続性および全体的な一貫性を保証しない（信号の周波数エンベロープがこの周辺で著しく変動するときに）。問題を仮定する数学的方法は、２つの曲線の間の連続性を、それらを１つかつ同一のポイントにおいて一致させることによって保証することができることに留意することにあるが、より全体的な一貫性を保証するようにローカル特性（逐次導関数）が一致することを保証するものが存在しない。低帯域および高帯域ＬＰＣエンベロープの間の点の一貫性を保証するリスクは、非常に強く、または非常に弱い相対レベルの高帯域におけるＬＰＣエンベロープを設定するリスクであり、非常に強いレベルのケースでは、それがさらに問題となるアーチファクトをもたらすため、さらに不利である。

さらに、ＡＭＲ−ＷＢ＋におけるゲイン補償は主として、符号器および復号器に既知であり、かつ高帯域励起信号をスケーリングするゲイン情報の伝達に必要なビットレートを減少させる役割を果たすゲインの予測である。ここで、ＡＭＲ−ＷＢ符号化／復号化の相互動作可能な改善に関連して、ＡＭＲ−ＷＢ２３．８５キロビット／秒モードにおいて帯域拡張のサブフレーム（０．８キロビット／秒）によるゲインの既存の符号化を修正することが可能ではない。さらに、厳密に２３．８５キロビット／秒未満のビットレートの場合、低帯域および高帯域におけるＬＰＣフィルタのレベルの補償を、ＡＭＲ−ＷＢと互換性を有する復号化の帯域拡張に適用することができるが、最適化をすることなく適用される、ＡＭＲ−ＷＢ＋符号化から導出されるこの唯一の技術によって、高帯域（６ｋＨｚを上回る）のエネルギーの過大評価の問題が生じることがある。

Ｗ．Ｂ．ＫｌｅｉｊｎａｎｄＫ．Ｋ．Ｐａｌｉｗａｌ（ｅｄｓ．），ＳｐｅｅｃｈＣｏｄｉｎｇａｎｄＳｙｎｔｈｅｓｉｓ，Ｅｌｓｅｖｉｅｒ（１９９５）Ｍ．Ｂｏｓｉ，Ｒ．Ｅ．Ｇｏｌｄｂｅｒｇ，ＩｎｔｒｏｄｕｃｔｉｏｎｔｏＤｉｇｉｔａｌＡｕｄｉｏＣｏｄｉｎｇａｎｄＳｔａｎｄａｒｄｓ，Ｓｐｒｉｎｇｅｒ（２００２）Ｊ．Ｂｅｎｅｓｔｙ，Ｍ．Ｍ．Ｓｏｎｄｈｉ，Ｙ．Ｈｕａｎｇ（Ｅｄｓ．），ＨａｎｄｂｏｏｋｏｆＳｐｅｅｃｈＰｒｏｃｅｓｓｉｎｇ，Ｓｐｒｉｎｇｅｒ（２００８）３ＧＰＰｓｐｅｃｉｆｉｃａｔｉｏｎｓ（ＴＳ２６．１９０、２６．１９１、２６．１９２、２６．１９３、２６．１９４、２６．２０４）ＩＴＵ−Ｔ−Ｇ．７２２．２Ｂ．Ｂｅｓｓｅｔｔｅｅｔａｌ．ｅｎｔｉｔｌｅｄ"Ｔｈｅａｄａｐｔｉｖｅｍｕｌｔｉｒａｔｅｗｉｄｅｂａｎｄｓｐｅｅｃｈｃｏｄｅｃ（ＡＭＲ−ＷＢ）"，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ，ｖｏｌ．１０，Ｎｏ．８，２００２，ｐｐ．６２０−６３６

したがって、周波数帯域においてエネルギーを過大評価することなく、かつ符号器からの追加情報を必要とすることなく、ＡＭＲ−ＷＢタイプのコーデックにおける周波数帯域拡張に対する異なる周波数帯域の線形予測フィルタと、このコーデックの相互動作可能なバージョンとの間のゲインの補償を改善する必要が存在する。

本発明はこの状況を改善する。

この目的を達成するために、本発明は、音声周波数信号周波数帯域拡張方法において励起信号またはフィルタに適用されることになる最適化スケール因子を判定する方法を対象とし、帯域拡張方法は、第１の周波数帯域において、励起信号、および線形予測フィルタの係数を備えた第１の周波数帯域のパラメータを復号化または抽出するステップと、少なくとも１つの第２の周波数帯域上で、拡張された励起信号を生成するステップと、線形予測フィルタによって、第２の周波数帯域をフィルタリングするステップと、を備える。判定方法は、
− 第１の周波数帯域の線形予測フィルタよりも低次数の、追加フィルタと称される線形予測フィルタを判定するステップであって、追加フィルタの係数は、第１の周波数帯域から復号化または抽出されたパラメータから取得される、ステップと、
− 追加フィルタの係数に少なくとも応じて、最適化スケール因子を算出するステップと
を備える。

よって、等化されることになる第１の周波数帯域のフィルタよりも低次数の追加フィルタの使用によって、エンベロープの局所揺らぎから生じることがあり、かつ予測フィルタの等化を中断させることがある、高周波数におけるエネルギーの過大評価を回避することが可能になる。

よって、第１の周波数帯域の線形予測フィルタと第２の周波数帯域の線形予測フィルタとの間のゲインの等化が改善される。

正規に取得された最適化スケール因子の有利な適用では、帯域拡張方法は、最適化スケール因子を拡張された励起信号に適用するステップを備える。

最適な実施形態では、最適化スケール因子の適用は、第２の周波数帯域においてフィルタリングするステップと組み合わされる。

よって、最適化スケール因子をフィルタリングおよび適用するステップは、処理の複雑度を減少させる単一のフィルタリングステップにおいて組み合わされる。

特定の実施形態では、追加フィルタの係数は、低次数を取得するために第１の周波数帯域の線形予測フィルタの伝達関数の打ち切り（ｔｒｕｎｃａｔｉｏｎ）によって取得される。

したがって、この低次数追加フィルタは単一の方式で取得される。

さらに、安定したフィルタを取得するために、追加フィルタの係数が追加フィルタの安定度基準に応じて修正される。

特定の実施形態では、最適化スケール因子を算出するステップは、
− 共通周波数に対する第１の周波数帯域および第２の周波数帯域の線形予測フィルタの周波数応答を算出するステップと、
− この共通周波数に対する追加フィルタの周波数応答を算出するステップと、
− 正規に算出された周波数応答に応じて、最適化スケール因子を算出するステップと
を備える。

よって、最適化スケール因子は、共通周波数に近接した第１の帯域の高次数フィルタ周波数応答が信号の最大値または最小値を示すはずである、起こり得る問題となるアーチファクトを防止する方法で算出される。

特定の実施形態では、方法はさらに、予め定められた復号化ビットレートに対して実装される、以下のステップ：
− 復号化された励起信号と拡張された励起信号との間のエネルギー比に応じて、サブフレームごとに算出されたゲインによって、拡張された励起信号をスケーリングする第１のステップと、
− 復号化された補正ゲインによってスケーリングする第１のステップから取得された励起信号をスケーリングする第２のステップと、
− スケーリングする第２のステップの後に取得された信号のエネルギーに応じて、および最適化スケール因子の適用の後に取得された信号に応じて、算出された調整因子によって、カレントサブフレームに対する励起のエネルギーを調整するステップと
を備える。

よって、予め定められた動作モードに対する拡張された信号の品質を改善するために追加情報を使用することができる。

本発明はまた、音声周波数信号周波数帯域拡張デバイスにおいて励起信号またはフィルタに適用されることになる最適化スケール因子を判定するデバイスを対象とし、帯域拡張デバイスは、第１の周波数帯域において、励起信号、および線形予測フィルタの係数を備えた第１の周波数帯域のパラメータを復号化または抽出するモジュールと、少なくとも１つの第２の周波数帯域上で、拡張された励起信号を生成するモジュールと、線形予測フィルタによって、第２の周波数帯域をフィルタリングするモジュールとを備える。判定するデバイスは、
− 第１の周波数帯域の線形予測フィルタよりも低次数の、追加フィルタと称される線形予測フィルタを判定するモジュールであって、追加フィルタの係数は、第１の周波数帯域から復号化または抽出されたパラメータから取得される、モジュールと、
− 追加フィルタの係数に少なくとも応じて、最適化スケール因子を算出するモジュールと
を備える。

本発明は、上述したデバイスを備える復号器を対象とする。

それは、コード命令がプロセッサによって実行されると、上述した最適化スケール因子を判定する方法のステップを実行するそれらのコード命令を備えるコンピュータプログラムを対象とする。

最後に、本発明は、上述した最適化スケール因子を判定する方法を実行するコンピュータプログラムを記憶している、最適化スケール因子を判定するデバイスに組み込まれ、または組み込まれていない、場合によっては着脱可能である、プロセッサによって読み取ることが可能な記憶媒体に関する。

本発明の他の特徴および利点が、純粋に非限定的な例として与えられる、以下の発明を実施するための形態を読むことによって、かつ添付の図面を参照してより明確になるであろう。

従来技術の、および前に説明された周波数帯域拡張ステップを実装するＡＭＲ−ＷＢタイプの復号器の一部を示す図である。従来技術に従って、および前に説明されたＡＭＲ−ＷＢ＋コーデックにおける高帯域の符号化を提示する図である。従来技術に従って、および前に説明されたＡＭＲ−ＷＢ＋コーデックにおける高帯域の符号化を提示する図である。本発明の実施形態に従って使用される帯域拡張デバイスを組み込んだ、ＡＭＲ−ＷＢ符号化と相互動作することができる復号器を示す図である。本発明の実施形態に従って、ビットレートに応じてサブフレームによって最適化されたスケール因子を判定するデバイスを示す図である。本発明の実施形態に従って、最適化スケール因子の算出に使用されるフィルタの周波数応答を示す図である。本発明の実施形態に従って、最適化スケール因子の算出に使用されるフィルタの周波数応答を示す図である。本発明の実施形態に従って、最適化スケール因子を判定する方法の主たるステップをフローチャート形式で示す図である。帯域拡張の一部として最適化スケール因子を判定するデバイスの周波数領域における実施形態を示す図である。本発明の実施形態に従って、帯域拡張における最適化スケール因子判定デバイスのハードウェア実装形態を示す図である。

図３は、ブロック３０９によって示される帯域拡張デバイスによって実装される、本発明の方法の実施形態に従って最適化スケール因子を判定するステップを備える帯域拡張が存在する、ＡＭＲ−ＷＢ／Ｇ．７２２．２標準と互換性を有する、例示的な復号器を示す。

１６ｋＨｚの出力サンプリング周波数で動作するＡＭＲ−ＷＢ復号化とは異なり、ここでは、復号器は、周波数ｆｓ＝８、１６、３２または４８ｋＨｚにおいて出力信号（合成）で動作することができると考えられる。ここでは、低帯域におけるＣＥＬＰ符号化に対する１２．８ｋＨｚの内部周波数でのＡＭＲ−ＷＢアルゴリズムに従って、および１６ｋＨｚの周波数におけるサブフレームごとのゲイン符号化により２３．８５キロビット／秒で符号化が実行されていることが想定され、ここでは、本発明が復号化レベルにおいて説明されるが、ここでは、符号化はまた、周波数ｆｓ＝８、１６、３２または４８ｋＨｚにおいて入力信号で動作することができ、および本発明の文脈の範囲外の、適切なリサンプリング動作が、ｆｓの値に応じて符号化において実装されることが想定される。ｆｓ＝８ｋＨｚのとき、ＡＭＲ−ＷＢと互換性を有する復号化のケースでは、周波数ｆｓにおいて再構築される音声帯域が０〜４０００Ｈｚに制限されるため、０〜６．４ｋＨｚ低帯域を拡張する必要がないことに留意されたい。

図３では、ＣＥＬＰ復号化（低周波数を表すＬＦ）は、ＡＭＲ−ＷＢにあるように、１２．８ｋＨｚの内部周波数においていまだに動作し、本発明に使用される帯域拡張（高周波数を表すＨＦ）は、１６ｋＨｚの周波数において動作し、ならびにＬＦおよびＨＦ合成は、適切なリサンプリング（ブロック３０６およびブロック３１１における内部処理）の後、周波数ｆｓにおいて結合される（ブロック３１２）。変形形態の実施形態では、周波数ｆｓにおける結合された信号をリサンプリングする前に、１２．８〜１６ｋＨｚの低帯域をリサンプリングした後、低帯域および高帯域の結合を１６ｋＨｚにおいて行うことができる。

図３に従った復号化は、受信されるカレントフレームと関連付けられたＡＭＲ−ＷＢモード（またはビットレート）に依存する。インジケーションとして、およびブロック３０９に影響を与えることなく、低帯域におけるＣＥＬＰ部の復号化は、以下のステップ、
・正確に受信されたフレームのケースでは（ｂｆｉ＝０、ｂｆｉは「受信されたフレームに対して値０、および損失したフレーム対して値１を有する、「不良フレームインジケータ」である）、符号化されたパラメータを逆多重化する（ブロック３００）ステップ、
・標準Ｇ．７２２．２の第６．１節で説明される補間およびＬＰＣ係数への変換を伴うＩＳＦパラメータを復号化する（ブロック３０１）ステップ、
・１２．８ｋＨｚにおいて長さ６４の各サブフレームにおいて励起（ｅｘｃまたはｕ'（ｎ））を再構築する適応および固定部で、ＣＥＬＰ励起を復号化する（ブロック３０２）ステップであって、ＣＥＬＰ復号化に関して、ＡＭＲ−ＷＢ符号器／復号器と相互動作可能な復号器のＩＴＵ−Ｔ勧告Ｇ．７１８の第７．１．２．１節の以下の注記によって、

であり、ｖ（ｎ）およびｃ（ｎ）はそれぞれ、適応および固定ディクショナリのコードワードであり、ならびに

および

は、関連付けられた復号化されたゲインである。この励起ｕ'（ｎ）は、次のサブフレームの適応ディクショナリに使用され、次いで、それは後処理され、およびＧ．７１８にあるように、励起ｕ'（ｎ）（ｅｘｃとも表される）が、ブロック３０３における合成フィルタ

に対する入力としての役割を果たす、その修正された後処理されたバージョンｕ（ｎ）（ｅｘｃ２とも表される）と区別される、ステップ、
・

によって合成フィルタリングする（ブロック３０３）ステップであって、復号化されたＬＰＣフィルタ

は、次数１６のフィルタである、ステップ、
・ｆｓ＝８ｋＨｚの場合、Ｇ．７１８の第７．３節に従って狭帯域の後処理をするステップ、
・フィルタ１／（１−０．６８ｚ^−１）によってデエンファシスするステップと、
・Ｇ．７１８の第７．１４．１．１節で説明される、低周波数における混調波ノイズ（ｃｒｏｓｓ−ｈａｒｍｏｎｉｃｓｎｏｉｓｅ）を減衰させる、低周波数を後処理する（「帯域ポスフィルタ（ｂａｓｓｐｏｓｆｉｌｔｅｒ）」と称される）（ブロック３０６）ステップ。この処理は、高帯域（６．４ｋＨｚを上回る）の復号化において考慮される遅延を生じさせる、
・出力周波数ｆｓにおいて１２．８ｋＨｚの内部周波数をリサンプリングするステップ。多数の実施形態が可能である。概念を失うことなく、ここでは、例として、ｆｓ＝８または１６ｋＨｚの場合、Ｇ．７１８の第７．６節で説明されるリサンプリングがここで繰り返され、およびｆｓ＝３２または４８ｋＨｚの場合、追加有限インパルス応答（ＦＩＲ）フィルタが使用され、
・レベル低減によるサイレンスの品質を「改善する」ためにＧ．７１８の第７．１４．３節で説明されるように好ましくは実行される「ノイズゲート」（ブロック３０８）のパラメータを算出するステップ。

本発明に対して実装することができる変形形態では、帯域拡張の本質に影響を与えることなく、励起に適用される後処理動作を修正することができ（例えば、位相分散を改善することができ）、またはそれらの後処理動作を拡張することができる（例えば、混調波ノイズの低減を実装することができる）。

ブロック３０６、３０８、３１４の使用は任意選択であることに留意されたい。

上記説明された低帯域の復号化は、６．６キロビット／秒と２３．８５キロビット／秒との間のビットレートを有する、いわゆる「活性」カレントフレームを想定していることに留意されたい。実際に、ＤＴＸモードが活性化されるとき、一定のフレームを「非活性」として符号化することができ、このケースでは、サイレンス記述子（ｓｉｌｅｎｃｅｄｅｓｃｒｉｐｔｏｒ）を伝達し（３５ビット上で）、または何も伝達しないかのいずれかが可能である。特に、ＳＩＤフレームは、多数のパラメータ、８のフレームで平均化されたＩＳＦパラメータ、８のフレームでの平均エネルギー、非固定ノイズの再構築のための「ディザリング」フラグを記述することが想起される。全てのケースでは、復号器では、カレントフレームに対する励起およびＬＰＣフィルタの再構築（それによって、さらに非活性フレームに帯域拡張を適用することが可能になる）を伴う、活性フレームに対するのと同一の復号化モデルが存在する。同一の観察は、ＬＰＣモデルが適用される、「損失フレーム」（またはＦＥＣ、ＰＬＣ）の復号化を要求する。

ここで説明される実施形態において、および図７を参照して、復号器によって、復号化された低帯域を、カレントフレームで実装されたモードに応じて約５０〜６９００Ｈｚから５０〜７７００Ｈｚまでの範囲でその幅が変動する、拡張された帯域に拡張することが可能になる（復号器上での５０Ｈｚハイパスフィルタリングを考慮した５０〜６４００Ｈｚ、一般的なケースでは０〜６４００Ｈｚ）。よって、０〜６４００Ｈｚの第１の周波数帯域、および６４００〜８０００Ｈｚの第２の周波数帯域を参照することが可能である。実際に、好ましい実施形態では、６０００〜６９００または７７００Ｈｚの幅のバンドパスフィルタリングを可能にするために、５０００〜８０００Ｈｚの帯域における周波数領域において励起の拡張が実行される。

２３．８５キロビット／秒において、２３．８５キロビット／秒において伝達されるＨＦゲイン補正情報（０．８キロビット／秒）がここで復号化される。その使用は、図４を参照して後に詳述される。本発明のために使用される帯域拡張デバイスを示し、および実施形態における図７で詳述される、高帯域合成部が、ならびにブロック３０９において作成される。

復号化された低帯域および高帯域を調整するために、ブロック３０６および３０７の出力を同期する遅延（ブロック３１０）がもたらされ、１６ｋＨｚにおいて合成される高帯域は、１６ｋＨｚ〜周波数ｆｓでリサンプリングされる（ブロック３１１の出力）。遅延Ｔの値は、高帯域信号がどのように合成されるかに依存し、および低周波数の後処理にあるように周波数ｆｓに依存する。よって、全体的に、ブロック３１０におけるＴの値は、特定の実装形態に従って調整される必要がある。

次いで、低帯域および高帯域がブロック３１２において結合され（追加され）、得られた合成が、次数２の、その係数が周波数ｆｓに依存する５０Ｈｚハイパスフィルタリング（ＩＩＲタイプの）によって後処理され（ブロック３１３）、ならびにＧ．７１８と同様の方式で、「ノイズゲート」の任意選択の適用で後処理を出力する（ブロック３１４）。

図３を参照して、ここでは、周波数帯域拡張処理において励起信号に適用されることになる最適化スケール因子を判定するデバイスの実施形態が説明される。このデバイスは、前に説明された帯域拡張ブロック３０９に含まれる。

よって、ブロック４００は、第１の周波数帯域ｕ（ｎ）において復号化された励起信号から、少なくとも１つの第２の周波数帯域上で、拡張された励起信号ｕ_ＨＢ（ｎ）を取得するために帯域拡張を実行する。

本発明に従った最適化スケール因子評価は、信号ｕ_ＨＢ（ｎ）がどのように取得されるかとは独立していることに留意されたい。しかしながら、そのエネルギーに関する１つの条件が重要である。実際に、６０００〜８０００Ｈｚの高帯域のエネルギーは、ブロック３０２の出力における復号化された励起信号の４０００〜６０００Ｈｚの帯域のエネルギーと同様のレベルにあるべきである。さらに、低帯域信号がデエンファシスされるため（ブロック３０５）、特定のデエンファシスフィルタを使用し、または上述したフィルタの平均減衰に対応する定数因子を乗算するかのいずれかによって、デエンファシスがまた高帯域励起信号に適用されるべきである。この条件は、符号器によって伝達される追加情報を使用する２３．８５キロビット／秒ビットレートのケースには当てはまらない。このケースでは、高帯域励起信号のエネルギーは、後に説明されるように、符号器に対応する信号のエネルギーと一致するはずである。

周波数帯域拡張は、例えば、ホワイトノイズから、図１を参照してブロック１００〜１０２において説明されたＡＭＲ−ＷＢタイプの復号器に対するのと同一の方法で実装されてもよい。

別の実施形態では、図７におけるブロック７００〜７０７に対して後に示され、かつ説明されるホワイトノイズおよび復号化された励起信号の結合から、この周波数帯域拡張を実装することができる。

以下で説明される復号化された励起信号と拡張された励起信号との間のエネルギーレベルの保存を伴う他の周波数帯域拡張方法はもちろん、ブロック４００に対して想定されてもよい。

さらに、帯域拡張モジュールはまた、復号器から独立することができ、ならびに励起およびそれからのＬＰＣフィルタを抽出する音声信号の分析と共に、拡張モジュールに記憶されまたは拡張モジュールに送信される既存の音声信号に対する帯域拡張を実行することができる。このケースでは、拡張モジュールの入力における励起信号は、もはや復号化された信号ではないが、本発明の実装形態において最適化スケール因子を判定する方法で使用される第１の周波数帯域の線形予測フィルタの係数と同様に、分析の後に抽出された信号である。

図４で示された例では、それに対して最適化スケール因子の判定がブロック４０１に制限される、２３．８５キロビット／秒を上回るビットレートのケースが最初に考えられる。

このケースでは、ｇ_ＨＢ２（ｍ）で表される最適化スケール因子が算出される。一実施形態では、この算出は、好ましくはサブフレームごとに実行され、ならびにそれは、合成された高帯域の過度なエネルギーをもたらし、よって可聴アーチファクトを生じさせることがある過大評価のケースを回避するための追加の予防策を有する、図７を参照して後に説明されるような、低周波数および高周波数で使用されるＬＰＣフィルタ

および

の周波数応答のレベルを均等にすることにある。

代替的な実施形態では、例えば、フィルタ

の代わりに、ＩＴＵ−Ｔ勧告Ｇ．７１８に従って、ＡＭＲ−ＷＢ符号器／復号器と相互作用することができるＡＭＲ−ＷＢ復号器または復号器で実装されるような、推定されたＨＦ合成フィルタ

を維持することが可能である。次いで、本発明に従った補償が、フィルタ

および

から実行される。

最適化スケール因子の判定はまた、第１の周波数帯域の線形予測フィルタ

よりも低次数の、追加フィルタと称される線形予測フィルタの判定（４０１ａにおいて）によって実行され、追加フィルタの係数は、第１の周波数帯域から復号化または抽出されるパラメータから取得される。次いで、最適化スケール因子は、拡張された励起信号ｕ_ＨＢ（ｎ）に適用されることになるそれらの係数に少なくとも応じて算出される（４０１ｂにおいて）。

ブロック４０１で実装される、最適化スケール因子の判定の原理は、１６ｋＨｚにおいてサンプリングされる信号から取得される具体的な例と共に図５ａおよび５ｂで示され、３つのフィルタの以下でＲ、Ｐ、Ｑで表される周波数応答振幅値が、カレントサブフレームにおける６０００Ｈｚ（垂直破線）の共通周波数において算出され、カレントサブフレームのインデックスｍは、文章を明確にするために、サブフレームによって推定されるＬＰＣフィルタの表記においてここでは想起されない。６０００Ｈｚの値は、それが低帯域のナイキスト周波数に近づくように、すなわち、６４００Ｈｚになるように選択される。最適化スケール因子を判定するためにこのナイキスト周波数をとらないことが好ましい。実際に、低周波数における復号化された信号のエネルギーは典型的には、６４００Ｈｚにおいて既に減衰している。さらに、ここで説明される帯域拡張は、６０００〜８０００Ｈｚの範囲にある、高帯域と称される第２の周波数帯域上で実行される。本発明の変形形態では、６０００Ｈｚ以外の周波数が、最適化スケール因子を判定する概念を失うことなく、選択されることが可能であることに留意するべきである。２つのＬＰＣフィルタが別個の帯域（ＡＭＲ−ＷＢ＋にあるように）に対して定義されるケースを考えることも可能である。このケースでは、Ｒ、ＰおよびＱが別個の周波数において算出される。

図５ａおよび５ｂは、量（ｑｕａｎｔｉｔｉｅｓ）Ｒ、Ｐ、Ｑがどのように定義されるかを示す。

第１のステップは、６０００Ｈｚの周波数における第１の周波数帯域（低帯域）および第２の周波数帯域（高帯域）の線形予測フィルタの周波数応答ＲおよびＰをそれぞれ算出することにある。以下が最初に算出され、

Ｍ＝１６は、復号化されたＬＰＣフィルタ

の次数であり、θは、１２．８ｋＨｚのサンプリング周波数に対して正規化される６０００Ｈｚの周波数に相当し、すなわち、

である。

次いで、同様に以下が算出され、

である。

好ましい実施形態では、量ＰおよびＲが、以下の疑似コードに従って算出される。
ｐｘ＝ｐｙ＝０
ｒｘ＝ｒｙ＝０
ｆｏｒｉ＝０ｔｏ１６
ｐｘ＝ｐｘ＋Ａｐ［ｉ］*ｅｘｐ＿ｔａｂ＿ｐ［ｉ］
ｐｙ＝ｐｙ＋Ａｐ［ｉ］*ｅｘｐ＿ｔａｂ＿ｐ［３３−ｉ］
ｒｘ＝ｒｘ＋Ａｑ［ｉ］*ｅｘｐ＿ｔａｂ＿ｑ［ｉ］
ｒｙ＝ｒｙ＋Ａｑ［ｉ］*ｅｘｐ＿ｔａｂ＿ｑ［３３−ｉ］
ｅｎｄｆｏｒ
Ｐ＝１／ｓｑｒｔ（ｐｘ*ｐｘ＋ｐｙ*ｐｙ）
Ｒ＝１／ｓｑｒｔ（ｒｘ*ｒｘ＋ｒｙ*ｒｙ）
ここで、

は、

（次数１６の）の係数に相当し、

は、

の係数に相当し、ｓｑｒｔ（）は、平方根演算に対応し、ならびにサイズ３４のテーブルｅｘｐ＿ｔａｂ＿ｐおよびｅｘｐ＿ｔａｂ＿ｑは、

を有する、６０００Ｈｚ周波数と関連付けられた複素指数関数の実数部および虚数部を含む。

例えば、多項式

を次数２に適切に切り捨てることによって、追加予測フィルタが取得される。

実際に、次数への直接の切り捨ては、次数２のこのフィルタが安定することを保証するものが通常存在しないため、問題を引き起こすことがある、フィルタ

につながる。好ましい実施形態では、したがって、フィルタ

の安定度が検出され、およびフィルタ

が使用され、その係数は、不安定度検出に応じて

から得られる。特に、以下が初期化される。

フィルタ

の安定度を異なって検証することができ、ここでは、ＰＡＲＣＯＲ係数（または反射係数）領域において

を算出することによって変換が使用される。

｜ｋ_ｉ｜＜１、ｉ＝１，２の場合に安定度が検証される。したがって、ｋ_ｉの値は、以下のステップで、フィルタの安定度を保証する前に条件付きで修正され、

ここで、ｍｉｎ（．，．）およびｍａｘ（．，．）はそれぞれ、２つのオペランドの最小値および最大値を与える。

ｋ_１に対する閾値０．９９およびｋ_２に対する閾値０．６は、本発明に変形形態において調整されることが可能であることに留意されたい。第１の反射係数ｋ_１は、次数１にモデル化される信号のスペクトル傾斜（またはチルト）を特徴付け、本発明におけるｋ_１の値は、この傾斜を保持し、および

のそれと同様のチルトを維持するために、安定限界に近い値で飽和することが想起される。また、第２の反射係数ｋ_２は、次数２にモデル化される信号の共鳴レベルを特徴付け、次数２のフィルタの使用が６０００Ｈｚの周波数の周囲のそのような共鳴の影響を除去することを目的としているため、ｋ_２の値はさらに強く制限され、この制限は０．６に設定されることが想起される。

次いで、

の係数が

によって取得される。

したがって、追加フィルタの周波数応答は最後に

で算出され

である。この量は、好ましくは以下の疑似コードに従って算出され、
ｑｘ＝ｑｙ＝０
ｆｏｒｉ＝０ｔｏ２
ｑｘ＝ｑｘ＋Ａｓ［ｉ］*ｅｘｐ＿ｔａｂ＿ｑ［ｉ］；
ｑｙ＝ｑｙ＋Ａｓ［ｉ］*ｅｘｐ＿ｔａｂ＿ｑ［３３−ｉ］；
ｅｎｄｆｏｒ
Ｑ＝１／ｓｑｒｔ（ｑｘ*ｑｘ＋ｑｙ*ｑｙ）
ここで、Ａｓ［ｉ］＝

である。

概念を失うことなく、別の方法では、例えば、次数１６のＬＰＣフィルタ

に、Ｊ．Ｄ．ＭａｒｋｅｌａｎｄＡ．Ｈ．Ｇｒａｙ，ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎｏｆＳｐｅｅｃｈ，ＳｐｒｉｎｇｅｒＶｅｒｌａｇ（１９７６年）で説明される「ＳＴＥＰＤＯＷＮ」と称されるＬＰＣ次数の削減手順を適用することよって、または１２．８ｋＨｚにおいて合成され（復号化され）およびウインドウ化された信号上で算出された自己相関からの２つのＬｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ（またはＳＴＥＰ−ＵＰ）アルゴリズムの繰り返しを実行することによって、次数２のフィルタの係数を算出することが可能である。

一部の信号に対し、復号化された最初の３つのＬＰＣ係数から算出された量Ｑは、スペクトルにおけるスペクトル傾斜（またはチルト）をより良好に考慮し、および「偽」ピークの影響を回避し、または全てのＬＰＣ係数から算出される量Ｒの値を歪めもしくは上昇させることがある６０００Ｈｚに近い。

好ましい実施形態では、以下のように、事前に算出された量Ｒ、Ｐ、Ｑから条件付きで推定される：
チルト（ｒ（ｉ）が自己相関であるｒ（１）／ｒ（０）の形式で正規化された自己相関によって、ブロック１０４でＡＭＲ−ＷＢにあるように算出される）が負である場合（図５ｂに示されるようにチルトが０未満である）、以下のようにスケール因子の算出が行われ、
高帯域のエネルギーの過度に急激な変動に起因したアーチファクトを回避するために、平滑化がＲの値に適用される。好ましい実施形態では、指数関数的平滑化が、
Ｒ＝０．５Ｒ＋０．５Ｒ_ｐｒｅｖ
Ｒ_ｐｒｅｖ＝Ｒ
の形式で時間において一定の因子（０．５）で実行され、Ｒ_ｐｒｅｖは、先行のサブフレームにおけるＲの値に相当し、因子０．５は、経験的に最適化され、明白に、因子０．５は、別の値に変更されることが可能であり、および他の平滑化方法も可能である。平滑化によって、一時的な変動を減少させることが可能であり、よってアーチファクトを回避することが可能である。

次いで、最適化スケール因子が
ｇ_ＨＢ２（ｍ）＝ｍａｘ（ｍｉｎ（Ｒ，Ｑ），Ｐ）／Ｐ
によって与えられる。

代替的な実施形態では、
ｇ_ＨＢ２（ｍ）←０．５ｇ_ＨＢ２（ｍ）＋０．５ｇ_ＨＢ２（ｍ−１）
となるように、Ｒの平滑化をｇ_ＨＢ２（ｍ）の平滑化に置き換えることが可能である。チルト（ブロック１０４でＡＭＲ−ＷＢにあるように算出される）が正である場合（図５ａにあるようにチルトが０を上回る）、以下のようにスケール因子の算出が行われる：
先行のケースにあるように、Ｒが低いときにより強い平滑化で、量Ｒが時間で適応して平滑化され、この平滑化によって一時的な変動を減少させることが可能であり、よってアーチファクトを回避することが可能である。
Ｒ＝（１−α）Ｒ＋αＲ_ｐｒｅｖ、α＝１−Ｒ^２
Ｒ_ｐｒｅｖ＝Ｒ
次いで、最適化スケール因子が
ｇ_ＨＢ２（ｍ）＝ｍｉｎ（Ｒ，Ｐ，Ｑ）／Ｐ
によって与えられる。

代替的な実施形態では、Ｒの平滑化を、上記算出されたｇ_ＨＢ２（ｍ）の平滑化に置き換えることが可能である。
ｇ_ＨＢ（ｍ）＝（１−α）ｇ_ＨＢ（ｍ）＋αｇ_ＨＢ（ｍ−１）、ｍ＝０，...，３、α＝１−ｇ^２ _ＨＢ（ｍ）
ここで、ｇ_ＨＢ（−１）は、先行のフレームの最後のサブフレームに対して算出されたスケールまたはゲイン因子である。

ここで、スケール因子を過大評価することを回避するために、Ｒ、Ｐ、Ｑの最小値がとられる。

変形形態では、チルトにのみ依存する上記条件は、決定を改善するために、チルトパラメータのみでなく、他のパラメータをも考慮するように拡張されることが可能である。さらに、ｇ_ＨＢ２（ｍ）の算出は、それらの前記追加パラメータに従って調整されることが可能である。

追加パラメータの例は、

として定義することができるゼロ交差（ＺＣＲ、ゼロ交差率）の数であり、

である。

パラメータｚｃｒは概して、チルトと同様の結果を与える。良好な分類基準は、合成信号ｓ（ｎ）に対して算出されたｚｃｒ_ｓと、１２８００Ｈｚにおける励起信号ｕ（ｎ）に対して算出されたｚｃｒ_ｕとの間の比率である。この比率は、０と１との間であり、０は、減少するスペクトルを信号が有していることを意味し、１は、スペクトルが増加していることを意味（（１−ｔｉｌｔ）／２に相当する）する。このケースでは、ｚｃｒ_ｓ／ｚｃｒ_ｕ＞０．５の比率は、ｔｉｌｔ＜０のケースに相当し、ｚｃｒ_ｓ／ｚｃｒ_ｕ＜０．５の比率は、ｔｉｌｔ＞０に相当する。

変形形態では、パラメータｔｉｌｔ_ｈｐの関数を使用することが可能であり、ｔｉｌｔ_ｈｐは、例えば、４８００Ｈｚにおいてカットオフ周波数でハイパスフィルタによってフィルタリングされる、合成信号ｓ（ｎ）に対して算出されたチルトであり、このケースでは、６〜８ｋＨｚの応答

（１６ｋＨｚにおいて適用される）は、４．８〜６．４ｋＨｚの

の重み付け応答（ｗｅｉｇｈｔｅｄｒｅｓｐｏｎｓｅ）に相当する。

は、さらなる平坦化応答（ｆｌａｔｔｅｎｅｄｒｅｓｐｏｎｓｅ）を有するため、このチルトの変化を補償する必要がある。ｔｉｌｔ_ｈｐに従ったスケール因子関数は次いで、（１−ｔｉｌｔ_ｈｐ）^２＋０．６、によって実施形態において与えられる。したがって、ＱおよびＲは、ｔｉｌｔ＞０のときに、ｍｉｎ（１，（１−ｔｉｌｔ_ｈｐ）^２＋０．６）、と乗算され、ｔｉｌｔ＜０のときに、ｍａｘ（１，（１−ｔｉｌｔ_ｈｐ）^２＋０．６）、と乗算される。

ここで、２３．８５キロビット／秒ビットレートのケースが考えられ、そのケースでは、ブロック４０３〜４０８によってゲイン補正が実行される。このゲイン補正はさらに、別の発明の主題である。本発明に従ったこの特定の実施形態では、２３．８５キロビット／秒において品質を改善するために使用される、０．８キロビット／秒のビットレートを有するＡＭＲ−ＷＢ（互換性を有する）符号化によって伝達される、ｇ_{ＨＢｃｏｒｒ}（ｍ）で表されるゲイン補正情報が使用される。

ここで、ＩＴＵ−ＴｃｌａｕｓｅＧ．７２２．２／５．１１、または同様に、３ＧＰＰｃｌａｕｓｅＴＳ２６．１９０／５．１１で説明されるように、ＡＭＲ−ＷＢ（互換性を有する）符号化は、４ビット上で補正ゲイン量子化を実行している。

ＡＭＲ−ＷＢ符号器では、１６ｋＨｚにおいてサンプリングされ、および６〜７ｋＨｚバンドパスフィルタｓ_ＨＢ（ｎ）によってフィルタリングされた元の信号のエネルギーを、合成フィルタ

および６〜７ｋＨｚバンドパスフィルタ（フィルタリングの前に、ノイズのエネルギーが、１２．８ｋＨｚにおける励起のレベルと同様のレベルに設定される）ｓ_ＨＢ２（ｎ）によってフィルタリングされた１６ｋＨｚにおけるホワイトノイズのエネルギーと比較することによって、補正ゲインが算出される。ゲインは元の信号のエネルギーと、２つに分割されるノイズのエネルギーとの比率のルートである。１つの可能な実施形態では、より広帯域（例えば、６〜７．６ｋＨｚ）を有するフィルタに対するバンドパスフィルタを変更することが可能である。

２３．８５キロビット／秒において受信されるゲイン情報（ブロック４０７で）を適用することを可能にするために、ＡＭＲ−ＷＢ（互換性を有する）符号化の予想されるレベルと同様のレベルに励起をさせることが重要である。よって、ブロック４０４は、以下の式に従って励起信号のスケーリングを実行し、
ｕ_ＨＢ１（ｎ）＝ｇ_ＨＢ３（ｍ）ｕ_ＨＢ（ｎ）、ｎ＝８０ｍ，・・・，８０（ｍ＋１）−１
ｇ_ＨＢ３（ｍ）は、

の形式で、ブロック４０３で算出されたサブフレームごとのゲインであり、ＡＭＲ−ＷＢ符号化において、ＨＦ励起が０〜８０００Ｈｚ帯域を上回るホワイトノイズであると仮定すると、分母における因子５は、信号ｕ（ｎ）と信号ｕ_ＨＢ（ｎ）との間の帯域幅差を補償する役割を果たす。

２３．８５キロビット／秒において送信される、ｉｎｄｅｘ_{ＨＦ＿ｇａｉｎ}（ｍ）で表されるサブフレームごとの４ビットのインデックスは、ビットストリームから逆多重化され（ブロック４０５）、および以下のようにブロック４０６によって復号化され、
ｇ_{ＨＢｃｏｒｒ}（ｍ）＝２・ＨＰ＿ｇａｉｎ（ｉｎｄｅｘ_{ＨＦ＿ｇａｉｎ}（ｍ））
ＨＰ＿ｇａｉｎ（．）は、ＡＭＲ−ＷＢ符号化で定義され、および以下で想起されるＨＦゲイン量子化辞書である。

ブロック４０７は、以下の式に従って、励起信号のスケーリングを実行する。
ｕ_ＨＢ２（ｎ）＝ｇ_{ＨＢｃｏｒｒ}（ｍ）ｕ_ＨＢ１（ｎ）、ｎ＝８０ｍ，・・・，８０（ｍ＋１）−１

最後に、励起のエネルギーは、以下の条件（ブロック４０８）でのカレントサブフレームのレベルに調整される。以下が算出される。

ここで、分子は、モード２３．０５で取得される高帯域信号エネルギーを表す。前に説明されたように、ビットレート＜２３．８５キロビット／秒の場合、復号化された励起信号と拡張された励起信号ｕ_ＨＢ（ｎ）との間のエネルギーのレベルを保持することが必要であるが、２３．８５キロビット／秒のビットレートのケースでは、ｕ_ＨＢ（ｎ）がゲインｇ_ＨＢ３（ｍ）によってスケーリングされるため、この制約は、このケースでは必要ではない。二重乗算を回避するために、ブロック４００で信号に適用される一定の乗算演算は、ｇ（ｍ）と乗算することによってブロック４０２で適用される。ｇ（ｍ）の値は、ｕ_ＨＢ（ｎ）合成アルゴリズムに依存し、および低帯域における復号化された励起信号と信号ｇ（ｍ）ｕ_ＨＢ（ｎ）との間のエネルギーレベルが保持されるように調整される必要がある。

図７を参照して後に詳細に説明される特定の実施形態では、ｇ（ｍ）＝０．６ｇ_ＨＢ１（ｍ）であり、ｇ_ＨＢ１（ｍ）は、信号ｕ_ＨＢに対し、サブフレームごとのエネルギーと信号ｕ（ｎ）に関するフレームごとのエネルギーとの間で同一の比率を保証するゲインであり、および０．６は、５０００〜６４００Ｈｚのデエンファシスフィルタの平均周波数応答振幅値に相当する。

ブロック４０８では、低帯域信号のチルト上に情報が存在し、好ましい実施形態では、このチルトは、ブロック１０３および１０４に従ってＡＭＲ−ＷＢコーデックにあるように算出されるが、本発明の原理を変更することなくチルトを評価する他の方法が可能であることが想定される。

ｆａｃ（ｍ）＞１またはチルト＜０の場合、
ｕ_ＨＢ'（ｎ）＝ｕ_ＨＢ２（ｎ）、ｎ＝８０ｍ，・・・，８０（ｍ＋１）−１
が想定され、それ以外の場合、

が想定される。

特にブロック４０１および４０２では、ここで説明される最適化スケール因子の算出は、多数の態様によるＡＭＲ−ＷＢ＋コーデックで実行されるフィルタレベルの上述した等化と区別される。
・最適化スケール因子は、一時的フィルタリングを伴うことなくＬＰＣフィルタの伝達関数から直接算出される。これは方法を簡易化する。
・低帯域と関連付けられたナイキスト周波数（６４００Ｈｚ）とは異なる周波数において好ましくは等化が行われる。実際に、ＬＰＣモデリングは、リサンプリング動作によって典型的には生じる信号の減衰を黙示的に表し、したがってＬＰＣフィルタの周波数応答は、選択された共通周波数までではないナイキスト周波数における減少の影響を受けることがある。
・ここで、等化は、等化されることになる２つのフィルタに加え、低次数（ここでは次数２の）フィルタに依存する。この追加フィルタによって、予測フィルタの周波数応答の算出のために共通周波数に存在することがある局所的スペクトル変動（最大値または最小値）の影響を回避することが可能になる。

ブロック４０３〜４０８に対し、本発明の利点は、本発明に従って２３．８５キロビット／秒において復号化された信号の品質が、ＡＭＲ−ＷＢ復号器におけるケースではない、２３．０５キロビット／秒において復号化された信号と比較して改善されることである。実際に、本発明のこの態様によって、２３．８５キロビット／秒において受信される追加情報（０．８キロビット／秒）を使用することが可能になるが、制御された方式では（ブロック４０８）、２３．８５のビットレートにおいて拡張された励起信号の品質を改善することが可能になる。

図４のブロック４０１〜４０８によって示されるような最適化スケール因子を判定するデバイスは、図６を参照してここで説明される最適化スケール因子を判定する方法を実装する。

メインステップは、ブロック４０１によって実装される。

よって、拡張された励起信号ｕ_ＨＢ（ｎ）は、低帯域と称される第１の周波数帯域で、励起信号、および例えば、第１の周波数帯域の線形予測フィルタの係数などの第１の周波数帯域のパラメータを復号化または抽出するステップを備える周波数帯域拡張方法Ｅ６０１において取得される。

ステップＥ６０２は、第１の周波数帯域の次数よりも低次数の、追加フィルタと称される線形予測フィルタを判定する。このフィルタを判定するために、復号化または抽出された第１の周波数帯域のパラメータが使用される。

一実施形態では、例えば２の、より低いフィルタ次数を取得するために低帯域の線形予測フィルタの伝達関数の打ち切りによってこのステップが実行される。次いで、図４を参照して前に説明されたような安定度基準に応じてそれらの係数を修正することができる。

よって、判定された追加フィルタの係数から、拡張された励起信号に適用されることになる最適化スケール因子を算出するために、ステップＥ６０３が実装される。この最適化スケール因子は例えば、低帯域（第１の周波数帯域）と高帯域（第２の周波数帯域）との間の共通周波数において、追加フィルタの周波数応答から算出される。このフィルタの周波数応答と低帯域および高帯域フィルタの応答との間で最小値を選択することができる。

したがって、これは、従来技術の方法に存在することがあったエネルギーの過大評価を回避する。

最適化スケール因子の算出のこのステップは、例えば、図４ならびに図５ａおよび５ｂを参照して前に説明されている。

帯域拡張のためのブロック４０２または４０９によって実行される（復号化ビットレートに応じて）ステップＥ６０４は、正規に算出された最適化スケール因子を拡張された励起信号に適用して、最適に拡張された励起信号ｕ_ＨＢ'（ｎ）を取得する。

特定の実施形態では、最適化スケール因子７０８を判定するデバイスは、図７を参照してここで説明される帯域拡張デバイスに組み込まれる。ブロック７０８によって示される最適化スケール因子を判定するこのデバイスは、図６を参照して前に説明された最適化スケール因子を判定する方法を実装する。

この実施形態では、図４の帯域拡張ブロック４００は、ここで説明される図７のブロック７００〜７０７を備える。

よって、帯域拡張デバイスの入力において、分析によって復号化または評価された低帯域励起信号が受信される（ｕ（ｎ））。ここでの帯域拡張は、図３のブロック３０２の出力において１２．８ｋＨｚにおいて復号化された励起（ｅｘｃ２またはｕ（ｎ））を使用する。

この実施形態では、オーバーサンプリングおよび拡張された励起の生成が、５〜８ｋＨｚの範囲にあり、よって第１の周波数帯域（０〜６．４ｋＨｚ）を上回る第２の周波数帯域（６．４〜８ｋＨｚ）を含む周波数帯域において実行される。

よって、拡張された励起信号の生成は、少なくとも第２の周波数帯域上で実行されるが、第１の周波数帯域の一部の上でも実行される。

明らかに、それらの周波数帯域を定義する値は、復号器または本発明が適用される処理デバイスに応じて異なってもよい。

この例示的な実施形態の場合、この信号は、時間−周波数変換モジュール５００によって励起信号スペクトルＵ（ｋ）を取得するために変換される。

特定の実施形態では、変換は、ウインドウ化なしで、２０ミリ秒（２５６サンプル）のカレントフレーム上でＤＣＴ−ＩＶ（「離散コサイン変換」−タイプＩＶを表す）を使用し、それは以下の式に従ってｎ＝０，・・・，２５５を有するｕ（ｎ）を直接変換することになり、

Ｎは２５６であり、およびｋは、０，・・・，２５５である。

処理が信号領域においてではなく、励起領域において実行され、それによって、アーチファクトが聞こえなくなり（ブロック効果）、それは本発明のこの実施形態の重要な利点を構成するため、ウインドウ化なしの（または同様に、フレームの長さの黙示的な長方形ウインドウでの）変換が可能であることに留意するべきである。

この実施形態では、ＤＣＴ−ＩＶ変換は、Ｄ．Ｍ．Ｚｈａｎｇ，Ｈ．Ｔ．Ｌｉ，ＡＬｏｗＣｏｍｐｌｅｘｉｔｙＴｒａｎｓｆｏｒｍ−ＥｖｏｌｖｅｄＤＣＴ，ＩＥＥＥ１４ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔａｔｉｏｎａｌＳｃｉｅｎｃｅａｎｄＥｎｇｉｎｅｅｒｉｎｇ（ＣＳＥ），２０１１年８月，１４４〜１４９ページの論文によって説明され、およびＩＴＵ−Ｔ標準Ｇ．７１８ＡｎｎｅｘＢおよびＧ．７２９．１ＡｎｎｅｘＥにおいて実装されるいわゆる「発展型ＤＣＴ（ＥＤＣＴ）」アルゴリズムに従ったＦＦＴによって実装される。

本発明の変形形態では、および概念を失うことなく、ＤＣＴ−ＩＶ変換は、ＦＦＴ（「高速フーリエ変換」を表す）またはＤＣＴ−ＩＩ（離散コサイン変換−タイプＩＩ）などの、同一の長さの、かつ励起領域における他の短期時間−周波数変換と置き換えられることが可能である。代わりに、変換によるフレーム上でのＤＣＴ−ＩＶを、例えば、ＭＤＣＴ（「修正離散コサイン変換」を表す）を使用することによって、カレントフレームの長さよりも長い長さの重複−加算およびウインドウ化と置き換えることが可能である。このケースでは、図３のブロック３１０における遅延Ｔは、この変換による分析／合成に起因した追加遅延に応じて適切に調整（減少）される必要がある。

０〜６４００Ｈｚ帯域をカバーする（１２．８ｋＨｚにおいて）２５６のサンプルの、ＤＣＴスペクトルＵ（ｋ）は次いで、以下の形式にある０〜８０００Ｈｚ帯域をカバーする（１６ｋＨｚにおいて）３２０のサンプルのスペクトルに拡張され（ブロック７０１）、

そこでは、好ましくはｓｔａｒｔ＿ｂａｎｄ＝１６０とされる。

ブロック７０１は、オーバーサンプリングおよび拡張された励起信号を生成するモジュールとして動作し、ならびにサンプル（ｋ＝２４０，・・・，３１９）の１／４をスペクトルに追加することによって（１６と１２．８との間の比率は５／４である）、周波数領域における１２．８〜１６ｋＨｚでリサンプリングを実行する。

さらに、ブロック７０１は、Ｕ_ＨＢ１（ｋ）の最初の２００のサンプルがゼロに設定されるため、０〜５０００Ｈｚ帯域において黙示的なハイパスフィルタリングを実行し、後に説明されるように、このハイパスフィルタリングはまた、５０００〜６４００Ｈｚ帯域におけるインデックスｋ＝２００，・・・，２５５のスペクトル値の漸進的な減衰の一部によって補完され、この漸進的な減衰は、ブロック７０４において実装されるが、ブロック７０４の外部では別個に実行されてもよい。同様に、かつ本発明の変形形態では、変換された領域における減衰された係数ｋ＝２００，・・・，２５５の、ゼロに設定されるインデックスｋ＝０，・・・，１９９の係数のブロックに分離されるハイパスフィルタリングの実装形態は、したがって、単一のステップで実行されることが可能である。

この例示的な実施形態では、かつＵ_ＨＢ１（ｋ）の定義に従って、Ｕ_ＨＢ１（ｋ）（インデックスｋ＝２００，・・・，２３９に相当する）の５０００〜６０００Ｈｚ帯域は、Ｕ（ｋ）の５０００〜６０００Ｈｚ帯域から複製されることに留意されたい。このアプローチによって、この帯域において元のスペクトルを保持し、およびＬＦ合成にＨＦ合成を追加するときの５０００〜６０００Ｈｚ帯域における歪みを生じさせることを回避することが可能になり、特に、この帯域における信号の位相（ＤＣＴ−ＩＶ領域において黙示的に表される）が保持される。

ここで、Ｕ_ＨＢ１（ｋ）の６０００〜８０００Ｈｚ帯域は、ｓｔａｒｔ＿ｂａｎｄの値が好ましくは１６０に設定されるため、Ｕ（ｋ）の４０００〜６０００Ｈｚ帯域を複製することによって定義される。

実施形態の変形形態では、ｓｔａｒｔ＿ｂａｎｄの値は、１６０の値の周囲で適応することが可能になる。ｓｔａｒｔ＿ｂａｎｄ値の適応の詳細は、それらが本発明の枠組みを、その範囲を変更することなく超えるため、ここでは説明されない。

一定の広帯域信号（１６ｋＨｚにおいてサンプリングされる）の場合、高帯域（６ｋＨｚを上回る）は、ノイズが入り、調波であり、またはノイズおよび調波の混合を含むことがある。さらに、６０００〜８０００Ｈｚ帯域における調波のレベルは概して、低周波数帯域のレベルと相関付けられる。よって、ノイズ生成ブロック７０２は、高周波数と称される第２の周波数帯域に相当する周波数領域Ｕ_ＨＢＮ（ｋ）、ｋ＝２４０，・・・，３１９（８０のサンプル）においてノイズ生成を実行して、次いで、ブロック７０３において、このノイズをスペクトルＵ_ＨＢ１（ｋ）と結合する。

特定の実施形態では、ノイズ（６０００〜８０００Ｈｚ帯域における）は、１６ビット上の線形合同ジェネレータで疑似ランダムに生成され、

上記規定では、カレントフレームにおけるＵ_ＨＢＮ（２３９）は、前のフレームの値Ｕ_ＨＢＮ（３１９）に相当する。本発明の変形形態では、このノイズ生成を他の方法によって置き換えることが可能である。

異なる方法で、結合ブロック７０３を作成することができる。好ましくは、以下の式の適応加法混合が考えられ、
Ｕ_ＨＢ２（ｋ）＝βＵ_ＨＢ１（ｋ）＋αＧ_ＨＢＮＵ_ＨＢＮ（ｋ）、ｋ＝２４０，・・・，３１９
Ｇ_ＨＢＮは、２つの信号の間のエネルギーのレベルを等化する役割を果たす正規化因子であり、

ε＝０．０１であり、係数α（０と１との間）は、復号化された低帯域から評価されたパラメータに応じて調整され、および係数β（０と１との間）は、αに依存する。

好ましい実施形態では、ノイズのエネルギーは、３つの帯域、

を有する２０００〜４０００Ｈｚ、４０００〜６０００Ｈｚおよび６０００〜８０００Ｈｚにおいて算出され、

であり、Ｎ（ｋ_１，ｋ_２）は、インデックスｋの集合であり、インデックスｋに対して、インデックスｋの係数が、ノイズと関連付けられるものとして分類される。この集合は、例えば、｜Ｕ'（ｋ）｜≧｜Ｕ'（ｋ−１）｜および｜Ｕ'（ｋ）｜≧｜Ｕ'（ｋ＋１）｜を検証するＵ'（ｋ）における局所的ピークを検出し、およびそれらの射線がノイズと関連付けられないことを考慮することによって、すなわち、（前の条件の否定を適用することによって）
Ｎ（ａ，ｂ）＝｛ａ≦ｋ≦ｂ｜｜Ｕ'（ｋ）｜＜｜Ｕ'（ｋ−１）｜または｜Ｕ'（ｋ）｜＜｜Ｕ'（ｋ＋１）｜｝
取得されてもよい。

例えば、考えられる帯域上のスペクトルの中間値をとることによって、または帯域ごとのエネルギーを算出する前に、各々の周波数の射線に平滑化を適用することによって、ノイズのエネルギーを算出する他の方法が可能であることに留意されたい。

αは、４〜６ｋＨｚおよび６〜８ｋＨｚ帯域におけるノイズのエネルギーの間の比率が、２〜４ｋＨｚおよび４〜６ｋＨｚ帯域の間と同一であるように設定され、

であり、

である。

本発明の変形形態では、αの算出は、他の方法によって置き換えられることが可能である。例えば、変形形態では、ＡＭＲ−ＷＢコーデックにおいて算出されるのと同様の「チルト」パラメータを含む、低帯域における信号を特徴付ける異なるパラメータ（または「特徴」）を抽出（算出）することが可能であり、および因子αは、０と１との間のその値を制限することによってそれらの異なるパラメータから線形回帰に応じて評価される。線形回帰は、例えば、学習に基づく元の高帯域を交換することによる因子αを評価することによって、指揮された方式で評価されることが可能である。αが算出される方法は、本発明の本質を限定しないことに留意されたい。

好ましい実施形態では、混合の後に拡張された信号のエネルギーを保持するために、

がとられる。

変形形態では、因子βおよびαは、信号の所与の帯域に入り込むノイズが概して、同一の帯域における同一のエネルギーを有する調波信号よりも強いとして知覚される事実を考慮するように適合されることが可能である。よって、以下のように、因子βおよびαを修正することが可能であり、
β←β．ｆ（α）
α←α．ｆ（α）
ｆ（α）は、αの減少関数であり、例えば、

であり、ｂ＝１．１、α＝１．２であり、ｆ（α）は、０．３〜１に制限される。ｆ（α）との乗算の後に、信号Ｕ_ＨＢ２（ｋ）＝βＵ_ＨＢ１（ｋ）＋αＧ_ＨＢＮＵ_ＨＢＮ（ｋ）のエネルギーがＵ_ＨＢ１（ｋ）のエネルギーよりも低くなるように（エネルギー差はαに依存し、ノイズがさらに追加されると、エネルギーはさらに減衰する）、α^２＋β^２＜１となることに留意するべきである。

本発明の他の変形形態では、
β＝１−α
をとることが可能であり、それによって、振幅レベルを保持することが可能であるが（結合された信号が同一の兆候の信号であるとき）、この変形形態は、αに応じて単調にならない、全体的なエネルギー（Ｕ_ＨＢ２（ｋ）のレベルにおける）をもたらすという欠点を有する。

したがって、ここでは、ブロック７０３は、励起に応じてホワイトノイズを正規化する、図１のブロック１０１と均等な内容を実行し、一方で、励起は、周波数領域において、１６ｋＨｚの速度で既に拡張されており、さらに混合は６０００〜８０００Ｈｚ帯域に制限されることに留意するべきである。

単一の変形形態では、ブロック７０３の実装形態を考慮することが可能であり、そこでは、αに対して値０または１のみを許可することになる、スペクトルＵ_ＨＢ１（ｋ）またはＧ_ＨＢＮＵ_ＨＢＮ（ｋ）が適応的に選択され（切り替えられ）、このアプローチは、６０００〜８０００Ｈｚ帯域において生成されることになる励起のタイプを分類することになる。

ブロック７０４は、周波数領域においてバンドパスフィルタ周波数応答およびデエンファシスフィルタリングの適用の二重動作を任意選択で実行する。

本発明の変形形態では、デエンファシスフィルタリングは、ブロック７０５の後、さらにはブロック７００の前で、時間領域において実行されることが可能であるが、しかしながら、このケースでは、ブロック７０４において実行されるバンドパスフィルタリングは、復号化された低帯域をわずかに知覚可能な方式で修正することができる、デエンファシスによって増幅される超低レベルの一定の低周波数成分をそのままとすることがある。その理由として、ここでは、周波数領域においてデエンファシスを実行することが好ましいからである。好ましい実施形態では、インデックスｋ＝０，・・・，１９９の係数はゼロに設定され、よってデエンファシスはより高い係数に制限される。

励起は、以下の式に従って最初にデエンファシスされ、

Ｇ_{ｄｅｅｍｐｈ}（ｋ）は、制限された離散周波数帯域上でのフィルタ１／（１−０．６８ｚ^−１）の周波数応答である。ＤＣＴ−ＩＶの離散（奇数）周波数を考慮することによって、Ｇ_{ｄｅｅｍｐｈ}（ｋ）はここでは以下のように定義され、

である。

ＤＣＴ−ＩＶ以外の変換が使用されるケースでは、θ_ｋの定義が調整されることが可能である（例えば、偶数周波数に対し）。

５０００〜６４００Ｈｚ周波数帯域に相当する２つの位相、ｋ＝２００，・・・，２５５にデエンファシスが適用され、応答１／１（１−０．６８ｚ^−１）が１２．８ｋＨｚにおいて、および、６４００〜８０００Ｈｚ周波数帯域に相当するｋ＝２５６，・・・，３１９に対して適用され、ここでは、応答が１６ｋＨｚから６．４〜８ｋＨｚ帯域における一定値に拡張されることに留意するべきである。

ＡＭＲ−ＷＢコーデックでは、ＨＦ合成がデエンファシスされないことに留意されたい。

ここで提示される実施形態では、一方で、高周波数信号がデエンファシスされて、それを、図３のブロック３０５を出る低周波数信号（０〜６．４ｋＨｚ）と一致する領域に持ち込む。これは、ＨＦ合成のエネルギーの評価および後続の調整に対して重要である。

実施形態の変形形態では、複雑度を低減させるために、例えば、上記説明された実施形態の条件におけるＧ_{ｄｅｅｍｐｈ}（ｋ）、ｋ＝２００，・・・，３１９の平均値に大凡相当するＧ_{ｄｅｅｍｐｈ}（ｋ）＝０．６をとることによって、ｋとは独立した一定値にＧ_{ｄｅｅｍｐｈ}（ｋ）を設定することが可能である。

拡張デバイスの実施形態の別の変形形態では、逆ＤＣＴの後に時間領域において均等な方式で、デエンファシスが実行されることが可能である。

デエンファシスに加え、１つがハイパス、固定、その他がローパス、適応的（ビットレートの関数）、の２つの部分でバンドパスフィルタリング適用される。

このフィルタリングは、周波数領域において実行される。

好ましい実施形態では、ローパスフィルタ部分応答は、以下のように周波数領域において算出され、

Ｎ_ｌｐは、６．６キロビット／秒においては６０、８．８５キロビット／秒においては４０、およびビットレート＞８．８５ビット／秒においては２０である。

次いで、

の形式で、バンドパスフィルタが適用される。

Ｇ_ｈｐ（ｋ）、ｋ＝０，・・・，５５の定義は、例えば、以下の表２において与えられる。

本発明の変形形態では、Ｇ_ｈｐ（ｋ）の値は、漸次的な減衰を維持する間に修正されることが可能であることに留意されたい。同様に、可変帯域幅Ｇ_ｌｐ（ｋ）を有するローパスフィルタリングは、このフィルタリングステップの原理を変更することなく、異なる値または周波数の中間（ｍｅｄｉｕｍ）で調整されることが可能である。

ハイパスおよびローパスフィルタリングを組み合わせる単一のフィルタリングステップを定義することによって、バンドパスフィルタリングが適応されることが可能であることにも留意されたい。

別の実施形態では、バンドパスフィルタリングは、逆ＤＣＴステップの後に、ビットレートに従った異なるフィルタ係数を有する時間領域における（図１のブロック１１２にあるように）均等な方式で実行されることが可能である。しかしながら、フィルタリングがＬＰＣ励起の領域で実行され、よって、巡回畳み込み、およびエッジ効果の問題がこの領域において非常に限定されるため、このステップを周波数領域において直接実行することが有利である。

また、２３．８５キロビット／秒ビットレートのケースでは、励起Ｕ_ＨＢ２（ｋ）のデエンファシスは、補正ゲインがＡＭＲ−ＷＢ符号器において算出される方法との一致を維持するため、および二重乗算を回避するために実行されない。このケースでは、ブロック７０４は、ローパスフィルタリングのみを実行する。

逆変換ブロック７０５は、１６ｋＨｚにおいてサンプリングされた高周波数励起を発見するために３２０のサンプル上で逆ＤＣＴを実行する。その実装形態はブロック７００と同様であり、なぜならば、変換の長さが２５６の代わりに３２０であることを除いて、ＤＣＴ−ＩＶが正規直交しており、および以下が取得されるからであり、

Ｎ_１６ｋ＝３２０であり、ｋ＝０，・・・，３１９である。

１６ｋＨｚにおいてサンプリングされたこの励起は、次いで、任意選択で、８０のサンプルのサブフレームごとに定義されたゲインによってスケーリングされる（ブロック７０７）。

好ましい実施形態では、ゲインｇ_ＨＢ１（ｍ）は、サブフレームのエネルギー比によってサブフレームごとに最初に算出され（ブロック７０６）、それによって、カレントフレームのインデックスｍ＝０、１、２または３の各々のサブフレームにおいて、

となり、

ε＝０．０１である。サブフレームｇ_ＨＢ１（ｍ）ごとのゲインは、信号ｕ_ＨＢにおいて、サブフレームごとのエネルギーと信号ｕ（ｎ）にあるようにフレームごとのエネルギーとの間の同一の比率が保証されることを示す

の形式で書き込まれる。

ブロック７０７は、以下の式に従って、結合された信号のスケーリングを実行する。
ｕ_ＨＢ（ｎ）＝ｇ_ＨＢ１（ｍ）ｕ_ＨＢ０（ｎ）、ｎ＝８０ｍ，・・・，８０（ｍ＋１）−１

ブロック７０６の実装形態は、図１のブロック１０１の実装形態とは異なり、なぜならば、カレントフレームにおけるエネルギーのレベルが、サブフレームのレベルに加えて考慮されるからである。これによって、フレームのエネルギーに関連して各々のサブフレームのエネルギーの比率を有することが可能になる。したがって、低帯域と高帯域との間の絶対エネルギーよりもエネルギー比（または相対エネルギー）が比較される。

よって、このスケーリングステップによって、高帯域において、低帯域にあるのと同一の方法で、サブフレームとフレームとの間のエネルギー比を維持することが可能になる。

ここでは、２３．８５キロビット／秒ビットレートのケースでは、ゲインｇ_ＨＢ１（ｍ）が算出されるが、二重乗算を回避するために、図４を参照して説明されるように、次のステップにおいてゲインｇ_ＨＢ１（ｍ）が適用される。このケースでは、ｕ_ＨＢ（ｎ）＝ｕ_ＨＢ０（ｎ）である。

本発明に従って、次いで、ブロック７０８は、図６を参照して前に説明され、ならびに図４および５において詳述されたように、信号のサブフレームごとのスケール因子算出を実行する（図６のステップＥ６０２〜Ｅ６０３）。

最後に、補正された励起ｕ_ＨＢ'（ｎ）は、伝達関数

として見なすことによって、ここで実行することができるフィルタリングモジュール７１０によってフィルタリングされ、６．６キロビット／秒においてγ＝０．９であり、および他のビットレートにおいてγ＝０．６であり、それは、フィルタの次数を次数１６に制限する。

変形形態では、このフィルタリングは、ＡＭＲ−ＷＢ復号器の図１のブロック１１１に対して説明されたのと同一の方法で実行されることが可能であるが、フィルタの次数は、６．６ビットレートにおいては２０に変化し、それは、合成信号の品質を著しく変化させるものではない。別の変形形態では、ブロック７１０で実装されるフィルタの周波数応答を算出した後、周波数領域においてＬＰＣ合成フィルタリングを実行することが可能である。

変形形態では、第２の周波数帯域に対する線形予測フィルタ７１０によるフィルタリングのステップは、処理の複雑度を低減させることが可能な最適化スケール因子の適用と組み合わされる。よって、フィルタリング

および最適化スケール因子ｇ_ＨＢ２の適用のステップは、処理の複雑度を低減させるために、フィルタリング

の単一のステップにおいて組み合わされる。

本発明の変形形態では、低帯域（０〜６．４ｋＨｚ）の符号化は、例えば、８キロビット／秒におけるＧ．７１８でのＣＥＬＰ符号器などの、ＡＭＲ−ＷＢで使用される以外のＣＥＬＰ符号器によって置き換えられることが可能である。概念を失うことなく、他の広帯域符号器、または低帯域の符号化が１２．８ｋＨｚにおいて内部周波数で動作する、１６ｋＨｚを上回る周波数において動作する符号器が使用されてもよい。さらに、本発明は、低周波数符号器が、元の信号または再構築された信号の周波数よりも低いサンプリング周波数で動作するとき、１２．８ｋＨｚ以外の周波数をサンプリングするように明確に適合されてもよい。低帯域復号化が線形予測を使用しないとき、拡張されることになる励起信号が存在せず、そのケースでは、カレントフレームにおいて再構築された信号のＬＰＣ分析を実行することが可能であり、およびＬＰＣ励起は、本発明を適用することが可能なように算出される。

最後に、本発明の別の変形形態では、例えば、長さ３２０の変換（例えば、ＤＣＴ−ＩＶ）の前に１２．８ｋＨｚ〜１６ｋＨｚで、線形補間または三次「スプライン」によって、励起（ｕ（ｎ））がリサンプリングされる。この変形形態は、励起の変換（ＤＣＴ−ＩＶ）が次いで、さらなる長さ上で算出され、およびリサンプリングが変換領域で実行されないため、より複雑になる欠点を有する。

さらに、本発明の変形形態では、ゲイン（Ｇ_ＨＢＮ，ｇ_ＨＢ１（ｍ），ｇ_ＨＢ２（ｍ），ｇ_ＨＢＮ，・・・）の評価に必要な全ての算出は、対数領域で実行されることが可能である。

帯域拡張の変形形態では、低帯域ｕ（ｎ）における励起およびＬＰＣフィルタ

は、それに対して帯域が拡張される必要がある低帯域信号のＬＰＣ分析によって、フレームごとに評価される。次いで、低帯域励起信号は、音声信号の分析によって抽出される。

この変形形態の可能な実施形態では、音声信号から抽出された励起（線形予測によって）が既にリサンプリングされるように、励起を抽出するステップの前に低帯域音声信号がリサンプリングされる。

図７で示された帯域拡張は、このケースでは、復号化されないが分析される低帯域に適用される。

図８は、本発明に従って最適化スケール因子８００を判定するデバイスの例示的な物理的な実施形態を示す。後者は、音声周波数信号復号器、または復号化され、もしくは復号化されていない音声周波数信号を受信する設備機器の一体部分を形成することができる。

このタイプのデバイスは、記憶装置および／または作業メモリＭＥＭを備えたメモリブロックＢＭと協働するプロセッサＰＲＯＣを備える。

そのようなデバイスは、低帯域（ｕ（ｎ）またはＵ（ｋ））と称される第１の周波数帯域において復号化または抽出された励起音声信号、および線形予測合成フィルタ

のパラメータを受信するのに適切な入力モジュールＥを備える。それは、合成および最適化された高周波数信号（ｕ_ＨＢ'（ｎ））を、例えば、図７のブロック７１０のようなフィルタリングモジュールまたは図３のモジュール３１１のようなリサンプリングモジュールに送信するのに適切な出力モジュールＳを備える。

有利なことに、メモリブロックは、コード命令を備えたコンピュータプログラムを備え、それらの命令がプロセッサＰＲＯＣによって実行されるとき、命令は、本発明の意義の中で励起信号またはフィルタに適用されることになる最適化スケール因子を判定する方法のステップ、ならびに、特に、第１の周波数帯域の線形予測フィルタよりも低次数の、追加フィルタと称される線形予測フィルタ、第１の周波数帯域から復号化または抽出されたパラメータから取得される追加フィルタの係数を判定するステップ（Ｅ６０２）、および追加フィルタの係数に少なくとも応じて最適化スケール因子を算出するステップ（Ｅ６０３）を実行する。

典型的に、図６の説明は、そのようなコンピュータプログラムのアルゴリズムのステップを繰り返す。また、デバイスの読取機によって読み取ることが可能であり、またはそのメモリ空間にダウンロードすることが可能なメモリ媒体にコンピュータプログラムを記憶することができる。

メモリＭＥＭは概して、方法の実装に必要な全てのデータを記憶する。

可能な実施形態では、説明されたデバイスはまた、拡張された励起信号への最適化スケール因子の適用、周波数帯域拡張の適用、低帯域復号化の適用のための機能、ならびに本発明に従った最適化スケール因子判定機能に加え、例えば、図３および４において説明された他の処理機能を備えることができる。

Claims

音声周波数信号周波数帯域拡張方法において励起信号またはフィルタに適用されることになる最適化スケール因子を判定する方法であって、前記帯域拡張方法は、
第１の周波数帯域において、励起信号、および線形予測フィルタの係数を備えた前記第１の周波数帯域のパラメータを復号化または抽出するステップと、
少なくとも１つの第２の周波数帯域上で、拡張された励起信号を生成するステップと、
線形予測フィルタによって、前記第２の周波数帯域をフィルタリングするステップと
を備える、前記判定する方法において、
− 前記第１の周波数帯域の前記線形予測フィルタよりも低次数の、追加フィルタと称される線形予測フィルタを判定するステップであって、前記追加フィルタの係数は、前記第１の周波数帯域から復号化または抽出された前記パラメータから取得される、ステップと、
− 前記追加フィルタの前記係数に少なくとも応じて、前記最適化スケール因子を算出するステップと
を備えることを特徴とする方法。
前記帯域拡張方法は、前記最適化スケール因子を前記拡張された励起信号に適用するステップを備えることを特徴とする請求項１に記載の方法。
前記最適化スケール因子を適用する前記ステップは、前記第２の周波数帯域においてフィルタリングするステップと組み合わされることを特徴とする請求項２に記載の方法。
前記追加フィルタの前記係数は、低次数を取得するために前記第１の周波数帯域の前記線形予測フィルタの伝達関数の打ち切りによって取得されることを特徴とする請求項１に記載の方法。
前記追加フィルタの前記係数は、前記追加フィルタの安定度基準に応じて修正されることを特徴とする請求項４に記載の方法。
前記最適化スケール因子を算出する前記ステップは、
− 共通周波数に対する前記第１および第２の周波数帯域の前記線形予測フィルタの周波数応答を算出するステップと、
− 前記共通周波数に対する前記追加フィルタの前記周波数応答を算出するステップと、
− 前記正規に算出された周波数応答に応じて、前記最適化スケール因子を算出するステップと
を備えることを特徴とする請求項１に記載の方法。
予め定められた復号化ビットレートに対して実装される、以下のステップ：
− 前記復号化された励起信号と前記拡張された励起信号との間のエネルギー比に応じて、サブフレームごとに算出されたゲインによって、前記拡張された励起信号をスケーリングする第１のステップと、
− 復号化された補正ゲインによって前記スケーリングする第１のステップから取得された前記励起信号をスケーリングする第２のステップと、
− 前記スケーリングする第２のステップの後に取得された前記信号のエネルギーに応じて、および前記最適化スケール因子を適用するステップの後に取得された前記信号に応じて、算出された調整因子によって、カレントサブフレームに対する励起のエネルギーを調整するステップと
をさらに備えることを特徴とする請求項１に記載の方法。
音声周波数信号周波数帯域拡張デバイスにおいて励起信号またはフィルタに適用されることになる最適化スケール因子を判定するデバイスであって、前記帯域拡張デバイスは、
第１の周波数帯域において、励起信号、および線形予測フィルタの係数を備えた前記第１の周波数帯域のパラメータを復号化または抽出するモジュールと、
少なくとも１つの第２の周波数帯域上で、拡張された励起信号を生成するモジュールと、
線形予測フィルタによって、前記第２の周波数帯域をフィルタリングするモジュールと
を備える、前記判定するデバイスにおいて、
− 前記第１の周波数帯域の前記線形予測フィルタよりも低次数の、追加フィルタと称される線形予測フィルタを判定するモジュールであって、前記追加フィルタの係数は、前記第１の周波数帯域から復号化または抽出された前記パラメータから取得される、モジュールと、
− 前記追加フィルタの前記係数に少なくとも応じて、前記最適化スケール因子を算出するモジュールと
を備えることを特徴とするデバイス。
請求項８に記載の最適化スケール因子を判定するデバイスを備えることを特徴とする音声周波数信号復号器。
プロセッサによって命令が実行されるときに、請求項１〜７のいずれか一項に記載の最適化スケール因子を判定する方法のステップを実行するコード命令を備えるコンピュータプログラム。
請求項１〜７のいずれか一項に記載の最適化スケール因子を判定する方法のステップを実行するためのコード命令を備えるコンピュータプログラムを記憶している、最適化スケール因子を判定するデバイスによって読み取ることが可能な記憶媒体。