JP6258522B2

JP6258522B2 - デバイスにおいてコーディング技術を切り替える装置および方法

Info

Publication number: JP6258522B2
Application number: JP2016559604A
Authority: JP
Inventors: アッティ、ベンカトラマン・エス．; クリシュナン、ベンカテシュ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-03-31
Filing date: 2015-03-30
Publication date: 2018-01-10
Anticipated expiration: 2035-03-30
Also published as: PT3127112T; CA2941025A1; SA516371927B1; US9685164B2; MX2016012522A; CN106133832B; RU2016137922A3; DK3127112T3; BR112016022764A8; ES2688037T3; BR112016022764A2; US20150279382A1; EP3127112B1; KR20160138472A; EP3127112A1; RU2667973C2; JP2017511503A; SG11201606852UA; NZ723532A; HK1226546A1

Description

優先権の主張

本出願は、その内容全体が参照により組み込まれる、２０１５年３月２７日に出願された「ＳＹＳＴＥＭＳＡＮＤＭＥＴＨＯＤＳＯＦＳＷＩＴＣＨＩＮＧＣＯＤＩＮＧＴＥＣＨＮＯＬＯＧＩＥＳＡＴＡＤＥＶＩＣＥ」と題する米国出願第１４／６７１，７５７号および２０１４年３月３１日に出願された「ＳＹＳＴＥＭＳＡＮＤＭＥＴＨＯＤＳＯＦＳＷＩＴＣＨＩＮＧＣＯＤＩＮＧＴＥＣＨＮＯＬＯＧＩＥＳＡＴＡＤＥＶＩＣＥ」と題する米国仮出願第６１／９７３，０２８号の優先権を主張する。

本開示は、一般に、デバイスにおいてコーディング技術を切り替えることに関する。

[0003]技術の進歩により、コンピューティングデバイスは、より小型でより強力になった。たとえば、現在、小型で、軽量で、ユーザが容易に持ち運べる、ポータブルワイヤレス電話、携帯情報端末（ＰＤＡ）、およびページングデバイスなど、ワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー電話およびインターネットプロトコル（ＩＰ）電話などのポータブルワイヤレス電話が、ワイヤレスネットワークを介して音声とデータパケットとを通信することができる。さらに、多くのそのようなワイヤレス電話は、その中に組み込まれた他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤを含むこともできる。

[0004]ワイヤレス電話は、人間の音声（voice）（たとえばスピーチ）を表す信号を送り、また受信する。デジタル技法による音声の送信は、特に長距離およびデジタル無線電話用途において普及している。再構成されたスピーチの知覚品質を維持しながらチャネルを介して送られ得る情報の最小量を決定することが重要であり得る。スピーチがサンプリングおよびデジタル化によって送信される場合、６４キロビット毎秒（ｋｂｐｓ）程度のデータレートが、アナログ電話のスピーチ品質を達成するために使用され得る。スピーチ分析の使用に、受信機におけるコーディング、送信、および再合成が続くことにより、データレートのかなりの低減が達成され得る。

[0005]スピーチを圧縮するためのデバイスが、電気通信の多数の分野で用途を見出し得る。例示的な分野はワイヤレス通信である。ワイヤレス通信の分野は、たとえば、コードレス電話、ページング、ワイヤレスローカルループ、セルラー電話システムおよびパーソナル通信サービス（ＰＣＳ）電話システムなどのワイヤレス電話、モバイルＩＰ電話、ならびに衛星通信システムを含む、多くの適用例を有する。特定的な用途が、モバイル加入者用のワイヤレス電話である。

[0006]様々なオーバージエアインターフェースが、たとえば、周波数分割多元接続（ＦＤＭＡ）、時分割多元接続（ＴＤＭＡ）、符号分割多元接続（ＣＤＭＡ）、および時分割同期ＣＤＭＡ（ＴＤ−ＳＣＤＭＡ）を含むワイヤレス通信システム用に開発されてきた。これらのインターフェースに関連して、たとえば、先進移動電話サービス（ＡＭＰＳ）、モバイル通信用グローバルシステム（ＧＳＭ（登録商標））、およびインテリムスタンダード９５（ＩＳ−９５）などを含む様々な国内および国際標準が策定されている。例示的なワイヤレス電話通信システムがＣＤＭＡシステムである。ＩＳ−９５規格およびその派生規格、ＩＳ−９５Ａ、米国規格協会（ＡＮＳＩ）Ｊ−ＳＴＤ−００８、およびＩＳ−９５Ｂ（本明細書ではまとめてＩＳ−９５と呼ばれる）は、セルラーまたはＰＣＳ電話通信システムのためのＣＤＭＡオーバージエアインターフェースの使用法を指定するために、米国電気通信工業会（ＴＩＡ）および他の規格団体によって公表されている。

[0007]ＩＳ−９５規格は後に、より大容量で高速なパケットデータサービスを提供する、ｃｄｍａ２０００および広帯域ＣＤＭＡ（ＷＣＤＭＡ（登録商標））などの「３Ｇ」システムへと進化した。ｃｄｍａ２０００の２つの変形形態が、ＴＩＡによって発行されているドキュメントＩＳ−２０００（ｃｄｍａ２０００１ｘＲＴＴ）およびＩＳ−８５６（ｃｄｍａ２０００１ｘＥＶ−ＤＯ）に示されている。ｃｄｍａ２０００１ｘＲＴＴ通信システムは１５３ｋｂｐｓのピークデータレートを提供するのに対し、ｃｄｍａ２０００１ｘＥＶ−ＤＯ通信システムは、３８．４ｋｂｐｓ〜２．４Ｍｂｐｓの範囲のデータレートのセットを規定する。ＷＣＤＭＡ規格は、第３世代パートナーシッププロジェクト「３ＧＰＰ（登録商標）」、ドキュメント番号３ＧＴＳ２５．２１１、３ＧＴＳ２５．２１２、３ＧＴＳ２５．２１３、および３ＧＴＳ２５．２１４に包含されている。国際モバイル電気通信アドバンスト（ＩＭＴ−Ａｄｖａｎｃｅｄ）仕様は、「４Ｇ」規格を示している。ＩＭＴ−アドバンスト仕様は、４Ｇサービスのピークデータレートを高モビリティ通信（たとえば、列車および車から）に対しては１００メガビット毎秒（Ｍｂｉｔ／ｓ）に、低モビリティ通信（たとえば、歩行者および静止ユーザから）に対しては１ギガビット毎秒（Ｇｂｉｔ／ｓ）に設定している。

[0008]人間のスピーチ生成のモデルに関するパラメータを抽出することによってスピーチを圧縮する技法を用いるデバイスは、スピーチコーダと呼ばれる。スピーチコーダは、エンコーダとデコーダとを含み得る。エンコーダは、着信スピーチ信号を、時間のブロック、または分析フレームに分割する。時間（または「フレーム」）における各セグメントの持続時間は、信号のスペクトルエンベロープが比較的定常のままであることが予想され得るほど十分に短くなるように選択され得る。たとえば、特定の適用例に好適と見なされる任意のフレーム長またはサンプリングレートが使用され得るが、１つのフレーム長は２０ミリ秒であり、それは、８キロヘルツ（ｋＨｚ）のサンプリングレートで１６０個のサンプルに対応する。

[0009]エンコーダは、着信スピーチフレームを分析していくつかの関連するパラメータを抽出し、次いで、それらのパラメータを、２進表現に、たとえば、ビットのセットまたはバイナリデータパケットに量子化する。データパケットは、通信チャネル（たとえば、ワイヤードおよび／またはワイヤレスネットワーク接続）を介して受信機およびデコーダに送信される。デコーダは、データパケットを処理し、それらの処理されたデータパケットを逆量子化してパラメータを生成し、逆量子化されたパラメータを使用してスピーチフレームを再合成する。

[0010]スピーチコーダの機能は、スピーチに内在する固有の冗長性を除去することによって、デジタル化されたスピーチ信号を低ビットレート信号へと圧縮することである。デジタル圧縮は、入力スピーチフレームをパラメータのセットで表し、量子化を用いてそれらのパラメータをビットのセットで表すことによって達成され得る。入力スピーチフレームがビット数Ｎｉを有し、スピーチコーダによって生成されたデータパケットがビット数Ｎｏを有する場合、スピーチコーダによって達成される圧縮係数はＣｒ＝Ｎｉ／Ｎｏである。問題は、ターゲットの圧縮係数を達成しながら、復号スピーチの高度な音声品質を保つことである。スピーチコーダの性能は、（１）スピーチモデル、または上述した分析および合成プロセスの組合せがいかに良好に働くか、ならびに（２）パラメータ量子化プロセスが１フレーム毎にＮｏビットのターゲットビットレートでいかに良好に実施されるかに依存する。スピーチモデルの目標はしたがって、フレームごとにパラメータの小さなセットを用いて、スピーチ信号の本質またはターゲットの音声品質を捕捉することである。

[0011]スピーチコーダは一般に、スピーチ信号を記述するためにパラメータ（ベクトルを含む）のセットを利用する。パラメータの良好なセットは理想的には、知覚的に正確なスピーチ信号の再構成のために、低いシステム帯域幅をもたらす。ピッチ、信号電力、スペクトルエンベロープ（またはホルマント）、振幅および位相スペクトルは、スピーチコーディングパラメータの例である。

[0012]スピーチコーダは、スピーチの小セグメント（たとえば、５ミリ秒（ｍｓ）のサブフレーム）を一度に符号化するために高時間分解能（high time-resolution）の処理を用いることによって時間領域のスピーチ波形を捕捉することを試行する時間領域コーダとして実装され得る。サブフレームごとに、コードブック空間からの高精度代表が探索アルゴリズムによって発見される。代替的に、スピーチコーダは、パラメータのセットを用いて入力スピーチフレームの短期間スピーチスペクトルを捕捉し（分析）、スペクトルパラメータからスピーチ波形を再生成するために対応する合成プロセスを用いることを試行する周波数領域コーダとして実装され得る。パラメータ量子化器は、既知の量子化技法に従って、コードベクトルの記憶された表現を用いてパラメータを表すことによって、パラメータを保存する。

[0013]ある時間領域スピーチコーダは、符号励振線形予測（ＣＥＬＰ：Code Excited Linear Predictive）コーダである。ＣＥＬＰコーダでは、スピーチ信号における短期間の相関または冗長性が、短期間ホルマントフィルタの係数を発見する線形予測（ＬＰ）分析によって除去される。短期間予測フィルタを着信スピーチフレームに適用することにより、ＬＰ残差信号が生成され、このＬＰ残差信号は、長期間予測フィルタパラメータと後続のストキャスティックコードブックを用いてさらにモデル化および量子化される。このようにして、ＣＥＬＰコーディングは、時間領域のスピーチ波形を符号化するタスクを、別々のＬＰ短期間フィルタ係数を符号化するタスクとＬＰ残差を符号化するタスクとに分割する。時間領域コーディングは、固定レートで（たとえば、各フレームに対して同じビット数Ｎｏを使用して）または可変レートで（異なるタイプのフレームコンテンツに対して異なるビットレートが使用される）実施され得る。可変レートコーダは、ターゲットの品質を得るのに適切なレベルにコーデックパラメータを符号化するのに必要な量のビットを使用することを試行する。

[0014]ＣＥＬＰコーダなどの時間領域コーダは、時間領域のスピーチ波形の精度を保存するために、フレーム当たりの高ビット数Ｎ０に依存し得る。そのようなコーダは、フレーム当たりのビット数Ｎｏが比較的多ければ（たとえば、８ｋｂｐｓ以上）、優れたボイス品質を提供し得る。低ビットレート（たとえば、４ｋｂｐｓ以下）では、時間領域コーダは、利用可能なビットの数が限られることが原因で、高品質およびロバストな性能を維持することに失敗し得る。低ビットレートでは、限られたコードブック空間は、より高いレートの商用アプリケーションで配備される時間領域コーダの波形マッチング能力を制限する。したがって、長い間の改善にもかかわらず、低ビットレートで動作する多くのＣＥＬＰコーディングシステムは、雑音として特徴付けられる、知覚的に顕著なひずみを伴うという欠点がある。

[0015]低ビットレートにおけるＣＥＬＰコーダに対する代替物は、ＣＥＬＰコーダと同様の原理で動作する「雑音励振線形予測」（ＮＥＬＰ）コーダである。ＮＥＬＰコーダは、スピーチをモデル化するために、コードブックではなく、フィルタ処理された疑似ランダム雑音信号を使用する。ＮＥＬＰは、コード化されたスピーチに対して、より単純なモデルを使用するので、ＮＥＬＰは、ＣＥＬＰよりも低いビットレートを達成する。ＮＥＬＰは、無声スピーチまたは無音を圧縮または表現するために使用され得る。

[0016]２．４ｋｂｐｓ程度のレートで動作するコーディングシステムは一般に、本質的にパラメトリックである。すなわち、そのようなコーディングシステムは、スピーチ信号のピッチ周期とスペクトルエンベロープ（またはホルマント）とを記述するパラメータを規則的な間隔で送信することによって動作する。これらのいわゆるパラメトリックコーダの例示的なものが、ＬＰボコーダシステムである。

[0017]ＬＰボコーダは、有声スピーチ（voiced speech）信号をピッチ周期当たりの単一のパルスでモデル化する。この基本的な技法は、特にスペクトルエンベロープに関する送信情報を含むように拡張され得る。ＬＰボコーダは、一般的には妥当なパフォーマンスをもたらすが、それらは、バズ（buzz）として特徴付けられる、知覚的に顕著なひずみを導入し得る。

[0018]近年、波形コーダとパラメトリックコーダの両方のハイブリッドであるコーダが出現している。これらのいわゆるハイブリッドコーダの例示的なものが、プロトタイプ波形補間（ＰＷＩ）スピーチコーディングシステムである。ＰＷＩコーディングシステムはまた、プロトタイプピッチ周期（ＰＰＰ）スピーチコーダとも呼ばれ得る。ＰＷＩコーディングシステムは、有声スピーチをコーディングするための効率的な方法を提供する。ＰＷＩの基本的概念は、固定間隔で代表的なピッチサイクル（プロトタイプ波形）を抽出すること、その記述を送信すること、および、プロトタイプ波形間を補間することによってスピーチ信号を再構成することである。ＰＷＩ法は、ＬＰ残差信号またはスピーチ信号のいずれかに対して作用し得る。

[0019]通信デバイスは、最適なボイス品質より低いスピーチ信号を受信し得る。説明のために、通信デバイスは、ボイス呼の間に別の通信デバイスからスピーチ信号を受信し得る。ボイス呼品質は、環境雑音（たとえば、風、街頭雑音）など、様々な理由により、通信デバイスのインターフェースの制限、通信デバイスによる信号処理、パケット損失、帯域幅制限、ビットレート制限などを受け得る。

[0020]従来の電話システム（たとえば、公衆交換電話網（ＰＳＴＮ））では、信号帯域幅は、３００ヘルツ（Ｈｚ）〜３．４ｋＨｚの周波数範囲に限定される。セルラーテレフォニーおよびボイスオーバーインターネットプロトコル（ＶｏＩＰ）など、広帯域（ＷＢ）適用例では、信号帯域幅が、５０Ｈｚ〜７ｋＨｚの周波数範囲にわたり得る。超広帯域（ＳＷＢ）コーディング技術は、最大約１６ｋＨｚに及ぶ帯域幅をサポートする。３．４ｋＨｚの狭帯域テレフォニーから１６ｋＨｚのＳＷＢテレフォニーの信号帯域幅まで拡張することにより、信号再構成の品質、明瞭さ、自然らしさを改善し得る。

[0021]あるＷＢ／ＳＷＢコーディング技法は、信号の低周波数部分（たとえば、０Ｈｚ〜６．４ｋＨｚ、「ローバンド（low band）」とも呼ばれる）を符号化および送信することを伴う帯域幅拡張（ＢＷＥ）である。たとえば、ローバンドは、フィルタパラメータおよび／またはローバンド励振信号（excitation signal）を用いて表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分（たとえば、６．４ｋＨｚ〜１６ｋＨｚ、「ハイバンド（high band）」とも呼ばれる）は、完全には符号化および伝送されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用し得る。いくつかの実施態様では、予測を助けるために、ハイバンドと関連付けられるデータが受信機に与えられ得る。そのようなデータは「サイド情報」と呼ばれることがあり、利得（gain）情報、線スペクトル（line spectral）周波数（ＬＳＦ、線スペクトル対（ＬＳＰ）とも呼ばれる）などを含むことができる。

[0022]いくつかのワイヤレス電話では、複数のコーディング技術が利用可能である。たとえば、種々のタイプのオーディオ信号（たとえば、ボイス信号対音楽信号）を符号化するために、種々のコーディング技術が使用され得る。ワイヤレス電話が、オーディオ信号を符号化するために第１の符号化技術を使用することから、オーディオ信号を符号化するために第２の符号化技術を使用することへと切り替えるとき、エンコーダ内におけるメモリバッファのリセットが原因で、可聴アーティファクト（artifacts）がオーディオ信号のフレーム境界に生成され得る。

[0023]デバイスにおけるコーディング技術を切り替えるときの、フレーム境界アーティファクトおよびエネルギー不一致を低減するシステムおよび方法が開示される。たとえば、デバイスは、かなりの高周波数成分を含んだオーディオ信号のフレームを符号化するために、修正離散コサイン変換（ＭＤＣＴ:modified discrete cosine transform）エンコーダなどの第１のエンコーダを使用し得る。たとえば、当該フレームは、背景雑音、雑音の多いスピーチ、または音楽を含み得る。デバイスは、かなりの高周波成分を含まないスピーチフレームを符号化するために、代数符号励振線形予測（ＡＣＥＬＰ：algebraic code-excited linear prediction）エンコーダなどの第２のエンコーダを使用し得る。これらのエンコーダの一方または両方がＢＷＥ技法を適用し得る。ＭＤＣＴエンコーダとＡＣＥＬＰエンコーダとの間で切り替えるとき、ＢＷＥに使用されるメモリバッファがリセットされ（たとえば、ゼロでポピュレートされ）得、フィルタ状態がリセットされ得、これがフレーム境界アーティファクトとエネルギー不一致とを引き起こし得る。

[0024]説明した技法によれば、バッファをリセット（または「ゼロ設定」）すること、およびフィルタをリセットすることに代わって、１つのエンコーダがバッファにポピュレートし、他のエンコーダからの情報に基づいてフィルタ設定を決定し得る。たとえば、オーディオ信号の第１のフレームを符号化するとき、ＭＤＣＴエンコーダは、ハイバンド「ターゲット」に対応するベースバンド信号を生成し得、ＡＣＥＬＰエンコーダは、そのベースバンド信号を使用して、ターゲット信号バッファにポピュレートし、オーディオ信号の第２のフレームに対するハイバンドパラメータを生成し得る。別の例として、ターゲット信号バッファは、ＭＤＣＴエンコーダの合成出力に基づいてポピュレートされ得る。また別の例として、ＡＣＥＬＰエンコーダは、外挿技法、信号エネルギー、フレームタイプ情報（たとえば、第２のフレームおよび／または第１のフレームが無声（unvoiced）フレーム、有声(voiced)フレーム、過渡(transient)フレーム、または一般（generic）フレームであるかどうか）などを使用して、第１のフレームの一部分を推定し得る。

[0025]信号合成の間、デコーダはまた、コーディング技法の切替えを原因とするフレーム境界アーティファクトとエネルギー不一致とを低減するように動作を実施し得る。たとえば、デバイスは、ＭＤＣＴデコーダとＡＣＥＬＰデコーダとを含み得る。ＡＣＥＬＰデコーダがオーディオ信号の第１のフレームを復号するとき、ＡＣＥＬＰデコーダは、オーディオ信号の第２の（すなわち、次の）フレームに対応する「重複（overlap）」サンプルのセットを生成し得る。コーディング技法の切替えが第１のフレームと第２のフレームとのフレーム境界で生じる場合、ＭＤＣＴデコーダは、フレーム境界における知覚される信号連続性を向上させるために、第２のフレームの復号の間、ＡＣＥＬＰデコーダからの重複サンプルに基づいて平滑化（たとえばクロスフェード）動作を実施し得る。

[0026]特定の態様では、ある方法が、第１のエンコーダを使用してオーディオ信号の第１のフレームを符号化することを含む。この方法はまた、第１のフレームの符号化の間に、オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することを含む。この方法は、第２のエンコーダを使用してオーディオ信号の第２のフレームを符号化すること、をさらに含み、第２のフレームを符号化することは、第２のフレームと関連付けられるハイバンドパラメータを生成するためにベースバンド信号を処理することを含む。

[0027]別の特定の態様では、ある方法が、第１のデコーダと第２のデコーダとを含むデバイスで、第２のデコーダを使用してオーディオ信号の第１のフレームを復号することを含む。第２のデコーダは、オーディオ信号の第２のフレームの開始部分に対応する重複データを生成する。この方法はまた、第１のデコーダを使用して第２のフレームを復号することを含む。第２のフレームを復号することは、第２のデコーダからの重複データを使用して平滑化動作を適用することを含む。

[0028]別の特定の態様では、ある装置が、オーディオ信号の第１のフレームを符号化し、また、第１のフレームの符号化の間に、オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成するように構成された第１のエンコーダを含む。この装置はまた、オーディオ信号の第２のフレームを符号化するように構成された第２のエンコーダを含む。第２のフレームを符号化することは、第２のフレームと関連付けられるハイバンドパラメータを生成するためにベースバンド信号を処理することを含む。

[0029]別の特定の態様では、ある装置が、オーディオ信号の第１のフレームを符号化するように構成された第１のエンコーダを含む。この装置はまた、オーディオ信号の第２のフレームの符号化の間に、第１のフレームの第１の部分を推定するように構成された第２のエンコーダを含む。第２のエンコーダはまた、第１のフレームの第１の部分および第２のフレームに基づいて第２のエンコーダのバッファにポピュレートし、また第２のフレームと関連付けられるハイバンドパラメータを生成するように構成される。

[0030]別の特定の態様では、ある装置が、第１のデコーダと第２のデコーダとを含む。第２のデコーダは、オーディオ信号の第１のフレームを復号し、またオーディオ信号の第２のフレームの一部分に対応する重複データを生成するように構成される。第１のデコーダは、第２のフレームの復号の間に、第２のデコーダからの重複データを使用して平滑化動作を適用するように構成される。

[0031]また別の特定の態様では、コンピュータ可読記憶デバイスが、プロセッサによって実行されるとプロセッサに、第１のエンコーダを使用してオーディオ信号の第１のフレームを符号化することを含む動作を実施させる命令を記憶する。これらの動作はまた、第１のフレームの符号化の間に、オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することを含む。これらの動作は、第２のエンコーダを使用してオーディオ信号の第２のフレームを符号化することをさらに含む。第２のフレームを符号化することは、第２のフレームと関連付けられるハイバンドパラメータを生成するためにベースバンド信号を処理することを含む。

[0032]開示する例のうちの少なくとも１つによってもたらされる特定の利点には、デバイスにおいてエンコーダ間またはデコーダ間で切り替えるときのフレーム境界アーティファクトとエネルギー不一致とを低減する能力が含まれる。たとえば、１つのエンコーダまたはデコーダのバッファまたはフィルタ状態など、１つまたは複数のメモリが、別のエンコーダまたはデコーダの動作に基づいて決定され得る。本開示の他の態様、利点、および特徴は、「図面の簡単な説明」と「発明を実施するための形態」と「特許請求の範囲」とを含む出願書類全体の検討の後、明らかになるであろう。

フレーム境界アーティファクトおよびエネルギー不一致の低減を伴うエンコーダ間の切替えをサポートするように動作可能であるシステムの特定の例を示すブロック図。ＡＣＥＬＰ符号化システムの特定の例を示すブロック図。フレーム境界アーティファクトおよびエネルギー不一致の低減を伴うデコーダ間の切替えをサポートするように動作可能であるシステムの特定の例を示すブロック図。エンコーダデバイスにおける動作の方法の特定の例を示すフローチャート。エンコーダデバイスにおける動作の方法の別の特定の例を示すフローチャート。エンコーダデバイスにおける動作の方法の別の特定の例を示すフローチャート。デコーダデバイスにおける動作の方法の特定の例を示すフローチャート。図１〜７のシステムおよび方法に従って動作を実施するように動作可能なワイヤレスデバイスのブロック図。

[0041]図１を参照すると、フレーム境界アーティファクトとエネルギー不一致とを低減しながらエンコーダ（たとえば、符号化技術）を切り替えるように動作可能であるシステムの特定の例が示され、全体として１００で示されている。例示的な例では、システム１００は、ワイヤレス電話、タブレットコンピュータなどの電子デバイスに統合される。システム１００は、エンコーダセレクタ１１０と、変換ベースのエンコーダ（たとえば、ＭＤＣＴエンコーダ１２０）と、ＬＰベースのエンコーダ（たとえば、ＡＣＥＬＰエンコーダ１５０）とを含んでいる。代替例では、種々のタイプの符号化技術がシステム１００に実装され得る。

[0042]以下の説明では、図１のシステム１００によって実施される様々な機能は、いくつかの構成要素またはモジュールによって実施されるものとして説明される。しかしながら、構成要素およびモジュールのこの分割は説明のためにすぎない。代替例では、特定の構成要素またはモジュールによって実施される機能は、代わりに複数の構成要素またはモジュール間に分割され得る。さらに、代替例では、図１の２つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに統合され得る。図１に示された各構成要素またはモジュールは、ハードウェア（たとえば、特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、コントローラ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイスなど）、ソフトウェア（たとえば、プロセッサによって実行可能な命令）、またはそれらの任意の組合せを使用して実装され得る。

[0043]加えて、図１は別々のＭＤＣＴエンコーダ１２０とＡＣＥＬＰエンコーダ１５０を示しているが、これは限定するものと見なされるべきでないことに留意されたい。代替例では、電子デバイスの単一のエンコーダが、ＭＤＣＴエンコーダ１２０およびＡＣＥＬＰエンコーダ１５０に対応する構成要素を含み得る。たとえば、エンコーダは、１つまたは複数のローバンド（ＬＢ）「コア」モジュール（たとえば、ＭＤＣＴコアおよびＡＣＥＬＰコア）と、１つまたは複数のハイバンド（ＨＢ）／ＢＷＥモジュールとを含み得る。オーディオ信号１０２の各フレームのローバンド部分が、符号化用の特定のローバンドコアモジュール、フレームの依存する特性（たとえば、フレームがスピーチ、雑音、音楽などを含むかどうか）に与えられ得る。各フレームのハイバンド部分は、特定のＨＢ／ＢＷＥモジュールに与えられ得る。

[0044]エンコーダセレクタ１１０は、オーディオ信号１０２を受信するように構成され得る。オーディオ信号１０２は、スピーチデータ、非スピーチデータ（たとえば、音楽または背景雑音）、またはそれら両方を含み得る。例示的な例では、オーディオ信号１０２はＳＷＢ信号である。たとえば、オーディオ信号１０２は、およそ０Ｈｚ〜１６ｋＨｚにまたがる周波数範囲を占め得る。オーディオ信号１０２は複数のフレームを含み得、各フレームは特定の持続期間を有する。例示的な例では、各フレームは持続期間において２０ｍｓであるが、代替的な例では、異なるフレーム持続期間が使用され得る。エンコーダセレクタ１１０は、オーディオ信号１０２の各フレームがＭＤＣＴエンコーダ１２０またはＡＣＥＬＰエンコーダ１５０によって符号化されるかどうかを決定し得る。たとえば、エンコーダセレクタ１１０は、フレームのスペクトル分析に基づいてオーディオ信号１０２のフレームを分類し得る。特定の例では、エンコーダセレクタ１１０は、かなりの高周波成分を含むフレームをＭＤＣＴエンコーダ１２０に送る。たとえば、そのようなフレームは、背景雑音、雑音の多いスピーチ、または音楽信号を含み得る。エンコーダセレクタ１１０は、かなりの高周波成分を含まないフレームをＡＣＥＬＰエンコーダ１５０に送り得る。たとえば、そのようなフレームはスピーチ信号を含み得る。

[0045]したがって、システム１００の動作の間、オーディオ信号１０２の符号化は、ＭＤＣＴエンコーダ１２０からＡＣＥＬＰエンコーダ１５０に切り替わり得、その逆も同様である。ＭＤＣＴエンコーダ１２０およびＡＣＥＬＰエンコーダ１５０は、符号化されたフレームに対応する出力ビットストリーム１９９を生成し得る。説明しやすいように、ＡＣＥＬＰエンコーダ１５０によって符号化されるフレームはクロスハッチ付きのパターンで示され、ＭＤＣＴエンコーダ１２０によって符号化されるフレームはパターンなしで示されている。図１の例では、ＡＣＥＬＰ符号化からＭＤＣＴ符号化への切替えは、フレーム１０８と１０９とのフレーム境界において生じる。ＭＤＣＴ符号化からＡＣＥＬＰ符号化への切替えは、フレーム１０４と１０６とのフレーム境界において生じる。

[0046]ＭＤＣＴエンコーダ１２０は、周波数領域で符号化を実施するＭＤＣＴ分析モジュール１２１を含む。ＭＤＣＴエンコーダ１２０がＢＷＥを実施しない場合、ＭＤＣＴ分析モジュール１２１は「完全」ＭＤＣＴモジュール１２２を含み得る。「完全」ＭＤＣＴモジュール１２２は、オーディオ信号１０２の周波数範囲全体（たとえば、０Ｈｚ〜１６ｋＨｚ）の分析に基づいて、オーディオ信号１０２のフレームを符号化し得る。代替的に、ＭＤＣＴエンコーダ１２０がＢＷＥを実施する場合、ＬＢデータとハイＨＢデータは別々に処理され得る。ローバンドモジュール１２３はオーディオ信号１０２のローバンド部分の符号化表現を生成し得、ハイバンドモジュール１２４は、オーディオ信号１０２のハイバンド部分（たとえば、８ｋＨｚ〜１６ｋＨｚ）を再構成するためにデコーダによって使用されるハイバンドパラメータを生成し得る。ＭＤＣＴエンコーダ１２０はまた、閉ループ推定用のローカルデコーダ１２６を含み得る。例示的な例では、ローカルデコーダ１２６は、オーディオ信号１０２（または、ハイバンド部分などその一部分）の表現を合成するために使用される。合成された信号は、合成バッファ内に記憶され得、ハイバンドパラメータの決定の間にハイバンドモジュール１２４によって使用され得る。

[0047]ＡＣＥＬＰエンコーダ１５０は、時間領域ＡＣＥＬＰ分析モジュール１５９を含み得る。図１の例では、ＡＣＥＬＰエンコーダ１５０は帯域幅拡張を実施するものであり、ローバンド分析モジュール１６０と、別個のハイバンド分析モジュール１６１とを含んでいる。ローバンド分析モジュール１６０は、オーディオ信号１０２のローバンド部分を符号化し得る。例示的な例では、オーディオ信号１０２のローバンド部分は、およそ０Ｈｚ〜６．４ｋＨｚにまたがる周波数範囲を占める。代替的な例では、図２を参照しながらさらに説明するように、異なるクロスオーバ周波数がローバンド部分とハイバンド部分とを分離すること、および／または、各部分が重複（オーバーラップ）することが可能である。特定の例では、ローバンド分析モジュール１６０は、ローバンド部分のＬＰ分析から生成されたＬＳＰを量子化することによって、オーディオ信号１０２のローバンド部分を符号化する。この量子化は、ローバンドコードブックに基づき得る。ＡＣＥＬＰローバンド分析は、図２を参照しながらさらに説明されている。

[0048]ＡＣＥＬＰエンコーダ１５０のターゲット信号生成器１５５が、オーディオ信号１０２のハイバンド部分のベースバンドバージョンに対応するターゲット信号を生成し得る。説明のために、計算モジュール１５６が、１つまたは複数のフリップ（flip）、デシメーション（decimation）、高次フィルタ処理、ダウンミキシング、および／またはダウンサンプリング動作をオーディオ信号１０２に対して実施するによってターゲット信号を生成し得る。ターゲット信号が生成されるとき、ターゲット信号は、ターゲット信号バッファ１５１にポピュレートするために使用され得る。特定の例では、ターゲット信号バッファ１５１は、１．５フレームに値するデータを記憶し、第１の部分１５２と、第２の部分１５３と、第３の部分１５４とを含む。したがって、フレームが持続期間において２０ｍｓであるとき、ターゲット信号バッファ１５１は、オーディオ信号のうちの３０ｍｓについてハイバンドデータを表す。第１の部分１５２は、１ｍｓ〜１０ｍｓにおけるハイバンドデータを表し得、第２の部分１５３は１１ｍｓ〜２０ｍｓにおけるハイバンドデータを表し得、第３の部分１５４は２１ｍｓ〜３０ｍｓにおけるハイバンドデータを表し得る。

[0049]ハイバンド分析モジュール１６１は、オーディオ信号１０２のハイバンド部分を再構成するためにデコーダによって使用され得るハイバンドパラメータを生成し得る。たとえば、オーディオ信号１０２のハイバンド部分は、およそ６．４ｋＨｚ〜１６ｋＨｚにまたがる周波数範囲を占め得る。例示的な例では、ハイバンド分析モジュール１６１は、ハイバンド部分のＬＰ分析から生成されたＬＳＰを（たとえば、コードブックに基づいて）量子化する。ハイバンド分析モジュール１６１はまた、ローバンド分析モジュール１６０からローバンド励振信号を受信し得る。ハイバンド分析モジュール１６１はまた、ローバンド励振信号からハイバンド励振信号を生成し得る。ハイバンド励振信号は、合成ハイバンド部分を生成するローカルデコーダ１５８に与えられ得る。ハイバンド分析モジュール１６１は、ターゲット信号バッファ１５１内のハイバンドターゲットおよび／またはローカルデコーダ１５８からの合成ハイバンド部分に基づいて、フレーム利得、利得係数などのハイバンドパラメータを決定し得る。ＡＣＥＬＰハイバンド分析は、図２を参照しながらさらに説明されている。

[0050]フレーム１０４と１０６とのフレーム境界においてオーディオ信号１０２の符号化がＭＤＣＴエンコーダ１２０からＡＣＥＬＰエンコーダ１５０に切り替わった後、ターゲット信号バッファ１５１は、空であることもあり、リセットされることもあり、または過去のいくつかのフレーム（たとえば、フレーム１０８）からのハイバンドデータを含んでいることもある。さらに、計算モジュール１５６、ＬＢ分析モジュール１６０、および／またはＨＢ分析モジュール１６１におけるフィルタのフィルタ状態など、ＡＣＥＬＰエンコーダにおけるフィルタ状態が、過去のいくつかのフレームからの動作を反映し得る。そのようなリセットされるまたは「古い」情報がＡＣＥＬＰ符号化の間に使用される場合、不快なアーティファクト（たとえば、クリック音（clicking））が、第１のフレーム１０４と第２のフレーム１０６とのフレーム境界で生成され得る。さらに、エネルギー不一致がリスナーによって知覚され得る（たとえば、音量または他のオーディオ特性の急激な増減）。説明した技法によれば、古いフィルタ状態とターゲットデータとをリセットまたは使用する代わりに、ターゲット信号バッファ１５１にポピュレートされ、フィルタ状態が、第１のフレーム１０４（すなわち、ＡＣＥＬＰエンコーダ１５０への切替えの前にＭＤＣＴエンコーダ１２０によって符号化された最後のフレーム）と関連付けられるデータに基づいて決定され得る。

[0051]特定の態様では、ターゲット信号バッファ１５１は、ＭＤＣＴエンコーダ１２０によって生成された「軽量」ターゲット信号に基づいてポピュレートされる。たとえば、ＭＤＣＴエンコーダ１２０は、「軽量」ターゲット信号生成器１２５を含み得る。「軽量」ターゲット信号生成器１２５は、ＡＣＥＬＰエンコーダ１５０によって使用されるターゲット信号の推定値を表すベースバンド信号１３０を生成し得る。特定の態様では、ベースバンド信号１３０は、オーディオ信号１０２に対してフリップ動作とデシメーション動作とを実施することによって生成される。一例では、「軽量」ターゲット信号生成器１２５は、ＭＤＣＴエンコーダ１２０の動作中、連続的に稼働する。計算上の複雑さを軽減するために、「軽量」ターゲット信号生成器１２５は、高次のフィルタ処理動作またはダウンミキシング動作を実施せずに、ベースバンド信号１３０を生成し得る。ベースバンド信号１３０は、ターゲット信号バッファ１５１の少なくとも一部分にポピュレートするために使用され得る。たとえば、第１の部分１５２は、ベースバンド信号１３０に基づいてポピュレートされ得、第２の部分１５３および第３の部分１５４は、第２のフレーム１０６によって表される２０ｍｓのハイバンド部分に基づいてポピュレートされ得る。

[0052]特定の例では、ターゲット信号バッファ１５１の一部分（たとえば、第１の部分１５２）は、「軽量」ターゲット信号生成器１２５の出力の代わりに、ＭＤＣＴローカルデコーダ１２６の出力（たとえば、合成出力のうちの直近の１０ｍｓ）に基づいてポピュレートされ得る。この例では、ベースバンド信号１３０は、オーディオ信号１０２の合成バージョンに対応し得る。
説明のために、ベースバンド信号１３０は、ＭＤＣＴローカルデコーダ１２６の合成バッファから生成されてもよい。ＭＤＣＴ分析モジュール１２１が「完全」ＭＤＣＴを行う場合、ローカルデコーダ１２６は、「完全」逆ＭＤＣＴ（ＩＭＤＣＴ）（０Ｈｚ〜１６ｋＨｚ）を実施し得、ベースバンド信号１３０は、オーディオ信号１０２のハイバンド部分ならびにオーディオ信号の付加的部分（たとえば、ローバンド部分）に対応し得る。この例では、合成出力および／またはベースバンド信号１３０は、ハイバンドデータを（たとえば、８ｋＨｚ〜１６ｋＨｚの帯域において）近似する（たとえば、含む）結果信号を生成するために、（たとえば、ハイパスフィルタ（ＨＰＦ）、フリップおよびデシメーション動作などを介して）フィルタ処理され得る。

[0053]ＭＤＣＴエンコーダ１２０がＢＷＥを実施する場合、ローカルデコーダ１２６は、ハイバンド専用信号を合成するために、ハイバンドＩＭＤＣＴ（８ｋＨｚ〜１６ｋＨｚ）を含み得る。この例では、ベースバンド信号１３０は、合成されたハイバンド専用信号を表し得、ターゲット信号バッファ１５１の第１の部分１５２の中にコピーされ得る。この例では、ターゲット信号バッファ１５１の第１の部分１５２は、フィルタ処理動作を使用することなく、データコピー動作のみを使用してポピュレートされる。ターゲット信号バッファ１５１の第２の部分１５３および第３の部分１５４は、第２のフレーム１０６によって表される２０ｍｓのハイバンド部分に基づいてポピュレートされ得る。

[0054]したがって、特定の態様では、ターゲット信号バッファ１５１は、ベースバンド信号１３０に基づいてポピュレートされ得、ベースバンド信号１３０は、第１のフレーム１０４がＭＤＣＴエンコーダ１２０の代わりにＡＣＥＬＰエンコーダ１５０によって符号化されている場合に、ターゲット信号生成器１５５またはローカルデコーダ１５８によって生成されるターゲットまたは合成信号データを表す。ＡＣＥＬＰエンコーダ１５０内のフィルタ状態（たとえば、ＬＰフィルタ状態、デシメータ状態など）などの他のメモリ要素がまた、エンコーダ切替えに応答してリセットされる代わりにベースバンド信号１３０に基づいて決定され得る。ターゲットまたは合成信号データの近似を使用することにより、ターゲット信号バッファ１５１をリセットすることと比較して、フレームの境界アーティファクトおよびエネルギー不一致が低減され得る。加えて、ＡＣＥＬＰエンコーダ１５０内のフィルタは、「定常の」状態により迅速に到達（たとえば、収束）し得る。

[0055]特定の態様では、第１のフレーム１０４に対応するデータはＡＣＥＬＰエンコーダ１５０によって推定され得る。たとえば、ターゲット信号生成器１５５は、ターゲット信号バッファ１５１の一部分にポピュレートするために第１のフレーム１０４の一部分を推定するように構成された推定器１５７を含み得る。特定の態様では、推定器１５７は、第２のフレーム１０６のデータに基づいて外挿動作を実施する。たとえば、第２のフレーム１０６のハイバンド部分を表すデータは、ターゲット信号バッファ１５１の第２および第３の部分１５３、１５４内に記憶され得る。推定器１５７は、第２の部分１５３内に、およびオプションで第３の部分１５４内に記憶されたデータを外挿する（代替的に「逆伝播する（backpropagating）」と呼ばれる）ことによって生成されるデータを、第１の部分１５２内に記憶する。別の例として、推定器１５７は、第１のフレーム１０４またはその一部分（たとえば、第１のフレーム１０４の最後の１０ｍｓまたは５ｍｓ）を予測するために、第２のフレーム１０６に基づいて後方（backward）ＬＰを実施し得る。

[0056]特定の態様では、推定器１５７は、第１のフレーム１０４と関連付けられるエネルギーを示すエネルギー情報１４０に基づいて、第１のフレーム１０４の一部分を推定する。たとえば、第１のフレーム１０４の一部分は、第１のフレーム１０４のうちの（たとえば、ＭＤＣＴローカルデコーダ１２６において）局所的に復号されたローバンド部分、第１のフレーム１０４のうちの（たとえば、ＭＤＣＴローカルデコーダ１２６において）局所的に復号されたハイバンド部分、またはそれら両方に関連付けられるエネルギーに基づいて推定され得る。エネルギー情報１４０を考慮することにより、推定器１５７は、ＭＤＣＴエンコーダ１２０からＡＣＥＬＰエンコーダ１５０に切り替えるときの利得形状の下降など、フレーム境界におけるエネルギー不一致を低減するのに役立ち得る。例示的な例では、エネルギー情報１４０は、ＭＤＣＴ合成バッファなど、ＭＤＣＴエンコーダ内のバッファと関連付けられるエネルギーに基づいて決定される。合成バッファの周波数範囲全体（たとえば、０Ｈｚ〜１６ｋＨｚ）のエネルギーまたは合成バッファのハイバンド部分（たとえば、８ｋＨｚ〜１６ｋＨｚ）のみのエネルギーが推定器１５７によって使用され得る。推定器１５７は、第１のフレーム１０４の推定エネルギーに基づいて、第１の部分１５２においてデータにテーパリング（tapering）動作を適用し得る。テーパリングは、「非アクティブ」または低エネルギーフレームと「アクティブ」または高エネルギーフレームとの間の遷移が生じる場合などの、フレーム境界におけるエネルギー不一致を低減し得る。推定器１５７によって第１の部分１５２に適用されるテーパリングは、線形であってもよく、または別の数学関数に基づいてもよい。

[0057]特定の態様では、推定器１５７は、第１のフレーム１０４のフレームタイプに少なくとも部分的に基づいて、第１のフレーム１０４の一部分を推定する。たとえば、推定器１５７は、第１のフレーム１０４のフレームタイプおよび／または第２のフレーム１０６のフレームタイプ（代替的に「コーディングタイプ」と呼ばれる）に基づいて、第１のフレーム１０４の一部分を推定し得る。フレームタイプは、有声フレームタイプ、無声フレームタイプ、過渡フレームタイプ、および一般フレームタイプを含み得る。フレームタイプに応じて、推定器１５７は、第１の部分１５２においてデータに異なるテーパリング動作を適用し得る（たとえば、異なるテーパリング係数を使用する）。

[0058]したがって、特定の態様では、ターゲット信号バッファ１５１は、第１のフレーム１０４またはその一部分と関連付けられる信号推定値および／またはエネルギーに基づいてポピュレートされ得る。代替または追加として、第１のフレーム１０４および／または第２のフレーム１０６のフレームタイプが、信号のテーパリングなどのために、推定プロセスの間に使用され得る。ＡＣＥＬＰエンコーダ１５０内のフィルタ状態（たとえば、ＬＰフィルタ状態、デシメータ状態など）などの他のメモリ要素がまた、エンコーダ切替えに応答してリセットされる代わりに推定値に基づいて決定され得、これによって、フィルタ状態は「定常」状態により迅速に到達する（たとえば、収束する）ことが可能となり得る。

[0059]図１のシステム１００は、フレーム境界アーティファクトとエネルギー不一致とを低減する方式で、第１の符号化モードまたはエンコーダ（たとえば、ＭＤＣＴエンコーダ１２０）と第２の符号化モードまたはエンコーダ（たとえば、ＡＣＥＬＰエンコーダ１５０）との間で切り替えるときに、メモリ更新を処理し得る。図１のシステム１００を使用することは、信号コーディング品質の改善、ならびにユーザエクスペリエンスの改善につながり得る。

[0060]図２を参照すると、ＡＣＥＬＰ符号化システム２００の特定の例が示されており、全体として２００で示されている。本明細書でさらに説明するように、システム２００の１つまたは複数の構成要素が、図１のシステム１００の１つまたは複数の構成要素に対応し得る。例示的な例では、システム２００は、ワイヤレス電話、タブレットコンピュータなどの電子デバイスに統合される。

[0061]以下の説明では、図２のシステム２００によって実施される様々な機能は、いくつかの構成要素またはモジュールによって実施されるものとして説明される。しかしながら、構成要素およびモジュールのこの分割は説明のためにすぎない。代替例では、特定の構成要素またはモジュールによって実施される機能は、代わりに複数の構成要素またはモジュール間に分割され得る。さらに、代替例では、図２の２つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに統合され得る。図２に示された各構成要素またはモジュールは、ハードウェア（たとえば、ＡＳＩＣ、ＤＳＰ、コントローラ、ＦＰＧＡデバイスなど）、ソフトウェア（たとえば、プロセッサによって実行可能な命令）、またはそれらの任意の組合せを使用して実装され得る。

[0062]システム２００は、入力音声信号２０２を受信するように構成された分析フィルタバンク２１０を含む。たとえば、入力音声信号２０２はマイクロフォンまたは他の入力装置によって供給され得る。例示的な例では、入力オーディオ信号２０２は、オーディオ信号１０２が図１のＡＣＥＬＰエンコーダ１５０によって符号化されるべきであると図１のエンコーダセレクタ１１０が決定するとき、図１のオーディオ信号１０２に対応し得る。入力オーディオ信号２０２は、約０Ｈｚ〜約１６ｋＨｚの周波数範囲内のデータを含む超広帯域（ＳＷＢ）信号であり得る。分析フィルタバンク２１０は、周波数に基づいて入力オーディオ信号２０２をフィルタ処理して複数の部分にし得る。たとえば、分析フィルタバンク２１０は、ローバンド信号２２２とハイバンド信号２２４とを生成するために、ローパスフィルタ（ＬＰＦ）とハイパスフィルタ（ＨＰＦ）とを含み得る。ローバンド信号２２２およびハイバンド信号２２４は、等しい帯域幅を有しても等しくない帯域幅を有してもよく、重複してもよいし重複しなくてもよい。ローバンド信号２２２とハイバンド信号２２４が重複するとき、分析フィルタバンク２１０のローパスフィルタとハイパスフィルタは、スムーズなロールオフを有し得、これによって、設計が単純化され、ローパスフィルタおよびハイパスフィルタのコストが低減され得る。ローバンド信号２２２とハイバンド信号２２４とを重複させることは、受信機におけるローバンド信号とハイバンド信号との滑らかな混合をも可能にし得、これは、より少数の可聴アーティファクトをもたらし得る。

[0063]いくつかの例は本明細書ではＳＷＢ信号を処理する状況において説明されているが、これは説明のためのものにすぎないことに留意されたい。代替例では、説明した技法は、約０Ｈｚ〜約８ｋＨｚの周波数範囲を有するＷＢ信号を処理するために使用され得る。そのような例では、ローバンド信号２２２は約０Ｈｚ〜約６．４ｋＨｚの周波数範囲に対応し得、ハイバンド信号２２４は約６．４ｋＨｚ〜約８ｋＨｚの周波数範囲に対応し得る。

[0064]システム２００は、ローバンド信号２２２を受信するように構成されたローバンド分析モジュール２３０を含み得る。特定の態様では、ローバンド分析モジュール２３０は、ＡＣＥＬＰエンコーダの一例を表し得る。たとえば、ローバンド分析モジュール２３０は、図１のローバンド分析モジュール１６０に対応し得る。ローバンド分析モジュール２３０は、ＬＰ分析およびコーディングモジュール２３２と、線形予測係数（ＬＰＣ）−線スペクトル対（ＬＳＰ）変換モジュール２３４と、量子化器２３６とを含み得る。ＬＳＰはＬＳＦと呼ばれる場合もあり、２つの用語は本明細書において互換的に用いられる場合がある。ＬＰ分析およびコーディングモジュール２３２は、ローバンド信号２２２のスペクトルエンベロープをＬＰＣのセットとして符号化し得る。ＬＰＣは、オーディオの各フレーム（たとえば、１６ｋＨｚのサンプリングレートにおける３２０個のサンプルに対応する、オーディオの２０ｍｓ）、オーディオの各サブフレーム（たとえば、オーディオの５ｍｓ）、またはそれらの任意の組合せについて、生成され得る。各フレームまたはサブフレームに対して生成されるＬＰＣの数は、実施されるＬＰ分析の「次数」によって決定され得る。特定の態様では、ＬＰ分析およびコーディングモジュール２３２は、１０次ＬＰ分析に対応する１１個のＬＰＣのセットを生成し得る。

[0065]変換モジュール２３４は、ＬＰ分析およびコーディングモジュール２３２によって生成されたＬＰＣのセットを（たとえば１対１変換を使用して）ＬＳＰの対応するセットに変換し得る。代替的には、ＬＰＣのセットは、パーコール係数、ログ面積比値、イミッタンススペクトル対（ＩＳＰ）、またはイミッタンススペクトル周波数（ＩＳＦ）の対応するセットに１対１変換され得る。ＬＰＣのセットとＬＳＰのセットとの間の変換は、誤差を生じることなく可逆的にすることができる。

[0066]量子化器２３６は、変換モジュール２３４によって生成されたＬＳＰのセットを量子化し得る。たとえば、量子化器２３６は、複数のエントリ（たとえば、ベクトル）を含む複数のコードブックを含むかまたはそれらに結合され得る。ＬＳＰのセットを量子化するために、量子化器２３６は、（たとえば、最小２乗または平均２乗誤差などのひずみ尺度に基づいて）ＬＳＰのセット「に最も近い」コードブックのエントリを識別し得る。量子化器２３６は、コードブック内の特定された項目の位置に対応する指標値または一連の指標値を出力し得る。したがって、量子化器２３６の出力は、ローバンドビットストリーム２４２に含まれるローバンドフィルタパラメータを表し得る。

[0067]ローバンド分析モジュール２３０はまた、ローバンド励振信号２４４を生成し得る。たとえば、ローバンド励振信号２４４は、ローバンド分析モジュール２３０によって実行されるＬＰプロセス中に生成されるＬＰ残差信号を量子化することによって生成される符号化された信号であってよい。ＬＰ残差信号は、予測誤差を表し得る。

[0068]システム２００は、分析フィルタバンク２１０からのハイバンド信号２２４とローバンド分析モジュール２３０からのローバンド励振信号２４４とを受け取るように構成されたハイバンド分析モジュール２５０をさらに含み得る。たとえば、ハイバンド分析モジュール２５０は、図１のハイバンド分析モジュール１６１に対応し得る。ハイバンド分析モジュール２５０は、ハイバンド信号２２４およびローバンド励振信号２４４に基づいてハイバンドパラメータ２７２を生成し得る。たとえば、ハイバンドパラメータ２７２は、本明細書でさらに説明されるように、ハイバンドＬＳＰおよび／またはゲイン情報（たとえば、少なくともハイバンドエネルギーとローバンドエネルギーとの比に基づく）を含んでよい。

[0069]ハイバンド分析モジュール２５０は、ハイバンド励振生成器２６０を含み得る。ハイバンド励振生成器２６０は、ローバンド励振信号２４４のスペクトルをハイバンド周波数範囲（たとえば、８ｋＨｚ〜１６ｋＨｚ）に拡張することによってハイバンド励振信号を生成し得る。ハイバンド励振信号は、ハイバンドパラメータ２７２に含まれる１つまたは複数のハイバンド利得パラメータを決定するために使用され得る。図示のように、ハイバンド分析モジュール２５０は、ＬＰ分析およびコーディングモジュール２５２と、ＬＰＣ−ＬＳＰ変換モジュール２５４と、量子化器２５６も含むことができる。ＬＰ分析およびコーディングモジュール２５２、変換モジュール２５４、および量子化器２５６の各々は、ローバンド分析モジュール２３０の対応する構成要素を参照しながら先に説明されたように機能することができるが、（たとえば、それぞれの係数、ＬＳＰなどに対してより少ないビットを用いて）比較的低い解像度で機能することができる。ＬＰ分析およびコーディングモジュール２５２は、変換モジュール２５４によってＬＳＰに変換されコードブック２６３に基づいて量子化器２５６によって量子化されるＬＰＣのセットを生成することができる。たとえば、ＬＰ分析およびコーディングモジュール２５２、変換モジュール２５４、および量子化器２５６は、ハイバンドパラメータ２７２に含まれるハイバンドフィルタ情報（たとえば、ハイバンドＬＳＰ）を決定するためにハイバンド信号２２４を使用することができる。特定の実施形態では、ハイバンドパラメータ２７２は、ハイバンドＬＳＰならびにハイバンド利得パラメータを含むことができる。

[0070]ハイバンド分析モジュール２５０はまた、ローカルデコーダ２６２とターゲット信号生成器２６４とをさらに含み得る。たとえば、ローカルデコーダ２６２は図１のローカルデコーダ１５８に対応し得、ターゲット信号生成器２６４は図１のターゲット信号生成器１５５に対応し得る。ハイバンド分析モジュール２５０はさらに、ＭＤＣＴエンコーダからＭＤＣＴ情報２６６を受信し得る。たとえば、ＭＤＣＴ情報２６６は、図１のベースバンド信号１３０および／または図１のエネルギー情報１４０を含み得、また、図２のシステム２００によって実施されるＭＤＣＴ符号化からＡＣＥＬＰ符号化への切替えのときに、フレーム境界アーティファクトとエネルギー不一致とを低減するために使用され得る。

[0071]ローバンドビットストリーム２４２およびハイバンドパラメータ２７２は、出力ビットストリーム２９９を生成するためにマルチプレクサ（ＭＵＸ）２８０によって多重化され得る。出力ビットストリーム２９９は、入力音声信号２０２に対応する符号化音声信号を表し得る。たとえば、出力ビットストリーム２９９は（たとえば、ワイヤード、ワイヤレス、または光チャネルを介して）送信機２９８によって送信されることおよび／または記憶されることが可能である。受信機デバイスにおいて、合成オーディオ信号（たとえば、スピーカーまたは他の出力デバイスに与えられる入力オーディオ信号２０２の再構成されたバージョン）を生成するために、逆方向演算が、デマルチプレクサ（ＤＥＭＵＸ）、ローバンドデコーダ、ハイバンドデコーダ、およびフィルタバンクによって実施され得る。ローバンドビットストリーム２４２を表すために使用されるビット数は、ハイバンドパラメータ２７２を表すために使用されるビット数よりも実質的に大きいことがある。したがって、出力ビットストリーム２９９中のビットの大部分は、ローバンドデータを表し得る。ハイバンドパラメータ２７２は、信号モデルに従ってローバンドデータからハイバンド励振信号を再生成するために受信機で使用され得る。たとえば、この信号モデルは、ローバンドデータ（たとえば、ローバンド信号２２２）とハイバンドデータ（たとえば、ハイバンド信号２２４）の関係または相関関係の予測されるセットを表すことができる。したがって、異なる種類のオーディオデータに異なる信号モデルが使用可能であり、符号化オーディオデータの通信の前に、使用する特定の信号モデルが送信器と受信器とによってネゴシエートされてよい（または業界標準で定義されてよい）。信号モデルを使用して、送信機におけるハイバンド分析モジュール２５０は、出力ビットストリーム２９９からハイバンド信号２２４を再構成するために受信機における対応するハイバンド分析モジュールが信号モデルを使用することが可能であるように、ハイバンドパラメータ２７２を生成することが可能であってよい。

[0072]図２はしたがって、入力オーディオ信号２０２を符号化するときにＭＤＣＴエンコーダからのＭＤＣＴ情報２６６を使用するＡＣＥＬＰ符号化システム２００を示している。ＭＤＣＴ情報２６６を使用することにより、フレーム境界アーティファクトとエネルギー不一致とが低減され得る。たとえば、ＭＤＣＴ情報２６６は、ターゲット信号推定、逆伝播、テーパリングなどを実施するために使用され得る。

[0073]図３を参照すると、フレーム境界アーティファクトとエネルギー不一致とを低減しながらデコーダ間の切替えをサポートするように動作可能であるシステムの特定の例が示され、全体として３００で示されている。例示的な例では、システム３００は、ワイヤレス電話、タブレットコンピュータなどの電子デバイスに統合される。

[0074]システム３００は、受信機３０１と、デコーダセレクタ３１０と、変換ベースのデコーダ（たとえば、ＭＤＣＴデコーダ３２０）と、ＬＰベースのデコーダ（たとえば、ＡＣＥＬＰデコーダ３５０）とを含んでいる。したがって、図示されていないが、ＭＤＣＴデコーダ３２０およびＡＣＥＬＰデコーダ３５０は、それぞれ図１のＭＤＣＴエンコーダ１２０および図１のＡＣＥＬＰエンコーダ１５０の１つまたは複数の構成要素を参照しながら説明したものに対して逆の動作を実施する１つまたは複数の構成要素を含み得る。さらに、ＭＤＣＴデコーダ３２０によって実施されるものとして説明した１つまたは複数の動作がまた、図１のＭＤＣＴローカルデコーダ１２６によって実施されてもよく、ＡＣＥＬＰデコーダ３５０によって実施されるものとして説明した１つまたは複数の動作もまた、図１のＡＣＥＬＰローカルデコーダ１５８によって実施されてもよい。

[0075]動作の間、受信機３０１が、ビットストリーム３０２を受信し、デコーダセレクタ３１０に供給し得る。例示的な例では、ビットストリーム３０２は、図１の出力ビットストリーム１９９または図２の出力ビットストリーム２９９に対応する。デコーダセレクタ３１０は、ビットストリーム３０２の特性に基づいて、ビットストリーム３０２を復号して合成オーディオ信号３９９を生成するためにＭＤＣＴデコーダ３２０またはＡＣＥＬＰデコーダ３５０が使用されるべきかどうかを決定し得る。

[0076]ＡＣＥＬＰデコーダ３５０が選択されたとき、ＬＰＣ合成モジュール３５２は、ビットストリーム３０２またはその一部分を処理し得る。たとえば、ＬＰＣ合成モジュール３５２は、オーディオ信号の第１のフレームに対応するデータを復号し得る。復号の間、ＬＰＣ合成モジュール３５２は、オーディオ信号の第２の（たとえば、次の）フレームに対応する重複データ３４０を生成し得る。例示的な例では、重複データ３４０は、２０のオーディオサンプルを含み得る。

[0077]デコーダセレクタ３１０がＡＣＥＬＰデコーダ３５０からＭＤＣＴデコーダ３２０に復号を切り替えるとき、平滑化モジュール３２２は、平滑化関数を実行するために重複データ３４０を使用し得る。平滑化関数は、ＡＣＥＬＰデコーダ３５０からＭＤＣＴデコーダ３２０への切替えに応答して、ＭＤＣＴデコーダ３２０におけるフィルタメモリおよび合成バッファのリセットを原因とする、フレーム境界の不連続性を平滑化し得る。例示的な非限定的な例として、平滑化モジュール３２２は、重複データ３４０に基づいてクロスフェード（crossfade）動作を実施し得、それにより、重複データ３４０に基づいた合成出力とオーディオ信号の第２のフレームに対する合成出力との間の遷移が、より連続的であるとリスナーに知覚されるようになる。

[0078]図３のシステム３００はしたがって、フレーム境界の不連続性を低減する方式で、第１の復号モードまたはデコーダ（たとえば、ＡＣＥＬＰデコーダ３５０）と第２の復号モードまたはデコーダ（たとえば、ＭＤＣＴデコーダ３２０）との間で切り替えるときに、フィルタメモリとバッファ更新とを処理し得る。図３のシステム３００を使用することは、信号再構成品質の改善、ならびにユーザエクスペリエンスの改善につながり得る。

[0079]図１〜３のシステムのうちの１つまたは複数はしたがって、フィルタメモリと先読み（lookahead）バッファとを修正し、「現在の」コアの合成との組合せのために「以前の」コアの合成のフレーム境界オーディオサンプルを後方予測し得る。たとえば、図１を参照しながら説明したように、ＡＣＥＬＰ先読みバッファをゼロにリセットする代わりに、バッファ内のコンテンツが、ＭＤＣＴの「軽量」ターゲットまたは合成バッファから予測されてもよい。代替的に、フレーム境界サンプルの後方予測は、図１〜２を参照しながら説明したように行われてもよい。ＭＤＣＴエネルギー情報（たとえば、図１のエネルギー情報１４０）、フレームタイプなどのさらなる情報が場合によっては使用されてもよい。さらに、図３を参照して説明したように、時間的な不連続性を限定するために、ＡＣＥＬＰ重複サンプルなど、特定の合成出力が、ＭＤＣＴ復号の間にフレーム境界において平滑に混合され得る。特定の例では、「以前の」合成の最後のいくつかのサンプルが、フレーム利得および他の帯域幅拡張パラメータの算出において使用され得る。

[0080]図４を参照すると、エンコーダデバイスにおける動作の方法の特定の例が示され、全体として４００で指定されている。例示的な例では、方法４００は、図１のシステム１００において実施され得る。

[0081]方法４００は、４０２において、第１のエンコーダを使用してオーディオ信号の第１のフレームを符号化することを含み得る。第１のエンコーダはＭＤＣＴエンコーダであってもよい。たとえば、図１では、ＭＤＣＴエンコーダ１２０は、オーディオ信号１０２の第１のフレーム１０４を符号化し得る。

[0082]方法４００はまた、４０４において、第１のフレームの符号化の間に、オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することを含み得る。ベースバンド信号は、「軽量」ＭＤＣＴターゲット生成またはＭＤＣＴ合成出力に基づいたターゲット信号推定値に対応し得る。たとえば、図１では、ＭＤＣＴエンコーダ１２０は、「軽量」ターゲット信号生成器１２５によって生成された「軽量」ターゲット信号に基づいて、またはローカルデコーダ１２６の合成出力に基づいて、ベースバンド信号１３０を生成し得る。

[0083]方法４００は、４０６において、第２のエンコーダを使用してオーディオ信号の第２の（たとえば、連続的に次の）フレームを符号化することをさらに含み得る。第２のエンコーダは、ＡＣＥＬＰエンコーダであってもよく、第２のフレームを符号化することは、第２のフレームと関連付けられるハイバンドパラメータを生成するためにベースバンド信号を処理することを含み得る。たとえば、図１では、ＡＣＥＬＰエンコーダ１５０は、ターゲット信号バッファ１５１の少なくとも一部分にポピュレートするためのベースバンド信号１３０の処理に基づいて、ハイバンドパラメータを生成し得る。例示的な例では、ハイバンドパラメータは、図２のハイバンドパラメータ２７２を参照しながら説明したように生成され得る。

[0084]図５を参照すると、エンコーダデバイスにおける動作の方法の別の特定の例が示され、全体として５００で指定されている。方法５００は図１のシステム１００において実施され得る。特定の実装形態では、方法５００は図４の４０４に対応し得る。

[0085]方法５００は、５０２において、オーディオ信号のハイバンド部分を近似する結果信号を生成するために、ベースバンド信号に対してフリップ動作とデシメーション動作とを実施することを含む。ベースバンド信号は、オーディオ信号のハイバンド部分およびオーディオ信号の付加的部分に対応し得る。たとえば、図１のベースバンド信号１３０は、図１を参照しながら説明したように、ＭＤＣＴローカルデコーダ１２６の合成バッファから生成され得る。説明のために、ＭＤＣＴエンコーダ１２０は、ＭＤＣＴローカルデコーダ１２６の合成出力に基づいてベースバンド信号１３０を生成してもよい。ベースバンド信号１３０は、オーディオ信号１２０のハイバンド部分、ならびにオーディオ信号１２０の付加的（たとえば、ローバンド）部分に対応し得る。図１を参照しながら説明したように、ハイバンドデータを含む結果信号を生成するために、フリップ動作およびデシメーション動作がベースバンド信号１３０に対して実施され得る。たとえば、ＡＣＥＬＰエンコーダ１５０は、結果信号を生成するために、ベースバンド信号１３０に対してフリップ動作とデシメーション動作とを実施し得る。

[0086]方法５００はまた、５０４において、結果信号に基づいて第２のエンコーダのターゲット信号バッファにポピュレートすることを含む。たとえば、図１のＡＣＥＬＰエンコーダ１５０のターゲット信号バッファ１５１は、図１を参照しながら説明したように、結果信号に基づいてポピュレートされ得る。説明のために、ＡＣＥＬＰエンコーダ１５０は、結果信号に基づいてターゲット信号バッファ１５１にポピュレートしてもよい。ＡＣＥＬＰエンコーダ１５０は、図１を参照しながら説明したように、ターゲット信号バッファ１５１に記憶されたデータに基づいて、第２のフレーム１０６のハイバンド部分を生成し得る。

[0087]図６を参照すると、エンコーダデバイスにおける動作の方法の別の特定の例が示され、全体として６００で指定されている。例示的な例では、方法６００は、図１のシステム１００において実施され得る。

[0088]方法６００は、６０２において、第１のエンコーダを使用してオーディオ信号の第１のフレームを符号化することと、６０４において、第２のエンコーダを使用してオーディオ信号の第２のフレームを符号化することとを含み得る。第１のエンコーダは、図１のＭＤＣＴエンコーダ１２０などのＭＤＣＴエンコーダであってもよく、第２のエンコーダは、図１のＡＣＥＬＰエンコーダ１５０などのＡＣＥＬＰエンコーダであってもよい。第２のフレームは、第１のフレームに連続的に続き得る。

[0089]第２のフレームを符号化することは、６０６において、第２のエンコーダで第１のフレームの第１の部分を推定することを含み得る。たとえば、図１を参照すると、推定器１５７は、外挿、線形予測、ＭＤＣＴエネルギー（たとえば、エネルギー情報１４０）、フレームタイプなどに基づいて、第１のフレーム１０４の一部分（たとえば、最後の１０ｍｓ）を推定し得る。

[0090]第２のフレームを符号化することはまた、６０８において、第１のフレームの第１の部分および第２のフレームに基づいて第２のバッファのバッファにポピュレートすることを含み得る。たとえば、図１を参照すると、ターゲット信号バッファ１５１の第１の部分１５２は、第１のフレーム１０４の推定部分に基づいてポピュレートされ得、ターゲット信号バッファ１５１の第２および第３の部分１５３、１５４は、第２のフレーム１０６に基づいてポピュレートされ得る。

[0091]第２のフレームを符号化することは、６１０において、第２のフレームと関連付けられるハイバンドパラメータを生成することをさらに含み得る。たとえば、図１では、ＡＣＥＬＰエンコーダ１５０は、第２のフレーム１０６と関連付けられるハイバンドパラメータを生成し得る。例示的な例では、ハイバンドパラメータは、図２のハイバンドパラメータ２７２を参照しながら説明したように生成され得る。

[0092]図７を参照すると、デコーダデバイスにおける動作の方法の特定の例が示され、全体として７００で指定されている。例示的な例では、方法７００は、図３のシステム３００において実施され得る。

[0093]方法７００は、７０２において、第１のデコーダと第２のデコーダとを含むデバイスで、第２のデコーダを使用してオーディオ信号の第１のフレームを復号することを含み得る。第２のデコーダはＡＣＥＬＰデコーダであってもよく、オーディオ信号の第２のフレームの一部分に対応する重複データを生成し得る。たとえば、図３を参照すると、ＡＣＥＬＰデコーダ３５０は、第１のフレームを復号し、重複データ３４０（たとえば、２０のオーディオサンプル）を生成し得る。

[0094]方法７００はまた、７０４において、第１のデコーダを使用して第２のフレームを復号することを含み得る。第１のデコーダはＭＤＣＴデコーダであってもよく、第２のフレームを復号することは、第２のデコーダからの重複データを使用して平滑化（たとえば、クロスフェード）動作を適用することを含み得る。たとえば、図１を参照すると、ＭＤＣＴデコーダ３２０は、第２のフレームを復号し、重複データ３４０を使用して平滑化動作を適用し得る。

[0095]特定の態様では、方法図４〜７のうちの１つまたは複数が、中央処理ユニット（ＣＰＵ）、ＤＳＰ、またはコントローラなどの処理ユニットのハードウェア（たとえば、ＦＰＧＡデバイス、ＡＳＩＣなど）を介して、ファームウェアデバイスを介して、またはそれらの任意の組合せで実装され得る。例として、方法図４〜７の内の１つまたは複数が、図８に関して説明したように、命令を実行するプロセッサによって実施され得る。

[0096]図８を参照すると、デバイス（たとえば、ワイヤレス通信デバイス）の特定の例示的な実施形態のブロック図が示されており、全体的に８００と指定されている。様々な例では、デバイス８００は、図８に示すものよりも少ない、または多い構成要素を有し得る。例示的な例として、デバイス８００は、図１〜３のシステムのうちの１つまたは複数に対応し得る。例示的な例として、デバイス８００は、図４〜７の方法のうちの１つまたは複数に従って動作し得る。

[0097]特定の態様では、デバイス８００はプロセッサ８０６（たとえば、ＣＰＵ）を含む。デバイス８００は、１つまたは複数の付加的なプロセッサ８１０（たとえば、１つまたは複数のＤＳＰ）を含み得る。プロセッサ８１０は、スピーチおよび音楽コーダデコーダ（ＣＯＤＥＣ）８０８と、エコーキャンセラ８１２とを含み得る。スピーチおよび音楽ＣＯＤＥＣ８０８は、ボコーダエンコーダ８３６、ボコーダデコーダ８３８、またはそれら両方を含み得る。

[0098]特定の態様では、ボコーダエンコーダ８３６は、ＭＤＣＴエンコーダ８６０と、ＡＣＥＬＰエンコーダ８６２とを含み得る。ＭＤＣＴエンコーダ８６０は、図１のＭＤＣＴエンコーダ１２０に対応し得、ＡＣＥＬＰエンコーダ８６２は、図１のＡＣＥＬＰエンコーダ１５０または図２のＡＣＥＬＰ符号化システム２００の１つもしくは複数の構成要素に対応し得る。ボコーダエンコーダ８３６はまた、（たとえば、図１のエンコーダセレクタ１１０に対応する）エンコーダセレクタ８６４を含み得る。ボコーダデコーダ８３８は、ＭＤＣＴデコーダ８７０とＡＣＥＬＰデコーダ８７２とを含み得る。ＭＤＣＴデコーダ８７０は、図３のＭＤＣＴデコーダ３２０に対応し得、ＡＣＥＬＰデコーダ８７２は、図１のＡＣＥＬＰデコーダ３５０に対応し得る。ボコーダデコーダ８３８はまた、（たとえば、図３のデコーダセレクタ３１０に対応する）デコーダセレクタ８７４を含み得る。スピーチおよび音楽ＣＯＤＥＣ８０８はプロセッサ８１０の構成要素として示されているが、他の例では、スピーチおよび音楽ＣＯＤＥＣ８０８の１つまたは複数の構成要素が、プロセッサ８０６、ＣＯＤＥＣ８３４、別の処理構成要素、またはそれらの組合せの中に含められてもよい。

[0099]デバイス８００は、メモリ８３２と、トランシーバ８５０を介してアンテナ８４２に結合されたワイヤレスコントローラ８４０とを含み得る。デバイス８００は、ディスプレイコントローラ８２６に結合されたディスプレイ８２８を含み得る。スピーカー８４８、マイクロフォン８４６、またはそれら両方がＣＯＤＥＣ８３４に結合され得る。ＣＯＤＥＣ８３４は、デジタルアナログ変換器（ＤＡＣ）８０２と、アナログデジタル変換器（ＡＤＣ）８０４とを含み得る。

[0100]特定の態様では、ＣＯＤＥＣ８３４は、マイクロフォン８４６からアナログ信号を受信し、アナログデジタル変換器８０４を使用してそのアナログ信号をデジタル信号に変換し、パルス符号変調（ＰＣＭ）形式などでスピーチおよび音楽ＣＯＤＥＣ８０８にそのデジタル信号を供給し得る。スピーチおよび音楽ＣＯＤＥＣ８０８はデジタル信号を処理し得る。特定の態様では、スピーチおよび音楽ＣＯＤＥＣ８０８は、ＣＯＤＥＣ８３４にデジタル信号を供給し得る。ＣＯＤＥＣ８３４は、デジタルアナログ変換器８０２を使用してデジタル信号をアナログ信号に変換し得、そのアナログ信号をスピーカー８４８に供給し得る。

[0101]メモリ８３２は、図４〜７の方法のうちの１つまたは複数など、本明細書で開示する方法とプロセスとを実施するために、プロセッサ８０６によって実行可能な命令８５６、プロセッサ８１０、ＣＯＤＥＣ８３４、デバイス８００の別の処理ユニット、またはそれらの組合せを含み得る。図１〜３のシステムの１つまたは複数の構成要素が、専用ハードウェア（たとえば回路）により、１つもしくは複数のタスクを実施するための命令（たとえば命令８５６）を実行するプロセッサによって、またはそれらの組合せによって実装され得る。一例として、メモリ８３２またはプロセッサ８０６、プロセッサ８１０、および／もしくはＣＯＤＥＣ８３４の１つもしくは複数の構成要素は、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピントルクトランスファーＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読出し専用メモリ（ＲＯＭ）、プログラマブル読出し専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読出し専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読出し専用メモリ（ＣＤ−ＲＯＭ）などのメモリデバイスであり得る。メモリデバイスは、コンピュータ（たとえば、ＣＯＤＥＣ８３４内のプロセッサ、プロセッサ８０６、および／またはプロセッサ８１０）によって実行されたとき、コンピュータに図４〜７の方法のうちの１つまたは複数の方法の少なくとも一部分を実施させ得る命令（たとえば命令８５６）を含み得る。一例として、メモリ８３２またはプロセッサ８０６、プロセッサ８１０、ＣＯＤＥＣ８３４の１つもしくは複数の構成要素は、コンピュータ（たとえば、ＣＯＤＥＣ８３４内のプロセッサ、プロセッサ８０６、および／またはプロセッサ８１０）によって実行されるときにコンピュータに方法図４〜７のうちの１つまたは複数の方法の少なくとも一部分を実施させる命令（たとえば、命令８５６）を含む非一時的コンピュータ可読媒体であり得る。

[0102]特定の態様では、デバイス８００は、移動局モデム（ＭＳＭ）など、システムインパッケージまたはシステムオンチップデバイス８２２内に含められ得る。特定の態様では、プロセッサ８０６、プロセッサ８１０、ディスプレイコントローラ８２６、メモリ８３２、ＣＯＤＥＣ８３４、ワイヤレスコントローラ８４０、およびトランシーバ８５０は、システムインパッケージまたはシステムオンチップデバイス８２２内に含められる。特定の態様では、タッチスクリーンおよび／またはキーパッドなどの入力デバイス８３０ならびに電源８４４が、システムオンチップデバイス８２２に結合される。さらに、特定の態様では、図８に示すように、ディスプレイ８２８、入力デバイス８３０、スピーカー８４８、マイクロフォン８４６、アンテナ８４２、および電源８４４は、システムオンチップデバイス８２２の外部に存在する。しかしながら、ディスプレイ８２８、入力デバイス８３０、スピーカー８４８、マイクロフォン８４６、アンテナ８４２、および電源８４４の各々は、インターフェースまたはコントローラなど、システムオンチップデバイス８２２の構成要素に結合され得る。例示的な例では、デバイス８００は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、エンコーダシステム、またはそれらの任意の組合せに対応する。

[0103]例示的な態様では、プロセッサ８１０は、説明した技法に従って単一の符号化および復号動作を実施するように動作可能となり得る。たとえば、マイクロフォン８４６はオーディオ信号（たとえば、図１のオーディオ信号１０２）を捕捉し得る。ＡＤＣ８０４は、捕捉されたオーディオ信号を、アナログ波形から、デジタルオーディオサンプルを含んだデジタル波形へと変換し得る。プロセッサ８１０は、デジタルオーディオサンプルを処理し得る。エコーキャンセラ８１２は、スピーカー８４８の出力がマイクロフォン８４６に入ることによって生成された可能性のあるエコーを低減し得る。

[0104]ボコーダエンコーダ８３６は、処理されたスピーチ信号に対応するデジタルオーディオサンプルを圧縮し得、また送信パケット（たとえば、デジタルオーディオサンプルの圧縮されたビットの表現）を形成し得る。たとえば、送信パケットは、図１の出力ビットストリーム１９９または図２の出力ビットストリーム２９９の少なくとも一部分に対応し得る。送信パケットはメモリ８３２に記憶され得る。トランシーバ８５０は、ある形式の送信パケットを変調し得（たとえば、他の情報が送信パケットに付加され得る）、アンテナ８４２を介して、その変調されたデータを送信し得る。

[0105]さらなる例として、アンテナ８４２は、受信パケットを含んだ着信パケットを受信し得る。受信パケットは、ネットワークを介して別のデバイスによって送られ得る。たとえば、受信パケットは、図３のビットストリーム３０２の少なくとも一部分に対応し得る。ボコーダデコーダ８３８は、（たとえば、合成オーディオ信号３９９に対応する）再構成オーディオサンプルを生成するために、受信パケットを復元および復号し得る。エコーキャンセラ８１２は、再構成オーディオサンプルからエコーを除去し得る。ＤＡＣ８０２は、ボコーダデコーダ８３８の出力をデジタル波形からアナログ波形に変換し得、その変換された波形を出力用にスピーカー８４８に供給し得る。

[0106]説明した態様に関連して、オーディオ信号の第１のフレームを符号化するための第１の手段を含む装置が開示される。たとえば、符号化するための第１の手段は、図１のＭＤＣＴエンコーダ１２０、プロセッサ８０６、プロセッサ８１０、図８のＭＤＣＴエンコーダ８６０、オーディオ信号の第１のフレームを符号化するように構成された１つもしくは複数のデバイス（たとえば、コンピュータ可読記憶デバイスに記憶された命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。符号化するための第１の手段は、第１のフレームの符号化の間に、オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成するように構成され得る。

[0107]この装置はまた、オーディオ信号の第２のフレームを符号化するための第２の手段を含む。たとえば、符号化するための第２の手段は、図１のＡＣＥＬＰエンコーダ１５０、プロセッサ８０６、プロセッサ８１０、図８のＡＣＥＬＰエンコーダ８６２、オーディオ信号の第２のフレームを符号化するように構成された１つもしくは複数のデバイス（たとえば、コンピュータ可読記憶デバイスに記憶された命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。第２のフレームを符号化することは、第２のフレームと関連付けられるハイバンドパラメータを生成するためにベースバンド信号を処理することを含み得る。

[0108]さらに、本明細書で開示した態様に関して説明した様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実装され得ることを、当業者は諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップが、上記では概して、それらの機能に関して説明された。そのような機能をハードウェアとして実現するか、実行可能ソフトウェアとして実現するかは、特定の適用例およびシステム全体に課される設計制約によって決まる。当業者は、説明された機能を特定の適用例ごとに様々な方法において実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。

[0109]本明細書で開示した態様に関して説明した方法またはアルゴリズムのステップは、直接ハードウェアで実施され得るか、プロセッサによって実行されるソフトウェアモジュールで実施され得るか、またはその２つの組合せで実施され得る。ソフトウェアモジュールは、ＲＡＭ、ＭＲＡＭ、ＳＴＴ−ＭＲＡＭ、フラッシュメモリ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、レジスタ、ハードディスク、リムーバブルディスク、またはＣＤ−ＲＯＭなどのメモリデバイス内に存在し得る。例示のメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替実施形態では、メモリデバイスはプロセッサに内蔵され得る。プロセッサおよび記憶媒体はＡＳＩＣ中に存在し得る。ＡＳＩＣはコンピューティングデバイスまたはユーザ端末中に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として存在し得る。

[0110]開示されている例の上記の説明は、当業者が開示されている例を製作または使用することを可能にするために提供されている。これらの例に対する種々の変更は、当業者には容易に明らかになり、本明細書において規定される原理は、本開示の範囲から逸脱することなく、他の例に適用され得る。したがって、本開示は、本明細書に示した態様に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴と一致する、可能な最も広い範囲が与えられるべきものである。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
第１のエンコーダを使用して、オーディオ信号の第１のフレームを符号化することと、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することと、
第２のエンコーダを使用して、前記オーディオ信号の第２のフレームを符号化することと、ここで、前記第２のフレームを符号化することは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために前記ベースバンド信号を処理することを含み、
を備える方法。
［Ｃ２］
前記第２のフレームは、前記オーディオ信号において前記第１のフレームに連続的に続く、Ｃ１に記載の方法。
［Ｃ３］
前記第１のエンコーダは、変換ベースのエンコーダを備える、Ｃ１に記載の方法。
［Ｃ４］
前記変換ベースのエンコーダは、修正離散コサイン変換（ＭＤＣＴ）エンコーダを備える、Ｃ３に記載の方法。
［Ｃ５］
前記第２のエンコーダは、線形予測（ＬＰ）ベースのエンコーダを備える、Ｃ１に記載の方法。
［Ｃ６］
前記線形予測（ＬＰ）ベースのエンコーダは、代数符号励振線形予測（ＡＣＥＬＰ）エンコーダを備える、Ｃ５に記載の方法。
［Ｃ７］
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含む、Ｃ１に記載の方法。
［Ｃ８］
前記ベースバンド信号を生成することは、高次フィルタ処理動作を実行することを含まず、ダウンミキシング動作を実行することを含まない、Ｃ１に記載の方法。
［Ｃ９］
前記ベースバンド信号に少なくとも部分的に基づいて、および前記第２のフレームの特定のハイバンド部分に少なくとも部分的に基づいて、前記第２のエンコーダのターゲット信号バッファにポピュレートすることをさらに備える、Ｃ１に記載の方法。
［Ｃ１０］
前記ベースバンド信号は、前記第１のエンコーダのローカルデコーダを使用して生成され、ここにおいて、前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、Ｃ１に記載の方法。
［Ｃ１１］
前記ベースバンド信号は、前記オーディオ信号の前記ハイバンド部分に対応し、前記第２のエンコーダのターゲット信号バッファにコピーされる、Ｃ１０に記載の方法。
［Ｃ１２］
前記ベースバンド信号は、前記オーディオ信号の前記ハイバンド部分および前記オーディオ信号の付加的な部分に対応し、前記方法は、
前記ハイバンド部分を近似する結果信号を生成するために、前記ベースバンド信号に対してフリップ動作とデシメーション動作とを実行することと、
前記結果信号に基づいて、前記第２のエンコーダのターゲット信号バッファにポピュレートすることと、
をさらに備える、Ｃ１０に記載の方法。
［Ｃ１３］
第１のデコーダと第２のデコーダとを含むデバイスにおいて、前記第２のデコーダを使用してオーディオ信号の第１のフレームを復号することと、ここで、前記第２のデコーダは、前記オーディオ信号の第２のフレームの一部分に対応する重複データを生成し、
前記第１のデコーダを使用して前記第２のフレームを復号することと、ここで、前記第２のフレームを復号することは、前記第２のデコーダからの前記重複データを使用して平滑化動作を適用することを含み、
を備える方法。
［Ｃ１４］
前記第１のデコーダは修正離散コサイン変換（ＭＤＣＴ）デコーダを備え、前記第２のデコーダは代数符号励振線形予測（ＡＣＥＬＰ）デコーダを備える、Ｃ１３に記載の方法。
［Ｃ１５］
前記重複データは、前記第２のフレームの２０オーディオサンプルを備える、Ｃ１３に記載の方法。
［Ｃ１６］
前記平滑化動作はクロスフェード動作を備える、Ｃ１３に記載の方法。
［Ｃ１７］
オーディオ信号の第１のフレームを符号化し、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成する
ように構成された第１のエンコーダと、
前記オーディオ信号の第２のフレームを符号化するように構成された第２のエンコーダと、ここで、前記第２のフレームを符号化することは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を処理することを含む、
を備える装置。
［Ｃ１８］
前記第２のフレームは、前記オーディオ信号において前記第１のフレームに連続的に続く、Ｃ１７に記載の装置。
［Ｃ１９］
前記第１のエンコーダは修正離散コサイン変換（ＭＤＣＴ）エンコーダを備え、前記第２のエンコーダは代数符号励振線形予測（ＡＣＥＬＰ）エンコーダを備える、Ｃ１７に記載の装置。
［Ｃ２０］
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、前記ベースバンド信号を生成することは、高次のフィルタ処理動作を実行することを含まず、前記ベースバンド信号を生成することは、ダウンミキシング動作を実行することを含まない、Ｃ１７に記載の装置。
［Ｃ２１］
オーディオ信号の第１のフレームを符号化するように構成された第１のエンコーダと、
前記オーディオ信号の第２のフレームの符号化の間に、
前記第１のフレームの第１の部分を推定し、
前記第１のフレームの前記第１の部分および前記第２のフレームに基づいて、前記第２のエンコーダのバッファにポピュレートし、
前記第２のフレームと関連付けられるハイバンドパラメータを生成するように構成された第２のエンコーダと、
を備える装置。
［Ｃ２２］
前記第１のフレームの前記第１の部分を推定することは、前記第２のフレームのデータに基づいて外挿動作を実行することを含む、Ｃ２１に記載の装置。
［Ｃ２３］
前記第１のフレームの前記第１の部分を推定することは、後方線形予測を実施することを含む、Ｃ２１に記載の装置。
［Ｃ２４］
前記第１のフレームの前記第１の部分は、前記第１のフレームと関連付けられるエネルギーに基づいて推定される、Ｃ２１に記載の装置。
［Ｃ２５］
前記第１のエンコーダに結合された第１のバッファをさらに備え、
前記第１のフレームと関連付けられる前記エネルギーは、前記第１のバッファと関連付けられる第１のエネルギーに基づいて決定される、Ｃ２４に記載の装置。
［Ｃ２６］
前記第１のフレームと関連付けられる前記エネルギーは、前記第１のバッファのハイバンド部分と関連付けられる第２のエネルギーに基づいて決定される、Ｃ２５に記載の装置。
［Ｃ２７］
前記第１のフレームの前記第１の部分は、前記第１のフレームの第１のフレームタイプ、前記第２のフレームの第２のフレームタイプ、またはそれら両方に少なくとも部分的に基づいて推定される、Ｃ２１に記載の装置。
［Ｃ２８］
前記第１のフレームタイプは、有声フレームタイプ、無声フレームタイプ、過渡フレームタイプ、または一般フレームタイプを備え、
前記第２のフレームタイプは、前記有声フレームタイプ、前記無声フレームタイプ、前記過渡フレームタイプ、または前記一般フレームタイプを備える、Ｃ２７に記載の装置。
［Ｃ２９］
前記第１のフレームの前記第１の部分は、持続時間において約５ミリ秒であり、前記第２のフレームは、持続時間において約２０ミリ秒である、Ｃ２１に記載の装置。
［Ｃ３０］
前記第１のフレームの前記第１の部分は、前記第１のフレームの局所的に復号されたローバンド部分、前記第１のフレームの局所的に復号されたハイバンド部分、またはそれら両方と関連付けられるエネルギーに基づいて推定される、Ｃ２１に記載の装置。
［Ｃ３１］
第１のデコーダと、
第２のデコーダと、を備え、
前記第２のデコーダは、
オーディオ信号の第１のフレームを復号し、
前記オーディオ信号の第２のフレームの一部分に対応する重複データを生成するように構成され、
前記第１のデコーダは、前記第２のフレームの復号の間、前記第２のデコーダからの前記重複データを使用して平滑化動作を適用するように構成される、装置。
［Ｃ３２］
前記平滑化動作はクロスフェード動作を備える、Ｃ３１に記載の装置。
［Ｃ３３］
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
第１のエンコーダを使用して、オーディオ信号の第１のフレームを符号化することと、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することと、
第２のエンコーダを使用して、前記オーディオ信号の第２のフレームを符号化することと、ここで、前記第２のフレームを符号化することは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を処理することを含む、
を備える動作を実行させる、コンピュータ可読記憶デバイス。
［Ｃ３４］
前記第１のエンコーダは、変換ベースのエンコーダを備え、前記第２のエンコーダは、線形予測（ＬＰ）ベースのエンコーダを備える、Ｃ３３に記載のコンピュータ可読記憶デバイス。
［Ｃ３５］
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、
前記動作は、前記ベースバンド信号に少なくとも部分的に基づいて、および前記第２のフレームの特定のハイバンド部分に少なくとも部分的に基づいて、前記第２のエンコーダのターゲット信号バッファにポピュレートすることをさらに備える、
Ｃ３３に記載のコンピュータ可読記憶デバイス。
［Ｃ３６］
前記ベースバンド信号は、前記第１のエンコーダのローカルデコーダを使用して生成され、前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、Ｃ３３に記載のコンピュータ可読記憶デバイス。
［Ｃ３７］
オーディオ信号の第１のフレームを符号化するための第１の手段と、符号化するための前記第１の手段は、前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成するように構成され、
前記オーディオ信号の第２のフレームを符号化するための第２の手段と、ここで、前記第２のフレームを符号化することは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために前記ベースバンド信号を処理することを含む、
を備える装置。
［Ｃ３８］
符号化するための前記第１の手段および符号化するための前記第２の手段は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、またはエンコーダシステムのうちの少なくとも１つに統合される、Ｃ３７に記載の装置。
［Ｃ３９］
符号化するための前記第１の手段は、フリップ動作とデシメーション動作とを実行することによって前記ベースバンド信号を生成するようにさらに構成される、Ｃ３７に記載の装置。
［Ｃ４０］
符号化するための前記第１の手段は、ローカルデコーダを使用することによって、前記ベースバンド信号を生成するようにさらに構成され、
前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、Ｃ３７に記載の装置。

Claims

オーディオ信号を符号化するための方法であって、前記方法は、
第１のエンコーダにおける第１の領域分析を使用して、前記オーディオ信号の第１のフレームを符号化することと、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
第２のエンコーダにおける第２の領域分析を使用して、前記オーディオ信号の第２のフレームを、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第１のデータと前記第２のフレームのハイバンド部分を表す第２のデータとを処理することによって、符号化することと、
を備える、方法。
前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記第２のフレームは、前記オーディオ信号において前記第１のフレームに連続的に続く、請求項１に記載の方法。
前記オーディオ信号の前記第１のフレームは、変換ベースのエンコーダを使用して符号化される、請求項１に記載の方法。
前記オーディオ信号の前記第１のフレームは、修正離散コサイン変換（ＭＤＣＴ）エンコーダを使用して符号化される、請求項１に記載の方法。
前記オーディオ信号の前記第２のフレームは、ターゲット信号バッファに前記第１のデータおよび前記第２のデータを記憶する線形予測（ＬＰ）ベースのエンコーダを使用して符号化される、請求項１に記載の方法。
前記オーディオ信号の前記第２のフレームは、帯域幅拡張を実行するように構成された代数符号励振線形予測（ＡＣＥＬＰ）エンコーダを使用して符号化される、請求項１に記載の方法。
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含む、請求項１に記載の方法。
前記ベースバンド信号を生成することは、高次のフィルタ処理動作を実行することを含まず、および、ダウンミキシング動作を実行することを含まない、請求項１に記載の方法。
前記第２のエンコーダは、前記第２のエンコーダのターゲット信号バッファの第１の部分に前記第１のデータを記憶し、前記ターゲット信号バッファの第２の部分に前記第２のデータを記憶する、請求項１に記載の方法。
前記第１のエンコーダおよび前記第２のエンコーダは、モバイル通信デバイスに含まれる、請求項１に記載の方法。
前記ベースバンド信号を生成することは、前記第１のエンコーダのローカルデコーダを使用することを備え、前記第２のエンコーダのターゲット信号バッファに前記第１のデータをコピーすることをさらに備える、請求項１に記載の方法。
前記オーディオ信号の前記ハイバンド部分を近似する結果信号を生成するために、前記ベースバンド信号に対してフリップ動作とデシメーション動作とを実行することと、
前記結果信号に基づいて、前記第２のエンコーダのターゲット信号バッファにポピュレートすることと、
をさらに備える、請求項１に記載の方法。
オーディオ信号を復号するための方法であって、前記方法は、
第１のエンコーダにおける第１の領域分析を使用して符号化された前記オーディオ信号の第２のフレームに基づく第２のビットの、および、第２のエンコーダにおける第２の領域分析を使用して符号化された前記オーディオ信号の第１のフレームに基づく第１のビットのビットストリームを受信することと、前記第１のフレームは、ベースバンド信号を表す第１のデータと前記第１のフレームのハイバンド部分を表す第２のデータとを処理することによって符号化され、ここで、前記ベースバンド信号は、第３のフレームのハイバンド推定値、または前記第３のフレームの少なくとも一部分の合成バージョンに基づいて前記第１のエンコーダによって生成され、
第１のデコーダと第２のデコーダとを含むデバイスにおいて、前記第２のデコーダおよび前記第１のビットを使用して前記第１のフレームの符号化バージョンを復号することと、前記第２のデコーダは、前記第２のフレームの一部分に対応する重複データを生成し、
前記第１のデコーダおよび前記第２のビットを使用して前記第２のフレームの符号化バージョンを復号することと、前記復号することは、前記第２のデコーダからの前記重複データを使用して平滑化動作を適用することを含む、
を備える、方法。
前記第１のデコーダは、修正離散コサイン変換（ＭＤＣＴ）デコーダを備え、前記第２のデコーダは、帯域幅拡張パラメータに基づいて算出を実行する代数符号励振線形予測（ＡＣＥＬＰ）デコーダを備え、前記重複データは、前記第２のフレームの２０オーディオサンプルに対応するデータを備える、請求項１３に記載の方法。
前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備える、請求項１３に記載の方法。
前記平滑化動作は、クロスフェード動作を含み、前記第１のデコーダおよび前記第２のデコーダは、モバイル通信デバイスに含まれる、請求項１３に記載の方法。
オーディオ信号を符号化するための装置であって、前記装置は、
アンテナと、
第１の領域分析に基づいて、前記オーディオ信号の第１のフレームを符号化することと、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または、前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
を行うように構成された第１のエンコーダと、
第２の領域分析と、
前記ベースバンド信号を表す第１のデータと第２のフレームのハイバンド部分を表す第２のデータと、
に基づいて、前記オーディオ信号の第２のフレームを符号化するように構成された第２のエンコーダと、第２のエンコーダは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するように構成され、
前記アンテナに結合され、前記ベースバンド信号と関連付けられる符号化オーディオ信号を送信するように構成された送信機と、
を備える、装置。
前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記第２のフレームは、前記オーディオ信号において前記第１のフレームに連続的に続く、請求項１７に記載の装置。
前記第１のエンコーダは、修正離散コサイン変換（ＭＤＣＴ）エンコーダを備え、
前記第２のエンコーダは、ターゲット信号バッファに前記第１のデータまたは前記第２のデータのうちの少なくとも１つを記憶することと、帯域幅拡張を実行することとを行うように構成された代数符号励振線形予測（ＡＣＥＬＰ）エンコーダを備え、
前記第１のエンコーダおよび前記第２のエンコーダは、モバイル通信デバイスに統合される、
請求項１７に記載の装置。
前記第１のエンコーダは、高次のフィルタ処理動作を実行せずに、および、ダウンミキシング動作を実行せずに、フリップ動作を使用して、およびデシメーション動作を使用して、前記ベースバンド信号を生成するように構成される、請求項１７に記載の装置。
オーディオ信号を符号化するための装置であって、前記装置は、
アンテナと、
第１の領域分析に基づいて、オーディオ信号の第１のフレームを符号化するように構成された第１のエンコーダと、
第２の領域分析に基づいて、前記オーディオ信号の第２のフレームを符号化する間に、前記第１のフレームの第１の部分の信号推定値を生成することと、
前記信号推定値に基づいて第１のデータで、および、前記オーディオ信号の第２のフレームのハイバンド部分を表す第２のデータで、第２のエンコーダのバッファにポピュレートすることと、
前記バッファに記憶された前記第１のデータおよび前記第２のデータに基づいて、前記第２のフレームと関連付けられるハイバンドパラメータを生成することと、
を行うように構成された第２のエンコーダと、
前記アンテナに結合され、前記オーディオ信号と関連付けられる符号化オーディオ信号を送信するように構成された送信機と、
を備える、装置。
前記信号推定値は、前記第２のフレームのデータに基づく外挿動作に基づく、請求項２１に記載の装置。
前記信号推定値は、後方線形予測に基づく、請求項２１に記載の装置。
前記信号推定値は、前記第１のフレームと関連付けられるエネルギーを示すエネルギー情報に基づく、請求項２１に記載の装置。
前記第１のエンコーダに結合された第１のバッファをさらに備え、
前記第１のフレームと関連付けられる前記エネルギーは、前記第１のバッファと関連付けられる第１のエネルギーに基づいて決定され、前記第１のフレームと関連付けられる前記エネルギーは、前記第１のバッファのハイバンド部分と関連付けられる第２のエネルギーに基づいて決定される、請求項２４に記載の装置。
前記符号化オーディオ信号を変調するように構成された変調器をさらに備える、請求項２１に記載の装置。
前記アンテナ、前記送信機、および前記変調器は、モバイル通信デバイスに統合される、請求項２６に記載の装置。
前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、
前記信号推定値は、前記第１のフレームの第１のフレームタイプ、前記第２のフレームの第２のフレームタイプ、またはそれら両方に少なくとも部分的に基づき、
前記第１のフレームタイプは、有声フレームタイプ、無声フレームタイプ、過渡フレームタイプ、または一般フレームタイプを備え、
前記第２のフレームタイプは、前記有声フレームタイプ、前記無声フレームタイプ、前記過渡フレームタイプ、または前記一般フレームタイプを備える、請求項２１に記載の装置。
前記第１のフレームの前記第１の部分は、持続時間において約５ミリ秒であり、前記第２のフレームは、持続時間において約２０ミリ秒である、請求項２１に記載の装置。
前記信号推定値は、前記第１のフレームの局所的に復号されたローバンド部分、前記第１のフレームの局所的に復号されたハイバンド部分、またはそれら両方と関連付けられるエネルギーに基づく、請求項２１に記載の装置。
オーディオ信号を復号するための装置であって、前記装置は、
第１のエンコーダにおける第１の領域分析を介して符号化される前記オーディオ信号の第２のフレームに対応する第２のビットの、および、第２のエンコーダにおける第２の領域分析を介して符号化される前記オーディオ信号の第１のフレームに対応する第１のビットの、ビットストリームを受信するように構成された受信機と、前記第１のフレームは、ベースバンド信号を表す第１のデータと前記第１のフレームのハイバンド部分を表す第２のデータとを処理することによって符号化され、ここで、前記ベースバンド信号は、第３のフレームのハイバンド推定値、または前記第３のフレームの少なくとも一部分の合成バージョンに基づいて前記第１のエンコーダによって生成され、
前記第２のビットに基づく前記第２のフレームの符号化バージョンの復号の間に、前記第２のフレームの一部分に対応する重複データを使用して平滑化動作を適用するように構成された第１のデコーダと、
前記第１のフレームの符号化バージョンを復号することと、前記重複データを生成することとを行うように構成された第２のデコーダと、
を備える、装置。
前記受信機に結合されたアンテナをさらに備え、前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記平滑化動作は、クロスフェード動作を含み、前記アンテナ、前記受信機、前記第１のデコーダ、および前記第２のデコーダは、モバイル通信デバイスに統合される、請求項３１に記載の装置。
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
第１のエンコーダにおける第１の領域分析を使用して、オーディオ信号の第１のフレームを符号化することと、
前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または、前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
第２のエンコーダにおける第２の領域分析を使用して、前記オーディオ信号の第２のフレームを符号化することと、ここで、前記第２のフレームを符号化することは、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第１のデータと前記第２のフレームのハイバンド部分を表す第２のデータとを処理することを含む、
を備える、オーディオ信号を符号化するための動作を実行させる、コンピュータ可読記憶デバイス。
前記第１のエンコーダは、変換ベースのエンコーダを備え、前記第２のエンコーダは、線形予測（ＬＰ）ベースのエンコーダを備える、請求項３３に記載のコンピュータ可読記憶デバイス。
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、
前記動作は、前記第１のデータに少なくとも部分的に基づいて、前記第２のエンコーダのターゲット信号バッファの第１の部分にポピュレートすることと、前記第２のデータに少なくとも部分的に基づいて、前記ターゲット信号バッファの第２の部分にポピュレートすることとをさらに備える、
請求項３３に記載のコンピュータ可読記憶デバイス。
前記ベースバンド信号は、前記第１のエンコーダのローカルデコーダを使用して生成される、請求項３３に記載のコンピュータ可読記憶デバイス。
オーディオ信号を符号化するための装置であって、前記装置は、
第１の領域分析に基づいて、オーディオ信号の第１のフレームを符号化するための第１の手段と、符号化するための前記第１の手段は、前記第１のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成するように構成され、
第２の領域分析に基づいて、前記オーディオ信号の第２のフレームを、前記第２のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第１のデータと前記第２のフレームのハイバンド部分を表す第２のデータとを処理することに基づいて、符号化するための第２の手段と、
前記オーディオ信号と関連付けられる符号化オーディオ信号を送信するための手段と、
を備える、装置。
前記第１の領域分析と前記第２の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、
符号化するための前記第１の手段、符号化するための前記第２の手段、および送信するための前記手段は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、またはエンコーダシステムのうちの少なくとも１つに統合される、請求項３７に記載の装置。
符号化するための前記第１の手段は、フリップ動作とデシメーション動作とを実行することによって前記ベースバンド信号を生成するようにさらに構成され、符号化するための前記第２の手段は、ターゲット信号バッファに前記第１のデータおよび前記第２のデータを記憶するようにさらに構成される、請求項３７に記載の装置。
符号化するための前記第１の手段は、ローカルデコーダを使用して前記ベースバンド信号を生成するようにさらに構成される、請求項３７に記載の装置。