JP2012505429A - エネルギ保存型マルチチャネルオーディオ符号化 - Google Patents
エネルギ保存型マルチチャネルオーディオ符号化 Download PDFInfo
- Publication number
- JP2012505429A JP2012505429A JP2011530989A JP2011530989A JP2012505429A JP 2012505429 A JP2012505429 A JP 2012505429A JP 2011530989 A JP2011530989 A JP 2011530989A JP 2011530989 A JP2011530989 A JP 2011530989A JP 2012505429 A JP2012505429 A JP 2012505429A
- Authority
- JP
- Japan
- Prior art keywords
- energy
- channel
- audio
- representation
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 219
- 230000008569 process Effects 0.000 claims abstract description 130
- 230000015572 biosynthetic process Effects 0.000 claims description 56
- 238000003786 synthesis reaction Methods 0.000 claims description 56
- 230000005236 sound signal Effects 0.000 claims description 41
- 238000012937 correction Methods 0.000 claims description 20
- 238000009795 derivation Methods 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 18
- 238000013459 approach Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 239000002131 composite material Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011965 cell line development Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
(非会話型ストリーミング/ダウンロード)
一般に、現在のオーディオ研究の傾向は低ビットレートでの圧縮効率を向上することである(32kbps未満のビットレートで十分に高いステレオ品質を提供することである)。最近の低ビットレートオーディオの改良点は、MPEGにおけるパラメトリックステレオ(PS)ツール開発の完成と、3GPPにおけるMixed CELP及び変換コーデックExtended AMR-WB(別名AMR-WB+)の標準化である。Spatial Audio Coding(サラウンド/5.1コンテンツ)の周辺でも進行中のMPEG標準化活動があり、第一の参照モデル(RM0)が選択されている(非特許文献4)。
(概要)
一般の音声圧縮における最新の標準化活動は、8.55kbpsの最大レートでの動作もサポートするような3GPP2/VMR−WBコーデックの拡張である。ITU−TではマルチレートG.722.1オーディオ/ビデオ会議コーデックが、24、32、48kbpsで動作する超広帯域(14kHzオーディオ帯域幅、32kHzサンプリング)での能力を提供する2つの新しいモードで以前、更新されている。更なる標準化活動は、帯域幅を48kHzのフルバンド符号化に拡張する付加モードを追加することを目的としていた。最終結果は新しいスタンドアロン・コーデックG.719であり、これは16kbpsのステップで32〜128kbpsの低演算量のフルバンド符号化を提供する。
SNRスケーラビリティの原理は、ビットやレイヤの数が増すほどSNRが向上するというものである。上述の2つの音声コーデックG.729.1及びG.718はこの特徴を有する。一般に、これは先行するレイヤからの符号化残差を段階的に再符号化することで達成される。上位階層を単に破棄するだけでより低いビットレートを復号化できるため、エンベデッド階層化構造は魅力的である。しかし、より高いビットレートを考えるとエンベデッド階層化は最適ではなく、ビットレートが同じであれば階層コーデックは通常、固定ビットレートコーデックより劣る。ここで言及可能な他のコーデックとしてはSNRスケーラブルMPEG4−CELP及びG.727(エンベデッドADPCM)がある。
G.722(サブバンドADPCM)やG.729.1及びG.718等のビット量の増加に伴い帯域幅を増加できるコーデックもある。G.729.1は8及び12kpbsのビットレートでカスケード型CELPコーデックと共に動作するが、4kHz〜7kHzの範囲をカバーするために帯域幅拡張を使用して14kbpsでWB信号を提供する。帯域幅拡張では一般に、スペクトル折り返し又は他のマッピングでより低い帯域から励起信号を作成し、それは更にゲイン調整され、スペクトル包路で整形され、より高品質の周波数スペクトルをシミュレートする。このソリューションは良さそうに思われるが、拡張スペクトルはMSEの意味では入力信号と通常一致しない。SNRスケーラブルなコーデックについては、より低いレートで使用された帯域幅拡張はより高いレイヤの符号化コンンテンツと通常置換される。これは、スペクトルがサブバンドベースで符号化コンンテンツと徐々に置換されるG.729.1の場合である。G.718は同じ特徴を示し、8、12及び16kbpsのレートで6.4kHz〜7.0kHzの帯域幅拡張を使用する。24及び32kbpsのレートについては、帯域幅拡張は無効になり符号化スペクトルと置換される。SNR−スケーラブルであることに加え、MPEG4−CELPは8及び16kHzのサンプリング済み入力信号に対する帯域幅スケーラブル符号化システムを特定する。
基本的にオーディオスケーラビリティは以下のように達成できる。
・信号の量子化の変更、すなわちSNRライクなスケーラビリティ。
・信号の帯域幅の拡張又は縮小。
・オーディオチャネルの削減(例えば、1チャネルのモノラル、2チャネルのステレオ、5チャネルのサラウンド)−(空間スケーラビリティ)。
マルチチャネル(すなわち、少なくとも2つの入力チャネル)符号化及び復号化を使用するオーディオ送信システムの一般例を図2に概略的に示す。システム全体は送信側のマルチチャネルオーディオエンコーダ100及び送信モジュール10と、受信側の受信モジュール20及びマルチチャネルオーディオデコーダ200とを基本的に具備する。
ダウンミキシングの標準的な方法は以下のように信号を単純に加算することである。
ステレオ信号の2つのチャネルは非常に似ていることが多く、ステレオ符号化で予測技術を適用することは有用である。復号化モノラルチャネル^Mはデコーダでも利用可能なため、予測の目的は送信された量子化ステレオパラメータ^Ψと共にこの信号から左右チャネル対を再構成することである。
予測ステレオチャネルと入力チャネルとの間の差は、予測残差を形成する。
本発明はオーディオコーデックの最新技術を綿密に分析し、そのようなコーデックの機能と性能とに関していくつかの有益な洞察を得た。マルチチャネルマルチステージエンコーダにおいて、信号は符号化ステージに対応する異なる成分から通常構成される。制限されたビットレート、変化する空間特性、更に送信条件によって、復号化成分の品質は時間と共に変動する可能性がある。資源が不足して信号を表現できなくなると、エネルギ損失を観察することになり、ステレオ画像が時間と共に変動すると不安定になる。
エネルギ表現:
・チャネルエネルギレベル差を決定し、
・チャネルエネルギレベル和を決定し、
・第1の符号化処理に関連してチャネルエネルギレベル和と局所合成からの局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定する。
エネルギ符号化:
・チャネルエネルギレベル差を量子化し、
・デルタエネルギ測度を量子化する。
チャネル予測:
・非量子化チャネル予測パラメータに基づく。
エネルギ表現:
・チャネルエネルギレベル差を決定し、
・チャネルエネルギレベル和を決定し、
・第1の符号化処理に関連してチャネルエネルギレベル和と局所合成からの局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定し、
・デルタエネルギ測度と局所復号化ダウンミックス信号のエネルギにより正規化された予測チャネルのエネルギとに基づき正規化エネルギ補償パラメータを決定する。
エネルギ符号化:
・チャネルエネルギレベル差を量子化し、
・正規化エネルギ補償パラメータを量子化する。
チャネル予測:
・量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータに基づく。
エネルギ表現:
・チャネルエネルギレベル差を決定し、
・エネルギ正規化入力チャネル相互相関パラメータを決定する。
エネルギ符号化:
・チャネルエネルギレベル差を量子化し、
・エネルギ正規化入力チャネル相互相関パラメータを量子化する。
チャネル予測:
・量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータと量子化エネルギ正規化入力チャネル相互相関パラメータとに基づく。
エネルギ表現の導出:
・チャネルエネルギレベル差とデルタエネルギ測度とを受信ビットストリームの第2の部分から導出する。
入力チャネルエネルギの推定:
・復号化ダウンミックス信号の推定エネルギとチャネルエネルギレベル差とデルタエネルギ測度とに基づく。
チャネル予測パラメータの推定:
・推定入力チャネルエネルギと復号化ダウンミックス信号の推定エネルギと残差誤差信号の推定エネルギとに基づく。
エネルギ表現の導出:
・チャネルエネルギレベル差と正規化エネルギ補償パラメータとを受信ビットストリームの第2の部分から導出する。
入力チャネルエネルギの推定:
・復号化ダウンミックス信号の推定エネルギとチャネルエネルギレベル差と正規化エネルギ補償パラメータとに基づく。
チャネル予測パラメータの推定:
・チャネルエネルギレベル差に基づく。
予測チャネルの合成:
・復号化ダウンミックス信号と推定チャネル予測パラメータとに基づく。
結合:
・残差誤差信号と合成予測チャネルとを結合して結合マルチチャネル合成にする。
チャネルエネルギ補償(結合後):
・結合マルチチャネル合成のエネルギを推定し、
・推定入力チャネルエネルギと結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定し、
・エネルギ補正係数を結合マルチチャネル合成に適用してマルチチャネルオーディオ信号を生成する。
エネルギ表現の導出:
・チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとを受信ビットストリームの第2の部分から導出する。
入力チャネルエネルギの推定:
・復号化ダウンミックス信号の推定エネルギとチャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとに基づく。
チャネル予測パラメータの推定:
・チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとに基づく。
予測チャネルの合成:
・復号化ダウンミックス信号と推定チャネル予測パラメータとに基づく。
結合:
・残差誤差信号と合成予測チャネルとを結合して結合マルチチャネル合成にする。
チャネルエネルギ補償(結合後):
・結合マルチチャネル合成のエネルギを推定し、
・推定入力チャネルエネルギと結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定し、
・エネルギ補正係数を結合マルチチャネル合成に適用してマルチチャネルオーディオ信号を生成する。
本例においてエネルギ表現生成器144は、チャネルエネルギレベル差を決定する決定部と、チャネルエネルギレベル和を決定する決定部と、第1の符号化処理に関連してチャネルエネルギレベル和と局所合成からの局所復号化ダウンミックス信号のエネルギとに基づき所謂デルタエネルギ測度を決定する決定部とを含む。エネルギ表現エンコーダ146は、チャネルエネルギレベル差を量子化する量子化器と、デルタエネルギ測度を量子化する量子化器とを含む。
本例においてエネルギ表現生成器144は、チャネルエネルギレベル差を決定する決定部と、チャネルエネルギレベル和を決定する決定部と、第1の符号化処理に関連してチャネルエネルギレベル和と局所合成からの局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定する決定部と、デルタエネルギ測度と局所復号化ダウンミックス信号のエネルギにより正規化された予測チャネルのエネルギとに基づき所謂正規化エネルギ補償パラメータを決定する決定部とを含む。エネルギ表現エンコーダ146は、チャネルエネルギレベル差を量子化する量子化器と、正規化エネルギ補償パラメータを量子化する量子化器とを含む。
本例においてエネルギ表現生成器144は、チャネルエネルギレベル差を決定する決定部と、エネルギ正規化入力チャネル相互相関パラメータを決定する決定部とを含む。エネルギ表現エンコーダ146は、チャネルエネルギレベル差を量子化する量子化器と、エネルギ正規化入力チャネル相互相関パラメータを量子化する量子化器とを含む。
本例において導出器241は、チャネルエネルギレベル差とデルタエネルギ測度とを受信ビットストリームの第2の部分から導出するように構成される。入力チャネルエネルギを推定する推定器242は、復号化ダウンミックス信号の推定エネルギと、チャネルエネルギレベル差と、デルタエネルギ測度とに基づき入力チャネルエネルギを推定するように構成される。チャネル予測パラメータを推定する推定器は、推定入力チャネルエネルギと、復号化ダウンミックス信号の推定エネルギと、残差誤差信号の推定エネルギとに基づきチャネル予測パラメータを推定するように構成されるのが好ましい。
本例において導出器241は、チャネルエネルギレベル差と正規化エネルギ補償パラメータとを前記受信ビットストリームの第2の部分から導出するように構成される。入力チャネルエネルギを推定する推定器242は、復号化ダウンミックス信号の推定エネルギと、チャネルエネルギレベル差と、正規化エネルギ補償パラメータとに基づき入力チャネルエネルギを推定するように構成される。チャネル予測パラメータを推定する推定器は、チャネルエネルギレベル差に基づきチャネル予測パラメータを推定するように構成され、予測チャネルを合成する合成器は、復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成するように構成される。本例において、結合及びチャネルエネルギ補償を行う手段270は、残差誤差信号と合成予測チャネルとを結合して結合マルチチャネル合成にする結合器と、チャネルエネルギ補償器とを含む。チャネルエネルギ補償器は、結合マルチチャネル合成のエネルギを推定する推定器と、推定入力チャネルエネルギと結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定する決定器と、エネルギ補正係数を結合マルチチャネル合成に適用してマルチチャネルオーディオ信号を生成するエネルギ補正器とを含む。
本例において導出器241は、チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとを受信ビットストリームの第2の部分から導出するように構成される。入力チャネルエネルギを推定する推定器242は、復号化ダウンミックス信号の推定エネルギと、チャネルエネルギレベル差と、エネルギ正規化入力チャネル相互相関パラメータとに基づき入力チャネルエネルギを推定するように構成される。チャネル予測パラメータを推定する推定器は、チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとに基づきチャネル予測パラメータを推定するように構成されるのが好ましい。予測チャネルを合成する合成器は、復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成するように構成される。本例において、結合及びチャネルエネルギ補償を行う手段270は、残差誤差信号と合成予測チャネルとを結合して結合マルチチャネル合成にする結合器と、チャネルエネルギ補償器とを含む。本例においてチャネルエネルギ補償器は、結合マルチチャネル合成のエネルギを推定する推定器と、推定入力チャネルエネルギと結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定する決定器と、エネルギ補正係数を結合マルチチャネル合成に適用してマルチチャネルオーディオ信号を生成するエネルギ補正器とを含む。
・損失エネルギはデコーダで回復されることが既知であるため、信号成分がエンコーダで故意に減衰される。そのような減衰は、例えば知覚重要性に基づいてもよい。
・信号の一部を表現するエンコーダ全体に対する制限があるため、信号の一部が失われる可能性がある。例えばビットレートやモデル化能力の制限のため、信号の一部がエンコーダ全体の範囲外になるかもしれない。一般的な観点から見ると、個別のエンコーダ及び関連したデコーダの処理の各々は、真の入力信号が投影される部分空間を表現している。最終残差又は符号化誤差は、エンコーダ及びデコーダ全体を表現する部分空間の合体に直交している。最終残差はこれらの部分空間では表現できないが、入力エネルギと受信部分空間成分のエネルギとが分かるか又は少なくとも推定できればそのエネルギは推定し補償できる。
本非限定例において、エンコーダ及びデコーダはステレオ入力及び出力信号でそれぞれ動作する。本実施形態の概要を図9Aに示す。図9Aのエンコーダは、ステレオ入力信号からモノラル信号を作成するダウンミキサと、ダウンミックス信号を符号化して局所復号化ダウンミックス合成を生成するモノラルエンコーダとを基本的に含む。更にエンコーダは、局所復号化ダウンミックス信号を使用して入力ステレオチャネルの第1の表現を作成し、また入力チャネルエネルギを推定し、エネルギ表現を作成し、デコーダで使用されるこの表現を符号化するパラメトリックステレオエンコーダを含む。エンコーダは、残差エンコーダで符号化されるステレオ予測残差も作成する。図9Aのデコーダは、エンコーダの局所復号化ダウンミックス信号に対応する復号化ダウンミックス信号を作成するモノラルデコーダを含む。デコーダは、符号化ステレオ予測残差を復号化する残差デコーダも含む。最後に、デコーダはエネルギ測定部とパラメトリックステレオデコーダとを含む。
エネルギ符号化のために、まず入力チャネルエネルギを定義する。
のエネルギと強い相関を示す。復号化ダウンミックス信号はステレオデコーダで利用可能なため、この信号に対して以下のようにデルタエネルギ測度を形成する。
更に、図6に例示するように、SとDは従属変数である。Dの値が大きいほどSの分布は狭くなり、異なるコードブックをCLDに応じて選択してもよい。CLDの極値に対してCLSは1つのチャネルに支配され、ゼロビットを使用した定数に設定できる。例えば、
と仮定すると、
となる。大きいCLDに対してCLSは4の値に収束し、これは図6で観察できる6dBレベルに対応する。6dB値からの偏差はモノラルダウンミックス信号における符号化雑音によるものである。左側のチャネルエネルギは、ダウンミックス係数が1/2であるためモノラルエネルギよりも低い単なる6dBである。この依存性を利用してCLSを量子化CLDに応じて異なる分解能で符号化する。CLSはエネルギ関係を表すため、このパラメータを対数領域で量子化する。
エンコーダで使用されるチャネル予測パラメータw'b(m)は量子化せず、これにより予測残差が最小であることを保証する。予測パラメータの量子化からの誤差は予測残差に転送されない。
第2の非限定例において、エンコーダ及びデコーダはステレオ信号で動作する。本実施形態の概要を図9Bに示し、ここで図9Bのエンコーダは、ステレオ入力信号からモノラル信号を作成するダウンミキサと、ダウンミックス信号を符号化して局所復号化ダウンミックス合成を生成するモノラルエンコーダとを基本的に含む。更にエンコーダは、局所復号化ダウンミックス信号を使用して入力ステレオチャネルの第1の表現を作成し、また入力チャネルエネルギを推定し、エネルギ表現を作成し、デコーダで使用されるこの表現を符号化するパラメトリックステレオエンコーダを含む。エンコーダは、残差エンコーダで符号化されるステレオ予測残差も作成する。図9Bのデコーダは、エンコーダの局所復号化ダウンミックス信号に対応する復号化ダウンミックス信号を作成するモノラルデコーダを含む。デコーダは、符号化ステレオ予測残差を復号化する残差デコーダも含む。更にデコーダは、パラメトリックステレオデコーダと、結合信号合成で動作するエネルギ測定部と、結合ステレオ合成を修正して最終ステレオ合成を作成するエネルギ補正部とを含む。図10のフローチャートはデコーダ動作のステップを記述する。ステップS41においてモノラル復号化を行い、その後ステップS42においてパラメトリックステレオ合成を行い、ステップS43においてステレオ残差復号化を行う。ステップS44において残差及びパラメトリックステレオ合成を連結し、ステップS45において結合合成エネルギを測定する。最後に、ステップS46は結合合成のエネルギ調整を含む。実施形態Bのエネルギ符号化及び復号化とチャネル予測とを更に詳細に説明する。
エネルギを符号化するオプションの戦略が導出できる。CLDのDb(m)は上述のように導出する。次に、CLDはチャネル予測係数の関係を与える残差符号化せずに予測ステレオ寄与率に保存すべきであると仮定する。
は、モノラルエネルギで正規化された予測チャネルのエネルギ和に等しい。この結果、このエネルギ表現は第1の表現と同等であり、CLSパラメータΔSb(m)及びCb 2(m)の正規化という点のみが異なる。CLDは実施形態Aのように符号化される。正規化エネルギ補償パラメータとも呼ばれるエネルギ補償パラメータCb 2(m)は、ΔSb(m)のように対数領域でも量子化されるが、スケーリングの違いにより異なるコードブック(実際には異なる対数値オフセット)を使用する。
別の方式ではエンコーダで使用されるチャネル予測係数は量子化CLDから以下のように導出される。
残差符号化がないと仮定して
を導出したので、残差符号化エネルギがデコーダで存在した場合にそれを補償しなければならない。まず、非拡縮ステレオ合成を以下のように行う。
第3の非限定例もステレオエンコーダ及びデコーダの実施形態である。本実施形態の概要を図9Cに示し、ここで図9Cのエンコーダは、ステレオ入力信号からモノラル信号を作成するダウンミキサと、ダウンミックス信号を符号化して局所復号化ダウンミックス合成を生成するモノラルエンコーダとを基本的に含む。更にエンコーダは、局所復号化ダウンミックス信号を使用して入力ステレオチャネルの第1の表現を作成し、また入力チャネルエネルギを推定し、エネルギ表現を作成し、デコーダで使用されるこの表現を符号化するパラメトリックステレオエンコーダを含む。エンコーダは、残差エンコーダで符号化されるステレオ予測残差も作成する。図9Cのデコーダは、エンコーダの局所復号化ダウンミックス信号に対応する復号化ダウンミックス信号を作成するモノラルデコーダを含む。デコーダは、符号化ステレオ予測残差を復号化する残差デコーダも含む。更にデコーダは、パラメトリックステレオデコーダと、結合ステレオ合成で動作するエネルギ測定部と、結合ステレオ合成を修正して最終ステレオ合成を作成するエネルギ補正部とを含む。概要の観点から実施形態Cのデコーダ動作は実施形態Bのデコーダと同様であり、図10は2つの例のデコーダのステップを正確に記述する。実施形態Cのエネルギ符号化及び復号化とチャネル予測とを更に詳細に説明する。
式(12)及び式(13)よりチャネル予測係数は正規化相互相関という1つの項を共有するが、これはエネルギ正規化入力チャネル相互相関とも呼ばれ、以下のようにρと定義される。
を満たさないならば式(33)で与えられる値で検索を開始しインクリメンタルサーチを行えることを意味する。モノラル符号化でエネルギ損失があるならば、
を最小にするより小さなρを検索したいかもしれないが、これはチャネル予測パラメータに悪影響がある。変動するρを使用したチャネル予測への効果は更に後述する。
ρとDとを使用して、MMSE最適チャネル予測係数は以下のように表現できる。
実施形態Bのように予測符号化成分と残差符号化成分とを連結した後、出力チャネルエネルギが補正される。異なるパラメータがチャネル予測とエネルギ推定とで使用されるという点を除き、図10のデコーダフローチャートの記述全体は実施形態Cにも有効である。実施形態Cでは上述のように図9Cのブロック図を参照する。
上述の例示的な実施形態A、B、Cでは、合成ステレオ音声でCLDを表現する際に同一の正確さを付与していた。また残差符号化がない場合、これらの実施形態では同等の挙動となり、この場合デフォルトのインテンシティ・ステレオアルゴリズムになる。主な相違はチャネル予測パラメータがエンコーダで使用され、これらがデコーダでどのように導出されるかである。好適な実施形態は、種々のパラメータ、例えば利用可能なビットレートや符号化及び空間情報に対する入力信号の複雑さ等に応じて異なる。
一例として、例示的な方法Bをテストした。比較の基準としては、2.2kHz〜7.0kHzの範囲でCLDベースのチャネル予測(インテンシティステレオ)を使用した。2.2kHz未満に適用される方法についてはテストした候補に対しては同一であった。図12は票決のヒストグラムを示し、本発明に対する好みを表している。
であるとする。エンコーダは、qチャネルのダウンミックス信号
を作成する。ただし、p>qである。ダウンミックスの特性は、原マルチチャネル信号のチャネルとチャネルエネルギ及びチャネル予測係数の表現を効率化するのに利用できるダウンミックス信号のチャネルとの間の依存性を生成できる。そのようなマルチチャネルダウンミックスは、従来技術である非特許文献5に見られるようにマルチステージで行うことができる。対毎のチャネル結合が行われたならば、ステレオ実施形態からの原理を適用することができる。ダウンミックス信号はqチャネルで動作する第1ステージのエンコーダに送られ、局所復号化ダウンミックス信号
がこの処理から抽出される。この信号はマルチチャネル予測又はアップミックスステップで使用され、入力マルチチャネル信号に対する第1の近似
を作成する。この近似は原入力信号から減算されて、マルチチャネル予測残差又はパラメトリック残差を形成する。この残差は第2の符号化ステージに送られる。必要に応じて局所復号化残差信号を抽出して原残差信号から減算し、第2ステージの残差信号を作成できる。この符号化処理を繰り返し、原入力信号へ収束する更なる改良を提供するか又は信号の異なる特性を捕捉することができる。符号化予測、エネルギ及び残差パラメータはデコーダで使用されるように送信されるか又は記憶される。符号化処理の一例の概要を図13に示す。
AAC (Advanced Audio Coding):アドバンストオーディオ符号化
AAC-BSAC (Advanced Audio Coding - Bit-Sliced Arithmetic Coding):アドバンストオーディオ符号化−ビットスライス算術符号化
AMR (Adaptive Multi-Rate):適応マルチレート
AMR-WB (Adaptive Multi-Rate Wide Band):適応マルチレート広帯域
AOT (Audio Object Type):オーディオ・オブジェクトタイプ
BCC (Binaural cue coding):バイノーラルキュー符号化(非特許文献2)
BMLD (Binaural masking level difference):両耳マスキングレベル差
CELP (Code Excited Linear Prediction):符号励振線形予測
CfI (Call for Information):コールフォーインフォメーション
CLD (Channel level difference):チャネルレベル差
CLS (Channel level sum):チャネルレベル和
EV (Embedded VBR (Variable Bit Rate)):エンベデッドVBR(可変ビットレート)
ICC (Inter-channel correlation):チャネル間相関
ICP (Inter-channel prediction):チャネル間予測
ITU (International Telecommunication Union):国際電気通信連合
LSB (Least Significant Bit):最下位ビット
MDCT (Modified discrete cosine transform):変形離散コサイン変換
MDST (Modified discrete sinusoid transform):変形離散サイン変換
MMSE (Minimum mean squared error):最小平均二乗誤差
MPEG (Moving Picture Experts Group):動画像圧縮方式の標準化作業グループ
MPEG-SLS (MPEG-Scalable to Lossless):MPEG−スケーラブルロスレス
MSB (Most Significant Bit):最上位ビット
MSE (Mean Squared Error):平均二乗誤差
NB (Narrow Band (8 kHz samplerate)):狭帯域(8kHzサンプリングレート)
SNR (Signal-to-noise ratio):信号対雑音比
SWB (Super Wide Band (32 kHz samplerate)):超広帯域(32kHzサンプリングレート)
PS (Parametric Stereo):パラメトリックステレオ
VMR-WB (Variable Multi Rate-Wide Band):可変マルチレート広帯域
VoIP (Voice over Internet Protocol):ボイスオーバーインターネットプロトコル
WB (Wide Band (16 kHz samplerate)):広帯域(16kHzサンプリングレート)
xDSL (x Digital Subscriber Line):xデジタル加入者回線
Claims (50)
- 少なくとも2つのチャネルを有するマルチチャネルオーディオ信号のオーディオ入力チャネル群の信号表現に作用する符号化手順全体に基づくオーディオ符号化方法であって、
前記オーディオ入力チャネル群のダウンミックス信号を含む第1の信号表現を符号化するための第1の符号化処理を行うステップ(S1)と、
前記第1の符号化処理に関連して局所合成が行われ、前記第1の符号化処理の符号化誤差の表現を含む局所復号化ダウンミックス信号を生成するステップ(S2)と、
少なくとも前記局所復号化ダウンミックス信号を入力として使用し、前記オーディオ入力チャネル群の第2の表現を符号化するための第2の符号化処理を行うステップ(S3)と、
前記オーディオ入力チャネル群の入力チャネルエネルギを推定するステップ(S4)と、
前記オーディオ入力チャネル群の推定入力チャネルエネルギに基づいて、前記オーディオ入力チャネル群の少なくとも1つのエネルギ表現を生成するステップ(S5)と、
前記少なくとも1つのエネルギ表現を符号化するステップ(S6)と、
少なくとも前記第2の符号化処理を含む前記複数の符号化処理の少なくとも1つから残差誤差信号を生成するステップ(S7)と、
第3の符号化処理において前記残差誤差信号の残差符号化を行うステップ(S8)と、
を有することを特徴とするオーディオ符号化方法。 - 前記少なくとも1つのエネルギ表現により、復号化側の出力チャネルのエネルギと前記推定入力チャネルエネルギとの整合が可能であることを特徴とする請求項1に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現により、エネルギ及び品質の双方の点で、出力チャネルと入力チャネルとの整合が可能であることを特徴とする請求項2に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現を生成するステップ(S5)及び前記少なくとも1つのエネルギ表現を符号化するステップ(S6)は、前記第2の符号化処理において実行されることを特徴とする請求項1に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現を生成するステップ(S5)及び前記少なくとも1つのエネルギ表現を符号化するステップ(S6)は、少なくとも1つの周波数帯域における複数フレームの各々に対して実行されることを特徴とする請求項4に記載のオーディオ符号化方法。
- 前記第1の符号化処理は、ダウンミックス符号化処理であり、
前記第2の符号化処理は、少なくとも1つの予測チャネルを生成するチャネル予測に基づくものであり、
前記残差誤差信号を生成するステップ(S7)は、残差予測誤差信号を生成するステップを含む
ことを特徴とする請求項1に記載のオーディオ符号化方法。 - 前記推定入力チャネルエネルギ及び前記チャネル予測の予測パラメータは、前記第2の符号化処理において、一緒に表現され符号化されることを特徴とする請求項6に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現を生成するステップ(S5)は、
チャネルエネルギレベル差を決定するステップと、
チャネルエネルギレベル和を決定するステップと、
前記第1の符号化処理に関連して前記チャネルエネルギレベル和と前記局所合成からの前記局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定するステップと、
を含み、
前記少なくとも1つのエネルギ表現を符号化するステップ(S6)は、
前記チャネルエネルギレベル差を量子化するステップと、
前記デルタエネルギ測度を量子化するステップと、
を含むことを特徴とする請求項6に記載のオーディオ符号化方法。 - 前記チャネル予測は、非量子化チャネル予測パラメータに基づくものであることを特徴とする請求項8に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現を生成するステップ(S5)は、
チャネルエネルギレベル差を決定するステップと、
チャネルエネルギレベル和を決定するステップと、
前記第1の符号化処理に関連して前記チャネルエネルギレベル和と前記局所合成からの前記局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定するステップと、
前記デルタエネルギ測度と前記局所復号化ダウンミックス信号のエネルギにより正規化された前記予測チャネルのエネルギとに基づき正規化エネルギ補償パラメータを決定するステップと、
を含み、
前記少なくとも1つのエネルギ表現を符号化するステップ(S6)は、
前記チャネルエネルギレベル差を量子化するステップと、
前記正規化エネルギ補償パラメータを量子化するステップと、
を含むことを特徴とする請求項6に記載のオーディオ符号化方法。 - 前記チャネル予測は、量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータに基づくものであることを特徴とする請求項10に記載のオーディオ符号化方法。
- 前記少なくとも1つのエネルギ表現を生成するステップ(S5)は、
チャネルエネルギレベル差を決定するステップと、
エネルギ正規化入力チャネル相互相関パラメータを決定するステップと、
を含み、
前記少なくとも1つのエネルギ表現を符号化するステップ(S6)は、
前記チャネルエネルギレベル差を量子化するステップと、
前記エネルギ正規化入力チャネル相互相関パラメータを量子化するステップと、
を含むことを特徴とする請求項6に記載のオーディオ符号化方法。 - 前記チャネル予測は、量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータと量子化エネルギ正規化入力チャネル相互相関パラメータとに基づくものであることを特徴とする請求項12に記載のオーディオ符号化方法。
- 少なくとも2つのチャネルを有するマルチチャネルオーディオ信号のオーディオ入力チャネル群の信号表現に作用するオーディオ符号化装置(100)であって、
第1の符号化処理において前記オーディオ入力チャネル群のダウンミックス信号を含む第1の表現を符号化する第1のエンコーダ(130)と、
前記第1の符号化処理に関連して局所合成を行い、前記第1の符号化処理の符号化誤差の表現を含む局所復号化ダウンミックス信号を生成する局所合成器(132)と、
少なくとも前記局所復号化ダウンミックス信号を入力として使用し、第2の符号化処理において前記オーディオ入力チャネル群の第2の表現を符号化する第2のエンコーダ(140)と、
前記オーディオ入力チャネル群の入力チャネルエネルギを推定するエネルギ推定器(142)と、
前記オーディオ入力チャネル群の推定入力チャネルエネルギに基づいて、前記オーディオ入力チャネル群の少なくとも1つのエネルギ表現を生成するエネルギ表現生成器(144)と、
前記少なくとも1つのエネルギ表現を符号化するエネルギ表現エンコーダ(146)と、
少なくとも前記第2の符号化処理を含む前記複数の符号化処理の少なくとも1つから残差誤差信号を生成する残差生成器(155)と、
第3の符号化処理において前記残差誤差信号の残差符号化を行う残差エンコーダ(160)と、
を有することを特徴とするオーディオ符号化装置。 - 前記エネルギ表現生成器(144)は、復号化側の出力チャネルのエネルギと推定入力チャネルエネルギとの整合が可能となるように、少なくとも1つのエネルギ表現を生成することを特徴とする請求項14に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)は、エネルギ及び品質の双方の点で、出力チャネルと入力チャネルとの整合が可能となるように、少なくとも1つのエネルギ表現を生成することを特徴とする請求項15に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)及び前記エネルギ表現エンコーダ(146)は、前記第2のエンコーダ(140)において実現されることを特徴とする請求項14に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)及び前記エネルギ表現エンコーダ(146)は、少なくとも1つの周波数帯域における複数フレームの各々に対して、前記少なくとも1つのエネルギ表現を生成して符号化することを特徴とする請求項17に記載のオーディオ符号化装置。
- 前記第1のエンコーダ(130)は、ダウンミックスエンコーダであり、
前記第2のエンコーダ(140)は、少なくとも1つの予測チャネルを生成するチャネル予測に基づいて動作するパラメトリックエンコーダであり、
前記残差生成器(155)は、残差予測誤差信号を生成するように構成される
ことを特徴とする請求項14に記載のオーディオ符号化装置。 - 前記第2のエンコーダ(140)は、前記推定入力チャネルエネルギと前記チャネル予測の予測パラメータとを一緒に表現して符号化することを特徴とする請求項19に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)は、
チャネルエネルギレベル差を決定する決定器と、
チャネルエネルギレベル和を決定する決定器と、
前記第1の符号化処理に関連して前記チャネルエネルギレベル和と前記局所合成からの前記局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定する決定器と、
を含み、
前記エネルギ表現エンコーダ(146)は、
前記チャネルエネルギレベル差を量子化する量子化器と、
前記デルタエネルギ測度を量子化する量子化器と、
を含むことを特徴とする請求項19に記載のオーディオ符号化装置。 - 前記第2のエンコーダ(140)は、非量子化チャネル予測パラメータに基づくチャネル予測を行うことを特徴とする請求項21に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)は、
チャネルエネルギレベル差を決定する決定器と、
チャネルエネルギレベル和を決定する決定器と、
前記第1の符号化処理に関連して前記チャネルエネルギレベル和と前記局所合成からの前記局所復号化ダウンミックス信号のエネルギとに基づきデルタエネルギ測度を決定する決定器と、
前記デルタエネルギ測度と前記局所復号化ダウンミックス信号のエネルギにより正規化された前記予測チャネルのエネルギとに基づき正規化エネルギ補償パラメータを決定する決定器と、
を含み、
前記エネルギ表現エンコーダ(146)は、
前記チャネルエネルギレベル差を量子化する量子化器と、
前記正規化エネルギ補償パラメータを量子化する量子化器と、
を含むことを特徴とする請求項19に記載のオーディオ符号化装置。 - 前記第2のエンコーダ(140)は、量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータに基づくチャネル予測を行うことを特徴とする請求項23に記載のオーディオ符号化装置。
- 前記エネルギ表現生成器(144)は、
チャネルエネルギレベル差を決定する決定器と、
エネルギ正規化入力チャネル相互相関パラメータを決定する決定器と、
を含み、
前記エネルギ表現エンコーダ(146)は、
前記チャネルエネルギレベル差を量子化する量子化器と、
前記エネルギ正規化入力チャネル相互相関パラメータを量子化する量子化器と、
を含むことを特徴とする請求項19に記載のオーディオ符号化装置。 - 前記第2のエンコーダ(140)は、量子化チャネルエネルギレベル差から導出された量子化チャネル予測パラメータと量子化エネルギ正規化入力チャネル相互相関パラメータとに基づくチャネル予測を行うことを特徴とする請求項25に記載のオーディオ符号化装置。
- 少なくとも2つのチャネルを有するマルチチャネルオーディオ信号を再構成する受信ビットストリームに作用する復号化手順全体に基づくオーディオ復号化方法であって、
前記受信ビットストリームの第1の部分に基づき復号化ダウンミックス信号を含む少なくとも1つの第1の復号化チャネル表現を生成する第1の復号化処理を行うステップ(S11)と、
前記復号化ダウンミックス信号の推定エネルギとオーディオ入力チャネルの少なくとも1つのエネルギ表現を代表する前記受信ビットストリームの第2の部分とに基づき少なくとも1つの第2の復号化チャネル表現を生成する第2の復号化処理を行うステップ(S12)と、
前記復号化ダウンミックス信号の推定エネルギとオーディオ入力チャネルの少なくとも1つのエネルギ表現を代表する前記受信ビットストリームの前記第2の部分とに基づきオーディオ入力チャネルの入力チャネルエネルギを推定するステップ(S13)と、
残差誤差信号情報を代表する前記受信ビットストリームの第3の部分に基づき第3の復号化処理で残差復号化を行い、残差誤差信号を生成するステップ(S14)と、
前記残差誤差信号と少なくとも前記第2の復号化処理を含む前記第1の復号化処理及び前記第2の復号化処理の少なくとも1つからの復号化チャネル表現とを結合し、前記マルチチャネルオーディオ信号を生成するための推定入力チャネルエネルギに少なくとも部分的に基づきチャネルエネルギ補償を行うステップ(S15)と、
を有することを特徴とするオーディオ復号化方法。 - 前記チャネルエネルギ補償は、前記マルチチャネルオーディオ信号の出力チャネルのエネルギと前記推定入力チャネルエネルギとが整合するように行われることを特徴とする請求項27に記載のオーディオ復号化方法。
- エネルギ及び品質の双方の点で、前記マルチチャネルオーディオ信号の出力チャネルと符号化側の対応する入力チャネルとが整合し、これにより、低品質な信号よりも高品質な信号が高い割合で表現され出力チャネルの品質全体が向上することを特徴とする請求項28に記載のオーディオ復号化方法。
- 少なくとも1つの第2の復号化チャネル表現を生成する場合に、前記チャネルエネルギ補償は、前記第2の復号化処理に統合されることを特徴とする請求項27に記載のオーディオ復号化方法。
- 前記復号化ダウンミックス信号のエネルギと前記残差誤差信号のエネルギとが推定され、前記第2の復号化処理は、当該復号化ダウンミックス信号のエネルギと当該残差誤差信号のエネルギとに基づくものであることを特徴とする請求項30に記載のオーディオ復号化方法。
- 前記チャネルエネルギ補償は、前記残差誤差信号と前記復号化チャネル表現とを結合した後に実行されることを特徴とする請求項27に記載のオーディオ復号化方法。
- 前記残差誤差信号と前記第1の復号化処理及び前記第2の復号化処理の少なくとも1つからの復号化チャネル表現とが結合されてマルチチャネル合成になり、該マルチチャネル合成のエネルギが推定され、前記チャネルエネルギ補償は、該マルチチャネル合成の推定エネルギと推定入力チャネルエネルギとに基づいて実行されることを特徴とする請求項32に記載のオーディオ復号化方法。
- 前記少なくとも1つの第2の復号化チャネル表現を生成する第2の復号化処理を行うステップ(S12)は、予測チャネルを合成するステップを含み、
前記残差復号化を行うステップ(S14)は、残差予測誤差信号を生成するステップを含む
ことを特徴とする請求項27に記載のオーディオ復号化方法。 - 前記少なくとも1つの第2の復号化チャネル表現を生成する第2の復号化処理を行うステップ(S12)は、
前記オーディオ入力チャネルの少なくとも1つのエネルギ表現を前記受信ビットストリームの前記第2の部分から導出するステップと、
前記少なくとも1つのエネルギ表現に少なくとも部分的に基づきチャネル予測パラメータを推定するステップと、
復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成するステップと、
を含むことを特徴とする請求項34に記載のオーディオ復号化方法。 - 前記少なくとも1つのエネルギ表現を導出するステップは、チャネルエネルギレベル差とデルタエネルギ測度とを前記受信ビットストリームの前記第2の部分から導出するステップを含み、
前記入力チャネルエネルギを推定するステップは、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差とデルタエネルギ測度とに基づいて行われ、
前記チャネル予測パラメータを推定するステップは、前記推定入力チャネルエネルギと前記復号化ダウンミックス信号の推定エネルギと前記残差誤差信号の推定エネルギとに基づき行われる
ことを特徴とする請求項35に記載のオーディオ復号化方法。 - 前記少なくとも1つのエネルギ表現を導出するステップは、チャネルエネルギレベル差と正規化エネルギ補償パラメータとを前記受信ビットストリームの前記第2の部分から導出するステップを含み、
前記入力チャネルエネルギを推定するステップは、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差と前記正規化エネルギ補償パラメータとに基づき行われ、
前記チャネル予測パラメータを推定するステップは、前記チャネルエネルギレベル差に基づき行われ、
前記予測チャネルを合成するステップは、前記復号化ダウンミックス信号と前記推定チャネル予測パラメータとに基づき行われ、
前記残差誤差信号と復号化チャネル表現とを結合するステップは、前記残差誤差信号と前記合成予測チャネルとを結合して結合マルチチャネル合成にするステップを含み、
前記チャネルエネルギ補償は、
前記結合マルチチャネル合成のエネルギを推定し、
前記推定入力チャネルエネルギと前記結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定し、
前記エネルギ補正係数を前記結合マルチチャネル合成に適用し、前記マルチチャネルオーディオ信号を生成する
ことにより、前記結合ステップの後に行われることを特徴とする請求項35に記載のオーディオ復号化方法。 - 前記少なくとも1つのエネルギ表現を導出するステップは、チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとを前記受信ビットストリームの前記第2の部分から導出するステップを含み、
前記入力チャネルエネルギを推定するステップは、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差と前記エネルギ正規化入力チャネル相互相関パラメータとに基づき行われ、
前記チャネル予測パラメータを推定するステップは、前記チャネルエネルギレベル差と前記エネルギ正規化入力チャネル相互相関パラメータとに基づき行われ、
前記予測チャネルを合成するステップは、前記復号化ダウンミックス信号と前記推定チャネル予測パラメータとに基づき行われ、
前記残差誤差信号と復号化チャネル表現とを結合するステップは、前記残差誤差信号と前記合成予測チャネルとを結合して結合マルチチャネル合成にするステップを含み、
前記チャネルエネルギ補償は、
前記結合マルチチャネル合成のエネルギを推定し、
前記推定入力チャネルエネルギと前記結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定し、
前記エネルギ補正係数を前記結合マルチチャネル合成に適用し、前記マルチチャネルオーディオ信号を生成する
ことにより、前記結合ステップの後に行われることを特徴とする請求項35に記載のオーディオ復号化方法。 - 少なくとも2つのチャネルを有するマルチチャネルオーディオ信号を再構成するための受信ビットストリームに作用するオーディオ復号化装置(200)であって、
前記受信ビットストリームの第1部分に基づき復号化ダウンミックス信号を含む少なくとも1つの第1の復号化チャネル表現を生成する第1のデコーダ(230)と、
前記復号化ダウンミックス信号の推定エネルギとオーディオ入力チャネルの少なくとも1つのエネルギ表現を代表する前記受信ビットストリームの第2の部分とに基づき少なくとも1つの第2の復号化チャネル表現を生成する第2のデコーダ(240)と、
前記復号化ダウンミックス信号の推定エネルギとオーディオ入力チャネルの少なくとも1つのエネルギ表現を代表する前記受信ビットストリームの前記第2の部分とに基づきオーディオ入力チャネルの入力チャネルエネルギを推定する推定器(242)と、
残差誤差信号情報を代表する前記受信ビットストリームの第3の部分に基づき第3の復号化処理で残差復号化を行い、残差誤差信号を生成する残差デコーダ(260)と、
前記残差誤差信号と少なくとも前記第2の復号化処理を含む前記第1の復号化処理及び前記第2の復号化処理の少なくとも1つからの復号化チャネル表現とを結合し、前記マルチチャネルオーディオ信号を生成するために推定入力チャネルエネルギに少なくとも部分的に基づきチャネルエネルギ補償を行う手段(270)と、
を有することを特徴とするオーディオ復号化装置。 - 前記結合及びチャネルエネルギ補償を行う手段(270)は、前記マルチチャネルオーディオ信号の出力チャネルのエネルギと前記推定入力チャネルエネルギとを整合させることを特徴とする請求項39に記載のオーディオ復号化装置。
- 前記結合及びチャネルエネルギ補償を行う手段(270)は、エネルギ及び品質の双方の点で、前記マルチチャネルオーディオ信号の出力チャネルと符号化側の対応する入力チャネルとを整合させ、これにより前記結合及びチャネルエネルギ補償を行う手段(270)は、低品質な信号よりも高い割合で高品質な信号が表現され、出力チャネルの品質全体を向上させることを特徴とする請求項40に記載のオーディオ復号化装置。
- 前記チャネルエネルギ補償は、前記第2のデコーダ(240)に統合されることを特徴とする請求項39に記載のオーディオ復号化装置。
- 前記オーディオ復号化装置(200)は、前記復号化ダウンミックス信号のエネルギと前記残差誤差信号のエネルギとを推定する手段を含み、
前記第2のデコーダ(240)は、前記復号化ダウンミックス信号のエネルギと前記残差誤差信号のエネルギとに基づいて動作する
ことを特徴とする請求項42に記載のオーディオ復号化装置。 - 前記結合及びチャネルエネルギ補償を行う手段(270)は、前記残差誤差信号と復号化チャネル表現とを結合して結合マルチチャネル合成にする結合器と、前記チャネルエネルギ補償を前記結合マルチチャネル合成に適用して前記マルチチャネルオーディオ信号を生成するチャネルエネルギ補償器とを含むことを特徴とする請求項39に記載のオーディオ復号化装置。
- 前記オーディオ復号化装置(200)は、結合マルチチャネル合成のエネルギを推定する推定器を含み、
前記チャネルエネルギ補償器は、結合マルチチャネル合成の推定エネルギと推定入力チャネルエネルギとに基づき前記チャネルエネルギ補償を適用する
ことを特徴とする請求項44に記載のオーディオ復号化装置。 - 前記第1のデコーダ(230)は、ダウンミックスデコーダであり、
前記第2のデコーダ(240)は、予測チャネルを合成するパラメトリックデコーダであり、
前記残差デコーダ(260)は、残差予測誤差信号を生成する
ことを特徴とする請求項39に記載のオーディオ復号化装置。 - 前記第2のデコーダ(240)は、
前記オーディオ入力チャネルの前記少なくとも1つのエネルギ表現を前記受信ビットストリームの前記第2の部分から導出する導出器(241)と、
前記少なくとも1つのエネルギ表現に少なくとも部分的に基づきチャネル予測パラメータを推定する推定器と、
復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成する合成器と
を含むことを特徴とする請求項46に記載のオーディオ復号化装置。 - 前記導出器は、チャネルエネルギレベル差とデルタエネルギ測度とを、前記受信ビットストリームの前記第2の部分から導出し、
前記入力チャネルエネルギを推定する前記推定器(242)は、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差とデルタエネルギ測度とに基づき入力チャネルエネルギを推定し、
前記チャネル予測パラメータを推定する前記推定器は、推定入力チャネルエネルギと前記復号化ダウンミックス信号の推定エネルギと前記残差誤差信号の推定エネルギとに基づきチャネル予測パラメータを推定する
ことを特徴とする請求項47に記載のオーディオ復号化装置。 - 前記導出器は、チャネルエネルギレベル差と正規化エネルギ補償パラメータとを、前記受信ビットストリームの前記第2の部分から導出し、
前記入力チャネルエネルギを推定する前記推定器(242)は、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差と前記正規化エネルギ補償パラメータとに基づき入力チャネルエネルギを推定し、
前記チャネル予測パラメータを推定する前記推定器は、前記チャネルエネルギレベル差に基づきチャネル予測パラメータを推定し、
前記予測チャネルを合成する前記合成器は、復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成し、
前記結合及びチャネルエネルギ補償を行う手段(270)は、
前記残差誤差信号と前記合成予測チャネルとを結合して結合マルチチャネル合成にする結合器と、チャネルエネルギ補償器を含み、
前記チャネルエネルギ補償器は、
前記結合マルチチャネル合成のエネルギを推定する推定器と、
推定入力チャネルエネルギと前記結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定する決定器と、
前記エネルギ補正係数を前記結合マルチチャネル合成に適用し、前記マルチチャネルオーディオ信号を生成するエネルギ補正器と
を含むことを特徴とする請求項47に記載のオーディオ復号化装置。 - 前記導出器は、チャネルエネルギレベル差とエネルギ正規化入力チャネル相互相関パラメータとを、前記受信ビットストリームの前記第2の部分から導出し、
前記入力チャネルエネルギを推定する前記推定器(242)は、前記復号化ダウンミックス信号の推定エネルギと前記チャネルエネルギレベル差と前記エネルギ正規化入力チャネル相互相関パラメータとに基づき入力チャネルエネルギを推定し、
前記チャネル予測パラメータを推定する前記推定器は、前記チャネルエネルギレベル差と前記エネルギ正規化入力チャネル相互相関パラメータとに基づきチャネル予測パラメータを推定し、
前記予測チャネルを合成する前記合成器は、復号化ダウンミックス信号と推定チャネル予測パラメータとに基づき予測チャネルを合成し、
前記結合及びチャネルエネルギ補償を行う手段(270)は、前記残差誤差信号と前記合成予測チャネルとを結合して結合マルチチャネル合成にする結合器と、チャネルエネルギ補償器とを含み、
前記チャネルエネルギ補償器は、
前記結合マルチチャネル合成のエネルギを推定する推定器と、
推定入力チャネルエネルギと前記結合マルチチャネル合成の推定エネルギとに基づきエネルギ補正係数を決定する決定器と、
前記エネルギ補正係数を前記結合マルチチャネル合成に適用し、前記マルチチャネルオーディオ信号を生成するエネルギ補正器と
を含むことを特徴とする請求項47に記載のオーディオ復号化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10440408P | 2008-10-10 | 2008-10-10 | |
US61/104,404 | 2008-10-10 | ||
PCT/SE2009/051071 WO2010042024A1 (en) | 2008-10-10 | 2009-09-25 | Energy conservative multi-channel audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012505429A true JP2012505429A (ja) | 2012-03-01 |
JP5608660B2 JP5608660B2 (ja) | 2014-10-15 |
Family
ID=42100797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011530989A Expired - Fee Related JP5608660B2 (ja) | 2008-10-10 | 2009-09-25 | エネルギ保存型マルチチャネルオーディオ符号化 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9330671B2 (ja) |
EP (1) | EP2345027B1 (ja) |
JP (1) | JP5608660B2 (ja) |
CN (1) | CN102177542B (ja) |
WO (1) | WO2010042024A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013536461A (ja) * | 2010-07-20 | 2013-09-19 | ファーウェイ テクノロジーズ カンパニー リミテッド | オーディオ信号合成器 |
JP2018511827A (ja) * | 2015-03-09 | 2018-04-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2018512613A (ja) * | 2015-02-27 | 2018-05-17 | アウロ テクノロジーズ エンフェー. | デジタルデータセットの符号化及び復号 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9330671B2 (en) * | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
EP2395504B1 (en) * | 2009-02-13 | 2013-09-18 | Huawei Technologies Co., Ltd. | Stereo encoding method and apparatus |
BRPI1009467B1 (pt) * | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
CN102157151B (zh) * | 2010-02-11 | 2012-10-03 | 华为技术有限公司 | 一种多声道信号编码方法、解码方法、装置和系统 |
PL3779978T3 (pl) * | 2010-04-13 | 2022-08-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania enkodowanego sygnału audio stereo z wykorzystaniem zmiennego kierunku predykcji |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
CN102280107B (zh) * | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
US9767822B2 (en) * | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
CN103380455B (zh) * | 2011-02-09 | 2015-06-10 | 瑞典爱立信有限公司 | 对音频信号的高效编码/解码 |
ES2744100T3 (es) | 2011-03-04 | 2020-02-21 | Ericsson Telefon Ab L M | Decodificador de audio con corrección de ganancia post-cuantificación |
NO2669468T3 (ja) * | 2011-05-11 | 2018-06-02 | ||
WO2013188562A2 (en) * | 2012-06-12 | 2013-12-19 | Audience, Inc. | Bandwidth extension via constrained synthesis |
CN104769669B (zh) | 2012-08-10 | 2020-09-29 | 弗劳恩霍夫应用研究促进协会 | 对参数音频对象编码运用残差概念的编码器、解码器、系统及方法 |
JP6065452B2 (ja) | 2012-08-14 | 2017-01-25 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
EP2898506B1 (en) | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
EP2757559A1 (en) * | 2013-01-22 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation |
US9336791B2 (en) * | 2013-01-24 | 2016-05-10 | Google Inc. | Rearrangement and rate allocation for compressing multichannel audio |
JP6146069B2 (ja) * | 2013-03-18 | 2017-06-14 | 富士通株式会社 | データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム |
US9478224B2 (en) | 2013-04-05 | 2016-10-25 | Dolby International Ab | Audio processing system |
WO2014210284A1 (en) | 2013-06-27 | 2014-12-31 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
CN104282312B (zh) | 2013-07-01 | 2018-02-23 | 华为技术有限公司 | 信号编码和解码方法以及设备 |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
CN117037811A (zh) | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
EP2996269A1 (en) | 2014-09-09 | 2016-03-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio splicing concept |
CN107112025A (zh) | 2014-09-12 | 2017-08-29 | 美商楼氏电子有限公司 | 用于恢复语音分量的系统和方法 |
CN107004421B (zh) | 2014-10-31 | 2020-07-07 | 杜比国际公司 | 多通道音频信号的参数编码和解码 |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
US12125492B2 (en) * | 2015-09-25 | 2024-10-22 | Voiceage Coproration | Method and system for decoding left and right channels of a stereo sound signal |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
CN106023999B (zh) * | 2016-07-11 | 2019-06-11 | 武汉大学 | 用于提高三维音频空间参数压缩率的编解码方法及系统 |
US10553224B2 (en) | 2017-10-03 | 2020-02-04 | Dolby Laboratories Licensing Corporation | Method and system for inter-channel coding |
US11495237B2 (en) * | 2018-04-05 | 2022-11-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Support for generation of comfort noise, and generation of comfort noise |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
CN111402906B (zh) * | 2020-03-06 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 语音解码方法、装置、引擎及存储介质 |
WO2022009505A1 (ja) * | 2020-07-07 | 2022-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、復号装置、符号化方法、復号方法、及び、ハイブリッド符号化システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008530616A (ja) * | 2005-02-22 | 2008-08-07 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成 |
JP2008536184A (ja) * | 2005-04-15 | 2008-09-04 | コーディング テクノロジーズ アクチボラゲット | 適応残差オーディオ符号化 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
NL9100173A (nl) | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
JP3571890B2 (ja) | 1997-10-23 | 2004-09-29 | 古河電気工業株式会社 | 光ファイバのコア観察装置 |
JP3609623B2 (ja) | 1998-07-14 | 2005-01-12 | 古河電気工業株式会社 | 異径コアファイバ接続部の接続損失推定方法および異径コアファイバの接続方法 |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
SE0200569L (sv) | 2002-02-26 | 2003-10-23 | Ericsson Telefon Ab L M | Inriktning av PM-fibrer |
WO2003085643A1 (en) | 2002-04-10 | 2003-10-16 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
ATE339759T1 (de) | 2003-02-11 | 2006-10-15 | Koninkl Philips Electronics Nv | Audiocodierung |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
SE527713C2 (sv) | 2003-12-19 | 2006-05-23 | Ericsson Telefon Ab L M | Kodning av polyfoniska signaler med villkorsbegränsade filter |
ES2307160T3 (es) * | 2004-04-05 | 2008-11-16 | Koninklijke Philips Electronics N.V. | Codificador multicanal. |
EP1944758A3 (en) * | 2004-04-05 | 2014-09-10 | Koninklijke Philips N.V. | Method of coding data |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
BRPI0516376A (pt) * | 2004-12-27 | 2008-09-02 | Matsushita Electric Ind Co Ltd | dispositivo de codificação de som e método de codificação de som |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
WO2007097549A1 (en) * | 2006-02-23 | 2007-08-30 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
MX2008012315A (es) * | 2006-09-29 | 2008-10-10 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basados en objeto. |
JP5363488B2 (ja) | 2007-09-19 | 2013-12-11 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル・オーディオのジョイント強化 |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
US9330671B2 (en) * | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
-
2009
- 2009-09-25 US US13/122,880 patent/US9330671B2/en not_active Expired - Fee Related
- 2009-09-25 JP JP2011530989A patent/JP5608660B2/ja not_active Expired - Fee Related
- 2009-09-25 WO PCT/SE2009/051071 patent/WO2010042024A1/en active Application Filing
- 2009-09-25 CN CN2009801401393A patent/CN102177542B/zh not_active Expired - Fee Related
- 2009-09-25 EP EP09819478.0A patent/EP2345027B1/en not_active Not-in-force
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008530616A (ja) * | 2005-02-22 | 2008-08-07 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成 |
JP2008536184A (ja) * | 2005-04-15 | 2008-09-04 | コーディング テクノロジーズ アクチボラゲット | 適応残差オーディオ符号化 |
Non-Patent Citations (1)
Title |
---|
JPN6014022167; Christof Faller: 'Parametric Multichannel Audio Coding: Synthesis of Coherence Cues' IEEE Transactions on Audio, Speech, and Language Processing Vol.14, No.1, 200601, pp.299-310, IEEE * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9082396B2 (en) | 2010-07-20 | 2015-07-14 | Huawei Technologies Co., Ltd. | Audio signal synthesizer |
JP2013536461A (ja) * | 2010-07-20 | 2013-09-19 | ファーウェイ テクノロジーズ カンパニー リミテッド | オーディオ信号合成器 |
JP2018512613A (ja) * | 2015-02-27 | 2018-05-17 | アウロ テクノロジーズ エンフェー. | デジタルデータセットの符号化及び復号 |
US10777208B2 (en) | 2015-03-09 | 2020-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11238874B2 (en) | 2015-03-09 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10395661B2 (en) | 2015-03-09 | 2019-08-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP2020038374A (ja) * | 2015-03-09 | 2020-03-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020074013A (ja) * | 2015-03-09 | 2020-05-14 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2018511827A (ja) * | 2015-03-09 | 2018-04-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
US11107483B2 (en) | 2015-03-09 | 2021-08-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10388287B2 (en) | 2015-03-09 | 2019-08-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP7077290B2 (ja) | 2015-03-09 | 2022-05-30 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022088470A (ja) * | 2015-03-09 | 2022-06-14 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP7181671B2 (ja) | 2015-03-09 | 2022-12-01 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
US11741973B2 (en) | 2015-03-09 | 2023-08-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11881225B2 (en) | 2015-03-09 | 2024-01-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP7469350B2 (ja) | 2015-03-09 | 2024-04-16 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Also Published As
Publication number | Publication date |
---|---|
US20110224994A1 (en) | 2011-09-15 |
WO2010042024A1 (en) | 2010-04-15 |
JP5608660B2 (ja) | 2014-10-15 |
EP2345027A1 (en) | 2011-07-20 |
EP2345027B1 (en) | 2018-04-18 |
CN102177542A (zh) | 2011-09-07 |
US9330671B2 (en) | 2016-05-03 |
CN102177542B (zh) | 2013-01-09 |
EP2345027A4 (en) | 2016-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5608660B2 (ja) | エネルギ保存型マルチチャネルオーディオ符号化 | |
JP7244609B2 (ja) | ビットバジェットに応じて2サブフレームモデルと4サブフレームモデルとの間で選択を行うステレオ音声信号の左チャンネルおよび右チャンネルを符号化するための方法およびシステム | |
JP5363488B2 (ja) | マルチチャネル・オーディオのジョイント強化 | |
JP7280306B2 (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
US12125492B2 (en) | Method and system for decoding left and right channels of a stereo sound signal | |
Schmidt et al. | On the Cost of Backward Compatibility for Communication Codecs | |
Li et al. | Efficient stereo bitrate allocation for fully scalable audio codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130215 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130416 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130729 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131025 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140221 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140901 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5608660 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |