JP6606190B2 - マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ - Google Patents
マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ Download PDFInfo
- Publication number
- JP6606190B2 JP6606190B2 JP2017548014A JP2017548014A JP6606190B2 JP 6606190 B2 JP6606190 B2 JP 6606190B2 JP 2017548014 A JP2017548014 A JP 2017548014A JP 2017548014 A JP2017548014 A JP 2017548014A JP 6606190 B2 JP6606190 B2 JP 6606190B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- encoder
- decoder
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 118
- 238000000034 method Methods 0.000 claims description 93
- 230000003595 spectral effect Effects 0.000 claims description 48
- 238000012545 processing Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000008878 coupling Effects 0.000 claims description 11
- 238000010168 coupling process Methods 0.000 claims description 11
- 238000005859 coupling reaction Methods 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 42
- 230000006870 function Effects 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 21
- 230000007704 transition Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000009432 framing Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000001755 vocal effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Analogue/Digital Conversion (AREA)
Description
MPEG−D USACコア符号器に対して、前/後プロセッサとしてPSおよびMPS
MPEG−D USAC規格
MPEG−H 3Dオーディオ規格
−MDCTのAACに対して、IGFおよび結合ステレオ符号化
−QMFのHeAACv2に対して、SBR+PS
−QMFのUSACに対して、SBR+MPS212。
セクション5.3.2補助ペイロードのUSAC規格[1]の表23は、次の通り修正されるべきである。
詳細な復号化手続は、7.x LPDステレオ復号化セクションで説明される。
lpd_stereo_stream():LPDモードのためのステレオデータを復号化するためのデータ要素。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
LPDステレオ符号化
ツール説明
LPDステレオは離散的なM/Sステレオ符号化である。中間チャンネルはモノラルLPDコア符号器によって符号化され、サイド信号はDFTドメインの中で符号化される。復号化された中間信号は、LPDモノラルデコーダから出力されて、それから、LPDステレオモジュールによって処理される。ステレオ復号化は、LチャンネルとRチャンネルとが復号化されるDFTドメインの中でなされる。2つの復号化されたチャンネルは、時間ドメインにおいて元に変換されて、それから、このドメインにおいて、FDモードから復号化されたチャンネルと結合される。FD符号化モードは、複雑な予測によって、または、予測無しで、それ自身のステレオのツール、すなわち離散的なステレオを使っている。
res_mode:パラメータ帯域の周波数解像度を示すフラグ。
q_mode:パラメータ帯域の時間解像度を示すフラグ。
ipd_mode:IPDパラメータに対してパラメータ帯域の最大値を定義するビットフィールド。
pred_mode:仮に予測が使われるならば示すフラグ。
cod_mode:サイド信号が量子化されるためのパラメータ帯域の最大値を定義するビットフィールド。
Ild_idx[k][b]:フレームkおよび帯域bのためのILDパラメータインデックス。
Ipd_idx[k][b]:フレームkおよび帯域bのためのIPDパラメータインデックス。
pred_gain_idx[k][b]:フレームkおよび帯域bのための予測利得インデックス。
cod_gain_idx:量子化されたサイド信号のためのグローバル利得インデックス。
ccfl:コア符号フレーム長さ。
M:テーブル7.x.1において定義されるステレオLPDフレーム長さ。
band_config():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
band_limits():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
ipd_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_max_band():符号化されたパラメータ帯域数を戻す機能。機能は7.xにおいて定義される。
cod_L:復号化されたサイド信号のためのDFTラインの数。
ステレオ復号化は周波数ドメインにおいて実行される。それはLPDデコーダの後処理として作動する。それはLPDデコーダからモノラル中間信号のシンセサイズを受信する。サイド信号は、その時、周波数ドメインにおいて復号化されるか、または予測される。チャンネルスペクトルは、その時、時間ドメインにおいて再シンセサイズされる前に、周波数ドメインにおいて再構成される。ステレオLPDは、LPDモードの中で使われた符号化モードと独立して、ACELPフレームのサイズと等しい固定されたフレーム長によって働く。
フレームインデックスiのDFTスペクトルは、長さMの復号化されたフレームxから計算される。
DFTスペクトルは、パラメータ帯域と呼ばれる非オーバーラップ周波数帯域の中に分割される。スペクトルの区分化は不均一で、聴覚の周波数分解に似る。スペクトルの2つの異なる分割が、等価矩形帯域幅(ERB)の約2倍または約4倍に続く帯域幅によって可能である。スペクトル区分化はデータ要素res_modにより選択され、以下の擬似符号により定義される。
funtion nbands=band_config(N,res_mod)
band_limits[0]=1;
nbands=0;
while(band_limits[nbands++]<(N/2))[
if(stereo_lpd_res==0)
band_limits[nbands]=band_limits_erb2[nbands];
else
band_limits[nbands]=band_limits_erb4[nbands];
]
nbands--;
band_limits[nbands]=N/2;
return nbands
ここで、nbandsはパラメータ帯域の総数であり、NはDFT分析ウィンドウサイズである。表band_limits_erb2とband_limits_erb4は、表7.x.2において定義される。デコーダは、すべての2つのステレオLPDフレームでスペクトルのパラメータ帯域の解像度を順応して変更できる。
ipd_max_band=max_band[res_mod][ipd_mod]
サイド信号の符号化のためのパラメータ帯域の最大数は、2ビットフィールドcod_modデータ要素内で送られる。
cod_max_band=max_band[res_mod][cod_mod]
テーブルmax_band[][]は表7.x.3において定義される。
サイド信号に対して予側するために、復号化されたラインの数は、その時、以下の式で計算される。
cod_L=2・(band_limits[cod_max_band]−1)
ステレオパラメータ相互チャンネルレベル差(ILD)、相互チャンネル位相差(IPD)および予測利得は、フラグq_modeに依存する全てのフレームまたは全ての2つのフレームに送られる。仮に、q_modeが0に等しいならば、パラメータは全てのフレームを更新する。さもなければ、パラメータ値は、USACフレーム内のステレオLPDフレームの奇数のインデックスiに対してのみ更新する。USACフレーム内のステレオLPDフレームのインデックスiは、LPDバージョン0の中で0と3の間のどちらか、およびLPDバージョン1の中で0と1の間のどちらかが可能である。
0≦b<nbandsに対して、
ILDi[b]=ild_q[ild_idx[i][b]]
q_modeの値とは無関係に、code_modeが非ゼロ値であれば、サイド信号の復号化がフレームごとに実行される。まず、グローバルな利益を復号化する。
低音の後処理は2つのチャンネルで別々に行われる。処理は、[1]のセクション7.17で説明したのと同じ両方のチャンネルのためのものである。
[1]ISO/IEC DIS 23003−3, Usac
[2]ISO/IEC DIS 23008−3, 3D Audio
Claims (20)
- マルチチャンネル信号を符号化するためのオーディオエンコーダ(2)であって、
線形予測ドメインエンコーダ(6)と、
周波数ドメインエンコーダ(8)と、
前記線形予測ドメインエンコーダ(6)と前記周波数ドメインエンコーダ(8)との間を切り替えるためのコントローラ(10)と、
を含み、
前記線形予測ドメインエンコーダ(6)は、マルチチャンネル信号(4)をダウンミックスしてダウンミックス信号(14)を得るためのダウンミキサ(12)、前記ダウンミックス信号(14)を符号化するための線形予測ドメインコアエンコーダ(16)、および、前記マルチチャンネル信号から第1マルチチャンネル情報(20)を生成するための第1結合マルチチャンネルエンコーダ(18)を含み、
前記周波数ドメインエンコーダ(8)は、前記マルチチャンネル信号から第2マルチチャンネル情報(24)を符号化するための第2結合マルチチャンネルエンコーダ(22)を含み、前記第2結合マルチチャンネルエンコーダ(22)は前記第1結合マルチチャンネルエンコーダ(18)と異なり、
前記コントローラ(10)は、前記マルチチャンネル信号の部分が、前記線形予測ドメインエンコーダの符号化されたフレーム、または、前記周波数ドメインエンコーダの符号化されたフレームのいずれかによって表現されるように構成され、
前記線形予測ドメインエンコーダ(6)は、ACELPプロセッサ(30)とTCXプロセッサ(32)、および時間ドメイン帯域幅拡張プロセッサ(36)を含み、前記ACELPプロセッサは、ダウンサンプリングされたダウンミックス信号(34)に作用するように構成され、前記時間ドメイン帯域幅拡張プロセッサ(36)は、第3のダウンサンプリングによってACELP入力信号から取り除かれた前記ダウンミックス信号の一部の帯域をパラメトリック的に符号化するように構成され、前記TCXプロセッサ(32)は、ダウンサンプリングされていない、または前記ACELPプロセッサ(30)のためのダウンサンプリングより少ない程度でダウンサンプリングされた前記ダウンミックス信号(14)に作用するように構成され、前記TCXプロセッサが、第1の時間−周波数コンバータ(40)と、第1帯域セットのパラメトリック表現(46)を生成するための第1パラメータ生成器(42)と、第2帯域セットのための量子化されたエンコーダスペクトルライン(48)のセットを生成するための第1量子化エンコーダ(44)とを含む、
または、
前記オーディオエンコーダは、前記ダウンミックス信号(14)を復号化して、符号化されて復号化されたダウンミックス信号(54)を得るための線形予測ドメインデコーダ(50)と、前記第1マルチチャンネル情報(20)を用いた復号化されたマルチチャンネル表現と、ダウンミックス前の前記マルチチャンネル信号(4)との間の誤差を表現する前記符号化されて復号化されたダウンミックス信号(54)を使って、マルチチャンネル残差信号(58)を計算して符号化するためのマルチチャンネル残差コーダ(56)とを含む、
または、
前記コントローラ(10)は、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを符号化するための前記周波数ドメインエンコーダ(8)を使うことから、後のフレームを符号化するための前記線形予測ドメインエンコーダ(6)を使うことに切り替えるように構成され、前記第1結合マルチチャンネルエンコーダ(18)は、前記現在のフレームのために前記マルチチャンネルオーディオ信号から合成マルチチャンネルパラメータ(210a,210b,212a,212b)を計算するように構成され、第2結合マルチチャンネルエンコーダ(22)は、停止ウィンドウを使って第2マルチチャンネル信号を重み付けするように構成される、オーディオエンコーダ(2)。 - 前記第1結合マルチチャンネルエンコーダ(18)は、第1の時間−周波数コンバータ(82)を含み、前記第2結合マルチチャンネルエンコーダ(22)は、第2の時間−周波数コンバータ(66)を含み、前記第1の時間−周波数コンバータと前記第2の時間−周波数コンバータとが互いに異なる、請求項1に記載のオーディオエンコーダ(2)。
- 前記第1結合マルチチャンネルエンコーダ(18)は、パラメトリック結合マルチチャンネルエンコーダであるか、または、
前記第2結合マルチチャンネルエンコーダ(22)は、波形維持結合マルチチャンネルエンコーダである、請求項1または請求項2に記載のオーディオエンコーダ(2)。 - 前記パラメトリック結合マルチチャンネルエンコーダは、ステレオ予測コーダ、パラメトリックステレオエンコーダまたは回転ベースのパラメトリックステレオエンコーダを含む、または、
前記波形維持結合マルチチャンネルエンコーダは、帯域選択的スイッチ中間/サイドまたは左/右ステレオコーダを含む、請求項3に記載のオーディオエンコーダ。 - 前記周波数ドメインエンコーダ(8)は、前記マルチチャンネル信号(4)の第1チャンネル(4a)および前記マルチチャンネル信号(4)の第2チャンネル(4b)を、スペクトル表現(72a、72b)に変換するための第2の時間−周波数コンバータ(66)と、第2帯域セットのパラメトリック表現を生成するための第2パラメータ生成器(68)と、第1帯域セット(80)の量子化されて符号化された表現を生成するための第2量子化エンコーダ(70)とを含む、請求項1ないし請求項4のいずれかに記載のオーディオエンコーダ(2)。
- 前記線形予測ドメインエンコーダは、時間ドメイン帯域幅拡張を持つACELPプロセッサと、MDCT操作を持つTCXプロセッサと、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記周波数ドメインエンコーダは、前記第1チャンネルおよび前記第2チャンネルのためのMDCT操作と、AAC操作と、インテリジェント・ギャップ・フィリング機能とを含む、または、
前記第1結合マルチチャンネルエンコーダは、前記マルチチャンネルオーディオ信号の全帯域幅のためのマルチチャンネル情報が導出されるような方法で動作するように構成される、請求項5に記載のオーディオエンコーダ(2)。 - 前記ダウンミックス信号は低帯域および高帯域を持ち、前記線形予測ドメインエンコーダは、前記高帯域をパラメトリック的に符号化するために帯域幅拡張処理を適用するように構成され、前記線形予測ドメインデコーダは、前記符号化されて復号化されたダウンミックス信号(54)として、前記ダウンミックス信号の前記低帯域を表現する低帯域信号だけを得るように構成され、前記符号化されたマルチチャンネル残差信号(58)は、ダウンミックス前の前記マルチチャンネル信号の前記低帯域内の周波数しか持っていない、請求項1に記載のオーディオエンコーダ(2)。
- 前記マルチチャンネル残差コーダ(56)は、
前記第1マルチチャンネル情報(20)および前記符号化されて復号化されたダウンミックス信号(54)を使って、復号化されたマルチチャンネル信号(64)を生成するための結合マルチチャンネルデコーダ(60)と、
前記復号化されたマルチチャンネル信号とダウンミックス化前の前記マルチチャンネル信号との間の差を形成して前記マルチチャンネル残差信号を得るためのディファレンスプロセッサ(62)と、
を含む、請求項1または請求項7に記載のオーディオエンコーダ(2)。 - 前記ダウンミキサ(12)は、前記マルチチャンネル信号をスペクトル表現に変換するように構成され、前記ダウンミックスは、前記スペクトル表現を使って、または、時間ドメイン表現を使って実行され、
前記第1結合マルチチャンネルエンコーダは、前記スペクトル表現の個々の帯域に対して別個の第1マルチチャンネル情報を生成するために、前記スペクトル表現を使用するように構成される、請求項1ないし請求項8のいずれかに記載のオーディオエンコーダ(2)。 - 符号化されたオーディオ信号(103)を復号化するためのオーディオデコーダ(102)であって、
線形予測ドメインデコーダ(104)と、
周波数ドメインデコーダ(106)と、
前記線形予測ドメインデコーダ(104)の出力と第1マルチチャンネル情報(20)とを使って第1マルチチャンネル表現(114)を生成するための第1結合マルチチャンネルデコーダ(108)と、
前記周波数ドメインデコーダ(106)の出力と第2マルチチャンネル情報(22,24)とを使って第2マルチチャンネル表現(116)を生成するための第2結合マルチチャンネルデコーダ(110)と、
前記第1マルチチャンネル表現(114)と前記第2マルチチャンネル表現(116)とを結合して復号化されたオーディオ信号(118)を得るための第1結合器(112)と、を含み、
前記第2結合マルチチャンネルデコーダは、前記第1結合マルチチャンネルデコーダと異なり、
前記第1結合マルチチャンネルデコーダ(108)は、パラメトリック結合マルチチャンネルデコーダであり、前記第2結合マルチチャンネルデコーダは、波形維持結合マルチチャンネルデコーダであり、前記第1結合マルチチャンネルデコーダは、複雑な予測、パラメトリックステレオ操作または回転操作に基づいて動作するように構成され、前記第2結合マルチチャンネルデコーダは、帯域選択的スイッチを、中間/サイドまたは左/右のステレオ復号化アルゴリズムに適用するように構成される、
または、
符号化されたマルチチャンネルオーディオ信号は、前記線形予測ドメインデコーダの前記出力のための残差信号を含み、前記第1結合マルチチャンネルデコーダは、前記マルチチャンネル残差信号を使って前記第1マルチチャンネル表現を生成するように構成される、
または、
前記オーディオデコーダ(102)は、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを復号化するための前記周波数ドメインデコーダ(106)を使うことから、後のフレームを復号化するための前記線形予測ドメインデコーダ(104)に切り替えるように構成され、前記結合器(112)は、前記現在のフレームの前記第2マルチチャンネル表現(116)から合成中間信号(226)を計算するように構成され、前記第1結合マルチチャンネルデコーダ(108)は、前記合成中間信号(226)および第1マルチチャンネル情報(20)を使って、前記第1マルチチャンネル表現(114)を生成するように構成され、前記結合器(112)は、前記第1マルチチャンネル表現および前記第2マルチチャンネル表現を結合して前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るように構成される、
または、
前記オーディオデコーダ(102)は、マルチチャンネルオーディオ信号の現在のフレーム(232)内で、前のフレームを復号化するための前記線形予測ドメインデコーダ(104)を使うことから、後のフレームを復号化するための前記周波数ドメインデコーダ(106)に切り替えるように構成され、前記第1結合マルチチャンネルデコーダ(108)は、ステレオデコーダ(146)を含み、前記ステレオデコーダ(146)は、前のフレームのマルチチャンネル情報を使って、現在のフレームについての前記線形予測ドメインデコーダの復号化されたモノラル信号から、合成マルチチャンネルオーディオ信号を計算するように構成され、前記第2結合マルチチャンネルデコーダ(110)は、前記現在のフレームについての第2マルチチャンネル表現を計算し、スタートウィンドウを使って、前記第2マルチチャンネル表現の重み付けをするように構成され、前記結合器(112)は、前記合成マルチチャンネルオーディオ信号と前記重み付けされた第2マルチチャンネル表現を結合して前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るように構成される、オーディオデコーダ(102)。 - 前記線形予測ドメインデコーダは、
ACELPデコーダ(120)、低帯域シンセサイザ(122)、アップサンプリング器(124)、時間ドメイン帯域幅拡張プロセッサ(126)、または、アップサンプリングされた信号と帯域幅拡張された信号とを結合するための第2結合器(128)、
TCXデコーダ(130)およびインテリジェント・ギャップ・フィリングプロセッサ(132)、
前記第2結合器(128)の出力とTCXデコーダ(130)およびIGFプロセッサ(132)の出力とを結合するための完全帯域シンセサイズプロセッサ(134)を備える、または、
クロスパス(136)は、前記TCXデコーダおよび前記IGFプロセッサからの低帯域スペクトル時間変換によって導出された情報を使って前記低帯域シンセサイザを初期設定するために設けられる、請求項10に記載のオーディオデコーダ(102)。 - 前記第1結合マルチチャンネルデコーダは、前記線形予測ドメインデコーダ(104)の前記出力をスペクトル表現(145)に変換するための時間−周波数コンバータ(138)と、
前記スペクトル表現(145)に作用する前記第1マルチチャンネル情報によってコントロールされるアップミキサと、
アップミックス結果を時間表現期間に変換するための周波数−時間コンバータ(148)とを含む、請求項10または請求項11に記載のオーディオデコーダ(102)。 - 前記第2結合マルチチャンネルデコーダ(110)は、入力として、前記周波数ドメインデコーダによって得られたスペクトル表現を使うように構成され、前記スペクトル表現は、少なくとも複数の帯域について、第1チャンネル信号および第2チャンネル信号を含み、
結合マルチチャンネル操作を前記第1チャンネル信号および前記第2チャンネル信号の複数の帯域に適用し、前記結合マルチチャンネル操作の結果を時間表現に変換して前記第2マルチチャンネル表現を得るように構成される、請求項10ないし請求項12のいずれかに記載のオーディオデコーダ(102)。 - 前記第2マルチチャンネル情報(24)は、個々の帯域について、左/右、または中間/サイドの結合マルチチャンネル符号化を示すマスクであり、前記結合マルチチャンネル操作は、前記マスクによって示された帯域を、前記中間/サイド表現から左/右表現に変換するための、中間/サイドから左/右への変換操作である、請求項13に記載のオーディオデコーダ(102)。
- 前記マルチチャンネル残差信号は、前記第1マルチチャンネル表現より低い帯域幅を持ち、前記第1結合マルチチャンネルデコーダは、前記第1マルチチャンネル情報を使って中間的な第1マルチチャンネル表現を再構成し、前記マルチチャンネル残差信号を前記中間的な第1マルチチャンネル表現に追加するように構成される、請求項10に記載のオーディオデコーダ(102)。
- 前記時間−周波数コンバータは、複雑な操作または過剰サンプリング操作を含み、
前記周波数ドメインデコーダは、IMDCT操作または臨界サンプリング操作を含む、請求項12に記載のオーディオデコーダ(102)。 - マルチチャンネルとは2つ以上のチャンネルを意味する、請求項10ないし請求項16のいずれか記載のオーディオデコーダ。
- マルチチャンネル信号を符号化する方法(800)であって、
線形予測ドメイン符号化を実行するステップと、
周波数ドメイン符号化を実行するステップと、
前記線形予測ドメイン符号化と前記周波数ドメイン符号化との間の切り替えをするステップと、
を含み、
前記線形予測ドメイン符号化を実行するステップは、ダウンミックス信号と、前記ダウンミックス信号をコア符号化する線形予測ドメインと、前記マルチチャンネル信号から第1のマルチチャンネル情報を生成する第1の結合マルチチャンネル符号化を得るために、マルチチャンネル信号をダウンミックスするステップを含み、
前記周波数ドメイン符号化を実行するステップは、前記マルチチャンネル信号から第2マルチチャンネル情報を生成する第2結合マルチチャンネル符号化するステップを含み、前記第2結合マルチチャンネル符号化するステップは、第1結合マルチチャンネル符号化するステップと異なり、
前記切り替えするステップは、前記マルチチャンネル信号の部分が、前記線形予測ドメイン符号化の符号化されたフレーム、または、前記周波数ドメイン符号化の符号化されたフレームのいずれかによって表現されるように実行され、
前記線形予測ドメイン符号化を実行するステップは、ACELP処理とTCX処理、および時間ドメイン帯域幅拡張処理を含み、前記ACELP処理は、ダウンサンプリングされたダウンミックス信号(34)に作用するように構成され、前記時間ドメイン帯域幅拡張処理は、第3のダウンサンプリングによってACELP入力信号から取り除かれた前記ダウンミックス信号の一部の帯域をパラメトリック的に符号化するように構成され、前記TCX処理は、ダウンサンプリングされていない、または前記ACELP処理のためのダウンサンプリングより少ない程度でダウンサンプリングされた前記ダウンミックス信号(14)に作用するように構成され、前記TCX処理は、第1帯域セットのパラメトリック表現(46)を生成するための第1パラメータ生成し、且つ、第2帯域セットのための量子化されたエンコーダスペクトルライン(48)のセットを生成する第1の時間−周波数変換を含む、
または、
符号化する方法は、前記ダウンミックス信号(14)を復号化して、符号化されて復号化されたダウンミックス信号(54)を得るための線形予測ドメインを復号化と、前記第1マルチチャンネル情報(20)を用いた復号化されたマルチチャンネル表現と、ダウンミックス前の前記マルチチャンネル信号との間の誤差を表現する前記符号化されて復号化されたダウンミックス信号(54)を使って、マルチチャンネル残差信号(58)を計算して符号化するステップをさらに含む、
または、
前記切り替えするステップは、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを符号化するための前記器周波数ドメイン符号化を実行するステップを使うことから、後のフレームを符号化するための前記線形予測ドメイン符号化を実行するステップに切り替えるステップを含み、前記第1結合マルチチャンネル符号化するステップは、前記現在フレームのために前記マルチチャンネルオーディオ信号から合成マルチチャンネルパラメータ(210a,210b,212a,212b)を計算するステップを含み、第2結合マルチチャンネル符号化するステップは、停止ウィンドウを使って前記第2マルチチャンネル信号を重み付けするステップを含む、方法(800)。 - 符号化されたオーディ信号を復号化する方法(900)であって、
線形予測ドメイン復号化するステップと、
周波数ドメイン復号化するステップと、
前記線形予測ドメイン復号化の出力および第1マルチチャンネル情報を使って、第1マルチチャンネル表現を生成する第1結合マルチチャンネル復号化するステップと、
前記周波数ドメイン復号化の出力および第2マルチチャンネル情報を使って、第2マルチチャンネル表現を生成する第2結合マルチチャンネル復号化するステップと、
復号化されたオーディオ信号を得るために、前記第1マルチチャンネル表現と前記第2マルチチャンネル表現を結合するステップと、
を含み、
前記第2結合マルチチャンネル復号化するステップは、前記第1結合マルチチャンネル復号化するステップと異なり、
前記第1結合マルチチャンネル復号化するステップは、パラメトリック結合マルチチャンネル復号化するステップであり、前記第2結合マルチチャンネル復号化するステップは、波形維持結合マルチチャンネル復号化するステップであり、前記第1結合マルチチャンネル復号化するステップは、複雑な予測、パラメトリックステレオ操作または回転操作に基づいて動作し、前記第2結合マルチチャンネル復号化するステップは、帯域選択的に切り替えるステップを、中間/サイドまたは左/右のステレオ復号化アルゴリズムに適用する、
または、
符号化されたマルチチャンネルオーディオ信号は、前記線形予測ドメイン復号化するステップの前記出力のための残差信号を含み、前記第1結合マルチチャンネル復号化するステップは、前記マルチチャンネル残差信号を使って前記第1マルチチャンネル表現を生成するように構成される、
または、
前記復号化する方法は、マルチチャンネルオーディオ信号の現在のフレーム(204)内で、前のフレームを復号化するための前記周波数ドメイン復号化するステップを使うことから、後のフレームを復号化するための前記線形予測ドメイン復号化するステップに切り替えるステップを含み、前記結合するステップは、前記現在のフレームの前記第2マルチチャンネル表現(116)から合成中間信号(226)を計算するステップを含み、前記第1結合マルチチャンネル復号化するステップは、前記合成中間信号(226)および第1マルチチャンネル情報(20)を使って、前記第1マルチチャンネル表現(114)を生成するステップを含み、前記結合するステップは、前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るために、前記第1マルチチャンネル表現および前記第2マルチチャンネル表現を結合するステップを含む、
または、
前記復号化するステップは、マルチチャンネルオーディオ信号の現在のフレーム(232)内で、前のフレームを復号化するための前記線形予測ドメイン復号化するステップを使うことから、後のフレームを復号化するための前記周波数ドメイン復号化するステップに切り替えするステップを含み、前記第1結合マルチチャンネル復号化するステップは、ステレオ復号化するステップを含み、前記ステレオ復号化するステップは、前のフレームのマルチチャンネル情報を使って、現在のフレームについての前記線形予測ドメイン復号化するステップの復号化されたモノラル信号から、合成マルチチャンネルオーディオ信号を計算するステップを含み、前記第2結合マルチチャンネル復号化するステップは、前記現在のフレームについての第2マルチチャンネル表現を計算し、スタートウィンドウを使って、前記第2マルチチャンネル表現の重み付けするステップを含み、前記結合するステップは、前記マルチチャンネルオーディオ信号の復号化された現在のフレームを得るために、前記合成マルチチャンネルオーディオ信号と前記重み付けされた第2マルチチャンネル表現を結合するステップを含む、方法(900)。 - コンピュータ・プログラムがコンピュータまたはプロセッサ上で稼働するとき、請求項18または請求項19の方法を実行するためのコンピュータ・プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158233.5 | 2015-03-09 | ||
EP15158233 | 2015-03-09 | ||
EP15172594.2A EP3067886A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP15172594.2 | 2015-06-17 | ||
PCT/EP2016/054776 WO2016142337A1 (en) | 2015-03-09 | 2016-03-07 | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019189837A Division JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018511827A JP2018511827A (ja) | 2018-04-26 |
JP6606190B2 true JP6606190B2 (ja) | 2019-11-13 |
Family
ID=52682621
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548014A Active JP6606190B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017548000A Active JP6643352B2 (ja) | 2015-03-09 | 2016-03-07 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2019189837A Active JP7077290B2 (ja) | 2015-03-09 | 2019-10-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2020000185A Active JP7181671B2 (ja) | 2015-03-09 | 2020-01-06 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022045510A Active JP7469350B2 (ja) | 2015-03-09 | 2022-03-22 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP2022183880A Pending JP2023029849A (ja) | 2015-03-09 | 2022-11-17 | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Country Status (19)
Country | Link |
---|---|
US (7) | US10388287B2 (ja) |
EP (9) | EP3067887A1 (ja) |
JP (6) | JP6606190B2 (ja) |
KR (2) | KR102151719B1 (ja) |
CN (6) | CN112614496B (ja) |
AR (6) | AR103881A1 (ja) |
AU (2) | AU2016231284B2 (ja) |
BR (4) | BR122022025643B1 (ja) |
CA (2) | CA2978812C (ja) |
ES (6) | ES2959970T3 (ja) |
FI (1) | FI3958257T3 (ja) |
MX (2) | MX364618B (ja) |
MY (2) | MY194940A (ja) |
PL (6) | PL3268957T3 (ja) |
PT (3) | PT3268958T (ja) |
RU (2) | RU2680195C1 (ja) |
SG (2) | SG11201707343UA (ja) |
TW (2) | TWI609364B (ja) |
WO (2) | WO2016142336A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022088470A (ja) * | 2015-03-09 | 2022-06-14 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017125558A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10573326B2 (en) * | 2017-04-05 | 2020-02-25 | Qualcomm Incorporated | Inter-channel bandwidth extension |
US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
WO2018211050A1 (en) | 2017-05-18 | 2018-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Managing network device |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
US10475457B2 (en) | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
US10535357B2 (en) | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10734001B2 (en) | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
KR102697685B1 (ko) * | 2017-12-19 | 2024-08-23 | 돌비 인터네셔널 에이비 | 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템 |
SG11202007182UA (en) * | 2018-02-01 | 2020-08-28 | Fraunhofer Ges Forschung | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis |
EP3550561A1 (en) * | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
US12020718B2 (en) | 2018-07-02 | 2024-06-25 | Dolby International Ab | Methods and devices for generating or decoding a bitstream comprising immersive audio signals |
JP7384893B2 (ja) * | 2018-07-04 | 2023-11-21 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法 |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
EP3915106A1 (en) | 2019-01-21 | 2021-12-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
WO2020253941A1 (en) | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
CN110267142B (zh) * | 2019-06-25 | 2021-06-22 | 维沃移动通信有限公司 | 一种移动终端及控制方法 |
CN114270436A (zh) * | 2019-07-19 | 2022-04-01 | 英迪股份有限公司 | 无线通信系统中的自适应音频处理方法、设备、计算机程序及其记录介质 |
FR3101741A1 (fr) * | 2019-10-02 | 2021-04-09 | Orange | Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés |
US11432069B2 (en) * | 2019-10-10 | 2022-08-30 | Boomcloud 360, Inc. | Spectrally orthogonal audio component processing |
WO2021155460A1 (en) * | 2020-02-03 | 2021-08-12 | Voiceage Corporation | Switching between stereo coding modes in a multichannel sound codec |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
WO2021260825A1 (ja) * | 2020-06-24 | 2021-12-30 | 日本電信電話株式会社 | 音信号符号化方法、音信号符号化装置、プログラム及び記録媒体 |
CN115917643A (zh) * | 2020-06-24 | 2023-04-04 | 日本电信电话株式会社 | 声音信号解码方法、声音信号解码装置、程序以及记录介质 |
WO2022066426A1 (en) * | 2020-09-25 | 2022-03-31 | Apple Inc. | Seamless scalable decoding of channels, objects, and hoa audio content |
MX2023003965A (es) * | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda. |
US20240127830A1 (en) * | 2021-02-16 | 2024-04-18 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, encoding method, and decoding method |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CA3240986A1 (en) * | 2021-12-20 | 2023-06-29 | Dolby International Ab | Ivas spar filter bank in qmf domain |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
DE4307688A1 (de) * | 1993-03-11 | 1994-09-15 | Daimler Benz Ag | Verfahren zur Geräuschreduktion für gestörte Sprachkanäle |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3593201B2 (ja) * | 1996-01-12 | 2004-11-24 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
AU2000233851A1 (en) * | 2000-02-29 | 2001-09-12 | Qualcomm Incorporated | Closed-loop multimode mixed-domain linear prediction speech coder |
SE519981C2 (sv) | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
CN1890712A (zh) | 2003-12-04 | 2007-01-03 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
JP4950040B2 (ja) * | 2004-06-21 | 2012-06-13 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置 |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
JP4832305B2 (ja) * | 2004-08-31 | 2011-12-07 | パナソニック株式会社 | ステレオ信号生成装置およびステレオ信号生成方法 |
JP5046652B2 (ja) * | 2004-12-27 | 2012-10-10 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
WO2007026763A1 (ja) * | 2005-08-31 | 2007-03-08 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法 |
WO2008035949A1 (en) | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
US8612220B2 (en) * | 2007-07-03 | 2013-12-17 | France Telecom | Quantization after linear transformation combining the audio signals of a sound scene, and related coder |
CN101373594A (zh) * | 2007-08-21 | 2009-02-25 | 华为技术有限公司 | 修正音频信号的方法及装置 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
US8527282B2 (en) * | 2007-11-21 | 2013-09-03 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
RU2439720C1 (ru) * | 2007-12-18 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
RU2439718C1 (ru) * | 2007-12-31 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
JP5333446B2 (ja) | 2008-04-25 | 2013-11-06 | 日本電気株式会社 | 無線通信装置 |
WO2010003545A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | An apparatus and a method for decoding an encoded audio signal |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
MY181247A (en) | 2008-07-11 | 2020-12-21 | Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2346029B1 (en) * | 2008-07-11 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and corresponding computer program |
PL2311034T3 (pl) * | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
JP5243527B2 (ja) * | 2008-07-29 | 2013-07-24 | パナソニック株式会社 | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
EP3640941A1 (en) * | 2008-10-08 | 2020-04-22 | Fraunhofer Gesellschaft zur Förderung der Angewand | Multi-resolution switched audio encoding/decoding scheme |
US9330671B2 (en) | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
MX2011009660A (es) * | 2009-03-17 | 2011-09-30 | Dolby Int Ab | Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica. |
GB2470059A (en) * | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
PL2471061T3 (pl) * | 2009-10-08 | 2014-03-31 | Fraunhofer Ges Forschung | Działający w wielu trybach dekoder sygnału audio, działający w wielu trybach koder sygnału audio, sposoby i program komputerowy stosujące kształtowanie szumu oparte o kodowanie z wykorzystaniem predykcji liniowej |
CN102859589B (zh) | 2009-10-20 | 2014-07-09 | 弗兰霍菲尔运输应用研究公司 | 多模式音频编译码器及其适用的码簿激励线性预测编码 |
EP4362014A1 (en) * | 2009-10-20 | 2024-05-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
BR122020024243B1 (pt) * | 2009-10-20 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio. |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US9613630B2 (en) * | 2009-11-12 | 2017-04-04 | Lg Electronics Inc. | Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US8166830B2 (en) * | 2010-07-02 | 2012-05-01 | Dresser, Inc. | Meter devices and methods |
JP5499981B2 (ja) * | 2010-08-02 | 2014-05-21 | コニカミノルタ株式会社 | 画像処理装置 |
CN102741831B (zh) * | 2010-11-12 | 2015-10-07 | 宝利通公司 | 多点环境中的可伸缩音频 |
CN103620679B (zh) * | 2011-03-18 | 2017-07-04 | 弗劳恩霍夫应用研究促进协会 | 具有灵活配置功能的音频编码器和解码器 |
US20150371643A1 (en) * | 2012-04-18 | 2015-12-24 | Nokia Corporation | Stereo audio signal encoder |
US9489962B2 (en) * | 2012-05-11 | 2016-11-08 | Panasonic Corporation | Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method |
CN102779518B (zh) * | 2012-07-27 | 2014-08-06 | 深圳广晟信源技术有限公司 | 用于双核编码模式的编码方法和系统 |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US20150159036A1 (en) | 2013-12-11 | 2015-06-11 | Momentive Performance Materials Inc. | Stable primer formulations and coatings with nano dispersion of modified metal oxides |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
-
2015
- 2015-06-17 EP EP15172599.1A patent/EP3067887A1/en not_active Withdrawn
- 2015-06-17 EP EP15172594.2A patent/EP3067886A1/en not_active Withdrawn
-
2016
- 2016-03-02 TW TW105106305A patent/TWI609364B/zh active
- 2016-03-02 TW TW105106306A patent/TWI613643B/zh active
- 2016-03-07 SG SG11201707343UA patent/SG11201707343UA/en unknown
- 2016-03-07 ES ES21171831T patent/ES2959970T3/es active Active
- 2016-03-07 JP JP2017548014A patent/JP6606190B2/ja active Active
- 2016-03-07 JP JP2017548000A patent/JP6643352B2/ja active Active
- 2016-03-07 CN CN202110019014.8A patent/CN112614496B/zh active Active
- 2016-03-07 CA CA2978812A patent/CA2978812C/en active Active
- 2016-03-07 AU AU2016231284A patent/AU2016231284B2/en active Active
- 2016-03-07 EP EP21171826.7A patent/EP3879527B1/en active Active
- 2016-03-07 BR BR122022025643-0A patent/BR122022025643B1/pt active IP Right Grant
- 2016-03-07 BR BR112017018439-7A patent/BR112017018439B1/pt active IP Right Grant
- 2016-03-07 PL PL16708171T patent/PL3268957T3/pl unknown
- 2016-03-07 CN CN202110178110.7A patent/CN112951248B/zh active Active
- 2016-03-07 MY MYPI2017001286A patent/MY194940A/en unknown
- 2016-03-07 MY MYPI2017001288A patent/MY186689A/en unknown
- 2016-03-07 KR KR1020177028167A patent/KR102151719B1/ko active IP Right Grant
- 2016-03-07 CN CN201680014669.3A patent/CN107430863B/zh active Active
- 2016-03-07 ES ES21171835T patent/ES2958535T3/es active Active
- 2016-03-07 EP EP16708172.8A patent/EP3268958B1/en active Active
- 2016-03-07 ES ES21171826T patent/ES2959910T3/es active Active
- 2016-03-07 ES ES21191544T patent/ES2951090T3/es active Active
- 2016-03-07 ES ES16708172T patent/ES2901109T3/es active Active
- 2016-03-07 AU AU2016231283A patent/AU2016231283C1/en active Active
- 2016-03-07 PL PL21171826.7T patent/PL3879527T3/pl unknown
- 2016-03-07 KR KR1020177028152A patent/KR102075361B1/ko active IP Right Grant
- 2016-03-07 PT PT167081728T patent/PT3268958T/pt unknown
- 2016-03-07 PL PL16708172T patent/PL3268958T3/pl unknown
- 2016-03-07 PL PL21171835.8T patent/PL3910628T3/pl unknown
- 2016-03-07 ES ES16708171T patent/ES2910658T3/es active Active
- 2016-03-07 WO PCT/EP2016/054775 patent/WO2016142336A1/en active Application Filing
- 2016-03-07 PL PL21171831.7T patent/PL3879528T3/pl unknown
- 2016-03-07 BR BR122022025766-6A patent/BR122022025766B1/pt active IP Right Grant
- 2016-03-07 CN CN202110019042.XA patent/CN112614497B/zh active Active
- 2016-03-07 PL PL21191544.2T patent/PL3958257T3/pl unknown
- 2016-03-07 BR BR112017018441-9A patent/BR112017018441B1/pt active IP Right Grant
- 2016-03-07 CN CN201680014670.6A patent/CN107408389B/zh active Active
- 2016-03-07 MX MX2017011493A patent/MX364618B/es active IP Right Grant
- 2016-03-07 SG SG11201707335SA patent/SG11201707335SA/en unknown
- 2016-03-07 EP EP21191544.2A patent/EP3958257B1/en active Active
- 2016-03-07 MX MX2017011187A patent/MX366860B/es active IP Right Grant
- 2016-03-07 PT PT211915442T patent/PT3958257T/pt unknown
- 2016-03-07 EP EP16708171.0A patent/EP3268957B1/en active Active
- 2016-03-07 FI FIEP21191544.2T patent/FI3958257T3/fi active
- 2016-03-07 EP EP21171835.8A patent/EP3910628B1/en active Active
- 2016-03-07 WO PCT/EP2016/054776 patent/WO2016142337A1/en active Application Filing
- 2016-03-07 CA CA2978814A patent/CA2978814C/en active Active
- 2016-03-07 PT PT167081710T patent/PT3268957T/pt unknown
- 2016-03-07 RU RU2017134385A patent/RU2680195C1/ru active
- 2016-03-07 CN CN202110018176.XA patent/CN112634913B/zh active Active
- 2016-03-07 EP EP23166790.8A patent/EP4224470A1/en active Pending
- 2016-03-07 EP EP21171831.7A patent/EP3879528B1/en active Active
- 2016-03-07 RU RU2017133918A patent/RU2679571C1/ru active
- 2016-03-08 AR ARP160100609A patent/AR103881A1/es active IP Right Grant
- 2016-03-08 AR ARP160100608A patent/AR103880A1/es active IP Right Grant
-
2017
- 2017-09-05 US US15/695,668 patent/US10388287B2/en active Active
- 2017-09-05 US US15/695,424 patent/US10395661B2/en active Active
-
2019
- 2019-03-22 US US16/362,462 patent/US10777208B2/en active Active
- 2019-07-09 US US16/506,767 patent/US11238874B2/en active Active
- 2019-10-17 JP JP2019189837A patent/JP7077290B2/ja active Active
-
2020
- 2020-01-06 JP JP2020000185A patent/JP7181671B2/ja active Active
- 2020-08-31 US US17/008,428 patent/US11107483B2/en active Active
-
2021
- 2021-08-24 US US17/410,033 patent/US11741973B2/en active Active
- 2021-10-18 AR ARP210102869A patent/AR123837A2/es unknown
- 2021-10-18 AR ARP210102867A patent/AR123835A2/es unknown
- 2021-10-18 AR ARP210102866A patent/AR123834A2/es unknown
- 2021-10-18 AR ARP210102868A patent/AR123836A2/es unknown
-
2022
- 2022-01-13 US US17/575,260 patent/US11881225B2/en active Active
- 2022-03-22 JP JP2022045510A patent/JP7469350B2/ja active Active
- 2022-11-17 JP JP2022183880A patent/JP2023029849A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022088470A (ja) * | 2015-03-09 | 2022-06-14 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
JP7469350B2 (ja) | 2015-03-09 | 2024-04-16 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7469350B2 (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181106 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6606190 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |