JP5645951B2 - ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム - Google Patents
ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム Download PDFInfo
- Publication number
- JP5645951B2 JP5645951B2 JP2012539298A JP2012539298A JP5645951B2 JP 5645951 B2 JP5645951 B2 JP 5645951B2 JP 2012539298 A JP2012539298 A JP 2012539298A JP 2012539298 A JP2012539298 A JP 2012539298A JP 5645951 B2 JP5645951 B2 JP 5645951B2
- Authority
- JP
- Japan
- Prior art keywords
- rendering matrix
- audio
- downmix
- bitstream
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 230000005236 sound signal Effects 0.000 title claims description 47
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000009877 rendering Methods 0.000 claims description 282
- 239000011159 matrix material Substances 0.000 claims description 209
- 238000012545 processing Methods 0.000 claims description 22
- 238000010606 normalization Methods 0.000 claims description 12
- 238000013139 quantization Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000000926 separation method Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000011664 signaling Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012805 post-processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 229910001369 Brass Inorganic materials 0.000 description 1
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000010951 brass Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 108010052322 limitin Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- PIRWNASAJNPKHT-SHZATDIYSA-N pamp Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](C)N)C(C)C)C1=CC=CC=C1 PIRWNASAJNPKHT-SHZATDIYSA-N 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Description
図1aは、本発明の実施形態による、アップミックス信号表現を提供するための装置のブロック概略図を示す。
図1bは、マルチチャネルオーディオ信号を表しているビットストリームを提供するための装置150のブロック概略図を示す。
3.1. SAOCデコーダ構造
以下に、歪み制御装置(DCU処理)によって実行される処理がSAOCシステム200のブロック概略図を示す図2を参照して記載される。具体的には、図2は、全体のSAOCシステムの範囲内における歪み制御装置DCUを例示する。
以下に、SAOCデコーダ200の動作への短いイントロダクションが与えられる。
gDCU=DcuParam[bsDcuParam]
3.4.1. イントロダクション
「ベストエフォート型」レンダリング法、概して、ターゲットレンダリングが重要な参照である場合において使用されうる。
以下に、本発明による若干の実施形態において実行されうる歪み制御装置のアプリケーションに関する若干の任意の拡張が記載される。
以下に、マルチチャネルオーディオ信号を表しているビットストリームが、この種のビットストリーム300の概略図を示す図3aの参照をして記載する。
5.1. SAOC特有の構成構文
図3bは、SAOCに特有の構成情報の詳細な構文表現を示す。
以下において、SAOCフレームの構文が、図3cの参照をして記載される。
以下に、SAOCにおけるレンダリング係数制限スキームの更なる実施形態が記載される。
図4は、本発明の実施形態によるオーディオデコーダ400のブロック外略図を示す。
間接的な制御方法の基礎をなす仮説は、ダウンミックスにおけるそれらの対応するオブジェクトレベルからRCの歪みレベルおよび偏差の関係を考慮する。これは、特定の減衰/ぶースティングが他のオブジェクトに関してRCによって特定のオブジェクトに適用されるほど、送信されたダウンミックス信号の積極的な修正がSAOCデコーダ/変換コーダによってより実行されることになっているという観察に基づく。換言すれば:「オブジェクトゲイン」値のより高い偏差は、(同一のダウンミックス係数を仮定する)発生する容認できない歪みに対するより高い機会の互いの関連を示す。
6.4.1. イントロダクション
Ndmx×NobサイズのダウンミックスマトリックスDは、エンコーダ(例えば、オーディオエンコーダ150)によって決定され、入力オブジェクトが、デコーダに送信されるダウンミックス信号にどのように線形に結合するかの情報を含む。例えば、モノラルダウンミックス信号とともに、Dは、単一の列ベクトルに、そして、ステレオダウンミックスのケースNdmx=2において減少する。
6.5.1. イントロダクション
ベストエフォート型レンダリング法は、ダウンミックスおよびレンダリング情報に依存するターゲットレンダリングマトリックスを記載する。エネルギー規格化は、Nch×NdmxサイズのマトリックスNBEによって表され、それゆえに、(複数の出力チャンネルを提供する)各出力チャネルに対して個別の値を提供する。これは、次のセクションにおいて要点が説明される異なるSAOC動作モードのためのNBEの異なる計算を必要とする。
用語(DD*)-1の計算のための正規化法は、不良設定マトリックスの結果を防止するために適用されうる。
6.6.1. ビットストリーム構文の例
以下において、SAOC特有の構成の構文表現は、図5aを参照して記載される。SAOC特有の構成「SAOCSpecificConfig()」は、従来のSAOC構成情報を含む。さらに、SAOC特有の構成は、以下においてさらに詳細に記載されるDCU特有の追加510を含む。また、SAOC特有の構成は、SAOC特有の構成の長さを調整するために用いられる1以上のフィルビット「ByteAlign()」を含む。加えて、SAOC特有の構成は、任意に、さらに構成パラメータを含むSAOC拡張構成を含む。
DCUの設定がSAOCエンコーダかデコーダ/変換コーダによって決定されるかどうか定義する。より正確に言うと、「bsDcuFlag」=1は、SAOCエンコーダによるSAOCSpecificConfig()において特定される値「bsDcuMode」および「bsDcuParam」がDCUに適用されることを意味するのに対して、「bsDcuFlag」=0は、(デフォルト値によって初期化される)変数「bsDcuMode」および「bsDcuParam」がSAOCデコーダ/変換コーダアプリケーションまたはユーザによってさらに修正されうることを意味する。
DCUのモードを定義する。より正確に言うと、「bsDcuMod」=0は、「ダウンミックス類似の」レンダリングモードがDCUによって適用されることを意味するのに対して、「bsDcuMode」=1は、「ベストエフォート型」レンダリングモードがDCUアルゴリズムによって適用されることを意味する。
DCUアルゴリズムのための混合パラメータ値を定義する。ここで、図5bの表は、「bsDcuParam」パラメータのための量子化テーブルを示す。
その場合、DCU設定(例えば、DCUモード「bsDcuMode」および混合パラメータ設定「bsDcuParam」)がSAOCエンコーダ(例えば、「bsDcuFlag」=1)によって明確に特定される場合、SAOCデコーダ/変換コーダは、直接的にこれらの値をDCUに適用する。DCU設定が、明確に特定されない(例えば、「bsDcuFlag」=0)場合、SAOCデコーダ/変換コーダはデフォルト値を使用し、それらを修正するために、SAOCデコーダ/変換コーダまたはユーザを許容する。第1の量子化インデックス(例えば、idx=0)は、DCUを使用不能にするために使用されうる。あるいは、DCUデフォルト値(「bsDcuParam」)は、「0」、すなわち、DCUを使用不能にするか、または、「1」、すなわち、完全に制限することでありうる。
7.1. リスニングテスト設計
主観的なリスニングテストは、提案されたDCMコンセプトの知覚的なパフォーマンスを評価して、それを正規のSAOC・RM復号化/変換符号化処理の結果と比較するために行われた。他のリスニングテストと比較して、このテストの作業は、2つの優良な態様に関して極端なレンダリング状況(「オブジェクトを単独で行う」「オブジェクトを弱める」)のベストの録音品質を考慮することである:
1.(ターゲットオブジェクトの良好な減衰/ブースティング)レンダリングのオブジェクトを達成すること
2.全体の場面音質(歪み、アーティファクト、不自然さを考慮すること)
極端なおよび重要なレンダリングを伴う以下の項目が、CfPリスニングテストの材料から現在のリスニングテストのために選択された。
図6cの表において記載されるレンダリングオブジェクトゲインは、考慮されたアップミックスシナリオに対して適用される。
主観的なリスニングテストは、高品質のリスニングを可能とするように設計されている音響的に隔離されたリスニングルームにおいて実施された。再生は、ヘッドホン(STAX SR Lambda Pro with Lake−People D/A−ConverterおよびSTAX SRM−Monitor)を使用して行われた。
オーディオ項目ごとに対して:
− 最初、システムユーザとしてのあなたが達成することを望む所望サウンドミックスの説明を読む
項目「BlackCoffe」 サウンドミックスの範囲内のソフトな金管楽器セクション
項目「VoiceOverMusic」ソフトなバックグラウンド音楽
項目「Audition」 強いボーカルおよびソフトな音楽
項目「LovePop」 サウンドミックスの範囲内のソフトな弦楽セクション
−そして、両方とも記載するために1つの一般の等級を使用している信号を等級分けする
− 所望のサウンドミックスのレンダリングオブジェクトを達成すること
− 全体的なシーンのサウンド品質(歪み、アーティファクト、不自然さ、空間的な歪み...を考慮する)
図7のグラフ図に示される図面はすべてのリスナーに対する項目につき平均値、および関連した95%の信頼区間とともに全ての評価項目の統計平均値を示す。
上記の議論を要約するために、SAOCにおける歪み制御のためのレンダリング係数制限スキームが記載されている。本発明による実施形態は、最近、提案された(例えば、非特許文献1、非特許文献2、非特許文献3、非特許文献4および非特許文献5を参照)複数のオーディオオブジェクトを含んでいるオーディオシーンのビットレートの効率的な伝送/蓄積のためのパラメータの技術と組み合わせて使用されうる。
いくつかの態様が装置に関連して説明されたが、これらの態様も対応する方法の説明を表すことは明らかである、ここで、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同じように、方法ステップの文脈にも記載されている態様は、対応する装置の対応するブロックまたは項目あるいは特徴の説明を表す。方法ステップのいくらかまたは全ては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路のようなハードウェア装置(または使用すること)によって実行されうる。いくつかの実施形態において、最も重要な方法ステップのいくつかの1つ以上は、この種の装置によって実行されうる。
Claims (20)
- オーディオコンテンツのビットストリーム表現(300)において含まれるダウンミックス信号表現(110;210)およびオブジェクト関連パラメトリック情報に基づいて、および複数のオーディオオブジェクトの所望の寄与を1以上の出力オーディオチャネルに定義するユーザ指定のレンダリングマトリックス(144,Mren)に依存して、アップミックス信号表現(130;230)を提供するためのオーディオ処理装置(100;200)であって、前記装置は、
ユーザ指定のレンダリングマトリックス(Mren)と線形結合パラメータ(146;gDCU)に基づく歪みのないターゲットレンダリングマトリックス(Mren,tar)との線形結合を用いて、修正レンダリングマトリックス(142;Mren,lim)を得るために構成されるディストーションリミッタ(140;240)と、
前記修正レンダリングマトリックスを用いて、前記ダウンミックス信号表現および前記オブジェクト関連パラメトリック情報に基づいて前記アップミックス信号表現を得るために構成される信号プロセッサ(148;248)と、を含み、
ここで、前記装置は、前記線形結合パラメータを得るために、前記線形結合パラメータ(146;gDCU)を表しているビットストリーム要素(306;bsDcuParameter)を評価するように構成される、装置(100;200)。 - 前記ディストーションリミッタは、前記ターゲットレンダリングマトリックス(Mren,tar)を得るために構成され、前記ターゲットレンダリングマトリックスは、歪みのないターゲットレンダリングマトリックスである、請求項1に記載の装置(100;200)。
- 前記ディストーションリミッタは、前記ターゲットレンダリングマトリックス(Mren,tar)を得るために構成され、前記ターゲットレンダリングマトリックスは、ターゲットレンダリングマトリックスに類似のダウンミックスである、請求項1ないし請求項3のいずれかに記載の装置(100;200)。
- 前記ディストーションリミッタは、前記ターゲットレンダリングマトリックス(Mren,tar)を得るために構成され、その結果、前記ターゲットレンダリングマトリックスは、ベストエフォート型ターゲットレンダリングマトリックスである、請求項1ないし請求項3のいずれかに記載の装置(100;200)。
- 前記ディストーションリミッタは、前記ターゲットレンダリングマトリックス(Mren,tar)を得るために構成され、その結果、前記ターゲットレンダリングマトリックスは、ダウンミックスマトリックス(D)および前記ユーザ指定のレンダリングマトリックス(Mren)に依存する、請求項1ないし請求項3、または請求項6のいずれかに記載の装置(100;200)。
- 前記ディストーションリミッタは、アップミックス信号表現を提供するための前記装置の複数の出力オーディオチャネルのためのチャネル個別のエネルギー規格化値を含むマトリックス(NBE)を算出するために構成され、前記装置の所与の出力オーディオチャネルのためのエネルギー規格化値は、少なくとも、ほぼ、複数のオーディオオブジェクトのための前記ユーザ指定のレンダリングマトリックスにおける前記所与の出力オーディオチャネルと関連するエネルギーレンダリング値の合計と前記複数のオーディオオブジェクトのためのエネルギーダウンミックス値の合計との間の比率を記載し、
ここで、ディストーションリミッタは、前記所与の出力チャネルと関連する前記ターゲットレンダリングマトリックス(Mren,tar)の一組のレンダリング値を得るために、チャネル個別のエネルギー規格化値を用いて一組のダウンミックス値を拡大・縮小するために構成される、請求項1ないし請求項3、請求項6または請求項7のいずれかに記載の装置(100;200)。 - 前記ディストーションリミッタは、前記ユーザ指定のレンダリングマトリックス(Mren)およびダウンミックスマトリックス(D)に依存して、前記装置の複数の出力オーディオチャネルのためのチャネル個別のエネルギー規格化値を記載しているマトリックスを算出するように構成され、
ここで、前記ディストーションリミッタは、前記ダウンミックス信号表現の異なるチャネルと関連する1組のダウンミックス値の線形結合として、前記装置の所与の出力オーディオチャネルと関連する前記ターゲットレンダリングマトリックス(Mren,tar)の1組のレンダリング係数を得るために前記チャネル個別のエネルギー規格化値を記載している前記マトリックスを適用するために構成される、請求項1ないし請求項3、請求項6ないし請求項7のいずれかに記載の装置(100;200)。 - 前記装置は、前記オーディオコンテンツの前記ビットストリーム表現から前記線形結合パラメータ(gDCU)を表しているインデックス値(idx)を読み取るために、およびパラメータ量子化テーブルを用いて、前記インデックス値を前記線形結合パラメータ(gDCU)にマッピングするために構成される、請求項1ないし請求項13のいずれかに記載の装置(100;200)。
- 前記量子化テーブルは、不均一性の量子化を記載し、ここで、修正レンダリングマトリックス(Mren,lim)に前記ユーザ指定のレンダリングマトリックス(Mren)のより強い寄与を記載する前記線形結合パラメータ(gDCU)のより小さい値は、より高い解像度によって量子化される、請求項14に記載の装置(100;200)。
- 前記装置は、ディストーションリミテーションモードを記載しているビットストリーム要素(bsDcuMode)を評価するために構成され、ここで、前記ディストーションリミッタは、前記ターゲットレンダリングマトリックスがダウンミックス類似のターゲットレンダリングマトリックスであるか、または前記ターゲットレンダリングマトリックスが、ベストエフォート型ターゲットレンダリングマトリックスであるように、前記ターゲットレンダリングマトリックスを選択的に得るために構成される、請求項1ないし請求項15のいずれかに記載の装置(100;200)。
- マルチチャネルオーディオ信号を表しているビットストリーム(170)を提供するための装置(150)であって、前記装置は、
複数のオーディオオブジェクト信号(160a−160N)に基づいてダウンミックス信号(182)を提供するために構成されるダウンミキサーと、
前記オーディオオブジェクト信号(160a−160N)の特徴およびダウンミックスパラメータを記載しているオブジェクト関連パラメトリックサイド情報(186)、および前記ビットストリームに基づくアップミックス信号を提供するための装置(100;200)によって用いられる修正レンダリングマトリックス(Mren,lim)にユーザ指定のレンダリングマトリックス(Mren)およびターゲットレンダリングマトリックス(Mren,tar)の所望の寄与を記載している線形結合パラメータ(188)を提供するために構成される、サイド情報プロバイダ(184)と、
前記ダウンミックス信号、前記オブジェクト関連パラメトリックサイド情報および前記線形結合パラメータの表現を含むビットストリーム(170)を提供するために構成されるビットストリームフォーマッタ(190)と、
を含み、
ここで、前記ユーザ指定のレンダリングマトリックス(144,Mren)は、複数のオーディオオブジェクトの所望の寄与を1以上の出力オーディオチャネルに定義する、
装置。 - オーディオコンテンツのビットストリーム表現において含まれるダウンミックス信号表現およびオブジェクト関連パラメトリック情報に基づき、および複数のオーディオオブジェクトの所望の寄与を1以上の出力オーディオチャネルに定義するユーザ指定のレンダリングマトリックスに依存して、アップミックス信号表現を提供するためのオーディオ処理の方法であって、前記方法は、
線形結合パラメータを得るために、前記線形結合パラメータを表しているビットストリーム要素を評価するステップと、
前記線形結合パラメータに依存して、ユーザ指定のレンダリングマトリックスおよび歪みのないターゲットレンダリングマトリックスの線形結合を用いて修正レンダリングマトリックスを得るステップと、
前記修正レンダリングマトリックスを用いて、前記ダウンミックス信号表現および前記オブジェクト関連パラメトリック情報に基づいて前記アップミックス信号表現を得るステップと、
を含む、方法。 - マルチチャネルオーディオ信号を表しているビットストリームを提供するための方法であって、前記方法は、
複数のオーディオオブジェクト信号に基づいてダウンミックス信号を提供するステップと、
前記オーディオオブジェクト信号およびダウンミックスパラメータの特徴を記載しているオブジェクト関連パラメトリックサイド情報、および修正レンダリングマトリックスにユーザ指定のレンダリングマトリックスおよびターゲットレンダリングマトリックスの所望の寄与を記載している線形結合パラメータを提供するステップと、
前記ダウンミックス信号、前記オブジェクト関連パラメトリックサイド情報および前記線形結合パラメータの表現を含むビットストリームを提供するステップと、
を含み、
ここで、前記ユーザ指定のレンダリングマトリックスは、複数のオーディオオブジェクトの所望の寄与を1以上の出力オーディオチャネルに定義する、
方法。 - コンピュータプログラムは、コンピュータで実行される場合、請求項18または請求項19による方法を実行するための前記コンピュータプログラムである、コンピュータプログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26304709P | 2009-11-20 | 2009-11-20 | |
US61/263,047 | 2009-11-20 | ||
US36926110P | 2010-07-30 | 2010-07-30 | |
EP10171452 | 2010-07-30 | ||
US61/369,261 | 2010-07-30 | ||
EP10171452.5 | 2010-07-30 | ||
PCT/EP2010/067550 WO2011061174A1 (en) | 2009-11-20 | 2010-11-16 | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013511738A JP2013511738A (ja) | 2013-04-04 |
JP5645951B2 true JP5645951B2 (ja) | 2014-12-24 |
Family
ID=44059226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012539298A Active JP5645951B2 (ja) | 2009-11-20 | 2010-11-16 | ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム |
Country Status (15)
Country | Link |
---|---|
US (1) | US8571877B2 (ja) |
EP (1) | EP2489038B1 (ja) |
JP (1) | JP5645951B2 (ja) |
KR (1) | KR101414737B1 (ja) |
CN (1) | CN102714038B (ja) |
AU (1) | AU2010321013B2 (ja) |
BR (1) | BR112012012097B1 (ja) |
CA (1) | CA2781310C (ja) |
ES (1) | ES2569779T3 (ja) |
MX (1) | MX2012005781A (ja) |
MY (1) | MY154641A (ja) |
PL (1) | PL2489038T3 (ja) |
RU (1) | RU2607267C2 (ja) |
TW (1) | TWI441165B (ja) |
WO (1) | WO2011061174A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2011011399A (es) | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
US10158958B2 (en) | 2010-03-23 | 2018-12-18 | Dolby Laboratories Licensing Corporation | Techniques for localized perceptual audio |
CN116390017A (zh) | 2010-03-23 | 2023-07-04 | 杜比实验室特许公司 | 音频再现方法和声音再现系统 |
KR20120071072A (ko) * | 2010-12-22 | 2012-07-02 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
KR101685447B1 (ko) | 2011-07-01 | 2016-12-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법 |
KR101903664B1 (ko) * | 2012-08-10 | 2018-11-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법 |
EP2717265A1 (en) | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding |
CN105009207B (zh) | 2013-01-15 | 2018-09-25 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
WO2014112793A1 (ko) | 2013-01-15 | 2014-07-24 | 한국전자통신연구원 | 채널 신호를 처리하는 부호화/복호화 장치 및 방법 |
EP2804176A1 (en) | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
CN117059107A (zh) | 2013-05-24 | 2023-11-14 | 杜比国际公司 | 对音频场景进行解码的方法、装置及计算机可读介质 |
KR101761099B1 (ko) | 2013-05-24 | 2017-07-25 | 돌비 인터네셔널 에이비 | 오디오 인코딩 및 디코딩 방법들, 대응하는 컴퓨터-판독 가능한 매체들 및 대응하는 오디오 인코더 및 디코더 |
CN105229731B (zh) | 2013-05-24 | 2017-03-15 | 杜比国际公司 | 根据下混的音频场景的重构 |
CN110085240B (zh) | 2013-05-24 | 2023-05-23 | 杜比国际公司 | 包括音频对象的音频场景的高效编码 |
WO2014187990A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
KR102243395B1 (ko) | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
US10095468B2 (en) | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
EP3074970B1 (en) | 2013-10-21 | 2018-02-21 | Dolby International AB | Audio encoder and decoder |
EP3069528B1 (en) * | 2013-11-14 | 2017-09-13 | Dolby Laboratories Licensing Corporation | Screen-relative rendering of audio and encoding and decoding of audio for such rendering |
EP2879131A1 (en) * | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
JP6439296B2 (ja) * | 2014-03-24 | 2018-12-19 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US9756448B2 (en) | 2014-04-01 | 2017-09-05 | Dolby International Ab | Efficient coding of audio scenes comprising audio objects |
WO2015183060A1 (ko) * | 2014-05-30 | 2015-12-03 | 삼성전자 주식회사 | 오디오 객체를 이용한 오디오 콘텐트 제공 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
CN105227740A (zh) * | 2014-06-23 | 2016-01-06 | 张军 | 一种实现移动终端三维声场听觉效果的方法 |
JP6412259B2 (ja) * | 2014-10-03 | 2018-10-24 | ドルビー・インターナショナル・アーベー | パーソナル化されたオーディオへのスマート・アクセス |
TWI587286B (zh) | 2014-10-31 | 2017-06-11 | 杜比國際公司 | 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 |
CN112954580B (zh) * | 2014-12-11 | 2022-06-28 | 杜比实验室特许公司 | 元数据保留的音频对象聚类 |
CN105989845B (zh) | 2015-02-25 | 2020-12-08 | 杜比实验室特许公司 | 视频内容协助的音频对象提取 |
CA3219512A1 (en) | 2015-08-25 | 2017-03-02 | Dolby International Ab | Audio encoding and decoding using presentation transform parameters |
CN108665902B (zh) | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
WO2019197404A1 (en) * | 2018-04-11 | 2019-10-17 | Dolby International Ab | Methods, apparatus and systems for 6dof audio rendering and data representations and bitstream structures for 6dof audio rendering |
GB2593136B (en) * | 2019-12-18 | 2022-05-04 | Nokia Technologies Oy | Rendering audio |
CN113641915B (zh) * | 2021-08-27 | 2024-04-16 | 北京字跳网络技术有限公司 | 对象的推荐方法、装置、设备、存储介质和程序产品 |
US20230091209A1 (en) * | 2021-09-17 | 2023-03-23 | Nolan Den Boer | Bale ripper assembly for feed mixer apparatus |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1307612C (zh) * | 2002-04-22 | 2007-03-28 | 皇家飞利浦电子股份有限公司 | 声频信号的编码解码方法、编码器、解码器及相关设备 |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
KR100663729B1 (ko) * | 2004-07-09 | 2007-01-02 | 한국전자통신연구원 | 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 |
EP1829424B1 (en) | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
CN103366747B (zh) * | 2006-02-03 | 2017-05-17 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
WO2007111568A2 (en) | 2006-03-28 | 2007-10-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for a decoder for multi-channel surround sound |
PL2112652T3 (pl) * | 2006-07-07 | 2013-04-30 | Fraunhofer Ges Forschung | Urządzenie i sposób do łączenia wielu zakodowanych parametrycznie źródeł audio |
CN101529501B (zh) * | 2006-10-16 | 2013-08-07 | 杜比国际公司 | 音频对象编码器和音频对象编码方法 |
EP2082397B1 (en) * | 2006-10-16 | 2011-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
JP5941610B2 (ja) * | 2006-12-27 | 2016-06-29 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute | トランスコーディング装置 |
KR20090122221A (ko) | 2007-02-13 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
JP5232795B2 (ja) * | 2007-02-14 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースのオーディオ信号の符号化及び復号化方法並びにその装置 |
CN101849257B (zh) * | 2007-10-17 | 2016-03-30 | 弗劳恩霍夫应用研究促进协会 | 使用下混合的音频编码 |
KR101024924B1 (ko) * | 2008-01-23 | 2011-03-31 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 이의 장치 |
JP5536674B2 (ja) * | 2008-03-04 | 2014-07-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 入力データストリームのミキシング及びそこからの出力データストリームの生成 |
US8315396B2 (en) * | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
-
2010
- 2010-11-16 WO PCT/EP2010/067550 patent/WO2011061174A1/en active Application Filing
- 2010-11-16 AU AU2010321013A patent/AU2010321013B2/en active Active
- 2010-11-16 EP EP10779542.9A patent/EP2489038B1/en active Active
- 2010-11-16 MY MYPI2012002219A patent/MY154641A/en unknown
- 2010-11-16 JP JP2012539298A patent/JP5645951B2/ja active Active
- 2010-11-16 PL PL10779542T patent/PL2489038T3/pl unknown
- 2010-11-16 BR BR112012012097-2A patent/BR112012012097B1/pt active IP Right Grant
- 2010-11-16 CA CA2781310A patent/CA2781310C/en active Active
- 2010-11-16 KR KR1020127013091A patent/KR101414737B1/ko active IP Right Grant
- 2010-11-16 RU RU2012127554A patent/RU2607267C2/ru not_active Application Discontinuation
- 2010-11-16 CN CN201080062050.2A patent/CN102714038B/zh active Active
- 2010-11-16 ES ES10779542.9T patent/ES2569779T3/es active Active
- 2010-11-16 MX MX2012005781A patent/MX2012005781A/es active IP Right Grant
- 2010-11-19 TW TW099139952A patent/TWI441165B/zh active
-
2012
- 2012-05-18 US US13/475,084 patent/US8571877B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
ES2569779T3 (es) | 2016-05-12 |
US8571877B2 (en) | 2013-10-29 |
CN102714038B (zh) | 2014-11-05 |
PL2489038T3 (pl) | 2016-07-29 |
TW201131553A (en) | 2011-09-16 |
CA2781310A1 (en) | 2011-05-26 |
EP2489038B1 (en) | 2016-01-13 |
KR101414737B1 (ko) | 2014-07-04 |
CN102714038A (zh) | 2012-10-03 |
AU2010321013A1 (en) | 2012-07-12 |
US20120259643A1 (en) | 2012-10-11 |
CA2781310C (en) | 2015-12-15 |
AU2010321013B2 (en) | 2014-05-29 |
MY154641A (en) | 2015-07-15 |
WO2011061174A1 (en) | 2011-05-26 |
JP2013511738A (ja) | 2013-04-04 |
TWI441165B (zh) | 2014-06-11 |
RU2012127554A (ru) | 2013-12-27 |
MX2012005781A (es) | 2012-11-06 |
KR20120084314A (ko) | 2012-07-27 |
BR112012012097B1 (pt) | 2021-01-05 |
EP2489038A1 (en) | 2012-08-22 |
RU2607267C2 (ru) | 2017-01-10 |
BR112012012097A2 (pt) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5645951B2 (ja) | ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム | |
JP5719372B2 (ja) | アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム | |
CA2777665C (en) | Apparatus, method and computer program for providing one or more adjusted parameters for provision of an upmix signal representation on the basis of a downmix signal representation and a parametric side information associated with the downmix signal representation, using an average value | |
CN101228575B (zh) | 利用侧向信息的声道重新配置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130925 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131127 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140320 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5645951 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |