[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5191886B2 - サイド情報を有するチャンネルの再構成 - Google Patents

サイド情報を有するチャンネルの再構成 Download PDF

Info

Publication number
JP5191886B2
JP5191886B2 JP2008514770A JP2008514770A JP5191886B2 JP 5191886 B2 JP5191886 B2 JP 5191886B2 JP 2008514770 A JP2008514770 A JP 2008514770A JP 2008514770 A JP2008514770 A JP 2008514770A JP 5191886 B2 JP5191886 B2 JP 5191886B2
Authority
JP
Japan
Prior art keywords
channel
audio signals
audio
signal
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008514770A
Other languages
English (en)
Other versions
JP2008543227A5 (ja
JP2008543227A (ja
Inventor
シーフェルト、アラン・ジェフリー
ビントン、マーク・ステュアート
ロビンソン、チャールズ・キト
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2008543227A publication Critical patent/JP2008543227A/ja
Publication of JP2008543227A5 publication Critical patent/JP2008543227A5/ja
Application granted granted Critical
Publication of JP5191886B2 publication Critical patent/JP5191886B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Description

広くDVDプレーヤーが導入されるようになるとともに、家庭内でマルチチャンネル(3チャンネル以上の)オーディオ再生システムを用いることが一般的になってきている。加えて、マルチチャンネルオーディオシステムを自動車内に搭載するのが普通となり、次世代衛星無線システム及び地上デジタル無線システムでは、マルチチャンネルコンテンツを増大しつつあるマルチチャンネル再生環境に送信することが強く求められている。しかしながら多くの場合、マルチチャンネルコンテンツの将来のプロバイダは、そのような素材が底をつく恐れに直面している。例えば、多くのポピュラー音楽は、依然として、2チャンネル立体音響(ステレオ)トラックだけのものとして存在している。ということで、モノラルの形態(モノ)又はステレオの形態で存在するような「レガシー」コンテンツを「アップミックス」する需要がある。
この変換を行うための従来技術による解決手段は存在する。例えば、ドルビープロロジックII(Dolby Pro logic II)は、オリジナルステレオ録音を受け取り、ステレオ録音自身から導き出したステアリング情報に基づきマルチチャンネルのアップミックスを生成する。「ドルビー」、「プロロジック」、及び「プロロジックII」はドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である。このようなアップミックスを消費者に配信するために、コンテンツプロバイダは、コンテンツ作成時にアップミックス手段をレガシーコンテンツに適用し、その結果できあがったマルチチャンネル信号を、ドルビーデジタルのような適切なマルチチャンネル配信形態で消費者に送信する。「ドルビーデジタル」は、ドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である。あるいは、レガシーコンテンツに手を加えず消費者に送ってもよく、消費者はそこで再生時にアップミックス処理を適用する。前者の場合、コンテンツプロバイダは、このアップミックスを生成するための方法を完全に管理することができ、これは、コンテンツプロバイダの観点からは好ましいことである。加えて、制作側での処理における制約は、再生する側での制約より、一般にはるかに少ないので、より洗練されたアップミックス技術を適用することができる。しかし、アップミックスを制作側で行うことにはいくつかの欠点がある。まず第1に、レガシーな形態の信号に比べてマルチチャンネル信号の伝送はオーディオチャンネルの数が増えるので高価となる。また、消費者がマルチチャンネル再生システムを所持していない場合、伝送したマルチチャンネル信号は、通常は再生する前にダウンミックスする必要がある。このダウンミックスした信号は、通常は元のレガシーコンテンツと同一ではなく、多くの場合は元のサウンドより劣るサウンドとなる。
図1及び2は、前記のような、それぞれ制作側と消費側で適用されるアップミックスの従来技術の例を示している。これらの例では、オリジナル信号はM=2チャンネルであり、アップミックスされた信号はN=6チャンネルであると仮定している。図1の例において、アップミックスは制作側で行われる一方、図2では、アップミックスは消費側で行われる。図2におけるようなアップミックスは、アップミックスが適用されるオーディオ信号のみをアップミキサーが受け取り、しばしば「ブラインド」アップミックスと称される。
図1を参照して、オーディオシステムの制作部分2において、Mチャンネルのオリジナル信号からなる1以上のオーディオ信号に、Nチャンネルのアップミックス信号からなる数を増やしたオーディオ信号を制作するアップミックス装置又はアップミックス機能(アップミックス)4が適用される(この図又は他の図において、各オーディオ信号は、左チャンネル、右チャンネル、等のような、チャンネルで表現されている)。アップミックス信号には、Nチャンネルのアップミックス信号を伝送又は記憶に適した形にフォーマットするフォーマッタ装置又はフォーマット機能(フォーマット)6が適用される。このフォーマット機能にはデータ圧縮エンコーディングを含めることができる。フォーマットされた信号は、そこでデフォーマット機能又はデフォーマット装置(デフォーマット)10によりこのフォーマットされた信号がNチャンネルのアップミックス信号(又はそれらの近似)に復元される、オーディオシステムの消費部分8で受け取られる。上述のように、場合によっては、ダウンミックス装置又はダウンミックス機能(ダウンミックス)12により、Nチャンネルのアップミックス信号はMチャンネルのダウンミックス信号(又はそれらの近似)にダウンミックスされる。ここでM<Nである。
図2参照して、オーディオシステムの制作部分14において、Mチャンネルのオリジナル信号からなる1以上のオーディオ信号に、このオーディオ信号を伝送又は記憶に適した形にフォーマットするフォーマッタ装置又はフォーマット機能(フォーマット)6が適用される(この図又は他の図において、異なった図において本質的に同じ装置又は機能には同じ参照番号が用いられる)。このフォーマット機能にはデータ圧縮エンコーディングを含めることができる。フォーマットされた信号は、そこでデフォーマット機能又はデフォーマット装置(デフォーマット)10によりこのフォーマットされた信号がMチャンネルのオリジナル信号(又はそれらの近似)に復元される、オーディオシステムの消費部分16で受け取られる。このMチャンネルのオリジナル信号を出力として供給することができ、これにも、Mチャンネルのオリジナル信号をアップミックスしてNチャンネルのアップミックス信号を作り出す、アップミックス機能又はアップミックス装置(アップミックス)18が適用される。
本発明の特徴によれば、図1及び2の構成に対する代替案が提示される。例えば、本発明の特徴によれば、制作側又は消費側でレガシーコンテンツをアップミックスするのではなく、例えば、エンコーダでの処理によりレガシーコンテンツを分析することで、例えばデコーダでのさらなる処理工程へとレガシーコンテンツのオーディオ情報と一緒に、何らかの方法で、送信される補助的な「サイド」情報、又は「サイドチェーン」情報を生成することができる。サイド情報を送る方法は本発明にとって重要ではない。サイド情報送る多くの方法が知られており、それには、例えば、オーディオ情報内にサイド情報を埋め込むこと(例えばサイド情報を隠すこと)、又は、(例えば、自身のビットストリーム内に、又はオーディオ情報と共に多重化して)サイド情報別に送ることが含まれる。本明細書において、「エンコーダ」と「デコーダ」はそれぞれ、制作に関連する装置又は処理と、消費に関連する装置又は処理とを称し、このような装置又は処理には、データ圧縮「エンコーディング」とデータ圧縮「デコーディング」が含まれても含まれなくてもよい。エンコーダにより生成されるサイド情報は、どのようにレガシーコンテンツをアップミックスするかをデコーダに指示することができる。このようにして、デコーダはサイド情報の助けを得てアップミックスする。アップミックス技法の制御は制作側で行うことができるが、消費側でも、もしマルチチャンネル再生システムが使えない場合に手を加えていない状態で再生することができる未処理のレガシーコンテンツを受信することができる。加えて、エンコーダでレガシーコンテンツを分析するための大きな処理能力を用いて、高品質のアップミックスを行うためのサイド情報生成し、デコーダでは、レガシーコンテンツを導出するのではなくこのサイド情報を適用するだけなので、はるかに少ない処理原資を使うだけでよくなる。最後に、サイド情報のアップミックスのコストは一般に非常に低い。
本発明とその種々の特徴はアナログ信号又はデジタル信号の使用を必要とするが、実際の応用では、ほとんど又は全ての処理又は機能は、オーディオ信号がサンプルにより表現されるデジタル信号ストリーム上のデジタル領域で行われるであろう。本発明による信号処理は、広帯域信号、又はマルチバンドのプロセッサの各周波数帯域に適用され、実施例に応じて、サンプルごとに、又は、デジタルオーディオをブロックに分割したときのサンプルのブロックのような1組のサンプルごとに実行される。マルチバンドの実施形態では、フィルターバンク構成、又は変換処理による構成を採用することができる。したがって、図3、4A〜4C、5A〜5C、及び6に示した本発明の実施形態の例では、(例えばPCM信号のような)時間領域でのデジタル信号を受け取り、人間の耳の臨界帯域に関連付けた複数の周波数帯域での処理のために、適当な時間・周波数変換器又は変換処理を適用する。処理の後、信号は変換して時間領域に戻すことができる。原則として、フィルターバンク、又は信号変換のどちらでも、時間から周波数への変換又はその逆の変換を行うために用いることができる。本明細書に記載した発明の実施形態の詳細例では、時間から周波数への信号変換、すなわち短時間離散フーリエ変換(STDFT)を採用する。しかし当然のことながら、本発明はその種々の特徴において、特定の時間から周波数への変換器又は変換処理を用いることに限定されるものではない。
本発明の1つの形態は、各オーディオ信号が1つのオーディオチャンネルを表現する、少なくとも1つのオーディオ信号、又はこの少なくとも1つのオーディオ信号と同じ数のチャンネルを持つ少なくとも1つのオーディオ信号を修正したものを処理するための方法であって、少なくとも1つのオーディオ信号又はそれを修正したものをチャンネル再構成するための指令を導き出すステップであって、導き出したものにより受け取られるオーディオ情報のみがこの少なくとも1つのオーディオ信号又はそれを修正したものであることを特徴とするステップと、(1)少なくとも1つのオーディオ信号又はそれを修正したもの、及び(2)チャンネル再構成するための指令とを含む出力を出力するステップとを具備するが、このようなチャンネルの再構成が、前記チャンネル再構成するための指令の結果である場合は、少なくとも1つのオーディオ信号又はそれを修正したもののチャンネルの再構成は含まれないことを特徴とする方法である。この少なくとも1つのオーディオ信号又はそれを修正したものは、それぞれ、2以上のオーディオ信号となることができ、この場合、修正された2以上の信号はマトリックスエンコードで修正されたものであり、マトリックスデコーダ又は能動マトリックスデコーダでデコードされるとき、修正された2以上のオーディオ信号は、修正されていない2以上のオーディオ信号のデコーディングに関して、改良したマルチチャンネルデコーディングとなることができる。デコーディングは、例えばチャンネル分離、空間イメージング、イメージの安定性、等を含む、マトリックスデコーダのような、どのような既知のデコーダの性能特性からみても「改良」されている。
この少なくとも1つのオーディオ信号及びそれを修正したものが2以上のオーディオ信号であろうとなかろうと、チャンネルを再構成させる指令にはいくつかの代案がある。1つの代案によれば、この指令は、アップミックスするためのこの指令によりアップミックスされたとき、結果得られたオーディオ信号の数が、少なくとも1つのオーディオ信号又はそれを修正したものからなるオーディオ信号の数より大きくなるように、この少なくとも1つのオーディオ信号又はそれを修正したものをアップミックスさせるためのものである。チャンネルを再構成させる指令の他の代案によれば、少なくとも1つのオーディオ信号及びそれを修正したものは2以上のオーディオ信号となっている。最初のこのような代案において、この指令は、ダウンミックスするためのこの指令によりダウンミックスされたとき、結果得られたオーディオ信号の数が、少なくとも1つのオーディオ信号又はそれを修正したものからなるオーディオ信号の数より小さくなるように、2以上のオーディオ信号をダウンミックスさせるためのものである。2つ目のこのような代案において、この指令は、再構成させるための指令により再構成されたとき、オーディオ信号の数は同じであるが、このようなオーディオ信号を再生する1以上の空間位置が変化するように、2以上のオーディオ信号を再構成させるためのものである。出力におけるこの少なくとも1つのオーディオ信号又はそれを修正したものは、それぞれ、少なくとも1つのオーディオ信号又はそれを修正したもののデータ圧縮したものであってもよい。
どの代案においても、データ圧縮なされていてもいなくても、チャンネル再構成させるための指令の結果再構成されたチャンネルを参照することなく、指令を導き出すことができる。この少なくとも1つのオーディオ信号を周波数帯域に分割してもよく、チャンネル再構成させるための指令は、このような周波数帯域のそれぞれに対する指令であってもよい。本発明の他の形態には、このような方法を実行するオーディオエンコーダが含まれる。
本発明の他の1つの形態は、各オーディオ信号が1つのオーディオチャンネルを表現する、少なくとも1つのオーディオ信号、又はこの少なくとも1つのオーディオ信号と同じ数のチャンネルを持つ少なくとも1つのオーディオ信号を修正したものを処理するための方法であって、少なくとも1つのオーディオ信号又はそれを修正したものをチャンネル再構成するための指令を導き出すステップであって、導き出したものにより受け取られるオーディオ情報のみがこの少なくとも1つのオーディオ信号又はそれを修正したものであることを特徴とするステップと、(1)少なくとも1つのオーディオ信号又はそれを修正したもの、及び(2)チャンネルを再構成するための指令とを含むが、このようなチャンネルの再構成が、前記チャンネル再構成するための指令の結果である場合は、少なくとも1つのオーディオ信号又はそれを修正したもののチャンネルの再構成は含まれない出力を出力するステップと、この出力を受信するステップとを具備することを特徴とする方法である。
この方法はさらに、受信したチャンネルの再構成するための指令を用いて、受信した少なくとも1つのオーディオ信号又はそれを修正したもののチャンネルを再構成するステップを具備する。この少なくとも1つのオーディオ信号又はそれを修正したものは、それぞれ、2以上のオーディオ信号となることができ、この場合、修正された2以上の信号はマトリックスエンコードで修正されたものであり、マトリックスデコーダ又は能動マトリックスデコーダでデコードされるとき、修正された2以上のオーディオ信号は、修正されていない2以上のオーディオ信号のデコーディングに関して、改良したマルチチャンネルデコーディングとなることができる。「改良」の語は、本発明の最初の形態における場合と同じ意味で用いられる。
本発明の最初の形態と同様に、チャンネルの再構成するための指令には代案がある。例えば、アップミックスさせること、ダウンミックスさせること、及びオーディオ信号の数は同じであるが、このようなオーディオ信号を再生する1以上の空間位置が変化するように、再構成させることである。本発明の最初の形態と同様に、出力におけるこの少なくとも1つのオーディオ信号又はそれを修正したものは、この少なくとも1つのオーディオ信号又はそれを修正したもののデータ圧縮したものであってもよく、この場合、出力を受信するステップには、この少なくとも1つのオーディオ信号又はそれを修正したもののデータ伸張を行うステップを含むことができる。本発明のこの形態の全ての代案において、データ圧縮及びデータ伸張がなされていてもいなくても、チャンネル再構成させるための指令の結果再構成されたチャンネルを参照することなく、指令を導き出すことができる。
本発明の最初の形態と同様に、この少なくとも1つのオーディオ信号又はそれを修正したものを周波数帯域に分割してもよく、この場合、チャンネルを再構成させるための指令は、このような周波数帯域のそれぞれに対する指令であってもよい。この方法がさらに、受信した少なくとも1つのオーディオ信号又はそれを修正したものを、受信したチャンネル再構成のための指令を用いて再構成するステップを含むときは、この方法はさらに、(1)少なくとも1つのオーディオ信号又はそれを修正したもの、又は(2)少なくとも1つのオーディオ信号のチャンネル再構成したもの、の内の1つ出力をオーディオ出力として選択するステップを具備する。
本方法が、受信したチャンネル再構成のための指令を用いて、受信した少なくとも1つのオーディオ信号又はそれを修正したものを再構成するステップを具備してもしなくても、本方法は、この受信した少なくとも1つのオーディオ信号又はそれを修正したものに応答してオーディオ出力を出力するステップを含むことができ、この場合、このオーディオ出力中のこの少なくとも1つのオーディオ信号又はそれを修正したものが2つ以上のオーディオ信号であるときは、本方法は、この2つ以上のオーディオ信号をマトリックスデコーディングするステップをさらに具備することができる。
本方法が、受信したチャンネル再構成のための指令を用いて、受信した少なくとも1つのオーディオ信号又はそれを修正したものを再構成するステップをさらに具備するときは、本方法は、オーディオ信号を出力するステップをさらに具備することができる。
本発明の他の形態には、このような方法を実行するオーディオエンコーディング及びオーディオデコーディングシステム、このような方法を実行するシステムにおいて用いるオーディオエンコーダ及びオーディオデコーダ、このような方法を実行するシステムにおいて用いるオーディオエンコーダ、並びに、このような方法を実行するシステムにおいて用いるオーディオデコーダが含まれる。
本発明の他の1つの形態は、各オーディオ信号が1つのオーディオチャンネルを表現する、少なくとも1つのオーディオ信号、又はこの少なくとも1つのオーディオ信号と同じ数のチャンネルを持つ少なくとも1つのオーディオ信号を修正したものを処理するための方法であって、少なくとも1つのオーディオ信号又はそれを修正したもの、及び、この少なくとも1つのオーディオ信号又はそれを修正したもののチャンネル再構成のための指令であるが、チャンネル再構成のためのこの指令の結果生じた少なくとも1つのオーディオ信号又はそれを修正したもののチャンネル再構成は行わない指令を受信するステップであって、この指令は、受信したオーディオ情報のみがこの少なくとも1つのオーディオ信号又はそれを修正したものとなる指令導出方法により導き出されたものであることを特徴とするステップと、この指令を用いて、この少なくとも1つのオーディオ信号又はそれを修正したものをチャンネル再構成するステップと、を具備することを特徴とする方法である。この少なくとも1つのオーディオ信号及びそれを修正したものはそれぞれ2以上のオーディオ信号であってもよく、この場合は、修正された2以上の信号は、マトリックスエンコードによる修正であってもよく、マトリックスデコーダ又は能動マトリックスデコーダでデコードされるとき、修正された2以上のオーディオ信号は、修正されていない2以上のオーディオ信号のデコーディングに関して、改良したマルチチャンネルデコーディングとなることができる。「改良」の語は、上述した本発明の他の形態における場合と同じ意味で用いられる。
本発明の他の形態と同様に、チャンネルの再構成するための指令には代案がある。例えば、アップミックスさせること、ダウンミックスさせること、及びオーディオ信号の数は同じであるが、このようなオーディオ信号を再生する1以上の空間位置が変化するように、再構成させることである。
本発明の他の形態と同様に、出力中のこの少なくとも1つのオーディオ信号又はそれを修正したものは、この少なくとも1つのオーディオ信号又はそれを修正したもののデータ圧縮したものであってもよく、この場合、受信するステップにはこの少なくとも1つのオーディオ信号又はそれを修正したものをデータ圧縮するステップを含むことができる。本発明のこの形態の全ての代案において、データ圧縮及びデータ伸張がなされていてもいなくても、チャンネル再構成させるための指令の結果再構成されたチャンネルを参照することなく、指令を導き出すことができる。本発明の他の形態と同様に、この少なくとも1つのオーディオ信号又はそれを修正したものを周波数帯域に分割してもよく、この場合、チャンネルを再構成させるための指令は、このような周波数帯域のそれぞれに対する指令であってもよい。1つの代案では、本発明のこの形態ではさらに、(1)少なくとも1つのオーディオ信号又はそれを修正したもの、又は(2)少なくとも1つのオーディオ信号のチャンネル再構成したもの、の内の1つ出力をオーディオ出力として選択するステップを具備してもよい。もう1つの代案では、本発明のこの形態ではさらに、受信したこの少なくとも1つのオーディオ信号又はそれを修正したものに応答してオーディオ出力を出力するステップを具備してもよく、この場合、この少なくとも1つのオーディオ信号及びそれを修正したものは、それぞれ2以上のオーディオ信号とすることができ、この2以上のオーディオ信号はマトリックスコーディングされる。さらに他の代案では、本発明のこの形態ではさらに、受信した、チャンネル再構成したこの少なくとも1つのオーディオ信号又はそれを修正したものに応答してオーディオ出力を出力するステップを具備してもよい。本発明の他の形態では、これらの何れかの方法を実行するオーディオデコーダが含まれる。
本発明のさらに他の1つの形態は、各オーディオ信号が1つのオーディオチャンネルを表現する、少なくとも1つのオーディオ信号、又はこの少なくとも1つのオーディオ信号と同じ数のチャンネルを持つ少なくとも1つのオーディオ信号を修正したものを処理するための方法であって、少なくとも2つのオーディオ信号、及び、この少なくとも2つのオーディオ信号のチャンネル再構成のための指令であるが、チャンネル再構成のためのこの指令の結果生じた少なくとも2つのオーディオ信号のチャンネル再構成は行わない指令を受信するステップであって、この指令は、受信したオーディオ情報のみがこの少なくとも2つのオーディオ信号となる指令導出方法により導き出されたものであることを特徴とするステップと、この2以上のオーディオ信号をマトリックスデコードするステップとを具備することを特徴とする方法である。このマトリックスデコーディングは、受信した指令を参照してもしなくてもよい。デコードされるとき、修正された2以上のオーディオ信号は、修正されていない2以上のオーディオ信号に関して改良したマルチチャンネルデコーディングを提供することができる。この修正された2以上のマトリックスエンコーディングによる修正でもよく、マトリックスデコーダ又は能動マトリックスデコーダでデコードされるとき、修正された2以上のオーディオ信号は、修正されていない2以上のオーディオ信号のデコーディングに関して、改良したマルチチャンネルデコーディングを提供することができる。「改良」の語は、上述した本発明の他の形態における場合と同じ意味で用いられる。本発明の他の形態には、このような方法を実行するオーディオデコーダが含まれる。
本発明のさらなる形態では、マトリックスデコーダによりデコードされるとき、修正されていない信号のデコーディングに関して、修正された信号が、改良したマルチチャンネルデコーディングを提供することができるように、それぞれがオーディオチャンネルを表している2以上のオーディオ信号が修正される。これは、オーディオ信号同士での本質的な信号特性における1以上の差異を修正することにより行ってもよい。このような本質的な信号特性には、振幅と位相のうちの1つ又は両方が含まれる。オーディオ信号同士での本質的な信号特性における1以上の差異を修正することには、修正されていない信号をアップミックスしてより数の多い信号にすること、及びこのアップミックスされた信号をマトリックスエンコーダを用いてダウンミックスすることが含まれる。あるいは、オーディオ信号同士での本質的な信号特性における1以上の差異を修正することにはまた、オーディオ信号同士での相互相関を増大又は減少させることが含まれてもよい。このオーディオ信号同士での相互相関を、1以上の周波数帯域において、様々に増大及び/又は減少させることができる。
本発明の他の形態には、(1)ここに記載したうちの1つの方法を実行するようにした装置、(2)ここに記載したうちの1つの方法をコンピュータに実行させるために、コンピュータが読み取り可能な媒体に記憶させたコンピュータプログラム、(3)ここに記載したうちの1つの方法で制作されたビットストリーム、及び(4)ここに記載したうちの1つの方法を実行するようにした装置で制作されたビットストリームが含まれる。
[発明の詳細な説明]
図3は、本発明のアップミキシングの実施例を示す。この構成の制作部分20において、Mチャンネルのオリジナル信号は、1以上のアップミックスサイド情報を導き出す(アップミックス情報の導出)装置又は機能21に入力し、そしてフォーマッタ装置又はフォーマッティング機能(フォーマット)22に入力される。あるいは、以下に記載の通り、図3のMチャンネルのオリジナル信号は、レガシーオーディオ信号の修正版であってもよい。フォーマット22には、例えばMチャンネルのオリジナル信号、アップミックスサイド情報、及び他のデータを、例えばシリアルビットストリーム又はパラレルビットストリームにフォーマット又は構成するマルチプレクサ又はマルチプレクシング機能を含むことができる。この構成の制作部分20の出力ビットストリームがシリアルであるかパラレルであるかは本発明にとって重要ではない。フォーマット22には、ロッシー、ロスレス、又はロッシーとロスレスとを結合したエンコーダ又はエンコーディング機能のような、適切なデータ圧縮エンコーダ又はエンコーディング機能を含むことができる。出力ビットストリームがエンコードされるかどうかは本発明にとって重要ではない。出力ビットストリームは、適切な方法で伝達又は保存される。
図3の実施例の構成における消費部分24で、出力ビットストリームを受け取り、デフォーマッタ又はデフォーマッティング機能(デフォーマット)26により、フォーマット22をアンドゥーし、Mチャンネルのオリジナル信号(又はこれに近似する信号)とアップミックス情報を出力する。デフォーマット26には、必要になるかもしれないので、適切なデータ圧縮デコーダ又はデコーディング機能を含むことができる。アップミックス情報及びMチャンネルのオリジナル信号(又はこれに近似する信号)は、Nチャンネルアップミックス信号を出力するために、アップミックス指令に従ってMチャンネルのオリジナル信号(又はこれに近似する信号)をアップミックスするアップミキサー装置又はアップミキシング機能に入る。例えば、それぞれが、異なった数のチャンネルにアップミックスする多数のアップミックス指令があってもよい。多数のアップミックス指令がある場合は、その1つ以上が選択される(このような選択は、この構成における消費部分で固定としてもよく、又は、何らかの方法で選択可能としてもよい)。Mチャンネルオリジナル信号とNチャンネルアップミックス信号とは、この構成における消費部分24の潜在的な出力となる。(図示の通り)一方または両方を出力として出力することができ又は、どちらかを選択することができ、この選択は、(不図示の)選択装置又は選択機能により自動又は手動で、ユーザー又は消費者により実行される。図3では、象徴的にM=2、N=6としたが、これは、MとNがこの値に限定されるのではないことは理解できるであろう。
本発明の実際的な応用例の一例では、それぞれステレオサウンドチャンネルを表す2つのオーディオ信号を1つの装置又は工程が受け取り、この2つの信号をアップミキシングして一般に「5.1」チャンネル(実際には6チャンネルであり、1つのチャンネルは非常に少ないデータしか必要としない低周波数効果チャンネルである)と称されるものにするのに適した指令を導き出すことが好ましい。次いで、元の2つのオーディオ信号は、アップミキシング指令と共に、好ましい5.1チャンネル(サイド情報を用いたアップミックス)を出力するために、このアップミキシング指令を2つのオーディオ信号に適用するアップミキサー又はアップミキシング処理へと送られる。しかし、場合によっては元の2つのオーディオ信号と関連するアップミキシング指令は、このアップミキシング指令を用いることのできない装置又は処理により受け取られるかもしれないが、それでも、この受け取った2つのオーディオ信号のアップミックスを行うことができ、このアップミックスは、しばしば上述したような「ブラインド」アップミックスと称される。このようなブラインドアップミックスは、例えば、プロロジックデコーダ、プロロジックIIデコーダ、又は
プロロジックIIxデコーダ(プロロジック、プロロジックII、及び プロロジックIIxはドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である)のような能動マトリックスデコーダにより提供される。他の能動マトリックスデコーダを用いることもできる。このような能動マトリックスブラインドアップミキサーは、アップミックスを実行するために(入力される信号間の振幅及び/又は位相関係のような)固有の信号特性に依存し、またこの特性に応答して動作する。ブラインドアップミックスにより、アップミックス指令を用いるようにした装置又は機能によりもたらされるものと同じ数のチャンネルが結果として生じるかもしれないし生じないかもしれない(例えば、この例では、ブラインドアップミックスにより5.1チャンネルが結果として生じないかもしれない)。
能動マトリックスデコーダが実行する「ブラインド」アップミックスは、マトリックスエンコーダのような、特にこのデコーダと相補的なマトリックスエンコーダのような、この能動マトリックスデコーダと相性の良い装置又は機能により、入力が前もってエンコードされていたときが最もうまく行く。この場合、入力信号は、能動マトリックスデコーダで用いられる固有の振幅と位相との関係を有する。相性の良い装置で前もってエンコードされているのではない信号、すなわち、振幅と位相との関係のような有用な固有の信号特性を持たない信号(又は最小の有用な固有の信号特性しか持たない信号)の「ブラインド」アップミックスは、以下に説明するように、「芸術的な」アップミックス装置と称されるもの、一般に複雑なアップミックス装置により実施するとうまく行く。
本発明はアップミキシングに有利に用いることができるが、一般に、特定の「チャンネル構成」のために設計した少なくとも1つのオーディオ信号が、1つ以上の今までのものに代わるチャンネル構成で再生するよう改変さられるような場合に用いる。例えば、エンコーダは、デコーダに、例えば、オリジナル信号を、必要に応じて1以上の今までのものに代わるチャンネル構成にどのように改変するかを指令する。ここで「チャンネル構成」には、例えば、オリジナルオーディオ信号に対応する再生オーディオ信号の数だけでなく、オリジナルオーディオ信号の空間位置に関して再生オーディオ信号を再生する空間位置も含まれる。このようにチャンネル「構成」には、例えば、1以上のチャンネルが何らかの方法でより多数のチャンネルにマッピングする「アップミキシング」と、2以上のチャンネルが何らかの方法でより少数のチャンネルにマッピングする「ダウンミキシング」と、チャンネルが再生されようとする位置が又はチャンネルに対応する方向が何らかの方法で変化し又は再マッピングされる空間位置再構成と、(クロストークキャンセルにより、又はクロストークキャンセラーで処理することにより)バイノーラル形式からラウドスピーカ形式への変換又は(「バイノーラリゼーション」により、又はラウドスピーカ形式からバイノーラルに変換する装置、すなわち「バイノーラライザー」により)ラウドスピーカ形式からバイノーラル形式への変換とが含まれる。したがって、本発明によるチャンネル再構成の文脈において、オリジナル信号のおけるチャンネル数は、結果として生じる今までのものに代わるチャンネル構成のチャンネル数より少なくなることもあるし、多くなることもあるし、同じとなることもある。
空間位置構成の例は、4チャンネル構成(左前方、右前方、左後方、右後方の「スクエア」配置)から従来の動画構成(左前方、中央前方、右前方、及びサラウンドの「ダイアモンド」配置)への変換である。
本発明のアップミキシングのない「再構成」の応用例の1つは、Michael John Smithersによる2004年8月3日出願の米国特許出願S.N.10/911,404、表題「Method for Combining Audio Signals Using Auditory Scene Analysis」に記載されている。Smithersの出願には、共通の櫛型フィルターと静的なダウンミックスに付随する位相キャンセレーション効果を避けるような方法で動的に信号をダウンミックスすることについて記載されている。例えば、オリジナル信号は、左チャンネル、中央チャンネル、及び右チャンネルで構成することができるが、多くの再生環境では中央チャンネルは使えない。この場合、中央チャンネル信号は、ステレオで再生するために左右に混合させる必要がある。Smithersにより開示された方法は、再生時に中央チャンネルと左右のチャンネルとの間の全体的な平均遅れを動的に計測する。次いで、櫛型フィルタリングを避けるために、左右のチャンネルに混入される前に、対応する時間遅れ補償を中央チャンネルに適用する。加えて、他の位相相殺効果を除去するために、出力補償が計算され、各ダウンミックスしたチャンネルの各臨界帯域に適用する。この発明は、再生時にこのような時間遅れ補償値や出力補償値を計算するのではなく、エンコーダでサイド情報として、これらを生成し、従来のステレオ構成での再生が要求された場合、この値を随意的にデコーダに適用する。
図4Aは、一般化されたチャンネル再構成における本発明の実施例を示す。この構成の制作部分30において、Mチャンネルオリジナル信号(レガシーオーディオ信号)が、1以上のチャンネル再構成サイド情報を導き出す装置又は機能(チャンネル再構成情報の導出)32に適用され、そして、フォーマッタ装置又はフォーマッティング機能(フォーマット)22(図3の実施例に関連して説明した)に入る。図4AのMチャンネルオリジナル信号は、以下に記載の通り、レガシーオーディオ信号の修正版でも良い。出力ビットストリームは適切な方法で伝達又は保存される。
この構成の消費部分34において、出力ビットストリームを受け取り、デフォーマッタ装置又はデフォーマッティング機能(デフォーマット)26(図3の実施例に関連して説明した)が、Mチャンネルオリジナル信号(又はその近似)とチャンネル再構成情報とを出力するために、フォーマット22の動作をアンドゥーする。チャンネル再構成情報とMチャンネルオリジナル信号(又はその近似)は、Nチャンネル再構成信号を出力するための指令に従い、Mチャンネルオリジナル信号(又はその近似)をチャンネル再構成する装置又は機能(チャンネル再構成)36に入力される。図3の実施例のように、複数の指令がある場合は、1つ以上が選択される(チャンネル再構成の選択)(この選択は、この構成における消費部分において固定としてもよくまた何らかの方法で選択可能としてもよい)。図3の実施例のように、Mチャンネルオリジナル信号とNチャンネル再構成信号はこの構成における消費部分34の潜在的な出力となる。(図示の通り)一方または両方を出力として出力することができ又は、どちらかを選択することができ、この選択は、(不図示の)選択装置又は選択機能により自動又は手動で、例えば、ユーザー又は消費者により実行される。図4Aでは、象徴的にM=3、N=2としたが、これは、MとNがこの値に限定されるのではないことは理解できるであろう。上記の通り、「チャンネル構成」には、例えば、1以上のチャンネルが何らかの方法でより多数のチャンネルにマッピングする「アップミキシング」と、2以上のチャンネルが何らかの方法でより少数のチャンネルにマッピングする「ダウンミキシング」と、チャンネルが再生されようとする位置が何らかの方法で再マッピングされる空間位置再構成と、(クロストークキャンセルにより、又はクロストークキャンセラーで処理することにより)バイノーラル形式からラウドスピーカ形式への変換又は(「バイノーラリゼーション」により、又はラウドスピーカ形式からバイノーラルに変換する装置、すなわち「バイノーラライザー」により)ラウドスピーカ形式からバイノーラル形式への変換とが含まれる。バイノーラリゼーションの場合、チャンネル再構成には、(1)複数のバーチャルなチャンネルにアップミキシングすること、及び/又は(2)2チャンネル立体音響バイノーラル信号にしたバーチャルな空間位置再構成とを含めることができる。バーチャルなアップミキシング及びバーチャルなラウドスピーカ位置については、少なくとも1960年代には当業者に知られていた(Atal等の米国特許番号3,236,949(1966年2月26日)、表題「Apparent Sound Source Translator」、及びBauerの米国特許番号3,088,997(1963年5月7日)、表題「Stereophonic
to Binaural Conversion Apparatus」参照のこと)。
図3及び図4Aの実施例に関連して上述したように、Mチャンネルオリジナル信号の修正版を入力として用いてもよい。あるいは、未修正の信号が2チャンネル立体音響信号であるときは、修正された信号は未修正の信号の2チャンネルバイノーラライズされたものであってもよい。修正されたMチャンネルオリジナル信号は、未修正の信号と同じ数のチャンネルを有してもよいが、このことは本発明にとって本質的ではない。図4Bの実施例を参照して、この構成の制作部分38において、Mチャンネルオリジナル信号(レガシーオーディオ信号)は、代替した又は修正したオーディオ信号を生成する装置又は機能(代替信号の生成)40に入力され、代替した又は修正したオーディオ信号は、1以上のチャンネル再構成サイド情報のセットを導き出す装置又は機能(チャンネル再構成情報の導出)32とフォーマッタ装置又はフォーマッティング機能(フォーマット)22(32と22については上述した)に入力される。このチャンネル再構成情報の導出32は、再構成情報を導き出すことを助けるために代替信号の生成40から非オーディオ情報を受け取ってもよい。出力ビットストリームは適切な方法で伝達又は保存される。
この構成の消費部分42において、出力ビットストリームを受け取り、(上述の)デフォーマット26が、Mチャンネル代替信号(又はその近似)とチャンネル再構成情報とを出力するために、フォーマット22の動作をアンドゥーする。チャンネル再構成情報とMチャンネル代替信号(又はその近似)は、Nチャンネル再構成信号を出力するための指令に従ってMチャンネルオリジナル信号(又はその近似)をチャンネル再構成する装置又は機能(チャンネル再構成)44に入力される。図3と図4Aの実施例と同様に、多くの指令がある場合は、1つを選択する(この選択は、この構成における消費部分において固定してもよくまた何らかの方法で選択可能としてもよい)。図4Aの実施例で説明したように、「チャンネル構成」には、例えば、「アップミキシング」(2チャンネルのバイノーラル信号が混合されたバーチャルなチャンネルを持つようにした、バーチャルなアップミキシングを含む)、「ダウンミキシング」、空間位置再構成、及びバイノーラル形式からラウドスピーカ形式への変換又はスピーカ形式からバイノーラルへの変換、を含めることができる。Mチャンネル代替信号(又はその近似)はまた、Pチャンネル再構成信号を出力するために、再構成情報を参照することなしにMチャンネル代替信号を再構成する装置又は機能(再構成情報なしのチャンネル再構成)46に入力してもよい。チャンネルPの数は、チャンネルNの数と同じである必要はない。先に説明したように、このような装置又は機能は、再構成がアップミキシングのときは、例えば能動マトリックスデコーダ(この例は先に述べた)のようなブラインドアップミキサーでもよい。装置又は機能46はまた、バイノーラル形式からラウドスピーカ形式への変換又はスピーカ形式からバイノーラルへの変換、をおこなうことができる。図4Aの実施例の装置又は機能36と同様に、装置又は機能46は、2チャンネルのバイノーラル信号をアップミックス及び/又は位置替えを行ったバーチャルなチャンネルを有するようにする、バーチャルなアップミックス及び/又はバーチャルなラウドスピーカの位置替えを行うこともできる。Mチャンネル代替信号、Nチャンネル再構成信号、及び、Pチャンネル再構成信号は、この構成の消費部分42の潜在的出力となる。出力としてのこれらの組み合わせ(図ではこの3つ全てを示している)、又はこれらのうちの1つ又は1つの組み合わせを選択することができ、この選択は、(不図示の)選択装置又は選択機能により自動又は手動で、例えば、ユーザー又は消費者により実行される。
さらなる代替案が図4Cの実施例に示されている。この実施例では、Mチャンネルオリジナル信号は修正されるが、チャンネル再構成情報は伝達も保存もされない。したがって、チャンネル再構成情報の導出32はこの構成の制作部分38から省略し、Mチャンネル代替信号のみがフォーマット22に入力されるようにしてもよい。このようにして、オーディオ情報に加えて再構成情報を持つことができないかもしれないレガシーな伝達又は保存の構成では、2チャンネル立体音響信号のようなレガシータイプの信号のみを持つことが要求され、この場合、能動マトリックスデコーダのような、民生の複雑でないアップミキサーに応用されるときに良い結果が得られるように修正される。この構成の消費部分42において、2つの潜在的出力、すなわち、Mチャンネル代替信号とPチャンネル再構成信号のうちの両方又は一方を出力させるためにチャンネル再構成44を省略してもよい。
先に示したとおり、このようなMチャンネルオリジナル信号(又はその近似)が、適応型マトリックスデコーダのような民生タイプのアップミキサーにより、システムの消費部分でブラインドアップミキシングするのにより適したものとなるように、オーディオシステムの制作部分に入力されたMチャンネルオリジナル信号を修正することが好ましいであろう。
最適化されていないオーディオ信号を修正する1つの方法は、(1)(入力される信号同士での振幅及び/又は位相関係のような)固有の信号特性に少ししか依存せず動作する装置又は機能を用いて信号をアップミックスし、(2)予測適応型マトリックスデコーダと互換性のあるマトリックスエンコーダを用いてアップミックスされた信号をエンコードすることである。このような方法を、図5Aの実施例の関連させて以下に説明する。
このようなオーディオ信号を修正するもうひとつの方法は、1つ以上の公知の「空間化」及び/又は信号合成技術を適用することである。このような技術は、しばしば「擬似ステレオ」又は「擬似4チャンネル」技術として特徴づけられる。例えば、1以上のチャンネルにデコリレートされたコンテンツ及び/又は位相外れのコンテンツを加えることができる。このような処理により、中央音像の安定性を損なうという犠牲を払って、見掛けのサウンドイメージ幅又はサウンドエンベロープメント(sound envelopment)を改善する。これを図5Bの実施例と関連して説明する。これらの信号特性(振幅/エンベロープメント対中央イメージの安定性)同士の平衡点に到達させるために、イメージの振幅とエンベロープメントは主として高周波数で決まる一方、中央イメージの安定性は主として低周波数から中心周波数で決まるという現象をうまく利用する。信号を2つ以上の周波数帯域に分割することによって、最小のデコリレーションを適用することにより低周波数と中央周波数とでのイメージの安定性を保持し、大きなデコリレーションを適用することにより高周波数でのエンベロープメントの感覚を良くするように、オーディオサブ帯域毎に処理することができる。これは図5Cの実施例に記載されている。
図5Aの実施例を参照して、この構成での制作部分48において、Mチャンネル信号は、「芸術的」アップミキサー装置又は「芸術的」アップミキシング機能(芸術的アップミックス)としての特性を有するものによりPチャンネル信号にアップミックスされる。「芸術的」アップミキサーは、一般に、しかし必ずしもそうとはいえないが、コンピュータによる複雑なアップミキサーであり、能動マトリックスデコーダがアップミックスを行うために用いる(入力される信号同士の振幅及び/又は位相の関係のような)固有の信号特性にほとんどあるいはまったく依存しないで動作する。その代わり、「芸術的」アップミキサーは、アップミキサーの設計者が特定の結果を得るのに適当だと判断するような1以上のプロセスに従い動作する。このような「芸術的」アップミキサーは、は多くの形態をとることができる。一例として図7と「空間コーダに適用した本発明」の見出しをつけた記載とに関連してここに提示する。この図7の実施例によれば、例えば、「中央パイルアップ」を最小限にするための左右の分離性を良くし、又は「エンベロープメント」を改善するための前後の分離性をより良くするという結果を、アップミックスした信号にもたらす。「芸術的」アップミックスを行うためのどの技法を採用するかについては本発明にとって本質的ではない。
さらに図5Aを参照して、アップミックスしたPチャンネル信号は、マトリックスデコーダでデコーディングするのに適し振幅及び位相キューのような、固有の信号特性でチャンネルがエンコードされた、少数のチャンネル、Mチャンネル代替信号、を出力するマトリックスエンコーダ又はマトリックスエンコーディング機能(マトリックスエンコード)52に入力される。適切なマトリックスエンコーダは、図8に関連して以下に説明する5:2マトリックスエンコーダである。他のマトリックスエンコーダも適しているかもしれない。マトリックスエンコード出力は、上述したような、例えば、シリアルビットストリーム又はパラレルビットストリームを生成するフォーマット22に入力される。芸術的アップミックス50とマトリックスエンコード52の結合により、理想的には、消費者の一般的なマトリックスデコーダでデコードされたとき、オリジナル信号を芸術的アップミックス50に入力することにより得られるデコーディングと比較して改善されたリスニング体験が得られる。
図5Aの構成の消費部分54において、出力ビットストリームが受け取られ、(上述の)デフォーマットでフォーマット22の動作をアンドゥーしてMチャンネル代替信号(又はその近似)を出力する。Mチャンネル代替信号(又はその近似)は、1つの出力として出力され、Pチャンネル再構成信号を出力するために、再構成情報を参照することなしにMチャンネル代替信号を再構成する装置又は機能(再構成情報なしのチャンネル再構成)に入力されてもよい。チャンネルPの数は、チャンネルMの数と同じである必要はない。先に説明したように、このような装置又は機能56は、再構成がアップミキシングのときは、例えば(先に述べた)能動マトリックスデコーダ)のようなブラインドアップミキサーでもよい。Mチャンネル代替信号とPチャンネル再構成信号は、この構成における消費部分54の潜在的出力となる。これらのうちの1つ又は両方を選択することができ、この選択は、(不図示の)選択装置又は選択機能により自動又は手動で、例えば、ユーザー又は消費者により実行される。
図5Bの実施例に、最適化されていない入力信号を修正するもう1つの方法、すなわち、チャンネル同士の相関関係が修正される「空間化」の形式が示されている。この構成の制作部分58において、Mチャンネル信号がデコリレーター装置又はデコリレーション機能(デコリレーター)60に入力される。信号チャンネル同士の相互相関を減少させることは、よく知られたデコリレーション技術を用いて独立に処理することにより行うことができる。あるいは、信号チャンネル同士で独立に処理することでデコリレーションを行うことができる。例えば、チャンネル同士で位相外れのコンテンツ(すなわち、負の相関がある)は、1つのチャンネルからの信号に信号に比率を掛け反転させて他の信号に混合させることにより行うことができる。両方の場合において、この処理は、各チャンネルの処理された信号及び未処理の信号の相対レベルを調整することにより制御することができる。上述のように、見掛けのサウンドイメージ幅又はサウンドエンベロープメントと、中央イメージの安定性の低下とは、トレードオフの関係にある。個々のチャンネルの独立した処理によるデコリレーションの例は、Seefeldt他による米国特許出願S.N.60/604,725(2004年8月25日出願)、米国特許出願S.N.60/700,137(2005年7月18日出願)、及びS.N.60/705,784(2005年8月5日出願、代理人の整理番号DOL14901)、表題「Multichannel Decorrelation in Spatial Audio Coding」に記載されている。個々のチャンネルの独立した処理によるデコリレーションの他の例は、以下に引用するBreebaart他によるEAS学会誌6072及び国際出願WO03/090206に記載されている。相互相関を減少させたMチャンネル信号は、上述のように、適切な伝達又は保存を行うために1以上のビットストリームのような適切な出力を出力する、フォーマット22に入力される。図5Bの構成の消費部分54は、図5Aの構成の消費部分と同じでもよい。
上述のように、1以上のチャンネルにデコリレートされたコンテンツ及び/又は位相外れのコンテンツを加えることにより、中央音像の安定性を損なうという犠牲を払って、見掛けのサウンドイメージ幅又はサウンドエンベロープメント(sound envelopment)を改善する。これを図5Cの実施例において、振幅/エンベロープメントに対する中央音像の安定性との間の平衡点に到達させるために、信号を2つ以上の周波数帯域に分割し、最小のデコリレーションを適用することにより低周波数と中央周波数とでのイメージの安定性を保持し、大きなデコリレーションを適用することにより高周波数でのエンベロープメントの感覚を良くするように、オーディオサブ帯域を処理する。
図5Cを参照して、制作部分58’において、Mチャンネル信号は、サブ帯域フィルター又はサブ帯域フィルタリング機能(サブ帯域フィルター)62に入力される。図5Cは、このようなサブ帯域フィルター62を明確に示しているが、上述のように、このようなフィルター又はフィルタリング機能は他の実施例でも用いることができることは理解されよう。サブ帯域フィルター62は種々の形態をとることができるが、フィルター又はフィルタリング機能の選択は(例えば、フィルターバンク又は変換の選択は)本発明にとって本質的ではない。サブ帯域フィルター62はMチャンネル信号のスペクトルを、それぞれをデコリレーターに入力することができるR個の帯域に分割する。図では、帯域1に対するデコリレーター64、帯域2に対するデコリレーター66、及び帯域Rに対するデコリレーター68が示されているが、各帯域はそれぞれ独自にデコリレーターを有することが分かる。帯域によってはデコリレーターに入力させなくてもよい。デコリレーターは、Mチャンネル信号のすべてのスペクトルより少ないスペクトルで動作する点を除いて図5Bの実施例におけるデコリレーター60と本質的に同じである。分かりやすくするために、図5Cは、単一の信号に対してサブ帯域フィルターと関連するデコリレーターが示されているが、各信号はサブ帯域に分割され各サブ帯域はデコリレートされることが分かる。デコリレーションの後、もしあれば、各信号のサブ帯域は、合算器又は合算機能(合算)70により合算することができる。合算70の出力は、例えば、上述のようなシリアルビットストリーム又はパラレルビットストリームを生成するフォーマット22に入力される。図5Cの構成の消費部分54は、図5A及び図5Bの構成の消費部分と同じでもよい。
[空間コーディングの組み込み]
最近発表された制限ビットレートコーディング技術(以下の、空間コーディングに関する特許、特許出願、及び出願公開のリスト参照)では、Mチャンネル合成信号の音場についてのNチャンネル入力信号の音場のパラメータモデルを含有するサイド情報を生成するために、Mチャンネル合成信号にと同調してNチャンネル入力信号を(N>M)分析する。一般に、合成信号は、オリジナルNチャンネル信号と同じマスター素材から導き出される。このサイド情報と合成信号は、オリジナルNチャンネル信号に近似した音場を再現させるために、合成信号にパラメータモデルを適用させるデコーダに伝達される。このような空間コーディングシステムの第1の目的は、非常に限られた量のデータで元の音場を再現させることである。したがって、これは、元の音場をシミュレートするために使うパラメータモデルの縮減を行う。このような空間コーディングシステムは、一般に、オリジナルNチャンネル信号の音場をモデル化するための、チャンネル間レベル偏差(ILD)、チャンネル間タイム偏差又は位相偏差(ITD又はIPD)、及びチャンネル間コヒーレンス(ICC)のような、パラメータを採用する。一般に、このようなパラメータはコード化されたNチャンネルの入力信号全体に亘る複数のスペクトル帯域に対して予測され、動的に時間的に予測される。
先行技術の空間コーディングの例を図6A,6B(エンコーダ),及び6C(デコーダ)に示す。Nチャンネルのオリジナル信号は、装置又は機能(時間から周波数)により、よく知られた短時間離散フーリエ変換(STDFT)のような、適切な時間・周波数変換を用いて周波数領域に変換される。一般に、この変換は、周波数帯域が耳の臨界帯域を近似するように行われる。チャンネル間振幅偏差、チャンネル間時間偏差又は位相偏差、及びチャンネル間相関の推定値は、帯域の各々に対して計算される(空間サイド情報の生成)。もし、Nチャンネルオリジナル信号に対応するMチャンネル合成信号がまだ存在しない場合は、これらの推定値は(図6Aの実施例のように)、Nチャンネルオリジナル信号をMチャンネル合成信号にダウンミックス(ダウンミックス)するために用いられる。あるいは、既存のMチャンネル合成信号を、同じ時間・周波数変換(分かりやすくするため別に示した)により同時に処理してもよく、(図6Bの実施例のように)Nチャンネルオリジナル信号の空間パラメータを、Mチャンネル合成信号の空間パラメータに関して計算してもよい。同様に、Nチャンネルオリジナル信号が使えない場合は、Nチャンネルオリジナル信号、すなわち、各信号が図6Bの実施例のそれぞれの時間・周波数変換装置又は機能への入力を出力する各信号を生成するために、利用可能なMチャンネル合成信号を時間領域でアップミックスしてもよい。次いで、この合成信号と推定した空間パラメータは、単一のビットストリームにエンコード(フォーマット)される。デコーダにおいて(図6C)、このビットストリームは、空間サイド情報と同調してMチャンネル合成信号を生成するためにデコード(デフォーマット)される。この合成信号は、周波数領域にNチャンネルオリジナル信号を生成するために、デコードされた空間パラメータを対応する帯域で適用する(空間サイド情報の適用)、周波数領域に(時間・周波数)変換される。最後に、それによりNチャンネルオリジナル信号又はその近似を生成するために、(周波数・時間)周波数・時間変換が適用される。あるいは、空間サイド情報を無視して、再生のためにMチャンネル合成信号を選択してもよい。
先行技術の空間コーディングシステムは、その音場の低データレートパラメーター表現をそれから予測するNチャンネル信号の存在を前提とする一方、このようなシステムは開示された発明と協働できるよう修正される。元のNチャンネル信号から予測するより、このような空間パラメータは、レガシーMチャンネル信号の分析により直接生成してもよい。ここでM<Nである。このようなパラメータがそこで適用されたとき、求めるレガシーMチャンネル信号のNチャンネルアップミックスがデコーダで作られるように、このパラメータは生成される。これはエンコーダで実際のNチャンネルアップミックス信号を生成することなく行うことができるが、Mチャンネルレガシー信号から直接求めるアップミックスされた信号の音場のパラメータ表現を作ることにより行うほうがよい。図7は、図6Cで示された空間デコーダと互換性のあるアップミキシングエンコーダを示す。このようなパラメータ表現の作成のさらなる詳細については、以下に「空間コーダに適用した本発明」の見出し出説明する。
図7の詳細を参照して、時間領域のMチャンネルオリジナル信号は、適切な時間・周波数変換(時間・周波数)72を用いて周波数領域に変換される。装置又は機能74(サイド情報としてアップミックス情報を導出)は、空間コーディングシステムで空間サイド情報を生成したのと同じ方法でアップミックス指令を導出する。空間コーディングシステムにおいて空間サイド情報を生成することについての詳細は、ここに引用した1以上の参考文献に述べられている。アップミックス指令を構成する空間コーディングパラメータは、Mチャンネルオリジナル信号と共に、Mチャンネルオリジナル信号と空間コーディングパラメータとを伝達又は記憶に適した形態に変換する装置又は機能(フォーマット)76に入力される。フォーマッティングにはデータ圧縮エンコーディングを含むことができる。
例えば図6Cのデコーダとしてアップミックスされる信号に入力させる装置又は機能と一緒に説明した、パラメータ生成を採用するアップミキサーは、図4B,4C,5A,及び5Bの例におけるような修正された信号を生成するために用いるコンピュータによる複雑なアップミキサーに適している。
Mチャンネルレガシー信号から、好ましいNチャンネルアップミックス信号をエンコーダで(以下の例のように)生成させることなく、直接パラメータ表現を生成することが好都合であるが、これは本発明の本質ではない。代替的に、好ましいNチャンネルアップミックス信号をエンコーダで生成させることで、空間パラメータを導き出すことができる。機能的に、このような信号は図7のブロック74内で生成される。このように、この代替案でも、導き出すための指令を受け取るオーディオ情報のみがMチャンネルレガシー信号である。
図8は、プロロジックIIと互換性のある5:2マトリックス能動エンコーダ(線形時間不変)の一般的な先行技術を示す理想化された機能ブロック図である。このようなエンコーダは、上述の図5Aの例で用いるのに適している。このエンコーダは、5つの別々の入力すなわち、左、中央、右、左サラウンド、及び右サラウンド(L,C,R,LS,RS)を受け取り、二つの最終的な出力、すなわち左トータル及び右トータル(Lt及びRt)を作る。C入力は等しく分割され、一定の聴覚パワーを保持するために(減衰器84により)3dBレベル(振幅)減衰させて、(それぞれ、結合器80と82において)L入力とR入力とに加算される。この、L入力とR入力は、それぞれレベルを減少させたC入力と加算して、位相とレベルをずらしたLS入力を減算させ、RS入力を加算させて、結合する。左サラウンド(LS)入力は、ブロック86に示すように、理想的には90度位相シフトさせて、Lとレベル減衰させたCとを加算したものと結合器90で減算させて結合するために、減衰器88で1.2dBレベルを減衰させる。次いで、Rと、レベル減衰させたCと、そして、RSの位相をずらし、レベルを減衰させたものと結合器94で加算させて結合させるために減衰器92で5dBレベルを減衰させ、次に述べるように、Rt出力を出力する。右サラウンド(RS)入力は、ブロック96に示すように、理想的には90度位相シフトさせて、Rとレベル減衰させたCとを加算したものと結合器100で加算させて結合させるために、減衰器98で1.2dBレベルを減衰させる。次いで、Rと、レベル減衰させたCと、そして、LSの位相をずらし、レベルを減衰させたものと結合器104で減算させ結合させるために減衰器102で5dBレベルを減衰させ、Lt出力を出力する。
一般に、図に示すように各サラウンド入力経路の90度の位相シフトブロックのみが必要である。実際には、90度の位相シフトは実現できないので、4つのすべての経路の回路網に、好ましい90度の位相シフトを実現するために、適切な位相シフトを用いてもよい。すべての経路の回路網に用いることは、処理するオーディオ信号の音色(周波数スペクトル)に影響を与えないという利点がある。エンコードされた左トータル信号(Lt)及びエンコードされた右トータル信号(Rt)とは、
Lt=L+m(-3)dB*C-j*[m(-1.2)dB*Ls+m(-6.2)dB*Rs]、及び、
Rt=R+m(-3)dB*C+j*[(m(-l.2)dB*Rs+m(-6.2)dB*Ls)
で表すことができ、
ここで、Lは左入力信号、Rは右入力信号、Cは中央入力信号、Lsは左サラウンド入力信号、Rsは右サラウンド入力信号、jはマイナス1(−1)の平方根(90度の位相シフト)、そして、mはデシベル単位での減衰(したがって、m(−3)dB=3dB減衰)を表したものとの乗算を表す。
代替的に、この式は以下のように表してもよい。すなわち、
Lt=L+(0.707)*C-j*(0.87*Ls+0.56*Rs)、及び
Rt=R+(0.707)*C+j*(0.87*Rs+0.56*Ls)
ここで、0.707は、3dB減衰の近似値、0.87は、1.23dB減衰の近似値、そして、0.56は、6.2dB減衰の近似値である。この値(0.707,0.87,及び0.56)は、本質的ではない。他の値を用いて許容できる結果を得ることもできる。他の値を採用することのできる範囲は、システムの設計者が聞こえた結果が許容できると判断する範囲で決まる。
[発明を実施するための最良の形態]
[空間コーディングの背景]
チャンネル間のレベル偏差(ILD)の臨界帯域毎の推定値と、Nチャンネル信号のチャンネル間のコヒーレンス(ICC)をサイド情報として用いる、空間コーディングを考える。合成信号のチャンネル数をM=2と仮定し、元の信号のチャンネル数をN=5と仮定する。以下のように記号を定義する。
[b,t]:帯域b、時間ブロックtにおける合成信号xのチャンネルjでの周波数領域での表現である。この値は、デコーダに送られた合成信号xに時間・周波数変換を適用することにより導き出される。
[b,t]:帯域b、時間ブロックtにおける元の信号の推定値zのチャンネルiでの周波数領域での表現である。この値は、サイド情報をX[b,t]に適用することにより導き出される。
ILDij[b,t]:帯域b、時間ブロックtにおける合成信号のチャンネルjについての元の信号のチャンネルiでのチャンネル間レベル偏差である。この値はサイド情報として伝送される。
ICC[b,t]:帯域b、時間ブロックtにおける元の信号のチャンネルiでのチャンネル間レベル偏差である。この値はサイド情報として伝送される。
デコーディングの最初のステップとして、Nチャンネル信号の中間周波数領域での表現を、チャンネル間レベル偏差を以下のように合成信号に適用することにより生成する。
Figure 0005191886
次いで、一意的なデコリレーションフィルターHを各チャンネルiに適用することにより、デコリレートしたYを生成し、ここで、フィルターの適用は、周波数領域で乗算することにより達成することができる。すなわち、
Figure 0005191886
Figure 0005191886
次いで、周波数・時間変換をZi[b,t]に適用することにより、最後の信号zを生成する。
[空間コーダに適用した本発明]
ここで、M=2チャンネルの信号をN=6チャンネルの信号にアップミックスするために、上述の空間デコーダを用いる、開示した発明の実施形態を説明する。このエンコーディングは、上述のように、サイド情報ILDij[b,t]とサイド情報ICC[b,t]とがX[b,t]に適用されるとき、好ましいアップミックスがデコーダで生成されるように、X[b,t]からサイド情報ILDij[b,t]とサイド情報ICC[b,t]とを合成することを必要とする。上述のように、適用するこの方法は、アップミックスされた信号が次にマトリックスエンコーダに適用されるとき、民生型マトリックスデコーダのような複雑でないアップミキサーでアップミックスするのに適した代替信号を生成するために用いるのに適した、コンピュータで計算する複雑なアップミックスを出力する。
ブラインドアップミキシングシステムの最初のステップは2チャンネル入力をスペクトル領域に変換することである。スペクトル領域へのこの変換は、デコレレーションフィルターに起因する、巡回畳み込み効果を防ぐために、ゼロパッドのブロックの50%と75%重複してDFTsを行うことにより達成することができる。この、DFT構想は、空間コーディングシステムの好ましい実施の形態で用いられる時間・周波数変換構想に適合する。次いで、この信号の周波数表現は、等価な直角帯域(ERB)スケールを近似する複数の帯域に分割される。ここで、この帯域構成は、サイド情報をデコーダでブラインドアップミキシングするのに用いることのできるように、空間コーディングシステムで用いられるものと同じである。各帯域bにおいて、共分散マトリックスが以下の式で示されるように計算される。
Figure 0005191886
Figure 0005191886
共分散マトリックスにおける瞬時推定値は、次に、以下の式に示すように各帯域での共分散マトリックスに適用する、簡単な一次HFフィルターを用いて各ブロックで平滑化される。
Figure 0005191886
簡単な2から6までのブラインドアップミキシングシステムについて、チャンネル順序づけを以下のように定義する。
Figure 0005191886
上記チャンネルマッピングを用いて、我々は、平滑化された共分散マトリックスに関するチャンネルの各々に対して帯域ILD及びICC毎に以下のように展開する。
Figure 0005191886
次いで、チャンネル1(左)に対して:
Figure 0005191886
チャンネル2(中央)に対して:
Figure 0005191886
チャンネル3(右)に対して:
Figure 0005191886
チャンネル4(左サラウンド)に対して:
Figure 0005191886
チャンネル5(右サラウンド)に対して:
Figure 0005191886
チャンネル6(LFE)に対して:
Figure 0005191886
実際には、上述の例による構成でうまく行くことが分かっている。すなわち、周囲音から直接のサウンドを分離し、直接のサウンドを左右のチャンネルにし、周囲音を後方チャンネルにもってゆく。より複雑な構成を、空間コーディングシステム内で伝達されたサイド情報を用いることで作り上げることもできる。
[参照としての編入]
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[バーチャルなサウンド処理]
Atal他による、米国特許3,236,949、表題「Apparent Sound Source Translator」(1966年2月26日)、
Bauerによる、米国特許3,088,997、表題「Stereophonic to Binaural Conversion Apparatus」(1963年5月7日)。
[AC−3(ドルビーデジタル)]
ATSC標準A52/A:Digital Audio Compression Standard (AC-3), Revision A、Advanced Television Systems Committee、2001年8月20日。このA52/A書面は、ワールドワイドウェブhttp://www.atsc.orR/standards.html.にて参照することができる。
Steve Vernon /EEE Trans.による、1995年8月のConsumer Electronics,Vol.41,No. 3、「Design and Implementation of AC-3 Coders」、
Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」、
Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」、
米国特許、5,583,962と、5,632,005と、5,633,981と、5,727,119と、6,021,386。
[空間コーディング]
米国特許出願公開公報US2003/0026441、2003年2月6日公開、
米国特許出願公開公報US2003/0035553、2003年2月20日公開、
米国特許出願公開公報US2003/0219130(Baumgarte & Faller)、2003年11月27日公開、
Audio Engineering Society 論文5852、2003年3月、
国際公開公報WO03/090206、2003年10月30日公開、
国際公開公報WO03/090207、2003年10月30日公開、
国際公開公報WO03/090208、2003年10月30日公開、
国際公開公報WO03/007656、2003年1月22日公開、
Baumgarte他による、2003年12月25日に公開された、米国特許出願公開公報US2003/0236583Al、表題「Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals」、出願番号S.N.10/246,570、
Faller他による、Audio Engineering Society Convention Paper 5574, 112th Convention, Munich, May 2002、「Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression」、
Baumgarte他による、Audio Engineering Society Convention Paper 5575, 112th Convention, Munich, May 2002「Why Binaural Cue Coding is Better than Intensity Stereo Coding」、
Baumgarte他による、Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, October 2002、「Design and Evaluatin of Binaural Cue Coding Schemes」、
Faller他による、IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New
York, October 2001, pp.199-202、「Efficient Representation of Spatial Audio Using Perceptual Parametrization」、
Baumgarte他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1801-1804、「Estimation of Auditory Spatial Cues for Binaural Cue Coding」、
Faller他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1841II-1844、「Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio」、
Breebaart他による、Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, May 2004、「High-quality parametric spatial audio coding at low bitrates」、
Baumgarte他による、Audio Engineering Society Convention Paper 6060, 116th Convention, Berlin, May
2004、「Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing」、
Schuijers他による、Audio Engineering Society Convention Paper 6073, 116th Convention, Berlin, May
2004、「Low complexity parametric stereo coding」、
Engdegard他による、Audio Engineering Society Convention Paper 6074, 116th Convention, Berlin, May
2004、「Synthetic Ambience in Parametric Stereo Coding」。
[その他]
Kenneth James Gundryによる米国特許6,760,448、表題「Compatible Matrix-Encoded Surround-Sound Channels in a Discrete Digital Sound Format」、
Michael John Smithersによる米国特許出願S.N.10/911,404、表題「Method for Combining Audio Signals Using Auditory Scene Analysis」、2004年8月3日出願、
Seefeldt他による米国特許出願S.N.60/604,725(2004年8月25日出願)、S.N.60/700,137(2005年7月18日出願)、及びS.N.60/705,784(2005年8月5日出願、代理人の整理番号DOL14901)、それぞれの表題「Multichannel Decorrelation in Spatial Audio Coding」、
国際公開公報WO03/090206、2003年10月30日公開、
Breebaart他による、Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, May
2004、「High-quality parametric spatial audio coding at low bitrates」。
(実施の形態)
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。他に記載がない限り、本発明の1部に含まれるアルゴリズム又はプロセスは、特定のコンピュータ又は特定の装置に本質的に関連するようなものではない。とりわけ、種々の汎用機をここの記載に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
このようなプログラムの各々は、コンピュータシステムとの通信のために、必要とされるどんなコンピュータ言語(機械語、アセンブリ、又は、高級な、手続言語、論理型言語、又は、オブジェクト指向言語を含む)ででも実現することができる。いずれにせよ、言語はコンパイル言語であってもインタープリタ言語であってもよい。
このようなコンピュータプログラムの各々は、ここに記載の手順を実行するために、コンピュータにより記憶媒体又は記憶装置を読み込んだとき、コンピュータを設定し動作させるための、汎用プログラマブルコンピュータ又は専用プログラマブルコンピュータにより、読み込み可能な記憶媒体又は記憶装置(例えば、半導体メモリー又は半導体媒体、又は磁気又は光学媒体)に保存又はダウンロードすることが好ましい。本発明のシステムはまた、コンピュータプログラムにより構成されるコンピュータにより読み込み可能な記憶媒体として実行することを考えることもできる。ここで、この記憶媒体は、コンピュータシステムを、ここに記載した機能を実行するために、具体的にあらかじめ定めた方法で動作させる。
本発明の多くの実施の形態について記載した。しかしながら、本発明の精神と技術範囲を逸脱することなく多くの修正を加えることができることは明らかであろう。例えば、ここに記載したステップのいくつかの順序は独立であり、従って、記載とは異なる順序で実行することができる。
制作部分と消費部分とを有し、アップミキシングが消費部分で行われる、アップミキシングのための先行技術における構成の機能ブロック図である。 制作部分と消費部分とを有し、アップミキシングが制作部分で行われる、アップミキシングのための先行技術における構成の機能ブロック図である。 本発明のアップミキシングの実施の形態であって、アップミキシングの指令が制作部分で導き出されこの指令が消費部分に適用される形態の一例を示す機能ブロック図である。 本発明の一般的なチャンネル再構成の実施の形態であって、チャンネル再構成の指令が制作部分で導き出されこの指令が消費部分に適用される形態の一例を示す機能ブロック図である。 本発明の他の一般的なチャンネル再構成の実施の形態であって、チャンネル再構成の指令が制作部分で導き出されこの指令が消費部分に適用される形態の一例を示す機能ブロック図である。制作部分に適用する信号は、このようなチャンネル再構成が消費部分でチャンネル再構成の指令を参照しないでなされるとき、このチャンネル再構成を改良するように修正することができる。 本発明の他の一般的なチャンネル再構成の実施の形態を示す機能ブロック図である。制作部分に適用する信号は、このようなチャンネル再構成が消費部分でチャンネル再構成の指令を参照しないでなされるとき、このチャンネル再構成を改良するように修正される。再構成情報は制作部分から消費部分に送られない。 制作部分が、アップミキシング又はアップミキシング機能及びマトリックスエンコーダ又はマトリックスエンコーディング機能により、入力された信号を修正する構成の機能ブロック図である。 制作部分が、相互相関を減少させることにより、入力された信号を修正する構成の機能ブロック図である。 制作部分が、サブ帯域に基づく相互相関を減少させることにより、入力された信号を修正する構成の機能ブロック図である。 エンコーダが空間コーディングシステムにおいてデコーダにより再生されることが求められるNチャンネル信号を受信する、空間コーディングシステムにおけるエンコーダの先行技術の一例を示す機能ブロック図である。 エンコーダが空間コーディングシステムにおいてデコーダにより再生されることが求められるNチャンネル信号を受け取り、また、エンコーダからデコーダに送られるMチャンネル合成信号を受信する、空間コーディングシステムにおけるエンコーダの先行技術の一例を示す機能ブロック図である。 図6Aのエンコーダ又は図6Bのエンコーダで使用可能な空間コーディングシステムにおけるデコーダの先行技術の一例を示す機能ブロック図である。 空間コーディングシステムで使用可能な本発明のデコーダの実施例の一例を示す機能ブロック図である。 2:5能動マトリックスデコーダで使用可能な5:2マトリックスエンコーダの理想化された先行技術を示す機能ブロック図である。

Claims (19)

  1. 2以上のオーディオ信号を処理するための方法であって、各オーディオ信号は1つのオーディオチャンネルを表現し、
    2以上のオーディオ信号をチャンネル再構成するための指令を導き出すステップであって、導き出すステップにより受け取られるオーディオ情報がこの2以上のオーディオ信号のみである、前記導き出すステップと、
    (1)前記2以上のオーディオ信号と、(2)前記チャンネル再構成するための指令とを含む出力ビットストリームを出力するステップとを具備し、
    記出力ビットストリームから生成された2以上のオーディオ信号に適用されるとき、前記チャンネル再構成するための指令によりチャンネル再構成されたオーディオ信号が生成される、方法。
  2. 前記オーディオ信号は、ステレオ音響のペアとなったオーディオ信号であることを特徴とする請求項1に記載の方法。
  3. 前記チャンネル再構成するための指令を導き出すステップでは、アップミックスするための指令によりアップミックスしたとき、結果得られたオーディオ信号の数が、前記2以上のオーディオ信号からなるオーディオ信号の数より大きくなるように、前記2以上のオーディオ信号をアップミックスするための指令を導き出すことを特徴とする請求項1に記載の方法。
  4. 前記チャンネル再構成するための指令を導き出すステップでは、ダウンミックスするための指令によりダウンミックスしたとき、結果得られたオーディオ信号の数が、前記2以上のオーディオ信号からなるオーディオ信号の数より小さくなるように、前記2以上のオーディオ信号をダウンミックスするための指令を導き出すことを特徴とする請求項1に記載の方法。
  5. 前記チャンネル再構成するための指令を導き出すステップでは、再構成するための指令により再構成したとき、オーディオ信号の数は同じであるが、このようなオーディオ信号を再生する1以上の空間位置が変化するように、前記2以上のオーディオ信号を再構成するための指令を導き出すことを特徴とする請求項1に記載の方法。
  6. 前記出力において前記2以上のオーディオ信号は、それぞれ前記2以上のオーディオ信号をデータ圧縮したものであることを特徴とする請求項1に記載の方法。
  7. 前記2以上のオーディオ信号は、周波数帯域に分割され、前記チャンネル再構成するための指令は、このような周波数帯域における信号についてのものであることを特徴とする請求項1に記載の方法。
  8. 2以上のオーディオ信号を処理するための方法であって、各オーディオ信号は1つのオーディオチャンネルを表現し、
    前記2以上のオーディオ信号と、前記2以上のオーディオ信号のチャンネル再構成のための指令とを含む出力ビットストリームを受信するステップであって、この指令は、受信したオーディオ情報のみがこの2以上のオーディオ信号となる指令導出方法により導き出されたものである、前記受信するステップと、
    前記出力ビットストリームから前記2以上のオーディオ信号を生成するステップと、
    この指令に従って前記2以上のオーディオ信号を用いてチャンネル再構成されたオーディオ信号生成するステップとを具備する、
    方法。
  9. 前記チャンネル再構成のための指令は、前記2以上のオーディオ信号をアップミックスするための指令であり、前記チャンネル再構成は、結果得られたオーディオ信号の数が、前記2以上のオーディオ信号からなるオーディオ信号の数より大きくなるように、前記2以上のオーディオ信号をアップミックスすることを特徴とする請求項に記載の方法。
  10. 前記チャンネル再構成するための指令は、前記2以上のオーディオ信号をダウンミックスするための指令であり、前記チャンネル再構成するステップでは、結果得られたオーディオ信号の数が、前記2以上のオーディオ信号からなるオーディオ信号の数より小さくなるように、前記2以上のオーディオ信号をダウンミックスすることを特徴とする請求項に記載の方法。
  11. 前記チャンネル再構成するための指令は、オーディオ信号の数は同じであるが、このようなオーディオ信号を再生するそれぞれの空間位置が変化するように、前記2以上のオーディオ信号を再構成するための指令であることを特徴とする請求項に記載の方法。
  12. 前記チャンネル再構成するための指令は、アップミキシングを有するバイノーラルステレオ音響信号を前記2以上のオーディオ信号の複数のバーチャルなチャンネルにレンダリングする指令であることを特徴とする請求項に記載の方法。
  13. 前記チャンネル再構成するための指令は、バーチャルな空間位置再構成を有するバイノーラルステレオ音響信号をレンダリングする指令であることを特徴とする請求項に記載の方法。
  14. 前記2以上のオーディオ信号はデータ圧縮されており、前記方法は、前記2以上のオーディオ信号をデータ伸張するステップをさらに具備することを特徴とする請求項に記載の方法。
  15. 前記2以上のオーディオ信号は、周波数帯域に分割され、前記チャンネル再構成するための指令は、このような周波数帯域における信号についてのものであることを特徴とする請求項に記載の方法。
  16. 請求項に記載の方法であって、
    オーディオ出力を出力するステップと、
    前記オーディオ出力として、
    (1)前記2以上のオーディオ信号、又は
    (2)前記チャンネル再構成した2以上のオーディオ信号、
    のいずれか1つを選択するステップと、
    をさらに具備する方法。
  17. 前記受信した2以上のオーディオ信号に応答して、オーディオ出力を出力するステップをさらに具備する請求項に記載の方法。
  18. 前記方法は、前記2以上のオーディオ信号をマトリックスデコーディングするステップをさらに具備することを特徴とする請求項17に記載の方法。
  19. 前記受信したチャンネル再構成した2以上のオーディオ信号に応答して、オーディオ出力を出力するステップをさらに具備する請求項に記載の方法。
JP2008514770A 2005-06-03 2006-05-26 サイド情報を有するチャンネルの再構成 Expired - Fee Related JP5191886B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US68710805P 2005-06-03 2005-06-03
US60/687,108 2005-06-03
US71183105P 2005-08-26 2005-08-26
US60/711,831 2005-08-26
PCT/US2006/020882 WO2006132857A2 (en) 2005-06-03 2006-05-26 Apparatus and method for encoding audio signals with decoding instructions

Publications (3)

Publication Number Publication Date
JP2008543227A JP2008543227A (ja) 2008-11-27
JP2008543227A5 JP2008543227A5 (ja) 2009-07-30
JP5191886B2 true JP5191886B2 (ja) 2013-05-08

Family

ID=37498915

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008514770A Expired - Fee Related JP5191886B2 (ja) 2005-06-03 2006-05-26 サイド情報を有するチャンネルの再構成

Country Status (13)

Country Link
US (2) US20080033732A1 (ja)
EP (1) EP1927102A2 (ja)
JP (1) JP5191886B2 (ja)
KR (1) KR101251426B1 (ja)
CN (1) CN101228575B (ja)
AU (1) AU2006255662B2 (ja)
BR (1) BRPI0611505A2 (ja)
CA (1) CA2610430C (ja)
IL (1) IL187724A (ja)
MX (1) MX2007015118A (ja)
MY (1) MY149255A (ja)
TW (1) TWI424754B (ja)
WO (1) WO2006132857A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8787585B2 (en) 2009-01-14 2014-07-22 Dolby Laboratories Licensing Corporation Method and system for frequency domain active matrix decoding without feedback

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
EP1721312B1 (en) 2004-03-01 2008-03-26 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
AU2006255662B2 (en) * 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080228501A1 (en) * 2005-09-14 2008-09-18 Lg Electronics, Inc. Method and Apparatus For Decoding an Audio Signal
US20090028344A1 (en) * 2006-01-19 2009-01-29 Lg Electronics Inc. Method and Apparatus for Processing a Media Signal
JP4966981B2 (ja) * 2006-02-03 2012-07-04 韓國電子通信研究院 空間キューを用いたマルチオブジェクト又はマルチチャネルオーディオ信号のレンダリング制御方法及びその装置
TWI331322B (en) * 2006-02-07 2010-10-01 Lg Electronics Inc Apparatus and method for encoding / decoding signal
JP4875142B2 (ja) * 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
US9009032B2 (en) * 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US20080269929A1 (en) 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
CN101568958B (zh) 2006-12-07 2012-07-18 Lg电子株式会社 用于处理音频信号的方法和装置
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
US8463605B2 (en) 2007-01-05 2013-06-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
RU2422922C1 (ru) 2007-06-08 2011-06-27 Долби Лэборетериз Лайсенсинг Корпорейшн Гибридное извлечение аудиоканалов объемного звука посредством управляемого объединения компонент сигналов окружения и компонент матрично-декодируемых сигналов
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
JP5336522B2 (ja) * 2008-03-10 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
EP2261894A4 (en) * 2008-03-14 2013-01-16 Nec Corp SIGNAL ANALYSIS / CONTROL SYSTEM AND METHOD, SIGNAL CONTROL DEVICE AND METHOD, AND PROGRAM
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
AU2009291259B2 (en) * 2008-09-11 2013-10-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
EP2329492A1 (en) 2008-09-19 2011-06-08 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
ATE552690T1 (de) * 2008-09-19 2012-04-15 Dolby Lab Licensing Corp Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US9628934B2 (en) 2008-12-18 2017-04-18 Dolby Laboratories Licensing Corporation Audio channel spatial translation
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
JP5439586B2 (ja) 2009-04-30 2014-03-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 低複雑度の聴覚イベント境界検出
FR2954570B1 (fr) * 2009-12-23 2012-06-08 Arkamys Procede de codage/decodage d'un flux numerique stereo ameliore et dispositif de codage/decodage associe
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2609591B1 (en) 2010-08-25 2016-06-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for generating a decorrelated signal using transmitted phase information
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
JP6384329B2 (ja) * 2012-12-28 2018-09-05 株式会社ニコン データ処理装置、およびデータ処理プログラム
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
CN108806704B (zh) * 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
KR102150955B1 (ko) * 2013-04-19 2020-09-02 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
PL3022949T3 (pl) 2013-07-22 2018-04-30 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Wielokanałowy dekoder audio, wielokanałowy koder audio, sposoby, program komputerowy i zakodowana reprezentacja audio z użyciem dekorelacji renderowanych sygnałów audio
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
CN106104684A (zh) * 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11528574B2 (en) * 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices
US11373662B2 (en) * 2020-11-03 2022-06-28 Bose Corporation Audio system height channel up-mixing
US20220391899A1 (en) * 2021-06-04 2022-12-08 Philip Scott Lyren Providing Digital Media with Spatial Audio to the Blockchain

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4624009A (en) * 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US5040081A (en) 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
FR2641917B1 (fr) * 1988-12-28 1994-07-22 Alcatel Transmission Dispositif de diagnostic du canal de transmission pour modem numerique
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
WO1991020164A1 (en) 1990-06-15 1991-12-26 Auris Corp. Method for eliminating the precedence effect in stereophonic sound systems and recording made with said method
CA2085887A1 (en) 1990-06-21 1991-12-22 Kentyn Reynolds Method and apparatus for wave analysis and event recognition
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
US5796844A (en) * 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
JPH1074097A (ja) 1996-07-26 1998-03-17 Ind Technol Res Inst オーディオ信号のパラメータを変更する方法及び装置
US6049766A (en) 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6211919B1 (en) * 1997-03-28 2001-04-03 Tektronix, Inc. Transparent embedment of data in a video signal
AU750877C (en) * 1997-09-05 2004-04-29 Lexicon, Inc. 5-2-5 matrix encoder and decoder system
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
TW444511B (en) * 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
US6624873B1 (en) * 1998-05-05 2003-09-23 Dolby Laboratories Licensing Corporation Matrix-encoded surround-sound channels in a discrete digital sound format
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
CA2418722C (en) 2000-08-16 2012-02-07 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
CA2443837C (en) 2001-04-13 2012-06-19 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
AU2002307533B2 (en) * 2001-05-10 2008-01-31 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
MXPA03010751A (es) 2001-05-25 2005-03-07 Dolby Lab Licensing Corp Segmentacion de senales de audio en eventos auditivos.
AU2002240461B2 (en) 2001-05-25 2007-05-17 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
WO2003069954A2 (en) 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
BR0304540A (pt) * 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Métodos para codificar um sinal de áudio, e para decodificar um sinal de áudio codificado, codificador para codificar um sinal de áudio, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenagem, e, decodificador para decodificar um sinal de áudio codificado
US8676361B2 (en) * 2002-06-05 2014-03-18 Synopsys, Inc. Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
EP1590800B1 (en) 2003-02-06 2009-11-04 Dolby Laboratories Licensing Corporation Continuous backup audio
TWI329463B (en) * 2003-05-20 2010-08-21 Arc International Uk Ltd Enhanced delivery of audio signals
AU2004248544B2 (en) 2003-05-28 2010-02-18 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US20050058307A1 (en) * 2003-07-12 2005-03-17 Samsung Electronics Co., Ltd. Method and apparatus for constructing audio stream for mixing, and information storage medium
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1721312B1 (en) * 2004-03-01 2008-03-26 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TW200638335A (en) 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
AU2006255662B2 (en) 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
MX2008013753A (es) 2006-04-27 2009-03-06 Dolby Lab Licensing Corp Control de ganancia de audio que utiliza deteccion de evento auditivo basado en intensidad acustica especifica.
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US8255821B2 (en) * 2009-01-28 2012-08-28 Lg Electronics Inc. Method and an apparatus for decoding an audio signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8787585B2 (en) 2009-01-14 2014-07-22 Dolby Laboratories Licensing Corporation Method and system for frequency domain active matrix decoding without feedback

Also Published As

Publication number Publication date
MX2007015118A (es) 2008-02-14
CA2610430A1 (en) 2006-12-14
TW200715901A (en) 2007-04-16
AU2006255662B2 (en) 2012-08-23
CA2610430C (en) 2016-02-23
CN101228575A (zh) 2008-07-23
US20080033732A1 (en) 2008-02-07
IL187724A (en) 2015-03-31
WO2006132857A2 (en) 2006-12-14
KR101251426B1 (ko) 2013-04-05
EP1927102A2 (en) 2008-06-04
CN101228575B (zh) 2012-09-26
AU2006255662A1 (en) 2006-12-14
MY149255A (en) 2013-07-31
US20080097750A1 (en) 2008-04-24
US8280743B2 (en) 2012-10-02
WO2006132857A3 (en) 2007-05-24
TWI424754B (zh) 2014-01-21
BRPI0611505A2 (pt) 2010-09-08
KR20080015886A (ko) 2008-02-20
JP2008543227A (ja) 2008-11-27
IL187724A0 (en) 2008-08-07

Similar Documents

Publication Publication Date Title
JP5191886B2 (ja) サイド情報を有するチャンネルの再構成
CN103489449B (zh) 音频信号译码器、提供上混信号表示型态的方法
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
AU2007300813B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP4987736B2 (ja) オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法
RU2407226C2 (ru) Генерация пространственных сигналов понижающего микширования из параметрических представлений мультиканальных сигналов
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
CN111970629B (zh) 音频解码器和解码方法
JP2007507731A (ja) 互換性マルチチャンネル符号化/復号化
JP2009543142A (ja) 複数のパラメータ的に符号化された音源を合成するための概念
KR20080051042A (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
MX2008010631A (es) Codificacion y decodificacion de audio

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090514

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111129

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130130

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160208

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees