[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2009510810A - オーディオ信号の処理装置及び方法 - Google Patents

オーディオ信号の処理装置及び方法 Download PDF

Info

Publication number
JP2009510810A
JP2009510810A JP2008521316A JP2008521316A JP2009510810A JP 2009510810 A JP2009510810 A JP 2009510810A JP 2008521316 A JP2008521316 A JP 2008521316A JP 2008521316 A JP2008521316 A JP 2008521316A JP 2009510810 A JP2009510810 A JP 2009510810A
Authority
JP
Japan
Prior art keywords
channel
information
block
audio signal
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008521316A
Other languages
English (en)
Other versions
JP2009510810A5 (ja
Inventor
リーブヒェン,ティルマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/KR2005/002291 external-priority patent/WO2007011079A1/en
Priority claimed from PCT/KR2005/002290 external-priority patent/WO2007011078A1/en
Priority claimed from PCT/KR2005/002292 external-priority patent/WO2007011080A1/en
Priority claimed from PCT/KR2005/002307 external-priority patent/WO2007011084A1/en
Priority claimed from PCT/KR2005/002306 external-priority patent/WO2007011083A1/en
Priority claimed from PCT/KR2005/002308 external-priority patent/WO2007011085A1/en
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009510810A publication Critical patent/JP2009510810A/ja
Publication of JP2009510810A5 publication Critical patent/JP2009510810A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】オーディオ信号のエンコーディング及びデコーディング装置及び方法を提供する。
【解決手段】ある実施形態において、チャンネルマッピング情報は、オーディオ信号のための構成情報に付加される。チャンネルマッピング情報は、再生装置内のどのスピーカが各チャンネルをオーディオ信号にマッピングするかを示す。例えば、チャンネルマッピング情報は、各ビットがスピーカと関連する複数のビットを含み、チャンネルが関連するスピーカ用のオーディオ信号内に存在するかどうかを示す。
【選択図】図3

Description

本発明はオーディオ信号を処理する方法に係り、特に、オーディオ信号をエンコーディングし且つデコーディングする方法及び装置に関する。
従来には、オーディオ信号の保存及び再生は異なる方式により行われていた。例えば、音楽及び音声は蓄音機技術(例えば、レコードプレーヤ)、磁気技術(例えば、カセットテープ)、及びデジタル技術(例えば、コンパクトディスク)により記録され且つ保存されていた。オーディオ保存技術の進歩に伴い、オーディオ信号の品質及び保存性を最適化させるために多くの問題点を克服する必要がある。
音楽信号のアーカイブ及び広帯域送信において、無損失再構成は、MP3またはAACなどのMPEG標準において定義された概念的なコーディングによる圧縮に際して、高効率よりもなお一層重要な特徴となっている。たとえ、DVDオーディオ及びスーパーCDオーディオが独自仕様の無損失圧縮スキームを含んでいるとしても、コンテンツ保有者及び放送業体に開放的で且つ一般的な圧縮スキームが求められるようになった。このような要求に応えて、新規な無損失コーディングスキームがMPEG−4オーディオ標準に対する拡張として考慮される。無損失オーディオコーディングは原信号の完全な再構成に起因する品質の損失なしにデジタルオーディオデータを圧縮可能にする。
本発明はオーディオ信号の処理方法に関する。
一実施形態において、チャンネルマッピング情報は、オーディオ信号のための構成情報に付加される。チャンネルマッピング情報は、再生装置内のどのスピーカが各チャンネルをオーディオ信号にマッピングするかを示す。例えば、チャンネルマッピング情報は、各ビットがスピーカと関連する複数のビットを含み、チャンネルが関連するスピーカ用のオーディオ信号内に存在するかどうかを示す。
他の実施形態において、指示子は、チャンネルマッピング情報が構成情報に含まれるかどうかを示すように構成情報に付加される。
さらに他の実施形態において、構成情報及び複数のチャンネルを備えるオーディオ信号が受信される。チャンネルマッピング情報は、構成情報から読み出される。チャンネルマッピング情報は、再生装置内のどのスピーカが各チャンネルをオーディオ信号にマッピングするかを示す。チャンネルは、チャンネルマッピング情報に基づいて処理される。例えば、チャンネルマッピング情報は複数のビットを含み、各ビットはスピーカと関連し、チャンネルが関連するスピーカ用のオーディオ信号内に存在するかどうかを示す。
以下、添付図面に基づき、本発明の好適な実施形態について説明する。なお、図中、同じ構成要素にはできる限り同じ符号を付してある。
本発明を記述する前に、本発明において開示されたほとんどのターミノロジーは公知の汎用用語であるが、一部の用語は必要に応じて選択されて次の説明において用いられるところに留意すべきである。よって、出願人により定義された用語は本発明においてその意味に基づいて理解すべきものである。
無損失オーディオコーディング方法において、エンコーディングプロセスが情報の損失無しに完全な可逆性を有する必要があるため、エンコーダ及びデコーダの両方の種々の構成要素は決定的な方式により実現できなければならない。
コーデック構造
図1は、本発明によるエンコーダ1の例示図である。
区画部100は、入力オーディオデータをフレームに区画する。1フレーム内において、各チャンネルはさらなる処理のためにオーディオサンプルにサブ分割される。バッファ110は、区画部100により区画されたブロック及び/またはフレームサンプルを保存する。
係数推定部120は、各ブロックに対する最適な組の係数値を推定する。係数の数、すなわち、予測器の順序は適宜に選択可能である。係数推定部120は、デジタルオーディオデータのブロックに対してパーコール値(parcor value)の組を演算する。パーコール値は、予測係数を示すパーコールを示す。量子化部130は、パーコール値組を量子化する。
第1のエントロピー符号化部140は、パーコール値からオフセット値を差し引いてパーコール余り値を演算し、エントロピーパラメータにより定義されたエントロピー符号化を用いてパーコール余り値をエンコーディングする。ここで、オフセット値及びエントロピーパラメータは最適なテーブルから選択される。最適なテーブルは、デジタルオーディオデータのブロックのサンプリングレートに基づいて複数のテーブルから選択される。複数のテーブルは、送信用のデジタルオーディオデータの最適な圧縮のために、複数のサンプリング範囲のそれぞれに対して予め定義される。
係数変換部150は、量子化されたパーコール値を線形予測符号化(LPC:Linear Predictive Coding)係数に変換する。予測器160は、LPC係数を用いてバッファ110内に保存されている以前の原サンプルから現在の予測値を推定する。減算器170は、バッファ110に保存されているデジタルオーディオデータのオリジナル値を用いてデジタルオーディオデータのブロックの余り予測及び予測器160により推定された予測値の演算を行う。
第2のエントロピー符号化部180は、他のエントロピーコードを用いて余り予測をコーディングし、コードインデックスを生成する。選択されたコードのインデックスは、補助情報として送信される。第2のエントロピー符号化部180は、異なる複雑性を有する2つの代案的なコーディング技術のうちいずれか一方を用いて余り予測をコーディングする。一方のコーディング技術は公知のゴロム−ライス(Golomb Rice)コーディング(以下、「ライスコーディング」と略す。)方法であり、他方のコーディング技術は公知のブロックギルバート−ムーアコード(以下、「BGMC」と略す。)方法である。ライスコードは複雑性は低いものの、効率的である。BGMC算術コーディングスキームは、ライスコードに比べてやや増加して複雑性を犠牲にして遥かに良好な圧縮を提供する。
結局として、マルチプレックス部190は、コーディングされた余り予測、コードインデックス、コーディングされたパーコール余り値、及び他の付加情報をマルチプレックスして圧縮されたビットストリームを形成する。また、エンコーダ1は、デコーディングされたデータを検証するためにデコーダにおいて主として提供される巡回冗長検査(CRC:Cyclic Redundancy Check)チェックサムを提供する。エンコーダ側上において、CRCは圧縮されたデータが無損失にてデコーディング可能であることを保証するのに用いられる。
付加的なエンコーディングオプションは、フレキシブルブロックスイッチングスキーム、ランダムアクセス及びジョイントチャンネルコーディングを含む。エンコーダ1は、種々の圧縮レベルに異なる複雑度を与えるためにこれらのオプションを用いる。ジョイントチャンネルコーディングは、ステレオチャンネルまたはマルチチャンネル信号同士の従属性を活用するのに用いられる。これは、2つのチャンネル間の差分が原チャンネルにおいてより効率よくコーディング可能なセグメントにおけるこのような差分をコーディングして達成することができる。このようなエンコーディングオプションの詳細については、本発明による例示的なデコーダの説明後に行う。
図2は、本発明によるデコーダ2の例示図である。特に、図2は、エンコーダよりもやや複雑性の低い無損失オーディオ信号デコーダを示し、その理由は、いかなる適用も行われないためである。
デマルチプレックス部200は、オーディオ信号を受信し、デジタルオーディオデータのブロックのコーディングされた余り予測、コードインデックス、コーディングされたパーコール余り値、及び他の付加情報をデマルチプレックスする。第1のエントロピー復号化部210は、エントロピーパラメータにより定義されたエントロピーコードを用いてパーコール余り値をデコーディングし、デコーディングされたパーコール余り値にオフセット値を加えてパーコール値の組を演算する。ここで、オフセット値及びエントロピーパラメータはデジタルオーディオデータのブロックのサンプルレートに基づいて複数のテーブルからデコーダにより選択されたテーブルから選択される。第2のエントロピー復号化部220は、コードインデックスを用いてデマルチプレックスされたコーディングされた余り予測をデコーディングする。係数変換部230は、エントロピー復号化されたパーコール値をLPC係数に変換する。予測器240は、LPC係数を用いてデジタルオーディオデータのブロックの予測余りを推定する。加算器250は、デコーディングされた予測余りを推定された予測余りに加えてデジタルオーディオデータの原ブロックを取得する。アセンブリング部260は、デコーディングされたブロックデータをフレームデータにアセンブリングする。
この後、デコーダ2は、コーディングされた予測余り及びパーコール余り値をデコーディングし、パーコール余り値をLPC係数に変換し、逆予測フィルタを適用して無損失再構成信号を演算する。デコーダ2の計算量は、エンコーダ1により選択された予測順序による。ほとんどの場合、リアルタイムなデコーディングはロウエンドシステムにおいてさえ行うことが可能である。図3は、本発明による複数のチャンネル(例えば、Mチャンネル)を含む圧縮オーディオ信号のビットストリーム構造の例示図である。ビットストリームは、複数のチャンネル(例えば、Mチャンネル)を含む少なくとも1枚のオーディオフレームから構成される。ビットストリーム構成シンタックス(テーブル6参照)の「チャンネル」フィールドは、チャンネル数を示す。各チャンネルは、後述するように、本発明によるブロックスイッチングスキームを用いて複数のブロックにサブ分割される。各サブ分割されたブロックは異なるサイズを有し、図1のエンコーディングによりコーディングデータを含む。例えば、サブ分割されたブロック内のコーディングデータは、コードインデックス、予測順序K、予測係数、及びコーディングされた余り値を含む。チャンネル対同士のジョイントコーディングが用いられる場合、ブロック区画は両チャンネルにおいて同じであり、ブロックはインタリーブ方式により保存される。ビットストリーム構成シンタックス(テーブル6)内の「js stereo」フィールドは、ジョイントステレオ(チャンネル差分)がオンであるか、またはオフであるかを示し、フレーム データシンタックス(テーブル7)内の「js switch」フィールドは、ジョイントステレオ(チャンネル差分)が選択されているかどうかを示す。そうでなければ、各チャンネルに対するブロック区画は独立的である。
以下、添付図面に基づき、ブロックスイッチング、ランダムアクセス、区画、及び上述したエントロピー符号化オプションについてシンタックスを参考として詳述する。
ブロックスイッチング
本発明の一態様は、実際にコーディングスキームを用いる前に各チャンネルを複数のブロックにサブ分割することと関連する。以下、本発明によるブロック区画(または、サブ分割)方法は「ブロックスイッチング方法」として言及される。
階層ブロックスイッチング
図4は、本発明による階層ブロックスイッチング方法の概念の例示図である。例えば、図4は、1チャンネルを32ブロックに階層的にサブ分割する方法を示す。複数のチャンネルが単一のフレームに与えられるとき、各チャンネルは32個のブロックまでサブ分割(または、分割)可能であり、各チャンネルに対するサブ分割されたブロックは1フレームを構成する。このため、本発明によるブロックスイッチング方法は、図1に示す区画部100により行われる。さらに、上述したように、予測及びエントロピー符号化はサブ分割されたブロック単位で行われる。
一般に、従来のオーディオ無損失符号化(ALS:Audio Lossless Coding)は、比較的に単純なブロックスイッチングメカニズムを含む。Nサンプルの各チャンネルは1つの完全長さのブロック(NB=N)または4個ブロックの長さNB=N/4(例えば、1:4スイッチング)を用いてエンコーディングされ、ここで、同じブロック分割がすべてのチャンネルに適用される。一部の状況下においては、このようなスキームは一部の制限を有する。例えば、単に1:1または1:4スイッチングのみが可能であることがあり、他のスイッチング(例えば、1:2、1:8及びこれらの組み合わせ)の方が一部の場合にはさらに有効であることがある。また、従来のALSにおいて、スイッチングは他のチャンネルが他のスイッチング(チャンネルが相関しない場合には特に真である)から利得を得るとしても、全てのチャンネルに対して同様に行われる。
このため、本発明の実施形態によるブロックスイッチング方法は比較的にフレキシブルなブロックスイッチングスキームを提供し、1フレームの各チャンネルは複数のブロックに階層的にサブ分割される。例えば、図4は、32個のブロックに階層的にサブ分割可能な1チャンネルを示す。NB=N、N/2、N/4、N/8、N/16、及びN/32とのブロックの任意の組み合わせは、各ブロックが2重長さの上位ブロックのサブ分割から生じる限り、この実施形態によりチャンネル内において可能でありうる。例えば、図4に例示するように、N/4+N/4+N/2への分割は可能であるが、N/4+N/2+N/4への分割は不可である(例えば、図5(e)及び図5(f)に示すブロックスイッチング例は後述する)。換言すると、チャンネルは複数のブロックに分割されて、各ブロックがi=1、2、...pに対するN/(mi)のうちいずれかと同じ長さを有する。ここで、Nはチャンネルの長さ、mは2以上の整数、pはサブ分割階層のレベル数を示す。
このため、本発明の実施形態において、ビットストリームは、ブロックスイッチングレベルを示す情報と、ブロックスイッチング結果を示す情報と、を含む。ここで、ブロックスイッチングと関連する情報は、後述するように、デコーディングプロセスにおいて用いられるシンタックスに含まれる。
例えば、ブロックスイッチングプロセス後に生成された最大ブロックサイズがNB=N/32になるように設定が行われる。しかしながら、このような設定は、本発明の説明を簡略化するための例に過ぎない。このため、本発明による設定はこのような設定に制限されない。
特に、最大ブロックサイズがNB=N/32の場合、ブロックスイッチングプロセスが、レベル5ブロックスイッチングとして言及される5回に亘って階層的に行われる。代案的に、最大のブロックサイズがNB=N/16の場合、ブロックスイッチングプロセスが、レベル4ブロックスイッチングとして言及される4回に亘って階層的に行われる。同様に、最大のブロックサイズがNB=N/8の場合、ブロックスイッチングプロセスは、レベル3ブロックスイッチングとして言及される3回に亘って階層的に行われる。最大のブロックサイズがNB=N/4の場合、ブロックスイッチングプロセスは、レベル2ブロックスイッチングとして言及される2回に亘って階層的に行われる。最大のブロックサイズがNB=N/2の場合、ブロックスイッチングプロセスは、レベル1ブロックスイッチングとして言及される1回に亘って階層的に行われる。結局として、最大のブロックサイズがNB=Nの場合、階層的なブロックスイッチングプロセスは行われることなく、これは、レベル0ブロックスイッチングとして言及される。
本発明の実施形態において、ブロックスイッチングを示す情報は、第1のブロックスイッチング情報として言及される。例えば、第1のブロックスイッチング情報は、後述するプロセスにおいて説明されるように、テーブル6に示すシンタックス内の2ビット「block switching」フィールドにより表現される。特に、「block switching=00」はレベル0を、「block switching=01」はレベル1から3のうち少なくともいずれか1つを、「block switching=10」はレベル4を、そして「block switching=11」はレベル5を示す。
また、上述したブロックスイッチングレベルによる、各階層的なレベルに対して行われたブロックスイッチングの結果を示す情報は、実施形態において第2のブロックスイッチング情報として言及される。以下、第2のブロックスイッチング情報は、テーブル7に示すシンタックス内の8ビット、16ビット及び32ビットのうち少なくともいずれか1つにより表現される。特に、「block switching=01」の場合(レベル1から3のいずれかを示す場合)、「bs info」は8ビットにより表現される。「block switching=10」の場合(レベル4を示す場合)、「bs info」は16ビットにより表現される。すなわち、ブロックスイッチング結果の4レベルまでは16ビットを用いて表現される。さらに、「block switching=11」の場合(レベル5を示す場合)、「bs info」は32ビットにより表現される。すなわち、ブロックスイッチング結果の5レベルまでは32ビットを用いて表現される。結局として、「block switching=00」の場合(ブロックスイッチングが行われない旨を示す場合)、「bs info」は送信されない。これは、1チャンネルが1ブロックを構成することを示す。
第2のブロックスイッチング情報に割り当てられたビットの総数は、第1のブロックスイッチング情報のレベル値に基づいて決まる。これは、最終的なビットレートを減らす結果を招く。第1のブロックスイッチング情報と第2のブロックスイッチング情報との間の関係は、以下のテーブル1に簡略に説明する。
Figure 2009510810
以下、第2のブロックスイッチング情報bs info内の各ビットを構成(または、マッピング)する方法の実施形態について説明する。
bs infoフィールドは、上述した実施形態により4バイトまでを含む。レベル1から5に関するビットのマッピングは[(0)1223333 44444444 5555555555555555]でありうる。第1のビットは、独立/同期ブロックスイッチングのセクションにおいて詳述する独立的なまたは同期化ブロックスイッチングを示すように保有される。図5(a)から図5(f)は、レベル3ブロックスイッチングが行われるチャンネルに対する他のブロックスイッチング例を示す。このため、これらの例において、最大のブロック長はNB=N/8であり、bs infoは1バイトからなる。最大のブロック長NB=Nから始まるとすれば、bs infoはブロックがさらにサブ分割される場合に設定される。例えば、図5(a)においてはサブ分割がなくて、「bs info」は(0)000 0000である。図5(b)において、フレームは((0)1...)にサブ分割され、長さN/2の第2のブロックは、((0)101...)をN/4長さの2つのブロックに分割して、「bs info」は(0)1010 000)である。図5(c)において、フレームは((0)1...)にサブ分割され、N/2長さの第1のブロックだけが((0)110...)をN/4長さの2つのブロックに分割して、「bs info」は(0)1100 0000となる。図5(d)において、フレームは((0)1...)にサブ分割され、N/2長さの第1及び第2のブロックが((0)111...)をN/4長さの2つのブロックにさらに分割し、長さN/4の第2のブロックだけが((0)11101...)を長さN/8の2つのブロックにさらに分割して、「bs info」は(0)111 0100となる。
上述したように、図5(e)及び図5(f)の例は、図5(e)のN/2ブロックと図5Fの第1のN/4ブロックが以前のレベルのブロックをサブ分割して取得できないために許容されないブロックスイッチングの場合を示す。
独立/同期化ブロックスイッチング
図6(a)から図6(c)は、本発明の実施形態によるブロックスイッチングの例示図である。
特に、図6(a)は、チャンネル1、2及び3に対してブロックスイッチングが行われない例を示す。図6(b)は、2つのチャンネル(チャンネル1及び2)が一つのチャンネル対を構成する例を示し、ブロックスイッチングは、チャンネル1及び2において同期的に行われる。インタリーブもまたこの例に適用される。図6(c)は、2つのチャンネル(チャンネル1及び2)が一つのチャンネル対を構成する例を示し、チャンネル1及び2のブロックスイッチングは独立して行われる。以下、チャンネル対は、2つの任意のオーディオチャンネルを指し示す。どのチャンネルがチャンネル対にグループ分けされるかの判断は、エンコーダにより自動的に行われうるか、または、ユーザによりマニュアルにて行われうる(例えば、L、Rチャンネル、Ls、Rsチャンネル)。
独立ブロックスイッチングに際し、たとえ、各チャンネルの長さが全てのチャンネルに対して同じであるとしても、ブロックスイッチングは各チャンネルに対して独立して行われることが可能である。すなわち、図6(c)に示すように、チャンネルはブロックに異なって分割される。チャンネル対の2つのチャンネルが互いに相関し、且つ、差分コーディングが用いられる場合、チャンネル対の両チャンネルは同期化されてブロックスイッチングされる。同期化ブロックスイッチングの際に、チャンネルは同じ方式によりブロックスイッチング(すなわち、ブロックに分割)される。図6(b)はこのような例を示し、ブロックがインタリーブされることをさらに示す。チャンネル対のうち2つのチャンネルが互いに相関していない場合に差分コーディングは利点がなく、これにより、チャンネルを同期的にブロックスイッチングする必要がない。むしろ、チャンネルを独立してスイッチングした方がさらに好適である。さらに、本発明の他の実施形態によれば、独立または同期化ブロックスイッチングの上述した方法は、3以上のチャンネル数を有するマルチチャンネル群に適用される。例えば、マルチチャンネル群の全てのチャンネルが互いに相関している場合、マルチチャンネル群の全てのチャンネルは同期的にスイッチングされる。一方、マルチチャンネル群の全てのチャンネルが互いに相関していない場合にマルチチャンネル群の各チャンネルは独立してスイッチングされる。
さらに、「bs info」フィールドはブロックスイッチング結果を示す情報として用いられる。また、「bs info」フィールドは、ブロックスイッチングがチャンネル対を構成する各チャンネルに対して独立してまたは同期化して行われるかどうかを示す情報として用いられる。この場合、上述したように、「bs info」フィールド内の特定のビット(例えば、第1のビット)が用いられる。例えば、チャンネル対の2つのチャンネルが互いに独立している場合、「bs info」フィールドの第1のビットは「1」に設定される。一方、チャンネル対の2つのチャンネルが互いに同期化される場合に「bs info」フィールドの第1のビットは「0」に設定される。
以下、図6(a)から図6(c)について説明する。
図6(a)を参照すれば、いかなるチャンネルにおいてもブロックスイッチングが行われないため、関連する「bs info」は生成されない。
図6(b)を参照すれば、チャンネル1及び2はチャンネル対を構成し、2つのチャンネルは互いに同期化され、ブロックスイッチングが同期的に行われる。例えば、図6(b)において、チャンネル1及び2の両方は長さN/4のブロックに分割され、同じbs info「bs info=(0)101 0000」を有する。このため、1つの「bs info」は各チャンネル対に対して送信されて、ビットレートを減らすという結果を招く。さらに、チャンネル対が同期化されれば、チャンネル対内の各ブロックは互いにインタリーブされることが求められる。インタリーブは利点(または、利得)がある。例えば、チャンネル対内の1チャンネルのブロック(例えば、図6Bのブロック1.2)は両チャンネル内の以前のブロック(例えば、図6(b)のブロック1.1及び2.1)に従属し、このため、これらの以前のブロックは現在ブロックに先行して利用可能なものである必要がある。
図6(c)を参照すれば、チャンネル1及び2はチャンネル対を構成する。しかしながら、この例において、ブロックスイッチングは独立して行われる。特に、チャンネル1はN/4までのサイズ(または、長さ)のブロックに分割され、「bs info=()101 0000」のbs infoを有する。チャンネル2はN/2までのサイズのブロックに分割され、「bs info=()100 0000」のbs infoを有する。図6(c)に示す例において、ブロックスイッチングは各チャンネル間に独立して行われ、このため、ブロック間のインタリーブプロセスは行われない。すなわち、ブロックが独立して行われたチャンネルにおいて、チャンネルデータは独立して配列される。
ジョイントチャンネルコーディング
また、ジョイントチャンネルコーディングはジョイントステレオとも呼ばれ、ステレオ信号の2チャンネル間またはマルチチャンネル信号の任意の2チャンネル間の従属性を活用するのに使用可能である。たとえ、2チャンネルx1(n)及びx2(n)を独立して処理することが容易であるとしても、チャンネル間の従属性を活用する単純な方法は、差分信号、x1(n)またはx2(n)の代わりにd(n)=x2(n)−x1(n)をエンコーディングすることである。
各ブロックにおけるx1(n),x2(n)及びd(n)間のスイッチングは。2つの信号が最も効率よくコーディング可能な個別信号の比較に従属して行われる。スイッチングされた差分コーディングによるこのような予測は、2つのチャンネルが互いに極めて類似している場合に利点がある。マルチチャンネルの場合、チャンネルは適宜なチャンネル対を割り当てるためにエンコーダにより並替え可能である。
また、単純な差分コーディングに加えて、無損失オーディオコーデックは、マルチチャンネル信号の任意のチャンネル間のチャンネル間冗長を活用するさらに複雑なスキームを支援する。
ランダムアクセス
本発明はオーディオ無損失コーディングに関するものであり、ランダムアクセスに対応可能である。ランダムアクセスは、以前の部分のデコーディングに高いコストをかけることなくエンコーディングされたオーディオ信号の所定の部分を高速にてアクセスすることを示す。圧縮されたデータの検索、編集またはストリーミングを採用するアプリケーションに重要な特徴がある。ランダムアクセスを可能にするためには、ランダムアクセス部内において、エンコーダが以前のフレームをデコーディングすることなくデコーディング可能なフレームを挿入する必要がある。挿入されたフレームは「ランダムアクセスフレーム」として言及される。このようなランダムアクセスフレームにおいて、以前のフレームからいかなるサンプルも予測に用いられない。
以下、本発明によるランダムアクセス用の情報について説明する。構成シンタックスを参照すれば(テーブル6参照)、ランダムアクセスと関連する情報は構成情報として送信される。例えば、「random access」フィールドは、ランダムアクセスが許容されるかどうかを示す情報として用いられ、8ビットを用いて表現される。さらに、ランダムアクセスが許容される場合、8ビットの「random access」フィールドは、ランダムアクセス部を構成するフレーム数を指定する。例えば、「random access=0000 0000」の場合、ランダムアクセスには対応されない。すなわち、「random access>0」の場合、ランダムアクセスに対応する。特に、「random access=000 0001」の場合、これは、ランダムアクセス部を構成するフレーム数が1であることを示す。これは、ランダムアクセスが全てのフレーム部において許容されることを意味する。さらに、「random access=1111 1111」の場合、これは、ランダムアクセス部を構成するフレーム数が255であることを示す。これにより、「random access」情報は、現在のランダムアクセス部内のランダムアクセスフレームと次のランダムアクセス部内のランダムアクセスフレームとの距離に相当する。以下、この距離はフレーム数により表現される。
32ビットの「ra unit size」フィールドは、ビットストリーム内に含まれて送られる。ここで、「ra unit size」フィールドは、ランダムアクセスユニットをバイトで示し、これにより、現在のランダムアクセスフレームから次のランダムアクセスフレームまでの距離をバイトで表わす。これにより、「ra unit size」フィールドは、構成シンタックス(テーブル6)に含まれるか、あるいは、フレーム−データシンタックス(テーブル7)に含まれる。構成シンタックス(テーブル6)は、「ra unit size」情報のビットストリーム内における保存先を示す情報をさらに含む。この情報は、2ビットの「ra flag」フィールドとして表現される。特に、例えば、「ra flag=00」の場合、これは、「ra unit size」情報がビットストリームに保存されない旨を示す。「ra flag=01」の場合、これは、「ra unit size」情報がビットストリーム内のフレームデータシンタックス(テーブル7)に保存されない旨を示す。さらに、「ra flag=10の場合、「ra unit size」情報はビットストリーム内の構成シンタックス(テーブル6)に保存される。「ra unit size」情報が構成シンタックスに含まれる場合、これは、「ra unit size」情報が1回のみビットストリーム上において送信され、且つ、全てのランダムアクセス部に同様に適用されることを示す。「ra unit size」情報がフレーム−データシンタックスに含まれる場合、これは、現在のランダムアクセス部内のランダムアクセスフレームと次のランダムアクセス部内のランダムアクセスフレームとの距離を示す。このため、「ra unit size」情報は、この距離の可変に起因して、ビットストリーム内の各ランダムアクセスユニットに対して送られる。これにより、構成シンタックス(テーブル6)内の「random access」フィールドは、第1の一般情報として言及される。また、「ra flag」フィールドは、第2の一般情報として言及される。本発明のこのような態様において、オーディオ信号は構成情報及び複数のランダムアクセス部を含み、各ランダムアクセス部は1以上のオーディオデータフレームを含み、これらのうちいずれか一つはランダムアクセスフレームであり、構成情報は2つの隣り合うランダムアクセスフレーム間の距離をフレームにより表わす第1の一般情報を含み、第2の一般情報は各ランダムアクセス部に対するランダムアクセス部のサイズ情報が保存されることを示す。ランダムアクセス部のサイズ情報は、2つの隣り合うランダムアクセスフレーム間の距離をバイトで表わす。
選択的に、本発明のこのような態様において、オーディオ信号をデコーディングする方法は、構成情報及び複数のランダムアクセス部を備えるオーディオ信号を受信するが、各ランダムアクセス部は1以上のオーディオデータフレームを含み、これらのうちいずれかはランダムアクセスフレームであるステップと、2つの隣り合うランダムアクセスフレーム間を距離をフレームで表わす第1の一般情報を構成情報から読み取るステップと、各ランダムアクセス部に対するランダムアクセスサイズ情報が保存される旨を示す第2の一般情報を読み取るステップと、を含み、このようなランダムアクセス部のサイズ情報は、2つの隣り合うランダムアクセスフレーム間の距離をバイトで表わす。デコーダはランダムアクセスユニットサイズ情報にアクセスし、この情報と第1及び第2の一般情報を用いてオーディオ信号内のオーディオデータのランダムアクセスを行う。
チャンネル構成
図3に示すように、オーディオ信号は、本発明によるマルチチャンネル情報を含む。例えば、各チャンネルは、オーディオスピーカの位置と一対一の対応関係でマッピングされる。構成シンタックス(テーブル6)は、16ビットの「chan config info」フィールド及び16ビットの「channel」フィールドとして表現されるチャンネル構成情報を含む。「chan config info」フィールドは、チャンネルをスピーカ位置にマッピングするための情報を含み、16ビットの「channel」フィールドは、チャンネルのトータル数を示す情報を含む。例えば、「channel」フィールドが「0」と同じ場合、これは、チャンネルがモノチャンネルに相当する旨を示す。「channel」フィールドが「1」と同じ場合、これは、チャンネルがステレオチャンネルのうちいずれかに相当する旨を示す。「channel」フィールドが「2」以上と同じ場合、これは、チャンネルがマルチチャンネルのうちいずれかに相当する旨を示す。
テーブル2は「chan config info」フィールドを構成する各ビットとこれに対応する各チャンネルの例を示す。特に、対応するチャンネルが送信されたビットストリーム内に存在する場合、「chan config info」フィールド内の対応するビットは「1」に設定される。代案的に、対応するチャンネルが送信されたビットストリーム内に存在しない場合、「chan config info」フィールド内の対応するビットは「0」に設定される。また、本発明は、「chan config info」フィールドが構成シンタックス(テーブル6)内に存在するかどうかを示す情報を含む。この情報は、1ビットの「chan config」フラグとして表現される。特に、「chan config=0」は、「chan config info」フィールドが存在しない旨を示す。「chan config=1」は、「chan config info」フィールドが存在する旨を示す。このため、「chan config=0」の場合、これは、「chan config info」フィールドが構成シンタックス(テーブル6)内において新たに定義される旨を示す。
Figure 2009510810
さらに、チャンネル構成において、相関するチャンネルがオーディオデータまたはオーディオ信号の構造に隣接しない。これにより、相関するチャンネルが隣接するようにチャンネルデータを再構成することが利点となる。チャンネルが再構成される方式は、構成情報(テーブル6)のchan posフィールドにおいて示される。さらに、構成情報(テーブル6)は、chan posフィールドのチャンネル再構成情報が存在するかどうかを示すchan posフィールドを含む。
上述した種々のチャンネル情報に基づいて、デコーダは、正確なチャンネルが正確なスピーカに送られるようにオーディオ信号を処理する。
フレーム長
図3に示すように、オーディオ信号は、本発明により多数または多重のチャンネルを含む。このため、エンコーディングを行うとき、1フレームを構成するマルチチャンネルの数に関する情報及び各チャンネルに対するサンプルの数に関する情報はビットストリーム内に挿入されて送信される。構成シンタックス(テーブル6)を参照すれば、32ビットの「sample」フィールドは、各チャンネルを構成するオーディオデータサンプルのトータル数を示す情報として用いられる。さらに、16ビットの「frame length」フィールドは、対応するフレーム内の各チャンネルに対するサンプルの数を示す情報として用いられる。
さらに、「frame length」フィールドの16ビット値はエンコーダにより用いられる値により決まり、ユーザ定義値と呼ばれる。すなわち、固定値の代わりに、ユーザ定義値はエンコーディングのプロセス時に任意に決まる。すなわち、固定値の代わりに、ユーザ定義値はエンコーディングプロセス時に任意に決まる。例えば、この値は、エンコーディングプロセスのユーザにより送られる。
このため、デコーディングプロセス中にビットストリームが図2に示すデマルチプレックス部200を介して受信されるとき、各チャンネルのフレーム数が先行して取得されることが必要である。この値は、後述するアルゴリズムにより取得される。
frames = samples / frame length;
rest = samples % frame length;
if (rest)

frames++;
frlen last = rest;

else
frlen last = frame length;
特に、各チャンネルに対するフレームのトータル数は、ビットストリームを介して送信された「sample」フィールドにより決まる各チャンネルに対するサンプルのトータル数を、「frame length」フィールドにより決まる各チャンネルに対するフレーム内のサンプル数で割ることで演算される。例えば、「sample」フィールドにより決まったサンプルのトータル数が、「frame length」フィールドにより決まる各フレーム内のサンプル数のちょうど倍数である場合、多数の値がフレームのトータル数となる。しかしながら、「sample」フィールドにより決まったサンプルのトータル数が、「frame length」フィールドにより決まったサンプル数のちょうど倍数ではない場合、且つ、余りが存在する場合、フレームのトータル数は多数値以上に「1」ずつインクリメントする。さらに、最終フレームfrlen lastのサンプル数は余りとして決まる。これは、最終フレームのサンプル数だけがそれ以前のフレームとは異なるという旨を示す。上述したように、エンコーダとデコーダとの間の標準化された規則を定義することにより、エンコーダは、各チャンネルに対するサンプルのトータル数(「sample」フィールド)及び各チャンネルのフレーム内のサンプル数(「frame length」フィールド)を自由に決めて送信することができる。さらに、デコーダは、送信された情報に対する上述したアルゴリズムを用いて、デコーディングに用いられる各チャンネルに対するフレーム数を正確に決めることができる。
線形予測
本発明において、線形予測は無損失オーディオコーディングに適用される。図1に示す予測器160は少なくとも1以上のフィルタ係数を含み、以前のサンプル値から現在のサンプル値を予測する。この後、第2のエントロピー符号化部180は、予測値とオリジナル値との間の差分に対応する余り値に対するエントロピー符号化を行う。また、予測器160に適用される各ブロックに対する予測係数値は、係数推定部120から最適値として選択される。さらに、予測係数値は、第1のエントロピー符号化部140によりエントロピー符号化される。第1のエントロピー符号化部及び第2のエントロピー符号化部180によりコーディングされたデータは、マルチプレックス部190によりビットストリームの一部として挿入されてから送信される。
以下、本発明により線形予測を行う方法について説明する。
FIRフィルタによる予測
線形予測は、音声及びオーディオ信号の処理のための多数のアプリケーションに用いられる。以下、予測器160の例示的な動作を有限インパルス応答(FIR:Finite Impulse Response)フィルタを元に説明する。しかしながら、この例が本発明の範囲を制限しないことは言うまでもない。
時間離散信号x(n)は、以前のサンプルx(n−k)から大まかに予測可能である。予測は。下記式として与えられる。
Figure 2009510810
Kは予測の順序である。予測サンプルが原サンプルに近づく場合、余りは以下の通りである:
Figure 2009510810
これは、x(n)そのものよりも小さなバラツキを有し、その結果、e(n)はさらに効率よくエンコーディングされる。
入力サンプルのセグメントをフィルタリングする前にこのようなセグメントから予測係数を推定する手続きは、フォワード適応として言及される。この場合、係数は送信される必要がある。一方、係数が以前に処理されたセグメントまたはサンプル、例えば、余りから推定される場合、バックワード適応が参考として行われる。バックワード適応の手続きは、係数を推定するのに必要なデータがデコーダにも利用可能であるため、いかなる係数送信も不要であるという利点を有する。
約10の順序を有するフォワード適応型の予測方法は音声コーディングに汎用され、無損失オーディオコーディングにも採用可能である。ほとんどのフォワード適応型の無損失予測スキームの最大順序は、例えば、K=32のように遥かに小さい。例外として、スーパーオーディオCDに対する1ビット無損失コーデックがあり、これは、128までの予測順序を用いる。
一方、数百個の係数を有するバックワード適応型のFIRフィルタは、多くの領域、例えば、チャンネル等化及びエコー削除に一般的に用いられる。ほとんどのこれらのシステムは、また、無損失オーディオコーディングに提案されるLMSアルゴリズムまたはその変形に基づく。高次順を有するこのようなLMS基盤のコーディングスキームは、予測係数がサイド情報として送信される必要がないために作用可能であり、その数はデータレートに寄与しない。しかしながら、バックワード適応型のコーデックは、適応がエンコーダとデコーダの両方に行われる必要があるという欠点を有するため、デコーダがフォワード適応型の場合よりも複雑になる。
フォワード適応型予測
以下、本発明の例示的な実施形態として、フォワード適応型予測について説明する。フォワード適応型線形予測において、最適な予測係数hk(余りの最小化されたバラツキの項)は、通常、自動相関方法または共分散を用いて係数推定部120により各ブロックに対して推定される。従来のレビンソン−ダービン(Levinson Durbin)アルゴリズムを用いる自動相関方法は、予測器順序を繰り返し適応するための簡単な手段を提供することができるというさらなる利点を有する。さらに、このアルゴリズムは、対応するパーコール係数も固有に計算する。
フォワード適応型予測の他の態様は、適切な予測順序を決めることである。順序が増大するに伴い、予測エラーのバラツキは低減され、余りに対する小さなビットレートReをもたらす。一方、予測係数に対するビットレートRcは、送信される係数の数を増やす。このため、全体のビットレートを最小化する最適な順序を見つけることが課題となる。これは、予測係数Kに関する下記式を最小化して表現することができる:
total(K)=Re(K)+Rc(K)
予測が高次順になるにつれて単調増加することにより、RはKに減少される。一方、Rcは、係数の増加数が送信される必要があるため、Kで単調増加する。
Figure 2009510810
たとえ、係数ビットレートが全体のビットレートに直接的な効果を有することが上述した数式から明らかであるとしても、また、Rcの遅い増加は、Rtotalの最小が高次順にシフトされるように許容し(ここで、Rは、もちろん小さい)、良好な圧縮をもたらす。その結果、予測係数の効率的で且つ正確な等化は、最大圧縮を達成する上で重要な役割を果たす。
予測順序
本発明において、線形予測に対する予測係数の数を決める予測順序Kが決まる。また、予測順序Kは、係数推定部120により決まる。以下、決まった予測順序に関する情報は、ビットストリームに含まれてから送信される。
係数シンタックス(テーブル6)は、予測順序Kに関する情報を含む。例えば、1ビットから10ビットの「max order」フィールドは、最大の順序値を示す情報に対応する。1ビットから10ビットの「max order」フィールドの最高次値は、K=1023(例えば、10ビット)である。予測係数Kに関する他の情報として、構成シンタックス(テーブル6)は、各ブロックに対する最適な順序が存在するかどうかを示す1ビットの「adapt order」フィールドを含む。例えば、「adapt order=1」の場合、最適な順序は、各ブロックに対して与えられる必要がある。ブロック データシンタックス(テーブル8)において、最適な順序は1ビットから10ビットの「opt order」フィールドとして与えられる。さらに、「adapt order=0」の場合、個別の最適な順序は各ブロックに対して与えられない。この場合、「max order」フィールドは、全てのブロックに適用された最終順序となる。
最適な順序opt orderは、max orderフィールドの値と対応するブロックのサイズNBに基づいて決まる。特に、例えば、max orderがKmax=10として決まり、且つ、「apapt order=1」の場合、各ブロックに対するopt orderが対応するブロックのサイズを考慮して決まる。一部の場合に、max order(Kmax=10)よりも大きなopt order値が可能である。
特に、本発明は、高次予測順序に関するものである。階層ブロックスイッチングが存在しないとき、この実施形態によれば、長いブロック長と短いブロック長(例えば、4096及び1024、または8192及び2048)との間には、4の要因が存在する。一方、階層ブロックスイッチングが実現される実施形態においては、このような要因は、(例えば、32まで)増加可能であり、より大きな範囲(例えば、高いサンプリングレートに対して16384から512へと減少、また、32768から1024へと減少)を可能にする。
階層ブロックスイッチングが実現される実施形態において、極めて長いブロックを上手に用いるためには、高い最大予測順序が採用可能である。最大順序は、Kmax=1023でありうる。この実施形態において、Kmaxは、ブロック長NBに限られる。例えば、Kmax<NB/8である(例えば、NB=2048に対してKmax=255である)。このため、Kmax=1023を用いる場合、少なくともNB=8192のブロック長を必要とする。この実施形態において、構成シンタックス(テーブル6)内の「max order」フィールドは10ビットまでであり得、また、ブロックデータシンタックス(テーブル8)内の「opt order」フィールドは10ビットまででありうる。特定のブロックのビットの実際数は、1ブロックに対して許容された最大順序に従属する。ブロックが短ければ、ローカル予測順序はグローバル予測順序よりも小さくなる。以下、ローカル予測順序は対応するブロック長NBを考慮して決まり、グローバル予測順序は構成シンタックスにおいて「max order」Kmaxから決まる。例えば、Kmax=1023、または、NB=2048の場合、「opt order」フィールドは255のローカル予測順序に起因して(10ビットの代わりに)8ビットとして決まる。
特に、opt orderは、以下の式に基づいて決まる。
opt order=min(グローバル予測順序、ローカル予測順序)
グローバル及びローカル予測順序は、
グローバル予測順序=ceil(log2(最大予測順序+1))、及び
ローカル予測順序=max(ceil(log2(nb>>3)−1))、1)
として決まる。
実施形態において、チャンネルからサブ分割されたブロックのデータサンプルは予測される。現在のブロックの第1のサンプルは、以前のブロックの最終的なKサンプルを用いて予測される。K値は、上述した式から導き出されたopt orderから決まる。
現在のブロックがチャンネルの第1のブロックである場合、以前のブロックからいかなるサンプルも用いられない。この場合、漸進的な順序を有する予測が採用される。例えば、opt order値が対応するブロックに対してK=5であるとすれば、ブロック内の第1のサンプルは予測を行うことができない。ブロックの第2のサンプルは、(K=1と同様に)予測を行うためにブロックの第1のサンプルを用い、ブロックの第3のサンプルは、(K=2と同様に)予測を行うためにブロックの第1及び第2のサンプルを用いる。このため、6番目のサンプルから始まってそれ以降のサンプルに対して、予測がK=5のopt orderに応じて行われる。上述したように、予測順序は、K=1からK=5に漸増する。
上述した予測の漸進的な順序形態は、ランダムアクセスフレームにおいて用いられるときに極めて有利になる。ランダムアクセスフレームがランダムアクセス部の基準フレームに対応するため、ランダムアクセスフレームは、以前のフレームサンプルを用いて予測を行うことができない。すなわち、このような漸進的な予測技術は、ランダムアクセスフレームの開始時に適用可能である。
予測係数の量子化
上述した予測係数は、図1の量子化部130において量子化される。予測係数hkの直接的な量子化は、小さな量子化エラーが最適な予測フィルタの所定のスペクトル特徴から大きなバラツキをもたらすため、送信に極めて非効率的である。この理由から、予測係数の量子化は、係数推定部120により演算可能なパーコール(反射)係数rkに基づく。上述したように、例えば、係数推定部120は、従来のレビンソン−ダービンアルゴリズムを用いて処理される。
第1の2つのパーコール係数(γ1及びγ2に対応する)は、下記式を用いて量子化される:
Figure 2009510810
これに対し、余り係数は単純な7ビットの均一量子化器を用いて量子化される:
Figure 2009510810
あらゆる場合に、最終的に量子化された値akは、範囲[−64、63]に限られる。
エントロピー符号化
図1に示すように、2通りの方式のエントロピー符号化が本発明に適用される。特に、第1のエントロピー符号化部140は、上述した予測係数をコーディングするのに用いられる。また、第2のエントロピー符号化部180は、上述したオーディオ原サンプル及びオーディオ余りサンプルをコーディングするのに用いられる。以下、2通りの方式のエントロピー符号化について説明する。
予測係数の第1のエントロピー符号化
従来のライスコードは、本発明による第1のエントロピー符号化方法として用いられる。例えば、量子化された係数akの送信は、余り値を生成して行われる:
δk=ak−offsetk
これは、例えば、ライスコード方法と同じ第1のエントロピー符号化部140を用いてエンコーディングされる。このようなプロセスにおいて用いられるライスコードの対応するオフセット及びパラメータは、テーブル3、4、5に示す組のうちいずれかからグローバル的に選択される。テーブルシンタックス(すなわち、2ビットの「coef table」)は、構成シンタックス(テーブル6)に現れる。「coef table=11」の場合、これは、いかなるエントロピー符号化も適用されず、量子化された係数は7ビットのそれぞれに送信されることを示す。この場合、オフセットは[0、27]に限られる非署名値δk=ak+64を得るために、常に−64である。逆に、「coeff table=00」の場合にテーブル3が選択され、「coeff table=01」の場合にテーブル4が選択され、「coeff table=10」の場合にテーブル5が選択される。
図2のデコーダにおいて量子化された係数を受信するとき、第1のエントロピー復号化部220は、余り値δkがパーコール係数akの量子化されたインデックスを生成するためにオフセットと組み合せられるプロセスを用いて予測係数を再構成する:
k=δk+offsetk
この後、第1の2つの係数(γ1及びγ2)の再構成は、
Figure 2009510810
を用いて行われる。
Figure 2009510810
このため、第1のエントロピー符号化に用いられるこれらのタイプの係数テーブルは、サンプリング周波数に応じて与えられる。例えば、サンプリング周波数は、48kHz、96kHz、192kHzに分割可能である。3つのテーブル3、4、5のそれぞれは、各サンプリング周波数に対して与えられる。
単一テーブルを用いる代わりに、3つの異なるテーブルのうちいずれかが全体ファイルのために選択可能である。テーブルは、サンプリングレートに応じて典型的に選択されなければならない。44.1kHzの材料において、本発明の出願人は、48kHzテーブルを用いることを推奨している。しかしながら、一般的に、テーブルは、他の基準により選択可能である。
Figure 2009510810
Figure 2009510810
Figure 2009510810
余りの第2のエントロピー符号化
本発明は、後述するように、図1の第2のエントロピー符号化部180に適用されるコーディング方法の2つの異なるモードを含む。
単純なモードにおいて、余り値e(n)は、ライスコードを用いてエントロピー符号化される。各ブロックにおいて、全ての値が同じライスコードを用いてコーディング可能であるか、あるいは、ブロックが4つの部分にさらに分割可能であり、これらのそれぞれは異なるライスコードによりエンコーディングされる。適用されたコーディングのインデックスは、図1に示すように送信される。所定のデータ組に対する最適なライスコードを決めるための異なる方式が存在するため、余りの統計により適切なコードをエンコーダが選択しなければならない。
代案的に、エンコーダは、BGMCモードを用いてより複雑で且つ効率よいコーディングスキームを用いることができる。BGMCモードにおいて、余りのエンコーディングは、2つのカテゴリに分配を分割して達成される。2通りの方式は、分布の中心領域、|e(n)|<emaxに属する余りとその尻尾に属する余りを含む。尻尾内の余りは簡単に再中心合わせが行われ(すなわち、e(n)>emaxに対して、et(n)=e(n)−emaxが与えられる)、上述したようにライスコードを用いてエンコーディングされる。しかしながら、分布の中心において余りをエンコーディングするためには、BGMCは、先ず、LSB及びMSB成分に余りを分割した後、BGMCは、ブロックギルバート−ムーア(block Gilbert−Moore)(算術)コードを用いてMSBをエンコーディングする。結局として、BGMCは、直接的な固定長コードを用いてLSBを送信する。パラメータemax及び直接的に送信されたLSBの数の全ては、やや複雑ではないコーディングを許容しながら、このようなスキームのコーディング効率性にのみ影響するように選択される。
本発明による構成シンタックス(テーブル6)及びブロック データシンタックス(テーブル8)は、ライスコード及びBGMCコードのコーディングと関連する情報を含む。情報は新たに詳述される。
構成シンタックス(テーブル6)は、先ず、1ビットの「bgmc mode」フィールドを含む。例えば、「bgmc mode=0」はライスコードを示し、「bgmc mode=1」はBGMCコードを示す。構成シンタックス(テーブル6)は、1ビットの「sb part」フィールドを含む。「sb part」フィールドは、1ブロックをサブブロックに区画し、区画されたサブブロックをコーディングする方法と関連する情報に相当する。以下、「sb part」フィールドの意味は、「bgmc mode」フィールドの値に応じて変わる。
例えば、「bgmc mode=0」の場合、すなわち、ライスコードが適用される場合、「sb part=0」は、ブロックがサブブロックに区画されない旨を示す。代案的に、「sb part=1」は、ブロックが1:4サブブロック区画比にて区画される旨を示す。また、「bgmc mode=1」の場合、すなわち、BGMCコードが適用される場合、「sb part=0」は、1:4サブブロック区画比にてブロックが区画される旨を示す。代案的に、「sb part=1」は、1:2:4:8サブブロック区画比にてブロックが区画される旨を示す。
構成シンタックス(テーブル6)に含まれている情報に対応する各ブロックに対するブロック データシンタックス(テーブル8)は、0ビットから2ビットの可変「ec sub」フィールドを含む。特に、「ec sub」フィールドは、実際に対応するブロックに存在するサブブロックの数を示す。以下、「ec sub」フィールドの意味は、構成シンタックス(テーブル6)内の「bgmc mode」+「sb part」フィールドの値に応じて変わる。
例えば、「bgmc mode+sb part=0」は、ライスコードがサブブロックを構成しない旨を示す。以下、「ec sub」フィールドは、いかなる情報も含まれていない旨を示す0ビットフィールドである。
また、「bgmc mode+sb part=1」は、ライスコードまたはBGMCコードがブロックを1:4レートにてサブブロックに区画するのに用いられる旨を示す。以下、1ビットだけが「ec sub」フィールドに割り当てられる。例えば、「ec sub=0」は1サブブロック(すなわち、ブロックはサブブロックに区画されない)、「ec sub=1」は4つのサブブロックが構成される旨を示す。
さらに、「bgmc mode+sb part=2」は、BGMCコードがブロックを1:2:4:8レートにてサブブロックに区画するのに用いられる旨を示す。以下、2ビットは「ec sub」フィールドに割り当てられる。例えば、「ec sub=00」は1サブブロック(すなわち、ブロックはサブブロックに区画されない)を示し、「ec sub=01」は2サブブロックを示す。また、「ec sub=10」は4個のサブブロックを、「ec sub=11」は8個のサブブロックを示す。
上述したように、各ブロック内に定義されたサブブロックは、他のコーディング方法を用いて第2のエントロピー符号化部180によりコーディングされる。以下、ライスコードを用いる例について説明する。余り値の各ブロックにおいては、全ての値が同じライスコードを用いてエンコーディングされるか、または、構成シンタックス内の「sb part」フィールドが設定される場合にブロックは4個のサブブロックに区画可能であり、これらのそれぞれのエンコーディングされたサブブロックは、異なるのライスコードを有する。後者の場合、ブロック データシンタックス(テーブル8)内の「ec sub」フィールドは、1または4個のブロックが用いられるかどうかを示す。
第1のサブブロックのパラメータs[i=1]が4ビット(解像度≦16ビット)または5ビット(解像度>16ビット)で直接的に送信されるとしても、次のパラメータs[i>0]の差分(s[i]−s[i−1])が送信される。これらの差分は適切に選択されたライスコードを再度用いてさらにエンコーディングされる。この場合、差分に用いられるライスコードパラメータは「0」の値を有する。
シンタックス
本発明の実施形態によれば、オーディオビットストリームに含まれている各種の情報のシンタックスは、下記のテーブルに示す。テーブル6は、オーディオ無損失コーディング用の構成シンタックスを示す。構成シンタックスはビットストリームに周期的に配置されたヘッダーを形成し、各フレームに対するヘッダーを形成する。テーブル7はフレーム−データシンタックスを示し、テーブル8はブロック−データシンタックスを示す。
Figure 2009510810
Figure 2009510810
Figure 2009510810
Figure 2009510810
Figure 2009510810
Figure 2009510810
圧縮結果
次には、無損失オーディオコーデックが無損失オーディオ圧縮用の最も大衆的なプログラムのうち2つ、すなわち、オープンソースコーデックFLAC及びMonkey’s Audio(MAC3.97)と比較される。以下、オープンソースコーデックFLACはフォワード適応型予測を用い、Monkey’s Audio(MAC3.97)は圧縮において現在のステート・オフ・ザー・アート・アルゴリズムとして用いられるバックワード適応型コーデックである。これらのコーデックは、最大圧縮(すなわち、フラック−8及びmac−c400)を与えるオプションで行われる。エンコーダに対する結果は(K−60に限られる予測順序を有する)中間圧縮レベルと、最大圧縮レベル(K−1023)と、500msのランダムアクセスを有するこれらの両レベルに対して決まる。テストは、1024MBのメモリを有する1.7GHzペンティアム(登録商標)−Mシステム上において行われる。テストは、48、96及び192kHzのサンプリングレートを有する1Gのステレオ波形データと、16及び24ビットの解像度を含む。
圧縮レート
次には、圧縮レートが
Figure 2009510810
により定義される。ここで、小さな値の方が良好な圧縮を示す。検査されたオーディオフォーマットに対する結果はテーブル9に示す(192kHz材料がFLACコーデックにより支援される)。
Figure 2009510810
この結果は、最大レベルにおいてALSが全てのフォーマット、特に、高品位材料(すなわち、96kHz/24ビット以上)用のFLAC及びMonkey’s Audio(MAC3.97)の両方よりも低くなることを示す。中間レベルにおいてさえ、ALSは最上の全体圧縮を伝える。
複雑性
異なるコーデックの複雑性は、実際の実現、特に、エンコーダの実現に極めて強く従属する。上述したように、本発明のオーディオ信号エンコーダはますます開発中である。このため、出願人は、その分析をエンコーダに制限して、さらなる最適化無しに単純なCコードを実現する。圧縮されたデータは、現在、最上のエンコーダの実現により生成される。異なる複雑度レベルでエンコーディングされる各種のオーディオフォーマットのリアルタイムなデコーディングに対する平均CPU負荷は、テーブル10に示す。最大複雑度においてさえ、デコーダに対するCPU負荷は約20〜25%だけであり、ファイル基盤のデコーディングの方が少なくともリアルタイムよりも4−5倍速いことを意味することになる。
Figure 2009510810
コーデックは、複雑度レベルの大きな範囲を与えるように設計される。最大レベルが最も遅いエンコーディング及びデコーディング速度を犠牲にして最も高い圧縮を達成するとしても、速い中間レベルだけが圧縮を劣化させるが、デコーディングは、最大レベル(すなわち、48kHz材料に対する約5%のCPU負荷)においてより複雑度が下がる。低い複雑度レベルを用いれば(すなわち、K−15、ライスコーディング)、中間レベルよりも1から1.5%だけ圧縮が劣化するが、デコーダ複雑度は3の因子に見合う分だけさらに低減する(すなわち、48kHz材料に対する2%未満の負荷)。このため、オーディオデータは極めて低い演算電力を有するハードウェア上においてさえデコーディング可能である。
エンコーダの複雑度が高い最大順序及びさらに精巧なブロックスイッチングアルゴリズム(この実施形態による)により増大するとしても、デコーダは、高い平均予測順序に影響されることがある。
上述した実施形態(例えば、階層ブロックスイッチング)及び利点は単なる例示的なものに過ぎず、特許請求の範囲を制限するものとして解釈されてはならない。上述した教示は当業者にとって自明なものであり、他の装置及び方法に作用可能である。多くの代案、修正及び変形が当業者にとって自明である。
当業者にとっては、本発明に対する種々の修正及び変更が本発明の範囲及び精神から逸脱することなく行われることは自明に理解できるであろう。例えば、本発明の態様及び実施形態は損失あるオーディオ信号コーデックと同じ他のオーディオ信号コーデックにも容易に適用可能である。よって、本発明は特許請求の範囲及びその均等物内に提供される本発明の修正及び変動をカバーする。
本発明のさらなる理解を提供するために添付された図面は本発明の一部として一体化及び構成されて本発明の実施形態を例示し、説明とともに本発明の原理を説明するのに寄与する。
本発明の一実施形態によるエンコーダの例示図である。 本発明の一実施形態によるデコーダの例示図である。 本発明の一実施形態による、圧縮Mチャンネルのビットストリーム構造の例示図である。 本発明の一実施形態による階層ブロックスイッチングの概念の例示図である。 ブロックスイッチング例と対応するブロックスイッチング情報コードの例示図である。 本発明の一実施形態による、複数のチャンネルのためのブロックスイッチング方法の例示図である。

Claims (16)

  1. オーディオ信号の処理方法であって、
    前記オーディオ信号用の構成情報に、再生装置内のどのスピーカが各チャンネルを前記オーディオ信号にマッピングするかを示すチャンネルマッピング情報を付加するステップ、
    を有することを特徴とする方法。
  2. 前記チャンネルマッピング情報は複数のビットを含み、各ビットはスピーカと関連し、チャンネルが前記関連するスピーカ用のオーディオ信号に存在するかどうかを示す、請求項1に記載の方法。
  3. 複数のビットは16ビットである、請求項2に記載の方法。
  4. 前記チャンネルマッピング情報が前記構成情報に含まれるかどうかを示す指示子を前記構成情報に付加するステップをさらに有する、請求項1に記載の方法。
  5. 前記チャンネル用のオーディオデータが再構成された場合、前記チャンネル用のオーディオデータの再構成を示すチャンネル再構成情報を前記構成情報に付加するステップをさらに有する、請求項1に記載の方法。
  6. 前記チャンネル再構成情報が前記構成情報に含まれているかどうかを示す指示子を前記構成情報に付加するステップをさらに有する、請求項5に記載の方法。
  7. 前記オーディオ信号内のチャンネル数を示すチャンネル情報を前記構成情報に付加するステップをさらに有する、請求項1に記載の方法。
  8. オーディオ信号の処理方法であって、
    構成情報及び複数のチャンネルを含む前記オーディオ信号を受信するステップと、
    再生装置内のどのスピーカが各チャンネルを前記オーディオ信号にマッピングするかを示すチャンネルマッピング信号を前記構成情報から読み出すステップと、
    前記チャンネルマッピング情報に基づいて前記チャンネルを処理するステップと、
    を有することを特徴とする方法。
  9. 前記チャンネルマッピング情報は複数のビットを含み、各ビットはスピーカと関連し、チャンネルが前記関連するスピーカ用のオーディオ信号に存在するかどうかを示す、請求項8に記載の方法。
  10. 前記複数のビットは16ビットである、請求項9に記載の方法。
  11. 前記チャンネルマッピング情報が前記構成情報に含まれるかどうかを示す指示子を前記構成情報から読み出すステップと、
    前記チャンネルマッピング情報を読み出すステップを前記指示子に基づいて行うステップと、
    をさらに有する請求項8に記載の方法。
  12. 前記チャンネル用のオーディオデータの再構成を示すチャンネル再構成データを前記構成情報から読み出すステップをさらに含み有し、
    前記チャンネル処理ステップは、前記チャンネルマッピング情報及び前記チャンネル再構成情報に基づいて前記チャンネルを処理する、請求項8に記載の方法。
  13. 前記チャンネル再構成情報が前記構成情報に付加されたかどうかを示す指示子を前記構成情報から読み出すステップと、
    前記チャンネル再構成情報を読み出すステップを前記指示子に基づいて行うステップと、
    をさらに有する請求項12に記載の方法。
  14. 前記オーディオ信号内のチャンネル数を示すチャンネル情報を前記構成情報から読み出すステップをさらに有し、
    前記チャンネル処理ステップは、前記チャンネルマッピング情報及び前記チャンネル情報に基づいて前記チャンネルを処理する、請求項8に記載の方法。
  15. オーディオ信号の処理装置であって、
    前記オーディオ信号用の構成情報に、再生装置内のどのスピーカが各チャンネルを前記オーディオ信号にマッピングするかを示すチャンネルマッピング情報を付加するように構成されたエンコーダ
    を有することを特徴とする装置。
  16. オーディオ信号の処理装置であって、
    構成情報及び複数のチャンネルを含む前記オーディオ信号を受信し、再生装置内のどのスピーカが各チャンネルを前記オーディオ信号にマッピングするかを示すチャンネルマッピング信号を前記構成情報から読み出すように構成されたデコーダを有し、
    前記チャンネルマッピング情報は、再生装置内のどのスピーカが各チャンネルを前記オーディオ信号にマッピングさせるかを示し、
    前記デコーダは、前記チャンネルマッピング情報に基づいて前記チャンネルを処理するように構成される、
    ことを特徴とする装置。
JP2008521316A 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法 Pending JP2009510810A (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US69755105P 2005-07-11 2005-07-11
PCT/KR2005/002291 WO2007011079A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002290 WO2007011078A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002292 WO2007011080A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002307 WO2007011084A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002306 WO2007011083A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002308 WO2007011085A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
US70057005P 2005-07-19 2005-07-19
PCT/KR2006/002688 WO2007008010A1 (en) 2005-07-11 2006-07-10 Apparatus and method of processing an audio signal

Publications (2)

Publication Number Publication Date
JP2009510810A true JP2009510810A (ja) 2009-03-12
JP2009510810A5 JP2009510810A5 (ja) 2010-09-16

Family

ID=37637332

Family Applications (14)

Application Number Title Priority Date Filing Date
JP2008521311A Pending JP2009500687A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521316A Pending JP2009510810A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521314A Pending JP2009500689A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521318A Pending JP2009500692A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521308A Pending JP2009500684A (ja) 2005-07-11 2006-07-10 オーディオ信号を処理する方法、オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521315A Pending JP2009500690A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521305A Pending JP2009500681A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521310A Pending JP2009500686A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521307A Pending JP2009500683A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521309A Pending JP2009500685A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521317A Pending JP2009500691A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521306A Pending JP2009500682A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521319A Pending JP2009500693A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521313A Pending JP2009500688A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008521311A Pending JP2009500687A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法

Family Applications After (12)

Application Number Title Priority Date Filing Date
JP2008521314A Pending JP2009500689A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521318A Pending JP2009500692A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521308A Pending JP2009500684A (ja) 2005-07-11 2006-07-10 オーディオ信号を処理する方法、オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521315A Pending JP2009500690A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521305A Pending JP2009500681A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521310A Pending JP2009500686A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521307A Pending JP2009500683A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521309A Pending JP2009500685A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521317A Pending JP2009500691A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法
JP2008521306A Pending JP2009500682A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521319A Pending JP2009500693A (ja) 2005-07-11 2006-07-10 オーディオ信号のエンコーディング及びデコーディング装置及び方法
JP2008521313A Pending JP2009500688A (ja) 2005-07-11 2006-07-10 オーディオ信号の処理装置及び方法

Country Status (5)

Country Link
US (36) US7996216B2 (ja)
EP (14) EP1911021A4 (ja)
JP (14) JP2009500687A (ja)
CN (14) CN101243492A (ja)
WO (14) WO2007008009A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019126070A (ja) * 2013-02-08 2019-07-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビットストリームで音声レンダリング情報を信号伝達すること

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7182738B2 (en) 2003-04-23 2007-02-27 Marctec, Llc Patient monitoring apparatus and method for orthosis and other devices
JP2007526687A (ja) * 2004-02-19 2007-09-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 可変ブロック長信号の復号化スキーム
US7930184B2 (en) 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
KR101259203B1 (ko) * 2005-04-28 2013-04-29 파나소닉 주식회사 음성 부호화 장치와 음성 부호화 방법, 무선 통신 이동국 장치 및 무선 통신 기지국 장치
CN101185123B (zh) * 2005-05-31 2011-07-13 松下电器产业株式会社 可扩展编码装置及可扩展编码方法
US7996216B2 (en) * 2005-07-11 2011-08-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
KR100891688B1 (ko) * 2005-10-26 2009-04-03 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
JP4769665B2 (ja) * 2006-08-29 2011-09-07 パナソニック株式会社 音楽再生装置および音楽再生端末
US20080114478A1 (en) * 2006-11-09 2008-05-15 David Wu Method and System for Multi-Channel PCM Audio Grouping in Hardware
US9053753B2 (en) * 2006-11-09 2015-06-09 Broadcom Corporation Method and system for a flexible multiplexer and mixer
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101385956B1 (ko) * 2007-08-31 2014-04-17 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
EP2215630B1 (en) * 2007-12-06 2016-03-02 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
JP5336522B2 (ja) * 2008-03-10 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
US20090268678A1 (en) * 2008-04-24 2009-10-29 Fujitsu Limited Method and apparatus for automatic gain control in a mobile orthogonal frequency division multiple access (ofdma) network
EP4224471B1 (en) * 2008-07-11 2024-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
JP5253518B2 (ja) * 2008-12-22 2013-07-31 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN102282770B (zh) * 2009-01-23 2014-04-16 日本电信电话株式会社 一种参数选择方法、参数选择装置
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
AR075199A1 (es) 2009-01-28 2011-03-16 Fraunhofer Ges Forschung Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8918325B2 (en) * 2009-06-01 2014-12-23 Mitsubishi Electric Corporation Signal processing device for processing stereo signals
US20100324913A1 (en) * 2009-06-18 2010-12-23 Jacek Piotr Stachurski Method and System for Block Adaptive Fractional-Bit Per Sample Encoding
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
US8207875B2 (en) * 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
CA2803269A1 (en) * 2010-07-05 2012-01-12 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, device, program, and recording medium
CN102959623B (zh) * 2010-07-05 2014-08-13 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序及记录介质
MY156027A (en) * 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
ES2530957T3 (es) * 2010-10-06 2015-03-09 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio y para proporcionar una mayor granularidad temporal para un códec de voz y de audio unificado combinado (USAC)
US8842842B2 (en) * 2011-02-01 2014-09-23 Apple Inc. Detection of audio channel configuration
JP5805796B2 (ja) 2011-03-18 2015-11-10 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 柔軟なコンフィギュレーション機能性を有するオーディオエンコーダおよびデコーダ
CN102761735B (zh) * 2011-04-25 2014-12-24 中国科学院微电子研究所 编码方法及装置、图像压缩方法及系统
CN102810314B (zh) * 2011-06-02 2014-05-07 华为终端有限公司 音频编码方法及装置、音频解码方法及装置、编解码系统
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
KR101647576B1 (ko) * 2012-05-29 2016-08-10 노키아 테크놀로지스 오와이 스테레오 오디오 신호 인코더
CN104641414A (zh) * 2012-07-19 2015-05-20 诺基亚公司 立体声音频信号编码器
US10346784B1 (en) 2012-07-27 2019-07-09 Google Llc Near-term delivery system performance simulation
KR102049602B1 (ko) * 2012-11-20 2019-11-27 한국전자통신연구원 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
JP6377730B2 (ja) * 2013-06-05 2018-08-22 ドルビー・インターナショナル・アーベー オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10075266B2 (en) * 2013-10-09 2018-09-11 Qualcomm Incorporated Data transmission scheme with unequal code block sizes
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR101850529B1 (ko) * 2014-01-24 2018-04-19 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
WO2015111568A1 (ja) * 2014-01-24 2015-07-30 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
EP3161737A4 (en) * 2014-06-24 2017-11-29 Hotel Trader LLC Reservation exchange server system
CN107431583A (zh) 2014-08-07 2017-12-01 相干逻辑公司 多分区无线电帧
KR101821533B1 (ko) * 2014-08-07 2018-03-08 원 미디어, 엘엘씨 유연한 직교 주파수 분할 멀티플렉싱 물리 전송 데이터 프레임의 동적 구성 방법
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及系统
CN104392725A (zh) * 2014-12-02 2015-03-04 中科开元信息技术(北京)有限公司 多声道无损音频混合编解码方法及装置
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10500739B2 (en) * 2015-11-13 2019-12-10 Ethicon Llc Robotic surgical system
CN106131550B (zh) * 2016-07-25 2020-02-14 合一网络技术(北京)有限公司 播放多媒体文件的方法及装置
CN107221334B (zh) * 2016-11-01 2020-12-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN109859766B (zh) 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
WO2020004027A1 (ja) * 2018-06-25 2020-01-02 ソニーセミコンダクタソリューションズ株式会社 情報処理装置、情報処理システム、プログラム及び情報処理方法
WO2020009082A1 (ja) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
PH12019000380A1 (en) 2018-12-17 2020-09-28 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2020164752A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
TW202102010A (zh) 2019-05-24 2021-01-01 瑞典商赫爾桑茲股份有限公司 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品
US11271678B2 (en) * 2020-01-21 2022-03-08 Realtek Semiconductor Corp. Encoding method, related transmitter apparatus and related receiver apparatus for wireless local area network
CN111341330B (zh) * 2020-02-10 2023-07-25 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置
US12058470B2 (en) 2020-08-25 2024-08-06 Nahum Nir Video compression and streaming
US11769478B1 (en) 2021-07-15 2023-09-26 Dialog Semiconductor B.V. Digital signal processing system
US11997317B2 (en) * 2021-09-29 2024-05-28 Tencent America LLC Techniques for constraint flag signaling for range extension with persistent rice adaptation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0831096A (ja) * 1994-07-12 1996-02-02 Matsushita Electric Ind Co Ltd オーディオデータ符号化記録装置及びオーディオデータ復号再生装置
JP2004072345A (ja) * 2002-08-05 2004-03-04 Pioneer Electronic Corp 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream

Family Cites Families (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US75153A (en) * 1868-03-03 Egbert d
US37461A (en) * 1863-01-20 Improved car for carrying petroleum
US216262A (en) * 1879-06-10 Improvement in thill-coupling jacks
US76333A (en) * 1868-04-07 To all whom it may concern
US254281A (en) * 1882-02-28 Corn-sheller
US117044A (en) * 1871-07-18 Improvement in ladies work-stands
US138157A (en) * 1873-04-22 Improvement in breech-loading fire-arms
US247035A (en) * 1881-09-13 Drill-chuck
US63368A (en) * 1867-04-02 davids
US78687A (en) * 1868-06-09 Daniel e
US2006A (en) * 1841-03-16 Clamp for crimping leather
US152557A (en) * 1874-06-30 Improvement in devices for coiling wire
US13405A (en) * 1855-08-07 Self-adjusting tongue-ihon
US125933A (en) * 1872-04-23 Improvement in compounds for the cure of colic and botts in horses
US80829A (en) * 1868-08-11 Patkick lennox
US115051A (en) * 1871-05-23 Improvement in the manufacture of glucose sirups -and sugars
US149322A (en) * 1874-04-07 Improvement in parasol-handles
US251330A (en) * 1881-12-20 Dust-collector for flour-mills
US4110571A (en) 1977-11-25 1978-08-29 Jimmy's Radio & Television Corporation Test unit for stereophonic speaker systems
US4922537A (en) 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
DE69031517T2 (de) 1989-06-30 1998-02-26 Nippon Electric Co Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JPH03224130A (ja) 1990-01-30 1991-10-03 Konica Corp ディスク状磁気記録媒体
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5283780A (en) * 1990-10-18 1994-02-01 Stanford Telecommunications, Inc. Digital audio broadcasting system
US5165686A (en) * 1990-12-18 1992-11-24 Morgan Edward H Wooden baseball bat
ATE138238T1 (de) 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US5751773A (en) * 1992-03-12 1998-05-12 Ntp Incorporated System for wireless serial transmission of encoded information
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
US5828784A (en) * 1992-07-13 1998-10-27 Hitachi Denshi Kabushiki Kaisha Data coding method and apparatus using a plurality of blocks of different length
US6161122A (en) * 1992-12-10 2000-12-12 Hawkes; Calvert T. Method and apparatus for interactively providing information at multiple sites
WO1995001633A1 (fr) 1993-06-30 1995-01-12 Sony Corporation Procede et appareil de codage de signaux numeriques, procede et appareil de decodage des signaux codes, et support d'enregistrement des signaux codes
JP3125543B2 (ja) 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JP3175446B2 (ja) 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
DE4401227C2 (de) * 1994-01-18 1999-03-18 Ernst Peter Prof Dr M Strecker In den Körper eines Patienten perkutan implantierbare Endoprothese
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
EP0727780B1 (en) * 1995-02-16 2002-01-23 Kabushiki Kaisha Toshiba Output control system for switchable audio channels
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3705305B2 (ja) * 1996-05-16 2005-10-12 カシオ計算機株式会社 音声記憶再生装置
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
US6154549A (en) * 1996-06-18 2000-11-28 Extreme Audio Reality, Inc. Method and apparatus for providing sound in a spatial environment
GB2318029B (en) 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
IL125274A (en) 1996-11-11 2001-10-31 Koninkl Philips Electronics Nv Compression / recovery of data using an encoder / decoder
TW432806B (en) 1996-12-09 2001-05-01 Matsushita Electric Ind Co Ltd Audio decoding device
EP1359755B1 (en) 1996-12-20 2005-11-09 Koninklijke Philips Electronics N.V. A coded information signal
TW395142B (en) * 1997-05-15 2000-06-21 Matsushita Electric Ind Co Ltd Compressed code decoding device and audio decoding device
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US6069947A (en) 1997-12-16 2000-05-30 Nortel Networks Corporation Communication system architecture and operating protocol therefor
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6831914B1 (en) * 1998-03-27 2004-12-14 Verizon Services Corp. Services control point selection in an advanced intelligent network
US6952677B1 (en) 1998-04-15 2005-10-04 Stmicroelectronics Asia Pacific Pte Limited Fast frame optimization in an audio encoder
US6298900B1 (en) * 1998-07-06 2001-10-09 Ford Global Technologies, Inc. Method of integrating wear plates into a spray formed rapid tool
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
EP1119108A4 (en) 1998-10-06 2002-03-06 Matsushita Electric Ind Co Ltd LOSSLESS COMPRESSION CODING METHOD AND DEVICE, AND LOSSLESS COMPRESSION DECODING METHOD AND DEVICE
JP4610680B2 (ja) * 1998-11-02 2011-01-12 ソニー株式会社 信号処理装置および方法、記録装置、再生装置、記録再生装置、ならびに、映像信号記録再生装置
US6816491B1 (en) * 1998-11-04 2004-11-09 Hitachi, Ltd. Multiplexed audio data decoding apparatus and receiver apparatus
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6628714B1 (en) * 1998-12-18 2003-09-30 Zenith Electronics Corporation Down converting MPEG encoded high definition sequences to lower resolution with reduced memory in decoder loop
US6276608B1 (en) * 1998-12-29 2001-08-21 Daimlerchrysler Ag Data storage and communication system
IL138230A (en) 1999-01-07 2005-06-19 Koninkl Philips Electronics Nv Efficient coding of side information in a lossless encoder
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US7051351B2 (en) * 1999-03-08 2006-05-23 Microsoft Corporation System and method of inserting advertisements into an information retrieval system display
US6658382B1 (en) 1999-03-23 2003-12-02 Nippon Telegraph And Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
EP1054575A3 (en) 1999-05-17 2002-09-18 Bose Corporation Directional decoding
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US7096481B1 (en) 2000-01-04 2006-08-22 Emc Corporation Preparation of metadata for splicing of encoded MPEG video and audio
US6678332B1 (en) 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US6810502B2 (en) 2000-01-28 2004-10-26 Conexant Systems, Inc. Iteractive decoder employing multiple external code error checks to lower the error floor
US6675748B2 (en) * 2000-02-11 2004-01-13 Westport Research Inc. Method and apparatus for fuel injection into an internal combustion engine
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
WO2001070946A2 (en) * 2000-03-21 2001-09-27 Neugenesis Corporation Methods for in vivo diversification of single genes
US6448890B1 (en) * 2000-05-01 2002-09-10 Breed Automotive Technology, Inc. Air bag system with biomechanical gray zones
SE522261C2 (sv) * 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
AU2001271297A1 (en) 2000-06-12 2001-12-24 Larry W. Fullerton A method for specifying non-temporal pulse characteristics
JP4538908B2 (ja) 2000-06-14 2010-09-08 ソニー株式会社 データ変換装置及び方法
US6609947B1 (en) * 2000-08-30 2003-08-26 Micron Technology, Inc. Planarizing machines and control systems for mechanical and/or chemical-mechanical planarization of micro electronic substrates
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6775254B1 (en) 2000-11-09 2004-08-10 Qualcomm Incorporated Method and apparatus for multiplexing high-speed packet data transmission with voice/data transmission
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP3639212B2 (ja) * 2000-12-11 2005-04-20 株式会社オプトウエア 光情報記録方法
US6675148B2 (en) 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
US6871043B2 (en) * 2001-02-02 2005-03-22 Ecollege.Com Variable types of sensory interaction for an on-line educational system
WO2002078355A1 (en) * 2001-03-23 2002-10-03 Nokia Corporation Variable length coding
JP4867076B2 (ja) 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
FI118067B (fi) * 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
JP3601473B2 (ja) 2001-05-11 2004-12-15 ヤマハ株式会社 ディジタルオーディオ圧縮回路および伸長回路
JP4376623B2 (ja) 2001-08-03 2009-12-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ストリーミングa/vデータの保護
GB2379977B (en) * 2001-09-25 2005-04-06 Kidde Plc High sensitivity particle detection
US20030078687A1 (en) 2001-10-15 2003-04-24 Du Breuil Thomas Lemaigre Method and system for automatically configuring an audio environment
DE20117292U1 (de) * 2001-10-22 2002-01-17 Reitter & Schefenacker GmbH & Co. KG, 73730 Esslingen Innenleuchte für Fahrzeuge, vorzugsweise für Kraftfahrzeuge
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
US7085401B2 (en) 2001-10-31 2006-08-01 Infowrap Systems Ltd. Automatic object extraction
SE521600C2 (sv) 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US7202335B2 (en) * 2001-12-06 2007-04-10 Genentech, Inc. PRO300 polypeptides
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US6690307B2 (en) 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video
EP1500086B1 (en) 2002-04-10 2010-03-03 Koninklijke Philips Electronics N.V. Coding and decoding of multichannel audio signals
BR0304540A (pt) 2002-04-22 2004-07-20 Koninkl Philips Electronics Nv Métodos para codificar um sinal de áudio, e para decodificar um sinal de áudio codificado, codificador para codificar um sinal de áudio, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenagem, e, decodificador para decodificar um sinal de áudio codificado
AU2003226596A1 (en) * 2002-04-26 2003-11-10 Nokia Corporation Adaptive method and system for mapping parameter values to codeword indexes
JP4296753B2 (ja) 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US6691028B2 (en) * 2002-06-07 2004-02-10 Motorola, Inc. Server-based navigation system and method of operating same
US20040015259A1 (en) * 2002-07-18 2004-01-22 A-Po Tsai NC machining program having easily selectable modes
US6807732B2 (en) 2002-07-24 2004-10-26 Agilent Technologies, Inc. Methods for modifying inner-layer circuit features of printed circuit boards
JP4055122B2 (ja) 2002-07-24 2008-03-05 日本ビクター株式会社 音響信号符号化方法及び音響信号符号化装置
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CN1703736A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
US20040076333A1 (en) 2002-10-22 2004-04-22 Huipin Zhang Adaptive interpolation filter system for motion compensated predictive video coding
US7145484B2 (en) 2002-11-21 2006-12-05 Nippon Telegraph And Telephone Corporation Digital signal processing method, processor thereof, program thereof, and recording medium containing the program
US7436931B2 (en) * 2002-12-11 2008-10-14 Koninklijke Philips Electronics N.V. X-ray source for generating monochromatic x-rays
US7440810B2 (en) * 2002-12-13 2008-10-21 Dell Products L.P. Multi-channel media applications support with channel-to-connector mapping
DE60230436D1 (de) * 2002-12-23 2009-01-29 Alcatel Lucent Überlastkontrolle in einem optischen Netzwerk mit Burstschaltung
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
US20040177044A1 (en) * 2003-03-03 2004-09-09 General Instrument Corporation Processing of copy control information for digital rights management
US7792194B2 (en) * 2003-04-10 2010-09-07 Lefan Zhong MPEG artifacts post-processed filtering architecture
US7742926B2 (en) 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
SE0302161D0 (sv) * 2003-08-04 2003-08-01 Akzo Nobel Nv Process for the manufacture of a bitumen-aggregate mix suitable for road pavement
US7640157B2 (en) * 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
CN1867969B (zh) 2003-10-13 2010-06-16 皇家飞利浦电子股份有限公司 用于对音频信号进行编码或解码的方法和设备
US7519520B2 (en) 2003-10-13 2009-04-14 Realnetworks, Inc. Compact signal coding method and apparatus
KR20050044085A (ko) * 2003-11-07 2005-05-12 삼성전자주식회사 집적회로 소자의 세정액 및 그 세정액을 이용한 세정방법
US7292902B2 (en) 2003-11-12 2007-11-06 Dolby Laboratories Licensing Corporation Frame-based audio transmission/storage with overlap to facilitate smooth crossfading
JP4765289B2 (ja) * 2003-12-10 2011-09-07 ソニー株式会社 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
KR100773539B1 (ko) 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7233174B2 (en) * 2004-07-19 2007-06-19 Texas Instruments Incorporated Dual polarity, high input voltage swing comparator using MOS input transistors
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US7996216B2 (en) * 2005-07-11 2011-08-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US7299902B2 (en) * 2005-10-21 2007-11-27 Jim Thorpe Wheel chock for tandem wheeled vehicles

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0831096A (ja) * 1994-07-12 1996-02-02 Matsushita Electric Ind Co Ltd オーディオデータ符号化記録装置及びオーディオデータ復号再生装置
JP2004072345A (ja) * 2002-08-05 2004-03-04 Pioneer Electronic Corp 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造
WO2004052052A2 (en) * 2002-12-02 2004-06-17 Thomson Licensing S.A. Method and apparatus for processing audio signals from a bitstream

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019126070A (ja) * 2013-02-08 2019-07-25 クゥアルコム・インコーポレイテッドQualcomm Incorporated ビットストリームで音声レンダリング情報を信号伝達すること

Also Published As

Publication number Publication date
US20090037188A1 (en) 2009-02-05
US8180631B2 (en) 2012-05-15
US20070009105A1 (en) 2007-01-11
WO2007008012A3 (en) 2007-03-08
EP1911020A4 (en) 2010-12-29
WO2007007999A2 (en) 2007-01-18
US7949014B2 (en) 2011-05-24
WO2007008004A2 (en) 2007-01-18
CN101243496A (zh) 2008-08-13
EP1913581A2 (en) 2008-04-23
WO2007008008A2 (en) 2007-01-18
US20070011004A1 (en) 2007-01-11
WO2007008001A3 (en) 2007-03-22
EP1913794A4 (en) 2010-12-29
US7991272B2 (en) 2011-08-02
US20070011000A1 (en) 2007-01-11
JP2009500691A (ja) 2009-01-08
US20090037186A1 (en) 2009-02-05
WO2007008011A3 (en) 2007-03-15
US20070009032A1 (en) 2007-01-11
CN101218629A (zh) 2008-07-09
US20090037183A1 (en) 2009-02-05
US7411528B2 (en) 2008-08-12
EP1913585A1 (en) 2008-04-23
EP1908058A4 (en) 2010-10-27
EP1913582A2 (en) 2008-04-23
US7991012B2 (en) 2011-08-02
US20090037009A1 (en) 2009-02-05
US20090037191A1 (en) 2009-02-05
US20090030700A1 (en) 2009-01-29
WO2007008003A3 (en) 2007-03-15
US20070011215A1 (en) 2007-01-11
US7930177B2 (en) 2011-04-19
US20090037184A1 (en) 2009-02-05
US20090037181A1 (en) 2009-02-05
JP2009500689A (ja) 2009-01-08
CN101243493A (zh) 2008-08-13
EP1913583A1 (en) 2008-04-23
US7987009B2 (en) 2011-07-26
WO2007007999A3 (en) 2007-03-22
US20090030701A1 (en) 2009-01-29
CN101243496B (zh) 2011-12-07
EP1913794A1 (en) 2008-04-23
US8149876B2 (en) 2012-04-03
CN101243497A (zh) 2008-08-13
US8108219B2 (en) 2012-01-31
US8065158B2 (en) 2011-11-22
EP1913582A4 (en) 2010-12-29
EP1913588A4 (en) 2011-02-16
US20090030703A1 (en) 2009-01-29
EP1913587A4 (en) 2010-10-27
US8417100B2 (en) 2013-04-09
US7962332B2 (en) 2011-06-14
US8155144B2 (en) 2012-04-10
EP1913579A2 (en) 2008-04-23
WO2007008001A2 (en) 2007-01-18
CN101218628A (zh) 2008-07-09
JP2009500693A (ja) 2009-01-08
CN101218628B (zh) 2011-11-09
JP2009500684A (ja) 2009-01-08
JP2009500688A (ja) 2009-01-08
EP1911020A2 (en) 2008-04-16
CN101243494A (zh) 2008-08-13
US20090106032A1 (en) 2009-04-23
JP2009500683A (ja) 2009-01-08
US20090037182A1 (en) 2009-02-05
US8275476B2 (en) 2012-09-25
WO2007008007A1 (en) 2007-01-18
US8032240B2 (en) 2011-10-04
CN101238509A (zh) 2008-08-06
JP2009500682A (ja) 2009-01-08
US8510120B2 (en) 2013-08-13
US20070014297A1 (en) 2007-01-18
US7830921B2 (en) 2010-11-09
WO2007008011A2 (en) 2007-01-18
US8149878B2 (en) 2012-04-03
US20090037185A1 (en) 2009-02-05
EP1911021A4 (en) 2010-06-30
WO2007008002A2 (en) 2007-01-18
EP1913587A1 (en) 2008-04-23
US20090037187A1 (en) 2009-02-05
WO2007008008A3 (en) 2007-03-15
CN101218630B (zh) 2013-07-17
US20090030702A1 (en) 2009-01-29
JP2009500690A (ja) 2009-01-08
US8055507B2 (en) 2011-11-08
EP1913580A2 (en) 2008-04-23
EP1913589A4 (en) 2010-12-29
WO2007008010A1 (en) 2007-01-18
EP1913584A4 (en) 2011-02-23
EP1913589A2 (en) 2008-04-23
US8326132B2 (en) 2012-12-04
US20070010996A1 (en) 2007-01-11
JP2009500692A (ja) 2009-01-08
US8554568B2 (en) 2013-10-08
WO2007008013A3 (en) 2007-03-22
CN101218630A (zh) 2008-07-09
US20090037167A1 (en) 2009-02-05
US8046092B2 (en) 2011-10-25
US8255227B2 (en) 2012-08-28
WO2007008005A1 (en) 2007-01-18
EP1913584A2 (en) 2008-04-23
US20090048851A1 (en) 2009-02-19
EP1911021A2 (en) 2008-04-16
CN101243489A (zh) 2008-08-13
US20070010995A1 (en) 2007-01-11
US20090055198A1 (en) 2009-02-26
CN101243495A (zh) 2008-08-13
US8155152B2 (en) 2012-04-10
WO2007008009A1 (en) 2007-01-18
CN101238510A (zh) 2008-08-06
EP1913580A4 (en) 2011-01-05
US20070009033A1 (en) 2007-01-11
US8149877B2 (en) 2012-04-03
EP1913588A2 (en) 2008-04-23
US8510119B2 (en) 2013-08-13
WO2007008013A2 (en) 2007-01-18
US20090037190A1 (en) 2009-02-05
JP2009500687A (ja) 2009-01-08
US8121836B2 (en) 2012-02-21
CN101243492A (zh) 2008-08-13
US20090048850A1 (en) 2009-02-19
US7966190B2 (en) 2011-06-21
JP2009500685A (ja) 2009-01-08
EP1908058A2 (en) 2008-04-09
US20070011013A1 (en) 2007-01-11
US8155153B2 (en) 2012-04-10
US20090037192A1 (en) 2009-02-05
EP1913579A4 (en) 2010-12-29
WO2007008003A2 (en) 2007-01-18
US7835917B2 (en) 2010-11-16
US7987008B2 (en) 2011-07-26
US20070008193A1 (en) 2007-01-11
WO2007008012A2 (en) 2007-01-18
JP2009500681A (ja) 2009-01-08
WO2007008000A2 (en) 2007-01-18
US20070009227A1 (en) 2007-01-11
EP1913581A4 (en) 2011-02-09
US8032368B2 (en) 2011-10-04
EP1913585A4 (en) 2010-12-29
EP1913583A4 (en) 2010-06-30
JP2009500686A (ja) 2009-01-08
US8010372B2 (en) 2011-08-30
WO2007008002A3 (en) 2007-03-15
WO2007008000A3 (en) 2007-04-05
US8050915B2 (en) 2011-11-01
US20070009233A1 (en) 2007-01-11
CN101218852A (zh) 2008-07-09
US8032386B2 (en) 2011-10-04
US20070009031A1 (en) 2007-01-11
WO2007008004A3 (en) 2007-03-15
US20090030675A1 (en) 2009-01-29
CN101218631A (zh) 2008-07-09
US7996216B2 (en) 2011-08-09

Similar Documents

Publication Publication Date Title
JP2009510810A (ja) オーディオ信号の処理装置及び方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100423

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100506

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20100726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110906