[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5111374B2 - オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 - Google Patents

オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 Download PDF

Info

Publication number
JP5111374B2
JP5111374B2 JP2008528939A JP2008528939A JP5111374B2 JP 5111374 B2 JP5111374 B2 JP 5111374B2 JP 2008528939 A JP2008528939 A JP 2008528939A JP 2008528939 A JP2008528939 A JP 2008528939A JP 5111374 B2 JP5111374 B2 JP 5111374B2
Authority
JP
Japan
Prior art keywords
time slot
information
bits
parameter
parameter set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008528939A
Other languages
English (en)
Other versions
JP2009506371A (ja
Inventor
スク パン,ヒー
オ オー,ヒョン
スー キム,ドン
ヒュン リム,ジェ
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060004063A external-priority patent/KR20070025907A/ko
Priority claimed from KR1020060004051A external-priority patent/KR20070025903A/ko
Priority claimed from KR1020060004062A external-priority patent/KR20070037974A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009506371A publication Critical patent/JP2009506371A/ja
Application granted granted Critical
Publication of JP5111374B2 publication Critical patent/JP5111374B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は主としてオーディオ信号処理に関する。
通常、空間音声コーディング(SAC:Spatial Audio Coding)と呼ばれるマルチチャンネルオーディオのコーディングを認識するための新たなアプローチ方式が研究開発中にある。SACは、マルチチャンネルオーディオを低いビットレートにて送信可能にすることから、種々のオーディオ適用分野(例えば、インターネットストリーミング、音楽のダウンロードなど)に向いている。
SACは、個別のオーディオ入力チャンネルを分散コーディングするよりも簡単なセットのパラメータでマルチチャンネルオーディオ信号の空間イメージを取得する。このようなパラメータは、デコーダに送信されてオーディオ信号の空間特性を合成したり再構成するのに用いられる。
一部のSAC適用分野においては、空間パラメータがビットストリームの一部としてデコーダに送信される。このようなビットストリームは複数の空間フレームを含み、これらの空間フレームは空間パラメータが適用可能に並べられたタイムスロットセットを含む。また、ビットストリームは位置情報を含むが、デコーダはこのような位置情報を用いて所定のパラメータセットが適用される正確なタイムスロットを識別することができる。
一部のSAC適用分野においては、エンコーディング/デコーディング経路に概念的なエレメントを用いる。そのようなエレメントの一つとしては、通常 OTT(One−To−Two)と呼ばれるものがあり、他のエレメントとしては、通常TTT(Two−To−Three)と呼ばれるものがあるが、このような名称は、それぞれ対応デコーダ要素の入力チャンネルと出力チャンネルの個数を意味している。OTTエンコーダエレメントは、2つの空間パラメータを抽出してダウンミックス信号とレジデュアル信号を生成する。TTTエレメントは、3つのオーディオ信号を1つのダウンミックス信号と1つのレジデュアル信号にダウンミックスする。これらのエレメントが組み合わせられて種々の構成の空間オーディオ環境(例えば、サラウンドサウンドなど)を提供することができる。
一部のSAC適用分野は、ノンガイド動作モードにて動作可能であるが、このような動作モードにおいては空間パラメータを送信する必要がなく、ステレオダウンミックス信号だけがエンコーダからデコーダに送信される。デコーダは、ダウンミックス信号から空間パラメータを合成してマルチチャンネルオーディオ信号の生成に用いる。
オーディオ信号に関連する空間情報は、デコーダに送信されるか、または、記録媒体に記録可能なビットストリームにエンコーディングされる。このようなビットストリームは、時間、周波数及び空間エリアに関連する異なるシンタックスを含むことができる。一部の実施形態において、ビットストリームはパラメータが適用可能に並べられたセットのスロットを含む1以上のデータ構造(例えば、フレーム)を含むことができる。このようなデータ構造は、固定されたものであっても、可変的なものであってもよい。デコーダがデータ構造タイプを判定して適切なデコーディング処理を呼び出せるようにするデータ構造タイプ表示子がビットストリームに含まれうる。データ構造は位置情報を含むことができ、デコーダはこのような位置情報を用いて所定のパラメータセットが適用される正確なスロットを識別することができる。スロット位置情報は、データ構造タイプ表示子が表示するデータ構造タイプに応じて、固定個数のビットまたは可変個数のビットでエンコーディング可能である。可変データ構造タイプについて、スロット位置情報は前記並べられたセットのスロットにおいて当該スロットの位置により可変個数のビットでエンコーディング可能である。
一部の実施形態において、オーディオ信号をエンコーディングする方法は、タイムスロットの個数と1以上のパラメータを含むパラメータセットの個数を決定するステップと、パラメータセットが適用される少なくとも一つのタイムスロットの位置を並べられたセットのタイムスロットに示す情報を生成するステップと、オーディオ信号を前記並べられたセットのタイムスロットを含むフレームを含むビットストリームとしてエンコーディングするステップと、前記並べられたタイムスロットにおいて前記タイムスロットの位置を示す可変個数のビットを前記ビットストリームに挿入するステップと、を含み、前記可変個数のビットは、前記タイムスロット位置により決定されることを特徴とする。
一部の実施形態において、オーディオ信号をデコーディングする方法は、オーディオ信号を示しかつフレームを含むビットストリームを受信するステップと、前記ビットストリームからタイムスロットの個数と1以上のパラメータを含むパラメータセットの個数を決定するステップと、前記ビットストリームから位置情報を決定するステップと、前記タイムスロットの個数、前記パラメータセットの個数及び前記位置情報に基づいて前記オーディオ信号をデコーディングするステップと、を含み、前記位置情報は前記並べられたセットのタイムスロットにおいて前記パラメータが適用されるタイムスロットの位置を示し、前記並べられたセットのタイムスロットは前記フレームに含まれ、前記タイムスロットに基づく可変個数のビットで表わされることを特徴とする。
システム、方法、装置、データ構造及びコンピュータにて読取り可能な媒体に関するタイムスロット位置コーディングの他の実施形態も開示される。
上述した通常の説明及び以下の実施形態の詳細な説明はいずれも例示的に説明するためのものであり、特許請求の範囲において請求される本発明の理解への一助となるものであるという点を理解しなければならない。
本発明への理解を容易にするために含まれる添付図面は本発明の実施形態を示すものであり、この明細書と一緒に本発明の原理を説明するためのものである。
図1は、本発明の一実施形態により空間情報を生成する原理を示す図である。マルチチャンネルオーディオ信号に対するコーディング方式の概念は、人間がオーディオ信号を3次元的に認識するということに基づく。オーディオ信号の3次元空間は空間情報を用いて表わすことができ、これは、チャンネルレベル差分(CLD;Channel Level Difference)と、チャンネル間相関/一貫性(ICC;Inter Cannel Correlation/Coherence)と、チャンネル時間差分(CTD;Channel Time Difference)と、チャンネル予測係数(CPC:Channel Prediction Coefficients)などを含むが、これらに制限されるものではない。CLDは2つのオーディオチャンネル間エネルギ(レベル)差分を意味し、ICCは2つのオーディオチャンネル間相関または一貫性の量を意味し、CTDは2チャンネル間の時間差分を意味する。
図1にCTDとCLDパラメータの生成を示す。遠距離サウンドソース101から第1のダイレクトサウンド波103が人間の左耳107に達し、第2のダイレクトサウンド波102が人間の頭の周りにおいて回折された後、人間の右耳106に達する。2つのサウンド波102及び103は到達時間とエネルギレベルにおいて互いに異なる。CTDパラメータとCLDパラメータはサウンド波102と103の到達時間及びエネルギレベル差分に基づき生成される。また、反射されたサウンド波104及び105が両耳106及び107にそれぞれ達し、これらは互いに相関がない。ICCパラメータはサウンド波104及び105間相関に基づき生成可能である。
エンコーダにおいては、マルチチャンネルオーディオ信号において空間情報(例えば、空間パラメータなど)が抽出され、ダウンミックス信号が生成される。ダウンミックス信号と空間パラメータはデコーダに転送される。これに制限されるものではないが、モノ信号、ステレオ信号またはマルチチャンネルオーディオ信号を含むダウンミックス信号に任意の個数のオーディオチャンネルが使用可能である。デコーダにおいては、ダウンミックス信号と空間パラメータからマルチチャンネルアップミックス信号が生成される。
図2は、本発明の一実施形態によりオーディオ信号をエンコーディングするエンコーダのブロック図である。エンコーダは、ダウンミキシング部202と、空間情報生成部203と、ダウンミックス信号エンコーディング部207とマルチプレクシング部209と、を備える。エンコーダの他の構成も採用可能である。エンコーダはハードウェアまたはソフトウェアにより実現されるか、あるいは、ハードウェアとソフトウェアとの組み合わせにより実現可能である。エンコーダは集積回路チップ、チップセット、システムオンチップ(SoC:System on Chip)、デジタル信号プロセッサ、汎用プロセッサ及び種々のデジタル装置とアナログ装置により実現可能である。
ダウンミキシング部202は、マルチチャンネルオーディオ信号201からダウンミックス信号204を生成する。図2において、x1、…、xnは入力オーディオチャンネルを示す。上述したように、ダウンミックス信号204は、モノ信号であっても、ステレオ信号であっても、オーディオ信号であってもよい。図示の例において、x’1、…、x’mはダウンミックス信号204のチャンネル番号を示す。一部の実施形態において、エンコーダはダウンミックス信号204に代えて外部供給ダウンミックス信号205(例えば、精度よいダウンミックスなど)を処理する。
空間情報生成部203は、マルチチャンネルオーディオ信号201から空間情報を抽出する。この場合、「空間情報」とは、デコーダにおいてダウンミックス信号204をマルチチャンネルオーディオ信号にアップミキシングするのに用いられるオーディオ信号チャンネルに関連する情報を意味している。ダウンミックス信号204は、マルチチャンネルオーディオ信号をダウンミックスすることにより生成される。空間情報はエンコーディングされて、エンコーディングされた空間情報信号206を与える。
ダウンミックス信号エンコーディング部207は、ダウンミキシング部202において生成されたダウンミックス信号204をエンコーディングして、エンコーディングされたダウンミックス信号208を生成する。
マルチプレクシング部209は、エンコーディングされたダウンミックス信号208とエンコーディングされた空間情報信号206とを含むビットストリーム210を生成する。ビットストリーム210はダウンストリームデコーダに転送され、及び/または、記録媒体に記録される。
図3は、本発明の一実施形態により、エンコーディングされたオーディオ信号をデコーディングするデコーダのブロック図である。デコーダは、デマルチプレクシング部302と、ダウンミックス信号デコーディング部305と、空間情報デコーディング部307と、アップミキシング部309と、を備える。デコーダは、ハードウェアやソフトウェアにより、または、ハードウェアとソフトウェアとの組み合わせにより実現可能である。デコーダは、集積回路チップ、チップセット、システムオンチップ(SoC)、デジタル信号プロセッサ、汎用プロセッサ及び種々のデジタル装置やデバイスにより実現可能である。
一部の実施形態において、デマルチプレクシング部302は、オーディオ信号を示すビットストリーム301を受信して、このビットストリーム301から、エンコーディングされたダウンミックス信号303とエンコーディングされた空間情報信号304とを分離する。図3において、x’1、…、x’mはダウンミックス信号303のチャンネルを示す。ダウンミックス信号デコーディング部305は、エンコーディングされたダウンミックス信号303をデコーディングして、デコーディングされたダウンミックス信号306を出力する。デコーダがマルチチャンネルオーディオ信号を出力することができない場合、ダウンミックス信号デコーディング部305はダウンミックス信号306を直接的に出力することができる。図3において、y’1、…、y’mはダウンミックス信号デコーディング部305の直接出力チャンネルを示す。
空間情報信号デコーディング部307は、エンコーディングされた空間情報信号304から空間情報信号の構成情報を抽出し、抽出された構成情報を用いて空間情報信号304をデコーディングする。
アップミキシング部309は、抽出された空間情報308を用いてダウンミックス信号306をマルチチャンネルオーディオ信号310にアップミックスすることができる。図3において、 y1、…、ynはアップミキシング部309の出力チャンネル番号を示す。
図4は、図3に示すデコーダのアップミキシング部309に含まれうるチャンネル変換モジュールのブロック図である。一部の実施形態において、アップミキシング部309は複数のチャンネル変換モジュールを含むことができる。チャンネル変換モジュールは、特定の情報を用いて入力チャンネルの個数と出力チャンネルの個数を区別可能な概念的な装置である。
一部の実施形態において、チャンネル変換モジュールは、1チャンネルを2チャンネル、及びその逆に変換するOTT(One−To−Two)ボックスと、2チャンネルを3チャンネル、及びその逆に変換するTTT(Two−To−Three)ボックスを含む。OTTボックス及び/またはTTTボックスは種々の有用な構成にて配置可能である。例えば、図3に示すアップミキシング部309は、5−1−5構成、5−2−5構成、7−2−7構成、7−5−7構成などを含むことができる。5−1−5構成においては、5チャンネルを1チャンネルにダウンミキシングして1チャンネルを有するダウンミックス信号が生成されるが、これは、今後、5チャンネルにアップミックス可能である。OTTボックスとTTTボックスの種々の組み合わせを用いる他の構成も同様に生成可能である。
図4には、アップミキシング部400の5−2−5構成例が示してある。5−2−5構成においては、2チャンネルを有するダウンミックス信号401がアップミキシング部400に入力される。図示の例には、左側のチャンネルLと右側のチャンネルRがアップミキシング部400への入力として与えられる。この実施形態において、アップミキシング部400は、1つのTTTボックス402と3つのOTTボックス406、407及び408を備える。2チャンネルを有するダウンミックス信号401がTTTボックスTTT0に対する入力として与えられ、TTTボックスはダウンミックス信号401を処理して3出力チャンネル403、404及び405を与える。TTTボックス402に対する入力として、1以上の空間パラメータ(例えば、CPC、CLD、ICCなど)が与えられて、後述するように、ダウンミックス信号401を処理するのに使用可能である。この場合、CPCは2チャンネルから3チャンネルを生成する予測係数として説明可能である。
TTTボックス402からの出力として与えられるチャンネル403は、1以上の空間パラメータを用いて2出力チャンネルを生成するOTTボックス406に対する入力として与えられる。図示の例において、2出力チャンネルは、例えば、サラウンドサウンド環境における前左(FL;Front Left)スピーカ位置と後左(BL;Backward Left)スピーカ位置を示す。チャンネル404は1以上の空間パラメータを用いて2出力チャンネルを生成するOTTボックス407に対する入力として与えられる。図示の例において、2出力チャンネルは前右(FR;Front Right)のスピーカ位置と後右(BR;Backward Right)のスピーカ位置を示す。チャンネル405は2出力チャンネルを生成するOTTボックス408に対する入力として与えられる。図示の例において、2出力チャンネルはセンター(C;Center)スピーカ位置と低周波拡張(LFE;Low Frequency Enhancement)チャンネルを示す。この場合、空間情報(例えば、CLD、ICCなど)はOTTボックスのそれぞれに対する入力として与えられる。一部の実施形態においては、レジデュアル(残留)信号Res1、Res2がOTTボックス406及び407に対する入力として与えられうる。この実施形態において、レジデュアル信号はセンターチャンネルとLFEチャンネルを出力するOTTボックス408に対する出力として与えられないことがある。
図4に示す構成は、チャンネル変換モジュール用の構成の一例である。OTTボックスとTTTボックスの種々の組み合わせを含むチャンネル変換モジュール用の他の構成も採用可能である。チャンネル変換モジュールのそれぞれは周波数エリアにおいて動作可能であるため、チャンネル変換モジュールのそれぞれに適用されるパラメータ帯域の個数が定義可能である。パラメータ帯域は一つのパラメータに適用可能な少なくとも一つの周波数帯域を意味している。パラメータ帯域の個数については図6Bに基づき説明する。
図5は、本発明の一実施形態によりオーディオ信号のビットストリームを構成する方法を示す図である。図5の(a)は、空間情報信号だけを含むオーディオ信号のビットストリームを示し、図5の(b)及び(c)は、ダウンミックス信号と空間情報信号を含むオーディオ信号のビットストリームを示す。
図5の(a)を参照すると、オーディオ信号のビットストリームは、構成情報501とフレーム503を含むことができる。フレーム503は、ビットストリームにおいて繰り返し可能であり、一部の実施形態においては、空間オーディオ情報を含む1枚の空間フレーム502を含む。
一部の実施形態において、構成情報501は1枚の空間フレーム502内におけるタイムスロットの総数と、オーディオ信号の周波数範囲を拡張するパラメータ帯域の総数と、OTTボックスにおけるパラメータ帯域の個数と、TTTボックスにおけるパラメータ帯域の個数と、レジデュアル信号におけるパラメータ帯域の個数を示す情報を含む。構成情報501には所望に応じて他の情報が含まれうる。
一部の実施形態において、空間フレーム502は、1以上の空間パラメータ(例えば、CLD、ICCなど)と、フレームタイプと、1枚のフレーム内におけるパラメータセットの個数とパラメータセットが適用可能なタイムスロットと、を含む。所望に応じて、空間フレーム502には他の情報が含まれうる。図6〜図10に基づき、構成情報501及び空間フレーム502に含まれる情報の意味と用途を説明する。
図5の(b)を参照すると、オーディオ信号のビットストリームは、構成情報504と、ダウンミックス信号505と、空間フレーム506と、を含む。この場合、1枚のフレーム507は、ダウンミックス信号505と空間フレーム506を含み、これらのフレーム507がビットストリームにおいて繰り返し可能である。
図5の(c)を参照すると、オーディオ信号のビットストリームは、ダウンミックス信号508と、構成情報509と、空間フレーム510と、を含む。この場合、1枚のフレーム511は、構成情報509と空間フレーム510を含み、フレーム511は、ビットストリームにおいて繰り返し可能である。各フレーム511に構成情報509が挿入される場合、オーディオ信号は再生装置により任意の位置において再生可能である。
図5の(c)は、構成情報509がフレーム511ごとにビットストリームに挿入されることを示しているが、周期的にまたは非周期的に繰り返される複数のフレームごとに構成情報509がビットストリームに挿入可能であるということはいうまでもない。
図6Aと図6Bは、本発明の一実施形態によるパラメータセット、タイムスロット及びパラメータ帯域間の関係を示す図である。パラメータセットとは、1個のタイムスロットに適用される1以上の空間パラメータのことを言う。空間パラメータは、CLD、ICC、CPCなどの空間情報を含むことができる。タイムスロットとは、空間パラメータが適用可能なオーディオ信号の時間間隔のことをいう。1枚の空間フレームは1以上のタイムスロットを含むことができる。
図6Aを参照すると、多数のパラメータセット1、…、Pが空間フレームに使用可能であり、各パラメータセットは1以上のデータフィールド1、…、Q−1を含むことができる。オーディオ信号の全体の周波数範囲に一つのパラメータセットが適用可能であり、このようなパラメータセットにおける各空間パラメータは当該周波数帯域の1以上の位置に適用可能である。例えば、パラメータセットが20個の空間パラメータを含む場合、オーディオ信号の全体の周波数帯域は20個のエリア(以下、「パラメータ帯域」と言う。)に分割可能であり、パラメータセットの20個の空間パラメータがこれらの20個のパラメータ帯域に適用可能である。パラメータは、所望に応じて、パラメータ帯域に適用可能である。例えば、低周波パラメータ帯域に空間パラメータが密に適用され、高周波パラメータ帯域には疎らに適用可能である。
図6Bには、パラメータセットとタイムスロットとの間の関係を示す時間/周波数グラフが示されている。図示の例においては、1枚の空間フレームに12個のタイムスロットに並べられたセットに3つのパラメータセット(パラメータセット1、パラメータセット2、パラメータセット3)が適用される。この場合、オーディオ信号の全体の周波数範囲は9個のパラメータ帯域に分割される。このため、水平軸はタイムスロットの個数を示し、垂直軸はパラメータ帯域の個数を示す。3つのパラメータセットのそれぞれが特定のタイムスロットに適用される。例えば、最初のパラメータセット(パラメータセット1)はタイムスロット#1に適用され、2番目のパラメータセット(パラメータセット2)はタイムスロット#5に適用され、3番目のパラメータセット(パラメータセット3)はタイムスロット#9に適用される。タイムスロットにこれらのパラメータセットを補間及び/またはコピーすることにより、残りのタイムスロットにもこれらのパラメータセットが適用可能である。一般的に、パラメータセットの個数はタイムスロットの個数以下であってもよく、パラメータ帯域の個数はオーディオ信号の周波数帯域の個数以下であってもよい。オーディオ信号の全体の時間−周波数エリアの代わりに、オーディオ信号の一部の時間−周波数エリアに関する空間情報をエンコーディングすることにより、エンコーダからデコーダに送られる空間情報の量を低減することができる。このようなデータの低減が可能になる理由は、公知のオーディオコーディング認識の原理によれば、時間−周波数エリアにおける空間情報は、ほとんどの場合、人間の聴覚認識に十分であるためである。
開示された実施形態の重要な特徴は、パラメータセットが適用されるタイムスロットの位置を、固定個数のビットまたは可変個数のビットを用いてエンコーディングしかつデコーディングする、というところにある。また、パラメータ帯域の個数も固定個数のビットまたは可変個数のビットで表わすことができる。これに制限されるものではないが、空間オーディオコーディングに用いられる他の情報として、時間エリア、空間エリア及び/または周波数エリアに関連する情報を含む情報にも可変コーディング方式が適用可能である(例えば、フィルターバンクから出力される多数の周波数副帯域に適用される)。
図7Aは、本発明の一実施形態による空間情報の構成情報を示すシンタックスを示している。このような構成情報は多数のビットが割当て可能な複数のフィールド701〜718を含む。
「bsSamplingFrequencyIndex」フィールド701は、オーディオ信号のサンプリング処理から取得されるサンプリング周波数を示す。サンプリング周波数を示すために、「bsSamplingFrequencyIndex」フィールド701には4ビットが割り当てられる。「bsSamplingFrequencyIndex」フィールド701の値が15、すなわち、2進数「1111」であれば、サンプリング周波数を示すために、「bsSamplingFrequency」フィールド702が追加される。この場合、「bsSamplingFrequency」フィールド702には24ビットが割り当てられる。
「bsFrameLength」フィールド703は、1枚の空間フレーム内のタイムスロットの総数(以下、「numSlots」という。)を示し、「numSlots」と「bsFrameLength」フィールド703との間には、「numSlots=bsFrameLength+1」という関係が成り立つ。
「bsFreqRes」フィールド704は、オーディオ信号の全体の周波数エリアを拡張するパラメータ帯域の総数を示す。「bsFreqRes」フィールド704については図7Bに基づき説明する。
「bsTreeConfg」フィールド705は、図4に基づき説明したように、複数のチャンネル変換モジュールを含むツリー構成のための情報を示す。このようなツリー構成のための情報は、チャンネル変換モジュールのタイプ、チャンネル変換モジュールの個数、チャンネル変換モジュールに用いられた空間情報のタイプ、オーディオ信号の入力/出力チャンネルの個数などの情報を含む。
ツリー構成は、チャンネル変換モジュールのタイプまたはチャンネルの個数に応じて、5−1−5構成、5−2−5構成、7−2−7構成、7−5−7構成などのうちいずれかであってもよい。ツリー構成のうち5−2−5構成が図4に示してある。
「bsQuantMode」フィールド706は、空間情報の量子化モード情報を示す。
「bsOneIcc」フィールド707は、1つのICCパラメータサブセットが全体のOTTボックスに対して用いられるか否かを示す。この場合、パラメータサブセットは、特定のタイムスロット及び特定のチャンネル変換モジュールに適用されるパラメータセットを意味する。
「bsArbitraryDownmix」フィールド708は、任意のダウンミックスゲインの存否を示す。
「bsFixedGainSur」フィールド709は、LS(左側のサラウンド)及びRS(右側のサラウンド)などのサラウンドチャンネルに適用されるゲインを示す。
「bsFixedGainLFE」は、LFEチャンネルに適用されるゲインを示す。
「bsFixedGainDM」は、ダウンミックス信号に適用されるゲインを示す。
「bsMatrixMode」フィールド712は、ステレオダウンミックス信号と互換可能な行列がエンコーダから生成されるか否かを示す。
「bsTempShapeConfig」フィールド713は、デコーダにおける臨時の形態(例えば、TES(Temporal Envelope Shaping)及び/またはTP(Temporal Shaping))の動作モードを示す。
「bsDecorrConfig」フィールド714は、デコーダの相関分離器の動作モードを示す。
最後に、「bs3DaudioMode」フィールド715は、ダウンミックス信号が3D信号にエンコーディングされるか否かと、逆HRTF処理が用いられるか否かを示す。
エンコーダ/デコーダにおいて各フィールドの情報が決定/抽出された後、チャンネル変換モジュールに適用されるパラメータ帯域の個数に関する情報がエンコーダ/デコーダにおいて決定/抽出される。先ず、OTTボックスに適用されるパラメータ帯域の個数が決定/抽出され(716)てから、TTTボックスに適用されるパラメータ帯域の個数が決定/抽出される(717)。OTTボックス及び/またはTTTボックスに対するパラメータ帯域の個数は、以下、図8A〜図9Bに基づき詳述する。
拡張フレームが存在する場合、「spatialExtensionConfig」ブロック718は、拡張フレームに関する構成情報を含む。「spatialExtensionConfig」ブロック718に含まれている情報について、以下、図10A〜図10Dに基づき説明する。
図7Bは、本発明の一実施形態による空間情報信号のパラメータ帯域の個数を示す表である。「numBands」は、オーディオ信号の全体の周波数エリアに対するパラメータ帯域の個数を示し、「bsFreqRes」は、パラメータ帯域の個数に関するインデックス情報を示す。例えば、オーディオ信号の全体の周波数エリアは、所望に応じて、パラメータ帯域の個数(例えば、4、5、7、10、14、20、28など)に分割可能である。
一部の実施形態においては、各パラメータ帯域に一つのパラメータが適用可能である。例えば、「numBands」が28である場合、オーディオ信号の全体の周波数エリアは28個のパラメータ帯域に分割され、これらの28個のパラメータ帯域のそれぞれに28個のパラメータがそれぞれ適用可能である。他の例において、「numBands」が4である場合、所定のオーディオ信号の全体の周波数エリアは4個のパラメータ帯域に分割され、これらの4個のパラメータ帯域のそれぞれには4個のパラメータがそれぞれ適用可能である。図7Bにおいて、「Reserve」は、所定のオーディオ信号の全体の周波数エリアに対するパラメータ帯域の個数が決定されていないことを意味する。
人間の聴覚機関は、コーディング方式において用いられるパラメータ帯域の個数に敏感ではないということに留意する必要がある。このため、少数のパラメータ帯域を用いてもより多数のパラメータ帯域が用いられた場合に比べて、聴取者に類似する空間オーディオ効果を奏することができる。
「numBands」とは異なり、図7Aに示す「bsFramelength」フィールド703が示す「numSlots」は、全体の値を示すことができる。しかしながら、1枚の空間フレーム内のサンプルの個数が「numSlots」により明確に分割される場合、「numSlots」の値は制限される。このため、実質的に表わされるべき「numSlots」の最大値が「b」であれば、「bsFrameLength」フィールド703の全体の値はceil{log2(b)}ビットで表わすことができる。この場合、「ceil(x)」は、値「x」以上の最大の整数を意味する。例えば、1枚の空間フレームが72個のタイムスロットを含む場合、ceil{log2(72)}=7ビットが「bsFrameLength」フィールド703に割当て可能であり、チャンネル変換モジュールに適用されるパラメータ帯域の個数は「numBands」内において決定可能である。
図8Aは、本発明の一実施形態により、OTTボックスに適用されるパラメータ帯域の個数を固定個数のビットで表わすシンタックスを示している。図7Aと図8Aを参照すると、「i」は「0」において「numOttBoxes−1」の値を有し、「numOttBoxes」はOTTボックスの総数である。すなわち、「i」の値が各OTTボックスを示し、各OTTボックスに適用されるパラメータ帯域の個数は「i」の値により表わされる。OTTボックスがLFEチャンネルモードを有する場合、OTTボックスのLFEチャンネルに適用される帯域の個数(以下、「bsOttBands」という。)は固定個数のビットを用いて表わすことができる。図示の例においては、「bsOttBands」フィールド801に5ビットが割り当てられる。OTTボックスがLFEチャンネルモードを有さない場合、総数のパラメータ帯域numBandsがOTTボックスのチャンネルに割り当てられる。
図8Bは、本発明の一実施の形態により、OTTボックスに適用されるパラメータ帯域の個数を可変個数のビットで表わすシンタックスを示している。図8Bは、図8Aとほとんど同様であるが、図8Bに示す「bsOttBands」フィールド802が可変個数のビットで表わすという点で図8Aとは異なる。具体的に、「numBands」以下の値を有する「bsOttBands」フィールド802は、「numBands」を用いる可変個数のビットで表わすことができる。
「numBands」が2^(n−1)以上2^(n)未満の範囲に収まると、「bsOttBands」フィールド802は可変nビットで表わすことができる。
例えば、(a)「numBands」が40である場合、「bsOttBands」フィールド802は6ビットで表わされ、(b)「numBands」が28または20である場合、「bsOttBands」フィールド802は5ビットで表わされ、(c)「numBands」が14または10である場合、「bsOttBands」フィールド802は4ビットで表わされ、(d)「numBands」が7、5または4である場合、「bsOttBands」フィールド802は3ビットで表わされる。
「numBands」が2^(n−1)より大きく2^(n)以下の範囲に収まると、「bsOttBands」フィールド802は可変nビットで表わすことができる。
例えば、(a)「numBands」が40である場合、「bsOttBands」フィールド802は6ビットで表わされ、(b)「numBands」が28または20である場合、「bsOttBands」フィールド802は5ビットで表わされ、(c)「numBands」が14または10である場合、「bsOttBands」フィールド802は4ビットで表わされ、(d)「numBands」が7または5である場合、「bsOttBands」フィールド802は3ビットで表わされ、(e)「numBands」が4である場合、「bsOttBands」フィールド802は2ビットとなる。
「bsOttBands」フィールド802は、「numBands」を変数として取って最も近い整数に切り上げる関数(以下、「切り上げ関数」と言う。)により可変個数のビットで表わすことができる。
具体的に、i)0<bsOttBands≦numBandsまたは0≦bsOttBands<numBandsである場合、「bsOttBands」フィールド802はceil(log2numBands)の値に対応する数のビットで表わされるか、あるいは、ii)0≦bsOttBands≦numBandsである場合、「bsOttBands」フィールド802はceil(log2(numBands+1))で表わすことができる。
「numBands」(以下、「numberBands」という。)以下の値が任意に決定される場合、「bsBands」フィールド802は、「numberBands」を変数として取って切り上げ関数により可変個数のビットで表わすことができる。
具体的に、i)0<bsOttBands≦numberBandsまたは0≦bsOttBands<numberBandsである場合、「bsOttBands」フィールド802はceil(log2(numberBands))ビットで表わされるか、あるいは、ii)0≦bsOttBands≦numberBandsである場合、「bsOttBands」フィールド802はceil(log2(numberBands+1)で表わすことができる。
1以上のOTTボックスが用いられる場合、「bsOttBands」の組み合わせは以下の式1で表わすことができる。
〔式1〕
Figure 0005111374
ここで、bsOttBandsiはi番目の「bsOttBands」を示す。例えば、OTTボックスが3個存在し、「bsOttBands」フィールド802に対して3つの値(N=3)が存在するとする。この例において、3つのOTTボックスに適用される「bsOttBands」フィールド802の3つの値(以下、それぞれa1、a2、a3とする。)はそれぞれ2ビットで表わすことができる。このため、a1、a2、a3の値を表わすために、合計で6ビットが必要となる。しかしながら、a1、a2、a3の値がグループで表わされる場合、27個(=3*3*3)の場合が発生可能であり、これは5ビットで表わすことができ、1ビットを節約することになる。「numBands」が3であり、かつ、5ビットで表わされるグループ値が15である場合、グループ値は15=1x(3^2)+2*(3^1)+0*(3^0)で表わすことができる。このため、デコーダは式1の逆を適用してグループ値15から「bsOttBands」フィールド802の3つの値a1、a2、a3をそれぞれ1、2、0に決定することができる。
多数のOTTボックスの場合、「bsOttBands」の組み合わせは「numberBands」を用いる式2〜式4(以下、後述する。)のうちいずれかとして表わすことができる。「numberBands」を用いる「bsOttBands」の表現は式1における「numBands」を用いる表現とほとんど同様であるため、詳細な説明は省き、その式だけを以下に示す。
〔式2〕
Figure 0005111374
〔式3〕
Figure 0005111374
〔式4〕
Figure 0005111374
図9Aは、本発明の一実施形態により、TTTボックスに適用されるパラメータ帯域の個数を固定個数のビットで示すシンタックスを示している。図7Aと図9Aを参照すると、「i」は「0」において「numTttBoxes−1」の値を有し、「numTttBoxes」はTTTボックスの総数である。すなわち、「i」の値が各TTTボックスを示す。各TTTボックスに適用されるパラメータ帯域の個数は「i」の値により表わされる。一部の実施形態において、TTTボックスは低周波帯域範囲と高周波帯域範囲とに分割可能であり、これらの低周波帯域範囲と高周波帯域範囲には異なる処理が適用可能である。異なる分割も行うことが可能である。
「bsTTTDualMode」フィールド901は、所定のTTTボックスが低周波帯域範囲と高周波帯域範囲に対してそれぞれ異なるモード(以下、「デュアルモード」という。)にて動作するか否かを示す。例えば、「bsTTTDualMode」フィールド901の値が「0」である場合、低周波帯域範囲と高周波帯域範囲を区別することなく、全体の帯域範囲に対して単一のモードが用いられる。「bsTTTDualMode」フィールド901の値が「1」である場合、低周波帯域範囲と高周波帯域範囲に対してそれぞれ異なるモードが用いられる。
「bsTttModeLow」フィールド902は、所定のTTTボックスの動作モードを示すものであり、これは種々の動作モードを有することができる。例えば、TTTボックスは、CPCパラメータとICCパラメータなどを用いる予測モード、CLDパラメータを用いるエネルギ基盤のモードなどを有することができる。TTTボックスがデュアルモードを有する場合、高周波帯域範囲に関する追加情報が必要になる。
「bsTttModeHigh」フィールド903は、TTTボックスがデュアルモードを有する場合に高周波帯域範囲の動作モードを示す。
「bsTttBandsLow」フィールド904は、TTTボックスに適用されるパラメータ帯域の個数を示す。
「bsTttBandsHigh」フィールド905は、「numBands」を有する。
TTTボックスがデュアルモードを有する場合、低帯域範囲は「0」以上「bsTttBandsLow」未満であり、高帯域範囲は「bsTttBandsLow」以上「bsTttBandsHigh」未満である。
TTTボックスがデュアルモードを有さない場合、TTTボックスに適用されるパラメータ帯域の個数は「0」以上「numBands」未満である(907)。
「bsTttBandsLow」フィールド904は、固定個数のビットで表わすことができる。例えば、図9Aに示すように、「bsTttBandsLow」フィールド904を表わすために5ビットが割当て可能である。
図9Bは、本発明の一実施形態により、TTTボックスに適用されるパラメータ帯域の個数を可変個数のビットで表わすシンタックスを示している。図9Bは、図9Aとほとんど同様であるが、図9Bにおいては、「bsTttBandsLow」フィールド907を可変個数のビットで表わし、図9Aにおいては、「bsTttBandsLow」フィールド904を固定個数のビットで表わすという点において図9Aと図9Bとは異なっている。具体的に、「bsTttBandsLow」フィールド907は「numBands」以下の値を有するため、「bsTttBandsLow」フィールド907は「numBands」を用いる可変個数のビットで表わすことができる。
具体的に、「numBands」が2^(n−1)以上2^(n)未満の範囲に収まると、「bsTttBandsLow」フィールド907はnビットで表わすことができる。
例えば、(i)「numBands」が40である場合、「bsTttBandsLow」フィールド907は6ビットで表わされ、(ii)「numBands」が28または20である場合、「bsTttBandsLow」フィールド907は5ビットで表わされ、(iii )「numBands」が14または10である場合、「bsTttBandsLow」フィールド907は4ビットで表わされ、(iv)「numBands」が7、5または4である場合、「bsTttBandsLow」フィールド907は3ビットで表わされる。
「numBands」が2^(n−1)より大きく2^(n)以下の範囲に収まると、「bsTttBandsLow」フィールド907は可変nビットで表わすことができる。
例えば、(i)「numBands」が40である場合、「bsTttBandsLow」フィールド907は6ビットで表わされ、(ii)「numBands」が28または20である場合、「bsTttBandsLow」フィールド907は5ビットで表わされ、(iii )「numBands」が14または10である場合、「bsTttBandsLow」フィールド907は4ビットで表わされ、(iv)「numBands」が7または5である場合、「bsTttBandsLow」フィールド907は3ビットで表わされ、(v)「numBands」が4である場合、「bsOttBands」フィールド802は2ビットで表わされる。
「bsTttBandsLow」フィールド907は、「numBands」を変数として取って最も近い整数に切り上げて決定される個数のビットで表わすことができる。
例えば、i)0<bsOttBandsLow≦numBandsまたは0≦bsOttBandsLow<numBandsである場合、「bsTttBandsLow」フィールド907はceil(log2(numBands))の値に対応する数のビットで表わされるか、あるいは、ii)0≦bsOttBandsLow≦numBandsである場合、「bsTttBandsLow」フィールド907はceil(log2(numBands+1))で表わすことができる。
「numBands」、すなわち、「numberBands」以下の値が任意に決定される場合、「bsTttBandsLow」フィールド907は、「numberBands」を用いて可変個数のビットで表わすことができる。
具体的に、i)0<bsOttBandsLow≦numberBandsまたは0≦bsOttBandsLow<numberBandsである場合、「bsTttBandsLow」フィールド907はceil(log2(numberBands))の値に対応する数のビットで表わされるか、あるいは、ii)0≦bsOttBandsLow≦numberBandsである場合、「bsTttBandsLow」フィールド907はceil(log2(numberBands+1)の値に対応する数のビットで表わすことができる。
多数のOTTボックスが用いられる場合、「bsOttBandsLow」の組み合わせは以下の式5で表わすことができる。
〔式5〕
Figure 0005111374
ここで、bsTttBandsLowiはi番目の「bsTttBandsLow」を示す。式5の意味は、式1の意味と同様であるため、式5の詳細な説明は省く。
多数のOTTボックスの場合、「bsOttBandsLow」の組み合わせは「numberBands」を用いる式6〜式8のうちいずれかとして表わすことができる。式6〜式8の意味は、式2〜式4の意味と同様であるため、式6〜式8の詳細な説明は省く。
〔式6〕
Figure 0005111374
〔式7〕
Figure 0005111374
〔式8〕
Figure 0005111374
チャンネル変換モジュール(例えば、OTTボックス及び/またはTTTボックスなど)に適用されるパラメータ帯域の個数は「numBands」の分割値として表わすことができる。この場合、上述した分割値は、「numBands」の半値または特定の値で「numBands」を割った結果の値を用いる。
OTT及び/またはTTボックスに適用されるパラメータ帯域の個数が一旦決定されると、前記パラメータ帯域の個数の範囲内において各OTTボックス及び/または各TTTボックスに適用可能なパラメータセットが決定される。各OTTボックス及び/または各TTTボックスには各パラメータセットがタイムスロット単位で適用可能である。すなわち、1個のタイムスロットに一つのパラメータセットが適用可能である。
以上の述べたように、1枚の空間フレームは複数のタイムスロットを含むことができる。空間フレームが固定フレームタイプである場合、複数のタイムスロットには等間隔にてパラメータセットが適用可能である。空間フレームが可変フレームタイプである場合、パラメータが適用されるタイムスロットの位置情報が必要となる。これについては、図13A〜13Cに基づき後述する。
図10Aは、本発明の一実施形態により空間拡張フレームに関する空間拡張構成情報を示すシンタックスを示している。空間拡張構成情報は、「bsSacExtType」フィールド1001と、「bsSacExtLen」フィールド1002と、「bsSacExtLenAdd」フィールド1003と、「bsSacExtLenAddAdd」フィールド1004と、「bsFillBits」フィールド1007と、を含む。他のフィールドも採用可能である。
「bsSacExtType」フィールド1001は、空間拡張フレームのデータタイプを示す。例えば、空間拡張フレームは、「0」、レジデュアル信号データ、任意のダウンミックスレジデュアル信号データまたは任意のツリーデータで詰め込むことができる。
「bsSacExtLen」フィールド1002は、空間拡張構成情報のバイト数を示す。
「bsSacExtLenAdd」フィールド1003は、空間拡張構成情報のバイト数が、例えば15以上である場合、空間拡張構成情報の追加バイト数を示す。
「bsSacLenAddAdd」フィールド1004は、空間拡張構成情報のバイト数が、例えば270以上である場合、空間拡張構成情報の追加バイト数を示す。
エンコーダ/デコーダにおいて各フィールドが決定/抽出された後、空間拡張フレームに含まれるデータタイプに関する構成情報が決定される(1005)。
上述したように、空間拡張フレームにはレジデュアル信号データ、任意のダウンミックスレジデュアル信号データ、ツリー構成データなどが含まれうる。
続けて、空間拡張構成情報の長さのうち未使用のビットの個数が算出される(1006)。
「bsFillBits」フィールド1007は、未使用のビットを詰め込むために見逃しうるデータのビット数を示す。
図10Bと図10Cは、本発明の一実施形態により、空間拡張フレームにレジデュアル信号が含まれる場合、レジデュアル信号のための空間拡張情報を示すシンタックスを示している。
図10Bを参照すると、「bsResidualSamplingFrequencyIndex」フィールド1008は、レジデュアル信号のサンプリング周波数を示す。
「bsResidualFramesPerSpatialFrame」フィールド1009は、空間フレーム当たりのレジデュアルフレームの本数を示す。例えば、1枚の空間フレームに1枚、2枚 、3枚または4枚のレジデュアルフレームが含まれうる。
「ResidualConfig」フィールド1010は、各OTT及び/またはTTTボックスに適用されるレジデュアル信号に対するパラメータ帯域の個数を示す。
図10Cを参照すると、「bsResidualPresent」フィールド1011は、各OTT及び/またはTTTボックスにレジデュアル信号が適用されるか否かを示す。
「bsResidualBands」フィールド1012は、各OTT及び/またはTTTボックスにレジデュアル信号が存在する場合、各OTT及び/またはTTTボックスに存在するレジデュアル信号のパラメータ帯域の個数を示す。レジデュアル信号のパラメータ帯域の個数は固定個数のビットまたは可変個数のビットで表わすことができる。パラメータ帯域の個数が固定個数のビットで表わされる場合、レジデュアル信号はオーディオ信号のパラメータ帯域の総数以下の値を有することができる。このため、全体のパラメータ帯域の個数を示すために必要となるビット数(例えば、図10Cにおける5ビットなど)が割当て可能である。
図10Dは、本発明の一実施形態により、レジデュアル信号のパラメータ帯域の個数を可変個数のビットで表わすシンタックスを示している。「beResidualBands」フィールド1014は、「numBands」を用いる可変個数のビットで表わすことができる。
「numBands」が2^(n−1)以上2^(n)未満であれば、「beResidualBands」フィールド1014はnビットで表わすことができる。
例えば、(i)「numBands」が40である場合、「beResidualBands」フィールド1014は6ビットで表わされ、(ii)「numBands」が28または20である場合、「beResidualBands」フィールド1014は5ビットで表わされ、(iii )「numBands」が14または10である場合、「beResidualBands」フィールド1014は4ビットで表わされ、(iv)「numBands」が7、5または4である場合、「beResidualBands」フィールド1014は3ビットで表わされる。
「numBands」が2^(n−1)より大きく2^(n)以下であれば、「beResidualBands」フィールド1014は可変nビットで表わすことができる。
例えば、(i)「numBands」が40である場合、「beResidualBands」フィールド1014は6ビットで表わされ、(ii)「numBands」が28または20である場合、「beResidualBands」フィールド1014は5ビットで表わされ、(iii )「numBands」が14または10である場合、「beResidualBands」フィールド1014は4ビットで表わされ、(iv)「numBands」が7または5である場合、「beResidualBands」フィールド1014は3ビットで表わされ、(v)「numBands」が4である場合、「beResidualBands」フィールド1014は2ビットで表わされる。
また、「beResidualBands」フィールド1014は、「numBands」を変数として取って最も近い整数に切り上げて決定される切り上げ関数により決定されるビット数で表わすことができる。
具体的に、i)0<beResidualBands≦numBandsまたは0≦beResidualBands<numBandsである場合、「beResidualBands」フィールド1014はceil(log2(numBands))ビットで表わされるか、あるいは、ii)0≦beResidualBands≦numBandsである場合、「beResidualBands」フィールド1014はceil(log2(numBands+1))ビットで表わすことができる。
一部の実施形態においては、「numBands」以下の値「numberBands」を用いて「beResidualBands」フィールド1014を表わすことができる。
具体的に、i)0<beResidualBands≦numberBandsまたは0≦beResidualBands<numberBandsである場合、「beResidualBands」フィールド1014はceil(log2(numberBands))ビットで表わされるか、あるいは、ii)0≦beResidualBands≦numberBandsである場合、「beResidualBands」フィールド1014はceil(log2(numberBands+1))の値で表わすことができる。
複数のレジデュアル信号Nが存在する場合、「beResidualBands」の組み合わせは、以下の式9で表わすことができる。
〔式9〕
Figure 0005111374
この場合、bsResidualBandsiはi番目の「bsResidualBands」を示す。式9の意味は、式1の意味と同様であるため、式9の詳細な説明は省く。
多数のレジデュアル信号が存在する場合、「bsResidualBands」の組み合わせは「numberBands」を用いる式10〜式12のうちいずれかとして表わすことができる。「numberBands」を用いて「bsResidualBands」を表わすことは式2〜式4とほとんど同様であるため、詳細な説明を省く。
〔式10〕
Figure 0005111374
〔式11〕
Figure 0005111374
〔式12〕
Figure 0005111374
レジデュアル信号のパラメータ帯域の個数は「numBands」の分割値として表わすことができる。この場合、上述した分割値は、「numBands」の半値または特定の値で「numBands」を割った結果の値を用いる。
レジデュアル信号はダウンミックス信号及び空間情報信号と共にオーディオ信号のビットストリームに含まれてもよく、このようなビットストリームはデコーダに転送可能である。デコーダは、このようなビットストリームから前記ダウンミックス信号と、空間情報信号及びレジデュアル信号を抽出することができる。
続けて、ダウンミックス信号は空間情報を用いてアップミックスされる。一方、レジデュアル信号はアップミックスの過程においてダウンミックス信号に適用される。具体的に、ダウンミックス信号は空間情報を用いる複数のチャンネル変換モジュールにおいてアップミックスされる。このような過程において、レジデュアル信号がチャンネル変換モジュールに適用される。以上述べたように、チャンネル変換モジュールは複数のパラメータ帯域を有し、パラメータセットはタイムスロット単位でチャンネル変換モジュールに適用される。レジデュアル信号がチャンネル変換モジュールに適用される場合、レジデュアル信号が適用されるオーディオ信号のチャンネル間相関情報を更新するためにはレジデュアル信号が必要となる。このような更新されたチャンネル間相関情報はアップミキシング処理に用いられる。
図11Aは、本発明の一実施形態によるノンガイドコーディングのためのデコーダを示すブロック図である。ノンガイドコーディングは、オーディオ信号のビットストリームに空間情報が含まれていないことを意味する。
一部の実施形態において、デコーダは、解析フィルターバンク1102と、解析部1104と、空間合成部1006と、合成フィルターバンク1108と、を備える。図11Aにはステレオ信号タイプのダウンミックス信号が示されているが、他のタイプのダウンミックス信号が使用可能である。
動作に際し、デコーダはダウンミックス信号1101を受信し、解析フィルターバンク1102は前記受信されたダウンミックス信号1101を周波数エリア信号1103に変換する。解析部1104は、前記変換されたダウンミックス信号1103から空間情報を生成する。解析部1104がスロット単位で処理を行い、複数のスロットごとに空間情報1105を生成することができる。この場合、スロットはタイムスロットを含む。
空間情報は2ステップで生成可能である。第一に、ダウンミックス信号からダウンミックスパラメータが生成される。第二に、前記ダウンミックスパラメータは空間パラメータなどの空間情報に変換される。一部の実施形態において、ダウンミックスパラメータはダウンミックス信号の行列演算により生成可能である。
空間合成部1106は、前記生成された空間情報1105とダウンミックス信号1103とを合成してマルチチャンネルオーディオ信号1107を生成する。前記生成されたマルチチャンネルオーディオ信号1107は、合成フィルターバンク1108を通過して時間エリアオーディオ信号1109に変換される。
空間情報は所定のスロット位置に生成可能である。このような位置間距離は同じであってもよい(すなわち、等距離)。例えば、空間情報は4個のスロットごとに生成可能である。また、空間情報は可変スロット位置に生成可能である。この場合、空間情報が生成される位置情報がビットストリームから抽出可能である。前記位置情報は可変個数のビットで表わすことができる。前記位置は以前のスロット位置情報からの絶対値及び差分値として表わすことができる。
ノンガイドコーディングを用いる場合、オーディオ信号の各チャンネルに対するパラメータ帯域の個数(以下、「bsNumguidedBlindBands」という。)は、固定個数のビットで表わすことができる。「bsNumguidedBlindBands」は、「numBands」を用いる可変個数のビットで表わすことができる。例えば、「numBands」が2^(n−1)以上2^(n)未満であれば、「bsNumguidedBlindBands」は可変nビットで表わすことができる。
具体的に、(a)「numBands」が40である場合、「bsNumguidedBlindBands」は6ビットで表わされ、(b)「numBands」が28または20である場合、「bsNumguidedBlindBands」は5ビットで表わされ、(c)「numBands」が14または10である場合、「bsNumguidedBlindBands」は4ビットで表わされ、(d)「numBands」が7、5または4である場合、「bsNumguidedBlindBands」は3ビットで表わされる。
「numBands」が2^(n−1)より大きく2^(n)以下であれば、「bsNumguidedBlindBands」は可変nビットで表わすことができる。
例えば、(a)「numBands」が40である場合、「bsNumguidedBlindBands」は6ビットで表わされ、(b)「numBands」が28または20である場合、「bsNumguidedBlindBands」は5ビットで表わされ、(c)「numBands」が14または10である場合、「bsNumguidedBlindBands」は4ビットで表わされ、(d)「numBands」が7または5である場合、「bsNumguidedBlindBands」は3ビットで表わされ、(e)「numBands」が4である場合、「bsNumguidedBlindBands」は2ビットで表わされる。
また、「bsNumguidedBlindBands」は「numBands」を変数として取る切り上げ関数を用いて可変個数のビットで表わすことができる。
例えば、i)0<bsNumguidedBlindBands≦numBandsまたは0≦bsNumguidedBlindBands<numBandsである場合、「bsNumguidedBlindBands」はceil(log2(numBands)ビットで表わされるか、あるいは、ii)0≦bsNumguidedBlindBands≦numBandsである場合、「bsNumguidedBlindBands」はceil(log2(numBands+1))ビットで表わすことができる。
「numBands」以下の値、すなわち、「numberBands」が任意に決定される場合、「bsNumguidedBlindBands」は以下のように表わすことができる。
具体的に、i)0<bsNumguidedBlindBands≦numberBandsまたは0≦bsNumguidedBlindBands<numberBandsである場合、「bsNumguidedBlindBands」はceil(log2(numberBands))ビットで表わされるか、あるいは、ii)0≦bsNumguidedBlindBands≦numberBandsである場合、「bsNumguidedBlindBands」はceil(log2(numberBands+1))で表わすことができる。
多数のチャンネルNが用いられる場合、「bsNumguidedBlindBands」の組み合わせは以下の式13で表わすことができる。
〔式13〕
Figure 0005111374
ここで、「bsNumGuidedBlindBandsi」はi番目の「bsNumguidedBlindBands」を示す。式13の意味は、式1の意味と同様であるため、式13の詳細な説明は省く。
多数のチャンネルが存在する場合、「bsNumguidedBlindBands」は「numberBands」を用いる式14〜式16のうちいずれかとして表わすことができる。「numberBands」を用いる「bsNumguidedBlindBands」の表現は式2〜式4の表現と同様であるため、式14〜式16の詳細な説明は省く。
〔式14〕
Figure 0005111374
〔式15〕
Figure 0005111374
〔式16〕
Figure 0005111374
図11Bは、本発明の一実施形態によりパラメータ帯域の個数をグループとして表わす方法を示している。パラメータ帯域の個数は、チャンネル変換モジュールに適用されるパラメータ帯域の個数情報と、レジデュアル信号に適用されるパラメータ帯域の個数情報と、ノンガイドコーディングを用いる場合にオーディオ信号の各チャンネルに関するパラメータ帯域の個数情報と、を含む。パラメータ帯域の個数情報が複数存在する場合、複数の個数情報(例えば、「bsOttBands」、「bsTttBands」、「bsResidualBands」及び/または「bsNumguidedBlindBands」など)は少なくとも一つのグループとして表わすことができる。
図11Bを参照すると、パラメータ帯域の個数情報が(kN+L)個存在し、かつ、各パラメータ帯域の個数情報を表わすのにQビットが必要となる場合、複数のパラメータ帯域の個数情報は以下のグループで表わすことができる。この場合、「k」と「N」は「0」ではない任意の整数であり、「L」は0≦L<Nを満たす任意の整数である。
グループ化方法は、パラメータ帯域の個数情報N個を束ねてk個のグループを生成するステップと、最後のパラメータ帯域の個数情報L個を束ねて最終のグループを生成するステップと、を含む。K個のグループはMビットで表わすことができ、最終のグループはpビットで表わすことができる。この場合、Mビットが、好ましくは、パラメータ帯域の個数情報のそれぞれをグループ化することなく表わす場合に用いられるN*Qビットよりも小さい。Pビットが、好ましくは、パラメータ帯域の個数情報のそれぞれをグループ化することなく表わす場合に用いられるL*Qビット以下である。
例えば、パラメータ帯域の個数情報の2つがそれぞれb1とb2であるとする。b1とb2がそれぞれ5個の値を有する場合、b1とb2のそれぞれを表わすのに3ビットが必要である。この場合、たとえ3ビットは8個の値を表わすことができるとしても、実質的には5個の値が必要となる。このため、b1とb2のそれぞれは3個の余分を有する。しかしながら、b1とb2を束ねてグループとして表わす場合には、6ビット(=3ビット+3ビット)の代わりに5ビットが用いられる。具体的に、b1とb2との全ての組み合わせは25個(=5*5)のタイプを有するため、b1とb2のグループは5ビットで表わすことができる。5ビットは32個の値を表わすことができるため、グループ化表現の場合、7個の余分が生成される。しかしながら、b1とb2をグループ化して表わす場合、その余分はb1とb2をそれぞれ3ビットで表わす場合の余分よりも小さい。複数のパラメータ帯域の個数情報をグループとして表わす方法は、以下のような種々の方式により実現可能である。
複数のパラメータ帯域の個数情報がそれぞれ40種類の値を有する場合、Nとして2、3、4、5または6を用いてk個のグループが生成される。これらのk個のグループはそれぞれ11ビット、16ビット、22ビット、27ビット、32ビットとして表わすことができる。あるいは、これらのk個のグループは各場合を組み合わせて表わされる。
複数のパラメータ帯域の個数情報がそれぞれ28種類の値を有する場合、Nとして6を用いてk個のグループが生成され、kは29ビットで表わすことができる。
複数のパラメータ帯域の個数情報がそれぞれ20種類の値を有する場合、Nとして2、3、4、5、6または7を用いてk個のグループが生成される。これらのk個のグループはそれぞれ9ビット、13ビット、18ビット、22ビット、26ビット及び31ビットとして表わすことができる。あるいは、これらのk個のグループは各場合を組み合わせて表わすことができる。
複数のパラメータ帯域の個数情報がそれぞれ14種類の値を有する場合、Nとして6を用いてk個のグループが生成される。これらのk個のグループは23ビットで表わすことができる。
複数のパラメータ帯域の個数情報がそれぞれ10種類の値を有する場合、Nとして2、3、4、5、6、7、8または9を用いてk個のグループが生成される。これらのk個のグループはそれぞれ7、10、14、17、20、24、27及び30ビットで表わすことができる。あるいは、これらのk個のグループは各場合を組み合わせて表わすことができる。
複数のパラメータ帯域の個数情報がそれぞれ7種類の値を有する場合、Nとして6、7、8、9、10または11を用いてk個のグループが生成される。これらのk個のグループはそれぞれ17、20、23、26、29及び31ビットで表わすことができる。あるいは、これらのk個のグループは各場合を組み合わせて表わすことができる。
複数のパラメータ帯域の個数情報がそれぞれ5種類の値を有する場合、Nとして2、3、4、5、6、7、8、9、10、11、12または13を用いてk個のグループが生成可能である。これらのk個のグループはそれぞれ5、7、10、12、13、17、19、21、24、26、28及び31ビットで表わすことができる。あるいは、これらのk個のグループは各場合を組み合わせて表わすことができる。
また、複数のパラメータ帯域の個数情報は、上述したグループとして表わされるように構成可能であるか、または、パラメータ帯域の個数情報のそれぞれを独立したビットシーケンスとして連続して表わされるように構成可能である。
図12は、本発明の一実施形態により空間フレームの構成情報を示すシンタックスを示している。空間フレームは、「FraminInfo」ブロック1201と、「bsIndependencyFlag」ブロック1201と、「Ottdata」ブロック1203と、「Tttdata」ブロック1204と、「SmgData」ブロック1205と、「TempShapeData」ブロック1206と、を含む。
「FramingInfo」ブロック1201は、パラメータセットの個数に関する情報と、各パラメータが適用されるタイムスロットに関する情報と、を含む。「FramingInfo」ブロック1201については、図13Aに基づき詳述する。
「bsIndependencyFlag」フィールド1202は、現在のフレームが以前フレームに関する知識無しにデコーディング可能であるか否かを示す。
「OttData」ブロック1203は、全体のOTTボックスに関する全体の空間パラメータ情報を含む。
「TttData」ブロック1204は、全体のTTTボックスに関する全体の空間パラメータ情報を含む。
「SmgData」ブロック1205は、非量子化された空間パラメータに適用される臨時平坦化に関する情報を含む。
「TempShapeData」ブロック1206は、非相関信号に適用される臨時エンベロープ形状化に関する情報を含む。
図13Aは、本発明の一実施形態により、パラメータセットが適用されるタイムスロット位置情報を示すシンタックスを示している。「bsFramingType」フィールド1301はオーディオ信号の空間フレームが固定フレームタイプであるか、あるいは、可変フレームタイプであるかを示す。固定フレームとは、予め設定されたタイムスロットにパラメータセットが適用されるフレームのことを言う。例えば、等間隔にて予め設定されたタイムスロットにパラメータセットが適用される。可変フレームとは、パラメータセットが適用されるタイムスロットの位置情報を別途に受信するフレームのことを言う。
「bsNumParamSets」フィールド1302は、1枚の空間フレーム内においてパラメータセットの個数を示し(以下、「numParamSets」という。)、「numParamSets」と「bsNumParamSets」との間には「numParamSets=bsNumparaSets+1」の関係が成り立つ。
例えば、図13Aの「bsNumParasets」フィールド1302に3ビットが割り当てられると、1枚の空間フレーム内には最大8個のパラメータセットが提供可能である。割り当てられるビットの個数については制限がないため、空間フレーム内により多くのパラメータセットが提供可能である。
空間フレームが固定フレームタイプである場合、パラメータセットが適用されるタイムスロットの位置情報は予め設定された規則により決定可能であり、パラメータセットが適用されるタイムスロットの追加的な位置情報は不要である。しかしながら、空間フレームが可変フレームタイプである場合、パラメータセットが適用される位置情報が必要となる。
「bsParamSlot」フィールド1303は、パラメータセットが適用されるタイムスロットの位置情報を示す。「bsParamSlot」フィールド1303は、1枚の空間フレーム内におけるタイムスロットの個数、すなわち、「numSlots」を用いて可変個数のビットで表わすことができる。具体的に、「numSlots」が2^(n−1)以上2^(n)未満の範囲に収まると、「bsParamSlot」フィールド1303はnビットで表わすことができる。
例えば、(i)「numSlots」が64と127との間の範囲にある場合、「bsParamSlot」フィールド1303は7ビットで表わされ、(ii)「numSlots」が32と63との間の範囲にある場合、「bsParamSlot」フィールド1303は6ビットで表わされ、(iii )「numSlots」が16と31との間の範囲にある場合、「bsParamSlot」フィールド1303は5ビットで表わされ、(iv)「numSlots」が8と15との間の範囲にある場合、「bsParamSlot」フィールド1303は4ビットで表わされ、(v)「numSlots」が4と7との間の範囲にある場合、「bsParamSlot」フィールド1303は3ビットで表わされ、(vi)「numSlots」が2と3との間の範囲にある場合、「bsParamSlot」フィールド1303は2ビットで表わされ、(vii )「numSlots」が1である場合、「bsParamSlot」フィールド1303は1ビットで表わされ、(viii)「numSlots」が0である場合、「bsParamSlot」フィールド1303は0ビットで表わすことができる。これと同様に、「numSlots」が64と127との間の範囲にある場合、「bsParamSlot」フィールド1303は7ビットで表わすことができる。
多数のパラメータセットNが存在する場合、「bsParamSlot」は式17により表わすことができる。
〔式17〕
Figure 0005111374
この場合、「bsParamSloti」はI番目のパラメータセットが適用されるタイムスロットを示す。例えば、「numSlots」が3であり、かつ、「bsParamSlot」フィールド1303が10個の値を有することができるとする。この場合、「bsParamSlot」フィールド1303に関する3つの情報(以下、それぞれ、c1、c2、c3という。)が必要となる。c1、c2、c3のそれぞれを表わすためには4ビットが必要であるため、合計で12ビットが必要となる。c1、c2、c3をグループに束ねて表わす場合、1、000個(=10*10*10)の場合が発生可能であり、これは10ビットで表わされ、2ビットを節約することになる。「numSlots」が3であり、かつ、5ビットで表わされるグループ値が31である場合、グループ値は31=1x(3^2)+5*(3^1)+7*(3^0)で表わすことができる。このため、デコーダ装置は、式17の逆を適用してc1、c2、c3をそれぞれ1、5、7に決定することができる。
図13Bは、本発明の一実施形態によりパラメータセットが絶対値及び差分値として適用されるタイムスロットの位置情報を示すシンタックスを示している。空間フレームが可変フレームタイプである場合、図13Aにおける「bsParamSlot」フィールド1301は「bsParamSlot」情報が単調増加するということを用いて絶対値及び差分値で表わすことができる。
例えば、(i)最初のパラメータセットが適用されるタイムスロットの位置は絶対値、すなわち、「bsParamSlot[0]」として生成可能であり、(ii)2番目以上のパラメータセットが適用されるタイムスロットの位置は絶対値、すなわち、「bsParamSlot[ps]」と「bsParamSlot[ps−1]」との間の「difference value」または「difference value−1」として生成可能である(以下、「bsDiffParamSlot[ps]」という。)。この場合、「ps」はパラメータセットを意味する。
「bsParamSlot[0]」フィールド1304は「numSlots」と「numParamSets」を用いて算出される個数のビットで表わすことができる(以下、「nBitsParamSlot(0)」という。)。
「bsDiffParamSlot[ps]」フィールド1305は、「numSlots」、「numParamSetst」及び以前のパラメータセットが適用されたタイムスロットの位置を用いて算出される個数のビットで表わすことができる(以下、「nBitParamSlot(ps)」という。)。
具体的に、最小数のビットで「bsParamSlot[ps]」を表わすために、「bsParamSlot[ps]」を表わすビットの個数は以下の規則により決定可能である:(i)複数の「bsParamSlot[ps]」は昇順に増加する(bsParamSlot[ps]>bsParamSlot[ps−1])、(ii)「bsParamSlot[0]」の最大値は「numSlots−NumParamSets」であり、(iii )0<ps<numParamSetsである場合、「bsParamSlot[ps]」は「bsParamSlot[ps−1]+1」と「numSlots−numParamSets+ps」との間の値だけを有する。
例えば、「numSlots」が10であり、かつ、「numParamSets」が3である場合、「bsParamSlot[ps]」は昇順に増加するため、「bsParamSlot[0]」の最大値は「10−3=7」となる。すなわち、「bsParamSlot[0]」は0〜7の値から選ばれる必要がある。これは、「bsParamSlot[0]」が7以上の値を有する場合、残りのパラメータセットに対するタイムスロットの個数が十分ではないためである。
「bsParamSlot[0]」が5である場合、2番目のパラメータセットに対するタイムスロット位置bsParamSlot[1]は「5+1=6」と「10−3+1=8」との間の値から選ばれる必要がある。
「bsParamSlot[1]」が7であれば、「bsParamSlot[2]」は8または9になりうる。「bsParamSlot[1]」が8であれば、「bsParamSlot[2]」は9になりうる。
このため、「bsParamSlot[ps]」は、固定ビットとして表わされる代わりに、上記の特徴を用いて可変個数のビットで表わすことができる。
「bsParamSlot[ps]」をビットストリームに構成するに当たって、「ps」が0である場合、「bsParamSlot[0]」は「nBitsParamSlot(0)」に対応する数のビットにより絶対値として表わすことができる。「ps」が0よりも大きな場合、「bsParamSlot[ps]」は「nBitsParaSlot(ps)」に対応する数により絶対値として表わすことができる。ビットストリームから上記のように構成された「bsParamSlot[ps]」を読み取るとき、各データに対するビットストリームの長さ、すなわち、「nBitsParamSlot[ps]」は式18を用いて表わすことができる。
〔式18〕
Figure 0005111374
具体的に、「nBitsParamSlot[ps]」はnBitsParamSlot[0]=fb(numSlots−numParaSets+1)で表わすことができる。0<ps<numParamSetsであれば、「nBitsParamSlot[ps]」はnBitsParamSlot[ps]=fb(numSlots−numParaSets+ps−bsParamSlot[ps−1])で表わすことができる。「nBitsParamSlot[ps]」は式18を7ビットまで延長した式19を用いて決定可能である。
〔式19〕
Figure 0005111374
関数fb(x)の例について後述する。「numSlots」が15であり、かつ、「numParamSets」が3である場合、上記の関数はnBitsParamSlot「1」=fb(15−3+1−7)=3ビットを求めることができる。この場合、「bsDiffParamSlot[1]」フィールド1305は3ビットで表わすことができる。
3ビットで表わされる値が3である場合、「bsParamSlot[1]」は7+3=10となる。このため、nBitsParamSlot[2]=fb(15−3+2−10)=2ビットとなる。この場合、「bsDiffParamSlot[1]」フィールド1305は2ビットで表わすことができる。レジデュアルタイムスロットの個数がレジデュアルパラメータセットの個数と同数である場合、「bsDiffParamSlot[ps]」フィールドには0ビットが割り当てられる。換言すると、パラメータセットが適用されるタイムスロットの位置を表わすための追加情報が不要である。
このため、「bsParamSlot[ps]」に対するビットの個数は可変的に決定可能である。「bsParamSlot[ps]」に対するビットの個数はデコーダにおいて関数fb(x)を用いてビットストリームから読取り可能である。一部の実施形態において、関数fb(x)は関数ceil(log2(x))を含むことができる。
絶対値と差分値で表わされる「bsParamSlot[ps]」に関する情報をデコーダにおいてビットストリームから読み取るとき、先ず、ビットストリームから「bsParamSlot[0]」が読み取られてから、0<ps<numParamSetsに対する「bsDiffParamSlot[ps]」が読み取られる。そして、0≦ps<numParamSets間隔に対する「bsParamSlot[ps]」は「bsParamSlot[0]」と「bsDiffParamSlot[ps]」を用いて求めることができる。例えば、図13Bに示すように、「bsParamSlot[ps]」は、「bsParamSlot[ps−1]」に「bsDiffParamSlot[ps]+1」を加えて求めることができる。
図13Cは、本発明の一実施形態により、パラメータセットが適用されるタイムスロットの位置情報を示すシンタックスを示す図である。複数のパラメータセットが存在する場合、複数のパラメータセットに対する複数の「bsParamSlots」1307は少なくとも一つのグループとして表わすことができる。
「bsParamSlots」1307の個数が(kN+L)であり、かつ、「bsParamSlots」1307のそれぞれを表わすのにQビットが必要となる場合、「bsParamSlots」1307は以下のグループとして表わすことができる。この場合、「k」と「N」は「0」ではない任意の整数であり、「L」は0≦L<Nを満たす任意の整数である。
グループ化方法は、N個の「bsParamSlots」1307を束ねてk個のグループを生成するステップと、最後のL個の「bsParamSlots」1307を束ねて最終グループを生成するステップと、を含む。k個のグループはMビットで表わすことができ、最終グループはpビットで表わすことができる。この場合、Mビットが、好ましくは、「bsParamSlots」1307のそれぞれをグループ化することなく表わす場合に用いられるN*Qビットよりも小さい。Pビットが、好ましくは、「bsParamSlots」1307のそれぞれをグループ化することなく表わす場合に用いられるL*Qビット以下である。
例えば、2つのパラメータセットに対する1対の「bsParamSlots」1307がそれぞれd1とd2であるとする。d1とd2がそれぞれ5個の値を有する場合、d1とd2のそれぞれを表わすのに3ビットが必要となる。この場合、たとえ3ビットは8個の値を表わすことができるとしても、実質的には5個の値が必要となる。このため、d1とd2のそれぞれは3個の余分を有する。しかしながら、d1とd2を束ねてグループとして表わす場合には、6ビット(=3ビット+3ビット)の代わりに5ビットが用いられる。具体的に、d1とd2との全ての組み合わせは25個(=5*5)のタイプを有するため、d1とd2のグループは5ビットで表わすことができる。5ビットは32個の値を表わすことができるため、グループ化表現の場合、7個の余分が生成される。しかしながら、d1とd2をグループ化して表わす場合、その余分はd1とd2をそれぞれ3ビットで表わす場合の余分よりも小さい。
グループを構成するとき、グループに関するデータは、初期値に対する「bsParamSlot[0]」と、2番目以上の値に対する「bsParamSlot[ps]」との組間の差分値を用いて構成可能である。
グループを構成するとき、パラメータセットの個数が1であれば、グループ化することなくビットが直接的に割当て可能であり、パラメータセットの個数が2以上であれば、グループ化を完了してからビットが割当て可能である。
図14は、本発明の一実施形態によるエンコーディング方法のフローチャートである。以下、本発明によるオーディオ信号のエンコーディング方法及びエンコーダの動作を説明する。
まず、1枚の空間フレームにおいてタイムスロットの総数numSlotsとオーディオ信号のパラメータ帯域の総数numBandsが決定される(S1401)。
そして、チャンネル変換モジュールに適用されるパラメータの個数及び/またはレジデュアル信号が決定される(S1402)。
OTTボックスがLFEチャンネルモードを有する場合、OTTボックスに適用されるパラメータ帯域の個数は別途に決定される。
OTTボックスがLFEチャンネルモードを有さない場合、OTTボックスに適用されるパラメータ帯域の個数として「numBands」が用いられる。
続けて、空間フレームのタイプが判定される。この場合、空間フレームは固定フレームタイプと可変フレームタイプとに大別できる。
空間フレームが可変フレームタイプである場合(S1403)、1枚の空間フレーム内において用いられるパラメータセットの個数が決定される(S1406)。この場合、パラメータセットはタイムスロット単位でチャンネル変換モジュールに適用可能である。
続けて、パラメータセットが適用されるタイムスロットの位置が決定される(S1407)。この場合、パラメータセットが適用されるタイムスロットの位置は絶対値と差分値として表わすことができる。例えば、最初のパラメータセットが適用されるタイムスロットの位置は絶対値として表わすことができ、2番目以上のパラメータセットが適用されるタイムスロットの位置は以前のタイムスロットの位置からの差分値として表わすことができる。この場合、パラメータセットが適用されるタイムスロットの位置は可変個数のビットとして表わすことができる。
具体的に、最初のパラメータセットが適用されるタイムスロットの位置は、タイムスロットの総数とパラメータセットの総数を用いて算出されるビットの個数で表わすことができる。2番目以上のパラメータセットが適用されるタイムスロットの位置は、タイムスロットの総数と、パラメータセットの総数と、以前のパラメータセットが適用されるタイムスロットの位置を用いて算出されるビットの個数で表わすことができる。
空間フレームが固定フレームタイプである場合、1枚の空間フレームに用いられたパラメータセットの個数が決定される(S1404)。この場合、パラメータセットが適用されるタイムスロットの位置は予め設定された規則を用いて決定される。例えば、パラメータセットが適用されるタイムスロットの位置は、以前のパラメータセットが適用されるタイムスロットの位置から等間隔を有するように決定可能である(S1405)。
続けて、ダウンミキシング部と空間生成部は、先に決定されたタイムスロットの総数と、パラメータ帯域の総数と、チャンネル変換部に適用されるべきパラメータ帯域の総数と、1枚の空間フレームにおけるパラメータセットの総数と、パラメータセットが適用されるタイムスロットの位置情報を用いて、ダウンミックス信号と空間情報をそれぞれ生成する(S1408)。
最後に、マルチプレクシング部は、ダウンミックス信号と空間情報を含むビットストリームを生成して(S1409)、この生成されたビットストリームをデコーダに転送する(S1409)。
図15は、本発明の一実施形態によるデコーディング方法のフローチャートである。以下、本発明によるオーディオ信号のデコーディング方法及びデコーダの動作を説明する。
まず、デコーダは、オーディオ信号のビットストリームを受信する(S1501)。デマルチプレクシング部は、受信されたビットストリームからダウンミックス信号と空間情報信号とを分離する(S1502)。続けて、空間情報信号デコーディング部は、空間情報信号の構成情報から、1枚の空間フレームにおけるタイムスロットの総数、パラメータ帯域の総数及びチャンネル変換モジュールに適用されるパラメータ帯域の個数に関する情報を抽出する(S1503)。
空間フレームが可変フレームタイプである場合(S1504)、1枚の空間フレームにおけるパラメータセットの個数とパラメータセットが適用されるタイムスロットの位置情報が空間フレームから抽出される(S1505)。タイムスロットの位置情報は、固定個数のビットまたは可変個数のビットで表わすことができる。この場合、最初のパラメータセットが適用されるタイムスロットの位置情報は絶対値として表わすことができ、2番目以上のパラメータセットが適用されるタイムスロットの位置情報は差分値として表わすことができる。2番目以上のパラメータセットが適用されるタイムスロットの実際の位置情報は、以前のパラメータセットが適用されたタイムスロットの位置情報に差分値を加えて求められる。
最後に、抽出された情報を用いてダウンミックス信号がマルチチャンネルオーディオ信号に変換される(S1506)。
この明細書に記載の実施形態は、従来のオーディオコーディング方式に比べて種々のメリットを与える。
最初に、マルチチャンネルオーディオ信号のコーディングにおいて、パラメータセットが適用されるタイムスロットの位置を可変個数のビットで表わすことにより、転送データ量を低減することができる。
第二に、最初のパラメータセットが適用されるタイムスロットの位置を絶対値で表わし、2番目以上のパラメータセットが適用されるタイムスロットの位置を差分値で表わすことにより、転送データ量を低減することができる。
第三に、OTTボックス及び/またはTTTボックスなどに適用されるパラメータ帯域の個数を固定個数のビットまたは可変個数のビットで表わすことにより、転送データ量を低減することができる。この場合、パラメータセットが適用されるタイムスロットの位置は、上述した原理を用いて表わすことができ、ここで、パラメータセットはパラメータ帯域の個数範囲内に存在する。
図16は、図1〜図15に基づき説明されたオーディオエンコーダ/デコーダを実現する装置構造1600の一例を示すブロック図である。この装置構造1600は、パソコン、サーバコンピュータ、家電装置、移動電話、PDA、電子タブレット、テレビシステム、テレビセットトップボックス、ゲームコンソール、媒体再生器、音楽再生器、ナビゲーションシステム及びオーディオ信号をデコーディング可能な任意のその他の装置を含む種々の装置に適用可能であるが、これらに制限されるものではない。これらの装置の一部はハードウェアとソフトウェアとの組み合わせを用いて変更された構造を実現することができる。
この構造1600は、1以上のプロセッサ1602(例えば、PowerPC(登録商標)、Intel Pentium(登録商標) 4など)と、1以上のディスプレイ装置1604(例えば、CRT、LCDなど)と、オーディオサブシステム1606(例えば、オーディオハードウェア/ソフトウェア)と、1以上のネットワークインタフェース1608(例えば、Ethernet(登録商標)、FireWire(登録商標)、USBなど)と、入力装置1610(例えば、キーボード、マウスなど)と、1以上のコンピュータにて読取り可能な媒体1612(例えば、RAM、ROM、SDRAM、ハードディスク、光ディスク、フラッシュメモリなど)と、を備える。これらの構成要素は1以上のバス1614(例えば、EISA、PCI、PCI Expressなど)を介して通信し、データをやり取りすることができる。
「コンピュータにて読取り可能な媒体」という用語は、プロセッサ1602に実行用命令語を与える任意の媒体をいい、不揮発性媒体(例えば、光ディスクや磁気ディスクなど)、揮発性媒体(例えば、メモリーなど)及び転送媒体を含むが、これらに制限されるものではない。転送媒体は、同軸ケーブル、銅配線及び光ファイバを含むが、これらに制限されるものではない。また、転送媒体は、音響波、光波または無線周波数波形の形態が採用可能である。
コンピュータにて読取り可能な媒体1612は、オペレーティングシステム1616(例えば、MacOS(登録商標)、Windows(登録商標)、Linux(登録商標)など)と、ネットワーク通信モジュール1618と、オーディオコーデック1620と、1以上のアプリケーション1622と、をさらに含む。
オペレーティングシステム1616は、マルチユーザ、マルチプロセッシング、マルチタスキング、マルチスレッディング、リアルタイムなどであってもよい。オペレーティングシステム1616は、入力装置1610から入力を認識し、ディスプレイ装置1604とサブシステム1606に出力を送り、コンピュータにて読取り可能な媒体1612(例えば、メモリーまたは記録装置など)の上にファイルとディレクトリを保持し、周辺装置(例えば、ディスクドライブ、プリンタなど)を制御し、1以上のバス1614上におけるトラフィックを管理する基本的なタスクを行うが、これらに制限されるものではない。
ネットワーク通信モジュール1618は、ネットワーク接続を確立して保持する種々の構成要素(例えば、TCP/IP、HTTP、Ethernet(登録商標)などの通信プロトコルを実現するソフトウェアなど)を含む。ネットワーク通信モジュール1618は、装置構造1600のオペレーターに情報(例えば、オーディオコンテンツなど)を探索してネットワーク(例えば、インターネットなど)を検索可能にするブラウザーを含むことができる。
オーディオコーデック1620は、図1〜図15に基づき説明したエンコーディング及び/またはデコーディングプロセスの全部または一部を実現する役割を果たす。一部の実施形態において、オーディオコーデックはハードウェア(例えば、プロセッサ1602、オーディオサブシステム1606など)と連動してこの明細書に記載の本発明によりオーディオ信号をエンコーディング及び/またはデコーディングすることをはじめとしてオーディオ信号を処理する。
アプリケーション1622は、オーディオコンテンツに関連する任意のソフトウェアを含むことができ、オーディオコンテンツは、媒体再生器、音楽再生器(例えば、MP3再生器など)、移動電話アプリケーション、PDA、テレビシステム、セットトップボックスなどにおいてエンコーディング及び/またはデコーディングされるが、これらに制限されるものではない。一実施形態において、オーディオコーデックはアプリケーションサービスプロバイダーがネットワーク(例えば、インターネットなど)を介してエンコーディング/デコーディングサービスを提供するのに使用可能である。
以上の説明においては、説明の目的から、本発明の完全な理解を提供するための種々の特定の詳細について開示している。しかしながら、当業者であれば、本発明がこれらの特定の詳細なしにも実行可能であるということが理解できるであろう。なお、本発明を不明にすることを防ぐために、構造及び装置はブロック図として示してある。
特に、当業者であれば、他の構造及びグラフィック環境が使用可能であり、上述とは異なるグラフィックツールと製品を用いて本発明が実現可能であるという点が理解できるであろう。特に、クライアント/サーバアプローチは本発明のダッシュボード機能を与える構造の一例に過ぎず、当業者であれば、クライアント/サーバアプローチではない他のものが使用可能であるという点が理解できるであろう。
詳細な説明の一部は、コンピュータメモリ内におけるデータビットに対する演算のアルゴリズムとシンボル表現で実現されている。これらのアルゴリズム説明と表現は、データ処理分野の当業者が他の当業者に自分の作業の本質を最も有効に伝えるための手段である。一般的に、そしてこの明細書において、アルゴリズムは所望の結果に至るステップの一連のシーケンスとして認識される。これらのステップは物理量の操作を必要とする。一般に、必ずしもその限りではないが、このような量は貯蔵されたり、転送されたり、組み合わせられたり、比較されたり、他に操作可能な電気信号または磁気信号の形態をとる。主として、通常の用途の理由から、これらの信号をビット、値、エレメント、シンボル、キャラクタ、述語、ナンバなどと呼んだ方が便利である。
しかしながら、これらの用語及びこれに類似する用語はあらゆる適切な物理量に関連するものであり、単にこれらの量に適用される便利な命名に過ぎない。論議から明らかなように、特に断わりのない限り、この明細書において、「処理」または「コンピューティング」または「算出」または「決定」または「表示」などの用語を用いるということは、コンピュータシステムのレジスターとメモリ内において物理(電気)量として表わされるデータを操作し、これをコンピュータシステムメモリまたはレジスターや他の情報の貯蔵、転送または表示装置において物理量で表わされるデータに変換するコンピュータシステムまたはこれに類似する電子計算装置のアクション及び処理を言う。
本発明はこのような動作を行う装置に関する。この装置は、求められる目的により特別に構成可能であるか、あるいは、コンピュータに格納されたコンピュータプログラムにより選択的に活性化されるか、あるいは、再構成される汎用のコンピュータを含むことができる。このようなコンピュータプログラムは、フロッピーディスク、光ディスク、CD−ROM、磁気光ディスクをはじめとする任意タイプのディスク、読込み専用メモリー(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カードまたは光カード、または電子的な命令語を格納するのに適した任意タイプの媒体を含み、コンピュータシステムに接続されるコンピュータ記憶媒体に格納可能である。
明細書に記載のアルゴリズムとモジュールが元々任意の特定のコンピュータや他の装置に関するものではない。この明細書に記載の技術によるプログラムに種々の汎用システムが使用可能であり、方法ステップを行う上でより特定化した装置を構成することが便利になることがある。このような種々のシステムに必要となる構造については、後述する。この明細書に記載の本発明の教示事項を実現するために種々のプログラミング言語が使用可能である。また、当業者にとって自明であるように、本発明のモジュール、特徴、属性、方法論及びその他の態様は、ソフトウェア、ハードウェア、ファームウェアまたはこれらの3種類に対する任意の組み合わせにより実現可能である。もちろん、本発明の構成要素がソフトウェアとして実現される場合、これらの構成要素は独自のプログラムとして、より大きなプログラムの一部として、複数の個別プログラムとして、静的にまたは動的にリンクされるライブラリーとして、カーネルロード型モジュールとして、デバイスドライバーとして実現されるか、あるいは、コンピュータプログラミングの分野における当業者に現在周知の、または、将来に周知になる予定のあらゆる任意の方式により実現可能である。また、本発明が任意の特定のオペレーティングシステムや環境において実現されることに制限されることはない。
当業者には本発明の思想または範囲から逸脱することなく、この明細書に記載の実施形態に種々の変形及び変更がなされうるということは自明であろう。よって、本発明は、このような変形及び変更が特許請求の範囲及びその等価物の範囲内にあるものである限り、開示された実施形態のこのような変形及び変更をいずれもカバーするものである。
本発明の一実施形態により空間情報を生成する原理を示す図である。 本発明の一実施形態によりオーディオ信号をエンコーディングするエンコーダのブロック図である。 本発明の一実施形態によりオーディオ信号をデコーディングするデコーダのブロック図である。 本発明の一実施形態によるデコーダのアップミキシング部に含まれるチャンネル変換部のブロック図である。 本発明の一実施形態によりオーディオ信号のビットストリームを構成する方法を説明するブロック図である。 本発明の一実施形態よる、パラメータセット、タイムスロット及びパラメータ帯域の関係を説明するための図面である。 本発明の一実施形態よる、パラメータセット、タイムスロット及びパラメータ帯域の関係を説明するための時間/周波数グラフである。 本発明の一実施形態による空間情報信号の構成情報を表示するシンタックスを示す図である。 本発明の一実施形態による空間情報信号のパラメータ帯域の個数を示す表である。 本発明の一実施形態より、固定個数のビットとしてOTTボックスに適用されたパラメータ帯域の個数を示すシンタックスを示す図である。 本発明の一実施形態により、可変個数のビットでOTTボックスに適用されたパラメータ帯域の個数を示すシンタックスを示す図である。 本発明の一実施形態により、固定個数のビットでTTTボックスに適用されたパラメータ帯域の個数を示すシンタックスを示す図である。 本発明の一実施形態により、可変個数のビットでTTTボックスに適用されたパラメータ帯域の個数を示すシンタックスを示す図である。 本発明の一実施形態による空間拡張フレームのための空間拡張構成情報のシンタックスを示す図である。 本発明の一実施形態により空間拡張フレームにレジデュアル信号が含まれる場合、レジデュアル信号のための空間拡張構成情報のシンタックスを示す図である。 本発明の一実施形態により空間拡張フレームにレジデュアル信号が含まれる場合、レジデュアル信号のための空間拡張構成情報のシンタックスを示す図である。 本発明の一実施形態によりレジデュアル信号のためのパラメータ帯域の個数を示す方法のためのシンタックスを示す図である。 本発明の一実施形態よりノンガイドコーディングを用いるデコーディング装置のブロック図である。 本発明の一実施形態によりパラメータ帯域の個数をグループで示す方法を示す図である。 本発明の一実施形態による空間フレームの構成情報のシンタックスを示す図である。 本発明の一実施形態によりパラメータセットが適用されるタイムスロットの位置情報のシンタックスを示す図である。 本発明の一実施形態により絶対値及び差分値としてパラメータセットが適用されるタイムスロットの位置情報を表わすためのシンタックスを示す図である。 本発明の一実施形態によりパラメータセットがグループとして適用されるタイムスロットの複数の位置情報を示す図である。 本発明の一実施形態によるエンコーディング方法のフローチャートである。 本発明の一実施形態によるデコーディング方法のフローチャートである。 図1〜図15に基づき説明されるエンコーディング及びデコーディング処理を実現するための装置構造を示すブロック図である。

Claims (4)

  1. 少なくとも1つのフレームを含むオーディオ信号を受信するステップであって、該フレームは少なくとも1つのタイムスロットと少なくとも1つのパラメータセットを有し、該パラメータセットは、マルチチャンネルオーディオ信号を生成するため、1つのタイムスロットに適用される1つ以上の空間パラメータを有し、前記オーディオ信号はダウンミックス信号を含むステップと、
    パラメータセットが適用されるタイムスロットを示すタイムスロット情報を識別するために、前記オーディオ信号からタイムスロットの個数とパラメータセットの個数を抽出するステップと、
    前記タイムスロットの個数、前記パラメータセットの個数、及び以前のパラメータセットに関連した以前のタイムスロット情報により変動する前記タイムスロット情報のビット長を決定するステップと、
    前記ビット長に基づいて、前記タイムスロット情報を抽出するステップと、
    前記タイムスロット情報に対応する前記タイムスロットに前記パラメータセットを適用して、前記ダウンミックス信号を前記マルチチャンネルオーディオ信号に変換するステップと、
    を有し、
    前記タイムスロット情報の個数は前記パラメータセットの個数と等しく、前記タイムスロット情報は、第1のパラメータセットが適用されるタイムスロットを示すための絶対値、及び該第1のパラメータセットの後に続くパラメータセットが適用されるタイムスロットを示すための差分値を有し、
    前記差分値は、前記以前のタイムスロット情報と前記後に続くパラメータセットが適用されるタイムスロットとの間の差分を示し、前記以前のタイムスロット情報は、前記後に続くパラメータセットの以前のパラメータセットが適用されるタイムスロットを示し、
    前記絶対値は、前記パラメータセットの個数及び前記タイムスロットの個数を用いて計算された第1の最大範囲内で決定され、
    前記差分値は、前記以前のタイムスロット情報に従い計算された第2の最大範囲内で決定される、オーディオ信号のデコーディング方法。
  2. 前記タイムスロット情報は、パラメータセットが適用されるタイムスロットの位置を示す位置情報である、請求項1に記載のオーディオ信号のデコーディング方法。
  3. オーディオ信号から、ダウンミックス信号及び空間情報を分離するデマルチプレクサであって該空間情報は、少なくとも1つのタイムスロットと少なくとも1つのパラメータセットを有する少なくとも1つのフレームを含み、該パラメータセットは、マルチチャンネルオーディオ信号を生成するため、1つのタイムスロットに適用される1つ以上の空間パラメータを有する、デマルチプレクサと、
    前記ダウンミックス信号をデコーディングするダウンミックス信号デコーディング部と、
    パラメータセットが適用されるタイムスロットを示すタイムスロット情報を識別するために、前記オーディオ信号からタイムスロットの個数パラメータセットの個数を抽出し、前記タイムスロットの個数、前記パラメータセットの個数、及び以前のパラメータセットに関連した以前のタイムスロット情報により変動する前記タイムスロット情報のビット長を決定し、該ビット長に基づいて前記タイムスロット情報を抽出する空間情報デコーディング部と、
    前記タイムスロット情報に対応する前記タイムスロットに前記パラメータセットを適用して、前記ダウンミックス信号から前記マルチチャンネル信号を生成するアップミキシング部と、
    を有し、
    前記タイムスロット情報の個数は前記パラメータセットの個数と等しく、前記タイムスロット情報は、第1のパラメータセットが適用されるタイムスロットを示すための絶対値、及び該第1のパラメータセットの後に続くパラメータセットが適用されるタイムスロットを示すための差分値を有し、
    前記差分値は、前記以前のタイムスロット情報と前記後に続くパラメータセットが適用されるタイムスロットとの間の差分を示し、前記以前のタイムスロット情報は、前記後に続くパラメータセットの以前のパラメータセットが適用されるタイムスロットを示し、
    前記絶対値は、前記パラメータセットの個数及び前記タイムスロットの個数を用いて計算された第1の最大範囲内で決定され、
    前記差分値は、前記以前のタイムスロット情報に従い計算された第2の最大範囲内で決定される、オーディオ信号のデコーディング装置。
  4. 前記タイムスロット情報は、パラメータセットが適用されるタイムスロットの位置を示す位置情報である、請求項3に記載のオーディオ信号のデコーディング装置。
JP2008528939A 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 Active JP5111374B2 (ja)

Applications Claiming Priority (25)

Application Number Priority Date Filing Date Title
US71211905P 2005-08-30 2005-08-30
US60/712,119 2005-08-30
US71920205P 2005-09-22 2005-09-22
US60/719,202 2005-09-22
US72300705P 2005-10-04 2005-10-04
US60/723,007 2005-10-04
US72622805P 2005-10-14 2005-10-14
US60/726,228 2005-10-14
US72922505P 2005-10-24 2005-10-24
US60/729,225 2005-10-24
KR1020060004063A KR20070025907A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
KR10-2006-0004063 2006-01-13
KR1020060004051A KR20070025903A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR20060004055 2006-01-13
KR10-2006-0004055 2006-01-13
KR1020060004057A KR20070025904A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 lfe채널의 파라미터밴드 수 비트스트림 구성방법
KR1020060004062A KR20070037974A (ko) 2005-10-04 2006-01-13 멀티채널 오디오 코딩에서 효과적인 넌가이디드 코딩의파라미터 밴드 수 비트스트림 구성방법
KR10-2006-0004051 2006-01-13
KR20060004065 2006-01-13
KR10-2006-0004057 2006-01-13
KR10-2006-0004062 2006-01-13
KR10-2006-0004065 2006-01-13
US76253606P 2006-01-27 2006-01-27
US60/762,536 2006-01-27
PCT/KR2006/003420 WO2007027050A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof

Publications (2)

Publication Number Publication Date
JP2009506371A JP2009506371A (ja) 2009-02-12
JP5111374B2 true JP5111374B2 (ja) 2013-01-09

Family

ID=43927883

Family Applications (7)

Application Number Title Priority Date Filing Date
JP2008528944A Active JP5108768B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528941A Active JP5108767B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528945A Active JP5231225B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528943A Active JP5111376B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528942A Expired - Fee Related JP5111375B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528939A Active JP5111374B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528940A Pending JP2009506372A (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Family Applications Before (5)

Application Number Title Priority Date Filing Date
JP2008528944A Active JP5108768B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528941A Active JP5108767B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528945A Active JP5231225B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528943A Active JP5111376B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2008528942A Expired - Fee Related JP5111375B2 (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008528940A Pending JP2009506372A (ja) 2005-08-30 2006-08-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Country Status (9)

Country Link
US (12) US7765104B2 (ja)
EP (7) EP1920636B1 (ja)
JP (7) JP5108768B2 (ja)
AT (2) ATE453908T1 (ja)
AU (1) AU2006285538B2 (ja)
BR (1) BRPI0615114A2 (ja)
CA (1) CA2620627C (ja)
TW (2) TWI405475B (ja)
WO (7) WO2007027051A1 (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2649240A (en) * 1947-10-13 1953-08-18 Clyde L Gilbert Blank for box production
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7765104B2 (en) * 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US20080262853A1 (en) * 2005-10-20 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
WO2007078254A2 (en) * 2006-01-05 2007-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Personalized decoding of multi-channel surround sound
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090028344A1 (en) * 2006-01-19 2009-01-29 Lg Electronics Inc. Method and Apparatus for Processing a Media Signal
TWI331322B (en) * 2006-02-07 2010-10-01 Lg Electronics Inc Apparatus and method for encoding / decoding signal
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8588440B2 (en) * 2006-09-14 2013-11-19 Koninklijke Philips N.V. Sweet spot manipulation for a multi-channel signal
MX2009003564A (es) * 2006-10-16 2009-05-28 Fraunhofer Ges Forschung Aparato y metodo para transformacion de parametro multicanal.
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
US8463413B2 (en) 2007-03-09 2013-06-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR20080082916A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
BRPI0809940A2 (pt) * 2007-03-30 2014-10-07 Panasonic Corp Dispositivo de codificação e método de codificação
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
CN101836249B (zh) 2007-09-06 2012-11-28 Lg电子株式会社 解码音频信号的方法和装置
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
BRPI0806228A8 (pt) * 2007-10-16 2016-11-29 Panasonic Ip Man Co Ltd Dispositivo de sintetização de fluxo, unidade de decodificação e método
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8645400B1 (en) 2008-08-01 2014-02-04 Marvell International Ltd. Flexible bit field search method
TWI475896B (zh) 2008-09-25 2015-03-01 Dolby Lab Licensing Corp 單音相容性及揚聲器相容性之立體聲濾波器
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
JP5813094B2 (ja) 2010-04-09 2015-11-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
EP2862165B1 (en) * 2012-06-14 2017-03-08 Dolby International AB Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
CN104641414A (zh) 2012-07-19 2015-05-20 诺基亚公司 立体声音频信号编码器
WO2014013070A1 (en) 2012-07-19 2014-01-23 Thomson Licensing Method and device for improving the rendering of multi-channel audio signals
KR102056589B1 (ko) 2013-01-21 2019-12-18 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
ES2640815T3 (es) * 2013-05-24 2017-11-06 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
US9136233B2 (en) * 2013-06-06 2015-09-15 STMicroelctronis (Crolles 2) SAS Process for fabricating a three-dimensional integrated structure with improved heat dissipation, and corresponding three-dimensional integrated structure
US9140959B2 (en) * 2013-07-12 2015-09-22 Canon Kabushiki Kaisha Dissipative soliton mode fiber based optical parametric oscillator
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN110648674B (zh) * 2013-09-12 2023-09-22 杜比国际公司 多声道音频内容的编码
CN105659320B (zh) 2013-10-21 2019-07-12 杜比国际公司 音频编码器和解码器
BR112016008817B1 (pt) * 2013-10-21 2022-03-22 Dolby International Ab Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
US10547825B2 (en) * 2014-09-22 2020-01-28 Samsung Electronics Company, Ltd. Transmission of three-dimensional video
US11205305B2 (en) 2014-09-22 2021-12-21 Samsung Electronics Company, Ltd. Presentation of three-dimensional video
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN107636756A (zh) * 2015-04-10 2018-01-26 汤姆逊许可公司 用于编码多个音频信号的方法和设备以及用于利用改进的分离解码多个音频信号的混合的方法和设备
US10725248B2 (en) * 2017-01-30 2020-07-28 Senko Advanced Components, Inc. Fiber optic receptacle with integrated device therein incorporating a behind-the-wall fiber optic receptacle
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN110192246B (zh) * 2017-06-09 2023-11-21 谷歌有限责任公司 对基于音频的计算机程序输出的修改
US10652170B2 (en) 2017-06-09 2020-05-12 Google Llc Modification of audio-based computer program output
US11049218B2 (en) 2017-08-11 2021-06-29 Samsung Electronics Company, Ltd. Seamless image stitching
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
ES2980822T3 (es) * 2019-06-14 2024-10-03 Fraunhofer Ges Forschung Codificación y decodificación de parámetros
CN112954581B (zh) * 2021-02-04 2022-07-01 广州橙行智动汽车科技有限公司 一种音频播放方法、系统及装置

Family Cites Families (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6096079A (ja) 1983-10-31 1985-05-29 Matsushita Electric Ind Co Ltd 多値画像の符号化方法
US4661862A (en) 1984-04-27 1987-04-28 Rca Corporation Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions
US4621862A (en) * 1984-10-22 1986-11-11 The Coca-Cola Company Closing means for trucks
JPS6294090A (ja) 1985-10-21 1987-04-30 Hitachi Ltd 符号化装置
US4725885A (en) 1986-12-22 1988-02-16 International Business Machines Corporation Adaptive graylevel image compression system
JPH0793584B2 (ja) * 1987-09-25 1995-10-09 株式会社日立製作所 符号化装置
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5243686A (en) 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5221232A (en) * 1989-01-12 1993-06-22 Zero-Max, Inc. Flexible disc-like coupling element
AU643677B2 (en) 1989-01-27 1993-11-25 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
DE3943880B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US6289308B1 (en) * 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
GB8921320D0 (en) 1989-09-21 1989-11-08 British Broadcasting Corp Digital video coding
JPH03250931A (ja) * 1990-02-28 1991-11-08 Iwatsu Electric Co Ltd 移動体通信の時間分割通信方法
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
DE69232251T2 (de) * 1991-08-02 2002-07-18 Sony Corp., Tokio/Tokyo Digitaler Kodierer mit dynamischer Quantisierungsbitverteilung
JPH05219582A (ja) * 1992-02-06 1993-08-27 Nec Corp ディジタル音声交換装置
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP3104400B2 (ja) 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3123286B2 (ja) 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
US5563661A (en) * 1993-04-05 1996-10-08 Canon Kabushiki Kaisha Image processing apparatus
US5511003A (en) * 1993-11-24 1996-04-23 Intel Corporation Encoding and decoding video signals using spatial filtering
US6125398A (en) * 1993-11-24 2000-09-26 Intel Corporation Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission
US5640159A (en) * 1994-01-03 1997-06-17 International Business Machines Corporation Quantization method for image data compression employing context modeling algorithm
RU2158970C2 (ru) 1994-03-01 2000-11-10 Сони Корпорейшн Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления
JP3498375B2 (ja) * 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08130649A (ja) * 1994-11-01 1996-05-21 Canon Inc データ処理装置
KR100209877B1 (ko) * 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JP3371590B2 (ja) 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JP3484832B2 (ja) 1995-08-02 2004-01-06 ソニー株式会社 記録装置、記録方法、再生装置及び再生方法
KR100219217B1 (ko) 1995-08-31 1999-09-01 전주범 무손실 부호화 장치
US5723495A (en) * 1995-11-16 1998-03-03 The University Of North Carolina At Chapel Hill Benzamidoxime prodrugs as antipneumocystic agents
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US6047027A (en) 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
GB9603454D0 (en) 1996-02-19 1996-04-17 Ea Tech Ltd Electric motor starting circuit
US6399760B1 (en) * 1996-04-12 2002-06-04 Millennium Pharmaceuticals, Inc. RP compositions and therapeutic and diagnostic uses therefor
GB9609282D0 (en) * 1996-05-03 1996-07-10 Cambridge Display Tech Ltd Protective thin oxide layer
EP0827312A3 (de) 1996-08-22 2003-10-01 Marconi Communications GmbH Verfahren zur Änderung der Konfiguration von Datenpaketen
US5912636A (en) 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
US5893066A (en) 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6639945B2 (en) 1997-03-14 2003-10-28 Microsoft Corporation Method and apparatus for implementing motion detection in video compression
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6356639B1 (en) 1997-04-11 2002-03-12 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
DE69800480T2 (de) * 1997-09-17 2001-06-13 Matsushita Electric Industrial Co., Ltd. Optische Platte, Videodatenschnittgeràt, Rechnerlesbares Aufzeichnungmedium das ein Schnittprogramm speichert, Wiedergabegerät für die optische Platte und rechnerlesbares Aufzeichnungsmedium das ein Wiedergabeprogramm speichert
US6130418A (en) 1997-10-06 2000-10-10 U.S. Philips Corporation Optical scanning unit having a main lens and an auxiliary lens
US5966688A (en) * 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
JP2005063655A (ja) 1997-11-28 2005-03-10 Victor Co Of Japan Ltd オーディオ信号のエンコード方法及びデコード方法
JP3022462B2 (ja) 1998-01-13 2000-03-21 興和株式会社 振動波の符号化方法及び復号化方法
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
JPH11282496A (ja) 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6339760B1 (en) 1998-04-28 2002-01-15 Hitachi, Ltd. Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
EP1034540B1 (en) * 1998-06-10 2007-02-28 Koninklijke Philips Electronics N.V. A method for storing audio-centered information using higher level audio files and lower level audio item indicating files, a device for reading and/or storing such information and a record carrier
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
MY118961A (en) * 1998-09-03 2005-02-28 Sony Corp Beam irradiation apparatus, optical apparatus having beam irradiation apparatus for information recording medium, method for manufacturing original disk for information recording medium, and method for manufacturing information recording medium
US6298071B1 (en) * 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6284759B1 (en) * 1998-09-30 2001-09-04 Neurogen Corporation 2-piperazinoalkylaminobenzo-azole derivatives: dopamine receptor subtype specific ligands
US6553147B2 (en) 1998-10-05 2003-04-22 Sarnoff Corporation Apparatus and method for data partitioning to improving error resilience
US6556685B1 (en) * 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6208276B1 (en) 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
US6631352B1 (en) * 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
US6522342B1 (en) * 1999-01-27 2003-02-18 Hughes Electronics Corporation Graphical tuning bar for a multi-program data stream
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
DE10007148C2 (de) * 1999-02-17 2003-06-18 Advantest Corp Hochgeschwindigkeits-Wellenformdigitalisierer mit einer Phasenkorrekturvorrichtung und Verfahren zur Phasenkorrektur
MY149792A (en) * 1999-04-07 2013-10-14 Dolby Lab Licensing Corp Matrix improvements to lossless encoding and decoding
JP3323175B2 (ja) 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6421467B1 (en) 1999-05-28 2002-07-16 Texas Tech University Adaptive vector quantization/quantizer
KR100307596B1 (ko) 1999-06-10 2001-11-01 윤종용 디지털 오디오 데이터의 무손실 부호화 및 복호화장치
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
KR20010001991U (ko) 1999-06-30 2001-01-26 정몽규 토잉 브라켓과 토잉 후크의 결합구조
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
GB2359967B (en) * 2000-02-29 2004-05-12 Virata Ltd Qamd
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6937592B1 (en) * 2000-09-01 2005-08-30 Intel Corporation Wireless communications system that supports multiple modes of operation
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20040244056A1 (en) * 2001-02-21 2004-12-02 Lorenz Kim E. System and method for providing direct, context-sensitive customer support in an interactive television system
JP4008244B2 (ja) 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP2002335230A (ja) 2001-05-11 2002-11-22 Victor Co Of Japan Ltd 音声符号化信号の復号方法、及び音声符号化信号復号装置
US20020183010A1 (en) * 2001-06-05 2002-12-05 Catreux Severine E. Wireless communication systems with adaptive channelization and link adaptation
JP2003005797A (ja) 2001-06-21 2003-01-08 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
AU2002343151A1 (en) 2001-11-23 2003-06-10 Koninklijke Philips Electronics N.V. Perceptual noise substitution
KR100480787B1 (ko) 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
BR0206783A (pt) * 2001-11-30 2004-02-25 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal, corrente de bits que representa um sinal codificado, meio de armazenagem, método e decodificador para decodificar uma corrente de bits que representa um sinal codificado, transmissor, receptor, e, sistema
TW510142B (en) * 2001-12-14 2002-11-11 C Media Electronics Inc Rear-channel sound effect compensation device
TW569550B (en) 2001-12-28 2004-01-01 Univ Nat Central Method of inverse-modified discrete cosine transform and overlap-add for MPEG layer 3 voice signal decoding and apparatus thereof
KR100746321B1 (ko) * 2002-01-18 2007-08-03 가부시끼가이샤 도시바 동화상 부호화방법 및 장치와 동화상 복호화방법 및 장치
JP2003233395A (ja) 2002-02-07 2003-08-22 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP4039086B2 (ja) * 2002-03-05 2008-01-30 ソニー株式会社 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US8284844B2 (en) * 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
WO2003085644A1 (en) 2002-04-11 2003-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
EP1523862B1 (en) 2002-07-12 2007-10-31 Koninklijke Philips Electronics N.V. Audio coding
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
US7555434B2 (en) 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
EP1527655B1 (en) 2002-08-07 2006-10-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP2004120217A (ja) 2002-08-30 2004-04-15 Canon Inc 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
TW567466B (en) 2002-09-13 2003-12-21 Inventec Besta Co Ltd Method using computer to compress and encode audio data
WO2004028142A2 (en) 2002-09-17 2004-04-01 Vladimir Ceperkovic Fast codec with high compression ratio and minimum required resources
TW549550U (en) 2002-11-18 2003-08-21 Asustek Comp Inc Key stroke mechanism with two-stage touching feeling
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
US7293217B2 (en) * 2002-12-16 2007-11-06 Interdigital Technology Corporation Detection, avoidance and/or correction of problematic puncturing patterns in parity bit streams used when implementing turbo codes
US6873559B2 (en) 2003-01-13 2005-03-29 Micron Technology, Inc. Method and apparatus for enhanced sensing of low voltage memory
JP2004220743A (ja) 2003-01-17 2004-08-05 Sony Corp 情報記録装置及び情報記録制御方法、並びに情報再生装置及び情報再生制御方法
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
US7787632B2 (en) 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
US20040199276A1 (en) * 2003-04-03 2004-10-07 Wai-Leong Poon Method and apparatus for audio synchronization
PL1621047T3 (pl) * 2003-04-17 2007-09-28 Koninl Philips Electronics Nv Generowanie sygnału audio
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP4019015B2 (ja) 2003-05-09 2007-12-05 三井金属鉱業株式会社 ドアロック装置
JP2005086486A (ja) * 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
PL1683133T3 (pl) * 2003-10-30 2007-07-31 Koninl Philips Electronics Nv Kodowanie lub dekodowanie sygnału audio
US20050137729A1 (en) 2003-12-18 2005-06-23 Atsuhiro Sakurai Time-scale modification stereo audio signals
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
JP2005202248A (ja) 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050174269A1 (en) * 2004-02-05 2005-08-11 Broadcom Corporation Huffman decoder used for decoding both advanced audio coding (AAC) and MP3 audio
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7813571B2 (en) * 2004-04-22 2010-10-12 Mitsubishi Electric Corporation Image encoding apparatus and image decoding apparatus
JP2005332449A (ja) 2004-05-18 2005-12-02 Sony Corp 光学ピックアップ装置、光記録再生装置及びチルト制御方法
TWM257575U (en) 2004-05-26 2005-02-21 Aimtron Technology Corp Encoder and decoder for audio and video information
SE0401408D0 (sv) * 2004-06-02 2004-06-02 Astrazeneca Ab Diameter measuring device
JP2006012301A (ja) * 2004-06-25 2006-01-12 Sony Corp 光記録再生方法、光ピックアップ装置、光記録再生装置、光記録媒体とその製造方法及び半導体レーザ装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP2006120247A (ja) 2004-10-21 2006-05-11 Sony Corp 集光レンズ及びその製造方法、これを用いた露光装置、光学ピックアップ装置及び光記録再生装置
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7765104B2 (en) 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
KR20070025905A (ko) 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Also Published As

Publication number Publication date
US7783494B2 (en) 2010-08-24
ATE453908T1 (de) 2010-01-15
AU2006285538B2 (en) 2011-03-24
JP5111375B2 (ja) 2013-01-09
EP1920636A1 (en) 2008-05-14
JP2009506372A (ja) 2009-02-12
US20070201514A1 (en) 2007-08-30
US20110022397A1 (en) 2011-01-27
EP1920636B1 (en) 2009-12-30
US20110044458A1 (en) 2011-02-24
EP1938311A4 (en) 2013-02-13
EP1920635B1 (en) 2010-01-13
JP2009506373A (ja) 2009-02-12
US8060374B2 (en) 2011-11-15
US20070071247A1 (en) 2007-03-29
US20070078550A1 (en) 2007-04-05
US20110022401A1 (en) 2011-01-27
US20070091938A1 (en) 2007-04-26
TW201129968A (en) 2011-09-01
US7831435B2 (en) 2010-11-09
BRPI0615114A2 (pt) 2011-05-03
JP2009506376A (ja) 2009-02-12
WO2007055464A1 (en) 2007-05-18
JP2009506375A (ja) 2009-02-12
JP5111376B2 (ja) 2013-01-09
EP1941497B1 (en) 2019-01-16
EP1941497A4 (en) 2013-01-30
US20110044459A1 (en) 2011-02-24
CA2620627A1 (en) 2007-03-08
EP1938311A1 (en) 2008-07-02
US7792668B2 (en) 2010-09-07
WO2007027050A1 (en) 2007-03-08
US20070203697A1 (en) 2007-08-30
WO2007055460A1 (en) 2007-05-18
EP1949759A4 (en) 2010-11-17
EP1949759A1 (en) 2008-07-30
EP1938662A1 (en) 2008-07-02
JP5108767B2 (ja) 2012-12-26
EP1938662A4 (en) 2010-11-17
US8082158B2 (en) 2011-12-20
US20110085670A1 (en) 2011-04-14
US8165889B2 (en) 2012-04-24
EP1938663A4 (en) 2010-11-17
US20070094036A1 (en) 2007-04-26
US7761303B2 (en) 2010-07-20
US8103513B2 (en) 2012-01-24
WO2007027051A1 (en) 2007-03-08
TWI425843B (zh) 2014-02-01
EP1920635A1 (en) 2008-05-14
US7822616B2 (en) 2010-10-26
CA2620627C (en) 2011-03-15
JP2009506374A (ja) 2009-02-12
EP1938311B1 (en) 2018-05-02
TWI405475B (zh) 2013-08-11
EP1938663A1 (en) 2008-07-02
JP5231225B2 (ja) 2013-07-10
AU2006285538A1 (en) 2007-03-08
US8103514B2 (en) 2012-01-24
TW200715900A (en) 2007-04-16
EP1941497A1 (en) 2008-07-09
US7765104B2 (en) 2010-07-27
EP1938662B1 (en) 2016-09-28
WO2007055463A1 (en) 2007-05-18
WO2007055462A1 (en) 2007-05-18
US7783493B2 (en) 2010-08-24
JP2009506377A (ja) 2009-02-12
US20070094037A1 (en) 2007-04-26
JP2009506371A (ja) 2009-02-12
WO2007055461A1 (en) 2007-05-18
JP5108768B2 (ja) 2012-12-26
ATE455348T1 (de) 2010-01-15

Similar Documents

Publication Publication Date Title
JP5111374B2 (ja) オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP5319846B2 (ja) オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121009

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5111374

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250