JP2014160212A - オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム - Google Patents
オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム Download PDFInfo
- Publication number
- JP2014160212A JP2014160212A JP2013031476A JP2013031476A JP2014160212A JP 2014160212 A JP2014160212 A JP 2014160212A JP 2013031476 A JP2013031476 A JP 2013031476A JP 2013031476 A JP2013031476 A JP 2013031476A JP 2014160212 A JP2014160212 A JP 2014160212A
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- signal
- channel
- unit
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 65
- 230000005236 sound signal Effects 0.000 claims abstract description 41
- 230000000873 masking effect Effects 0.000 claims description 61
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000003068 static effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000002542 deteriorative effect Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 41
- 238000013139 quantization Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 16
- 238000000926 separation method Methods 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
符号化効率を低下させずに予測符号化における誤差を抑制させることが可能となるオーディオ符号化装置を提供することを目的とする。
【解決手段】
オーディオ符号化装置は、オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、当該複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置である。当該オーディオ符号化装置は、予測符号化前の当該第3チャネル信号と予測符号化後の当該第3チャネル信号の差分で規定される誤差が最小となる当該第1チャネル信号と当該第2チャネル信号にそれぞれ対応する当該予測係数を選択する選択部を有する。更に、当該オーディオ符号化装置は、当該誤差が更に小さくなる様に当該第1チャネル信号または当該第2チャネル信号を制御する制御部を有する。
【選択図】 図1
Description
図1は、一つの実施形態によるオーディオ符号化装置1の機能ブロック図である。図1に示す様に、オーディオ符号化装置1は,時間周波数変換部11、第1ダウンミックス部12、第2ダウンミックス部15、予測符号化部13、チャネル信号符号化部18、空間情報符号化部22、多重化部23を有する。
(数1)
ここでnは時間を表す変数であり、1フレームのオーディオ信号を時間方向に128等分したときのn番目の時間を表す。なお,フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。またQMF(k,n)は、時間n、周波数kの周波数信号を出力するためのQMFである。時間周波数変換部11は、QMF(k,n)を入力されたチャネルの1フレーム分のオーディオ信号に乗じることにより、そのチャネルの周波数信号を生成する。なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号をそれぞれ周波数信号に変換してもよい。
(数2)
(数3)
(数4)
ここで、Nは、1フレームに含まれる時間方向のサンプル点数であり、本実施形態では、Nは128である。また、eL(k)は、左前方チャネルの周波数信号L(k,n)の自己相関値であり、eSL(k)は、左後方チャネルの周波数信号SL(k,n)の自己相関値である。またeLSL(k)は、左前方チャネルの周波数信号L(k,n)と左後方チャネルの周波数信号SL(k,n)との相互相関値である。
(数5)
(数6)
ここで、eR(k)は、右前方チャネルの周波数信号R(k,n)の自己相関値であり、eSR(k)は、右後方チャネルの周波数信号SR(k,n)の自己相関値である。またeRSR(k)は、右前方チャネルの周波数信号R(k,n)と右後方チャネルの周波数信号SR(k,n)との相互相関値である。
(数7)
ここで、eC(k)は、中央チャネルの周波数信号C(k,n)の自己相関値であり、eLFE(k)は、重低音チャネルの周波数信号LFE(k,n)の自己相関値である。
(数8)
(数9)
(数10)
また、上述の(数10)は、実数部と虚数部を用いると次式の通りに表現できる。
(数11)
なお、L0Re(k,n)はL0(k,n)の実数部、L0Im(k,n)はL0(k,n)の虚数部、R0Re(k,n)はR0(k,n)の実数部、R0Im(k,n)はR0(k,n)の虚数部を表す。
(数12)
算出部16は算出したマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)ならびに、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)、中央チャネルの信号C0(k,n)の3チャネルの周波数信号を制御部17に出力する。なお、算出部16は上述の(数12)において、静的マスキング閾値(qthr)または動的マスキング閾値(dthr)の何れか一つのみを用いてマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)を算出しても良い。
(数13)
(数14)
但し、ΔL0Re(k,n)は、L0(k,n)の実数部の制御量、ΔL0Im(k,n)は、L0(k,n)の虚数部の制御量、ΔR0Re(k,n)は、R0(k,n)の実数部の制御量、ΔR0Im(k,n)は、R0(k,n)の虚数部の制御量である。
(数15)
但し、L0Re(k,n)はL0(k,n)の実数部、L0Im(k,n)はL0(k,n)の虚数部を表し、R0Re(k,n)はR0(k,n)の実数部、R0Im(k,n)はR0(k,n)の虚数部を表す。
(数16)
但し、C0Re(k,n)はC0(k,n)の実数部、C0Im(k,n)はC0(k,n)の虚数部を表し、C’’0Re(k,n)はC’’0(k,n)の実数部、C0Im(k,n)はC’’0(k,n)の虚数部を表す。
(数17)
(数18)
ここでIQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。なお、時間周波数変換部11が、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いている場合、周波数時間変換部20は、その時間周波数変換処理の逆変換を使用する。周波数時間変換部20は、各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルのステレオ信号をAAC符号化部21へ出力する。
実施例1における図1に示す算出部16は、誤差d(k,n)が0以外の場合に、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)にそれぞれ対応するマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)を算出する。実施例2における算出部16は、誤差d(k,n)が0以外の場合に、初めに中央チャネルの信号C0(k,n)のマスキング閾値threshold-C0(k,n)を算出する。マスキング閾値threshold-C0(k,n)の算出方法は、上述のマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)と同様の方法を用いることが出来る為、詳細な説明は省略する。
図1に示す、図1の制御部17は、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)の双方を制御しているが、左側周波数信号L0(k,n)または右側周波数信号R0(k,n)のいずれか一方のみを制御することのみでも制御ステレオ周波数信号を生成することが可能である。例えば、制御部17は、右側周波数信号R0(k,n)のみ制御する場合は、上述の(数14)、(数15)において、R0(k,n)関する式のみを用いて、誤差d’(k,n)を(数16)により算出し、(数17の)R’0(k,n)を算出する。そして、第2ダウンミックス15は、制御右側周波数信号R’0(k,n)と左側周波数信号L0(k,n)を制御ステレオ周波数信号としてチャネル信号符号化部18へ出力する。
図10は、他の実施形態によるオーディオ符号化装置のハードウェア構成図である。図10に示すように、オーディオ符号化装置1は、制御部901、主記憶部902、補助記憶部903、ドライブ装置904、ネットワークI/F部906、入力部907、表示部908を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
図11は、一つの実施形態によるオーディオ復号装置100の機能ブロックを示す図である。図11に示す様に、オーディオ復号装置100は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、アップミックス部108、周波数時間変換部109を含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。
(数19)
ここでQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。
(数20)
予測復号部107は、制御左側周波数信号L0(k,n)、制御右側周波数信号R0(k,n)、中央チャネル信号C0(k,n)をアップミックス部108に出力する。
(数21)
ここで、Lout(k,n)、Rout(k,n)、Cout(k,n)は、それぞれ、左チャネル、右チャネル及び中央チャネルの周波数信号である。アップミックス部108は、マトリクス変換した、左チャネルの周波数信号Lout(k,n)、右チャネルの周波数信号Rout(k,n)及び、中央チャネルの周波数信号Cout(k,n)と、空間情報復号部106から受け取る空間情報から、例えば、5.1chのオーディオ信号へアップミックスする。なお、アップミックス方法は例、えば、ISO/IEC23003―1に記載の方法を用いることが出来る。
図12は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その1)である。図13は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その2)である。図12と図13に示す様に、オーディオ符号化復号システム1000は、時間周波数変換部11、第1ダウンミックス部12、第2ダウンミックス部15、予測符号化部13、チャネル信号符号化部18、空間情報符号化部22、多重化部23を有する。また、予測符号化部13は、選択部14を含み、第2ダウンミックス部15は、算出部16と制御部17を含んでいる。更に、チャネル信号符号化部18は、SBR(Spectral Band Replication)符号化部19と、周波数時間変換部20と、AAC(Advanced Audio Coding)符号化部21を含んでいる。また、オーディオ符号化復号システム1000は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、アップミックス部108、周波数時間変換部109を含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。なお、オーディオ符号化復号システム1000が含む各機能は、図1ならびに図11に示す機能と同様となる為、詳細な説明は省略する。
(付記1)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。
(付記2)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出する算出部を更に備え、
前記制御部は、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記1記載のオーディオ符号化装置。
(付記3)
前記制御部は、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記1または付記2記載のオーディオ符号化装置。
(付記4)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記3記載のオーディオ符号化装置。
(付記5)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記2記載のオーディオ符号化装置。
(付記6)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを含むことを特徴とするオーディオ符号化方法。
(付記7)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出することを更に含み、
前記制御することは、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記6記載のオーディオ符号化方法。
(付記8)
前記制御することは、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記6または付記7記載のオーディオ符号化方法。
(付記9)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記7記載のオーディオ符号化方法。
(付記10)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記7記載のオーディオ符号化方法。
(付記11)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、コンピュータに、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを実行させることを特徴とするオーディオ符号化プログラム。
(付記12)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出することを更に含み、
前記制御することは、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記11記載のオーディオ符号化プログラム。
(付記13)
前記制御することは、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記11または付記12記載のオーディオ符号化プログラム。
(付記14)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記13記載のオーディオ符号化プログラム。
(付記15)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記12記載のオーディオ符号化プログラム。
(付記16)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差を選択する選択部と、
前記誤差が前記予測符号化前の前記第3チャネル信号のマスキング閾値未満か否かを判定する判定部と、
前記マスキング閾値以上の場合、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。
(付記17)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測復号するオーディオ復号装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数が選択された後に、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号が制御された符号化チャネル信号と、
前記複数のチャネル間の強度差と類似度を含む符号化空間情報と、
が多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号をアップミックスするアップミックス部
を備えることを特徴とするオーディオ復号装置。
(付記18)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化復号システムにおいて、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部と、
前記第1チャネル信号または前記第2チャネル信号が制御された符号化チャネル信号と、前記複数のチャネル間の強度差と類似度を含む符号化空間情報とが多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号をアップミックスするアップミックス部
を備えることを特徴とするオーディオ符号化復号システム。
11 時間周波数変換部
12 第1ダウンミックス部
13 予測符号化部
14 選択部
15 第2ダウンミックス部
16 算出部
17 制御部
18 チャネル信号符号化部
19 SBR符号化部
20 周波数時間変換部
21 AAC符号化部
22 空間情報符号化部
23 多重化部
100 オーディオ復号装置
101 分離部
102 チャネル信号復号部
103 AAC復号部
104 時間周波数変換部
105 SBR復号部
106 空間情報復号部
107 予測復号部
108 アップミックス部
109 周波数時間変換部
Claims (8)
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。 - 前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出する算出部を更に備え、
前記制御部は、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする請求項1記載のオーディオ符号化装置。 - 前記制御部は、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする請求項1または請求項2記載のオーディオ符号化装置。
- 前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする請求項3記載のオーディオ符号化装置。
- 前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする請求項2記載のオーディオ符号化装置。
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを含むことを特徴とするオーディオ符号化方法。 - オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、コンピュータに、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを実行させることを特徴とするオーディオ符号化プログラム。 - オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差を選択する選択部と、
前記誤差が前記予測符号化前の前記第3チャネル信号のマスキング閾値未満か否かを判定する判定部と、
前記マスキング閾値以上の場合、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031476A JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
US14/090,546 US9508352B2 (en) | 2013-02-20 | 2013-11-26 | Audio coding device and method |
EP13194815.0A EP2770505B1 (en) | 2013-02-20 | 2013-11-28 | Audio coding device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031476A JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014160212A true JP2014160212A (ja) | 2014-09-04 |
JP6179122B2 JP6179122B2 (ja) | 2017-08-16 |
Family
ID=49667057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013031476A Expired - Fee Related JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9508352B2 (ja) |
EP (1) | EP2770505B1 (ja) |
JP (1) | JP6179122B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5799824B2 (ja) * | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP6303435B2 (ja) | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008517337A (ja) * | 2004-11-02 | 2008-05-22 | コーディング テクノロジーズ アクチボラゲット | 予測ベースの多チャンネル再構築の性能を改善するための方法 |
JP2012073351A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP2012521012A (ja) * | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
JP2007183528A (ja) | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP4606507B2 (ja) * | 2006-03-24 | 2011-01-05 | ドルビー インターナショナル アクチボラゲット | 多チャンネル信号のパラメータ表現からの空間ダウンミックスの生成 |
CA2874451C (en) * | 2006-10-16 | 2016-09-06 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
US9177569B2 (en) * | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
WO2009057329A1 (ja) * | 2007-11-01 | 2009-05-07 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
WO2011013983A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2011034376A2 (en) * | 2009-09-17 | 2011-03-24 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US9026434B2 (en) * | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
-
2013
- 2013-02-20 JP JP2013031476A patent/JP6179122B2/ja not_active Expired - Fee Related
- 2013-11-26 US US14/090,546 patent/US9508352B2/en not_active Expired - Fee Related
- 2013-11-28 EP EP13194815.0A patent/EP2770505B1/en not_active Not-in-force
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008517337A (ja) * | 2004-11-02 | 2008-05-22 | コーディング テクノロジーズ アクチボラゲット | 予測ベースの多チャンネル再構築の性能を改善するための方法 |
JP2012521012A (ja) * | 2009-03-17 | 2012-09-10 | ドルビー インターナショナル アーベー | 適応的に選択可能な左/右又はミッド/サイド・ステレオ符号化及びパラメトリック・ステレオ符号化の組み合わせに基づいた高度ステレオ符号化 |
JP2012073351A (ja) * | 2010-09-28 | 2012-04-12 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
Non-Patent Citations (1)
Title |
---|
岸洋平 他: ""予測誤差分布に基づく高音質かつ高速なMPEGサラウンド符号化の検討"", 日本音響学会2012年春季研究発表会講演論文集CD-ROM, JPN6016046843, 6 March 2012 (2012-03-06), pages 815 - 818, ISSN: 0003581269 * |
Also Published As
Publication number | Publication date |
---|---|
EP2770505B1 (en) | 2016-09-28 |
JP6179122B2 (ja) | 2017-08-16 |
US9508352B2 (en) | 2016-11-29 |
US20140236603A1 (en) | 2014-08-21 |
EP2770505A1 (en) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4616349B2 (ja) | ステレオ互換性のあるマルチチャネルオーディオ符号化 | |
KR101395254B1 (ko) | 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법 | |
US7719445B2 (en) | Method and apparatus for encoding/decoding multi-channel audio signal | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
RU2696952C2 (ru) | Аудиокодировщик и декодер | |
EP2345026A1 (en) | Apparatus for binaural audio coding | |
TW201603004A (zh) | 解碼壓縮高階保真立體音響表示之方法及裝置,及編碼壓縮高階保真立體音響表示之方法及裝置 | |
KR20170017873A (ko) | 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 | |
JP5949270B2 (ja) | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP6051621B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 | |
JP6303435B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 | |
JP6299202B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置 | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
CN105336334B (zh) | 多声道声音信号编码方法、解码方法及装置 | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 | |
KR20080010981A (ko) | 데이터 부호화/복호화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151007 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20160401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6179122 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |