JP6179122B2 - オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム - Google Patents
オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム Download PDFInfo
- Publication number
- JP6179122B2 JP6179122B2 JP2013031476A JP2013031476A JP6179122B2 JP 6179122 B2 JP6179122 B2 JP 6179122B2 JP 2013031476 A JP2013031476 A JP 2013031476A JP 2013031476 A JP2013031476 A JP 2013031476A JP 6179122 B2 JP6179122 B2 JP 6179122B2
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- signal
- channel
- unit
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 65
- 230000000873 masking effect Effects 0.000 claims description 67
- 230000005236 sound signal Effects 0.000 claims description 40
- 230000003068 static effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 description 41
- 238000013139 quantization Methods 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 238000000926 separation method Methods 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図1は、一つの実施形態によるオーディオ符号化装置1の機能ブロック図である。図1に示す様に、オーディオ符号化装置1は,時間周波数変換部11、第1ダウンミックス部12、第2ダウンミックス部15、予測符号化部13、チャネル信号符号化部18、空間情報符号化部22、多重化部23を有する。
(数1)
ここでnは時間を表す変数であり、1フレームのオーディオ信号を時間方向に128等分したときのn番目の時間を表す。なお,フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。またQMF(k,n)は、時間n、周波数kの周波数信号を出力するためのQMFである。時間周波数変換部11は、QMF(k,n)を入力されたチャネルの1フレーム分のオーディオ信号に乗じることにより、そのチャネルの周波数信号を生成する。なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号をそれぞれ周波数信号に変換してもよい。
(数2)
(数3)
(数4)
ここで、Nは、1フレームに含まれる時間方向のサンプル点数であり、本実施形態では、Nは128である。また、eL(k)は、左前方チャネルの周波数信号L(k,n)の自己相関値であり、eSL(k)は、左後方チャネルの周波数信号SL(k,n)の自己相関値である。またeLSL(k)は、左前方チャネルの周波数信号L(k,n)と左後方チャネルの周波数信号SL(k,n)との相互相関値である。
(数5)
(数6)
ここで、eR(k)は、右前方チャネルの周波数信号R(k,n)の自己相関値であり、eSR(k)は、右後方チャネルの周波数信号SR(k,n)の自己相関値である。またeRSR(k)は、右前方チャネルの周波数信号R(k,n)と右後方チャネルの周波数信号SR(k,n)との相互相関値である。
(数7)
ここで、eC(k)は、中央チャネルの周波数信号C(k,n)の自己相関値であり、eLFE(k)は、重低音チャネルの周波数信号LFE(k,n)の自己相関値である。
(数8)
(数9)
(数10)
また、上述の(数10)は、実数部と虚数部を用いると次式の通りに表現できる。
(数11)
なお、L0Re(k,n)はL0(k,n)の実数部、L0Im(k,n)はL0(k,n)の虚数部、R0Re(k,n)はR0(k,n)の実数部、R0Im(k,n)はR0(k,n)の虚数部を表す。
(数12)
算出部16は算出したマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)ならびに、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)、中央チャネルの信号C0(k,n)の3チャネルの周波数信号を制御部17に出力する。なお、算出部16は上述の(数12)において、静的マスキング閾値(qthr)または動的マスキング閾値(dthr)の何れか一つのみを用いてマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)を算出しても良い。
(数13)
(数14)
但し、ΔL0Re(k,n)は、L0(k,n)の実数部の制御量、ΔL0Im(k,n)は、L0(k,n)の虚数部の制御量、ΔR0Re(k,n)は、R0(k,n)の実数部の制御量、ΔR0Im(k,n)は、R0(k,n)の虚数部の制御量である。
(数15)
但し、L0Re(k,n)はL0(k,n)の実数部、L0Im(k,n)はL0(k,n)の虚数部を表し、R0Re(k,n)はR0(k,n)の実数部、R0Im(k,n)はR0(k,n)の虚数部を表す。
(数16)
但し、C0Re(k,n)はC0(k,n)の実数部、C0Im(k,n)はC0(k,n)の虚数部を表し、C’’0Re(k,n)はC’’0(k,n)の実数部、C0Im(k,n)はC’’0(k,n)の虚数部を表す。
(数17)
(数18)
ここでIQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。なお、時間周波数変換部11が、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いている場合、周波数時間変換部20は、その時間周波数変換処理の逆変換を使用する。周波数時間変換部20は、各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルのステレオ信号をAAC符号化部21へ出力する。
実施例1における図1に示す算出部16は、誤差d(k,n)が0以外の場合に、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)にそれぞれ対応するマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)を算出する。実施例2における算出部16は、誤差d(k,n)が0以外の場合に、初めに中央チャネルの信号C0(k,n)のマスキング閾値threshold-C0(k,n)を算出する。マスキング閾値threshold-C0(k,n)の算出方法は、上述のマスキング閾値threshold-L0(k,n)、threshold-R0(k,n)と同様の方法を用いることが出来る為、詳細な説明は省略する。
図1に示す、図1の制御部17は、左側周波数信号L0(k,n)、右側周波数信号R0(k,n)の双方を制御しているが、左側周波数信号L0(k,n)または右側周波数信号R0(k,n)のいずれか一方のみを制御することのみでも制御ステレオ周波数信号を生成することが可能である。例えば、制御部17は、右側周波数信号R0(k,n)のみ制御する場合は、上述の(数14)、(数15)において、R0(k,n)関する式のみを用いて、誤差d’(k,n)を(数16)により算出し、(数17の)R’0(k,n)を算出する。そして、第2ダウンミックス15は、制御右側周波数信号R’0(k,n)と左側周波数信号L0(k,n)を制御ステレオ周波数信号としてチャネル信号符号化部18へ出力する。
図10は、他の実施形態によるオーディオ符号化装置のハードウェア構成図である。図10に示すように、オーディオ符号化装置1は、制御部901、主記憶部902、補助記憶部903、ドライブ装置904、ネットワークI/F部906、入力部907、表示部908を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
図11は、一つの実施形態によるオーディオ復号装置100の機能ブロックを示す図である。図11に示す様に、オーディオ復号装置100は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、アップミックス部108、周波数時間変換部109を含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。
(数19)
ここでQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。
(数20)
予測復号部107は、制御左側周波数信号L0(k,n)、制御右側周波数信号R0(k,n)、中央チャネル信号C0(k,n)をアップミックス部108に出力する。
(数21)
ここで、Lout(k,n)、Rout(k,n)、Cout(k,n)は、それぞれ、左チャネル、右チャネル及び中央チャネルの周波数信号である。アップミックス部108は、マトリクス変換した、左チャネルの周波数信号Lout(k,n)、右チャネルの周波数信号Rout(k,n)及び、中央チャネルの周波数信号Cout(k,n)と、空間情報復号部106から受け取る空間情報から、例えば、5.1chのオーディオ信号へアップミックスする。なお、アップミックス方法は例、えば、ISO/IEC23003―1に記載の方法を用いることが出来る。
図12は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その1)である。図13は、一つの実施形態によるオーディオ符号化復号システム1000の機能ブロックを示す図(その2)である。図12と図13に示す様に、オーディオ符号化復号システム1000は、時間周波数変換部11、第1ダウンミックス部12、第2ダウンミックス部15、予測符号化部13、チャネル信号符号化部18、空間情報符号化部22、多重化部23を有する。また、予測符号化部13は、選択部14を含み、第2ダウンミックス部15は、算出部16と制御部17を含んでいる。更に、チャネル信号符号化部18は、SBR(Spectral Band Replication)符号化部19と、周波数時間変換部20と、AAC(Advanced Audio Coding)符号化部21を含んでいる。また、オーディオ符号化復号システム1000は、分離部101、チャネル信号復号部102、空間情報復号部106、予測復号部107、アップミックス部108、周波数時間変換部109を含んでいる。また、チャネル信号復号部102は、AAC復号部103、時間周波数変換部104、SBR復号部105を含んでいる。なお、オーディオ符号化復号システム1000が含む各機能は、図1ならびに図11に示す機能と同様となる為、詳細な説明は省略する。
(付記1)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。
(付記2)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出する算出部を更に備え、
前記制御部は、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記1記載のオーディオ符号化装置。
(付記3)
前記制御部は、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記1または付記2記載のオーディオ符号化装置。
(付記4)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記3記載のオーディオ符号化装置。
(付記5)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記2記載のオーディオ符号化装置。
(付記6)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを含むことを特徴とするオーディオ符号化方法。
(付記7)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出することを更に含み、
前記制御することは、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記6記載のオーディオ符号化方法。
(付記8)
前記制御することは、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記6または付記7記載のオーディオ符号化方法。
(付記9)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記7記載のオーディオ符号化方法。
(付記10)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記7記載のオーディオ符号化方法。
(付記11)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、コンピュータに、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する
ことを実行させることを特徴とするオーディオ符号化プログラム。
(付記12)
前記第1チャネル信号または前記第2チャネル信号のマスキング閾値を算出することを更に含み、
前記制御することは、前記マスキング閾値より規定される許容制御量に基づいて、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記11記載のオーディオ符号化プログラム。
(付記13)
前記制御することは、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする付記11または付記12記載のオーディオ符号化プログラム。
(付記14)
前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする付記13記載のオーディオ符号化プログラム。
(付記15)
前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする付記12記載のオーディオ符号化プログラム。
(付記16)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差を選択する選択部と、
前記誤差が前記予測符号化前の前記第3チャネル信号のマスキング閾値未満か否かを判定する判定部と、
前記マスキング閾値以上の場合、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部
を備えることを特徴とするオーディオ符号化装置。
(付記17)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測復号するオーディオ復号装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数が選択された後に、前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号が制御された符号化チャネル信号と、
前記複数のチャネル間の強度差と類似度を含む符号化空間情報と、
が多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号をアップミックスするアップミックス部
を備えることを特徴とするオーディオ復号装置。
(付記18)
オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化復号システムにおいて、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記誤差が更に小さくなる様に前記第1チャネル信号または前記第2チャネル信号を制御する制御部と、
前記第1チャネル信号または前記第2チャネル信号が制御された符号化チャネル信号と、前記複数のチャネル間の強度差と類似度を含む符号化空間情報とが多重化された入力信号を分離する分離部と、
復号処理された前記第1チャネル信号、前記第2チャネル信号ならびに前記第3チャネル信号をアップミックスするアップミックス部
を備えることを特徴とするオーディオ符号化復号システム。
11 時間周波数変換部
12 第1ダウンミックス部
13 予測符号化部
14 選択部
15 第2ダウンミックス部
16 算出部
17 制御部
18 チャネル信号符号化部
19 SBR符号化部
20 周波数時間変換部
21 AAC符号化部
22 空間情報符号化部
23 多重化部
100 オーディオ復号装置
101 分離部
102 チャネル信号復号部
103 AAC復号部
104 時間周波数変換部
105 SBR復号部
106 空間情報復号部
107 予測復号部
108 アップミックス部
109 周波数時間変換部
Claims (7)
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択する選択部と、
前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方のマスキング閾値を算出する算出部と、
前記各マスキング閾値より規定される許容制御量の範囲内で、前記誤差が更に小さくなる様に前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方を制御する制御部
を備えることを特徴とするオーディオ符号化装置。 - 前記制御部は、前記誤差が所定の第1閾値以上の場合に、前記第1チャネル信号または前記第2チャネル信号を制御することを特徴とする請求項1記載のオーディオ符号化装置。
- 前記第1閾値は、前記予測符号化前の前記第3チャネル信号のマスキング閾値に基づいて規定されることを特徴とする請求項2記載のオーディオ符号化装置。
- 前記マスキング閾値は、静的マスキング閾値または動的マスキング閾値であることを特徴とする請求項1記載のオーディオ符号化装置。
- オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化方法において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方のマスキング閾値を算出し、
前記各マスキング閾値より規定される許容制御量の範囲内で、前記誤差が更に小さくなる様に前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方を制御する
ことを含むことを特徴とするオーディオ符号化方法。 - オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化することをコンピュータに実行させるオーディオ符号化用コンピュータプログラムであって、コンピュータに、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差が最小となる前記第1チャネル信号と前記第2チャネル信号にそれぞれ対応する前記予測係数を選択し、
前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方のマスキング閾値を算出し、
前記各マスキング閾値より規定される許容制御量の範囲内で、前記誤差が更に小さくなる様に前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方を制御する
ことを実行させることを特徴とするオーディオ符号化プログラム。 - オーディオ信号に含まれる複数のチャネルに含まれる第1チャネル信号と第2チャネル信号と、符号帳に含まれる複数の予測係数とに基づいて、前記複数のチャネルに含まれる第3チャネル信号を予測符号化するオーディオ符号化装置において、
予測符号化前の前記第3チャネル信号と予測符号化後の前記第3チャネル信号の差分で規定される誤差を算出する制御部と、
前記第1チャネル信号、前記第2チャネル信号のいずれかまたは双方、及び前記第3チャネル信号のマスキング閾値を算出する算出部と、
前記誤差が前記予測符号化前の前記第3チャネル信号のマスキング閾値未満か否かを判定する判定部
を備え、
前記制御部は、前記誤差が前記予測符号化前の前記第3チャネル信号の前記マスキング閾値以上の場合、前記第1チャネル信号及び前記第2チャネル信号のいずれかまたはそれぞれのマスキング閾値より規定される許容制御量の範囲内で、前記誤差が更に小さくなる様に前記第1チャネル信号及び前記第2チャネル信号のいずれかまたは双方を制御する
ことを特徴とするオーディオ符号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031476A JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
US14/090,546 US9508352B2 (en) | 2013-02-20 | 2013-11-26 | Audio coding device and method |
EP13194815.0A EP2770505B1 (en) | 2013-02-20 | 2013-11-28 | Audio coding device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013031476A JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014160212A JP2014160212A (ja) | 2014-09-04 |
JP6179122B2 true JP6179122B2 (ja) | 2017-08-16 |
Family
ID=49667057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013031476A Expired - Fee Related JP6179122B2 (ja) | 2013-02-20 | 2013-02-20 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9508352B2 (ja) |
EP (1) | EP2770505B1 (ja) |
JP (1) | JP6179122B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5799824B2 (ja) * | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP6303435B2 (ja) | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
JP2007183528A (ja) | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
JP4606507B2 (ja) * | 2006-03-24 | 2011-01-05 | ドルビー インターナショナル アクチボラゲット | 多チャンネル信号のパラメータ表現からの空間ダウンミックスの生成 |
CA2874451C (en) * | 2006-10-16 | 2016-09-06 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
US9177569B2 (en) * | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
WO2009057329A1 (ja) * | 2007-11-01 | 2009-05-07 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
JP2011518345A (ja) * | 2008-03-14 | 2011-06-23 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
CA2949616C (en) * | 2009-03-17 | 2019-11-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
WO2011013983A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2011034376A2 (en) * | 2009-09-17 | 2011-03-24 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US9026434B2 (en) * | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
US9070361B2 (en) * | 2011-06-10 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component |
-
2013
- 2013-02-20 JP JP2013031476A patent/JP6179122B2/ja not_active Expired - Fee Related
- 2013-11-26 US US14/090,546 patent/US9508352B2/en not_active Expired - Fee Related
- 2013-11-28 EP EP13194815.0A patent/EP2770505B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
JP2014160212A (ja) | 2014-09-04 |
EP2770505B1 (en) | 2016-09-28 |
US9508352B2 (en) | 2016-11-29 |
US20140236603A1 (en) | 2014-08-21 |
EP2770505A1 (en) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4616349B2 (ja) | ステレオ互換性のあるマルチチャネルオーディオ符号化 | |
KR101395254B1 (ko) | 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법 | |
US7719445B2 (en) | Method and apparatus for encoding/decoding multi-channel audio signal | |
JP2009524108A (ja) | 拡張帯域周波数コーディングによる複素変換チャネルコーディング | |
RU2696952C2 (ru) | Аудиокодировщик и декодер | |
EP2345026A1 (en) | Apparatus for binaural audio coding | |
TW201603004A (zh) | 解碼壓縮高階保真立體音響表示之方法及裝置,及編碼壓縮高階保真立體音響表示之方法及裝置 | |
KR20170017873A (ko) | 오디오 신호 처리 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 | |
JP5949270B2 (ja) | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム | |
US20120163608A1 (en) | Encoder, encoding method, and computer-readable recording medium storing encoding program | |
JP6179122B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
JP6051621B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 | |
JP6303435B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 | |
JP5990954B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラム | |
JP6299202B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置 | |
CN105336334B (zh) | 多声道声音信号编码方法、解码方法及装置 | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 | |
KR20080010981A (ko) | 데이터 부호화/복호화 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151007 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20160401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170620 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6179122 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |