JP2006047561A - Audio signal encoding device and audio signal decoding device - Google Patents
Audio signal encoding device and audio signal decoding device Download PDFInfo
- Publication number
- JP2006047561A JP2006047561A JP2004226813A JP2004226813A JP2006047561A JP 2006047561 A JP2006047561 A JP 2006047561A JP 2004226813 A JP2004226813 A JP 2004226813A JP 2004226813 A JP2004226813 A JP 2004226813A JP 2006047561 A JP2006047561 A JP 2006047561A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- synthesis
- frequency domain
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、オーディオ信号を符号化するオーディオ信号符号化装置、並びに、符号化されたビットストリームを復号化するオーディオ信号復号化装置に関するものである。 The present invention relates to an audio signal encoding apparatus that encodes an audio signal, and an audio signal decoding apparatus that decodes an encoded bit stream.
従来、オーディオ信号を符号化する方法として、MPEG(Moving Picture Expert Group)Audio規格がある。MPEG Audio規格には複数の方式があるが、MPEG2 AAC、MPEG4 AAC規格では、圧縮効率を上げるためのツールとしてTNS(Temporary Noise Shaping)技術を使用できる。 Conventionally, as a method for encoding an audio signal, there is an MPEG (Moving Picture Expert Group) Audio standard. There are a plurality of MPEG Audio standards. In the MPEG2 AAC and MPEG4 AAC standards, a TNS (Temporary Noise Shaping) technique can be used as a tool for increasing compression efficiency.
図10は、ISO/IEC 13818−7で標準化されているMPEG2オーディオ規格AAC(Advanced Audio Coding)準拠の符号化装置のブロック図、図11は、MPEG2オーディオ規格AACのリファレンスソフトウェアにおけるTNS処理部のブロック図である。 FIG. 10 is a block diagram of an encoding apparatus compliant with the MPEG2 audio standard AAC (Advanced Audio Coding) standardized by ISO / IEC 13818-7, and FIG. 11 is a block of a TNS processing unit in the reference software of the MPEG2 audio standard AAC. FIG.
図10において、聴覚心理モデル部110は、入力オーディオ信号を人間の聴覚特性に従って分析し、信号対マスク比(SMR)値を算出する。ゲイン制御部111は、SSRプロファイルのみに使用され、入力信号を4つの等間隔の帯域に分割し、最低域以外の帯域について利得の制御を行う。MDCT部112は、時間領域の入力オーディオ信号を周波数領域のスペクトルデータに変換する。TNS処理部113は、量子化雑音の時間的な形状を制御する。インテンシティ/カップリング部114、M/Sステレオ部116は、ステレオ信号を効率よく処理するモジュールの一つであり、ステレオ相関符号化処理を行う。予測部115は、予測符号化を行う。正規化係数部117は、正規化係数を算出し、量子化部118では、正規化係数を基に音響信号を非線形量子化する。量子化された各出力は、ノイズレス符号化部119により符号化処理が行われ、マルチプレクサ部120でビットストリームを形成する。また、スペクトル処理を行うMDCT部112からM/Sステレオ部116の処理部をまとめてスペクトル処理部121、量子化/符号化を行う正規化係数部117からノイズレス符号化部119の処理部をまとめて量子化/符号化部122とする。
In FIG. 10, an auditory
次に、TNS処理部113の動作について、図11を用いて説明する。図11において、MDCT部131は、時間領域の入力オーディオ信号を周波数領域のスペクトルデータに変換する。線形予測部132は、周波数領域のスペクトルデータ上で線形予測を行う。ここで、線形予測によってスペクトルデータを予測できた場合は、残差信号算出部133では、線形予測部132で予測されたスペクトルとMDCT部131で変換されたスペクトルデータとの残差信号を算出する。さらに、この残差信号および線形予測係数は、量子化/符号化部134によって出力ビットストリームに変換される。
Next, the operation of the
このようにして、TNS処理によりMDCT係数の分散が小さくなり、スペクトルは平坦化される。通常、量子化ノイズは時間軸上全体に平均的に分布しているが、TNS処理により量子化ノイズは時間軸上で波形の大きいところに多く分布されるようになる。このことにより、プリエコーと呼ばれる音質劣化を減少させることができる。 In this way, the dispersion of MDCT coefficients is reduced by the TNS process, and the spectrum is flattened. Usually, the quantization noise is distributed on the entire time axis on the average, but the quantization noise is distributed a lot on the time axis where the waveform is large by the TNS processing. As a result, sound quality deterioration called pre-echo can be reduced.
デコード処理を行う際には、復号化された残差信号と線形予測係数からスペクトルが算出され、そのスペクトルを逆MDCTすることでオーディオ信号は復元される。 When performing the decoding process, a spectrum is calculated from the decoded residual signal and the linear prediction coefficient, and the audio signal is restored by performing inverse MDCT on the spectrum.
また、このような線形予測と残差信号を用いて伝達情報量の増加を軽減するとともにピッチ予測精度を上げ、音声を圧縮する音声符号化復号化装置も提案されている(例えば特許文献1参照)。
しかしながら、従来のオーディオ信号符号化復号化装置におけるTNS処理では、単純な波形の場合は予測が有効であるが、複雑な波形の場合には線形予測ができず、TNS処理による効果を十分に発揮できないという問題があった。 However, in the TNS processing in the conventional audio signal encoding / decoding apparatus, prediction is effective for a simple waveform, but linear prediction cannot be performed for a complicated waveform, and the effect of the TNS processing can be sufficiently exhibited. There was a problem that I could not.
本発明は、このような従来の問題を解決するためになされたもので、効率的な符号化処理を行うことができるオーディオ信号符号化装置、および、このような符号化信号を復号化することができるオーディオ信号復号化装置を提供することを目的とする。 The present invention has been made to solve such a conventional problem, and an audio signal encoding apparatus capable of performing efficient encoding processing and decoding such an encoded signal. An object of the present invention is to provide an audio signal decoding apparatus capable of performing the above.
本発明のオーディオ信号符号化装置は、時間領域のオーディオ信号を周波数領域へ変換する時間周波数変換手段と、前記時間周波数変換手段によって周波数領域へ変換された信号を近似するFM合成手段と、前記時間周波数変換手段によって周波数領域へ変換された信号と前記FM合成手段によって近似された周波数領域の信号との差分を算出する残差信号算出手段と、前記残差信号算出手段に算出された周波数領域の残差信号と、前記FM合成手段で使用したパラメータとを符号化する符号化手段とを備えたことを特徴とした構成を有している。 The audio signal encoding apparatus of the present invention includes a time-frequency conversion unit that converts a time-domain audio signal into a frequency domain, an FM synthesis unit that approximates the signal converted into the frequency domain by the time-frequency conversion unit, and the time A residual signal calculating means for calculating a difference between the signal converted into the frequency domain by the frequency converting means and the frequency domain signal approximated by the FM synthesizing means; and a frequency domain calculated by the residual signal calculating means. An encoding means for encoding the residual signal and the parameters used in the FM synthesizing means is provided.
この構成により、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測し、また、この信号との差分である残差信号を求め、前記パラメータと前記残差信号とを符号化するので、線形予測を使用した処理よりもより効率的な符号化処理を行うことができる。 With this configuration, frequency domain spectrum data is predicted using an FM synthesis method that can represent a complex waveform with fewer parameters than linear prediction, and a residual signal that is a difference from this signal is obtained. Since the parameter and the residual signal are encoded, the encoding process can be performed more efficiently than the process using linear prediction.
また、本発明のオーディオ信号符号化装置は、前記残差信号算出手段において残差信号を求める周波数の適用範囲を算出する適用周波数算出手段を備え、前記残差信号算出手段は、前記適用周波数算出手段に算出された適用周波数帯域の前記残差信号を算出し、前記符号化手段は、前記適用周波数算出手段が算出した適用周波数帯域をパラメータとして符号化することを特徴とした構成を有している。 The audio signal encoding apparatus according to the present invention further includes an applied frequency calculating unit that calculates an application range of a frequency for obtaining a residual signal in the residual signal calculating unit, and the residual signal calculating unit includes the applied frequency calculating unit. The residual signal of the applied frequency band calculated by the means is calculated, and the encoding means has a configuration characterized in that the applied frequency band calculated by the applied frequency calculating means is encoded as a parameter. Yes.
この構成により、残差信号を算出する周波数帯域を指定し、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測し、FM合成による信号との差分が実質的に影響を及ぼす範囲でのみ残差信号を符号化するので、必要外の残差信号を符号化せず、線形予測を使用した処理よりもより効率的な符号化処理を行うとともに、再生時の品質を落とさずに、さらなる符号化効率を高めることができる。 With this configuration, a frequency band in which a residual signal is calculated is designated, spectrum data in the frequency domain is predicted using an FM synthesis method capable of expressing a complex waveform with fewer parameters than linear prediction, and a signal obtained by FM synthesis. Since the residual signal is encoded only within the range where the difference between and is substantially affected, the residual signal is not encoded, and the encoding process is more efficient than the process using linear prediction. In addition, the encoding efficiency can be further increased without degrading the reproduction quality.
さらに、本発明のオーディオ信号復号化装置は、符号化された周波数領域の残差信号およびFM合成に使用するパラメータを復号化する復号化手段と、前記復号化手段によって復号化されたパラメータを用いてFM合成を行うFM合成手段と、前記復号化手段によって復号化された周波数領域の残差信号と前記FM合成手段によって出力された周波数領域の信号とを加算する加算信号算出手段と、前記加算信号算出手段によって生成された周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換手段とを備えたことを特徴とした構成を有している。 Furthermore, the audio signal decoding apparatus of the present invention uses a decoding means for decoding the encoded frequency domain residual signal and the parameters used for FM synthesis, and the parameters decoded by the decoding means. FM combining means for performing FM combining, an addition signal calculating means for adding the frequency domain residual signal decoded by the decoding means and the frequency domain signal output by the FM combining means, and the addition A frequency time conversion means for converting a frequency domain signal generated by the signal calculation means into a time domain audio signal.
この構成により、FM合成信号のパラメータと、オーディオ信号と前記FM合成信号との残差信号とを復号化して、オーディオ信号を再生することができるので、線形予測による符号化信号より圧縮率の高い符号化信号から、オーディオ信号を復号化することができる。 With this configuration, it is possible to reproduce the audio signal by decoding the parameter of the FM synthesized signal and the residual signal of the audio signal and the FM synthesized signal, so that the compression rate is higher than that of the encoded signal by linear prediction. From the encoded signal, the audio signal can be decoded.
さらに、本発明のオーディオ信号復号化装置は、符号化された周波数領域の残差信号、FM合成に使用するパラメータおよび前記残差信号を算出した周波数帯域のパラメータを復号化する復号化手段と、前記復号化手段によって復号化されたFM合成のパラメータを用いてFM合成を行うFM合成手段と、前記周波数帯域のパラメータで設定された適用周波数帯域において、前記復号化手段によって復号化された周波数領域の残差信号と前記FM合成手段によって出力された周波数領域の信号とを加算する加算信号算出手段と、前記加算信号算出手段によって生成された周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換手段とを備えたことを特徴とした構成を有している。 Furthermore, the audio signal decoding apparatus of the present invention includes a decoding means for decoding the encoded frequency domain residual signal, the parameter used for FM synthesis, and the parameter of the frequency band in which the residual signal is calculated, FM synthesis means for performing FM synthesis using the FM synthesis parameters decoded by the decoding means, and a frequency domain decoded by the decoding means in an applied frequency band set by the frequency band parameters An addition signal calculation means for adding the residual signal of the signal and the frequency domain signal output by the FM synthesis means, and a frequency for converting the frequency domain signal generated by the addition signal calculation means into a time domain audio signal. And a time conversion means.
この構成により、FM合成信号のパラメータと、オーディオ信号と前記FM合成信号との残差信号と、この残差信号が適用された周波数を示す適用周波数情報とを復号化して、オーディオ信号を再生することができるので、FM合成による信号との差分が実質的に影響を及ぼす範囲でのみ残差信号が符号化された、線形予測による符号化信号より特に圧縮率の高い符号化信号から、オーディオ信号を復号化することができる。 With this configuration, the audio signal is reproduced by decoding the FM composite signal parameter, the residual signal of the audio signal and the FM composite signal, and the applied frequency information indicating the frequency to which the residual signal is applied. Since the residual signal is encoded only in a range in which the difference from the signal by FM synthesis substantially affects, the encoded signal having a higher compression rate than that of the encoded signal by linear prediction can be used. Can be decrypted.
本発明は、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測するFM合成手段と、この信号と元の信号との差分である残差信号を求める残差信号算出手段と、前記パラメータと前記残差信号とを符号化する符号化手段とを設けることにより、線形予測を使用した処理よりもより効率的な符号化処理を行うことができるという効果を有するオーディオ信号符号化復号化装置を提供することができるものである。 The present invention uses an FM synthesis method capable of expressing a complex waveform with fewer parameters than linear prediction, and FM synthesis means for predicting frequency domain spectrum data, and a residual difference between this signal and the original signal. By providing a residual signal calculating means for obtaining a difference signal and an encoding means for encoding the parameter and the residual signal, the encoding process can be performed more efficiently than the process using linear prediction. Therefore, it is possible to provide an audio signal encoding / decoding device having the effect of being able to perform the above.
以下、本発明の実施の形態におけるオーディオ信号符号化装置およびオーディオ信号復号化装置について、図面を用いて説明する。 Hereinafter, an audio signal encoding device and an audio signal decoding device according to embodiments of the present invention will be described with reference to the drawings.
(第1の実施の形態)
本発明の第1の実施の形態におけるオーディオ信号符号化装置のブロック図を、図1に示し説明する。
(First embodiment)
A block diagram of an audio signal encoding apparatus according to the first embodiment of the present invention will be described with reference to FIG.
図1に示すように、オーディオ信号符号化装置10は、時間領域の入力オーディオ信号を周波数領域のスペクトル信号へ変換する時間周波数変換部11と、少ないパラメータで高音質な音声を合成することができるFM合成部12と、上記周波数領域のスペクトル信号とFM合成部12によって算出された周波数領域のスペクトル信号との差を算出する残差信号算出部13と、残差信号算出部13によって算出された残差信号とFM合成部12において使用されたパラメータ等を量子化/符号化する量子化/符号化部14とを備えた構成である。
As shown in FIG. 1, the audio
以上のように構成されたオーディオ信号符号化装置10について、その動作を説明する。
The operation of the audio
まず、時間領域の入力オーディオ信号は、時間周波数変換部11によって周波数領域のスペクトル信号へと変換される。時間周波数変換部11は、FFTやMDCTなどを使用することができる。次に、FM合成部12は、時間周波数変換部11によって変換された周波数領域のスペクトル信号をFM合成方式を用いて近似する。FM合成方式は、楽器のシンセサイザーや携帯電話の音源として幅広く使われている音声合成方式で、少ないパラメータで複雑な波形を出力することが可能である。FM合成方式では、FM(周波数変調)によって波形を変形させることでさまざまな音を作りだす。
First, the time domain input audio signal is converted into a frequency domain spectrum signal by the
ここで、FM合成部12は、複数の発信器から構成されており、この発信器の出力で別の発信器を変調することで音声を作成する。この発信器の個数は、回路規模や演算能力によって変更することが可能である。携帯電話の音源としては、2〜4個、楽器などでは、4〜8個を使用している。FM合成部のもっとも簡単な構成図を、図2に示す。
Here, the
図2に示すように、FM合成部は、2つの発信器21、発信器22を備えた構成であり、発信器21は、発信器22に接続されている。発信器22は、発信器21から出力された波形を変調して出力する。発信器の接続の仕方はアルゴリズムと呼ばれ、複数のアルゴリズムを有することが可能である。例えば、図2のような直列に2つの発信器を接続したものや、図3に示すように、2つの発信器31、発信器32を並列に接続したものなどがある。
As shown in FIG. 2, the FM synthesizing unit includes two
次に図4を用いて、FM合成部12の構成方法について説明する。FM合成部12では、周波数領域のスペクトル信号を解析部46によって基本周波数などを解析し、その解析結果に基づきFM合成のアルゴリズムやパラメータを設定し、FM合成部45によって時間領域の合成波形を出力する。合成波形は、時間周波数変換部49によって周波数領域のスペクトル信号へと変換される。
Next, a configuration method of the
また、演算量が十分に取れる回路であれば、図5のような構成をとることも可能である。ここでは、時間周波数変換部51によって周波数領域のスペクトル信号へと変換された信号と、FM合成部55によって生成されたFM合成波形を時間周波数変換部59によって周波数領域へと変換した信号とを比較部57によって比較し、2つのスペクトルの差が最小になるパラメータを計算する。誤差が最小となるFM合成波形を、周波数領域のスペクトル信号へと変換した信号をFM合成部12は出力する。
Further, if the circuit has a sufficient amount of calculation, the configuration as shown in FIG. 5 can be adopted. Here, the signal converted into the spectrum signal in the frequency domain by the time-
次に、残差信号算出部13は、FM合成部12によって出力された周波数領域のスペクトル信号と、時間周波数変換部11によって変換された周波数領域のスペクトル信号との残差信号を算出する。次に、量子化/符号化部14では、上記残差信号とFM合成に用いたアルゴリズムや周波数などのパラメータ等を量子化/符号化し、ビットストリームを出力する。
Next, the residual
また、MPEG2オーディオ規格AACにおいて圧縮効率をあげるためのツールである、M/Sステレオ部や聴覚心理モデル部を本符号化に適用することも可能である。 It is also possible to apply the M / S stereo part and the psychoacoustic model part, which are tools for increasing the compression efficiency in the MPEG2 audio standard AAC, to this encoding.
このような本発明の第1の実施の形態のオーディオ信号符号化装置によれば、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測することにより、線形予測を使用した処理よりもより効率的な符号化処理を行うことができる。 According to the audio signal encoding apparatus of the first embodiment of the present invention as described above, the spectrum data in the frequency domain is predicted using the FM synthesis method that can express a complex waveform with fewer parameters than the linear prediction. By doing so, it is possible to perform more efficient encoding processing than processing using linear prediction.
(第2の実施の形態)
次に、本発明の第2の実施の形態におけるオーディオ信号符号化装置のブロック図を、図6に示し説明する。
(Second Embodiment)
Next, a block diagram of an audio signal encoding apparatus according to the second embodiment of the present invention will be described with reference to FIG.
図6に示すように、オーディオ信号符号化装置60は、時間領域の入力オーディオ信号を周波数領域のスペクトル信号へ変換する時間周波数変換部61と、少ないパラメータで高音質な音声を合成することができるFM合成部62と、上記周波数領域のスペクトル信号とFM合成部62によって算出された周波数領域のスペクトル信号との差をどの周波数帯域で算出するかを決定する適用周波数算出部68と、上記周波数領域のスペクトル信号とFM合成部62によって算出された周波数領域のスペクトル信号との差を算出する残差信号算出部63と、残差信号算出部63によって算出された残差信号とFM合成部62において使用されたパラメータ等を量子化/符号化する量子化/符号化部64とを備えた構成である。
As shown in FIG. 6, the audio
以上のように構成されたオーディオ信号符号化装置60について、その動作を説明する。
The operation of the audio
まず、時間領域の入力オーディオ信号は、時間周波数変換部61によって周波数領域のスペクトル信号へと変換される。時間周波数変換部61は、FFTやMDCTなどを使用することができる。次に、FM合成部62は、時間周波数変換部61によって変換された周波数領域のスペクトル信号をFM合成方式を用いて上記第1の実施の形態で記載した手法を用いて近似する。
First, the time domain input audio signal is converted into a frequency domain spectrum signal by the
次に、適用周波数算出部68は、時間周波数変換部61によって変換された周波数領域のスペクトル信号と、FM合成部62によって算出された信号とについて、差分をどの周波数帯域で行うかを決定する。例えば、図7に示すように、ある周波数以上は差分を求め、ある周波数以下は差分を求めずに量子化/符号化部64に入力する。また、MPEG2オーディオ規格AACで設定されたスケールファクタバンドと呼ばれる帯域分割された帯域毎に差分を求めてもよい。
Next, the applied
次に、残差信号算出部63は、FM合成部62によって出力された周波数領域のスペクトル信号と、時間周波数変換部61によって変換された周波数領域のスペクトル信号との残差信号を、適用周波数算出部68で算出された周波数帯域において算出する。次に、量子化/符号化部64では、上記残差信号と残差信号を求めた周波数帯域の情報とFM合成に用いたアルゴリズムや周波数などのパラメータ等を量子化/符号化し、ビットストリームを出力する。
Next, the residual
また、MPEG2オーディオ規格AACにおいて圧縮効率をあげるためのツールである、M/Sステレオ部や聴覚心理モデル部を本符号化に適用することも可能である。 It is also possible to apply the M / S stereo part and the psychoacoustic model part, which are tools for increasing the compression efficiency in the MPEG2 audio standard AAC, to this encoding.
このように、本発明の第2の実施の形態におけるオーディオ信号符号化装置によれば、残差信号を算出する周波数帯域を指定し、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測し、FM合成による信号との差分が問題になる範囲でのみ残差信号を符号化することにより、必要外の残差信号を符号化せず、線形予測を使用した処理よりもより効率的な符号化処理を行うとともに、再生時の品質を落とさずに、さらなる符号化効率を高めることができる。 As described above, according to the audio signal encoding device in the second embodiment of the present invention, the frequency band in which the residual signal is calculated can be designated, and a complex waveform can be expressed with fewer parameters than linear prediction. Using the synthesis method, spectrum data in the frequency domain is predicted, and the residual signal is encoded only in a range where the difference from the signal by the FM synthesis becomes a problem, so that the unnecessary residual signal is not encoded. In addition to performing more efficient encoding processing than processing using linear prediction, it is possible to further increase the encoding efficiency without degrading the quality during reproduction.
(第3の実施の形態)
次に、本発明の第3の実施の形態におけるオーディオ信号復号化装置のブロック図を、図8に示し説明する。
(Third embodiment)
Next, a block diagram of an audio signal decoding apparatus according to the third embodiment of the present invention will be described with reference to FIG.
図8に示すように、オーディオ信号復号化装置80は、圧縮されたビットストリームを復号化する復号化部81と、符号化時にFM合成で使用したアルゴリズムや周波数などのパラメータを用いてFM合成し、FM合成された信号を周波数領域の信号として出力するFM合成部82と、FM合成された周波数領域の信号と残差信号とを加算する加算信号算出部83と、周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換部84とを備えた構成である。
As shown in FIG. 8, the audio
以上のように構成されたオーディオ信号復号化装置80について、その動作を説明する。
The operation of the audio
まず、圧縮された入力ビットストリームは、復号化部81によって、符号化時にFM合成で使用したアルゴリズムや周波数などのパラメータと、残差信号とに復号化される。次に、FM合成部82では、復号化部81によって復号化されたFM合成で使用したアルゴリズムや周波数などのパラメータを用いてFM合成をし、その合成波形を時間周波数変換を用いて周波数領域の信号へと変換する。
First, the compressed input bit stream is decoded by a
次に、加算信号算出部83は、復号化部81によって復号化された残差信号と、FM合成部82によって出力された信号とを加算する。この加算された周波数領域の信号を周波数時間変換部84によって時間領域のオーディオ信号へと変換する。
Next, the addition
このように、本発明の第3の実施の形態におけるオーディオ信号復号化装置によれば、FM合成信号のパラメータと、オーディオ信号と前記FM合成信号との残差信号とを復号化して、オーディオ信号を再生することができるので、線形予測による符号化信号より圧縮率の高い符号化信号から、オーディオ信号を復号化することができる。 Thus, according to the audio signal decoding device in the third embodiment of the present invention, the audio signal is decoded by decoding the parameter of the FM synthesized signal and the residual signal of the audio signal and the FM synthesized signal. Therefore, the audio signal can be decoded from the encoded signal having a higher compression rate than the encoded signal based on the linear prediction.
(第4の実施の形態)
次に、本発明の第4の実施の形態におけるオーディオ信号復号化装置のブロック図を、図9に示し説明する。
(Fourth embodiment)
Next, a block diagram of an audio signal decoding apparatus according to the fourth embodiment of the present invention will be described with reference to FIG.
図9に示すように、オーディオ信号復号化装置90は、圧縮されたビットストリームを復号化する復号化部91と、符号化時にFM合成で使用したアルゴリズムや周波数などのパラメータを用いてFM合成し、FM合成された信号を周波数領域の信号として出力するFM合成部92と、FM合成された周波数領域の信号と残差信号とを適用周波数情報で決定される周波数帯域で加算する加算信号算出部93と、周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換部94とを備えた構成である。
As shown in FIG. 9, the audio
以上のように構成されたオーディオ信号復号化装置90について、その動作を説明する。
The operation of the audio
まず、圧縮された入力ビットストリームは、復号化部91によって、符号化時にFM合成で使用したアルゴリズムや周波数などのパラメータと、残差信号と、この残差信号が適用された周波数を示す適用周波数情報とに復号化される。次に、FM合成部92では、復号化部91によって復号化されたFM合成で使用したアルゴリズムや周波数などのパラメータを用いてFM合成をし、その合成波形を時間周波数変換を用いて周波数領域の信号へと変換する。
First, the compressed input bit stream is decoded by the
次に、加算信号算出部93は、復号化部91によって復号化された残差信号と、FM合成部92によって出力された信号とを、復号化部91によって復号化され適用周波数情報で示された周波数帯域で加算する。この加算された周波数領域の信号を周波数時間変換部94によって時間領域のオーディオ信号へと変換する。
Next, the addition
このように、本発明の第4の実施の形態におけるオーディオ信号復号化装置によれば、FM合成信号のパラメータと、オーディオ信号と前記FM合成信号との残差信号と、この残差信号が適用された周波数を示す適用周波数情報とを復号化して、オーディオ信号を再生することができるので、FM合成による信号との差分が実質的に影響を及ぼす範囲でのみ残差信号が符号化された、線形予測による符号化信号より特に圧縮率の高い符号化信号から、オーディオ信号を復号化することができる。 Thus, according to the audio signal decoding device in the fourth embodiment of the present invention, the FM composite signal parameter, the residual signal between the audio signal and the FM composite signal, and the residual signal are applied. Since the audio signal can be reproduced by decoding the applied frequency information indicating the generated frequency, the residual signal is encoded only to the extent that the difference from the signal by the FM synthesis substantially affects, An audio signal can be decoded from an encoded signal having a compression rate that is particularly higher than that of an encoded signal based on linear prediction.
以上のように、本発明にかかるオーディオ信号符号化復号化装置は、複雑な波形を線形予測よりも少ないパラメータで表現可能なFM合成方式を用いて、周波数領域のスペクトルデータを予測し、また、この信号との差分である残差信号を求め、前記パラメータと前記残差信号とを符号化するので、線形予測を使用した処理よりもより効率的な符号化処理を行うことができるという効果を有し、オーディオ信号を符号化するオーディオ信号符号化復号化装置等として有用である。 As described above, the audio signal encoding / decoding device according to the present invention predicts frequency domain spectrum data using an FM synthesis method capable of expressing a complex waveform with fewer parameters than linear prediction, and Since a residual signal that is a difference from this signal is obtained and the parameter and the residual signal are encoded, an effect that the encoding process can be performed more efficiently than the process using linear prediction is achieved. And is useful as an audio signal encoding / decoding device or the like for encoding an audio signal.
10、60 オーディオ信号符号化装置
11、41、49、51、59、61 時間周波数変換部
12、62、82、92 FM合成部
13、63 残差信号算出部
14、64 量子化/符号化部
21、22、31、32 発信器
45、55 FM合成部
46 解析部
57 比較部
68 適用周波数算出部
80、90 オーディオ信号復号化装置
81、91 復号化部
83、93 加算信号算出部
84、94 周波数時間変換部
110 聴覚心理モデル部
111 ゲイン制御部
112 MDCT部
113 TNS処理部
114 インテンシティ/カップリング部
115 予測部
116 M/Sステレオ部
117 正規化係数部
118 量子化部
119 ノイズレス符号化部
120 マルチプレクサ部
121 スペクトル処理部
122 量子化/符号化部
131 MDCT部
132 線形予測部
133 残差信号算出部
134 量子化/符号化部
10, 60 Audio
13, 63 Residual
Claims (4)
前記時間周波数変換手段によって周波数領域へ変換された信号を近似するFM合成手段と、
前記時間周波数変換手段によって周波数領域へ変換された信号と前記FM合成手段によって近似された周波数領域の信号との差分を算出する残差信号算出手段と、
前記残差信号算出手段に算出された周波数領域の残差信号と、前記FM合成手段で使用したパラメータとを符号化する符号化手段とを備えたことを特徴とするオーディオ信号符号化装置。 A time-frequency conversion means for converting a time-domain audio signal into a frequency domain;
FM synthesis means for approximating the signal transformed into the frequency domain by the time-frequency transformation means;
Residual signal calculation means for calculating a difference between the signal converted into the frequency domain by the time frequency conversion means and the frequency domain signal approximated by the FM synthesis means;
An audio signal encoding apparatus comprising: encoding means for encoding the residual signal in the frequency domain calculated by the residual signal calculating means and the parameter used in the FM synthesizing means.
前記残差信号算出手段は、前記適用周波数算出手段に算出された適用周波数帯域の前記残差信号を算出し、
前記符号化手段は、前記適用周波数算出手段が算出した適用周波数帯域をパラメータとして符号化することを特徴とする請求項1に記載のオーディオ信号符号化装置。 An application frequency calculating means for calculating an application range of a frequency for obtaining a residual signal in the residual signal calculating means;
The residual signal calculating means calculates the residual signal of the applied frequency band calculated by the applied frequency calculating means;
The audio signal encoding apparatus according to claim 1, wherein the encoding means encodes the applied frequency band calculated by the applied frequency calculating means as a parameter.
前記復号化手段によって復号化されたパラメータを用いてFM合成を行うFM合成手段と、
前記復号化手段によって復号化された周波数領域の残差信号と、前記FM合成手段によって出力された周波数領域の信号とを加算する加算信号算出手段と、
前記加算信号算出手段によって生成された周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換手段とを備えたことを特徴とするオーディオ信号復号化装置。 Decoding means for decoding the encoded frequency domain residual signal and the parameters used for FM synthesis;
FM synthesis means for performing FM synthesis using the parameters decoded by the decoding means;
An addition signal calculation means for adding the frequency domain residual signal decoded by the decoding means and the frequency domain signal output by the FM synthesis means;
An audio signal decoding apparatus comprising: frequency time conversion means for converting a frequency domain signal generated by the addition signal calculation means into a time domain audio signal.
前記復号化手段によって復号化されたFM合成のパラメータを用いてFM合成を行うFM合成手段と、
前記周波数帯域のパラメータで設定された適用周波数帯域において、前記復号化手段によって復号化された周波数領域の残差信号と、前記FM合成手段によって出力された周波数領域の信号とを加算する加算信号算出手段と、
前記加算信号算出手段によって生成された周波数領域の信号を時間領域のオーディオ信号に変換する周波数時間変換手段とを備えたことを特徴とするオーディオ信号復号化装置。 Decoding means for decoding the encoded frequency domain residual signal, parameters used for FM synthesis, and parameters of the frequency band from which the residual signal was calculated;
FM synthesis means for performing FM synthesis using the parameters of FM synthesis decoded by the decoding means;
Addition signal calculation for adding the frequency domain residual signal decoded by the decoding unit and the frequency domain signal output by the FM synthesizing unit in the applied frequency band set by the frequency band parameter Means,
An audio signal decoding apparatus comprising: frequency time conversion means for converting a frequency domain signal generated by the addition signal calculation means into a time domain audio signal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004226813A JP2006047561A (en) | 2004-08-03 | 2004-08-03 | Audio signal encoding device and audio signal decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004226813A JP2006047561A (en) | 2004-08-03 | 2004-08-03 | Audio signal encoding device and audio signal decoding device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006047561A true JP2006047561A (en) | 2006-02-16 |
Family
ID=36026202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004226813A Pending JP2006047561A (en) | 2004-08-03 | 2004-08-03 | Audio signal encoding device and audio signal decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006047561A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010500631A (en) * | 2006-08-15 | 2010-01-07 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | Free shaping of temporal noise envelope without side information |
US8593321B2 (en) | 2008-09-26 | 2013-11-26 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, and program |
US8601039B2 (en) | 2008-09-26 | 2013-12-03 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, and program |
US8825494B2 (en) | 2008-09-05 | 2014-09-02 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program |
JP2016529547A (en) * | 2013-07-22 | 2016-09-23 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Context-based entropy coding of spectral envelope sample values |
CN110992963A (en) * | 2019-12-10 | 2020-04-10 | 腾讯科技(深圳)有限公司 | Network communication method, device, computer equipment and storage medium |
-
2004
- 2004-08-03 JP JP2004226813A patent/JP2006047561A/en active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010500631A (en) * | 2006-08-15 | 2010-01-07 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | Free shaping of temporal noise envelope without side information |
US8825494B2 (en) | 2008-09-05 | 2014-09-02 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program |
US8593321B2 (en) | 2008-09-26 | 2013-11-26 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, and program |
US8601039B2 (en) | 2008-09-26 | 2013-12-03 | Sony Corporation | Computation apparatus and method, quantization apparatus and method, and program |
JP2016529547A (en) * | 2013-07-22 | 2016-09-23 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Context-based entropy coding of spectral envelope sample values |
US9947330B2 (en) | 2013-07-22 | 2018-04-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Context-based entropy coding of sample values of a spectral envelope |
US10726854B2 (en) | 2013-07-22 | 2020-07-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Context-based entropy coding of sample values of a spectral envelope |
US11250866B2 (en) | 2013-07-22 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Context-based entropy coding of sample values of a spectral envelope |
US11790927B2 (en) | 2013-07-22 | 2023-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Context-based entropy coding of sample values of a spectral envelope |
CN110992963A (en) * | 2019-12-10 | 2020-04-10 | 腾讯科技(深圳)有限公司 | Network communication method, device, computer equipment and storage medium |
CN110992963B (en) * | 2019-12-10 | 2023-09-29 | 腾讯科技(深圳)有限公司 | Network communication method, device, computer equipment and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4934427B2 (en) | Speech signal decoding apparatus and speech signal encoding apparatus | |
RU2555221C2 (en) | Complex transformation channel coding with broadband frequency coding | |
JP5539203B2 (en) | Improved transform coding of speech and audio signals | |
AU733156B2 (en) | Audio coding method and apparatus | |
JP5413839B2 (en) | Encoding device and decoding device | |
JP4296752B2 (en) | Encoding method and apparatus, decoding method and apparatus, and program | |
JP5533502B2 (en) | Audio encoding apparatus, audio encoding method, and audio encoding computer program | |
KR101346358B1 (en) | Method and apparatus for encoding and decoding audio signal using band width extension technique | |
KR20120080257A (en) | Speech decoding device, speech decoding method, and a computer readable recording medium thereon a speech decoding program | |
WO2007026763A1 (en) | Stereo encoding device, stereo decoding device, and stereo encoding method | |
AU2012297805A1 (en) | Encoding device and method, decoding device and method, and program | |
KR20080044707A (en) | Method and apparatus for encoding and decoding audio/speech signal | |
WO2007011157A1 (en) | Virtual source location information based channel level difference quantization and dequantization method | |
JP4685165B2 (en) | Interchannel level difference quantization and inverse quantization method based on virtual sound source position information | |
JP2011059714A (en) | Signal encoding device and method, signal decoding device and method, and program and recording medium | |
JP5036317B2 (en) | Scalable encoding apparatus, scalable decoding apparatus, and methods thereof | |
US7583804B2 (en) | Music information encoding/decoding device and method | |
JP2003523535A (en) | Method and apparatus for converting an audio signal between a plurality of data compression formats | |
JP3923783B2 (en) | Encoding device and decoding device | |
JP2009512895A (en) | Signal coding and decoding based on spectral dynamics | |
JP2002156999A (en) | Noise signal analyzing device, noise signal composing device, noise signal analyzing method, and noise signal composing method | |
JP2006047561A (en) | Audio signal encoding device and audio signal decoding device | |
JP2003110429A (en) | Coding method and device, decoding method and device, transmission method and device, and storage medium | |
KR101387808B1 (en) | Apparatus for high quality multiple audio object coding and decoding using residual coding with variable bitrate | |
JP2004246038A (en) | Speech or musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program |