JP4977471B2 - Encoding apparatus and encoding method - Google Patents
Encoding apparatus and encoding method Download PDFInfo
- Publication number
- JP4977471B2 JP4977471B2 JP2006542421A JP2006542421A JP4977471B2 JP 4977471 B2 JP4977471 B2 JP 4977471B2 JP 2006542421 A JP2006542421 A JP 2006542421A JP 2006542421 A JP2006542421 A JP 2006542421A JP 4977471 B2 JP4977471 B2 JP 4977471B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- encoding
- parameter
- unit
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 30
- 238000001228 spectrum Methods 0.000 claims description 409
- 230000003595 spectral effect Effects 0.000 claims description 74
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000001914 filtration Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 23
- 230000000873 masking effect Effects 0.000 description 23
- 239000013598 vector Substances 0.000 description 23
- 238000000926 separation method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 238000010606 normalization Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、音声信号、オーディオ信号等を符号化する符号化装置及び符号化方法に関する。 The present invention, audio signal relates to a coding apparatus and coding how that turn into codes an audio signal and the like.
移動体通信システムにおける電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、ユーザからは通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。 In order to effectively use radio resources and the like in mobile communication systems, it is required to compress audio signals at a low bit rate. On the other hand, users are demanded to improve the quality of call voice and realize a call service with a high presence. For this realization, it is desirable not only to improve the quality of the audio signal, but also to encode a signal other than audio such as an audio signal having a wider bandwidth with high quality.
このような相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤ部と、入力信号と第1レイヤ復号信号との残差信号を音声以外の信号にも適したモデルで符号化する第2レイヤ部を階層的に組み合わせる構成を採る。このような階層構造を持つ符号化方式は、符号化部より得られるビットストリームにスケーラビリティ性(ビットストリームの一部の情報からでも復号信号が得られること)を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化はその性質から、ビットレートの異なるネットワーク間の通信にも柔軟に対応できる。この特徴は、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものといえる。 In response to such conflicting demands, an approach that hierarchically integrates a plurality of encoding techniques is considered promising. Specifically, a first layer unit that encodes an input signal at a low bit rate with a model suitable for a speech signal, and a residual signal between the input signal and the first layer decoded signal is also suitable for a signal other than speech. A configuration is adopted in which the second layer parts encoded by the model are hierarchically combined. An encoding method having such a hierarchical structure is called scalable encoding because the bit stream obtained from the encoding unit has scalability (a decoded signal can be obtained even from partial information of the bit stream). Because of its nature, scalable coding can flexibly support communication between networks with different bit rates. This feature can be said to be suitable for a future network environment in which various networks are integrated by the IP protocol.
従来のスケーラブル符号化としては、例えば非特許文献1記載のものがある。この文献では、MPEG-4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を構成する方法について述べられている。具体的には、第1レイヤ部(基本レイヤ部)では、CELP(Code Excited Linear Prediction:符号励振線形予測)を用いて音声信号つまり原信号を符号化し、第2レイヤ部(拡張レイヤ部)では、例えばAAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization:周波数領域重み付きインターリーブベクトル量子化)のような変換符号化を用いて残差信号を符号化する。ここで、残差信号は、第1レイヤ部で得られた符号化コードを復号したもの(第1レイヤ復号信号)を原信号から減算することにより得られる信号である。
しかしながら、上記従来技術においては、第2レイヤ部での変換符号化は、原信号から第1レイヤ復号信号を減じて得られる残差信号に対して行われる。よって、原信号に含まれる主要な情報の一部が、第1レイヤ部を介することにより取り除かれることがある。この場合、残差信号の特性が、雑音系列に近い特性となる。したがって、例えばAACやTwinVQのように楽音信号を効率的に符号化するよう設計された変換符号化を、第2レイヤ部に用いる場合、上記特性を持つ残差信号を符号化して復号信号の高品質化を図るには、多くのビットを配分する必要がある。その結果、ビットレートが大きくなってしまうという問題があった。 However, in the above prior art, the transform coding in the second layer unit is performed on the residual signal obtained by subtracting the first layer decoded signal from the original signal. Therefore, some of the main information included in the original signal may be removed by passing through the first layer unit. In this case, the characteristic of the residual signal is a characteristic close to a noise sequence. Therefore, for example, when transform coding designed to efficiently encode a musical tone signal, such as AAC or TwinVQ, is used for the second layer portion, the residual signal having the above characteristics is encoded to increase the decoding signal. In order to improve quality, it is necessary to allocate many bits. As a result, there is a problem that the bit rate is increased.
本発明の目的は、かかる点に鑑みてなされたものであり、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる符号化装置及び符号化方法を提供することである。 The object of the present invention has been made in view of this point, and a high-quality decoded signal can be obtained even if low bit rate encoding is performed in the second layer unit or higher layer unit. to provide a coding apparatus and coding how.
本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして出力する第1パラメータ算出手段と、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして出力する第2パラメータ算出手段と、前記出力される第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定手段と、前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。 An encoding apparatus according to the present invention is an encoding apparatus that generates low frequency band encoded information and high frequency band encoded information from an original signal, wherein the low frequency band encoded information is reduced from the decoded signal. A first spectrum calculating means for calculating a first spectrum of a frequency band; a second spectrum calculating means for calculating a second spectrum from the original signal; and a filter having the first spectrum as an internal state. A first parameter calculating means for outputting a parameter indicating a characteristic as a first parameter indicating the degree of similarity between the first spectrum and the high frequency band portion of the second spectrum; and a spectrum in which a plurality of spectral residual candidates are recorded. the sign of the candidate of one spectral residuals from the residual shape codebook, variations formed between the first spectrum and the second spectrum of the high frequency band portion A second parameter calculating means for outputting as a second parameter indicating, among the first parameter and the second parameter is the output, the first to produce an estimate of the most similar to the high frequency band portion of the second spectrum A configuration is adopted that includes determination means for simultaneously determining a parameter and the second parameter, and encoding means for encoding the determined first parameter and second parameter as encoding information of the high frequency band.
本発明の符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして算出する第1パラメータ算出ステップと、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして算出する第2パラメータ算出ステップと、前記算出された第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定ステップと、前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、を有するようにした。 The encoding method of the present invention is an encoding method for generating low-frequency band encoded information and high-frequency band encoded information from an original signal, wherein the low-frequency band encoded information is decoded from the decoded signal. A first spectrum calculating step for calculating a first spectrum of a frequency band; a second spectrum calculating step for calculating a second spectrum from the original signal; and a filter having the first spectrum as an internal state. A first parameter calculating step for calculating a parameter indicating characteristics as a first parameter indicating the degree of similarity between the first spectrum and the high frequency band portion of the second spectrum, and a spectrum in which a plurality of spectral residual candidates are recorded the sign of the candidate of one spectral residuals from the residual shape codebook, the first spectrum and the second spectrum of a high frequency band Generating a second parameter calculating step of calculating a second parameter indicating a fluctuation component, from the first parameter and the second parameter the calculated, the estimated value most similar to the high frequency band portion of the second spectrum and A determination step for simultaneously determining the first parameter and the second parameter, and an encoding step for encoding the determined first parameter and the second parameter as encoding information of the high frequency band. I made it.
本発明によれば、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる。 According to the present invention, a high-quality decoded signal can be obtained even when low bit rate encoding is performed in the second layer unit or higher layer unit.
本発明は、スケーラブル符号化の上位レイヤに適した変換符号化に関し、より具体的には、当該変換符号化におけるスペクトルの効率的な符号化法に関する。 The present invention relates to transform coding suitable for an upper layer of scalable coding, and more specifically to an efficient spectrum coding method in the transform coding.
その主な特徴の1つは、第1レイヤ復号信号を周波数分析して得られるスペクトル(第1レイヤ復号スペクトル)を内部状態(フィルタ状態)として持つフィルタを用いてフィルタリング処理を行い、その出力信号を原スペクトルの高域部の推定値とする。ここで、原スペクトルとは、遅延調整された原信号を周波数分析して得られるスペクトルのことである。そして、原スペクトルの高域部に最も類似する出力信号を生成するときのフィルタ情報を符号化して復号化部へ伝送する。フィルタ情報のみを符号化すれば良いため、低ビットレート化が図れる。 One of the main features is that filtering processing is performed using a filter having a spectrum (first layer decoded spectrum) obtained by frequency analysis of the first layer decoded signal as an internal state (filter state), and an output signal thereof Is the estimated value of the high frequency part of the original spectrum. Here, the original spectrum is a spectrum obtained by frequency analysis of the delay-adjusted original signal. Then, the filter information for generating the output signal most similar to the high frequency part of the original spectrum is encoded and transmitted to the decoding unit. Since only the filter information needs to be encoded, the bit rate can be reduced.
本発明のある実施の形態では、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を用いて、前述のフィルタにスペクトル残差を与えてフィルタリング処理を行う。また、他の実施の形態では、第1レイヤ復号スペクトルをフィルタの内部状態に
格納する前に第1レイヤ復号スペクトルの誤差成分を符号化して、第1レイヤ復号スペクトルの品質を向上させてから、フィルタリング処理による原スペクトルの高域部の推定を行う。また、さらに他の実施の形態では、第1レイヤ復号スペクトルの誤差成分を符号化する際に、第1レイヤ復号スペクトルの符号化の性能と第1レイヤ復号スペクトルを使った高域スペクトルの推定の性能とがいずれも高くなるように第1レイヤ復号スペクトルの誤差成分の符号化を行う。
In an embodiment of the present invention, a filtering process is performed by giving a spectral residual to the aforementioned filter using a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded. In another embodiment, the error component of the first layer decoded spectrum is encoded before storing the first layer decoded spectrum in the internal state of the filter to improve the quality of the first layer decoded spectrum. The high-frequency part of the original spectrum is estimated by filtering processing. In still another embodiment, when the error component of the first layer decoded spectrum is encoded, the encoding performance of the first layer decoded spectrum and the estimation of the high frequency spectrum using the first layer decoded spectrum are performed. The error component of the first layer decoded spectrum is encoded so that both performances are high.
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、各実施の形態では、複数のレイヤからなる階層構造を有するスケーラブル符号化を行う。また、各実施の形態では、一例として、(1)スケーラブル符号化の階層構造は、第1レイヤ(基本レイヤまたは下位レイヤ)と第1レイヤより上位にある第2レイヤ(拡張レイヤまたは上位レイヤ)の2階層とする、(2)第2レイヤの符号化では、周波数領域で符号化(変換符号化)を行う、(3)第2レイヤの符号化における変換方式にはMDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を使用する、(4)第2レイヤの符号化では、全帯域を複数のサブバンドに分割する場合は、全帯域をBarkスケールで等間隔に分割し各サブバンドを各臨界帯域に対応付ける、(5)第1レイヤの入力信号のサンプリングレート(F1)と第2レイヤの入力信号のサンプリングレート(F2)には、F2はF1以上(F1≦F2)の関係がある、ものとする。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In each embodiment, scalable coding having a hierarchical structure composed of a plurality of layers is performed. In each embodiment, as an example, (1) the hierarchical structure of scalable coding includes a first layer (basic layer or lower layer) and a second layer (an enhancement layer or upper layer) that is higher than the first layer. (2) In the second layer encoding, encoding (transform encoding) is performed in the frequency domain. (3) The transform method in the second layer encoding is MDCT (Modified Discrete Cosine Transform). (4) In the encoding of the second layer, when dividing the entire band into a plurality of subbands, the entire band is divided into equal intervals on the Bark scale and each subband is divided into each subband. (5) F2 is greater than or equal to F1 (F1 ≦ F2) for the sampling rate (F1) of the input signal of the first layer and the sampling rate (F2) of the input signal of the second layer that correspond to the critical band It is assumed that there is a relationship.
(実施の形態1)
図1は、例えば音声符号化装置等を形成する符号化装置100の構成を示すブロック図である。符号化装置100は、ダウンサンプリング部101、第1レイヤ符号化部102、第1レイヤ復号化部103、多重化部104、第2レイヤ符号化部105および遅延部106を有する。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of an
図1において、サンプリングレートがF2の音声信号やオーディオ信号(原信号)はダウンサンプリング部101に与えられ、ダウンサンプリング部101にてサンプリング変換処理が行われ、サンプリングレートがF1の信号が生成され、第1レイヤ符号化部102に与えられる。第1レイヤ符号化部102は、サンプリングレートがF1の信号を符号化して得られる符号化コードを第1レイヤ復号化部103および多重化部104に出力する。
In FIG. 1, an audio signal or an audio signal (original signal) having a sampling rate of F2 is given to the
第1レイヤ復号化部103は、第1レイヤ符号化部102から出力された符号化コードから第1レイヤ復号信号を生成して第2レイヤ符号化部105に出力する。
First
遅延部106は、原信号に対して所定の長さの遅延を与えて第2レイヤ符号化部105に出力する。この遅延は、ダウンサンプリング部101、第1レイヤ符号化部102および第1レイヤ復号化部103で生じる時間遅れを調整するためのものである。
第2レイヤ符号化部105は、遅延部106から出力された原信号を、第1レイヤ復号化部103から出力された第1レイヤ復号信号を用いて符号化を行う。そして、この符号化により得られる符号化コードを多重化部104に出力する。
Second
多重化部104は、第1レイヤ符号化部102から出力された符号化コードと第2レイヤ符号化部105から出力された符号化コードとを多重化し、ビットストリームとして出力する。
The
次いで、第2レイヤ符号化部105についてより詳細に説明する。第2レイヤ符号化部105の構成を図2に示す。第2レイヤ符号化部105は、周波数領域変換部201、拡張帯域符号化部202、周波数領域変換部203および聴覚マスキング算出部204を有
する。
Next, second
図2において、周波数領域変換部201は、第1レイヤ復号化部103から出力された第1レイヤ復号信号をMDCT変換により周波数分析してMDCT係数(第1レイヤ復号スペクトル)を算出する。そして、第1レイヤ復号スペクトルを拡張帯域符号化部202に出力する。
In FIG. 2, the frequency
周波数領域変換部203は、遅延部106から出力された原信号をMDCT変換により周波数分析してMDCT係数(原スペクトル)を算出する。そして、原スペクトルを拡張帯域符号化部202に出力する。
The frequency
聴覚マスキング算出部204は、遅延部106から出力された原信号を用いて、帯域毎の聴覚マスキングを算出し、この聴覚マスキングを拡張帯域符号化部202に通知する。
The auditory
ここで、人間の聴覚特性には、ある信号が聞こえているときにその信号と周波数の近い音が耳に入ってきてもその音が聞こえにくい、という聴覚マスキング特性がある。上記聴覚マスキングは効率的なスペクトル符号化を実現するために用いられる。このスペクトル符号化では、人間の聴覚マスキング特性を利用して聴感上許容される量子化歪を定量化し、その許容される量子化歪に応じた符号化法を適用する。 Here, human auditory characteristics include an auditory masking characteristic that when a signal is heard, even if a sound having a frequency close to that of the signal enters the ear, the sound is difficult to hear. The auditory masking is used to realize efficient spectral coding. In this spectral coding, quantization distortion that is permissible for auditory perception is quantified using human auditory masking characteristics, and a coding method corresponding to the permissible quantization distortion is applied.
拡張帯域符号化部202は、図3に示すように、振幅調整部301、フィルタ状態設定部302、フィルタリング部303、ラグ設定部304、スペクトル残差形状符号帳305、探索部306、スペクトル残差ゲイン符号帳307、乗算器308、拡張スペクトル復号化部309およびスケールファクタ符号化部310を有する。
As shown in FIG. 3, the extension
振幅調整部301には、周波数領域変換部201から第1レイヤ復号スペクトル{S1(k);0≦k<Nn}、周波数領域変換部203から原スペクトル{S2(k);0≦k<Nw}が与えられる。ここで、第1レイヤ復号スペクトルのスペクトル点数をNn、原スペクトルのスペクトル点数をNwと表し、Nn<Nwの関係がある。
The
振幅調整部301は、第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の最大振幅スペクトルと最小振幅スペクトルの比(ダイナミックレンジ)が、原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに近づくよう振幅調整を行う。具体的には、次の式(1)に示すように、振幅スペクトルのべき乗をとる。
ここで、sign()は正号/負号を返す関数、γは0≦γ≦1の範囲にある実数を表す。振幅調整部301は、振幅調整後の第1レイヤ復号スペクトルのダイナミックレンジが原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに最も近づくときのγ(振幅調整係数)を、あらかじめ用意された複数の候補の中から選択し、その符号化コードを多重化部104に出力する。
Here, sign () represents a function that returns a positive / negative sign, and γ represents a real number in the range of 0 ≦ γ ≦ 1. The
フィルタ状態設定部302は、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を後述するピッチフィルタの内部状態に設定する。具体的には、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファ{S(k);0≦k<Nn}に代入し、フィルタリング部303へ出力する。ここで、生成スペクトルバッファS(k)は、0≦k<Nwの範囲で定義される配列変数である
。後述するフィルタリング処理によって(Nw−Nn)点の原スペクトルの推定値(以下「推定原スペクトル」と言う)の候補が生成される。
The filter
ラグ設定部304は、探索部306からの指示に従い、ラグTを予め定められた探索範囲TMIN〜TMAXの中で漸次的に少しずつ変化させながら、フィルタリング部303に順次出力する。
In accordance with an instruction from the
スペクトル残差形状符号帳305は、複数のスペクトル残差形状ベクトルの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差形状ベクトルを順次出力する。
The spectral residual shape codebook 305 stores a plurality of spectral residual shape vector candidates. Further, in accordance with an instruction from the
同様に、スペクトル残差ゲイン符号帳307は複数のスペクトル残差ゲインの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差ゲインを順次出力する。
Similarly, the spectral residual gain codebook 307 stores a plurality of spectral residual gain candidates. Further, in accordance with an instruction from the
乗算器308は、スペクトル残差形状符号帳305から出力されるスペクトル残差形状ベクトルと、スペクトル残差ゲイン符号帳307から出力されるスペクトル残差ゲインと、を乗じて、スペクトル残差形状ベクトルをゲイン調整する。そして、ゲイン調整されたスペクトル残差形状ベクトルをフィルタリング部303に出力する。
The
フィルタリング部303は、フィルタ状態設定部302で設定されたピッチフィルタの内部状態と、ラグ設定部304から出力されるラグTと、ゲイン調整されたスペクトル残差形状ベクトルとを用いてフィルタリング処理を行い、推定原スペクトルを算出する。ここで、ピッチフィルタの伝達関数は、次の式(2)で表される。また、このフィルタリング処理は、次の式(3)のように表される。
ここで、C(i,k)は第i番目のスペクトル残差形状ベクトル、g(j)は第j番目のスペクトル残差形状ゲインを表す。範囲Nn≦k<Nwに含まれる生成スペクトルバッファS(k)がフィルタリング部303の出力信号(つまり、推定原スペクトル)として探索部306に出力される。図4に、生成スペクトルバッファ、振幅調整後の第1レイヤ復号スペクトル、フィルタリング部303の出力信号の相互関係を示す。
Here, C (i, k) represents the i-th spectral residual shape vector, and g (j) represents the j-th spectral residual shape gain. The generated spectrum buffer S (k) included in the range Nn ≦ k <Nw is output to the
探索部306は、ラグ設定部304、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307に、ラグ、スペクトル残差形状およびスペクトル残差ゲインの出力をそれぞれ指示する。
また、探索部306は、原スペクトルの高域部{S2(k);Nn≦k<Nw}とフィルタリング部303の出力信号{S(k);Nn≦k<Nw}との間の歪Eを算出する。そして、合成による分析手法(AbS;Analysis by Synthesis)により、最も歪が小さくなるときのラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインの組み合わせを決定する。このとき、聴覚マスキング算出部204から出力された聴覚マスキングを利用して、聴感的に最も歪の小さい組み合わせを選択する。この歪をEとすると、歪Eは、例えば聴覚マスキングにより定まる重み関数w(k)を用いて式
(4)によって表される。ここで、重み関数w(k)は、聴覚マスキングの大きい(歪が聞こえ難い)周波数では小さな値をとり、聴覚マスキングの小さい(歪が聞こえ易い)周波数では大きな値をとる。
探索部306により決定されたラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードは、多重化部104および拡張スペクトル復号化部309に出力される。
The lag encoding code, spectral residual shape vector encoding code, and spectral residual gain encoding code determined by
上記のAbSによる符号化コード決定法においては、ラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを同時に決定しても良いし、あるいは、演算量を削減するために各パラメータを順次(例えば、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲインの順に)決定しても良い。 In the above-described coding code determination method using AbS, the lag, the spectral residual shape vector, and the spectral residual gain may be determined at the same time, or each parameter is sequentially set (for example, the lag is reduced in order to reduce the calculation amount). , In the order of spectral residual shape vector and spectral residual gain).
拡張スペクトル復号化部309は、振幅調整部301より出力される振幅調整係数の符号化コードならびに探索部306より出力されるラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードを復号し、原スペクトルの推定値(推定原スペクトル)を生成する。
The extended
具体的には、まず、復号された振幅調整係数γを用いて前述の式(1)に従い第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の振幅調整を行う。次に、振幅調整された第1レイヤ復号スペクトルをフィルタの内部状態として用いるとともに、それぞれ復号されたラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを用いて、前述の式(3)に従ってフィルタリング処理を行い、推定原スペクトル{S(k);Nn≦k<Nw}を生成する。生成された推定原スペクトルはスケールファクタ符号化部310に出力される。
Specifically, first, amplitude adjustment of the first layer decoded spectrum {S1 (k); 0 ≦ k <Nn} is performed using the decoded amplitude adjustment coefficient γ according to the above-described equation (1). Next, the amplitude-adjusted first layer decoded spectrum is used as an internal state of the filter, and filtering processing is performed according to the above-described equation (3) using the decoded lag, spectral residual shape vector, and spectral residual gain, respectively. To generate an estimated original spectrum {S (k); Nn ≦ k <Nw}. The generated estimated original spectrum is output to scale
スケールファクタ符号化部310は、周波数領域変換部203より出力される原スペクトルの高域部{S2(k);Nn≦k<Nw}と拡張スペクトル復号化部309より出力される推定原スペクトル{S(k);Nn≦k<Nw}とを用いて、聴覚マスキングを利用して聴感上最も適した推定原スペクトルのスケールファクタ(スケーリング係数)を符号化し、その符号化コードを多重化部104に出力する。
The scale
すなわち、第2レイヤ符号化コードは、振幅調整部301から出力される符号化コード(振幅調整係数)、探索部306から出力される符号化コード(ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン)およびスケールファクタ符号化部310から出力される符号化コード(スケールファクタ)の組み合わせからなる。
That is, the second layer encoded code includes an encoded code (amplitude adjustment coefficient) output from the
なお、本実施の形態では、帯域Nn〜Nwに対して拡張帯域符号化部202を適用して一組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定する構成について説明しているが、帯域Nn〜Nwを複数の帯域に分割し各帯域に対して拡張帯域符号化部202を適用する構成にしても良い。この場合、帯域毎に符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定し、多重化部104に出力することになる。例えば、帯域Nn〜NwをM個の帯域に分割して各帯域で拡張帯域符号化部202を適用すると、M組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベク
トル、スペクトル残差ゲイン、スケールファクタ)が得られることになる。
In the present embodiment, the extended
また、複数帯域でそれぞれ独立の符号化コードを送らずに、隣接する帯域同士で一部の符号化コードを共有しても良い。例えば、帯域Nn〜NwをM個の帯域に分割し、隣接する2つの帯域で共通の振幅調整係数を用いる場合、振幅調整係数の符号化コードの数はM/2個となり、それ以外の符号化コードの数はそれぞれM個となる。 Further, a part of the encoded codes may be shared between adjacent bands without sending independent encoded codes in a plurality of bands. For example, when the bands Nn to Nw are divided into M bands and a common amplitude adjustment coefficient is used in two adjacent bands, the number of encoded codes of the amplitude adjustment coefficient is M / 2, and the other codes The number of conversion codes is M.
なお、本実施の形態は1次のAR型ピッチフィルタを用いた場合について説明してきた。しかしながら、本発明が適用できるフィルタは1次のAR型ピッチフィルタに限定されず、伝達関数が次の式(5)で表されるフィルタにも本発明を適用することができる。フィルタ次数を規定するパラメータLおよびMの大きいピッチフィルタを用いるほど多様な特性を表現でき、品質が向上する可能性がある。ただし、次数が大きくなるほどフィルタ係数の符号化ビットを多く配分する必要が出てくるため、実用的なビット配分の元で適切なピッチフィルタの伝達関数を決めておく必要がある。
なお、本実施の形態では聴覚マスキングを用いることを前提としているが、聴覚マスキングを用いない構成であっても良い。その場合、図2の聴覚マスキング算出部204を第2レイヤ符号化部105に設ける必要が無くなり、装置全体の演算量を削減できる。
In this embodiment, it is assumed that auditory masking is used, but a configuration that does not use auditory masking may be used. In this case, it is not necessary to provide the auditory
ここで、多重化部104から出力されるビットストリームの構成について、図5を用いて説明する。ビットストリームのMSB(Most Significant Bit)から順に、第1レイヤ符号化コード、第2レイヤ符号化コードが格納されている。さらに、第2レイヤ符号化コードは、スケールファクタ、振幅調整係数、ラグ、スペクトル残差ゲイン、スペクトル残差形状ベクトルの順に格納され、後者の情報ほどLSB(Least Significant Bit)に近い位置に配置されている。このビットストリームの構成は、各符号化コードの符号欠落に対する感度(符号化コードが欠落したときにどの程度復号信号の品質を劣化させるか)に対して、符号誤り感度の高い(大きく劣化する)ものほどMSBに近い位置に配置されている。この構成によれば、伝送路上でビットストリームを部分的に破棄する場合にLSBから順に破棄することで、破棄による劣化を最小限に抑えることができる。LSB側から優先的にビットストリームを破棄するネットワーク構成の一例では、図5のように区切られた各符号化コードを別々のパケットで伝送し、各パケットに優先順位付けをして、優先制御のできるパケット網を使う構成が挙げられる。ただし、ネットワーク構成は前述のものに限定されない。
Here, the configuration of the bit stream output from the
また、図5のように符号誤り感度の高い符号化パラメータほどMSBに近い位置に配置されるビットストリーム構成において、MSBに近いビットほど強い誤り検出・誤り訂正がかけられるようなチャネル符号化を適用すれば、復号品質の劣化を最小限に抑えられるという効果が得られる。例えば、誤り検出、誤り訂正の手法としてはCRC符号やRS符号などが適用できる。 In addition, in the bit stream configuration in which the coding parameters with higher code error sensitivity are arranged closer to the MSB as shown in FIG. 5, channel coding is applied such that stronger error detection and error correction is applied to the bits closer to the MSB. By doing so, it is possible to obtain an effect that degradation of decoding quality can be minimized. For example, a CRC code, an RS code, or the like can be applied as a method for error detection and error correction.
図6は、例えば音声復号化装置等を形成する復号化装置600の構成を示すブロック図である。
FIG. 6 is a block diagram illustrating a configuration of a
復号化装置600は、符号化装置100から出力されたビットストリームを第1レイヤ符号化コードと第2レイヤ符号化コードとに分離する分離部601、第1レイヤ符号化コードを復号する第1レイヤ復号化部602および第2レイヤ符号化コードを復号する第2レイヤ復号化部603を有する。
分離部601は、符号化装置100から送出されたビットストリームを受信し、第1レイヤの符号化コードと第2レイヤの符号化コードとに分離し、第1レイヤ復号化部602と第2レイヤ復号化部603にそれぞれ出力する。
Separating section 601 receives the bitstream sent from encoding
第1レイヤ復号化部602は、第1レイヤ符号化コードから第1レイヤ復号信号を生成して、第2レイヤ復号化部603に出力する。また、生成された第1レイヤ復号信号を、必要に応じて、最低限の品質が担保された復号信号(第1レイヤ復号信号)として出力する。
First
第2レイヤ復号化部603は、第1レイヤ復号信号と第2レイヤ符号化コードとを用いて、高品質の復号信号(ここでは、第2レイヤ復号信号と称す)を生成し、必要に応じてこの復号信号を出力する。
Second
このように、第1レイヤ復号信号によって再生音声の最低限の品質が担保され、第2レイヤ復号信号によって再生音声の品質を高めることができる。また、出力する信号を第1レイヤ復号信号または第2レイヤ復号信号のどちらにするかは、ネットワーク環境(パケットロスの発生等)によって第2レイヤ符号化コードが得られるかどうか、または、アプリケーションやユーザの設定等に依存する。 In this way, the minimum quality of the reproduced sound is ensured by the first layer decoded signal, and the quality of the reproduced sound can be enhanced by the second layer decoded signal. In addition, whether the output signal is the first layer decoded signal or the second layer decoded signal depends on whether the second layer encoded code can be obtained depending on the network environment (occurrence of packet loss, etc.) Depends on user settings.
第2レイヤ復号化部603の構成を、図7を用いて詳細に行う。図7において、第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
The configuration of second
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、そのパラメータをスペクトル点数がNnの第1レイヤ復号スペクトルとして拡張帯域復号化部701に出力する。
Frequency
拡張帯域復号化部701は、分離部601から入力された第2レイヤ符号化コード(この構成では拡張帯域符号化コードと同一)から各種パラメータ(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を復号する。また、復号された各種パラメータと周波数領域変換部702から出力された第1レイヤ復号スペクトルとを用いて帯域拡張された第2の復号スペクトルであってスペクトル点数がNwの第2のスペクトルを生成する。そして、第2の復号スペクトルを時間領域変換部703に出力する。
The extension
時間領域変換部703は、第2の復号スペクトルを時間領域の信号に変換した後、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行って、フレーム間に生じる不連続を回避し、第2レイヤ復号信号を出力する。
The time
次に、拡張帯域復号化部701の詳細な説明を、図8を用いて行う。図8において、拡張帯域復号化部701は、分離部801、振幅調整部802、フィルタ状態設定部803、フィルタリング部804、スペクトル残差形状符号帳805、スペクトル残差ゲイン符号帳806、乗算器807、スケールファクタ復号化部808、スケーリング部809およびスペクトル合成部810を有する。
Next, detailed description of the extended
分離部801は、分離部601から入力される拡張帯域符号化コードを振幅調整係数符号化コード、ラグ符号化コード、残差形状符号化コード、残差ゲイン符号化コード、スケールファクタ符号化コード、に分離する。また、振幅調整係数符号化コードを振幅調整部802に、ラグ符号化コードをフィルタリング部804に、残差形状符号化コードをスペクトル残差形状符号帳805に、残差ゲイン符号化コードをスペクトル残差ゲイン符号帳806に、スケールファクタ符号化コードをスケールファクタ復号化部808に、それぞれ出力する。
The
振幅調整部802は、分離部801から入力された振幅調整係数符号化コードを復号し、復号された振幅調整係数を用いて、別途周波数領域変換部702から入力された第1レイヤ復号スペクトルの振幅を調整し、振幅調整後の第1レイヤ復号スペクトルをフィルタ状態設定部803に出力する。振幅調整は、前述の式(1)で表される方法で行う。ここで、S1(k)は第1レイヤ復号スペクトル、S1’(k)は振幅調整後の第1レイヤ復号スペクトルを表す。
The
フィルタ状態設定部803は、前述の式(2)で表される伝達関数のピッチフィルタのフィルタ状態に振幅調整後の第1レイヤ復号スペクトルを設定する。具体的には振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファS(k)に代入し、フィルタリング部804へ出力する。ここで、Tはピッチフィルタのラグである。また、生成スペクトルバッファS(k)は、k=0〜Nw−1の範囲で定義される配列変数であり、本フィルタリング処理によって(Nw−Nn)点のスペクトルが生成される。
The filter
フィルタリング部804は、分離部801から入力されたラグTを復号し、復号されたラグTを用いて、フィルタ状態設定部803から入力された生成スペクトルバッファS(k)に対してフィルタリング処理を行う。具体的には、前述の式(3)に示される方法によって出力スペクトル{S(k);Nn≦k<Nw}を生成する。ここで、g(j)は残差ゲイン符号化コードjにより表されるスペクトル残差ゲイン、C(i,k)は残差形状符号化コードiにより表されるスペクトル残差形状ベクトルをそれぞれ示しており、g(j)・C(i,k)は乗算器807から入力される。生成されたフィルタリング部804の出力スペクトル{S(k);Nn≦k<Nw}はスケーリング部809へ出力される。
The
スペクトル残差形状符号帳805は、分離部801から入力された残差形状符号化コードを復号し、復号結果に対応するスペクトル残差形状ベクトルC(i,k)を乗算器807へ出力する。
The spectral
スペクトル残差ゲイン符号帳806は、分離部801から入力された残差ゲイン符号化コードを復号し、復号結果に対応するスペクトル残差ゲインg(j)を乗算器807へ出力する。
The spectral
乗算器807は、スペクトル残差形状符号帳805から入力されたスペクトル残差形状ベクトルC(i,k)と、スペクトル残差ゲイン符号帳806から入力されたスペクトル残差ゲインg(j)と、の乗算結果をフィルタリング部804へ出力する。
The
スケールファクタ復号化部808は、分離部801から入力されたスケールファクタ符号化コードを復号し、復号されたスケールファクタをスケーリング部809へ出力する。
The scale
スケーリング部809は、フィルタリング部804から与えられた出力スペクトル{S(k);Nn≦k<Nw}に、スケールファクタ復号化部808から入力されたスケール
ファクタを乗じて、その乗算結果をスペクトル合成部810に出力する。
The
スペクトル合成部810は、周波数領域変換部702より与えられる第1レイヤ復号スペクトル{S1(k);0≦k<Nn}と、スケーリング部809から出力されるスケーリング後の生成スペクトルバッファの高域部{S(k);Nn≦k<Nw}を結合して得られるスペクトルを第2の復号スペクトルとして時間領域変換部703に出力する。
(実施の形態2)
図9に、本発明の実施の形態2に係る第2レイヤ符号化部105の構成を示す。図9において図2と同一名称を持つブロックは、同様の機能を有するので、ここではその詳細な説明を省略する。図2と図9の違いは、周波数領域変換部201と拡張帯域符号化部202との間に第1スペクトル符号化部901が存在する点にある。第1スペクトル符号化部901は、周波数領域変換部201より出力される第1レイヤ復号スペクトルの品質を向上させ、そのときの符号化コード(第1のスペクトル符号化コード)を多重化部104に出力するとともに、品質向上された第1レイヤ復号スペクトル(第1の復号スペクトル)を拡張帯域符号化部202に与える。拡張帯域符号化部202は、前述の処理を第1の復号スペクトルを用いて行い、その結果として拡張帯域符号化コードを出力する。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コードと第1のスペクトル符号化コードとの組み合わせからなる。したがって、本実施の形態では、多重化部104は、第1レイヤ符号化コード、拡張帯域符号化コードおよび第1のスペクトル符号化コードを多重化して、ビットストリームを生成する。
(Embodiment 2)
FIG. 9 shows the configuration of second
次に、第1スペクトル符号化部901の詳細を、図10を用いて説明する。第1スペクトル符号化部901は、スケーリング係数符号化部1001、スケーリング係数復号化部1002、微細スペクトル符号化部1003、多重化部1004、微細スペクトル復号化部1005、正規化部1006、減算器1007および加算器1008を有する。
Next, details of the first
減算器1007は、原スペクトルから第1レイヤ復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1001および正規化部1006に出力する。スケーリング係数符号化部1001は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、その符号化コードを多重化部1004およびスケーリング係数復号化部1002に出力する。
The
スケーリング係数の符号化においては、聴覚マスキングを用いても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。これにより、スケーリング係数の符号化を効率化することができる。 Auditory masking may be used in encoding the scaling factor. For example, bit allocation necessary for encoding the scaling coefficient is determined using auditory masking, and encoding is performed based on the bit allocation information. At this time, if there is a band to which no bits are allocated, the scaling coefficient of that band is not encoded. Thereby, the encoding of a scaling factor can be made efficient.
スケーリング係数復号化部1002は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1006、微細スペクトル符号化部1003および微細スペクトル復号化部1005に出力する。
The scaling
正規化部1006は、スケーリング係数復号化部1002より与えられるスケーリング係数を用いて、減算器1007より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1003に出力する。
The
微細スペクトル符号化部1003は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられるビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル
)の符号化を行う。そして、この符号化によって得られた微細スペクトル符号化コードを多重化部1004および微細スペクトル復号化部1005に出力する。
The fine
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル符号化部1003へ入力するように構成する。
In addition, when encoding the residual spectrum after normalization, it may be encoded using auditory masking so as to reduce auditory distortion. Moreover, you may make it use the information of a 1st layer decoding spectrum for calculation of auditory importance. In this case, the first layer decoded spectrum is input to the fine
スケーリング係数符号化部1001および微細スペクトル符号化部1003より出力される符号化コードは、多重化部1004にて多重化され、第1のスペクトル符号化コードとして多重化部104に出力される。
The encoded codes output from the scaling
微細スペクトル復号化部1005は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられたビット数を求め、スケーリング係数と微細スペクトル符号化部1003から入力された微細スペクトル符号化コードとから各帯域の残差スペクトルを復号し、復号された残差スペクトルを加算器1008へ出力する。なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1005へ入力するように構成する。
The fine
加算器1008は、復号された残差スペクトルと第1レイヤ復号スペクトルとを加算して第1の復号スペクトルを生成し、生成された第1の復号スペクトルを拡張帯域符号化部202へ出力する。
このように本実施の形態によれば、第1レイヤ復号スペクトルの品質を改善した後に、品質改善後のスペクトル、つまり第1のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成することにより、帯域拡張された復号信号の品質を改善することができる。
As described above, according to the present embodiment, after improving the quality of the first layer decoded spectrum, the extended
本実施の形態の第2レイヤ復号化部603の構成を、図11を用いて詳細に行う。図11において図7と同一名称のブロックは、同一の機能を有するため、ここではその詳細な説明を省略する。図11において、第2レイヤ復号化部603は、分離部1101、第1スペクトル復号化部1102、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。
The configuration of second
分離部1101は、第2レイヤ符号化コードを、第1のスペクトル符号化コード、拡張帯域符号化コード、に分離し、第1のスペクトル符号化コードを第1スペクトル復号化部1102に、拡張帯域符号化コードを拡張帯域復号化部701に、それぞれ出力する。
Separating
周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、このパラメータを第1レイヤ復号スペクトルとして第1スペクトル復号化部1102に出力する。
Frequency
第1スペクトル復号化部1102は、分離部1101から入力された第1のスペクトル符号化コードを復号して得られる第1レイヤの符号化誤差の量子化スペクトルを、周波数領域変換部702から入力された第1レイヤ復号スペクトルに加える。そして、その加算結果を第1の復号スペクトルとして拡張帯域復号化部701へ出力する。
First
ここで、第1スペクトル復号化部1102の説明を、図12を用いて詳細に行う。第1スペクトル復号化部1102は、分離部1201、スケーリング係数復号化部1202、
微細スペクトル復号化部1203およびスペクトル復号部1204を有する。
Here, the first
A fine
分離部1201は、入力された第1のスペクトル符号化コードから、スケーリング係数を表す符号化コードと、微細スペクトル(スペクトル微細構造)を表す符号化コードと、を分離し、スケーリング係数符号化コードをスケーリング係数復号化部1202に、微細スペクトル符号化コードを微細スペクトル復号化部1203に、それぞれ出力する。
The
スケーリング係数復号化部1202は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数をスペクトル復号部1204および微細スペクトル復号化部1203に出力する。
The scaling
微細スペクトル復号化部1203は、スケーリング係数復号化部1202から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域の微細スペクトルに割り当てられたビット数を求める。また、分離部1201から入力された微細スペクトル符号化コードから各帯域の微細スペクトルを復号し、復号された微細スペクトルをスペクトル復号部1204へ出力する。
The fine
なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1203へ入力するように構成する。
In addition, you may make it use the information of a 1st layer decoding spectrum for calculation of auditory importance. In that case, the first layer decoded spectrum is configured to be input to the fine
スペクトル復号部1204は、周波数領域変換部702から与えられた第1レイヤ復号スペクトルと、スケーリング係数復号化部1202から入力されたスケーリング係数と、微細スペクトル復号化部1203から入力された微細スペクトルと、から第1の復号スペクトルを復号し、この復号スペクトルを拡張帯域復号化部701へ出力する。
なお、本実施の形態の拡張帯域符号化部202には、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307を設けなくとも良い。この場合の拡張帯域符号化部202の構成は、図13に示される。また、拡張帯域復号化部701には、スペクトル残差形状符号帳805およびスペクトル残差ゲイン符号帳806を設けなくとも良い。この場合の拡張帯域復号化部701の構成は、図14に示される。なお、図13および図14にそれぞれ示されるフィルタリング部1301、1401の出力信号は、次の式(6)で表される。
本実施の形態では、第1レイヤ復号スペクトルの品質を改善した後に、この品質改善後のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成する。この構成によれば、復号信号の品質を改善することができる。この利点は、スペクトル残差形状符号帳およびスペクトル残差ゲイン符号帳の有無に関わらず享受できる。
In the present embodiment, after the quality of the first layer decoded spectrum is improved, a spectrum of a high frequency band (Nn ≦ k <Nw) is generated by extension
なお、第1スペクトル符号化部901では、低域部(0≦k<Nn)のスペクトルの符号化を行う際に、全帯域(0≦k<Nw)の符号化歪が最も小さくなるように低域部(0≦k<Nn)のスペクトルの符号化を行っても良い。この場合、拡張帯域符号化部202では、高域部(Nn≦k<Nw)の符号化まで行われる。また、この場合、第1スペクトル符号化部901において、低域部の符号化結果が高域部の符号化に与える影響も考慮して低域部の符号化を行うことになる。したがって、全帯域のスペクトルが最適になるよう低域部のスペクトルの符号化が為されるようになるため、品質が向上するという効果が得
られる。
In the first
(実施の形態3)
本発明の実施の形態3に係る第2レイヤ符号化部105の構成を図15に示す。図15において図9と同一名称のブロックは同一の機能を有するため、ここではその詳細な説明を省略する。
(Embodiment 3)
The configuration of second
図9との違いは、復号機能を有し且つ拡張帯域符号化コードを求める拡張帯域符号化部1501と、その拡張帯域符号化コードを用いて第2の復号スペクトルを生成し原スペクトルから第2の復号スペクトルを減じて求められる誤差スペクトルを符号化する第2スペクトル符号化部1502と、が設けられた点にある。前述の誤差スペクトルを第2スペクトル符号化部1502にて符号化することでより高品質な復号スペクトルを生成できるようになり、復号化装置で得られる復号信号の品質を向上させることができる。
The difference from FIG. 9 is that an extension
拡張帯域符号化部1501は、図3に示された拡張帯域符号化部202と同様に拡張帯域符号化コードを生成して出力する。また、拡張帯域符号化部1501は、図8に示される拡張帯域復号化部701と同様の構成を内包し、拡張帯域復号化部701と同様に第2の復号スペクトルを生成する。この第2の復号スペクトルは、第2スペクトル符号化部1502に出力される。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コード、第1のスペクトル符号化コードおよび第2のスペクトル符号化コードからなる。
The extension
なお、拡張帯域符号化部1501の構成において、図3および図8で共通の名称を持つブロックは共有化されていても良い。
In the configuration of extended
第2スペクトル符号化部1502は、図16に示すように、スケーリング係数符号化部1601、スケーリング係数復号化部1602、微細スペクトル符号化部1603、多重化部1604、正規化部1605および減算器1606を有する。
As shown in FIG. 16, the second
減算器1606は、原スペクトルから第2の復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1601および正規化部1605に出力する。スケーリング係数符号化部1601は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、スケーリング係数符号化コードを多重化部1604およびスケーリング係数復号化部1602に出力する。
ここで、聴覚マスキングを用いてスケーリング係数の符号化の効率化を図っても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。 Here, the efficiency of encoding the scaling coefficient may be improved by using auditory masking. For example, bit allocation necessary for encoding the scaling coefficient is determined using auditory masking, and encoding is performed based on the bit allocation information. At this time, if there is a band to which no bits are allocated, the scaling coefficient of that band is not encoded.
スケーリング係数復号化部1602は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1605および微細スペクトル符号化部1603に出力する。
The scaling
正規化部1605は、スケーリング係数復号化部1602より与えられるスケーリング係数を用いて、減算器1606より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1603に出力する。
The
微細スペクトル符号化部1603は、スケーリング係数復号化部1602から入力された復号スケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられ
たビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル)の符号化を行う。そして、この符号化によって得られた符号化コードを多重化部1604に出力する。
The fine
なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第2レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第2レイヤ復号スペクトルを微細スペクトル符号化部1603へ入力するように構成する。
In addition, when encoding the residual spectrum after normalization, it may be encoded using auditory masking so as to reduce auditory distortion. Moreover, you may make it use the information of a 2nd layer decoding spectrum for calculation of auditory importance. In this case, the second layer decoded spectrum is configured to be input to the fine
スケーリング係数符号化部1601および微細スペクトル符号化部1603より出力される符号化コードは多重化部1604にて多重化され、第2のスペクトル符号化コードとして出力される。
The encoded codes output from the scaling
図17は、第2スペクトル符号化部1502の構成の変形例を示している。図17において図16と同一名称のブロックは同一機能を有するため、ここではその詳細な説明を省略する。
FIG. 17 illustrates a modification of the configuration of the second
この構成では、第2スペクトル符号化部1502は、減算器1606より与えられる残差スペクトルを直接符号化する。つまり、残差スペクトルの正規化は行われない。そのため本構成では、図16に示されたスケーリング係数符号化部1601、スケーリング係数復号化部1602および正規化部1605が設けられていない。この構成によれば、第2スペクトル符号化部1502でスケーリング係数にビットを配分する必要が無くなるため、ビットレートを低減させることができる。
In this configuration, the second
聴覚重要度およびビット配分算出部1701は、第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度およびビット配分は、微細スペクトル符号化部1603へ出力される。
Auditory importance and bit
微細スペクトル符号化部1603は、聴覚重要度およびビット配分算出部1701から入力された聴覚重要度およびビット配分に基づいて、残差スペクトルを符号化する。そして、この符号化によって得られた符号化コードを第2のスペクトル符号化コードとして多重化部104に出力する。なお、残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。
The fine
本実施の形態の第2レイヤ復号化部603の構成を図18に示す。第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702、時間領域変換部703、分離部1101、第1スペクトル復号化部1102および第2スペクトル復号化部1801を有する。図18において図11と同一名称のブロックは同一の機能を有するので、ここではその詳細な説明を省略する。
The configuration of second
第2スペクトル復号化部1801は、分離部1101から入力された第2のスペクトル符号化コードを復号して得られる第2の復号スペクトルの符号化誤差を量子化したスペクトルを、拡張帯域復号化部701から入力された第2の復号スペクトルに加える。そして、この加算結果を第3の復号スペクトルとして時間領域変換部703へ出力する。
The second
第2スペクトル復号化部1801は、第2スペクトル符号化部1502が図16に示す構成を採る場合、図12と同様の構成を採る。ただし、図12における第1のスペクトル符号化コード、第1レイヤ復号スペクトルおよび第1の復号スペクトルは、それぞれ、第2のスペクトル符号化コード、第2の復号スペクトルおよび第3の復号スペクトルに置き換わる。
Second
また、本実施の形態では、第2スペクトル復号化部1801の構成について、第2スペクトル符号化部1502が図16に示す構成を採る場合を例に挙げて説明したが、第2スペクトル符号化部1502が図17に示す構成を採る場合、第2スペクトル復号化部1801の構成は、図19のようになる。
Further, in the present embodiment, the configuration of second
つまり図19は、スケーリング係数を用いない第2スペクトル符号化部1502に対応する第2スペクトル復号化部1801の構成を示している。第2スペクトル復号化部1801は、聴覚重要度およびビット配分算出部1901と微細スペクトル復号化部1902とスペクトル復号部1903とを有する。
That is, FIG. 19 shows the configuration of second
図19において、聴覚重要度およびビット配分算出部1901は、拡張帯域復号化部701から入力された第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度とビット配分は、微細スペクトル復号化部1902へ出力される。
In FIG. 19, the auditory importance and bit
微細スペクトル復号化部1902は、聴覚重要度およびビット配分算出部1901から入力された聴覚重要度およびビット配分に基づいて、分離部1101から第2のスペクトル符号化コードとして入力される微細スペクトル符号化コードを復号し、その復号結果(各帯域の微細スペクトル)をスペクトル復号部1903に出力する。
The fine
微細スペクトル復号化部1903は、拡張帯域復号化部701から入力された第2の復号スペクトルに、微細スペクトル復号化部1902から入力された微細スペクトルを加えて、その加算結果を第3の復号スペクトルとして外部へ出力する。
The fine
なお、本実施の形態では、第1スペクトル符号化部901および第1スペクトル復号化部1102を含む構成を例に挙げて説明したが、第1スペクトル符号化部901および第1スペクトル復号化部1102が無くても本実施の形態の作用効果を実現することができる。その場合の第2レイヤ符号化部105の構成を図20に、第2レイヤ復号化部603の構成を図21に、それぞれ示す。
In the present embodiment, the configuration including first
以上、本発明によるスケーラブル復号化装置およびスケーラブル符号化装置の実施の形態について説明した。 The embodiments of the scalable decoding device and the scalable encoding device according to the present invention have been described above.
なお、上記実施の形態においては、変換方式としてMDCTを使って説明したがこれに限定されず、他の変換方式、例えばフーリエ変換やコサイン変換、Wavelet変換などを使用したときにも本発明は適用できる。 In the above-described embodiment, MDCT is used as the conversion method. However, the present invention is not limited to this, and the present invention is also applicable when other conversion methods such as Fourier transform, cosine transform, and Wavelet transform are used. it can.
また、上記実施の形態においては、階層数2を基に説明したがこれに限定されず、2以上の階層を持つスケーラブル符号化/復号化にも適用できる。 In the above-described embodiment, the description has been made based on the number of layers 2. However, the present invention is not limited to this.
また、本発明に係る符号化装置および復号化装置は、上記の実施の形態1〜3に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。 The encoding device and decoding device according to the present invention are not limited to the above-described first to third embodiments, and can be implemented with various modifications. For example, each embodiment can be implemented in combination as appropriate.
本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。 The encoding device and the decoding device according to the present invention can also be mounted on a communication terminal device and a base station device in a mobile communication system, whereby the communication terminal device and the base station having the same operational effects as described above An apparatus can be provided.
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発
明はソフトウェアで実現することも可能である。
Further, here, a case has been described as an example where the present invention is configured with hardware, but the present invention can also be implemented with software.
なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。 Each functional block used in the description of each of the above embodiments is typically realized as an LSI that is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them.
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。 The name used here is LSI, but it may also be called IC, system LSI, super LSI, or ultra LSI depending on the degree of integration.
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。 Further, the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. An FPGA (Field Programmable Gate Array) that can be programmed after manufacturing the LSI or a reconfigurable processor that can reconfigure the connection and setting of the circuit cells inside the LSI may be used.
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。 Further, if integrated circuit technology comes out to replace LSI's as a result of the advancement of semiconductor technology or a derivative other technology, it is naturally also possible to carry out function block integration using this technology. Biotechnology can be applied.
すなわち、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。 That is, the scalable encoding device according to the above embodiment is a scalable encoding device that generates low frequency band encoded information and high frequency band encoded information from an original signal, and includes the low frequency band code. First spectrum calculating means for calculating a first spectrum in a low frequency band from the decoded signal of the digitized information, second spectrum calculating means for calculating a second spectrum from the original signal, the first spectrum and the second spectrum A first parameter calculating means for calculating a first parameter indicating the degree of similarity with the high frequency band, and a second parameter for calculating a second parameter indicating a fluctuation component between the high frequency band of the first spectrum and the second spectrum. Calculating means, and encoding means for encoding the calculated first parameter and second parameter as encoding information of the high frequency band, A configuration that.
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1パラメータ算出手段は、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを前記第1パラメータとして出力する構成を採る。 In the scalable encoding device according to the above-described embodiment, in the above configuration, the first parameter calculation unit uses a filter having the first spectrum as an internal state to set a parameter indicating a characteristic of the filter in the first configuration. A configuration for outputting as one parameter is adopted.
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第2パラメータ算出手段は、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳を有し、前記スペクトル残差の符号を前記第2パラメータとして出力する構成を採る。 In the scalable encoding device according to the above-described embodiment, the second parameter calculation unit includes a spectrum residual shape codebook in which a plurality of spectrum residual candidates are recorded, and the spectrum residual code has the configuration described above. A configuration is adopted in which the sign of the difference is output as the second parameter.
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、前記第1パラメータ算出手段および前記第2パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する構成を採る。 The scalable coding apparatus according to the above embodiment further includes residual component encoding means for encoding the residual component between the first spectrum and the low frequency band portion of the second spectrum in the above configuration. The first parameter calculating means and the second parameter calculating means improve the quality of the first spectrum using the residual component encoded by the residual component encoding means, and then A configuration for calculating the parameter and the second parameter is adopted.
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記残差成分符号化手段は、前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる構成を採る。 In the scalable encoding device according to the above-described embodiment, in the above configuration, the residual component encoding unit includes the quality of the low frequency band portion of the first spectrum and the encoding unit encoded by the encoding unit. A configuration is adopted in which both the quality of the high frequency band portion of the decoded spectrum obtained from the first parameter and the second parameter are improved.
また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1
パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する構成を採る。
Further, the scalable coding apparatus according to the above embodiment has the above configuration in the first configuration.
The parameter includes a lag, the second parameter includes a spectrum residual, and further includes configuration means for configuring a bitstream arranged in the order of the lag and the spectrum residual.
また、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。 The scalable encoding device according to the above embodiment is an encoding device that generates low frequency band encoding information and high frequency band encoding information from an original signal, and the low frequency band encoding A first spectrum calculating means for calculating a first spectrum in a low frequency band from a decoded signal of information; a second spectrum calculating means for calculating a second spectrum from the original signal; and a high frequency of the first spectrum and the second spectrum. Parameter calculating means for calculating a parameter indicating the degree of similarity with the band part, parameter encoding means for encoding the calculated parameter as the encoding information of the high frequency band, low values of the first spectrum and the second spectrum A residual component encoding unit that encodes a residual component with the frequency band unit, and the parameter calculation unit includes the residual component encoding unit. After improving the quality of the first spectrum using the coded residual components Te, a configuration to calculate the parameters.
また、上記実施の形態に係るスケーラブル復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。 Further, the scalable decoding device according to the embodiment includes a spectrum acquisition unit that acquires a first spectrum corresponding to a low frequency band, and a first parameter that is encoded as encoded information of a high frequency band, A first parameter indicating the degree of similarity between the first spectrum and the high-frequency band portion of the second spectrum corresponding to the original signal; and a second parameter encoded as high-frequency band encoding information, Parameter acquisition means for acquiring a second parameter indicating a fluctuation component with respect to the high-frequency band section; and decoding means for decoding the second spectrum using the acquired first parameter and second parameter. Take the configuration.
また、上記実施の形態に係るスケーラブル符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
The scalable encoding method according to the above embodiment is a scalable encoding method for generating low frequency band encoded information and high frequency band encoded information from an original signal, and the low frequency band code A first spectrum calculating step for calculating a first spectrum in a low frequency band from the decoded signal of the conversion information, a second spectrum calculating step for calculating a second spectrum from the original signal, and the first spectrum and the second spectrum A first parameter calculating step for calculating a first parameter indicating the degree of similarity with the high frequency band part; and a second parameter for calculating a second parameter indicating a fluctuation component between the high frequency band part of the first spectrum and the second spectrum. A code for encoding the calculation step and the calculated first parameter and second parameter as encoding information of the high frequency band And the step,
It was made to have.
また、上記実施の形態に係るスケーラブル復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。 The scalable decoding method according to the embodiment includes a spectrum acquisition step of acquiring a first spectrum corresponding to a low frequency band, and a first parameter encoded as encoded information of a high frequency band, A first parameter indicating the degree of similarity between the first spectrum and the high-frequency band portion of the second spectrum corresponding to the original signal; and a second parameter encoded as high-frequency band encoding information, A parameter acquisition step for acquiring a second parameter indicating a fluctuation component with respect to the high-frequency band section; and a decoding step for decoding the second spectrum using the acquired first parameter and second parameter. I did it.
特に、本発明による第1のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定し、フィルタ情報を符号化して送るスペクトル符号化装置において、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を有し、前記フィルタの入力信号としてスペクトル残差を与えフィルタリングを行い第2スペクトルの高域部を推定するもので、スペクトル残差を用いることにより、第1スペクトルの変形では表せない第2スペクトルの高域部の成分を符号化するこ
とができるようになるため、第2スペクトルの高域部の推定性能が向上し高品質化が為される。
In particular, a first scalable coding apparatus according to the present invention uses a filter having a first spectrum as an internal state to estimate a high-frequency part of a second spectrum, and encodes and sends filter information. It has a spectrum residual shape codebook in which a plurality of spectral residual candidates are recorded, and applies a spectral residual as an input signal of the filter to perform filtering to estimate a high frequency part of the second spectrum. By using the difference, it becomes possible to encode the high-frequency component of the second spectrum that cannot be expressed by the deformation of the first spectrum, so that the estimation performance of the high-frequency part of the second spectrum is improved and high quality is achieved. Is made.
また、本発明による第2のスケーラブル符号化装置は、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化して第1スペクトルの高品質化を図った後に、この第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定するもので、第2スペクトルの低域部に対する第1スペクトルの品質を改善させた後に、品質改善後の第1スペクトルを用いて第2スペクトルの高域部を推定することにより、推定性能が向上し高品質化が為される。 The second scalable encoding device according to the present invention encodes an error component between the low-frequency part of the second spectrum and the first spectrum to improve the quality of the first spectrum, and then the first spectrum. Is used to estimate the high-frequency part of the second spectrum using a filter having an internal state, and after improving the quality of the first spectrum with respect to the low-frequency part of the second spectrum, the first spectrum after quality improvement is used. By estimating the high frequency part of the second spectrum, the estimation performance is improved and the quality is improved.
また、本発明による第3のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定して生成される推定スペクトルと第2スペクトルの高域部の間の誤差成分と、第2スペクトルの低域部と第1スペクトルの間の誤差成分の両誤差成分を小さくするように、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化するもので、第1スペクトルと第2スペクトルの低域部の間の誤差成分を符号化する際に、第1スペクトルおよび第2スペクトルの高域部の推定スペクトルの両品質が同時に向上する第1スペクトルの符号化が為されるため、高品質化が実現できる。 The third scalable coding apparatus according to the present invention also includes an estimated spectrum generated by estimating a high frequency part of the second spectrum using a filter having the first spectrum as an internal state, and a high frequency part of the second spectrum. The error component between the low-frequency part of the second spectrum and the first spectrum is reduced so as to reduce both the error component between the low-frequency part of the second spectrum and the error component between the low-frequency part of the second spectrum and the first spectrum. When encoding an error component between the first spectrum and the low-frequency part of the second spectrum, both qualities of the estimated spectrum of the first spectrum and the high-frequency part of the second spectrum are improved at the same time. Since the first spectrum is encoded, high quality can be realized.
また、上記第1〜3のスケーラブル符号化装置においては、符号化装置にて復号化装置に伝送されるビットストリームを生成する際に、当該ビットストリームは少なくとも、スケールファクタ、ダイナミックレンジ調整係数、ラグ、を含み、この順番でビットストリームを構成するようにしてもよい。これにより、ビットストリームの構成は復号信号の品質に与える影響が大きいパラメータほどビットストリームのMSB(Most Significant Bit)の近くに配置されているため、ビットストリームのLSB(Least Significant Bit)から任意のビット位置でビットが削除されても品質劣化が生じ難いという効果が得られる。 In the first to third scalable encoding devices, when the bit stream to be transmitted to the decoding device is generated by the encoding device, the bit stream includes at least a scale factor, a dynamic range adjustment coefficient, a lag. , And the bit stream may be configured in this order. As a result, the bit stream configuration is arranged closer to the MSB (Most Significant Bit) of the bit stream as the parameter having a greater influence on the quality of the decoded signal, and therefore any bit from the LSB (Least Significant Bit) of the bit stream Even if a bit is deleted at a position, an effect that quality degradation hardly occurs is obtained.
本明細書は、2004年11月5日出願の特願2004−322959に基づく。この内容はすべてここに含めておく。 This specification is based on Japanese Patent Application No. 2004-322959 filed on November 5, 2004. All this content is included here.
本発明に係る符号化装置、復号化装置、符号化方法及び復号化方法は、スケーラブル符号化/復号化等に適用できる。 The encoding apparatus, decoding apparatus, encoding method, and decoding method according to the present invention can be applied to scalable encoding / decoding and the like.
Claims (5)
前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、
前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、
前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして出力する第1パラメータ算出手段と、
スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして出力する第2パラメータ算出手段と、
前記出力される第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定手段と、
前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、
を有する符号化装置。An encoding device for generating low frequency band encoded information and high frequency band encoded information from an original signal,
First spectrum calculating means for calculating a first spectrum of a low frequency band from a decoded signal of the encoded information of the low frequency band;
Second spectrum calculating means for calculating a second spectrum from the original signal;
Using a filter having the first spectrum as an internal state, first outputs a parameter indicating a characteristic of the filter, as a first parameter indicating a similar degree of high-frequency band portion of the second spectrum and the first spectrum Parameter calculation means;
One spectral residual candidate code from a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded indicates a fluctuation component between the high frequency band portion of the first spectrum and the second spectrum. Second parameter calculating means for outputting as a second parameter;
Determining means for simultaneously determining the first parameter and the second parameter for generating an estimated value most similar to the high-frequency band portion of the second spectrum from the output first parameter and second parameter;
Encoding means for encoding the determined first parameter and second parameter as encoding information of the high frequency band;
An encoding device.
前記第1パラメータ算出手段および前記第2パラメータ算出手段は、
前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する、
請求項1記載の符号化装置。A residual component encoding means for encoding a residual component between the first spectrum and the low frequency band of the second spectrum;
The first parameter calculation means and the second parameter calculation means are:
Calculating the first parameter and the second parameter after improving the quality of the first spectrum using the residual component encoded by the residual component encoding means;
The encoding device according to claim 1.
前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる、
請求項2記載の符号化装置。The residual component encoding means includes:
Improving both the quality of the low frequency band portion of the first spectrum and the quality of the high frequency band portion of the decoded spectrum obtained from the first parameter and the second parameter encoded by the encoding means;
The encoding device according to claim 2 .
前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する、
請求項1記載の符号化装置。The first parameter includes a lag, the second parameter includes a spectral residual;
And further comprising means for configuring a bitstream arranged in the order of the lag and the spectral residuals.
The encoding device according to claim 1.
前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、
前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、
前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして算出する第1パラメータ算出ステップと、
スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして算出する第2パラメータ算出ステップと、
前記算出された第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定ステップと、
前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有する符号化方法。An encoding method for generating low frequency band encoded information and high frequency band encoded information from an original signal,
A first spectrum calculating step of calculating a first spectrum of a low frequency band from a decoded signal of the encoded information of the low frequency band;
A second spectrum calculating step of calculating a second spectrum from the original signal;
Using a filter having the first spectrum as an internal state, first to calculate the parameter indicating the characteristic of the filter, as a first parameter indicating a similar degree of high-frequency band portion of the second spectrum and the first spectrum A parameter calculation step;
One spectral residual candidate code from a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded indicates a fluctuation component between the high frequency band portion of the first spectrum and the second spectrum. A second parameter calculating step for calculating as a second parameter;
A determination step of simultaneously determining the first parameter and the second parameter that generate an estimated value that is most similar to the high frequency band portion of the second spectrum from the calculated first parameter and second parameter;
An encoding step of encoding the determined first parameter and second parameter as encoding information of the high frequency band;
An encoding method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006542421A JP4977471B2 (en) | 2004-11-05 | 2005-11-02 | Encoding apparatus and encoding method |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004322959 | 2004-11-05 | ||
JP2004322959 | 2004-11-05 | ||
PCT/JP2005/020200 WO2006049204A1 (en) | 2004-11-05 | 2005-11-02 | Encoder, decoder, encoding method, and decoding method |
JP2006542421A JP4977471B2 (en) | 2004-11-05 | 2005-11-02 | Encoding apparatus and encoding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2006049204A1 JPWO2006049204A1 (en) | 2008-05-29 |
JP4977471B2 true JP4977471B2 (en) | 2012-07-18 |
Family
ID=36319209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006542421A Active JP4977471B2 (en) | 2004-11-05 | 2005-11-02 | Encoding apparatus and encoding method |
Country Status (9)
Country | Link |
---|---|
US (3) | US7769584B2 (en) |
EP (3) | EP2752849B1 (en) |
JP (1) | JP4977471B2 (en) |
KR (1) | KR101220621B1 (en) |
CN (3) | CN101048814B (en) |
BR (1) | BRPI0517716B1 (en) |
ES (1) | ES2476992T3 (en) |
RU (2) | RU2500043C2 (en) |
WO (1) | WO2006049204A1 (en) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101048814B (en) | 2004-11-05 | 2011-07-27 | 松下电器产业株式会社 | Encoder, decoder, encoding method, and decoding method |
BRPI0616624A2 (en) | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | speech coding apparatus and speech coding method |
US7991611B2 (en) * | 2005-10-14 | 2011-08-02 | Panasonic Corporation | Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals |
US8103516B2 (en) * | 2005-11-30 | 2012-01-24 | Panasonic Corporation | Subband coding apparatus and method of coding subband |
WO2007066771A1 (en) * | 2005-12-09 | 2007-06-14 | Matsushita Electric Industrial Co., Ltd. | Fixed code book search device and fixed code book search method |
JP4876574B2 (en) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium |
EP1988544B1 (en) * | 2006-03-10 | 2014-12-24 | Panasonic Intellectual Property Corporation of America | Coding device and coding method |
EP1990800B1 (en) * | 2006-03-17 | 2016-11-16 | Panasonic Intellectual Property Management Co., Ltd. | Scalable encoding device and scalable encoding method |
WO2007126015A1 (en) * | 2006-04-27 | 2007-11-08 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
US8121850B2 (en) * | 2006-05-10 | 2012-02-21 | Panasonic Corporation | Encoding apparatus and encoding method |
WO2008007700A1 (en) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Sound decoding device, sound encoding device, and lost frame compensation method |
US8261163B2 (en) * | 2006-08-22 | 2012-09-04 | Panasonic Corporation | Soft output decoder, iterative decoder, and soft decision value calculating method |
JP5121719B2 (en) | 2006-11-10 | 2013-01-16 | パナソニック株式会社 | Parameter decoding apparatus and parameter decoding method |
US20100076755A1 (en) * | 2006-11-29 | 2010-03-25 | Panasonic Corporation | Decoding apparatus and audio decoding method |
WO2008072737A1 (en) * | 2006-12-15 | 2008-06-19 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
FR2911020B1 (en) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | AUDIO CODING METHOD AND DEVICE |
FR2911031B1 (en) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | AUDIO CODING METHOD AND DEVICE |
JP4871894B2 (en) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | Encoding device, decoding device, encoding method, and decoding method |
JP4638895B2 (en) * | 2007-05-21 | 2011-02-23 | 日本電信電話株式会社 | Decoding method, decoder, decoding device, program, and recording medium |
JP5098530B2 (en) * | 2007-09-12 | 2012-12-12 | 富士通株式会社 | Decoding device, decoding method, and decoding program |
US8548815B2 (en) * | 2007-09-19 | 2013-10-01 | Qualcomm Incorporated | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications |
JP5413839B2 (en) * | 2007-10-31 | 2014-02-12 | パナソニック株式会社 | Encoding device and decoding device |
CN101527138B (en) * | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | Coding method and decoding method for ultra wide band expansion, coder and decoder as well as system for ultra wide band expansion |
CN101971253B (en) * | 2008-03-14 | 2012-07-18 | 松下电器产业株式会社 | Encoding device, decoding device, and method thereof |
CA2721702C (en) * | 2008-05-09 | 2016-09-27 | Nokia Corporation | Apparatus and methods for audio encoding reproduction |
CN101609684B (en) * | 2008-06-19 | 2012-06-06 | 展讯通信(上海)有限公司 | Post-processing filter for decoding voice signal |
CN101620854B (en) * | 2008-06-30 | 2012-04-04 | 华为技术有限公司 | Method, system and device for band extension |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
EP2360687A4 (en) * | 2008-12-19 | 2012-07-11 | Fujitsu Ltd | Voice band extension device and voice band extension method |
CN101436407B (en) * | 2008-12-22 | 2011-08-24 | 西安电子科技大学 | Method for encoding and decoding audio |
ES2966639T3 (en) * | 2009-01-16 | 2024-04-23 | Dolby Int Ab | Enhanced harmonic transposition of cross product |
JP5511785B2 (en) * | 2009-02-26 | 2014-06-04 | パナソニック株式会社 | Encoding device, decoding device and methods thereof |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
RU2452044C1 (en) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Apparatus, method and media with programme code for generating representation of bandwidth-extended signal on basis of input signal representation using combination of harmonic bandwidth-extension and non-harmonic bandwidth-extension |
CO6440537A2 (en) | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | APPARATUS AND METHOD TO GENERATE A SYNTHESIS AUDIO SIGNAL AND TO CODIFY AN AUDIO SIGNAL |
TWI591625B (en) * | 2009-05-27 | 2017-07-11 | 杜比國際公司 | Systems and methods for generating a high frequency component of a signal from a low frequency component of the signal, a set-top box, a computer program product and storage medium thereof |
JP5754899B2 (en) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | Decoding apparatus and method, and program |
JP5678071B2 (en) * | 2009-10-08 | 2015-02-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | Multimode audio signal decoder, multimode audio signal encoder, method and computer program using linear predictive coding based noise shaping |
MY166169A (en) * | 2009-10-20 | 2018-06-07 | Fraunhofer Ges Forschung | Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation |
RU2605677C2 (en) | 2009-10-20 | 2016-12-27 | Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Audio encoder, audio decoder, method of encoding audio information, method of decoding audio information and computer program using iterative reduction of size of interval |
WO2011058758A1 (en) * | 2009-11-13 | 2011-05-19 | パナソニック株式会社 | Encoder apparatus, decoder apparatus and methods of these |
CN102081927B (en) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | Layering audio coding and decoding method and system |
MY153845A (en) | 2010-01-12 | 2015-03-31 | Fraunhofer Ges Forschung | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
CA3107943C (en) | 2010-01-19 | 2022-09-06 | Dolby International Ab | Improved subband block based harmonic transposition |
CN102918590B (en) * | 2010-03-31 | 2014-12-10 | 韩国电子通信研究院 | Encoding method and device, and decoding method and device |
JP5652658B2 (en) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program |
JP5850216B2 (en) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program |
JP5609737B2 (en) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program |
RU2445719C2 (en) * | 2010-04-21 | 2012-03-20 | Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) | Method of enhancing synthesised speech perception when performing analysis through synthesis in linear predictive vocoders |
JP2011253045A (en) * | 2010-06-02 | 2011-12-15 | Sony Corp | Encoding apparatus and encoding method, decoding apparatus and decoding method, and program |
EP4398244A3 (en) * | 2010-07-08 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP5707842B2 (en) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | Encoding apparatus and method, decoding apparatus and method, and program |
US9230551B2 (en) | 2010-10-18 | 2016-01-05 | Nokia Technologies Oy | Audio encoder or decoder apparatus |
JP5704397B2 (en) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | Encoding apparatus and method, and program |
JP5942358B2 (en) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | Encoding apparatus and method, decoding apparatus and method, and program |
US9384749B2 (en) * | 2011-09-09 | 2016-07-05 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, encoding method and decoding method |
CN103035248B (en) | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | Encoding method and device for audio signals |
WO2013061530A1 (en) * | 2011-10-28 | 2013-05-02 | パナソニック株式会社 | Encoding apparatus and encoding method |
WO2014118157A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal |
ES2836194T3 (en) * | 2013-06-11 | 2021-06-24 | Fraunhofer Ges Forschung | Device and procedure for bandwidth extension for acoustic signals |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
EP3614381A1 (en) * | 2013-09-16 | 2020-02-26 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
CN105531762B (en) | 2013-09-19 | 2019-10-01 | 索尼公司 | Code device and method, decoding apparatus and method and program |
KR102251833B1 (en) | 2013-12-16 | 2021-05-13 | 삼성전자주식회사 | Method and apparatus for encoding/decoding audio signal |
SG11201605015XA (en) | 2013-12-27 | 2016-08-30 | Sony Corp | Decoding device, method, and program |
US10395663B2 (en) | 2014-02-17 | 2019-08-27 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus, and signal decoding method and apparatus |
CN110176241B (en) * | 2014-02-17 | 2023-10-31 | 三星电子株式会社 | Signal encoding method and apparatus, and signal decoding method and apparatus |
RU2662693C2 (en) * | 2014-02-28 | 2018-07-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Decoding device, encoding device, decoding method and encoding method |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9911179B2 (en) * | 2014-07-18 | 2018-03-06 | Dolby Laboratories Licensing Corporation | Image decontouring in high dynamic range video processing |
EP3176780A4 (en) | 2014-07-28 | 2018-01-17 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus and signal decoding method and apparatus |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10609372B2 (en) * | 2017-09-29 | 2020-03-31 | Dolby Laboratories Licensing Corporation | Up-conversion to content adaptive perceptual quantization video signals |
CN113808596A (en) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | Audio coding method and audio coding device |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (en) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | Wideband audio signal restoration method |
JP2964879B2 (en) * | 1994-08-22 | 1999-10-18 | 日本電気株式会社 | Post filter |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP2956548B2 (en) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | Voice band expansion device |
JP3707116B2 (en) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | Speech decoding method and apparatus |
JP3707153B2 (en) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | Vector quantization method, speech coding method and apparatus |
JPH10233692A (en) * | 1997-01-16 | 1998-09-02 | Sony Corp | Audio signal coder, coding method, audio signal decoder and decoding method |
SE512719C2 (en) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | A method and apparatus for reducing data flow based on harmonic bandwidth expansion |
JP3765171B2 (en) * | 1997-10-07 | 2006-04-12 | ヤマハ株式会社 | Speech encoding / decoding system |
FI109393B (en) * | 2000-07-14 | 2002-07-15 | Nokia Corp | Method for encoding media stream, a scalable and a terminal |
EP1440432B1 (en) * | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
JP3926726B2 (en) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | Encoding device and decoding device |
WO2003042979A2 (en) * | 2001-11-14 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
DE60323331D1 (en) * | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | METHOD AND DEVICE FOR AUDIO ENCODING AND DECODING |
AU2003234763A1 (en) * | 2002-04-26 | 2003-11-10 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
JP2003323199A (en) | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | Device and method for encoding, device and method for decoding |
JP3881946B2 (en) * | 2002-09-12 | 2007-02-14 | 松下電器産業株式会社 | Acoustic encoding apparatus and acoustic encoding method |
FR2852172A1 (en) * | 2003-03-04 | 2004-09-10 | France Telecom | Audio signal coding method, involves coding one part of audio signal frequency spectrum with core coder and another part with extension coder, where part of spectrum is coded with both core coder and extension coder |
US7844451B2 (en) * | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
JP4679049B2 (en) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | Scalable decoding device |
US7848921B2 (en) * | 2004-08-31 | 2010-12-07 | Panasonic Corporation | Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof |
ATE480851T1 (en) * | 2004-10-28 | 2010-09-15 | Panasonic Corp | SCALABLE ENCODING APPARATUS, SCALABLE DECODING APPARATUS AND METHOD THEREOF |
JP4977472B2 (en) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | Scalable decoding device |
CN101048814B (en) * | 2004-11-05 | 2011-07-27 | 松下电器产业株式会社 | Encoder, decoder, encoding method, and decoding method |
-
2005
- 2005-11-02 CN CN2005800372338A patent/CN101048814B/en active Active
- 2005-11-02 ES ES05805494.1T patent/ES2476992T3/en active Active
- 2005-11-02 KR KR1020077010252A patent/KR101220621B1/en active IP Right Grant
- 2005-11-02 JP JP2006542421A patent/JP4977471B2/en active Active
- 2005-11-02 BR BRPI0517716-2A patent/BRPI0517716B1/en active IP Right Grant
- 2005-11-02 RU RU2009147514/08A patent/RU2500043C2/en active
- 2005-11-02 CN CN2011101503790A patent/CN102201242B/en active Active
- 2005-11-02 RU RU2007116941/09A patent/RU2387024C2/en active
- 2005-11-02 EP EP14156425.2A patent/EP2752849B1/en active Active
- 2005-11-02 EP EP14156428.6A patent/EP2752843A1/en not_active Withdrawn
- 2005-11-02 EP EP05805494.1A patent/EP1798724B1/en active Active
- 2005-11-02 US US11/718,452 patent/US7769584B2/en active Active
- 2005-11-02 WO PCT/JP2005/020200 patent/WO2006049204A1/en active Application Filing
- 2005-11-02 CN CN2011101503803A patent/CN102184734B/en active Active
-
2010
- 2010-06-21 US US12/819,690 patent/US8135583B2/en active Active
-
2011
- 2011-06-13 US US13/158,944 patent/US8204745B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP1798724A1 (en) | 2007-06-20 |
EP2752849B1 (en) | 2020-06-03 |
RU2387024C2 (en) | 2010-04-20 |
CN102201242A (en) | 2011-09-28 |
US8204745B2 (en) | 2012-06-19 |
RU2500043C2 (en) | 2013-11-27 |
WO2006049204A1 (en) | 2006-05-11 |
US7769584B2 (en) | 2010-08-03 |
US20100256980A1 (en) | 2010-10-07 |
EP2752843A1 (en) | 2014-07-09 |
US20080052066A1 (en) | 2008-02-28 |
CN102184734B (en) | 2013-04-03 |
BRPI0517716A (en) | 2008-10-21 |
BRPI0517716B1 (en) | 2019-03-12 |
CN102184734A (en) | 2011-09-14 |
CN101048814B (en) | 2011-07-27 |
EP1798724B1 (en) | 2014-06-18 |
RU2009147514A (en) | 2011-06-27 |
JPWO2006049204A1 (en) | 2008-05-29 |
KR101220621B1 (en) | 2013-01-18 |
EP1798724A4 (en) | 2008-09-24 |
RU2007116941A (en) | 2008-11-20 |
KR20070083997A (en) | 2007-08-24 |
US20110264457A1 (en) | 2011-10-27 |
US8135583B2 (en) | 2012-03-13 |
CN101048814A (en) | 2007-10-03 |
ES2476992T3 (en) | 2014-07-15 |
CN102201242B (en) | 2013-02-27 |
EP2752849A1 (en) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4977471B2 (en) | Encoding apparatus and encoding method | |
JP4977472B2 (en) | Scalable decoding device | |
JP4871894B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
JP5013863B2 (en) | Encoding apparatus, decoding apparatus, communication terminal apparatus, base station apparatus, encoding method, and decoding method | |
JP4954069B2 (en) | Post filter, decoding device, and post filter processing method | |
JP5089394B2 (en) | Speech coding apparatus and speech coding method | |
US8457319B2 (en) | Stereo encoding device, stereo decoding device, and stereo encoding method | |
JPWO2008072737A1 (en) | Encoding device, decoding device and methods thereof | |
JP4859670B2 (en) | Speech coding apparatus and speech coding method | |
JP5236040B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
JP5036317B2 (en) | Scalable encoding apparatus, scalable decoding apparatus, and methods thereof | |
US20100017197A1 (en) | Voice coding device, voice decoding device and their methods | |
JP4606418B2 (en) | Scalable encoding device, scalable decoding device, and scalable encoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120327 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4977471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |