[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4977471B2 - Encoding apparatus and encoding method - Google Patents

Encoding apparatus and encoding method Download PDF

Info

Publication number
JP4977471B2
JP4977471B2 JP2006542421A JP2006542421A JP4977471B2 JP 4977471 B2 JP4977471 B2 JP 4977471B2 JP 2006542421 A JP2006542421 A JP 2006542421A JP 2006542421 A JP2006542421 A JP 2006542421A JP 4977471 B2 JP4977471 B2 JP 4977471B2
Authority
JP
Japan
Prior art keywords
spectrum
encoding
parameter
unit
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006542421A
Other languages
Japanese (ja)
Other versions
JPWO2006049204A1 (en
Inventor
正浩 押切
宏幸 江原
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2006542421A priority Critical patent/JP4977471B2/en
Publication of JPWO2006049204A1 publication Critical patent/JPWO2006049204A1/en
Application granted granted Critical
Publication of JP4977471B2 publication Critical patent/JP4977471B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号、オーディオ信号等を符号化する符号化装置及び符号化方法に関する。 The present invention, audio signal relates to a coding apparatus and coding how that turn into codes an audio signal and the like.

移動体通信システムにおける電波資源等の有効利用のために、音声信号を低ビットレートで圧縮することが要求されている。その一方で、ユーザからは通話音声の品質向上や臨場感の高い通話サービスの実現が望まれている。この実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等の音声以外の信号をも高品質に符号化できることが望ましい。   In order to effectively use radio resources and the like in mobile communication systems, it is required to compress audio signals at a low bit rate. On the other hand, users are demanded to improve the quality of call voice and realize a call service with a high presence. For this realization, it is desirable not only to improve the quality of the audio signal, but also to encode a signal other than audio such as an audio signal having a wider bandwidth with high quality.

このような相反する要求に対し、複数の符号化技術を階層的に統合するアプローチが有望視されている。具体的には、音声信号に適したモデルで入力信号を低ビットレートで符号化する第1レイヤ部と、入力信号と第1レイヤ復号信号との残差信号を音声以外の信号にも適したモデルで符号化する第2レイヤ部を階層的に組み合わせる構成を採る。このような階層構造を持つ符号化方式は、符号化部より得られるビットストリームにスケーラビリティ性(ビットストリームの一部の情報からでも復号信号が得られること)を有するため、スケーラブル符号化と呼ばれる。スケーラブル符号化はその性質から、ビットレートの異なるネットワーク間の通信にも柔軟に対応できる。この特徴は、IPプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものといえる。   In response to such conflicting demands, an approach that hierarchically integrates a plurality of encoding techniques is considered promising. Specifically, a first layer unit that encodes an input signal at a low bit rate with a model suitable for a speech signal, and a residual signal between the input signal and the first layer decoded signal is also suitable for a signal other than speech. A configuration is adopted in which the second layer parts encoded by the model are hierarchically combined. An encoding method having such a hierarchical structure is called scalable encoding because the bit stream obtained from the encoding unit has scalability (a decoded signal can be obtained even from partial information of the bit stream). Because of its nature, scalable coding can flexibly support communication between networks with different bit rates. This feature can be said to be suitable for a future network environment in which various networks are integrated by the IP protocol.

従来のスケーラブル符号化としては、例えば非特許文献1記載のものがある。この文献では、MPEG-4(Moving Picture Experts Group phase-4)で規格化された技術を用いてスケーラブル符号化を構成する方法について述べられている。具体的には、第1レイヤ部(基本レイヤ部)では、CELP(Code Excited Linear Prediction:符号励振線形予測)を用いて音声信号つまり原信号を符号化し、第2レイヤ部(拡張レイヤ部)では、例えばAAC(Advanced Audio Coder)やTwinVQ(Transform Domain Weighted Interleave Vector Quantization:周波数領域重み付きインターリーブベクトル量子化)のような変換符号化を用いて残差信号を符号化する。ここで、残差信号は、第1レイヤ部で得られた符号化コードを復号したもの(第1レイヤ復号信号)を原信号から減算することにより得られる信号である。
三木弼一編著、「MPEG-4の全て」、初版、(株)工業調査会、1998年9月30日、p.126−127
As a conventional scalable coding, there exists a thing of a nonpatent literature 1, for example. This document describes a method for configuring scalable coding using a technique standardized by MPEG-4 (Moving Picture Experts Group phase-4). Specifically, in the first layer unit (base layer unit), a speech signal, that is, an original signal is encoded using CELP (Code Excited Linear Prediction), and in the second layer unit (enhancement layer unit) For example, the residual signal is encoded using transform coding such as AAC (Advanced Audio Coder) or TwinVQ (Transform Domain Weighted Interleave Vector Quantization). Here, the residual signal is a signal obtained by subtracting, from the original signal, a decoded version of the encoded code obtained in the first layer unit (first layer decoded signal).
Edited by Junichi Miki, “All about MPEG-4”, first edition, Industrial Research Co., Ltd., September 30, 1998, p. 126-127

しかしながら、上記従来技術においては、第2レイヤ部での変換符号化は、原信号から第1レイヤ復号信号を減じて得られる残差信号に対して行われる。よって、原信号に含まれる主要な情報の一部が、第1レイヤ部を介することにより取り除かれることがある。この場合、残差信号の特性が、雑音系列に近い特性となる。したがって、例えばAACやTwinVQのように楽音信号を効率的に符号化するよう設計された変換符号化を、第2レイヤ部に用いる場合、上記特性を持つ残差信号を符号化して復号信号の高品質化を図るには、多くのビットを配分する必要がある。その結果、ビットレートが大きくなってしまうという問題があった。   However, in the above prior art, the transform coding in the second layer unit is performed on the residual signal obtained by subtracting the first layer decoded signal from the original signal. Therefore, some of the main information included in the original signal may be removed by passing through the first layer unit. In this case, the characteristic of the residual signal is a characteristic close to a noise sequence. Therefore, for example, when transform coding designed to efficiently encode a musical tone signal, such as AAC or TwinVQ, is used for the second layer portion, the residual signal having the above characteristics is encoded to increase the decoding signal. In order to improve quality, it is necessary to allocate many bits. As a result, there is a problem that the bit rate is increased.

本発明の目的は、かかる点に鑑みてなされたものであり、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる符号化装置及び符号化方法を提供することである。 The object of the present invention has been made in view of this point, and a high-quality decoded signal can be obtained even if low bit rate encoding is performed in the second layer unit or higher layer unit. to provide a coding apparatus and coding how.

本発明の符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして出力する第1パラメータ算出手段と、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして出力する第2パラメータ算出手段と、前記出力される第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定手段と、前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。 An encoding apparatus according to the present invention is an encoding apparatus that generates low frequency band encoded information and high frequency band encoded information from an original signal, wherein the low frequency band encoded information is reduced from the decoded signal. A first spectrum calculating means for calculating a first spectrum of a frequency band; a second spectrum calculating means for calculating a second spectrum from the original signal; and a filter having the first spectrum as an internal state. A first parameter calculating means for outputting a parameter indicating a characteristic as a first parameter indicating the degree of similarity between the first spectrum and the high frequency band portion of the second spectrum; and a spectrum in which a plurality of spectral residual candidates are recorded. the sign of the candidate of one spectral residuals from the residual shape codebook, variations formed between the first spectrum and the second spectrum of the high frequency band portion A second parameter calculating means for outputting as a second parameter indicating, among the first parameter and the second parameter is the output, the first to produce an estimate of the most similar to the high frequency band portion of the second spectrum A configuration is adopted that includes determination means for simultaneously determining a parameter and the second parameter, and encoding means for encoding the determined first parameter and second parameter as encoding information of the high frequency band.

本発明の符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして算出する第1パラメータ算出ステップと、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして算出する第2パラメータ算出ステップと、前記算出された第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定ステップと、前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、を有するようにした。 The encoding method of the present invention is an encoding method for generating low-frequency band encoded information and high-frequency band encoded information from an original signal, wherein the low-frequency band encoded information is decoded from the decoded signal. A first spectrum calculating step for calculating a first spectrum of a frequency band; a second spectrum calculating step for calculating a second spectrum from the original signal; and a filter having the first spectrum as an internal state. A first parameter calculating step for calculating a parameter indicating characteristics as a first parameter indicating the degree of similarity between the first spectrum and the high frequency band portion of the second spectrum, and a spectrum in which a plurality of spectral residual candidates are recorded the sign of the candidate of one spectral residuals from the residual shape codebook, the first spectrum and the second spectrum of a high frequency band Generating a second parameter calculating step of calculating a second parameter indicating a fluctuation component, from the first parameter and the second parameter the calculated, the estimated value most similar to the high frequency band portion of the second spectrum and A determination step for simultaneously determining the first parameter and the second parameter, and an encoding step for encoding the determined first parameter and the second parameter as encoding information of the high frequency band. I made it.

本発明によれば、第2レイヤ部またはそれよりも上位のレイヤ部で低ビットレートの符号化を行っても高品質な復号信号を得ることができる。   According to the present invention, a high-quality decoded signal can be obtained even when low bit rate encoding is performed in the second layer unit or higher layer unit.

本発明は、スケーラブル符号化の上位レイヤに適した変換符号化に関し、より具体的には、当該変換符号化におけるスペクトルの効率的な符号化法に関する。   The present invention relates to transform coding suitable for an upper layer of scalable coding, and more specifically to an efficient spectrum coding method in the transform coding.

その主な特徴の1つは、第1レイヤ復号信号を周波数分析して得られるスペクトル(第1レイヤ復号スペクトル)を内部状態(フィルタ状態)として持つフィルタを用いてフィルタリング処理を行い、その出力信号を原スペクトルの高域部の推定値とする。ここで、原スペクトルとは、遅延調整された原信号を周波数分析して得られるスペクトルのことである。そして、原スペクトルの高域部に最も類似する出力信号を生成するときのフィルタ情報を符号化して復号化部へ伝送する。フィルタ情報のみを符号化すれば良いため、低ビットレート化が図れる。   One of the main features is that filtering processing is performed using a filter having a spectrum (first layer decoded spectrum) obtained by frequency analysis of the first layer decoded signal as an internal state (filter state), and an output signal thereof Is the estimated value of the high frequency part of the original spectrum. Here, the original spectrum is a spectrum obtained by frequency analysis of the delay-adjusted original signal. Then, the filter information for generating the output signal most similar to the high frequency part of the original spectrum is encoded and transmitted to the decoding unit. Since only the filter information needs to be encoded, the bit rate can be reduced.

本発明のある実施の形態では、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を用いて、前述のフィルタにスペクトル残差を与えてフィルタリング処理を行う。また、他の実施の形態では、第1レイヤ復号スペクトルをフィルタの内部状態に
格納する前に第1レイヤ復号スペクトルの誤差成分を符号化して、第1レイヤ復号スペクトルの品質を向上させてから、フィルタリング処理による原スペクトルの高域部の推定を行う。また、さらに他の実施の形態では、第1レイヤ復号スペクトルの誤差成分を符号化する際に、第1レイヤ復号スペクトルの符号化の性能と第1レイヤ復号スペクトルを使った高域スペクトルの推定の性能とがいずれも高くなるように第1レイヤ復号スペクトルの誤差成分の符号化を行う。
In an embodiment of the present invention, a filtering process is performed by giving a spectral residual to the aforementioned filter using a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded. In another embodiment, the error component of the first layer decoded spectrum is encoded before storing the first layer decoded spectrum in the internal state of the filter to improve the quality of the first layer decoded spectrum. The high-frequency part of the original spectrum is estimated by filtering processing. In still another embodiment, when the error component of the first layer decoded spectrum is encoded, the encoding performance of the first layer decoded spectrum and the estimation of the high frequency spectrum using the first layer decoded spectrum are performed. The error component of the first layer decoded spectrum is encoded so that both performances are high.

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、各実施の形態では、複数のレイヤからなる階層構造を有するスケーラブル符号化を行う。また、各実施の形態では、一例として、(1)スケーラブル符号化の階層構造は、第1レイヤ(基本レイヤまたは下位レイヤ)と第1レイヤより上位にある第2レイヤ(拡張レイヤまたは上位レイヤ)の2階層とする、(2)第2レイヤの符号化では、周波数領域で符号化(変換符号化)を行う、(3)第2レイヤの符号化における変換方式にはMDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を使用する、(4)第2レイヤの符号化では、全帯域を複数のサブバンドに分割する場合は、全帯域をBarkスケールで等間隔に分割し各サブバンドを各臨界帯域に対応付ける、(5)第1レイヤの入力信号のサンプリングレート(F1)と第2レイヤの入力信号のサンプリングレート(F2)には、F2はF1以上(F1≦F2)の関係がある、ものとする。   Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In each embodiment, scalable coding having a hierarchical structure composed of a plurality of layers is performed. In each embodiment, as an example, (1) the hierarchical structure of scalable coding includes a first layer (basic layer or lower layer) and a second layer (an enhancement layer or upper layer) that is higher than the first layer. (2) In the second layer encoding, encoding (transform encoding) is performed in the frequency domain. (3) The transform method in the second layer encoding is MDCT (Modified Discrete Cosine Transform). (4) In the encoding of the second layer, when dividing the entire band into a plurality of subbands, the entire band is divided into equal intervals on the Bark scale and each subband is divided into each subband. (5) F2 is greater than or equal to F1 (F1 ≦ F2) for the sampling rate (F1) of the input signal of the first layer and the sampling rate (F2) of the input signal of the second layer that correspond to the critical band It is assumed that there is a relationship.

(実施の形態1)
図1は、例えば音声符号化装置等を形成する符号化装置100の構成を示すブロック図である。符号化装置100は、ダウンサンプリング部101、第1レイヤ符号化部102、第1レイヤ復号化部103、多重化部104、第2レイヤ符号化部105および遅延部106を有する。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of an encoding apparatus 100 that forms, for example, a speech encoding apparatus. The encoding apparatus 100 includes a downsampling unit 101, a first layer encoding unit 102, a first layer decoding unit 103, a multiplexing unit 104, a second layer encoding unit 105, and a delay unit 106.

図1において、サンプリングレートがF2の音声信号やオーディオ信号(原信号)はダウンサンプリング部101に与えられ、ダウンサンプリング部101にてサンプリング変換処理が行われ、サンプリングレートがF1の信号が生成され、第1レイヤ符号化部102に与えられる。第1レイヤ符号化部102は、サンプリングレートがF1の信号を符号化して得られる符号化コードを第1レイヤ復号化部103および多重化部104に出力する。   In FIG. 1, an audio signal or an audio signal (original signal) having a sampling rate of F2 is given to the downsampling unit 101, and sampling conversion processing is performed in the downsampling unit 101 to generate a signal having a sampling rate of F1, The signal is provided to first layer encoding section 102. First layer encoding section 102 outputs the encoded code obtained by encoding the signal with sampling rate F1 to first layer decoding section 103 and multiplexing section 104.

第1レイヤ復号化部103は、第1レイヤ符号化部102から出力された符号化コードから第1レイヤ復号信号を生成して第2レイヤ符号化部105に出力する。   First layer decoding section 103 generates a first layer decoded signal from the encoded code output from first layer encoding section 102 and outputs the first layer decoded signal to second layer encoding section 105.

遅延部106は、原信号に対して所定の長さの遅延を与えて第2レイヤ符号化部105に出力する。この遅延は、ダウンサンプリング部101、第1レイヤ符号化部102および第1レイヤ復号化部103で生じる時間遅れを調整するためのものである。   Delay section 106 gives a delay of a predetermined length to the original signal and outputs the delayed signal to second layer encoding section 105. This delay is for adjusting a time delay generated in the downsampling unit 101, the first layer encoding unit 102, and the first layer decoding unit 103.

第2レイヤ符号化部105は、遅延部106から出力された原信号を、第1レイヤ復号化部103から出力された第1レイヤ復号信号を用いて符号化を行う。そして、この符号化により得られる符号化コードを多重化部104に出力する。   Second layer encoding section 105 encodes the original signal output from delay section 106 using the first layer decoded signal output from first layer decoding section 103. Then, the encoded code obtained by this encoding is output to multiplexing section 104.

多重化部104は、第1レイヤ符号化部102から出力された符号化コードと第2レイヤ符号化部105から出力された符号化コードとを多重化し、ビットストリームとして出力する。   The multiplexing unit 104 multiplexes the encoded code output from the first layer encoding unit 102 and the encoded code output from the second layer encoding unit 105, and outputs it as a bit stream.

次いで、第2レイヤ符号化部105についてより詳細に説明する。第2レイヤ符号化部105の構成を図2に示す。第2レイヤ符号化部105は、周波数領域変換部201、拡張帯域符号化部202、周波数領域変換部203および聴覚マスキング算出部204を有
する。
Next, second layer encoding section 105 will be described in more detail. The configuration of second layer encoding section 105 is shown in FIG. Second layer encoding section 105 includes frequency domain conversion section 201, extension band encoding section 202, frequency domain conversion section 203, and auditory masking calculation section 204.

図2において、周波数領域変換部201は、第1レイヤ復号化部103から出力された第1レイヤ復号信号をMDCT変換により周波数分析してMDCT係数(第1レイヤ復号スペクトル)を算出する。そして、第1レイヤ復号スペクトルを拡張帯域符号化部202に出力する。   In FIG. 2, the frequency domain transform unit 201 performs frequency analysis on the first layer decoded signal output from the first layer decoding unit 103 by MDCT transform to calculate MDCT coefficients (first layer decoded spectrum). Then, the first layer decoded spectrum is output to extended band coding section 202.

周波数領域変換部203は、遅延部106から出力された原信号をMDCT変換により周波数分析してMDCT係数(原スペクトル)を算出する。そして、原スペクトルを拡張帯域符号化部202に出力する。   The frequency domain transform unit 203 performs frequency analysis on the original signal output from the delay unit 106 by MDCT transform to calculate MDCT coefficients (original spectrum). Then, the original spectrum is output to extended band coding section 202.

聴覚マスキング算出部204は、遅延部106から出力された原信号を用いて、帯域毎の聴覚マスキングを算出し、この聴覚マスキングを拡張帯域符号化部202に通知する。   The auditory masking calculation unit 204 calculates auditory masking for each band using the original signal output from the delay unit 106 and notifies the extended band encoding unit 202 of the auditory masking.

ここで、人間の聴覚特性には、ある信号が聞こえているときにその信号と周波数の近い音が耳に入ってきてもその音が聞こえにくい、という聴覚マスキング特性がある。上記聴覚マスキングは効率的なスペクトル符号化を実現するために用いられる。このスペクトル符号化では、人間の聴覚マスキング特性を利用して聴感上許容される量子化歪を定量化し、その許容される量子化歪に応じた符号化法を適用する。   Here, human auditory characteristics include an auditory masking characteristic that when a signal is heard, even if a sound having a frequency close to that of the signal enters the ear, the sound is difficult to hear. The auditory masking is used to realize efficient spectral coding. In this spectral coding, quantization distortion that is permissible for auditory perception is quantified using human auditory masking characteristics, and a coding method corresponding to the permissible quantization distortion is applied.

拡張帯域符号化部202は、図3に示すように、振幅調整部301、フィルタ状態設定部302、フィルタリング部303、ラグ設定部304、スペクトル残差形状符号帳305、探索部306、スペクトル残差ゲイン符号帳307、乗算器308、拡張スペクトル復号化部309およびスケールファクタ符号化部310を有する。   As shown in FIG. 3, the extension band encoding unit 202 includes an amplitude adjustment unit 301, a filter state setting unit 302, a filtering unit 303, a lag setting unit 304, a spectrum residual shape codebook 305, a search unit 306, and a spectrum residual. A gain codebook 307, a multiplier 308, an extended spectrum decoding unit 309, and a scale factor encoding unit 310 are included.

振幅調整部301には、周波数領域変換部201から第1レイヤ復号スペクトル{S1(k);0≦k<Nn}、周波数領域変換部203から原スペクトル{S2(k);0≦k<Nw}が与えられる。ここで、第1レイヤ復号スペクトルのスペクトル点数をNn、原スペクトルのスペクトル点数をNwと表し、Nn<Nwの関係がある。   The amplitude adjustment unit 301 includes the first layer decoded spectrum {S1 (k); 0 ≦ k <Nn} from the frequency domain transform unit 201, and the original spectrum {S2 (k); 0 ≦ k <Nw from the frequency domain transform unit 203. } Is given. Here, the spectrum score of the first layer decoded spectrum is expressed as Nn, the spectrum score of the original spectrum is expressed as Nw, and there is a relationship of Nn <Nw.

振幅調整部301は、第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の最大振幅スペクトルと最小振幅スペクトルの比(ダイナミックレンジ)が、原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに近づくよう振幅調整を行う。具体的には、次の式(1)に示すように、振幅スペクトルのべき乗をとる。

Figure 0004977471
The amplitude adjustment unit 301 is configured such that the ratio (dynamic range) between the maximum amplitude spectrum and the minimum amplitude spectrum of the first layer decoded spectrum {S1 (k); 0 ≦ k <Nn} is the high frequency portion {S2 (k) of the original spectrum. The amplitude is adjusted so as to approach the dynamic range of Nn ≦ k <Nw}. Specifically, as shown in the following equation (1), the power of the amplitude spectrum is taken.
Figure 0004977471

ここで、sign()は正号/負号を返す関数、γは0≦γ≦1の範囲にある実数を表す。振幅調整部301は、振幅調整後の第1レイヤ復号スペクトルのダイナミックレンジが原スペクトルの高域部{S2(k);Nn≦k<Nw}のダイナミックレンジに最も近づくときのγ(振幅調整係数)を、あらかじめ用意された複数の候補の中から選択し、その符号化コードを多重化部104に出力する。   Here, sign () represents a function that returns a positive / negative sign, and γ represents a real number in the range of 0 ≦ γ ≦ 1. The amplitude adjustment unit 301 uses the γ (amplitude adjustment coefficient) when the dynamic range of the first layer decoded spectrum after amplitude adjustment is closest to the dynamic range of the high-frequency part {S2 (k); Nn ≦ k <Nw} of the original spectrum. ) Is selected from a plurality of candidates prepared in advance, and the encoded code is output to the multiplexing unit 104.

フィルタ状態設定部302は、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を後述するピッチフィルタの内部状態に設定する。具体的には、振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファ{S(k);0≦k<Nn}に代入し、フィルタリング部303へ出力する。ここで、生成スペクトルバッファS(k)は、0≦k<Nwの範囲で定義される配列変数である
。後述するフィルタリング処理によって(Nw−Nn)点の原スペクトルの推定値(以下「推定原スペクトル」と言う)の候補が生成される。
The filter state setting unit 302 sets the first layer decoded spectrum {S1 ′ (k); 0 ≦ k <Nn} after amplitude adjustment to the internal state of the pitch filter described later. Specifically, the first layer decoded spectrum {S1 ′ (k); 0 ≦ k <Nn} after amplitude adjustment is substituted into the generated spectrum buffer {S (k); 0 ≦ k <Nn}, and the filtering unit 303 Output to. Here, the generated spectrum buffer S (k) is an array variable defined in the range of 0 ≦ k <Nw. A candidate of an estimated value (hereinafter referred to as “estimated original spectrum”) of the (Nw−Nn) point original spectrum is generated by a filtering process described later.

ラグ設定部304は、探索部306からの指示に従い、ラグTを予め定められた探索範囲TMIN〜TMAXの中で漸次的に少しずつ変化させながら、フィルタリング部303に順次出力する。   In accordance with an instruction from the search unit 306, the lag setting unit 304 sequentially outputs the lag T to the filtering unit 303 while gradually changing the lag T within a predetermined search range TMIN to TMAX.

スペクトル残差形状符号帳305は、複数のスペクトル残差形状ベクトルの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差形状ベクトルを順次出力する。   The spectral residual shape codebook 305 stores a plurality of spectral residual shape vector candidates. Further, in accordance with an instruction from the search unit 306, spectral residual shape vectors are sequentially output from all candidates or from candidates limited in advance.

同様に、スペクトル残差ゲイン符号帳307は複数のスペクトル残差ゲインの候補を格納している。また、探索部306からの指示に従い、全ての候補の中から、または、あらかじめ限定された候補の中から、スペクトル残差ゲインを順次出力する。   Similarly, the spectral residual gain codebook 307 stores a plurality of spectral residual gain candidates. Further, in accordance with an instruction from the search unit 306, the spectral residual gain is sequentially output from all candidates or from candidates limited in advance.

乗算器308は、スペクトル残差形状符号帳305から出力されるスペクトル残差形状ベクトルと、スペクトル残差ゲイン符号帳307から出力されるスペクトル残差ゲインと、を乗じて、スペクトル残差形状ベクトルをゲイン調整する。そして、ゲイン調整されたスペクトル残差形状ベクトルをフィルタリング部303に出力する。   The multiplier 308 multiplies the spectral residual shape vector output from the spectral residual shape codebook 305 by the spectral residual gain output from the spectral residual gain codebook 307 to obtain the spectral residual shape vector. Adjust the gain. The gain-adjusted spectral residual shape vector is output to the filtering unit 303.

フィルタリング部303は、フィルタ状態設定部302で設定されたピッチフィルタの内部状態と、ラグ設定部304から出力されるラグTと、ゲイン調整されたスペクトル残差形状ベクトルとを用いてフィルタリング処理を行い、推定原スペクトルを算出する。ここで、ピッチフィルタの伝達関数は、次の式(2)で表される。また、このフィルタリング処理は、次の式(3)のように表される。

Figure 0004977471
Figure 0004977471
The filtering unit 303 performs a filtering process using the internal state of the pitch filter set by the filter state setting unit 302, the lag T output from the lag setting unit 304, and the spectral residual shape vector after gain adjustment. The estimated original spectrum is calculated. Here, the transfer function of the pitch filter is expressed by the following equation (2). Further, this filtering process is expressed as the following equation (3).
Figure 0004977471
Figure 0004977471

ここで、C(i,k)は第i番目のスペクトル残差形状ベクトル、g(j)は第j番目のスペクトル残差形状ゲインを表す。範囲Nn≦k<Nwに含まれる生成スペクトルバッファS(k)がフィルタリング部303の出力信号(つまり、推定原スペクトル)として探索部306に出力される。図4に、生成スペクトルバッファ、振幅調整後の第1レイヤ復号スペクトル、フィルタリング部303の出力信号の相互関係を示す。   Here, C (i, k) represents the i-th spectral residual shape vector, and g (j) represents the j-th spectral residual shape gain. The generated spectrum buffer S (k) included in the range Nn ≦ k <Nw is output to the search unit 306 as an output signal of the filtering unit 303 (that is, an estimated original spectrum). FIG. 4 shows the correlation among the generated spectrum buffer, the first layer decoded spectrum after amplitude adjustment, and the output signal of the filtering unit 303.

探索部306は、ラグ設定部304、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307に、ラグ、スペクトル残差形状およびスペクトル残差ゲインの出力をそれぞれ指示する。   Search section 306 instructs lag setting section 304, spectral residual shape codebook 305, and spectral residual gain codebook 307 to output lag, spectral residual shape, and spectral residual gain, respectively.

また、探索部306は、原スペクトルの高域部{S2(k);Nn≦k<Nw}とフィルタリング部303の出力信号{S(k);Nn≦k<Nw}との間の歪Eを算出する。そして、合成による分析手法(AbS;Analysis by Synthesis)により、最も歪が小さくなるときのラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインの組み合わせを決定する。このとき、聴覚マスキング算出部204から出力された聴覚マスキングを利用して、聴感的に最も歪の小さい組み合わせを選択する。この歪をEとすると、歪Eは、例えば聴覚マスキングにより定まる重み関数w(k)を用いて式
(4)によって表される。ここで、重み関数w(k)は、聴覚マスキングの大きい(歪が聞こえ難い)周波数では小さな値をとり、聴覚マスキングの小さい(歪が聞こえ易い)周波数では大きな値をとる。

Figure 0004977471
The search unit 306 also performs distortion E between the high-frequency part {S2 (k); Nn ≦ k <Nw} of the original spectrum and the output signal {S (k); Nn ≦ k <Nw} of the filtering unit 303. Is calculated. Then, a combination of a lag, a spectrum residual shape vector, and a spectrum residual gain when the distortion becomes the smallest is determined by an analysis method (AbS; Analysis by Synthesis) by synthesis. At this time, the auditory masking output from the auditory masking calculation unit 204 is used to select the combination with the smallest audible distortion. Assuming that this distortion is E, the distortion E is expressed by Expression (4) using a weight function w (k) determined by auditory masking, for example. Here, the weighting function w (k) takes a small value at a frequency where auditory masking is large (distortion is difficult to hear) and takes a large value at a frequency where auditory masking is small (distortion is easy to hear).
Figure 0004977471

探索部306により決定されたラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードは、多重化部104および拡張スペクトル復号化部309に出力される。   The lag encoding code, spectral residual shape vector encoding code, and spectral residual gain encoding code determined by search section 306 are output to multiplexing section 104 and extended spectrum decoding section 309.

上記のAbSによる符号化コード決定法においては、ラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを同時に決定しても良いし、あるいは、演算量を削減するために各パラメータを順次(例えば、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲインの順に)決定しても良い。   In the above-described coding code determination method using AbS, the lag, the spectral residual shape vector, and the spectral residual gain may be determined at the same time, or each parameter is sequentially set (for example, the lag is reduced in order to reduce the calculation amount). , In the order of spectral residual shape vector and spectral residual gain).

拡張スペクトル復号化部309は、振幅調整部301より出力される振幅調整係数の符号化コードならびに探索部306より出力されるラグの符号化コード、スペクトル残差形状ベクトルの符号化コードおよびスペクトル残差ゲインの符号化コードを復号し、原スペクトルの推定値(推定原スペクトル)を生成する。   The extended spectrum decoding unit 309 includes an amplitude adjustment coefficient encoding code output from the amplitude adjustment unit 301, a lag encoding code output from the search unit 306, a spectral residual shape vector encoding code, and a spectral residual. The encoded code of the gain is decoded, and an estimated value (estimated original spectrum) of the original spectrum is generated.

具体的には、まず、復号された振幅調整係数γを用いて前述の式(1)に従い第1レイヤ復号スペクトル{S1(k);0≦k<Nn}の振幅調整を行う。次に、振幅調整された第1レイヤ復号スペクトルをフィルタの内部状態として用いるとともに、それぞれ復号されたラグ、スペクトル残差形状ベクトルおよびスペクトル残差ゲインを用いて、前述の式(3)に従ってフィルタリング処理を行い、推定原スペクトル{S(k);Nn≦k<Nw}を生成する。生成された推定原スペクトルはスケールファクタ符号化部310に出力される。   Specifically, first, amplitude adjustment of the first layer decoded spectrum {S1 (k); 0 ≦ k <Nn} is performed using the decoded amplitude adjustment coefficient γ according to the above-described equation (1). Next, the amplitude-adjusted first layer decoded spectrum is used as an internal state of the filter, and filtering processing is performed according to the above-described equation (3) using the decoded lag, spectral residual shape vector, and spectral residual gain, respectively. To generate an estimated original spectrum {S (k); Nn ≦ k <Nw}. The generated estimated original spectrum is output to scale factor encoding section 310.

スケールファクタ符号化部310は、周波数領域変換部203より出力される原スペクトルの高域部{S2(k);Nn≦k<Nw}と拡張スペクトル復号化部309より出力される推定原スペクトル{S(k);Nn≦k<Nw}とを用いて、聴覚マスキングを利用して聴感上最も適した推定原スペクトルのスケールファクタ(スケーリング係数)を符号化し、その符号化コードを多重化部104に出力する。   The scale factor encoding unit 310 includes a high-frequency part {S2 (k); Nn ≦ k <Nw} of the original spectrum output from the frequency domain conversion unit 203 and an estimated original spectrum {output from the extended spectrum decoding unit 309 { Using S (k); Nn ≦ k <Nw}, the scale factor (scaling coefficient) of the estimated original spectrum most suitable for hearing is encoded using auditory masking, and the encoded code is multiplexed by the multiplexing unit 104. Output to.

すなわち、第2レイヤ符号化コードは、振幅調整部301から出力される符号化コード(振幅調整係数)、探索部306から出力される符号化コード(ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン)およびスケールファクタ符号化部310から出力される符号化コード(スケールファクタ)の組み合わせからなる。   That is, the second layer encoded code includes an encoded code (amplitude adjustment coefficient) output from the amplitude adjustment unit 301, and an encoded code (lag, spectrum residual shape vector, spectrum residual gain) output from the search unit 306. ) And the encoding code (scale factor) output from the scale factor encoding unit 310.

なお、本実施の形態では、帯域Nn〜Nwに対して拡張帯域符号化部202を適用して一組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定する構成について説明しているが、帯域Nn〜Nwを複数の帯域に分割し各帯域に対して拡張帯域符号化部202を適用する構成にしても良い。この場合、帯域毎に符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を決定し、多重化部104に出力することになる。例えば、帯域Nn〜NwをM個の帯域に分割して各帯域で拡張帯域符号化部202を適用すると、M組の符号化コード(振幅調整係数、ラグ、スペクトル残差形状ベク
トル、スペクトル残差ゲイン、スケールファクタ)が得られることになる。
In the present embodiment, the extended band coding unit 202 is applied to the bands Nn to Nw, and a set of coded codes (amplitude adjustment coefficient, lag, spectrum residual shape vector, spectrum residual gain, scale) However, a configuration may be adopted in which the bands Nn to Nw are divided into a plurality of bands and the extended band encoding unit 202 is applied to each band. In this case, an encoding code (amplitude adjustment coefficient, lag, spectral residual shape vector, spectral residual gain, scale factor) is determined for each band and is output to the multiplexing unit 104. For example, when the bands Nn to Nw are divided into M bands and the extended band encoding unit 202 is applied to each band, M sets of encoded codes (amplitude adjustment coefficient, lag, spectrum residual shape vector, spectrum residual) Gain, scale factor).

また、複数帯域でそれぞれ独立の符号化コードを送らずに、隣接する帯域同士で一部の符号化コードを共有しても良い。例えば、帯域Nn〜NwをM個の帯域に分割し、隣接する2つの帯域で共通の振幅調整係数を用いる場合、振幅調整係数の符号化コードの数はM/2個となり、それ以外の符号化コードの数はそれぞれM個となる。   Further, a part of the encoded codes may be shared between adjacent bands without sending independent encoded codes in a plurality of bands. For example, when the bands Nn to Nw are divided into M bands and a common amplitude adjustment coefficient is used in two adjacent bands, the number of encoded codes of the amplitude adjustment coefficient is M / 2, and the other codes The number of conversion codes is M.

なお、本実施の形態は1次のAR型ピッチフィルタを用いた場合について説明してきた。しかしながら、本発明が適用できるフィルタは1次のAR型ピッチフィルタに限定されず、伝達関数が次の式(5)で表されるフィルタにも本発明を適用することができる。フィルタ次数を規定するパラメータLおよびMの大きいピッチフィルタを用いるほど多様な特性を表現でき、品質が向上する可能性がある。ただし、次数が大きくなるほどフィルタ係数の符号化ビットを多く配分する必要が出てくるため、実用的なビット配分の元で適切なピッチフィルタの伝達関数を決めておく必要がある。

Figure 0004977471
In the present embodiment, the case where a primary AR type pitch filter is used has been described. However, a filter to which the present invention can be applied is not limited to a first-order AR type pitch filter, and the present invention can also be applied to a filter whose transfer function is expressed by the following equation (5). The more the pitch filter having the parameters L and M that define the filter order is used, the more various characteristics can be expressed and the quality may be improved. However, since it becomes necessary to allocate more encoded bits of the filter coefficient as the order increases, it is necessary to determine an appropriate pitch filter transfer function based on practical bit allocation.
Figure 0004977471

なお、本実施の形態では聴覚マスキングを用いることを前提としているが、聴覚マスキングを用いない構成であっても良い。その場合、図2の聴覚マスキング算出部204を第2レイヤ符号化部105に設ける必要が無くなり、装置全体の演算量を削減できる。   In this embodiment, it is assumed that auditory masking is used, but a configuration that does not use auditory masking may be used. In this case, it is not necessary to provide the auditory masking calculation unit 204 of FIG. 2 in the second layer encoding unit 105, and the calculation amount of the entire apparatus can be reduced.

ここで、多重化部104から出力されるビットストリームの構成について、図5を用いて説明する。ビットストリームのMSB(Most Significant Bit)から順に、第1レイヤ符号化コード、第2レイヤ符号化コードが格納されている。さらに、第2レイヤ符号化コードは、スケールファクタ、振幅調整係数、ラグ、スペクトル残差ゲイン、スペクトル残差形状ベクトルの順に格納され、後者の情報ほどLSB(Least Significant Bit)に近い位置に配置されている。このビットストリームの構成は、各符号化コードの符号欠落に対する感度(符号化コードが欠落したときにどの程度復号信号の品質を劣化させるか)に対して、符号誤り感度の高い(大きく劣化する)ものほどMSBに近い位置に配置されている。この構成によれば、伝送路上でビットストリームを部分的に破棄する場合にLSBから順に破棄することで、破棄による劣化を最小限に抑えることができる。LSB側から優先的にビットストリームを破棄するネットワーク構成の一例では、図5のように区切られた各符号化コードを別々のパケットで伝送し、各パケットに優先順位付けをして、優先制御のできるパケット網を使う構成が挙げられる。ただし、ネットワーク構成は前述のものに限定されない。   Here, the configuration of the bit stream output from the multiplexing unit 104 will be described with reference to FIG. A first layer encoded code and a second layer encoded code are stored sequentially from the MSB (Most Significant Bit) of the bit stream. Further, the second layer encoded code is stored in the order of scale factor, amplitude adjustment coefficient, lag, spectral residual gain, spectral residual shape vector, and the latter information is arranged at a position closer to LSB (Least Significant Bit). ing. The configuration of this bit stream is high in code error sensitivity (deteriorates greatly) with respect to the sensitivity to code loss of each encoded code (how much the quality of the decoded signal is degraded when the encoded code is lost). The closer one is to the MSB. According to this configuration, when the bit stream is partially discarded on the transmission path, the degradation due to the discarding can be minimized by discarding sequentially from the LSB. In an example of a network configuration in which the bit stream is discarded preferentially from the LSB side, each encoded code divided as shown in FIG. 5 is transmitted in separate packets, prioritized for each packet, A configuration that uses a packet network that can be used. However, the network configuration is not limited to that described above.

また、図5のように符号誤り感度の高い符号化パラメータほどMSBに近い位置に配置されるビットストリーム構成において、MSBに近いビットほど強い誤り検出・誤り訂正がかけられるようなチャネル符号化を適用すれば、復号品質の劣化を最小限に抑えられるという効果が得られる。例えば、誤り検出、誤り訂正の手法としてはCRC符号やRS符号などが適用できる。   In addition, in the bit stream configuration in which the coding parameters with higher code error sensitivity are arranged closer to the MSB as shown in FIG. 5, channel coding is applied such that stronger error detection and error correction is applied to the bits closer to the MSB. By doing so, it is possible to obtain an effect that degradation of decoding quality can be minimized. For example, a CRC code, an RS code, or the like can be applied as a method for error detection and error correction.

図6は、例えば音声復号化装置等を形成する復号化装置600の構成を示すブロック図である。   FIG. 6 is a block diagram illustrating a configuration of a decoding device 600 that forms, for example, a speech decoding device.

復号化装置600は、符号化装置100から出力されたビットストリームを第1レイヤ符号化コードと第2レイヤ符号化コードとに分離する分離部601、第1レイヤ符号化コードを復号する第1レイヤ復号化部602および第2レイヤ符号化コードを復号する第2レイヤ復号化部603を有する。   Decoding apparatus 600 includes a separation unit 601 that separates the bitstream output from encoding apparatus 100 into a first layer encoded code and a second layer encoded code, and a first layer that decodes the first layer encoded code. It has the decoding part 602 and the 2nd layer decoding part 603 which decodes a 2nd layer encoding code.

分離部601は、符号化装置100から送出されたビットストリームを受信し、第1レイヤの符号化コードと第2レイヤの符号化コードとに分離し、第1レイヤ復号化部602と第2レイヤ復号化部603にそれぞれ出力する。   Separating section 601 receives the bitstream sent from encoding apparatus 100, separates it into a first layer encoded code and a second layer encoded code, and first layer decoding section 602 and second layer The data are output to the decryption unit 603, respectively.

第1レイヤ復号化部602は、第1レイヤ符号化コードから第1レイヤ復号信号を生成して、第2レイヤ復号化部603に出力する。また、生成された第1レイヤ復号信号を、必要に応じて、最低限の品質が担保された復号信号(第1レイヤ復号信号)として出力する。   First layer decoding section 602 generates a first layer decoded signal from the first layer encoded code, and outputs the first layer decoded signal to second layer decoding section 603. In addition, the generated first layer decoded signal is output as a decoded signal (first layer decoded signal) with guaranteed minimum quality, if necessary.

第2レイヤ復号化部603は、第1レイヤ復号信号と第2レイヤ符号化コードとを用いて、高品質の復号信号(ここでは、第2レイヤ復号信号と称す)を生成し、必要に応じてこの復号信号を出力する。   Second layer decoding section 603 generates a high-quality decoded signal (herein referred to as a second layer decoded signal) using the first layer decoded signal and the second layer encoded code, and if necessary, This decoded signal is output.

このように、第1レイヤ復号信号によって再生音声の最低限の品質が担保され、第2レイヤ復号信号によって再生音声の品質を高めることができる。また、出力する信号を第1レイヤ復号信号または第2レイヤ復号信号のどちらにするかは、ネットワーク環境(パケットロスの発生等)によって第2レイヤ符号化コードが得られるかどうか、または、アプリケーションやユーザの設定等に依存する。   In this way, the minimum quality of the reproduced sound is ensured by the first layer decoded signal, and the quality of the reproduced sound can be enhanced by the second layer decoded signal. In addition, whether the output signal is the first layer decoded signal or the second layer decoded signal depends on whether the second layer encoded code can be obtained depending on the network environment (occurrence of packet loss, etc.) Depends on user settings.

第2レイヤ復号化部603の構成を、図7を用いて詳細に行う。図7において、第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。   The configuration of second layer decoding section 603 will be described in detail using FIG. In FIG. 7, second layer decoding section 603 has extended band decoding section 701, frequency domain transform section 702, and time domain transform section 703.

周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、そのパラメータをスペクトル点数がNnの第1レイヤ復号スペクトルとして拡張帯域復号化部701に出力する。   Frequency domain transform section 702 transforms the first layer decoded signal input from first layer decoding section 602 into frequency domain parameters (for example, MDCT coefficients), and the parameters are subjected to first layer decoding with a spectrum score of Nn. The spectrum is output to extended band decoding section 701 as a spectrum.

拡張帯域復号化部701は、分離部601から入力された第2レイヤ符号化コード(この構成では拡張帯域符号化コードと同一)から各種パラメータ(振幅調整係数、ラグ、スペクトル残差形状ベクトル、スペクトル残差ゲイン、スケールファクタ)を復号する。また、復号された各種パラメータと周波数領域変換部702から出力された第1レイヤ復号スペクトルとを用いて帯域拡張された第2の復号スペクトルであってスペクトル点数がNwの第2のスペクトルを生成する。そして、第2の復号スペクトルを時間領域変換部703に出力する。   The extension band decoding unit 701 uses various parameters (amplitude adjustment coefficient, lag, spectrum residual shape vector, spectrum) from the second layer encoded code (in this configuration, the same as the extension band encoded code) input from the separation unit 601. (Residual gain, scale factor). Also, a second decoded spectrum that is band-extended using the various decoded parameters and the first layer decoded spectrum output from the frequency domain transform section 702 and having a spectrum score of Nw is generated. . Then, the second decoded spectrum is output to time domain transform section 703.

時間領域変換部703は、第2の復号スペクトルを時間領域の信号に変換した後、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行って、フレーム間に生じる不連続を回避し、第2レイヤ復号信号を出力する。   The time domain conversion unit 703 converts the second decoded spectrum into a time domain signal, and then performs appropriate processing such as windowing and superposition addition as necessary to avoid discontinuities between frames. The second layer decoded signal is output.

次に、拡張帯域復号化部701の詳細な説明を、図8を用いて行う。図8において、拡張帯域復号化部701は、分離部801、振幅調整部802、フィルタ状態設定部803、フィルタリング部804、スペクトル残差形状符号帳805、スペクトル残差ゲイン符号帳806、乗算器807、スケールファクタ復号化部808、スケーリング部809およびスペクトル合成部810を有する。   Next, detailed description of the extended band decoding unit 701 will be given with reference to FIG. In FIG. 8, the extended band decoding unit 701 includes a separation unit 801, an amplitude adjustment unit 802, a filter state setting unit 803, a filtering unit 804, a spectral residual shape codebook 805, a spectral residual gain codebook 806, and a multiplier 807. A scale factor decoding unit 808, a scaling unit 809, and a spectrum synthesis unit 810.

分離部801は、分離部601から入力される拡張帯域符号化コードを振幅調整係数符号化コード、ラグ符号化コード、残差形状符号化コード、残差ゲイン符号化コード、スケールファクタ符号化コード、に分離する。また、振幅調整係数符号化コードを振幅調整部802に、ラグ符号化コードをフィルタリング部804に、残差形状符号化コードをスペクトル残差形状符号帳805に、残差ゲイン符号化コードをスペクトル残差ゲイン符号帳806に、スケールファクタ符号化コードをスケールファクタ復号化部808に、それぞれ出力する。   The separation unit 801 converts the extension band encoded code input from the separation unit 601 into an amplitude adjustment coefficient encoded code, a lag encoded code, a residual shape encoded code, a residual gain encoded code, a scale factor encoded code, To separate. Also, the amplitude adjustment coefficient encoded code is stored in the amplitude adjuster 802, the lag encoded code is stored in the filtering unit 804, the residual shape encoded code is stored in the spectral residual shape codebook 805, and the residual gain encoded code is stored in the spectral residual. The scale factor encoded code is output to the difference gain codebook 806 to the scale factor decoding unit 808, respectively.

振幅調整部802は、分離部801から入力された振幅調整係数符号化コードを復号し、復号された振幅調整係数を用いて、別途周波数領域変換部702から入力された第1レイヤ復号スペクトルの振幅を調整し、振幅調整後の第1レイヤ復号スペクトルをフィルタ状態設定部803に出力する。振幅調整は、前述の式(1)で表される方法で行う。ここで、S1(k)は第1レイヤ復号スペクトル、S1’(k)は振幅調整後の第1レイヤ復号スペクトルを表す。   The amplitude adjustment unit 802 decodes the amplitude adjustment coefficient encoded code input from the separation unit 801, and uses the decoded amplitude adjustment coefficient to separately detect the amplitude of the first layer decoded spectrum input from the frequency domain transform unit 702. The first layer decoded spectrum after amplitude adjustment is output to the filter state setting section 803. The amplitude adjustment is performed by the method represented by the above-described equation (1). Here, S1 (k) represents the first layer decoded spectrum, and S1 '(k) represents the first layer decoded spectrum after amplitude adjustment.

フィルタ状態設定部803は、前述の式(2)で表される伝達関数のピッチフィルタのフィルタ状態に振幅調整後の第1レイヤ復号スペクトルを設定する。具体的には振幅調整後の第1レイヤ復号スペクトル{S1’(k);0≦k<Nn}を生成スペクトルバッファS(k)に代入し、フィルタリング部804へ出力する。ここで、Tはピッチフィルタのラグである。また、生成スペクトルバッファS(k)は、k=0〜Nw−1の範囲で定義される配列変数であり、本フィルタリング処理によって(Nw−Nn)点のスペクトルが生成される。   The filter state setting unit 803 sets the first layer decoded spectrum after amplitude adjustment to the filter state of the pitch filter of the transfer function represented by the above equation (2). Specifically, the amplitude-adjusted first layer decoded spectrum {S1 ′ (k); 0 ≦ k <Nn} is substituted into the generated spectrum buffer S (k) and output to the filtering unit 804. Here, T is a pitch filter lag. The generated spectrum buffer S (k) is an array variable defined in a range of k = 0 to Nw−1, and a spectrum of (Nw−Nn) points is generated by this filtering process.

フィルタリング部804は、分離部801から入力されたラグTを復号し、復号されたラグTを用いて、フィルタ状態設定部803から入力された生成スペクトルバッファS(k)に対してフィルタリング処理を行う。具体的には、前述の式(3)に示される方法によって出力スペクトル{S(k);Nn≦k<Nw}を生成する。ここで、g(j)は残差ゲイン符号化コードjにより表されるスペクトル残差ゲイン、C(i,k)は残差形状符号化コードiにより表されるスペクトル残差形状ベクトルをそれぞれ示しており、g(j)・C(i,k)は乗算器807から入力される。生成されたフィルタリング部804の出力スペクトル{S(k);Nn≦k<Nw}はスケーリング部809へ出力される。   The filtering unit 804 decodes the lag T input from the separation unit 801, and performs a filtering process on the generated spectrum buffer S (k) input from the filter state setting unit 803 using the decoded lag T. . Specifically, the output spectrum {S (k); Nn ≦ k <Nw} is generated by the method shown in the above-described equation (3). Here, g (j) represents a spectral residual gain represented by a residual gain encoding code j, and C (i, k) represents a spectral residual shape vector represented by a residual shape encoding code i. G (j) · C (i, k) is input from the multiplier 807. The generated output spectrum {S (k); Nn ≦ k <Nw} of the filtering unit 804 is output to the scaling unit 809.

スペクトル残差形状符号帳805は、分離部801から入力された残差形状符号化コードを復号し、復号結果に対応するスペクトル残差形状ベクトルC(i,k)を乗算器807へ出力する。   The spectral residual shape codebook 805 decodes the residual shape encoded code input from the separation unit 801 and outputs a spectral residual shape vector C (i, k) corresponding to the decoding result to the multiplier 807.

スペクトル残差ゲイン符号帳806は、分離部801から入力された残差ゲイン符号化コードを復号し、復号結果に対応するスペクトル残差ゲインg(j)を乗算器807へ出力する。   The spectral residual gain codebook 806 decodes the residual gain encoded code input from the separation unit 801 and outputs a spectral residual gain g (j) corresponding to the decoding result to the multiplier 807.

乗算器807は、スペクトル残差形状符号帳805から入力されたスペクトル残差形状ベクトルC(i,k)と、スペクトル残差ゲイン符号帳806から入力されたスペクトル残差ゲインg(j)と、の乗算結果をフィルタリング部804へ出力する。   The multiplier 807 has a spectral residual shape vector C (i, k) input from the spectral residual shape codebook 805, a spectral residual gain g (j) input from the spectral residual gain codebook 806, and Is output to the filtering unit 804.

スケールファクタ復号化部808は、分離部801から入力されたスケールファクタ符号化コードを復号し、復号されたスケールファクタをスケーリング部809へ出力する。   The scale factor decoding unit 808 decodes the scale factor encoded code input from the separation unit 801 and outputs the decoded scale factor to the scaling unit 809.

スケーリング部809は、フィルタリング部804から与えられた出力スペクトル{S(k);Nn≦k<Nw}に、スケールファクタ復号化部808から入力されたスケール
ファクタを乗じて、その乗算結果をスペクトル合成部810に出力する。
The scaling unit 809 multiplies the output spectrum {S (k); Nn ≦ k <Nw} given from the filtering unit 804 by the scale factor inputted from the scale factor decoding unit 808, and spectrally synthesizes the multiplication result. Output to the unit 810.

スペクトル合成部810は、周波数領域変換部702より与えられる第1レイヤ復号スペクトル{S1(k);0≦k<Nn}と、スケーリング部809から出力されるスケーリング後の生成スペクトルバッファの高域部{S(k);Nn≦k<Nw}を結合して得られるスペクトルを第2の復号スペクトルとして時間領域変換部703に出力する。   Spectrum synthesis section 810 includes first layer decoded spectrum {S1 (k); 0 ≦ k <Nn} given from frequency domain transform section 702, and a high-frequency section of the generated spectrum buffer after scaling output from scaling section 809 A spectrum obtained by combining {S (k); Nn ≦ k <Nw} is output to the time domain transforming unit 703 as a second decoded spectrum.

(実施の形態2)
図9に、本発明の実施の形態2に係る第2レイヤ符号化部105の構成を示す。図9において図2と同一名称を持つブロックは、同様の機能を有するので、ここではその詳細な説明を省略する。図2と図9の違いは、周波数領域変換部201と拡張帯域符号化部202との間に第1スペクトル符号化部901が存在する点にある。第1スペクトル符号化部901は、周波数領域変換部201より出力される第1レイヤ復号スペクトルの品質を向上させ、そのときの符号化コード(第1のスペクトル符号化コード)を多重化部104に出力するとともに、品質向上された第1レイヤ復号スペクトル(第1の復号スペクトル)を拡張帯域符号化部202に与える。拡張帯域符号化部202は、前述の処理を第1の復号スペクトルを用いて行い、その結果として拡張帯域符号化コードを出力する。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コードと第1のスペクトル符号化コードとの組み合わせからなる。したがって、本実施の形態では、多重化部104は、第1レイヤ符号化コード、拡張帯域符号化コードおよび第1のスペクトル符号化コードを多重化して、ビットストリームを生成する。
(Embodiment 2)
FIG. 9 shows the configuration of second layer encoding section 105 according to Embodiment 2 of the present invention. In FIG. 9, blocks having the same names as those in FIG. 2 have the same functions, and therefore detailed description thereof is omitted here. The difference between FIG. 2 and FIG. 9 is that a first spectrum encoding unit 901 exists between the frequency domain transform unit 201 and the extended band encoding unit 202. First spectrum encoding section 901 improves the quality of the first layer decoded spectrum output from frequency domain transform section 201, and the encoded code (first spectrum encoded code) at that time is sent to multiplexing section 104. The first layer decoded spectrum (first decoded spectrum) with improved quality is output to the extended band coding unit 202. The extension band encoding unit 202 performs the above-described processing using the first decoded spectrum, and outputs an extension band encoded code as a result. That is, the second layer encoded code of the present embodiment is a combination of the extended band encoded code and the first spectrum encoded code. Therefore, in the present embodiment, multiplexing section 104 multiplexes the first layer encoded code, the extended band encoded code, and the first spectrum encoded code to generate a bit stream.

次に、第1スペクトル符号化部901の詳細を、図10を用いて説明する。第1スペクトル符号化部901は、スケーリング係数符号化部1001、スケーリング係数復号化部1002、微細スペクトル符号化部1003、多重化部1004、微細スペクトル復号化部1005、正規化部1006、減算器1007および加算器1008を有する。   Next, details of the first spectrum encoding unit 901 will be described with reference to FIG. The first spectrum encoding unit 901 includes a scaling coefficient encoding unit 1001, a scaling coefficient decoding unit 1002, a fine spectrum encoding unit 1003, a multiplexing unit 1004, a fine spectrum decoding unit 1005, a normalization unit 1006, and a subtractor 1007. And an adder 1008.

減算器1007は、原スペクトルから第1レイヤ復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1001および正規化部1006に出力する。スケーリング係数符号化部1001は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、その符号化コードを多重化部1004およびスケーリング係数復号化部1002に出力する。   The subtractor 1007 generates a residual spectrum by subtracting the first layer decoded spectrum from the original spectrum, and outputs the residual spectrum to the scaling coefficient encoding unit 1001 and the normalizing unit 1006. The scaling coefficient encoding unit 1001 calculates a scaling coefficient representing the spectral outline of the residual spectrum, encodes the scaling coefficient, and outputs the encoded code to the multiplexing unit 1004 and the scaling coefficient decoding unit 1002.

スケーリング係数の符号化においては、聴覚マスキングを用いても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。これにより、スケーリング係数の符号化を効率化することができる。   Auditory masking may be used in encoding the scaling factor. For example, bit allocation necessary for encoding the scaling coefficient is determined using auditory masking, and encoding is performed based on the bit allocation information. At this time, if there is a band to which no bits are allocated, the scaling coefficient of that band is not encoded. Thereby, the encoding of a scaling factor can be made efficient.

スケーリング係数復号化部1002は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1006、微細スペクトル符号化部1003および微細スペクトル復号化部1005に出力する。   The scaling coefficient decoding unit 1002 decodes the scaling coefficient from the input scaling coefficient encoded code, and outputs the decoded scaling coefficient to the normalization unit 1006, the fine spectrum encoding unit 1003, and the fine spectrum decoding unit 1005. .

正規化部1006は、スケーリング係数復号化部1002より与えられるスケーリング係数を用いて、減算器1007より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1003に出力する。   The normalization unit 1006 normalizes the residual spectrum provided from the subtractor 1007 using the scaling coefficient provided from the scaling coefficient decoding unit 1002, and the normalized residual spectrum is subjected to the fine spectrum encoding unit 1003. Output to.

微細スペクトル符号化部1003は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられるビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル
)の符号化を行う。そして、この符号化によって得られた微細スペクトル符号化コードを多重化部1004および微細スペクトル復号化部1005に出力する。
The fine spectrum encoding unit 1003 calculates the auditory importance of each band using the scaling coefficient input from the scaling coefficient decoding unit 1002, obtains the number of bits allocated to each band, and determines the condition of the number of bits. Originally, the normalized residual spectrum (fine spectrum) is encoded. Then, the fine spectrum encoded code obtained by this encoding is output to multiplexing section 1004 and fine spectrum decoding section 1005.

なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル符号化部1003へ入力するように構成する。   In addition, when encoding the residual spectrum after normalization, it may be encoded using auditory masking so as to reduce auditory distortion. Moreover, you may make it use the information of a 1st layer decoding spectrum for calculation of auditory importance. In this case, the first layer decoded spectrum is input to the fine spectrum encoding unit 1003.

スケーリング係数符号化部1001および微細スペクトル符号化部1003より出力される符号化コードは、多重化部1004にて多重化され、第1のスペクトル符号化コードとして多重化部104に出力される。   The encoded codes output from the scaling coefficient encoding unit 1001 and the fine spectrum encoding unit 1003 are multiplexed by the multiplexing unit 1004 and output to the multiplexing unit 104 as the first spectrum encoded code.

微細スペクトル復号化部1005は、スケーリング係数復号化部1002から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられたビット数を求め、スケーリング係数と微細スペクトル符号化部1003から入力された微細スペクトル符号化コードとから各帯域の残差スペクトルを復号し、復号された残差スペクトルを加算器1008へ出力する。なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1005へ入力するように構成する。   The fine spectrum decoding unit 1005 calculates the auditory importance of each band using the scaling coefficient input from the scaling coefficient decoding unit 1002, obtains the number of bits assigned to each band, and calculates the scaling coefficient and the fine spectrum. The residual spectrum of each band is decoded from the fine spectrum encoded code input from encoding section 1003, and the decoded residual spectrum is output to adder 1008. In addition, you may make it use the information of a 1st layer decoding spectrum for calculation of auditory importance. In this case, the first layer decoded spectrum is configured to be input to the fine spectrum decoding unit 1005.

加算器1008は、復号された残差スペクトルと第1レイヤ復号スペクトルとを加算して第1の復号スペクトルを生成し、生成された第1の復号スペクトルを拡張帯域符号化部202へ出力する。   Adder 1008 adds the decoded residual spectrum and the first layer decoded spectrum to generate a first decoded spectrum, and outputs the generated first decoded spectrum to extension band coding section 202.

このように本実施の形態によれば、第1レイヤ復号スペクトルの品質を改善した後に、品質改善後のスペクトル、つまり第1のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成することにより、帯域拡張された復号信号の品質を改善することができる。   As described above, according to the present embodiment, after improving the quality of the first layer decoded spectrum, the extended band encoding unit 202 uses the spectrum after the quality improvement, that is, the first spectrum, in the high band part (Nn ≦ By generating a spectrum of k <Nw), it is possible to improve the quality of the band-extended decoded signal.

本実施の形態の第2レイヤ復号化部603の構成を、図11を用いて詳細に行う。図11において図7と同一名称のブロックは、同一の機能を有するため、ここではその詳細な説明を省略する。図11において、第2レイヤ復号化部603は、分離部1101、第1スペクトル復号化部1102、拡張帯域復号化部701、周波数領域変換部702および時間領域変換部703を有する。   The configuration of second layer decoding section 603 of the present embodiment will be described in detail using FIG. In FIG. 11, since the block having the same name as FIG. 7 has the same function, its detailed description is omitted here. In FIG. 11, second layer decoding section 603 has demultiplexing section 1101, first spectrum decoding section 1102, extended band decoding section 701, frequency domain transform section 702 and time domain transform section 703.

分離部1101は、第2レイヤ符号化コードを、第1のスペクトル符号化コード、拡張帯域符号化コード、に分離し、第1のスペクトル符号化コードを第1スペクトル復号化部1102に、拡張帯域符号化コードを拡張帯域復号化部701に、それぞれ出力する。   Separating section 1101 separates the second layer encoded code into a first spectrum encoded code and an extended band encoded code, and sends the first spectrum encoded code to first spectrum decoding section 1102 The encoded code is output to extended band decoding section 701, respectively.

周波数領域変換部702は、第1レイヤ復号化部602から入力された第1レイヤ復号信号を周波数領域のパラメータ(例えばMDCT係数など)に変換し、このパラメータを第1レイヤ復号スペクトルとして第1スペクトル復号化部1102に出力する。   Frequency domain transform section 702 transforms the first layer decoded signal input from first layer decoding section 602 into a frequency domain parameter (for example, MDCT coefficient), and uses this parameter as the first layer decoded spectrum as the first spectrum. The data is output to the decoding unit 1102.

第1スペクトル復号化部1102は、分離部1101から入力された第1のスペクトル符号化コードを復号して得られる第1レイヤの符号化誤差の量子化スペクトルを、周波数領域変換部702から入力された第1レイヤ復号スペクトルに加える。そして、その加算結果を第1の復号スペクトルとして拡張帯域復号化部701へ出力する。   First spectrum decoding section 1102 receives from frequency domain transform section 702 the quantized spectrum of the first layer encoding error obtained by decoding the first spectrum encoded code input from demultiplexing section 1101. Added to the first layer decoded spectrum. Then, the addition result is output to extended band decoding section 701 as the first decoded spectrum.

ここで、第1スペクトル復号化部1102の説明を、図12を用いて詳細に行う。第1スペクトル復号化部1102は、分離部1201、スケーリング係数復号化部1202、
微細スペクトル復号化部1203およびスペクトル復号部1204を有する。
Here, the first spectrum decoding section 1102 will be described in detail with reference to FIG. The first spectrum decoding unit 1102 includes a separation unit 1201, a scaling coefficient decoding unit 1202,
A fine spectrum decoding unit 1203 and a spectrum decoding unit 1204 are provided.

分離部1201は、入力された第1のスペクトル符号化コードから、スケーリング係数を表す符号化コードと、微細スペクトル(スペクトル微細構造)を表す符号化コードと、を分離し、スケーリング係数符号化コードをスケーリング係数復号化部1202に、微細スペクトル符号化コードを微細スペクトル復号化部1203に、それぞれ出力する。   The separation unit 1201 separates an encoded code representing a scaling coefficient and an encoded code representing a fine spectrum (spectral fine structure) from the input first spectrum encoded code, and obtains the scaling coefficient encoded code. The fine spectrum encoded code is output to scaling coefficient decoding section 1202 and fine spectrum decoding section 1203, respectively.

スケーリング係数復号化部1202は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数をスペクトル復号部1204および微細スペクトル復号化部1203に出力する。   The scaling coefficient decoding unit 1202 decodes the scaling coefficient from the input scaling coefficient encoded code, and outputs the decoded scaling coefficient to the spectrum decoding unit 1204 and the fine spectrum decoding unit 1203.

微細スペクトル復号化部1203は、スケーリング係数復号化部1202から入力されたスケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域の微細スペクトルに割り当てられたビット数を求める。また、分離部1201から入力された微細スペクトル符号化コードから各帯域の微細スペクトルを復号し、復号された微細スペクトルをスペクトル復号部1204へ出力する。   The fine spectrum decoding unit 1203 calculates the auditory importance of each band using the scaling coefficient input from the scaling coefficient decoding unit 1202, and obtains the number of bits assigned to the fine spectrum of each band. In addition, the fine spectrum of each band is decoded from the fine spectrum encoded code input from separation section 1201, and the decoded fine spectrum is output to spectrum decoding section 1204.

なお、聴覚的重要度の算出に第1レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第1レイヤ復号スペクトルを微細スペクトル復号化部1203へ入力するように構成する。   In addition, you may make it use the information of a 1st layer decoding spectrum for calculation of auditory importance. In that case, the first layer decoded spectrum is configured to be input to the fine spectrum decoding unit 1203.

スペクトル復号部1204は、周波数領域変換部702から与えられた第1レイヤ復号スペクトルと、スケーリング係数復号化部1202から入力されたスケーリング係数と、微細スペクトル復号化部1203から入力された微細スペクトルと、から第1の復号スペクトルを復号し、この復号スペクトルを拡張帯域復号化部701へ出力する。   Spectrum decoding section 1204, first layer decoded spectrum provided from frequency domain transform section 702, scaling coefficient input from scaling coefficient decoding section 1202, fine spectrum input from the fine spectrum decoding section 1203, The first decoded spectrum is decoded, and this decoded spectrum is output to extended band decoding section 701.

なお、本実施の形態の拡張帯域符号化部202には、スペクトル残差形状符号帳305およびスペクトル残差ゲイン符号帳307を設けなくとも良い。この場合の拡張帯域符号化部202の構成は、図13に示される。また、拡張帯域復号化部701には、スペクトル残差形状符号帳805およびスペクトル残差ゲイン符号帳806を設けなくとも良い。この場合の拡張帯域復号化部701の構成は、図14に示される。なお、図13および図14にそれぞれ示されるフィルタリング部1301、1401の出力信号は、次の式(6)で表される。

Figure 0004977471
The extended band encoding unit 202 of the present embodiment does not have to be provided with the spectrum residual shape codebook 305 and the spectrum residual gain codebook 307. The configuration of extension band encoding section 202 in this case is shown in FIG. In addition, extended band decoding section 701 does not have to provide spectral residual shape codebook 805 and spectral residual gain codebook 806. The configuration of extended band decoding section 701 in this case is shown in FIG. Note that the output signals of the filtering units 1301 and 1401 shown in FIGS. 13 and 14 are expressed by the following equation (6).
Figure 0004977471

本実施の形態では、第1レイヤ復号スペクトルの品質を改善した後に、この品質改善後のスペクトルを使って拡張帯域符号化部202で高域部(Nn≦k<Nw)のスペクトルを生成する。この構成によれば、復号信号の品質を改善することができる。この利点は、スペクトル残差形状符号帳およびスペクトル残差ゲイン符号帳の有無に関わらず享受できる。   In the present embodiment, after the quality of the first layer decoded spectrum is improved, a spectrum of a high frequency band (Nn ≦ k <Nw) is generated by extension band coding section 202 using the spectrum after the quality improvement. According to this configuration, the quality of the decoded signal can be improved. This advantage can be enjoyed regardless of the presence or absence of the spectral residual shape codebook and the spectral residual gain codebook.

なお、第1スペクトル符号化部901では、低域部(0≦k<Nn)のスペクトルの符号化を行う際に、全帯域(0≦k<Nw)の符号化歪が最も小さくなるように低域部(0≦k<Nn)のスペクトルの符号化を行っても良い。この場合、拡張帯域符号化部202では、高域部(Nn≦k<Nw)の符号化まで行われる。また、この場合、第1スペクトル符号化部901において、低域部の符号化結果が高域部の符号化に与える影響も考慮して低域部の符号化を行うことになる。したがって、全帯域のスペクトルが最適になるよう低域部のスペクトルの符号化が為されるようになるため、品質が向上するという効果が得
られる。
In the first spectrum encoding unit 901, when encoding the spectrum of the low band part (0 ≦ k <Nn), the encoding distortion of the entire band (0 ≦ k <Nw) is minimized. You may encode the spectrum of a low-pass part (0 <= k <Nn). In this case, the extension band encoding unit 202 performs the encoding up to the high band part (Nn ≦ k <Nw). In this case, in the first spectrum encoding unit 901, the low band part is encoded in consideration of the influence of the low band part encoding result on the high band part encoding. Accordingly, since the spectrum of the low frequency band is encoded so that the spectrum of the entire band is optimized, the effect of improving the quality can be obtained.

(実施の形態3)
本発明の実施の形態3に係る第2レイヤ符号化部105の構成を図15に示す。図15において図9と同一名称のブロックは同一の機能を有するため、ここではその詳細な説明を省略する。
(Embodiment 3)
The configuration of second layer coding section 105 according to Embodiment 3 of the present invention is shown in FIG. In FIG. 15, blocks having the same names as those in FIG. 9 have the same functions, and thus detailed description thereof is omitted here.

図9との違いは、復号機能を有し且つ拡張帯域符号化コードを求める拡張帯域符号化部1501と、その拡張帯域符号化コードを用いて第2の復号スペクトルを生成し原スペクトルから第2の復号スペクトルを減じて求められる誤差スペクトルを符号化する第2スペクトル符号化部1502と、が設けられた点にある。前述の誤差スペクトルを第2スペクトル符号化部1502にて符号化することでより高品質な復号スペクトルを生成できるようになり、復号化装置で得られる復号信号の品質を向上させることができる。   The difference from FIG. 9 is that an extension band encoding unit 1501 that has a decoding function and obtains an extension band encoded code, generates a second decoded spectrum using the extension band encoded code, and generates a second decoded spectrum from the original spectrum. And a second spectrum encoding unit 1502 for encoding an error spectrum obtained by subtracting the decoded spectrum. By encoding the error spectrum described above with the second spectrum encoding unit 1502, a higher quality decoded spectrum can be generated, and the quality of the decoded signal obtained by the decoding apparatus can be improved.

拡張帯域符号化部1501は、図3に示された拡張帯域符号化部202と同様に拡張帯域符号化コードを生成して出力する。また、拡張帯域符号化部1501は、図8に示される拡張帯域復号化部701と同様の構成を内包し、拡張帯域復号化部701と同様に第2の復号スペクトルを生成する。この第2の復号スペクトルは、第2スペクトル符号化部1502に出力される。すなわち、本実施の形態の第2レイヤ符号化コードは、拡張帯域符号化コード、第1のスペクトル符号化コードおよび第2のスペクトル符号化コードからなる。   The extension band encoding unit 1501 generates and outputs an extension band encoded code in the same manner as the extension band encoding unit 202 shown in FIG. Also, the extended band encoding unit 1501 includes the same configuration as the extended band decoding unit 701 shown in FIG. 8, and generates the second decoded spectrum in the same manner as the extended band decoding unit 701. This second decoded spectrum is output to second spectrum encoding section 1502. That is, the second layer encoded code of the present embodiment includes an extended band encoded code, a first spectrum encoded code, and a second spectrum encoded code.

なお、拡張帯域符号化部1501の構成において、図3および図8で共通の名称を持つブロックは共有化されていても良い。   In the configuration of extended band encoding section 1501, blocks having common names in FIGS. 3 and 8 may be shared.

第2スペクトル符号化部1502は、図16に示すように、スケーリング係数符号化部1601、スケーリング係数復号化部1602、微細スペクトル符号化部1603、多重化部1604、正規化部1605および減算器1606を有する。   As shown in FIG. 16, the second spectrum encoding unit 1502 includes a scaling coefficient encoding unit 1601, a scaling coefficient decoding unit 1602, a fine spectrum encoding unit 1603, a multiplexing unit 1604, a normalization unit 1605, and a subtracter 1606. Have

減算器1606は、原スペクトルから第2の復号スペクトルを減じて残差スペクトルを生成し、残差スペクトルをスケーリング係数符号化部1601および正規化部1605に出力する。スケーリング係数符号化部1601は、残差スペクトルのスペクトル概形を表すスケーリング係数を算出し、当該スケーリング係数を符号化し、スケーリング係数符号化コードを多重化部1604およびスケーリング係数復号化部1602に出力する。   Subtractor 1606 generates a residual spectrum by subtracting the second decoded spectrum from the original spectrum, and outputs the residual spectrum to scaling coefficient encoding section 1601 and normalization section 1605. Scaling coefficient encoding section 1601 calculates a scaling coefficient that represents the spectral outline of the residual spectrum, encodes the scaling coefficient, and outputs the scaling coefficient encoded code to multiplexing section 1604 and scaling coefficient decoding section 1602. .

ここで、聴覚マスキングを用いてスケーリング係数の符号化の効率化を図っても良い。例えば、聴覚マスキングを用いてスケーリング係数の符号化に必要なビット配分を決定し、そのビット配分情報に基づき符号化を行う。このとき、全くビットが配分されない帯域がある場合には、その帯域のスケーリング係数は符号化されないことになる。   Here, the efficiency of encoding the scaling coefficient may be improved by using auditory masking. For example, bit allocation necessary for encoding the scaling coefficient is determined using auditory masking, and encoding is performed based on the bit allocation information. At this time, if there is a band to which no bits are allocated, the scaling coefficient of that band is not encoded.

スケーリング係数復号化部1602は、入力されたスケーリング係数符号化コードからスケーリング係数を復号し、復号されたスケーリング係数を正規化部1605および微細スペクトル符号化部1603に出力する。   The scaling coefficient decoding unit 1602 decodes the scaling coefficient from the input scaling coefficient encoded code, and outputs the decoded scaling coefficient to the normalization unit 1605 and the fine spectrum encoding unit 1603.

正規化部1605は、スケーリング係数復号化部1602より与えられるスケーリング係数を用いて、減算器1606より与えられる残差スペクトルの正規化を行い、正規化後の残差スペクトルを微細スペクトル符号化部1603に出力する。   The normalization unit 1605 normalizes the residual spectrum provided from the subtractor 1606 using the scaling coefficient provided from the scaling coefficient decoding unit 1602, and converts the residual spectrum after normalization into a fine spectrum encoding unit 1603. Output to.

微細スペクトル符号化部1603は、スケーリング係数復号化部1602から入力された復号スケーリング係数を用いて各帯域の聴覚的重要度を算出し、各帯域に割り当てられ
たビット数を求め、このビット数の条件のもとで正規化後の残差スペクトル(微細スペクトル)の符号化を行う。そして、この符号化によって得られた符号化コードを多重化部1604に出力する。
The fine spectrum encoding unit 1603 calculates the aural importance of each band using the decoding scaling coefficient input from the scaling coefficient decoding unit 1602, obtains the number of bits allocated to each band, and calculates the number of bits. The residual spectrum (normal spectrum) after normalization is encoded under the conditions. Then, the encoded code obtained by this encoding is output to multiplexing section 1604.

なお、正規化後の残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。また、聴覚的重要度の算出に第2レイヤ復号スペクトルの情報を用いるようにしても良い。その場合、第2レイヤ復号スペクトルを微細スペクトル符号化部1603へ入力するように構成する。   In addition, when encoding the residual spectrum after normalization, it may be encoded using auditory masking so as to reduce auditory distortion. Moreover, you may make it use the information of a 2nd layer decoding spectrum for calculation of auditory importance. In this case, the second layer decoded spectrum is configured to be input to the fine spectrum encoding unit 1603.

スケーリング係数符号化部1601および微細スペクトル符号化部1603より出力される符号化コードは多重化部1604にて多重化され、第2のスペクトル符号化コードとして出力される。   The encoded codes output from the scaling coefficient encoding unit 1601 and the fine spectrum encoding unit 1603 are multiplexed by the multiplexing unit 1604 and output as the second spectrum encoded code.

図17は、第2スペクトル符号化部1502の構成の変形例を示している。図17において図16と同一名称のブロックは同一機能を有するため、ここではその詳細な説明を省略する。   FIG. 17 illustrates a modification of the configuration of the second spectrum encoding unit 1502. In FIG. 17, since the block having the same name as that of FIG. 16 has the same function, detailed description thereof is omitted here.

この構成では、第2スペクトル符号化部1502は、減算器1606より与えられる残差スペクトルを直接符号化する。つまり、残差スペクトルの正規化は行われない。そのため本構成では、図16に示されたスケーリング係数符号化部1601、スケーリング係数復号化部1602および正規化部1605が設けられていない。この構成によれば、第2スペクトル符号化部1502でスケーリング係数にビットを配分する必要が無くなるため、ビットレートを低減させることができる。   In this configuration, the second spectrum encoding unit 1502 directly encodes the residual spectrum given from the subtracter 1606. That is, normalization of the residual spectrum is not performed. Therefore, in this configuration, the scaling coefficient encoding unit 1601, the scaling coefficient decoding unit 1602, and the normalization unit 1605 shown in FIG. 16 are not provided. According to this configuration, it is not necessary for the second spectrum encoding unit 1502 to allocate bits to the scaling coefficient, so that the bit rate can be reduced.

聴覚重要度およびビット配分算出部1701は、第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度およびビット配分は、微細スペクトル符号化部1603へ出力される。   Auditory importance and bit allocation calculation section 1701 calculates the auditory importance of each band from the second decoded spectrum, and calculates the bit allocation to each band determined according to the auditory importance. The obtained auditory importance and bit allocation are output to the fine spectrum encoding unit 1603.

微細スペクトル符号化部1603は、聴覚重要度およびビット配分算出部1701から入力された聴覚重要度およびビット配分に基づいて、残差スペクトルを符号化する。そして、この符号化によって得られた符号化コードを第2のスペクトル符号化コードとして多重化部104に出力する。なお、残差スペクトルの符号化の際には、聴覚マスキングを用いて聴感的な歪を小さくするように符号化しても良い。   The fine spectrum encoding unit 1603 encodes the residual spectrum based on the auditory importance and bit allocation input from the auditory importance and bit allocation calculating unit 1701. Then, the encoded code obtained by this encoding is output to the multiplexing unit 104 as the second spectrum encoded code. When encoding the residual spectrum, it may be encoded using auditory masking to reduce auditory distortion.

本実施の形態の第2レイヤ復号化部603の構成を図18に示す。第2レイヤ復号化部603は、拡張帯域復号化部701、周波数領域変換部702、時間領域変換部703、分離部1101、第1スペクトル復号化部1102および第2スペクトル復号化部1801を有する。図18において図11と同一名称のブロックは同一の機能を有するので、ここではその詳細な説明を省略する。   The configuration of second layer decoding section 603 in the present embodiment is shown in FIG. Second layer decoding section 603 includes extension band decoding section 701, frequency domain transform section 702, time domain transform section 703, separation section 1101, first spectrum decoding section 1102 and second spectrum decoding section 1801. In FIG. 18, since the block having the same name as that of FIG. 11 has the same function, the detailed description thereof is omitted here.

第2スペクトル復号化部1801は、分離部1101から入力された第2のスペクトル符号化コードを復号して得られる第2の復号スペクトルの符号化誤差を量子化したスペクトルを、拡張帯域復号化部701から入力された第2の復号スペクトルに加える。そして、この加算結果を第3の復号スペクトルとして時間領域変換部703へ出力する。   The second spectrum decoding unit 1801 quantizes the spectrum obtained by quantizing the coding error of the second decoded spectrum obtained by decoding the second spectrum encoded code input from the demultiplexing unit 1101, and the extended band decoding unit It adds to the 2nd decoding spectrum input from 701. FIG. Then, the addition result is output to the time domain conversion unit 703 as a third decoded spectrum.

第2スペクトル復号化部1801は、第2スペクトル符号化部1502が図16に示す構成を採る場合、図12と同様の構成を採る。ただし、図12における第1のスペクトル符号化コード、第1レイヤ復号スペクトルおよび第1の復号スペクトルは、それぞれ、第2のスペクトル符号化コード、第2の復号スペクトルおよび第3の復号スペクトルに置き換わる。   Second spectrum decoding section 1801 adopts the same configuration as that in FIG. 12 when second spectrum encoding section 1502 adopts the configuration shown in FIG. However, the first spectrum encoded code, the first layer decoded spectrum, and the first decoded spectrum in FIG. 12 are replaced with the second spectrum encoded code, the second decoded spectrum, and the third decoded spectrum, respectively.

また、本実施の形態では、第2スペクトル復号化部1801の構成について、第2スペクトル符号化部1502が図16に示す構成を採る場合を例に挙げて説明したが、第2スペクトル符号化部1502が図17に示す構成を採る場合、第2スペクトル復号化部1801の構成は、図19のようになる。   Further, in the present embodiment, the configuration of second spectrum decoding section 1801 has been described by taking the case where second spectrum encoding section 1502 adopts the configuration shown in FIG. 16 as an example, but second spectrum encoding section When 1502 adopts the configuration shown in FIG. 17, the configuration of second spectrum decoding section 1801 is as shown in FIG.

つまり図19は、スケーリング係数を用いない第2スペクトル符号化部1502に対応する第2スペクトル復号化部1801の構成を示している。第2スペクトル復号化部1801は、聴覚重要度およびビット配分算出部1901と微細スペクトル復号化部1902とスペクトル復号部1903とを有する。   That is, FIG. 19 shows the configuration of second spectrum decoding section 1801 corresponding to second spectrum encoding section 1502 that does not use a scaling coefficient. Second spectrum decoding section 1801 has auditory importance and bit allocation calculation section 1901, fine spectrum decoding section 1902, and spectrum decoding section 1903.

図19において、聴覚重要度およびビット配分算出部1901は、拡張帯域復号化部701から入力された第2の復号スペクトルから各帯域の聴覚重要度を求め、聴覚重要度に応じて決定される各帯域へのビット配分を求める。求められた聴覚重要度とビット配分は、微細スペクトル復号化部1902へ出力される。   In FIG. 19, the auditory importance and bit allocation calculating unit 1901 obtains the auditory importance of each band from the second decoded spectrum input from the extended band decoding unit 701, and is determined according to the auditory importance. Obtain the bit allocation to the band. The obtained auditory importance and bit allocation are output to the fine spectrum decoding unit 1902.

微細スペクトル復号化部1902は、聴覚重要度およびビット配分算出部1901から入力された聴覚重要度およびビット配分に基づいて、分離部1101から第2のスペクトル符号化コードとして入力される微細スペクトル符号化コードを復号し、その復号結果(各帯域の微細スペクトル)をスペクトル復号部1903に出力する。   The fine spectrum decoding unit 1902 performs fine spectrum encoding input from the separation unit 1101 as the second spectral encoding code based on the auditory importance and bit allocation input from the auditory importance and bit allocation calculation unit 1901. The code is decoded, and the decoding result (fine spectrum of each band) is output to the spectrum decoding unit 1903.

微細スペクトル復号化部1903は、拡張帯域復号化部701から入力された第2の復号スペクトルに、微細スペクトル復号化部1902から入力された微細スペクトルを加えて、その加算結果を第3の復号スペクトルとして外部へ出力する。   The fine spectrum decoding unit 1903 adds the fine spectrum input from the fine spectrum decoding unit 1902 to the second decoded spectrum input from the extended band decoding unit 701, and adds the addition result to the third decoded spectrum. Output to the outside.

なお、本実施の形態では、第1スペクトル符号化部901および第1スペクトル復号化部1102を含む構成を例に挙げて説明したが、第1スペクトル符号化部901および第1スペクトル復号化部1102が無くても本実施の形態の作用効果を実現することができる。その場合の第2レイヤ符号化部105の構成を図20に、第2レイヤ復号化部603の構成を図21に、それぞれ示す。   In the present embodiment, the configuration including first spectrum encoding section 901 and first spectrum decoding section 1102 has been described as an example. However, first spectrum encoding section 901 and first spectrum decoding section 1102 are described. Even if there is no, the effect of this Embodiment is realizable. In this case, the configuration of second layer encoding section 105 is shown in FIG. 20, and the configuration of second layer decoding section 603 is shown in FIG.

以上、本発明によるスケーラブル復号化装置およびスケーラブル符号化装置の実施の形態について説明した。   The embodiments of the scalable decoding device and the scalable encoding device according to the present invention have been described above.

なお、上記実施の形態においては、変換方式としてMDCTを使って説明したがこれに限定されず、他の変換方式、例えばフーリエ変換やコサイン変換、Wavelet変換などを使用したときにも本発明は適用できる。   In the above-described embodiment, MDCT is used as the conversion method. However, the present invention is not limited to this, and the present invention is also applicable when other conversion methods such as Fourier transform, cosine transform, and Wavelet transform are used. it can.

また、上記実施の形態においては、階層数2を基に説明したがこれに限定されず、2以上の階層を持つスケーラブル符号化/復号化にも適用できる。   In the above-described embodiment, the description has been made based on the number of layers 2. However, the present invention is not limited to this.

また、本発明に係る符号化装置および復号化装置は、上記の実施の形態1〜3に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。   The encoding device and decoding device according to the present invention are not limited to the above-described first to third embodiments, and can be implemented with various modifications. For example, each embodiment can be implemented in combination as appropriate.

本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。   The encoding device and the decoding device according to the present invention can also be mounted on a communication terminal device and a base station device in a mobile communication system, whereby the communication terminal device and the base station having the same operational effects as described above An apparatus can be provided.

また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発
明はソフトウェアで実現することも可能である。
Further, here, a case has been described as an example where the present invention is configured with hardware, but the present invention can also be implemented with software.

なお、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。   Each functional block used in the description of each of the above embodiments is typically realized as an LSI that is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them.

ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。   The name used here is LSI, but it may also be called IC, system LSI, super LSI, or ultra LSI depending on the degree of integration.

また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。   Further, the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. An FPGA (Field Programmable Gate Array) that can be programmed after manufacturing the LSI or a reconfigurable processor that can reconfigure the connection and setting of the circuit cells inside the LSI may be used.

さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。   Further, if integrated circuit technology comes out to replace LSI's as a result of the advancement of semiconductor technology or a derivative other technology, it is naturally also possible to carry out function block integration using this technology. Biotechnology can be applied.

すなわち、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出手段と、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、を有する構成を採る。   That is, the scalable encoding device according to the above embodiment is a scalable encoding device that generates low frequency band encoded information and high frequency band encoded information from an original signal, and includes the low frequency band code. First spectrum calculating means for calculating a first spectrum in a low frequency band from the decoded signal of the digitized information, second spectrum calculating means for calculating a second spectrum from the original signal, the first spectrum and the second spectrum A first parameter calculating means for calculating a first parameter indicating the degree of similarity with the high frequency band, and a second parameter for calculating a second parameter indicating a fluctuation component between the high frequency band of the first spectrum and the second spectrum. Calculating means, and encoding means for encoding the calculated first parameter and second parameter as encoding information of the high frequency band, A configuration that.

また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1パラメータ算出手段は、前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを前記第1パラメータとして出力する構成を採る。   In the scalable encoding device according to the above-described embodiment, in the above configuration, the first parameter calculation unit uses a filter having the first spectrum as an internal state to set a parameter indicating a characteristic of the filter in the first configuration. A configuration for outputting as one parameter is adopted.

また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第2パラメータ算出手段は、スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳を有し、前記スペクトル残差の符号を前記第2パラメータとして出力する構成を採る。   In the scalable encoding device according to the above-described embodiment, the second parameter calculation unit includes a spectrum residual shape codebook in which a plurality of spectrum residual candidates are recorded, and the spectrum residual code has the configuration described above. A configuration is adopted in which the sign of the difference is output as the second parameter.

また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、前記第1パラメータ算出手段および前記第2パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する構成を採る。   The scalable coding apparatus according to the above embodiment further includes residual component encoding means for encoding the residual component between the first spectrum and the low frequency band portion of the second spectrum in the above configuration. The first parameter calculating means and the second parameter calculating means improve the quality of the first spectrum using the residual component encoded by the residual component encoding means, and then A configuration for calculating the parameter and the second parameter is adopted.

また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記残差成分符号化手段は、前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる構成を採る。   In the scalable encoding device according to the above-described embodiment, in the above configuration, the residual component encoding unit includes the quality of the low frequency band portion of the first spectrum and the encoding unit encoded by the encoding unit. A configuration is adopted in which both the quality of the high frequency band portion of the decoded spectrum obtained from the first parameter and the second parameter are improved.

また、上記実施の形態に係るスケーラブル符号化装置は、上記構成において、前記第1
パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する構成を採る。
Further, the scalable coding apparatus according to the above embodiment has the above configuration in the first configuration.
The parameter includes a lag, the second parameter includes a spectrum residual, and further includes configuration means for configuring a bitstream arranged in the order of the lag and the spectrum residual.

また、上記実施の形態に係るスケーラブル符号化装置は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示すパラメータを算出するパラメータ算出手段と、算出されたパラメータを前記高周波帯域の符号化情報として符号化するパラメータ符号化手段と、前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段と、を有し、前記パラメータ算出手段は、前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記パラメータを算出する構成を採る。   The scalable encoding device according to the above embodiment is an encoding device that generates low frequency band encoding information and high frequency band encoding information from an original signal, and the low frequency band encoding A first spectrum calculating means for calculating a first spectrum in a low frequency band from a decoded signal of information; a second spectrum calculating means for calculating a second spectrum from the original signal; and a high frequency of the first spectrum and the second spectrum. Parameter calculating means for calculating a parameter indicating the degree of similarity with the band part, parameter encoding means for encoding the calculated parameter as the encoding information of the high frequency band, low values of the first spectrum and the second spectrum A residual component encoding unit that encodes a residual component with the frequency band unit, and the parameter calculation unit includes the residual component encoding unit. After improving the quality of the first spectrum using the coded residual components Te, a configuration to calculate the parameters.

また、上記実施の形態に係るスケーラブル復号化装置は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得手段と、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得手段と、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号手段と、を有する構成を採る。   Further, the scalable decoding device according to the embodiment includes a spectrum acquisition unit that acquires a first spectrum corresponding to a low frequency band, and a first parameter that is encoded as encoded information of a high frequency band, A first parameter indicating the degree of similarity between the first spectrum and the high-frequency band portion of the second spectrum corresponding to the original signal; and a second parameter encoded as high-frequency band encoding information, Parameter acquisition means for acquiring a second parameter indicating a fluctuation component with respect to the high-frequency band section; and decoding means for decoding the second spectrum using the acquired first parameter and second parameter. Take the configuration.

また、上記実施の形態に係るスケーラブル符号化方法は、原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成するスケーラブル符号化方法であって、前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータを算出する第1パラメータ算出ステップと、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータを算出する第2パラメータ算出ステップと、算出された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有するようにした。
The scalable encoding method according to the above embodiment is a scalable encoding method for generating low frequency band encoded information and high frequency band encoded information from an original signal, and the low frequency band code A first spectrum calculating step for calculating a first spectrum in a low frequency band from the decoded signal of the conversion information, a second spectrum calculating step for calculating a second spectrum from the original signal, and the first spectrum and the second spectrum A first parameter calculating step for calculating a first parameter indicating the degree of similarity with the high frequency band part; and a second parameter for calculating a second parameter indicating a fluctuation component between the high frequency band part of the first spectrum and the second spectrum. A code for encoding the calculation step and the calculated first parameter and second parameter as encoding information of the high frequency band And the step,
It was made to have.

また、上記実施の形態に係るスケーラブル復号化方法は、低周波帯域に対応する第1スペクトルを取得するスペクトル取得ステップと、高周波帯域の符号化情報として符号化された第1パラメータであって、前記第1スペクトルと原信号に対応する第2スペクトルの高周波帯域部との類似具合を示す第1パラメータと、高周波帯域の符号化情報として符号化された第2パラメータであって、前記第1スペクトルと前記高周波帯域部との変動成分を示す第2パラメータと、をそれぞれ取得するパラメータ取得ステップと、取得された第1パラメータおよび第2パラメータを用いて前記第2スペクトルを復号する復号ステップと、を有するようにした。   The scalable decoding method according to the embodiment includes a spectrum acquisition step of acquiring a first spectrum corresponding to a low frequency band, and a first parameter encoded as encoded information of a high frequency band, A first parameter indicating the degree of similarity between the first spectrum and the high-frequency band portion of the second spectrum corresponding to the original signal; and a second parameter encoded as high-frequency band encoding information, A parameter acquisition step for acquiring a second parameter indicating a fluctuation component with respect to the high-frequency band section; and a decoding step for decoding the second spectrum using the acquired first parameter and second parameter. I did it.

特に、本発明による第1のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定し、フィルタ情報を符号化して送るスペクトル符号化装置において、スペクトル残差の候補が複数記録されているスペクトル残差形状符号帳を有し、前記フィルタの入力信号としてスペクトル残差を与えフィルタリングを行い第2スペクトルの高域部を推定するもので、スペクトル残差を用いることにより、第1スペクトルの変形では表せない第2スペクトルの高域部の成分を符号化するこ
とができるようになるため、第2スペクトルの高域部の推定性能が向上し高品質化が為される。
In particular, a first scalable coding apparatus according to the present invention uses a filter having a first spectrum as an internal state to estimate a high-frequency part of a second spectrum, and encodes and sends filter information. It has a spectrum residual shape codebook in which a plurality of spectral residual candidates are recorded, and applies a spectral residual as an input signal of the filter to perform filtering to estimate a high frequency part of the second spectrum. By using the difference, it becomes possible to encode the high-frequency component of the second spectrum that cannot be expressed by the deformation of the first spectrum, so that the estimation performance of the high-frequency part of the second spectrum is improved and high quality is achieved. Is made.

また、本発明による第2のスケーラブル符号化装置は、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化して第1スペクトルの高品質化を図った後に、この第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定するもので、第2スペクトルの低域部に対する第1スペクトルの品質を改善させた後に、品質改善後の第1スペクトルを用いて第2スペクトルの高域部を推定することにより、推定性能が向上し高品質化が為される。   The second scalable encoding device according to the present invention encodes an error component between the low-frequency part of the second spectrum and the first spectrum to improve the quality of the first spectrum, and then the first spectrum. Is used to estimate the high-frequency part of the second spectrum using a filter having an internal state, and after improving the quality of the first spectrum with respect to the low-frequency part of the second spectrum, the first spectrum after quality improvement is used. By estimating the high frequency part of the second spectrum, the estimation performance is improved and the quality is improved.

また、本発明による第3のスケーラブル符号化装置は、第1スペクトルを内部状態として持つフィルタを用いて第2スペクトルの高域部を推定して生成される推定スペクトルと第2スペクトルの高域部の間の誤差成分と、第2スペクトルの低域部と第1スペクトルの間の誤差成分の両誤差成分を小さくするように、第2スペクトルの低域部と第1スペクトルの間の誤差成分を符号化するもので、第1スペクトルと第2スペクトルの低域部の間の誤差成分を符号化する際に、第1スペクトルおよび第2スペクトルの高域部の推定スペクトルの両品質が同時に向上する第1スペクトルの符号化が為されるため、高品質化が実現できる。   The third scalable coding apparatus according to the present invention also includes an estimated spectrum generated by estimating a high frequency part of the second spectrum using a filter having the first spectrum as an internal state, and a high frequency part of the second spectrum. The error component between the low-frequency part of the second spectrum and the first spectrum is reduced so as to reduce both the error component between the low-frequency part of the second spectrum and the error component between the low-frequency part of the second spectrum and the first spectrum. When encoding an error component between the first spectrum and the low-frequency part of the second spectrum, both qualities of the estimated spectrum of the first spectrum and the high-frequency part of the second spectrum are improved at the same time. Since the first spectrum is encoded, high quality can be realized.

また、上記第1〜3のスケーラブル符号化装置においては、符号化装置にて復号化装置に伝送されるビットストリームを生成する際に、当該ビットストリームは少なくとも、スケールファクタ、ダイナミックレンジ調整係数、ラグ、を含み、この順番でビットストリームを構成するようにしてもよい。これにより、ビットストリームの構成は復号信号の品質に与える影響が大きいパラメータほどビットストリームのMSB(Most Significant Bit)の近くに配置されているため、ビットストリームのLSB(Least Significant Bit)から任意のビット位置でビットが削除されても品質劣化が生じ難いという効果が得られる。   In the first to third scalable encoding devices, when the bit stream to be transmitted to the decoding device is generated by the encoding device, the bit stream includes at least a scale factor, a dynamic range adjustment coefficient, a lag. , And the bit stream may be configured in this order. As a result, the bit stream configuration is arranged closer to the MSB (Most Significant Bit) of the bit stream as the parameter having a greater influence on the quality of the decoded signal, and therefore any bit from the LSB (Least Significant Bit) of the bit stream Even if a bit is deleted at a position, an effect that quality degradation hardly occurs is obtained.

本明細書は、2004年11月5日出願の特願2004−322959に基づく。この内容はすべてここに含めておく。   This specification is based on Japanese Patent Application No. 2004-322959 filed on November 5, 2004. All this content is included here.

本発明に係る符号化装置、復号化装置、符号化方法及び復号化方法は、スケーラブル符号化/復号化等に適用できる。   The encoding apparatus, decoding apparatus, encoding method, and decoding method according to the present invention can be applied to scalable encoding / decoding and the like.

本発明の実施の形態1に係る符号化装置の構成を示すブロック図FIG. 1 is a block diagram showing a configuration of an encoding apparatus according to Embodiment 1 of the present invention. 本発明の実施の形態1に係る第2レイヤ符号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer encoding part which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る拡張帯域符号化部の構成を示すブロック図FIG. 3 is a block diagram showing a configuration of an extension band encoding unit according to Embodiment 1 of the present invention. 本発明の実施の形態1に係る拡張帯域符号化部のフィルタリング部で処理される生成スペクトルバッファを示す模式図Schematic diagram showing a generated spectrum buffer processed by the filtering unit of the extension band encoding unit according to Embodiment 1 of the present invention 本発明の実施の形態1に係る符号化装置の多重化部から出力されるビットストリームの内容を示す模式図Schematic diagram showing the contents of the bitstream output from the multiplexing unit of the encoding apparatus according to Embodiment 1 of the present invention. 本発明の実施の形態1に係る復号化装置の構成を示すブロック図The block diagram which shows the structure of the decoding apparatus which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る第2レイヤ復号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer decoding part which concerns on Embodiment 1 of this invention. 本発明の実施の形態1に係る拡張帯域復号化部の構成を示すブロック図FIG. 2 is a block diagram showing a configuration of an extended band decoding unit according to Embodiment 1 of the present invention. 本発明の実施の形態2に係る第2レイヤ符号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer encoding part which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る第1スペクトル符号化部の構成を示すブロック図The block diagram which shows the structure of the 1st spectrum encoding part which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る第2レイヤ復号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer decoding part which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る第1スペクトル復号化部の構成を示すブロック図The block diagram which shows the structure of the 1st spectrum decoding part which concerns on Embodiment 2 of this invention. 本発明の実施の形態2に係る拡張帯域符号化部の構成を示すブロック図FIG. 9 is a block diagram showing a configuration of an extension band encoding unit according to Embodiment 2 of the present invention. 本発明の実施の形態2に係る拡張帯域復号化部の構成を示すブロック図FIG. 9 is a block diagram showing a configuration of an extended band decoding unit according to Embodiment 2 of the present invention. 本発明の実施の形態3に係る第2レイヤ符号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer encoding part which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る第2スペクトル符号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd spectrum encoding part which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る第2スペクトル符号化部の構成の変形例を示すブロック図The block diagram which shows the modification of a structure of the 2nd spectrum encoding part which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る第2レイヤ復号化部の構成を示すブロック図The block diagram which shows the structure of the 2nd layer decoding part which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る第2スペクトル復号化部の構成の変形例を示すブロック図The block diagram which shows the modification of a structure of the 2nd spectrum decoding part which concerns on Embodiment 3 of this invention. 本発明の実施の形態3に係る第2レイヤ符号化部の構成の変形例を示すブロック図Block diagram showing a modification of the configuration of the second layer encoding section according to Embodiment 3 of the present invention 本発明の実施の形態3に係る第2レイヤ復号化部の構成の変形例を示すブロック図Block diagram showing a modification of the configuration of the second layer decoding section according to Embodiment 3 of the present invention

Claims (5)

原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化装置であって、
前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出手段と、
前記原信号から第2スペクトルを算出する第2スペクトル算出手段と、
前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして出力する第1パラメータ算出手段と、
スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして出力する第2パラメータ算出手段と、
前記出力される第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定手段と、
前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化手段と、
を有する符号化装置。
An encoding device for generating low frequency band encoded information and high frequency band encoded information from an original signal,
First spectrum calculating means for calculating a first spectrum of a low frequency band from a decoded signal of the encoded information of the low frequency band;
Second spectrum calculating means for calculating a second spectrum from the original signal;
Using a filter having the first spectrum as an internal state, first outputs a parameter indicating a characteristic of the filter, as a first parameter indicating a similar degree of high-frequency band portion of the second spectrum and the first spectrum Parameter calculation means;
One spectral residual candidate code from a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded indicates a fluctuation component between the high frequency band portion of the first spectrum and the second spectrum. Second parameter calculating means for outputting as a second parameter;
Determining means for simultaneously determining the first parameter and the second parameter for generating an estimated value most similar to the high-frequency band portion of the second spectrum from the output first parameter and second parameter;
Encoding means for encoding the determined first parameter and second parameter as encoding information of the high frequency band;
An encoding device.
前記第1スペクトルと前記第2スペクトルの低周波帯域部との残差成分を符号化する残差成分符号化手段をさらに有し、
前記第1パラメータ算出手段および前記第2パラメータ算出手段は、
前記残差成分符号化手段によって符号化された残差成分を用いて前記第1スペクトルの品質を向上させた後に、前記第1パラメータおよび第2パラメータを算出する、
請求項1記載の符号化装置。
A residual component encoding means for encoding a residual component between the first spectrum and the low frequency band of the second spectrum;
The first parameter calculation means and the second parameter calculation means are:
Calculating the first parameter and the second parameter after improving the quality of the first spectrum using the residual component encoded by the residual component encoding means;
The encoding device according to claim 1.
前記残差成分符号化手段は、
前記第1スペクトルの低周波帯域部の品質と、前記符号化手段によって符号化された第1パラメータと第2パラメータとから得られる復号スペクトルの高周波帯域部の品質と、の両方を向上させる、
請求項記載の符号化装置。
The residual component encoding means includes:
Improving both the quality of the low frequency band portion of the first spectrum and the quality of the high frequency band portion of the decoded spectrum obtained from the first parameter and the second parameter encoded by the encoding means;
The encoding device according to claim 2 .
前記第1パラメータは、ラグを含み、前記第2パラメータは、スペクトル残差を含み、
前記ラグ、前記スペクトル残差の順に配置されたビットストリームを構成する構成手段をさらに有する、
請求項1記載の符号化装置。
The first parameter includes a lag, the second parameter includes a spectral residual;
And further comprising means for configuring a bitstream arranged in the order of the lag and the spectral residuals.
The encoding device according to claim 1.
原信号から、低周波帯域の符号化情報と高周波帯域の符号化情報とを生成する符号化方法であって、
前記低周波帯域の符号化情報の復号信号から低周波帯域の第1スペクトルを算出する第1スペクトル算出ステップと、
前記原信号から第2スペクトルを算出する第2スペクトル算出ステップと、
前記第1スペクトルを内部状態として有するフィルタを用いて、前記フィルタの特性を示すパラメータを、前記第1スペクトルと前記第2スペクトルの高周波帯域部との類似具合を示す第1パラメータとして算出する第1パラメータ算出ステップと、
スペクトル残差の候補を複数記録しているスペクトル残差形状符号帳の中から一つのスペクトル残差の候補の符号を、前記第1スペクトルと前記第2スペクトルの高周波帯域部との変動成分を示す第2パラメータとして算出する第2パラメータ算出ステップと、
前記算出された第1パラメータおよび第2パラメータの中から、前記第2スペクトルの高周波帯域部と最も類似する推定値を生成する前記第1パラメータと前記第2パラメータを同時に決定する決定ステップと、
前記決定された第1パラメータと第2パラメータとを前記高周波帯域の符号化情報として符号化する符号化ステップと、
を有する符号化方法。
An encoding method for generating low frequency band encoded information and high frequency band encoded information from an original signal,
A first spectrum calculating step of calculating a first spectrum of a low frequency band from a decoded signal of the encoded information of the low frequency band;
A second spectrum calculating step of calculating a second spectrum from the original signal;
Using a filter having the first spectrum as an internal state, first to calculate the parameter indicating the characteristic of the filter, as a first parameter indicating a similar degree of high-frequency band portion of the second spectrum and the first spectrum A parameter calculation step;
One spectral residual candidate code from a spectral residual shape codebook in which a plurality of spectral residual candidates are recorded indicates a fluctuation component between the high frequency band portion of the first spectrum and the second spectrum. A second parameter calculating step for calculating as a second parameter;
A determination step of simultaneously determining the first parameter and the second parameter that generate an estimated value that is most similar to the high frequency band portion of the second spectrum from the calculated first parameter and second parameter;
An encoding step of encoding the determined first parameter and second parameter as encoding information of the high frequency band;
An encoding method comprising:
JP2006542421A 2004-11-05 2005-11-02 Encoding apparatus and encoding method Active JP4977471B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006542421A JP4977471B2 (en) 2004-11-05 2005-11-02 Encoding apparatus and encoding method

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004322959 2004-11-05
JP2004322959 2004-11-05
PCT/JP2005/020200 WO2006049204A1 (en) 2004-11-05 2005-11-02 Encoder, decoder, encoding method, and decoding method
JP2006542421A JP4977471B2 (en) 2004-11-05 2005-11-02 Encoding apparatus and encoding method

Publications (2)

Publication Number Publication Date
JPWO2006049204A1 JPWO2006049204A1 (en) 2008-05-29
JP4977471B2 true JP4977471B2 (en) 2012-07-18

Family

ID=36319209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542421A Active JP4977471B2 (en) 2004-11-05 2005-11-02 Encoding apparatus and encoding method

Country Status (9)

Country Link
US (3) US7769584B2 (en)
EP (3) EP2752849B1 (en)
JP (1) JP4977471B2 (en)
KR (1) KR101220621B1 (en)
CN (3) CN101048814B (en)
BR (1) BRPI0517716B1 (en)
ES (1) ES2476992T3 (en)
RU (2) RU2500043C2 (en)
WO (1) WO2006049204A1 (en)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101048814B (en) 2004-11-05 2011-07-27 松下电器产业株式会社 Encoder, decoder, encoding method, and decoding method
BRPI0616624A2 (en) 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd speech coding apparatus and speech coding method
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
US8103516B2 (en) * 2005-11-30 2012-01-24 Panasonic Corporation Subband coding apparatus and method of coding subband
WO2007066771A1 (en) * 2005-12-09 2007-06-14 Matsushita Electric Industrial Co., Ltd. Fixed code book search device and fixed code book search method
JP4876574B2 (en) * 2005-12-26 2012-02-15 ソニー株式会社 Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium
EP1988544B1 (en) * 2006-03-10 2014-12-24 Panasonic Intellectual Property Corporation of America Coding device and coding method
EP1990800B1 (en) * 2006-03-17 2016-11-16 Panasonic Intellectual Property Management Co., Ltd. Scalable encoding device and scalable encoding method
WO2007126015A1 (en) * 2006-04-27 2007-11-08 Panasonic Corporation Audio encoding device, audio decoding device, and their method
US8121850B2 (en) * 2006-05-10 2012-02-21 Panasonic Corporation Encoding apparatus and encoding method
WO2008007700A1 (en) 2006-07-12 2008-01-17 Panasonic Corporation Sound decoding device, sound encoding device, and lost frame compensation method
US8261163B2 (en) * 2006-08-22 2012-09-04 Panasonic Corporation Soft output decoder, iterative decoder, and soft decision value calculating method
JP5121719B2 (en) 2006-11-10 2013-01-16 パナソニック株式会社 Parameter decoding apparatus and parameter decoding method
US20100076755A1 (en) * 2006-11-29 2010-03-25 Panasonic Corporation Decoding apparatus and audio decoding method
WO2008072737A1 (en) * 2006-12-15 2008-06-19 Panasonic Corporation Encoding device, decoding device, and method thereof
FR2911020B1 (en) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim AUDIO CODING METHOD AND DEVICE
FR2911031B1 (en) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim AUDIO CODING METHOD AND DEVICE
JP4871894B2 (en) * 2007-03-02 2012-02-08 パナソニック株式会社 Encoding device, decoding device, encoding method, and decoding method
JP4638895B2 (en) * 2007-05-21 2011-02-23 日本電信電話株式会社 Decoding method, decoder, decoding device, program, and recording medium
JP5098530B2 (en) * 2007-09-12 2012-12-12 富士通株式会社 Decoding device, decoding method, and decoding program
US8548815B2 (en) * 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
JP5413839B2 (en) * 2007-10-31 2014-02-12 パナソニック株式会社 Encoding device and decoding device
CN101527138B (en) * 2008-03-05 2011-12-28 华为技术有限公司 Coding method and decoding method for ultra wide band expansion, coder and decoder as well as system for ultra wide band expansion
CN101971253B (en) * 2008-03-14 2012-07-18 松下电器产业株式会社 Encoding device, decoding device, and method thereof
CA2721702C (en) * 2008-05-09 2016-09-27 Nokia Corporation Apparatus and methods for audio encoding reproduction
CN101609684B (en) * 2008-06-19 2012-06-06 展讯通信(上海)有限公司 Post-processing filter for decoding voice signal
CN101620854B (en) * 2008-06-30 2012-04-04 华为技术有限公司 Method, system and device for band extension
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd Voice band extension device and voice band extension method
CN101436407B (en) * 2008-12-22 2011-08-24 西安电子科技大学 Method for encoding and decoding audio
ES2966639T3 (en) * 2009-01-16 2024-04-23 Dolby Int Ab Enhanced harmonic transposition of cross product
JP5511785B2 (en) * 2009-02-26 2014-06-04 パナソニック株式会社 Encoding device, decoding device and methods thereof
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (en) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Apparatus, method and media with programme code for generating representation of bandwidth-extended signal on basis of input signal representation using combination of harmonic bandwidth-extension and non-harmonic bandwidth-extension
CO6440537A2 (en) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung APPARATUS AND METHOD TO GENERATE A SYNTHESIS AUDIO SIGNAL AND TO CODIFY AN AUDIO SIGNAL
TWI591625B (en) * 2009-05-27 2017-07-11 杜比國際公司 Systems and methods for generating a high frequency component of a signal from a low frequency component of the signal, a set-top box, a computer program product and storage medium thereof
JP5754899B2 (en) 2009-10-07 2015-07-29 ソニー株式会社 Decoding apparatus and method, and program
JP5678071B2 (en) * 2009-10-08 2015-02-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Multimode audio signal decoder, multimode audio signal encoder, method and computer program using linear predictive coding based noise shaping
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
RU2605677C2 (en) 2009-10-20 2016-12-27 Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Audio encoder, audio decoder, method of encoding audio information, method of decoding audio information and computer program using iterative reduction of size of interval
WO2011058758A1 (en) * 2009-11-13 2011-05-19 パナソニック株式会社 Encoder apparatus, decoder apparatus and methods of these
CN102081927B (en) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 Layering audio coding and decoding method and system
MY153845A (en) 2010-01-12 2015-03-31 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
CA3107943C (en) 2010-01-19 2022-09-06 Dolby International Ab Improved subband block based harmonic transposition
CN102918590B (en) * 2010-03-31 2014-12-10 韩国电子通信研究院 Encoding method and device, and decoding method and device
JP5652658B2 (en) 2010-04-13 2015-01-14 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
JP5850216B2 (en) 2010-04-13 2016-02-03 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
JP5609737B2 (en) 2010-04-13 2014-10-22 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
RU2445719C2 (en) * 2010-04-21 2012-03-20 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Method of enhancing synthesised speech perception when performing analysis through synthesis in linear predictive vocoders
JP2011253045A (en) * 2010-06-02 2011-12-15 Sony Corp Encoding apparatus and encoding method, decoding apparatus and decoding method, and program
EP4398244A3 (en) * 2010-07-08 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder using forward aliasing cancellation
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5707842B2 (en) 2010-10-15 2015-04-30 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
US9230551B2 (en) 2010-10-18 2016-01-05 Nokia Technologies Oy Audio encoder or decoder apparatus
JP5704397B2 (en) * 2011-03-31 2015-04-22 ソニー株式会社 Encoding apparatus and method, and program
JP5942358B2 (en) 2011-08-24 2016-06-29 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
US9384749B2 (en) * 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
CN103035248B (en) 2011-10-08 2015-01-21 华为技术有限公司 Encoding method and device for audio signals
WO2013061530A1 (en) * 2011-10-28 2013-05-02 パナソニック株式会社 Encoding apparatus and encoding method
WO2014118157A1 (en) * 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal
ES2836194T3 (en) * 2013-06-11 2021-06-24 Fraunhofer Ges Forschung Device and procedure for bandwidth extension for acoustic signals
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
EP3614381A1 (en) * 2013-09-16 2020-02-26 Samsung Electronics Co., Ltd. Signal encoding method and device and signal decoding method and device
CN105531762B (en) 2013-09-19 2019-10-01 索尼公司 Code device and method, decoding apparatus and method and program
KR102251833B1 (en) 2013-12-16 2021-05-13 삼성전자주식회사 Method and apparatus for encoding/decoding audio signal
SG11201605015XA (en) 2013-12-27 2016-08-30 Sony Corp Decoding device, method, and program
US10395663B2 (en) 2014-02-17 2019-08-27 Samsung Electronics Co., Ltd. Signal encoding method and apparatus, and signal decoding method and apparatus
CN110176241B (en) * 2014-02-17 2023-10-31 三星电子株式会社 Signal encoding method and apparatus, and signal decoding method and apparatus
RU2662693C2 (en) * 2014-02-28 2018-07-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Decoding device, encoding device, decoding method and encoding method
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9911179B2 (en) * 2014-07-18 2018-03-06 Dolby Laboratories Licensing Corporation Image decontouring in high dynamic range video processing
EP3176780A4 (en) 2014-07-28 2018-01-17 Samsung Electronics Co., Ltd. Signal encoding method and apparatus and signal decoding method and apparatus
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10609372B2 (en) * 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
CN113808596A (en) * 2020-05-30 2021-12-17 华为技术有限公司 Audio coding method and audio coding device

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (en) * 1992-10-05 1998-07-23 日本電信電話株式会社 Wideband audio signal restoration method
JP2964879B2 (en) * 1994-08-22 1999-10-18 日本電気株式会社 Post filter
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2956548B2 (en) * 1995-10-05 1999-10-04 松下電器産業株式会社 Voice band expansion device
JP3707116B2 (en) * 1995-10-26 2005-10-19 ソニー株式会社 Speech decoding method and apparatus
JP3707153B2 (en) * 1996-09-24 2005-10-19 ソニー株式会社 Vector quantization method, speech coding method and apparatus
JPH10233692A (en) * 1997-01-16 1998-09-02 Sony Corp Audio signal coder, coding method, audio signal decoder and decoding method
SE512719C2 (en) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd A method and apparatus for reducing data flow based on harmonic bandwidth expansion
JP3765171B2 (en) * 1997-10-07 2006-04-12 ヤマハ株式会社 Speech encoding / decoding system
FI109393B (en) * 2000-07-14 2002-07-15 Nokia Corp Method for encoding media stream, a scalable and a terminal
EP1440432B1 (en) * 2001-11-02 2005-05-04 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
JP3926726B2 (en) * 2001-11-14 2007-06-06 松下電器産業株式会社 Encoding device and decoding device
WO2003042979A2 (en) * 2001-11-14 2003-05-22 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
DE60323331D1 (en) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd METHOD AND DEVICE FOR AUDIO ENCODING AND DECODING
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP2003323199A (en) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd Device and method for encoding, device and method for decoding
JP3881946B2 (en) * 2002-09-12 2007-02-14 松下電器産業株式会社 Acoustic encoding apparatus and acoustic encoding method
FR2852172A1 (en) * 2003-03-04 2004-09-10 France Telecom Audio signal coding method, involves coding one part of audio signal frequency spectrum with core coder and another part with extension coder, where part of spectrum is coded with both core coder and extension coder
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
JP4679049B2 (en) * 2003-09-30 2011-04-27 パナソニック株式会社 Scalable decoding device
US7848921B2 (en) * 2004-08-31 2010-12-07 Panasonic Corporation Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
ATE480851T1 (en) * 2004-10-28 2010-09-15 Panasonic Corp SCALABLE ENCODING APPARATUS, SCALABLE DECODING APPARATUS AND METHOD THEREOF
JP4977472B2 (en) * 2004-11-05 2012-07-18 パナソニック株式会社 Scalable decoding device
CN101048814B (en) * 2004-11-05 2011-07-27 松下电器产业株式会社 Encoder, decoder, encoding method, and decoding method

Also Published As

Publication number Publication date
EP1798724A1 (en) 2007-06-20
EP2752849B1 (en) 2020-06-03
RU2387024C2 (en) 2010-04-20
CN102201242A (en) 2011-09-28
US8204745B2 (en) 2012-06-19
RU2500043C2 (en) 2013-11-27
WO2006049204A1 (en) 2006-05-11
US7769584B2 (en) 2010-08-03
US20100256980A1 (en) 2010-10-07
EP2752843A1 (en) 2014-07-09
US20080052066A1 (en) 2008-02-28
CN102184734B (en) 2013-04-03
BRPI0517716A (en) 2008-10-21
BRPI0517716B1 (en) 2019-03-12
CN102184734A (en) 2011-09-14
CN101048814B (en) 2011-07-27
EP1798724B1 (en) 2014-06-18
RU2009147514A (en) 2011-06-27
JPWO2006049204A1 (en) 2008-05-29
KR101220621B1 (en) 2013-01-18
EP1798724A4 (en) 2008-09-24
RU2007116941A (en) 2008-11-20
KR20070083997A (en) 2007-08-24
US20110264457A1 (en) 2011-10-27
US8135583B2 (en) 2012-03-13
CN101048814A (en) 2007-10-03
ES2476992T3 (en) 2014-07-15
CN102201242B (en) 2013-02-27
EP2752849A1 (en) 2014-07-09

Similar Documents

Publication Publication Date Title
JP4977471B2 (en) Encoding apparatus and encoding method
JP4977472B2 (en) Scalable decoding device
JP4871894B2 (en) Encoding device, decoding device, encoding method, and decoding method
JP5013863B2 (en) Encoding apparatus, decoding apparatus, communication terminal apparatus, base station apparatus, encoding method, and decoding method
JP4954069B2 (en) Post filter, decoding device, and post filter processing method
JP5089394B2 (en) Speech coding apparatus and speech coding method
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
JPWO2008072737A1 (en) Encoding device, decoding device and methods thereof
JP4859670B2 (en) Speech coding apparatus and speech coding method
JP5236040B2 (en) Encoding device, decoding device, encoding method, and decoding method
JP5036317B2 (en) Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
JP4606418B2 (en) Scalable encoding device, scalable decoding device, and scalable encoding method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120416

R150 Certificate of patent or registration of utility model

Ref document number: 4977471

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3