[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2013129439A1 - 符号化装置、この方法、プログラム及び記録媒体 - Google Patents

符号化装置、この方法、プログラム及び記録媒体 Download PDF

Info

Publication number
WO2013129439A1
WO2013129439A1 PCT/JP2013/055048 JP2013055048W WO2013129439A1 WO 2013129439 A1 WO2013129439 A1 WO 2013129439A1 JP 2013055048 W JP2013055048 W JP 2013055048W WO 2013129439 A1 WO2013129439 A1 WO 2013129439A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
index
code
bits
sample
Prior art date
Application number
PCT/JP2013/055048
Other languages
English (en)
French (fr)
Inventor
守谷 健弘
優 鎌本
登 原田
弘和 亀岡
茂樹 嵯峨山
崇良 大嶋
小野 順貴
大輔 齋藤
Original Assignee
日本電信電話株式会社
国立大学法人東京大学
大学共同利用機関法人情報・システム研究機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社, 国立大学法人東京大学, 大学共同利用機関法人情報・システム研究機構 filed Critical 日本電信電話株式会社
Priority to JP2014502273A priority Critical patent/JP5789816B2/ja
Publication of WO2013129439A1 publication Critical patent/WO2013129439A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Definitions

  • Patent Document 1 discloses a technique for performing fixed-length or variable-length encoding and decoding in consideration of the continuity and frequency of gain values of periodic components.
  • the variable-length coding and decoding described in Patent Document 1 is intended to reduce the average code amount, and both the distortion and the code length of the index are taken into account when performing variable-length coding. Was not.
  • the problem of the present invention is that when the gain obtained by an encoding method such as CELP is encoded with reference to a codebook, it is more efficient considering both the length (information amount) and distortion of the code. It is to provide a good encoding device, this method, a program and a recording medium.
  • variable-length code that assigns a short code to a frequently occurring index in advance, and when selecting an index, the length of the index code is approximately converted to distortion.
  • An index with the most favorable balance between distortion and code length can be selected.
  • the functional block diagram of the example of an encoding apparatus The functional block diagram of the example of a decoding apparatus.
  • the encoding device 11 of the first embodiment includes a linear prediction analysis unit 111, an adaptive codebook 112, a fixed codebook 113, and a pitch analysis unit 114 (corresponding to an “adaptive codebook search unit”). , Search section 115 (corresponding to “fixed codebook search section”), perceptual weighting filter 116, synthesis filter 117, gain quantization section 118, and parameter encoding section 119.
  • the decoding device 12 includes an adaptive codebook 122, a fixed codebook 123, a fixed codebook selection unit 125, a synthesis filter 127, and a parameter decoding unit 129.
  • the encoding device 11 and the decoding device 12 are, for example, a program in a known computer or a dedicated computer having a CPU (central processing unit), a RAM (random-access memory), a ROM (read-only memory), etc. It is a special device constructed by reading data. Further, at least a part of the processing units of the encoding device 11 and the decoding device 12 may be configured by hardware such as an integrated circuit.
  • the input acoustic signals x (n) (n 0,..., L ⁇ 1, L), which are digitized and time-series signals divided in units of frames that are predetermined time intervals, An integer greater than or equal to 2 and each n is called a “sample point”).
  • the fixed codebook 113 includes a plurality of pulse sequences (“sample”) composed of one or more signals having a value composed of a combination of a non-zero unit pulse and its polarity and one or more signals having a zero value. Information for identifying the column) is stored. Fixed codebook 113 outputs a pulse sequence corresponding to input acoustic signal x (n) for each subframe into which one frame is divided under the control of search section 115.
  • an example is shown in which one frame is equally divided into four subframes. That is, a frame composed of L sample points 0,..., L ⁇ 1 is a first subframe (first frame ) composed of sample points L f (0) ,..., L f (1) ⁇ 1.
  • Pulse sequences c f1 , c f2 , c f3 , and c f4 corresponding to the first to fourth subframes are expressed as follows.
  • c f1 (c f1 (L f (0) ), ..., c f1 (L f (1) -1))
  • c f2 (c f2 (L f (1) ), ..., c f2 (L f (2) -1))
  • c f3 (c f3 (L f (2) ), ..., c f3 (L f (3) -1))
  • c f4 (c f4 (L f (3) ), ..., c f4 (L f (4) -1))
  • the pitch period is obtained by decoding the pitch code. Therefore, it is not essential for the pitch analysis unit 114 to output the pitch period.
  • the pitch period is not only expressed as an integer multiple of the sample point interval (integer precision), but is also expressed using an integer multiple of the sample point interval and a decimal value (fractional value) (decimal precision) There is also.
  • pitch analyzer 114 may obtain and output pitch gains g p1 , g p2 , g p3 , and g p4 for each subframe for use in search unit 115.
  • the adaptive codebook 112 stores excitation signals generated at each past time point.
  • the adaptive signal component v (n) is expressed using a pitch cycle with decimal precision, an interpolation filter that performs a weighted average operation on a plurality of excitation signals delayed according to the pitch cycle is used.
  • a code corresponding to a set of quantized pitch gain g p1 ⁇ and quantized fixed codebook gain g c1 ⁇ , and a set of quantized pitch gain g p2 ⁇ and quantized fixed codebook gain g c2 ⁇ A set corresponding to a set of code, quantized pitch gain g p3 ⁇ and quantized fixed codebook gain g c3 ⁇ , a set of quantized pitch gain g p4 ⁇ and quantized fixed codebook gain g c4 ⁇
  • the codes corresponding to are expressed as “gain codes GA f1 , GA f2 , GA f3 , GA f4 ”.
  • D g D 0 2 (-2g / N) ... (1)
  • D 0 distortion when the number of bits of the code per sample is 0.
  • the index value D U is not limited to the above, and a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits b of the index increases is used as the index value D U.
  • code value D U is the minimum need be searched.
  • Gain quantization section 118 performs variable length coding (for example, Huffman coding) on a set of quantized pitch gain candidates and quantized fixed codebook gain candidates to obtain an index that is a gain code.
  • a quantized fixed codebook gain candidate obtained from a function value of a quantized fixed codebook gain candidate May be ⁇ .
  • the number of samples included in the sample sequence Z, the number of samples included in the sample sequence Y, and the number of samples included in the combined signal sample sequence ⁇ Y + ⁇ Z are all N.
  • the synthesis filter 117 converts a sample ⁇ (n) at a certain sample point n into samples ⁇ (n) of P sample points n ⁇ 1, n ⁇ 2,..., NP past the sample point n.
  • the samples included in the sample string A are ⁇ (n ⁇ 1), ⁇ (n ⁇ 2),. P) is at least a part, and ⁇ (n) is a sample at the sample point n of the sample sequence C.
  • ⁇ (n ⁇ 1), ⁇ (n ⁇ 2),..., ⁇ (n ⁇ P) corresponds to a sample point in the past from the sample sequence A, for example, ⁇ (n ⁇ 1)
  • At least part of ⁇ (n ⁇ 2),..., ⁇ (n ⁇ P) is a sample included in a sample sequence before the sample sequence A.
  • gain quantization section 118 does not calculate the bit number b from the index. It can calculate the value D U. However, even without the number of bits b is stored in the gain codebook, the gain quantization unit 118 may calculate the index value D U by calculating the number of bits from the index. Therefore, it is not essential to store the bit number b of each index in the gain codebook.
  • variable length coding using the gain codebook illustrated in Table 1 and the index having the number of bits b is a gain code
  • the remainder is obtained by changing the uniform length coding to variable length coding (B ⁇ b)
  • the input sound signal can be further encoded using bits and distortion can be reduced.
  • Equation (11) can be changed from the uniform length code as a reference for selecting the gain codebook.
  • the long code has a smaller number of bits and is evaluated in terms of distortion.
  • the term (2log2) B / N in equation (11) is very small compared to 1. Therefore, there is no big difference between the index value D U approximate to the formula (10) and (11).
  • the index value D U of formula (14) can be adjusted magnitude of the number of bits of the gain code of each sub-frame.
  • w in the current time interval is set in advance.
  • the current time interval w is set to a predetermined value w This is possible by setting a value larger than zero .
  • linear prediction information LPC info pitch period codes CT 1 , CT 2 , CT 3 , CT 4 , code indexes C f1 , C f2 , C f3 , C f4 , and gain codes GA f1 , GA f2 , GA f3 , GA
  • the “excitation parameter” including f4 is input to the parameter encoding unit 119.
  • the parameter encoding unit 119 generates and outputs a bit stream BS (code) that is a code corresponding to the excitation parameter.
  • the fixed codebook 123 decodes the input code indexes C f1 , C f2 , C f3 , and C f4 based on the control of the fixed codebook selection unit 125, and the pulse sequences c f1 , c f2 , c f3 and c f4 are obtained and output.
  • the present invention can be applied to any coding that is obtained by multiplying a gain sample (hereinafter referred to as “quantized gain”) and a waveform sample sequence obtained by multiplying an input signal and obtaining a variable-length gain code of the input signal.
  • the input signal is, for example, a time series signal. Examples of input signals are acoustic signals, video signals, biological signals, seismic wave signals, sensor array signals, and the like.
  • the input signal may be a time domain signal or a frequency domain signal. That is, the encoding device includes a gain codebook in which a plurality of sets of quantized gain candidates or function values thereof and indexes are stored, and the plurality of indexes include those having different numbers of bits. cage, each time or frequency intervals may be obtained an index index value D U is the smallest as a gain code.
  • the waveform information code is a code that can specify a sample string by decoding the waveform information code.
  • the index value DU is a value that increases as the distortion D increases, and increases as the number of bits of an index corresponding to a quantized gain candidate for obtaining a waveform sample sequence increases.
  • the distortion D is a distortion between the waveform sample sequence obtained by multiplying the sample sequence corresponding to the waveform information code by the quantized gain candidates and the input signal, or the first to ⁇ ⁇ ( ⁇ Is obtained by multiplying each sample of the sample sequence corresponding to ⁇ th ( ⁇ is an integer not less than 1 and not more than ⁇ ) waveform information codes by the ⁇ th quantized gain candidates.
  • This is a distortion of the total waveform sample sequence obtained by adding the ⁇ th waveform sample sequence ( ⁇ waveform sample sequences) for each corresponding sample and the input signal.
  • the sample sequence corresponding to the waveform information code is obtained by, for example, passing the sample sequence itself obtained by decoding the waveform information code or the sample sequence obtained by decoding the waveform information code through the synthesis filter. It is.
  • the index value DU is a value obtained by adding or multiplying the distortion D and a coefficient that increases as the number of bits of the index increases.
  • An example of a coefficient that increases as the number of bits of the index increases is a power value having an exponent with a value that increases as the number of bits of the index increases.
  • Specific examples of the index value D U is like the above-mentioned formula (4) (5) (7) (10) (11).
  • the encoding apparatus 21 illustrated in FIG. 3 includes ⁇ waveform information codebooks 211-1,..., 211- ⁇ and an encoding unit 212.
  • is an integer of 1 or more
  • the encoding unit 212 includes a gain quantization unit 218.
  • sample string Y ⁇ corresponding to the waveform information code E ⁇ is a sample obtained by passing the sample string from the waveform information code book 211- ⁇ for the waveform information code E ⁇ through the synthesis filter corresponding to the input signal X. column and the sample sequence from the waveform information codebook 211-theta for waveform information code E theta and the like.
  • the quantized gain candidate ⁇ 1 in the gain quantizing unit 218 is the quantized fixed codebook gain candidate ⁇ in the gain quantizing unit 118
  • the quantized gain candidate in the gain quantizing unit 218 ⁇ 2 is a quantized pitch gain candidate ⁇ in the gain quantization unit 118
  • the waveform information code E 1 is the code index of the first embodiment
  • the waveform information code E 2 is the pitch code of the first embodiment.
  • the input signal X is the input acoustic signal of the first embodiment.
  • the decoding apparatus uses the waveform information codes E 1 ,..., E ⁇ and the gain code included in the input bit stream, and gains gain for each sample of the sample sequence Y ⁇ corresponding to the waveform information code E ⁇ for each time interval.
  • the sample sequence ⁇ 1 Y 1 +... + ⁇ ⁇ Y ⁇ is output for the sample sequence ⁇ ⁇ Y ⁇ obtained by multiplying the quantized gain candidate ⁇ ⁇ represented by the code.
  • index index value D U is the smallest as a gain code.
  • index index value D U is the smallest as a gain code
  • each plurality of sub-frame or frame to obtain an index index value D U is the smallest as a gain code Also good.
  • the program describing the processing contents can be recorded on a computer-readable recording medium.
  • a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.
  • This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 利得量子化部には、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納された利得符号帳が記憶されている。複数個のインデックスにはビット数が異なるものが含まれている。符号の選択にあたっては、利得の量子化によって生ずる波形歪みそのものと、対応する符号の長さから換算された歪みとの双方を考慮する。すなわち、符号を選択するために、この符号を使うことで生じる波形の歪みだけでなくこの符号に割り当てられた符号長を考慮する。

Description

符号化装置、この方法、プログラム及び記録媒体
 この発明は、音声、音楽等の音信号を符号化または復号する技術に関する。特に、CELP等の符号化技術で符号化された周期性成分の利得およびパルス性成分の利得を符号化または復号する技術に関する。
 従来は、CELP(Code Excited Linear Prediction)の符号化および復号において用いられる周期性成分の利得およびパルス性成分の利得は、符号誤りに対する耐性を強くするために固定長ビットが割り当てられて符号化および復号されていた(例えば、非特許文献1参照)。パルス性成分の利得については、利得そのものではなく過去のサブフレームからの予測値に対する比を符号化の対象とすることにより、利得の値の時間的な連続性を考慮して符号量の削減を行っていた。
 また、特許文献1では、周期性成分の利得から周期性成分の利得の値の時間的な連続性の有無を判定し、時間的な連続性があると予測された場合には周期性成分の利得の値の差分を可変長符号化することにより符号量の削減を行っていた。
WO2006/075605国際公開公報
3rd Generation Partnership Project(3GPP), Technical Specification (TS) 26.090, "AMR speech codec; Transcoding functions", Version 4.0.0 (2001-03)
 非特許文献1に記載された符号化方法および復号方法では、周期性成分の利得およびパルス性成分の利得については、固定長での符号化および復号が行われていた。
 しかしながら、非特許文献1に記載された符号化方法では、周期性成分の利得およびパルス性成分の利得の頻度に関する冗長性や周期性成分の利得の連続性について考慮することなく符号化および復号されており、符号化および復号の効率が良くないという問題があった。
 特許文献1には、周期性成分の利得の値の連続性や頻度を考慮して固定長または可変長の符号化および復号を行う技術が開示されている。
 しかしながら、特許文献1に記載された可変長符号化および復号は、平均符号量を少なくすることを目的としたものであり、可変長符号化の際には歪みとインデックスの符号長の双方は考慮されていなかった。
 この発明の課題は、CELPなどの符号化方式で得られた利得を、符号帳を参照して符号化する際に、符号の長さ(情報量)と歪みの双方を考慮した、より効率が良い符号化装置、この方法、プログラムおよび記録媒体を提供することである。
 符号化においては、利得に対応する符号帳の中から、最も好ましいインデックスを選択するが、この際にこの符号を使うことで生じる波形の歪みだけでなくこの符号に割り当てられた符号長を考慮する。
 利得のベクトル量子化のために、予め出現頻度の高いインデックスに短い符号を割り当てるような可変長符号を使い、インデックスを選択する際に、インデックスの符号の長さを歪みに近似的に換算して歪み尺度を変形し、その変形した歪み尺度を利用する。歪みと符号の長さで最も好ましいバランスのインデックスを選択できる。これにより、従来技術よりも小さな平均ビットレートでありながら、平均の波形歪みについては従来技術とほぼ同じにすることができる。また、節約できた平均のビット数を例えばパルス成分符号化に充当することで、従来の符号化方法に比べ、同じ平均ビットレートでありながら、波形歪みを小さくできる。
符号化装置の例の機能ブロック図。 復号装置の例の機能ブロック図。 符号化装置の例の機能ブロック図。
 以下、この発明の一実施形態について、詳細に説明する。
 [第一実施形態]
 <構成>
 図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、ピッチ分析部114(「適応符号帳探索部」に相当)、探索部115(「固定符号帳探索部」に相当)、聴覚重み付けフィルタ116、合成フィルタ117、利得量子化部118、およびパラメータ符号化部119を有する。
 図2に例示するように、第一実施形態の復号装置12は、適応符号帳122、固定符号帳123、固定符号帳選択部125、合成フィルタ127、およびパラメータ復号部129を有する。
 本形態の符号化装置11および復号装置12は、例えば、CPU(central processing unit)、RAM(random-access memory)、ROM(read-only memory)等を備えた公知のコンピュータまたは専用のコンピュータにプログラムやデータが読み込まれることで構成された特別な装置である。また、符号化装置11および復号装置12の処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。
 <符号化>
 符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L-1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。符号化装置11は、入力音響信号x(n)(n=0,...,L-1)を以下のようにフレームごとに符号化する。
 線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L-1での入力音響信号x(n)(n=0,...,L-1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L-1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。
 固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。固定符号帳113は、探索部115の制御に従い、1フレームを区分したサブフレームごとに、入力音響信号x(n)に対応するパルス系列を出力する。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L-1からなるフレームは、サンプル点Lf(0),...,Lf(1)-1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点Lf(1),...,Lf(2)-1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点Lf(2),...,Lf(3)-1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点Lf(3),...,Lf(4)-1からなる4番目のサブフレーム(第4サブフレーム)に区分される。Lf(0),Lf(1),Lf(2),Lf(3),Lf(4)は、Lf(0)=0,Lf(4)=L,Lf(0)<Lf(1)<Lf(2)<Lf(3)<Lf(4)を満たす正整数である。第1-4サブフレームに対応するパルス系列cf1,cf2,cf3,cf4はそれぞれ以下のように表現される。
  cf1=(cf1(Lf(0)),...,cf1(Lf(1)-1))
  cf2=(cf2(Lf(1)),...,cf2(Lf(2)-1))
  cf3=(cf3(Lf(2)),...,cf3(Lf(3)-1))
  cf4=(cf4(Lf(3)),...,cf4(Lf(4)-1))
 ピッチ分析部114は、サブフレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応するピッチ周期T,T,T,Tを得て、当該ピッチ周期T,T,T,Tと、当該ピッチ周期T,T,T,Tを特定するピッチ符号(周期性成分符号)CT,CT,CT,CTと、を出力する。各サブフレームのピッチ符号CT,CT,CT,CTはそれぞれ均一長であってもよいし、可変長であってもよい。CT,CT,CT,CTそれぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られる。そのため、ピッチ分析部114がピッチ周期を出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部114は、探索部115で用いるために、サブフレームごとに、ピッチ利得gp1,gp2,gp3,gp4を求めて出力してもよい。
 入力音響信号x(n)(n=0,...,L-1)に対応するピッチ周期T,T,T,T、当該ピッチ周期T,T,T,Tを特定するピッチ符号CT,CT,CT,CTの探索は、例えば、サブフレームごとに、適応符号帳112に記憶されている過去の各時点で生成された励振信号をピッチ周期の候補で遅延させて得られる信号に線形予測情報LPC infoによって特定される全極型の合成フィルタ117を適用して得られる合成信号と、入力された入力音響信号との差分に、聴覚重み付けフィルタ116を適用した値が最小となるように行われる。
 ピッチ利得gp1,gp2,gp3,gp4は、例えば、サブフレームごとに、探索された当該ピッチ周期T,T,T,Tに対応する合成信号と入力された入力音響信号との相互相関値を合成信号の自己相関値で除算した値として求められる。
 適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1-4サブフレームの各サブフレームで得られるピッチ周期T,T,T,Tに応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L-1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
 探索部115は、サブフレームごとに、入力音響信号x(n)(n=0,...,L-1)に対応するパルス系列cf1,cf2,cf3,cf4と、当該パルス系列cf1,cf2,cf3,cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4(入力音響信号x(n)(n=0,...,L-1)に対応するパルス系列cf1,cf2,cf3,cf4を特定するコードインデックス)と、を得て出力する。なお、パルス系列はコードインデックスを復号することにより得られるので、探索部115がパルス系列を出力することは必須ではない。
 利得量子化部118には、入力音響信号x(n)(n=0,...,L-1)および合成信号x’(n)(n=0,...,L-1)が入力される。合成信号x’(n)(n=0,...,L-1)からなるサンプル列は、コードインデックスに対応するパルス系列を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化された固定符号帳利得の候補を乗算して得られるサンプル列と、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列のそれぞれのサンプルに、量子化されたピッチ利得の候補を乗算して得られるサンプル列と、を対応するサンプル毎に加算して得られる。利得量子化部118は、これらを用いてベクトル量子化を行い、すなわちサブフレームごとに、入力音響信号と合成信号の歪が最も小さくなるように、量子化されたピッチ利得またはその関数値と量子化された固定符号帳利得またはその関数値との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得gp1^と量子化済固定符号帳利得gc1^の組に対応する符号、量子化済ピッチ利得gp2^と量子化済固定符号帳利得gc2^の組に対応する符号、量子化済ピッチ利得gp3^と量子化済固定符号帳利得gc3^の組に対応する符号、量子化済ピッチ利得gp4^と量子化済固定符号帳利得gc4^の組に対応する符号を「利得符号GAf1,GAf2,GAf3,GAf4」と表現する。すなわち、利得量子化部118は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、量子化済ピッチ利得gpj^と量子化済固定符号帳利得gcj^の組を特定する利得符号GAfjを得て出力する。
 このようなベクトル量子化には、例えば、量子化済ピッチ利得と量子化済固定符号帳利得との組に対応する利得符号を特定するためのテーブルである利得符号帳が用いられる。利得符号帳の例は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組が複数個格納されたテーブルである。なお、量子化済ピッチ利得に代えて量子化済ピッチ利得の関数値をベクトル量子化の対象としてもよいし、量子化済固定符号帳利得に代えて量子化済固定符号帳利得の関数値をベクトル量子化の対象としてもよいが、以下では量子化済ピッチ利得そのものと量子化済固定符号帳利得そのものをベクトル量子化の対象とする例について説明する。
 量子化済固定符号帳利得の関数値の一例は、過去または現在のサブフレーム(またはフレーム)での固定符号帳113からの信号成分のエネルギーを基に予測された現在のサブフレーム(またはフレーム)での固定符号帳利得の推定値と、現在のサブフレーム(またはフレーム)での固定符号帳利得との比を表す補正係数(correction factor)などである。補正係数の例は、非特許文献1の「5.8.2 Quantization of codebook gains」の欄に記載されたγgcである。例えば、j(j=1,...,4)番目のサブフレームでの量子化済固定符号帳利得gcj^、補正係数γgcの量子化値γgc^、j(j=1,...,4)番目のサブフレームでの固定符号帳利得の推定値の量子化値pgcj^の間には、以下の関係が成り立つ。
 gcj^=γgc^×pgcj^
 <利得量子化部118が行うベクトル量子化>
 利得量子化部118が行うベクトル量子化は、サブフレーム毎に、入力された入力音響信号x(n)(n=0,...,L-1)および合成信号x’(n)(n=0,...,L-1)に対して、利得符号帳に格納された複数個のインデックスのうちの何れか1つを選択し、それを利得符号とするものである。本発明は、この選択する処理に特徴があるので、以下でその[原理]と[具体的な手順の例]について順に説明する。
 [原理]
 本発明の利得量子化が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。本発明でのインデックスの選択は、符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされるのではなく、歪みとインデックスのビット数(符号長,情報量)とのバランスを考慮した基準に基づいてなされる。以下、この基準について説明する。
 一般に、N個(N≧1)のサンプルが符号化される場合、歪みDと1サンプルあたりの符号(インデックス)のビット数g/Nとの間には、以下の近似が成り立つ。
 Dg=D02(-2g/N)   ...(1)
ただし、符号化対象のN個のサンプルと、当該N個のサンプルに対応する符号が復号された場合に得られるN個の復元サンプルとの間の二乗距離を歪みと定義する。Dは1サンプルあたりの符号のビット数が0である場合の歪みである。
 このような関係は、サンプルの振幅が一様に分布する場合、1サンプルあたりの符号のビット数g/Nが1ビット増えると歪みDは1/4になること、および、サンプルの振幅がどのような分布に従う場合であっても、符号のビット数gがある程度以上ならほぼ同様のことがいえることに基づく。
 よって、歪みの変化率D/Dは以下のように近似できる。
 Dg/D0=2(-2g/N)  ...(2)
これを底10の対数に変換してdB表現すると以下のようになる。
 10log10(Dg/D0)
=10log10(2(-2g/N))
=10(-2g/N)log10(2)
=-6.02(g/N)    ...(3)
 すなわち、一般的に歪みの変化率D/Dの対数は1個のサンプルあたりの符号のビット数g/Nに比例する。例えばN=64の場合、64個のサンプルあたりの符号のビット数gが1ビット増加すると歪みの変化率D/Dは約0.1dB改善される。実験でもこれと同様な結果が得られる。
 以上のように、式(1)は歪みDと1サンプルあたりの符号のビット数g/Nとの一般的な関係を近似している。利得符号帳中のあるインデックスに対応する量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補を使うことによって生ずる歪みをDとし、そのインデックスのビット数をbとする。bが小さいと符号化装置全体として出力するビット数が小さくできたり、符号化装置が出力する符号の平均ビット数またはある時間区間内でビット数が一定である制約のもとに、節約できたビットを後続のフレームで利用して後続フレームの歪みを小さくできるという利点がある。従来はDを最小化する基準で選択したインデックスを利得符号としたが、本願では歪みとビット数を1つの指標値で評価して、最適なインデックスを利得符号として選択する。このために、式(1)の関係とこのフレームで一定のビット数のもとに利得量子化で節約できたビットを入力音響信号の符号化に割り当てることを想定する。利得符号にbビットを使うと、(b-1)ビットの場合より、入力音響信号の符号化で使うビット数は1ビット削減する必要があり、式(1)から歪みは2(2/N)倍だけ増加する。したがって、利得符号にbビットを使うと歪みは2(2b/N)倍だけ増加することになる。このようなビット数の消費を歪みに換算した歪みをDとして式(4)で定義する。
 DU=D×2(2b/N)  ...(4)
 歪みDが小さいほどDは小さくなり、インデックスを指定するビット数bが小さいほどDは小さくなる。Dが最小となる符号を探索することで、歪みDおよびインデックスのビット数bを1つの指標値で評価して利得符号を選択することができる。以下、Dを指標値と呼ぶ。
 式(4)の代わりに、以下の指標値Dが最小となる符号が探索されてもよい。
 DU=10log10(D×2(2b/N))=10log10(D)+(20b/N)log10(2)  ...(5)
 式(4)の指数部2b/Nの値は非常に小さいため、式(4)の指数関数部をテイラー展開し(e=1+x+x/2+x/6+...)、それによって得られる多項式の2項以降を省略してもよい近似となる。従って、以下の指標値Dが最小となる符号が探索されてもよい。
Figure JPOXMLDOC01-appb-M000001
 式(6)は上記のようないろいろな仮定と近似に基づいており、一般にはγを正の値である定数として式(7)のような指標値とし、γは符号化装置全体の制約や目的に合わせた実験に基づく値とすることが好ましい。
 DU=D(1+γb)   ...(7)
 要するに、指標値Dは上述のものに限定されず、歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる値が指標値Dとされ、指標値Dが最小となる符号が探索されればよい。
 [具体的な手順の例]
 上記の原理に基づいて利得量子化部118が行うベクトル量子化の具体的な手順を例示する。
 利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組を、可変長符号化(例えばハフマン符号化)し、利得符号であるインデックスを得る。例えば、利得量子化部118は、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補と可変長符号であるインデックスとの組が複数個格納された利得符号帳を備え、上述の基準に従い、入力音響信号x(n)(n=0,...,L-1)に対応する利得符号であるインデックスを得る。
 可変長符号は、例えば、学習用データを量子化した結果から得られる。具体的には、可変長符号は、学習用データのピッチ利得と固定符号帳利得の組をベクトル量子化した際に、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組が選択された頻度に応じて予め割り当てられたものである。選択された頻度の高い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の小さなインデックス(短い符号)が割り当てられ、選択された頻度の低い量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組にはビット数の大きなインデックス(長い符号)が割り当てられる。すなわち、利得符号帳に格納された複数個のインデックスにはビット数が異なるものが含まれる。このようなインデックスの例はハフマン符号である。しかしながら、その他の可変長符号がインデックスとして用いられてもよい。なお、各インデックスのビット数を定めるための上記頻度は、学習用データを用いなくても選択される量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組の頻度はある程度予想できるため、学習用データを用いることなく上記の頻度を予想して量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補との組に可変長符号を割り当ててもよい。
 以下に利得符号帳の具体例を示す。
Figure JPOXMLDOC01-appb-T000002
 表1は、インデックスがハフマン符号であり、インデックスのビット数も利得符号帳に格納する場合の利得符号帳の例である。表1ではその一部を省略してあるが、表1の利得符号帳には、量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスと当該インデックスのビット数とによる組が32組格納されている。
 利得量子化部118は、N個のサンプル点からなるサブフレーム(時間区間)ごとに、コードインデックスに対応するパルス系列(固定符号帳113からのサンプル列)を合成フィルタ117に通して得られるサンプル列Zのそれぞれのサンプルに、量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、ピッチ符号に対応するピッチ周期に対応するサンプル数だけ過去の励振信号を合成フィルタ117に通して得られるサンプル列Yのそれぞれのサンプルに、量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数bが大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得て出力する。例えば、第jサブフレームの合成信号サンプル列αY+βZは、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)=gpj^×v(n)+gcj^×cfj(n)からなるサンプル列である。ただし、gpj^=αかつgcj^=βである。例えば、第jサブフレームの入力音響信号Xは、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列である。例えば、利得量子化部118は、各インデックスに対応するgpj^=αおよびgcj^=βを出力し、第jサブフレームに属するN個のサンプル点nの合成信号x’(n)からなるサンプル列、および、第jサブフレームに属するN個のサンプル点nの入力音響信号x(n)からなるサンプル列を得て、第jサブフレームの指標値Dを各インデックスについて計算し、指標値Dが最も小さくなるインデックスを、第jサブフレームの利得符号として得て出力する。各指標値Dに対応する量子化済ピッチ利得の候補αと量子化済固定符号帳利得の候補βとインデックスとの組は、それぞれ、利得符号帳に格納された量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とインデックスとの組の何れかである。利得符号帳に量子化ピッチ利得の候補の関数値が格納されている場合は、量子化済ピッチ利得の候補の関数値から求まる量子化済ピッチ利得の候補をαとすればよい。同様に、利得符号帳に量子化済固定符号帳利得の候補の関数値が格納されている場合は、量子化済固定符号帳利得の候補の関数値から求まる量子化済固定符号帳利得の候補をβとすればよい。サンプル列Zに含まれるサンプルの個数、サンプル列Yに含まれるサンプルの個数、および合成信号サンプル列αY+βZに含まれるサンプルの個数は、すべてN個である。合成フィルタ117は、あるサンプル点nのサンプルυ(n)を、そのサンプル点nよりも過去のP個のサンプル点n-1,n-2,...,n-Pのサンプルχ(n-1),χ(n-2),...,χ(n-P)に線形予測係数a(n-1),a(n-2),...,a(n-P)を乗算した値a(n-1)×χ(n-1),a(n-2)×χ(n-2),...,a(n-P)×χ(n-P)の和で表す線形FIR(Finite Impulse Response)フィルタである。以下に合成フィルタ117を表す。
 υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
 例えば、サンプル列Aを合成フィルタ117に通してサンプル列Cが得られる場合、サンプル列Aに含まれるサンプルがχ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部となり、υ(n)がサンプル列Cのサンプル点nでのサンプルとなる。χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部がサンプル列Aよりも過去のサンプル点に対応する場合、例えば、当該χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部はサンプル列Aより過去のサンプル列に含まれるサンプルとされる。あるいは、サンプル列Aよりも過去のサンプル列が存在しない場合、当該当該χ(n-1),χ(n-2),...,χ(n-P)の少なくとも一部は0などの定数とされる。
 以下に指標値Dの具体例を示す。
 サブフレームがN個のサンプル点S,...,S+N-1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N-1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N-1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N-1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を歪みDと定義すると、歪みDは以下のように表される。ただし、σはσの転置を表す。
Figure JPOXMLDOC01-appb-M000003
 例えば、前述した1フレームが4個のサブフレームに等区分される例の場合、第jサブフレーム(j=1,...,4)は、N=Lf(j)-Lf(j-1)個のサンプル点Lf(j-1),...,Lf(j)-1からなる。ここで、第jサブフレームでの入力音響信号XをベクトルX=(x(Lf(j-1)),...,x(Lf(j)-1))と表現する。また、第jサブフレームでの固定符号帳113からのパルス系列cfj=(cfj(Lf(j-1)),...,cfj(Lf(j)-1))を合成フィルタ117に通して得られるサンプル列ZをZ=(z(Lf(j-1)),...,z(Lf(j)-1))と表現する。さらに、第jサブフレームでの適応信号成分(過去の励振信号)v(Lf(j-1)),...,v(Lf(j)-1)を合成フィルタ117に通して得られるサンプル列YをベクトルY=(y(Lf(j-1)),...,y(Lf(j)-1))と表現する。すると、第jサブフレームでの歪みDは以下のように表される。
Figure JPOXMLDOC01-appb-M000004
 指標値Dの例は、前述の式(4)または式(5)または式(7)であってもよいし、式(6)で近似された以下の指標値Dであってもよい。
Figure JPOXMLDOC01-appb-M000005
 歪みDは符号化歪みであり、Dは歪みと利得符号のビット数b(符号長)の双方を考慮した指標値である。すなわち、歪みDが最小となるインデックスを利得符号として選択するのが従来の選択方法であり、指標値Dが最小となるインデックスを利得符号として選択するのが本発明での選択方法である。本発明では、歪みDと利得符号のビット数b(符号長)の双方を考慮して利得符号が選択される。
 なお、表1のように、利得符号帳に各インデックスとそのビット数bとが対応付けられて格納されていれば、利得量子化部118は、インデックスからそのビット数bを算出することなく指標値Dを計算できる。しかしながら、利得符号帳にビット数bが格納されていなくても、利得量子化部118は、インデックスからそのビット数を計算して指標値Dを計算できる。そのため、各インデックスのビット数bを利得符号帳に格納しておくことは必須ではない。
 [指標値の変形例1]
 或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure JPOXMLDOC01-appb-M000006
ただし、Bは利得符号帳に格納された全ての量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補の組を均一長符号化するために必要な符号のビット数である。例えば、表1に例示した利得符号帳は32=2個のインデックスを含み、この場合のBの例は5である。表1に例示した利得符号帳を用いた可変長符号化でビット数がbのインデックスが利得符号とされた場合は、均一長符号化を可変長符号化に変更したことにより余った(B-b)ビットを使って入力音響信号を更に符号化するができ、歪を軽減できることを想定する。実際は(B-b)ビットが正であれば情報の節約ができ、あるいは次のサブフレーム以降で使うことができるが、式(11)は、利得符号帳の選択の基準として均一長符号より可変長符号のほうがビット数が少ないことを歪に換算して評価するものである。式(11)の(2log2)B/Nの項は1と比較して非常に小さい。従って、近似的には式(10)および式(11)の指標値Dの間に大きな違いはない。
 [指標値の変形例2]
 或いは、利得量子化部118が、以下の指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
Figure JPOXMLDOC01-appb-M000007
ただし、vは正の係数である。
 言い換えると、利得量子化部118が、式(10)の括弧内の第2項、すなわち、インデックスのビット数bが大きくなるほど大きくなる項、に正の値である係数vを乗算して得られる式(12)により求まる指標値Dを最小にする量子化済ピッチ利得の候補と量子化済固定符号帳利得の候補とに対応するインデックスを利得符号帳から探索し、得られたインデックスを利得符号として出力してもよい。
 式(12)の指標値Dが用いられる場合、係数vを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。このような調整は、例えば、パラメータ符号化部119から出力されるビットストリームのビット数がフレームごとに定められている場合などに有効である。このような調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のvを1より小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とすることによって可能である。
 例えば、利得量子化部118は、第1サブフレームでv=1とした式(12)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、v=0.5とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、インデックスのビット数を小さくすることよりも歪みDを小さくすることを優先してインデックスが選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、v=2.0とした式(12)により求まる指標値Dを最小とするインデックスが利得符号として選択される。すなわち、第2サブフレームでは、歪みDを小さくすることよりもインデックスのビット数を小さくすることを優先してインデックスが選択される。
 係数vが異なれば、それに対応する最適な利得符号帳も異なる。そのため、利得量子化部118が、利得符号帳を複数個備え、各係数vの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。例えば、v=1に対応する利得符号帳、v=2に対応する利得符号帳、v=0.5に対応する利得符号帳、の複数個の符号帳を予め利得量子化部118に格納しておき、vの値に対応する利得符号帳が選択され、選択された利得符号帳から指標値Dを最小とするインデックスが選択され、それが利得符号として出力されてもよい。この場合、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする。
 式(5)で求まる指標値Dに代えて式(6)で求まる指標値Dを用いることができるのと同様に、式(12)で求まる指標値Dに代えて式(13)で求まる指標値Dを用いることができる。
 Du=D(1+vγb)   …(13)
 ここで、γは正の定数、vは正の係数であるので、vγに相当する正の係数をwとすれば、式(14)で求まる指標値Dを用いることができる。
 Du=D(1+wb)   …(14)
 式(14)の指標値Dが用いられる場合、係数wを調整することで、サブフレームごとの利得符号のビット数の大小を調整できる。この調整は、所定時間だけ過去の時間区間(例えばサブフレーム)で得られた利得符号のビット数がインデックスの平均ビット数より小さい場合には、現在の時間区間(例えばサブフレーム)のwを予め定めた値wより小さな値とし、所定時間だけ過去の時間区間で得られた利得符号のビット数がインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた値wより大きな値とすることによって可能である。
 例えば、利得量子化部118は、第1サブフレームでw=wとした式(14)により求まる指標値Dを最小とするインデックスを利得符号として選択する。その結果、第1サブフレームでビット数が平均ビット数よりも小さいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも大きくなる。そこで、第2サブフレームでは、w=0.5wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。逆に第1サブフレームでビット数が平均ビット数よりも大きいインデックスが利得符号として選択された場合には、残りのサブフレームに割り当てることができるビット数が平均よりも小さくなる。そこで、第2サブフレームでは、w=2.0wとした式(14)により求まる指標値Dを最小とするインデックスが利得符号として選択される。上述した係数vを用いる場合と同様に、係数wを用いる場合も、利得量子化部118が、利得符号帳を複数個備え、各係数wの値ごとに予め定められた利得符号帳を用いて利得符号を得て出力してもよい。この場合も、利得符号帳の選択基準は、符号化装置11と復号装置12との間で同一とする(<利得量子化部118が行うベクトル量子化>の説明終わり)。
 利得量子化部118で各サブフレームでの利得符号GAf1,GAf2,GAf3,GAf4が得られると、コードインデックスCf1,Cf2,Cf3,Cf4に対応するパルス系列cf1,cf2,cf3,cf4(固定符号帳113からのサンプル列)に量子化済固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T,T,T,Tに対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L-1)に量子化済ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L-1)が、適応符号帳112に追加される。
  u'(n)=gp1^×v(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
  u'(n)=gp2^×v(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
  u'(n)=gp3^×v(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
  u'(n)=gp4^×v(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
 また、線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CT、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。
 <復号>
 符号化装置11(図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(図2)のパラメータ復号部129に入力される。パラメータ復号部129は、ビットストリームBSから得られた線形予測情報LPC info、ピッチ周期符号CT,CT,CT,CTを復号して得られたピッチ周期T',T',T',T'、コードインデックスCf1,Cf2,Cf3,Cf4、ならびに利得符号GAf1,GAf2,GAf3,GAf4を復号して得られた復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を出力する。なお、パラメータ復号部129は、符号化装置11の利得量子化部118に備えられた利得符号帳と同じ符号帳(例えば、表1)を用いて利得符号GAf1,GAf2,GAf3,GAf4を可変長復号し、復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を得る。
 固定符号帳123は、固定符号帳選択部125の制御に基づき、入力されたコードインデックスCf1,Cf2,Cf3,Cf4を復号し、当該フレームに対応するパルス系列cf1,cf2,cf3,cf4を得て出力する。適応符号帳122は、入力されたピッチ周期T’,T’,T’,T’で特定される適応信号成分v’(n)(n=0,...,L-1)を出力する。
 パルス系列cf1,cf2,cf3,cf4に復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、適応信号成分v’(n)(n=0,...,L-1)に復号ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u’(n)(n=0,...,L-1)が、適応符号帳122に追加される。
  u'(n)=gp1^×v'(n)+gc1^×cf1(n)(n=Lf(0),...,Lf(1)-1)
  u'(n)=gp2^×v'(n)+gc2^×cf2(n)(n=Lf(1),...,Lf(2)-1)
  u'(n)=gp3^×v'(n)+gc3^×cf3(n)(n=Lf(2),...,Lf(3)-1)
  u'(n)=gp4^×v'(n)+gc4^×cf4(n)(n=Lf(3),...,Lf(4)-1)
 また、励振信号u’(n)(n=0,...,L-1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L-1)が出力される。
 <その他の変形例等>
 本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では、線形予測残差残差信号を固定符号帳と適応符号帳と利得符号帳を用いて符号化する、いわゆるCELP符号化における利得の符号化に本発明を適用する例を示した。しかしながら、線形予測残差信号ではなく入力音響信号そのものを符号化対象とするものであっても、音響信号ではない時系列信号を符号化対象とするものであっても、固定符号帳と適応符号帳の何れかを備えないものであっても、固定符号帳と適応符号帳の何れかを複数備えるものであっても、固定符号帳や適応符号帳を用いる符号化の代わりにその他のサンプル列の符号化方法を採用したものであっても、何らかの方法によりサンプル列に対応する符号である波形情報符号を得られる符号化方法であり、かつ、波形情報符号に対応するサンプル列に量子化された利得(以下「量子化済利得」という)を乗算して得られる波形サンプル列と入力信号とが与えられ、入力信号の可変長の利得符号を得る符号化であれば、本発明を適用できる。入力信号は、例えば時系列信号である。入力信号の例は、音響信号、映像信号、生体信号、地震波信号、センサーアレイ信号などである。入力信号は時間領域の信号であってもよいし、周波数領域の信号であってもよい。すなわち、符号化装置が、量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、当該複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数区間ごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。
 波形情報符号とは、波形情報符号を復号することによりサンプル列を特定することが可能な符号であり、上述の実施形態におけるコードインデックスやピッチ符号やこれらを代替するような符号、たとえば、標本化・量子化されたPCM形式のサンプルを表す符号、である。指標値Dは、歪みDが大きいほど大きくなり、かつ、波形サンプル列を得るための量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる値である。歪Dは、波形情報符号に対応するサンプル列に量子化済利得の候補を乗算して得られる波形サンプル列と入力信号との歪みであるか、または、第1から第ΓまでのΓ(Γは2以上の整数)個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列(Γ個の波形サンプル列)、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みである。波形情報符号に対応するサンプル列は、例えば、波形情報符号を復号することにより得られるサンプル列そのものや、波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである。例えば、指標値Dは、歪みDとインデックスのビット数が大きいほど大きくなる係数とを加算または乗算して得られる値である。インデックスのビット数が大きいほど大きくなる係数の例は、インデックスのビット数が大きいほど大きくなる値を指数に持つ、べき乗値である。指標値Dの具体例は、前述の式(4)(5)(7)(10)(11)などである。
 図3に例示する符号化装置21は、Θ個の波形情報符号帳211-1,…,211-Θと符号化部212とを有する。ただし、Θは1以上の整数であり、符号化部212は利得量子化部218を含む。
 利得量子化部218は、量子化済利得の候補αθまたはその関数値とインデックスとの組を複数個格納している。ただしθ=1,…,Θである。すなわち、利得量子化部218は、量子化済利得の候補αまたはその関数値、量子化済利得の候補αまたはその関数値、・・・、および量子化済利得の候補αΘまたはその関数値、ならびにインデックスからなる組を複数個格納している。すなわち、Θ=1の場合、利得量子化部218は、量子化済利得の候補αまたはその関数値とインデックスとの組を複数個格納している。Θ=Γ≧2の場合、利得量子化部218は、第1から第Γの量子化済利得の候補αγまたはその関数値の組とインデックスとの組を複数個格納している。当該複数個のインデックスにはビット数が異なるものが含まれている。
 符号化部212は、時間区間ごとに、波形情報符号E,…,EΘを得、指標値Dが最も小さくなるインデックスを利得符号として得、波形情報符号E,…,EΘおよび利得符号に対応するビットストリームを出力する。インデックスの選択は、利得量子化部218によって行われる。前述のように、指標値Dは、歪みDが大きいほど大きくなり、かつ、量子化済利得の候補αθ(θ=1,…,Θ)に対応するインデックスのビット数が大きいほど大きくなる値である。ただし、図3の例の歪みDは、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのα+…+αΘΘと、入力信号Xと、の歪みである。また、波形情報符号Eθに対応するサンプル列Yθの例は、波形情報符号Eθに対する波形情報符号帳211-θからのサンプル列を入力信号Xに対応する合成フィルタに通して得られるサンプル列や、波形情報符号Eθに対する波形情報符号帳211-θからのサンプル列などである。
 図3に例示する符号化装置21は、第一実施形態の符号化装置、すなわち、図1に例示した符号化装置11を包含するものである。具体的には、図3の符号化装置21であって、Θ=2であり、かつ、波形情報符号帳211-1が固定符号帳113であり、波形情報符号帳211-2が適応符号帳112であり、利得量子化部218が利得量子化部118である構成は第一実施形態の符号化装置11そのものである。この場合は、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済固定符号帳利得の候補βであり、利得量子化部218における量子化済利得の候補αは利得量子化部118における量子化済ピッチ利得の候補αであり、波形情報符号Eは第一実施形態のコードインデックスであり、波形情報符号Eは第一実施形態のピッチ符号であり、入力信号Xは第一実施形態の入力音響信号である。
 符号化装置21に対応する復号装置は、量子化済利得の候補αθ(θ=1,…,Θ)またはその関数値とインデックスとの組を複数個格納している。これらの組は、利得量子化部218に格納された組と同一である。復号装置は、入力されたビットストリームが含む波形情報符号E,…,EΘおよび利得符号を用い、時間区間ごとに、波形情報符号Eθに対応するサンプル列Yθのそれぞれのサンプルに利得符号が表す量子化済利得の候補αθを乗算して得られるサンプル列αθθについてのサンプル列α+…+αΘΘを出力する。
 上記の実施形態では、サブフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得た。しかしながら、フレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよいし、複数個のサブフレームまたはフレームごとに、指標値Dが最も小さくなるインデックスを利得符号として得てもよい。
 その他、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
 また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
 この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
 このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
 このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
 上記実施形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。
11,21 符号化装置
12 復号装置

Claims (26)

  1.  量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有する符号化装置。
  2.  第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化部を有する符号化装置。
  3.  上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項1または2の符号化装置。
  4.  所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化部を有する、符号化装置。
  5.  入力音響信号を所定時間区間ごとに符号化する装置であって、
     時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測分析部と、
     時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索部と、
     時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索部と、
     時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化部と、
     上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を格納する適応符号帳と、を少なくとも備えており、
     上記利得量子化部は、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
     上記複数個のインデックスにはビット数が異なるものが含まれており、
     時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものである。
  6.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とし、γを予め定めた正の定数としたD=D{1+γb}により求まる値である、請求項1から5の何れかに記載の符号化装置。
  7.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)b/N}により求まる値である、請求項1から5の何れかに記載の符号化装置。
  8.  上記指標値Dは、bを上記インデックスのビット数とし、Bを上記利得符号帳に格納された全ての量子化済ピッチ利得の候補またはその関数値と量子化済固定符号帳利得の候補またはその関数値の組を均一長符号化するために必要な符号のビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)(b-B)/N}により求まる値である、請求項1から5の何れかに記載の符号化装置。
  9.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値wより小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた正の値wより大きな値とし、
     bを上記インデックスのビット数とした
     D=D(1+wb)
    により求まる値である、請求項1から5の何れかに記載の符号化装置。
  10.  上記利得量子化部には、利得符号帳が複数個備えられており、
     上記利得量子化部は、wの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項9記載の符号化装置。
  11.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とし、
     bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
     D=D{1+v(2log2)b/N}
    により求まる値である、請求項1から5の何れかに記載の符号化装置。
  12.  上記利得量子化部には、利得符号帳が複数個備えられており、
     上記利得量子化部は、vの値ごとに予め定められた利得符号帳を用いて利得符号を得る、請求項11記載の符号化装置。
  13.  量子化済利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、波形情報符号に対応するサンプル列の各サンプルに上記量子化済利得の候補を乗算して得られる波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有する符号化方法。
  14.  第1から第Γ(Γは2以上の整数)の量子化済利得の候補またはその関数値の組とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間または周波数の区間ごとに、第1から第ΓまでのΓ個の、第γ(γは1以上Γ以下の整数)の波形情報符号に対応するサンプル列の各サンプルに上記第γの量子化済利得の候補を乗算して得られる第γの波形サンプル列、を対応するサンプル毎に加算して得られる合計波形サンプル列と、入力信号と、の歪みDが大きいほど大きくなり、かつ、上記合計波形サンプル列を得るための上記量子化済利得の候補に対応するインデックスのビット数が大きいほど大きくなる指標値D、が最も小さくなる上記インデックスを、利得符号として得る利得量子化ステップを有する符号化方法。
  15.  上記波形情報符号に対応するサンプル列は、上記波形情報符号を復号することにより得られるサンプル列を、合成フィルタに通して得られたものである、
    請求項13または14の符号化方法。
  16.  所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
     量子化済固定符号帳利得の候補またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、上記複数個のインデックスにはビット数が異なるものが含まれており、時間区間ごとに、固定符号帳からのサンプル列を合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得る利得量子化ステップを有する、符号化方法。
  17.  入力音響信号を所定時間区間ごとに符号化する方法であって、
     時間区間ごとに、上記入力音響信号に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報を得る線形予測ステップと、
     時間区間ごとに、固定符号帳に含まれる複数のサンプル列のうち上記入力音響信号に対応するサンプル列を特定するコードインデックスを得る固定符号帳探索ステップと、
     時間区間ごとに、上記入力音響信号に対応するピッチ周期を特定するピッチ符号を得る適応符号帳探索ステップと、
     時間区間ごとに、量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号を得る利得量子化ステップと、
     上記コードインデックスに対応する固定符号帳からのサンプル列のそれぞれのサンプルに上記量子化済固定符号帳利得を乗算して得られるサンプル列と、上記ピッチ周期に対応するサンプル数だけ過去の励振信号のサンプル列のそれぞれのサンプルに上記量子化済ピッチ利得を乗算して得られるサンプル列と、を対応するサンプル毎に加算した励振信号を適応符号帳に格納するステップと、を少なくとも備えており、
     量子化済固定符号帳利得またはその関数値と量子化済ピッチ利得の候補またはその関数値とインデックスとの組が複数個格納された利得符号帳を備え、
     上記複数個のインデックスにはビット数が異なるものが含まれており、
     上記利得量子化ステップは、
     時間区間ごとに、上記コードインデックスに対応する固定符号帳からのサンプル列を上記線形予測係数またはこれと互換な係数による合成フィルタに通して得られるサンプル列Zのそれぞれのサンプルに上記量子化済固定符号帳利得の候補βを乗算して得られるサンプル列βZと、上記ピッチ周期に対応するサンプル数だけ過去の励振信号を上記合成フィルタに通して得られるサンプル列Yのそれぞれのサンプルに上記量子化済ピッチ利得の候補αを乗算して得られるサンプル列αYと、を対応するサンプル毎に加算して得られる合成信号サンプル列αY+βZと入力音響信号Xとの歪みDと、インデックスのビット数が大きいほど大きくなる係数と、を加算または乗算して得られる指標値Dが最も小さくなるインデックスを、利得符号として得るものである、符号化方法。
  18.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とし、γを予め定めた正の定数としたD=D{1+γb}により求まる値である、請求項13から17の何れかに記載の符号化方法。
  19.  上記指標値Dは、bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)b/N}により求まる値である、請求項13から17の何れかに記載の符号化方法。
  20.  上記指標値Dは、bを上記インデックスのビット数とし、Bを上記利得符号帳に格納された全ての量子化済ピッチ利得の候補またはその関数値と量子化済固定符号帳利得の候補またはその関数値の組を均一長符号化するために必要な符号のビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数としたD=D{1+(2log2)(b-B)/N}により求まる値である、請求項13から17の何れかに記載の符号化方法。
  21.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のwを予め定めた正の値wより小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のwを予め定めた正の値wより大きな値とし、
     bを上記インデックスのビット数とした
     D=D(1+wb)
    により求まる値である、請求項13から17の何れかに記載の符号化方法。
  22.  利得符号帳が複数個備えられており、
     上記利得量子化ステップは、wの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項21記載の符号化方法。
  23.  上記指標値Dは、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より小さい場合には、現在の時間区間のvを1より小さな値とし、
     所定時間だけ過去の時間区間で得られた利得符号のビット数が上記利得符号帳に格納されたインデックスの平均ビット数より大きい場合には、現在の時間区間のvを1より大きな値とし、
     bを上記インデックスのビット数とし、Nを上記時間区間の入力音響信号のサンプルの個数とした
     D=D{1+v(2log2)b/N}
    により求まる値である、請求項13から17の何れかに記載の符号化方法。
  24.  利得符号帳が複数個備えられており、
     上記利得量子化ステップは、vの値ごとに予め定められた利得符号帳を用いて利得符号を得るステップである、請求項23記載の符号化方法。
  25.  請求項1,4または5の何れかの符号化装置としてコンピュータを機能させるためのプログラム。
  26.  請求項1,4または5の何れかの符号化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
PCT/JP2013/055048 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体 WO2013129439A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014502273A JP5789816B2 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012041527 2012-02-28
JP2012-041527 2012-02-28

Publications (1)

Publication Number Publication Date
WO2013129439A1 true WO2013129439A1 (ja) 2013-09-06

Family

ID=49082634

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/055048 WO2013129439A1 (ja) 2012-02-28 2013-02-27 符号化装置、この方法、プログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JP5789816B2 (ja)
WO (1) WO2013129439A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020676A (ja) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc 音声符号化/復号化方法及び音声符号化/復号化装置
JP2011509426A (ja) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー オーディオエンコーダおよびデコーダ
JP2011133637A (ja) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4727413B2 (ja) * 2005-12-21 2011-07-20 三菱電機株式会社 音声符号化・復号装置
EP2099025A4 (en) * 2006-12-14 2010-12-22 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
JP2011518345A (ja) * 2008-03-14 2011-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
JPWO2011048810A1 (ja) * 2009-10-20 2013-03-07 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法
US9812141B2 (en) * 2010-01-08 2017-11-07 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004020676A (ja) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc 音声符号化/復号化方法及び音声符号化/復号化装置
JP2011509426A (ja) * 2008-01-04 2011-03-24 ドルビー・インターナショナル・アーベー オーディオエンコーダおよびデコーダ
JP2011133637A (ja) * 2009-12-24 2011-07-07 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、符号化装置、復号装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKAYOSHI OSHIMA ET AL.: "Variable-length coding of ACELP gain using Entropy-Constrained VQ", INTERNATIONAL SYMPOSIUM ON COMMUNICATIONS AND INFORMATION TECHNOLOGIES (ISCIT), 5 October 2012 (2012-10-05), pages 105 - 109 *

Also Published As

Publication number Publication date
JP5789816B2 (ja) 2015-10-07
JPWO2013129439A1 (ja) 2015-07-30

Similar Documents

Publication Publication Date Title
US11024319B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
US10056088B2 (en) Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
JP5613781B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
WO2012102149A1 (ja) 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体
JP3143956B2 (ja) 音声パラメータ符号化方式
CN110444216B (zh) 解码装置、解码方法、记录介质
EP1267328A2 (en) Method of converting codes between speech coding and decoding systems, and device and program therefor
KR101629661B1 (ko) 복호 방법, 복호 장치, 프로그램 및 그 기록매체
JP5789816B2 (ja) 符号化装置、この方法、プログラム及び記録媒体
JP5714172B2 (ja) 符号化装置、この方法、プログラムおよび記録媒体
JP5395649B2 (ja) 符号化方法、復号方法、符号化装置、復号装置及びプログラム
JP6053145B2 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5762636B2 (ja) 符号化装置、復号装置、これらの方法、プログラム、および記録媒体
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13755136

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014502273

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13755136

Country of ref document: EP

Kind code of ref document: A1