WO2018225412A1 - 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム - Google Patents
符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム Download PDFInfo
- Publication number
- WO2018225412A1 WO2018225412A1 PCT/JP2018/016564 JP2018016564W WO2018225412A1 WO 2018225412 A1 WO2018225412 A1 WO 2018225412A1 JP 2018016564 W JP2018016564 W JP 2018016564W WO 2018225412 A1 WO2018225412 A1 WO 2018225412A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- value
- sequence
- spectrum
- envelope
- logarithmic
- Prior art date
Links
- 238000009499 grossing Methods 0.000 title claims description 204
- 238000000034 method Methods 0.000 title claims description 78
- 230000003595 spectral effect Effects 0.000 claims abstract description 217
- 238000001228 spectrum Methods 0.000 claims description 495
- 230000007812 deficiency Effects 0.000 claims description 18
- 230000002441 reversible effect Effects 0.000 claims description 7
- 238000013139 quantization Methods 0.000 description 65
- 230000008569 process Effects 0.000 description 35
- 230000005236 sound signal Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 30
- 238000006243 chemical reaction Methods 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 9
- 230000001174 ascending effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
Definitions
- the present invention relates to a signal processing technique such as a coding technique for a time-series signal such as a sound signal, and in particular, smoothes a sample sequence derived from a frequency spectrum of a time-series signal such as a sound signal based on the spectrum envelope value. Or, it relates to a technique for inverse smoothing.
- Non-Patent Document 1 As a conventional technique for compressing and encoding a sample sequence of a sound and audio signal.
- FIG. 9A is a functional configuration diagram of the encoding device 1011 of Non-Patent Document 1.
- the encoding device 1011 of Non-Patent Document 1 converts a sample sequence of an input audio-acoustic signal into a frequency spectrum sequence X 0 , X 1 ,..., X N-1 (where N is a positive integer).
- a converting unit 1111 the frequency spectrum sequence X 0, X 1, ..., the linear prediction coefficients alpha 1 from X N-1, ⁇ 2, ..., ⁇ p (
- p is the order of the linear prediction, an integer of 2 or more )
- the linear prediction coefficient ⁇ 1 , ⁇ 2 ,..., ⁇ p to obtain a linear prediction coefficient code C ⁇ having a predetermined number of bits, and linear prediction coefficients ⁇ 1 , ⁇ 2 ,.
- a quantization unit 1115 that obtains a signal code CX by assigning a code length according to a corresponding spectral envelope value to obtain a signal code CX, and obtains a quantization width code CQ having a predetermined number of bits corresponding to the quantization width
- linear A multiplexing unit 1117 that multiplexes the prediction coefficient code C ⁇ , the signal code CX, and the quantization width code CQ to obtain the output code of the encoding device 1011 is included.
- FIG. 9B is a functional configuration diagram of the decoding device 1012 of Non-Patent Document 1.
- the decoding apparatus 1012 of Non-Patent Document 1 obtains the output code output from the encoding apparatus 1011 as an input code, and the quantization width code CQ included in the input code is input to the inverse quantization unit 1125 and the linear code included in the input code.
- the prediction coefficient code C ⁇ is output to the spectrum envelope generation unit 1123, the signal code CX included in the input code is output to the inverse quantization unit 1125, and the demultiplexing unit 1127 and the linear prediction coefficient code C ⁇ (a code representing the spectrum envelope) are output.
- spectral envelope sequence H 0, H 1, ..., a spectrum envelope generating unit 1123 to obtain the H N-1, the spectral envelope sequence H 0, H 1, ..., corresponding to the value of each sample in H N-1
- the code length signal code CX is decoded to obtain the value of each sample of the quantized spectrum sequence
- the quantized width code CQ is decoded to obtain the quantized width
- the value of each sample of the quantized spectrum sequence is quantized.
- Series obtained by multiplying Frequency spectrum sequence from X 0, X 1, ..., X and N-1 inverse quantization unit 1125 to obtain the frequency spectrum sequence X 0, X 1, ..., the output signal is a sample sequence of the X N-1 time domain
- an encoding method in which the code length assigned to each sample depends on the spectrum envelope is used as an input code without any error. This is useful for conditions that are entered.
- an error occurs once until a linear prediction coefficient code C ⁇ (a code representing a spectrum envelope) included in the output code output from the encoding device is input to the decoding device. If this happens, an error occurs in the code length of the code corresponding to each sample included in the signal code, and the number of samples obtained by decoding changes, so that the decoding process itself fails, or Although the number of samples obtained by decoding happens to be correct, there is a problem that an output signal that is completely different from the input signal is output.
- C ⁇ a linear prediction coefficient code representing a spectrum envelope
- the present invention makes it possible to efficiently use a signal of spectral envelope even under the condition that an error may occur in a code representing the spectral envelope before the code output from the encoding device is input to the decoding device. Can be obtained by decoding even if an error is included in the code representing the spectral envelope in the code input to the decoding device.
- An object of the present invention is to enable encoding and decoding compatible with ensuring that the number of samples is the same as the number of samples input to the encoding device and minimizing the influence of errors.
- a logarithm that is an integer value sequence corresponding to a 2-base logarithm of each sample value of a spectrum envelope sequence corresponding to a time-series signal in a predetermined time interval and is an integer value sequence in which the sum is zero.
- Spectral envelope sequences L 0 , L 1 ,..., L N-1 and an envelope code that is a code that can identify the logarithmic spectral envelope sequence are obtained.
- the quantized spectral sequence ⁇ X 0 of each sample of the frequency domain spectrum sequence obtained by quantization of the time-series signal, ⁇ X 1, ..., ⁇ X for N-1, ⁇ X k ( k is the sample number ⁇ X k with L k corresponding to k ⁇ ⁇ 0,..., N-1 ⁇ ) is a positive value
- L k digits removed from the least significant digit in binary notation of ⁇ X k was a smoothed spectral values ⁇ X k
- ⁇ for X k L k corresponding to is a negative value ⁇ X k
- ⁇ X k of binary -L k digit to the least significant digit in the notation by the smoothed spectrum values ⁇ X k and obtained by adding a numerical value only, ⁇ when X corresponding to k L k is 0, that ⁇ the X k and smoothed spectrum values ⁇ X
- the signal can be efficiently transmitted using the information of the spectral envelope. It can be compressed.
- FIG. 1 is a functional configuration diagram of the encoding device according to the first embodiment
- FIG. 1B is an example of a functional configuration diagram of a signal smoothing unit
- FIG. 2 is a functional configuration diagram of the decoding apparatus according to the first embodiment
- FIG. 2B is an example of a functional configuration diagram of the signal inverse smoothing unit.
- 3A to 3C are conceptual diagrams for illustrating the processing of the smoothing unit of the first embodiment.
- 4A to 4C are conceptual diagrams for illustrating the processing of the inverse smoothing unit of the first embodiment.
- 5A to 5C are conceptual diagrams for illustrating the effect when a code error occurs in the output code obtained in the first embodiment.
- FIG. 6A is a functional configuration diagram of the encoding device of the second embodiment
- FIG. 6A is a functional configuration diagram of the encoding device of the second embodiment
- FIG. 6B is a functional configuration diagram of the decoding device of the second embodiment.
- FIG. 7A is a functional configuration diagram of the encoding device of the third embodiment, and FIG. 7B is a functional configuration diagram of the decoding device of the third embodiment.
- FIG. 8A is a functional configuration diagram of the smoothing device of the fourth embodiment, and FIG. 8B is a functional configuration diagram of the inverse smoothing device of the fourth embodiment.
- FIG. 9A is a functional configuration diagram of the encoding device of Non-Patent Document 1
- FIG. 9B is a functional configuration diagram of the decoding device of Non-Patent Document 1.
- a fixed-length code having a short code length can be assigned to each sample of the smoothed spectrum series.
- the decoding apparatus needs to perform processing (that is, inverse smoothing) of multiplying each smoothed spectrum value of the smoothed spectrum sequence obtained by decoding the code by each spectrum envelope value of the spectrum envelope sequence.
- each smoothed spectrum value of the smoothed spectrum sequence obtained by dividing each frequency spectrum value of the frequency spectrum sequence by each spectrum envelope value of the spectrum envelope sequence of the time series signal is quantized.
- the code is assigned to each sample of the sample sequence obtained by the conversion.
- each frequency spectrum value of the frequency spectrum sequence is quantized to obtain a quantized frequency spectrum sequence that is a sequence of values after quantization, and each quantized frequency spectrum value of the quantized frequency spectrum sequence is converted into a spectrum envelope sequence. Is divided by each spectrum envelope value to obtain a smoothed quantized frequency spectrum sequence, and a code is assigned to each sample of the smoothed quantized frequency spectrum sequence.
- the frequency spectrum values of the frequency spectrum sequence are quantized. Smoothing and de-smoothing that achieves both division and multiplication in the integer region of the spectral envelope sequence for the quantized spectral sequence that has become an integer value and reversibility are realized. Furthermore, by performing encoding and decoding by assigning a fixed-length code to each sample of the smoothed spectrum sequence obtained by smoothing the quantized spectrum sequence by this division, the number of samples obtained by decoding is transferred to the encoding device. The signal compression and decompression is realized while guaranteeing that the number of input samples is the same.
- Quantized spectrum sequence of integer value of N points obtained by scalar quantization of each frequency spectrum value of frequency spectrum sequence X 0 , X 1 , ..., X N-1 ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N for -1, each spectral envelope value H 0 of the spectral envelope sequence representing the shape of the spectral envelope, H 1, ..., H N -1 , the frequency spectrum sequence X 0, X 1, ..., obtained from X N-1 Using the obtained linear prediction coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p , it can be expressed as follows.
- N is a positive integer and p is an integer of 2 or more.
- Exp ( ⁇ ) is an exponential function with the Napier number as the base, and j is an imaginary unit.
- the spectral envelope value H 0, H 1, ..., H total N-1 of the logarithmic value is known to be approximately 0, logarithm to the base 2 of the spectral envelope value H k L k
- the system of the first embodiment of the present invention includes an encoding device and a decoding device.
- the encoding apparatus encodes a time-series time-series signal input in units of frames, for example, a sound signal (acoustic signal) such as speech or music, and obtains and outputs a code.
- the code output from the encoding device is input to the decoding device.
- the decoding apparatus decodes the input code and outputs a time-series signal in the time domain in units of frames, for example, a sound signal.
- a sound signal acoustic signal
- the decoding apparatus decodes the input code and outputs a time-series signal in the time domain in units of frames, for example, a sound signal.
- the sound signal input to the encoding device is, for example, a time-series signal obtained by collecting sounds such as voice and music with a microphone and performing AD conversion.
- the sound signal output from the decoding device is, for example, DA-converted and reproduced by a speaker, thereby enabling listening.
- the encoding device 11 includes a frequency domain transform unit 111, a linear prediction analysis unit 112 (envelope encoding unit), a spectrum envelope generation unit 113, a logarithmic envelope generation unit 114, a quantization unit 115, a signal A smoothing unit 116 and a multiplexing unit 117 are included.
- the linear prediction analysis unit 112, the spectrum envelope generation unit 113, and the logarithmic envelope generation unit 114 are included in the “logarithmic spectrum envelope generation unit”.
- the encoding device 11 receives a time-domain sound signal (an input signal that is a time-series signal).
- the sound signal is, for example, an audio signal or an acoustic signal.
- the time-domain sound signal input to the encoding device is input to the frequency converter.
- the time domain sound signal input to the encoding device 11 is input to the frequency domain transform unit 111.
- the frequency domain transform unit 111 converts the input time domain sound signal in units of a predetermined time length frame (predetermined time interval) into N-point samples of the frequency domain by, for example, modified discrete cosine transform (MDCT).
- MDCT modified discrete cosine transform
- frequency spectrum sequence X 0 is a sequence, X 1, ..., and outputs the converted to X N-1.
- various known conversion methods for example, discrete Fourier transform, short-time Fourier transform, etc.
- MDCT modified discrete cosine transform
- the frequency spectrum sequence is an MDCT coefficient sequence.
- the frequency domain transform unit 111 outputs the frequency spectrum sequences X 0 , X 1 ,..., X N ⁇ 1 obtained by the transformation to the linear prediction analysis unit 112 and the quantization unit 115. Note that the frequency domain transform unit 111 performs filter processing and companding processing for auditory weighting on the frequency spectrum sequence obtained by the transformation, and the sequence after filtering and companding processing is performed on the frequency spectrum sequence X. 0 , X 1 ,..., X N-1 may be output.
- Linear prediction analysis unit 112 The linear prediction analysis unit 112, the frequency spectrum sequence X 0 to the frequency domain transform unit 111 outputs, X 1, ..., X N -1 are input. Linear prediction analysis unit 112, the frequency spectrum sequence is input X 0, X 1, ..., the linear prediction coefficients alpha 1 corresponding to X N-1, ⁇ 2, ..., and alpha p, the linear prediction coefficient alpha 1, A linear prediction coefficient code C ⁇ (envelope code CL) corresponding to ⁇ 2 ,..., ⁇ p is obtained and output. Examples of the linear prediction coefficient code C ⁇ linear prediction coefficients ⁇ 1, ⁇ 2, ..., a LSP code is a code corresponding to the LSP (Line Spectrum Pairs) parameter sequence corresponding to alpha p.
- LSP Line Spectrum Pairs
- the linear prediction analysis unit 112 outputs the linear prediction coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p to the spectrum envelope generation unit 113 and the linear prediction coefficient code C ⁇ to the multiplexing unit 117, respectively.
- the linear prediction analysis unit 112 performs, for example, a Levinson-Durbin algorithm on an inverse Fourier transform of the square of each value of the input frequency spectrum sequence X 0 , X 1 ,..., X N ⁇ 1. To obtain the linear prediction coefficient, encode the obtained linear prediction coefficient to obtain and output the linear prediction coefficient code C ⁇ , and linearize the quantized value of the linear prediction coefficient corresponding to the obtained linear prediction coefficient code C ⁇ . Prediction coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p are obtained and output.
- the generation of the linear prediction coefficient code C ⁇ by the linear prediction analysis unit 112 is performed by, for example, a conventional encoding technique.
- the conventional encoding technique is, for example, an encoding technique in which a code corresponding to the linear prediction coefficient itself is a linear prediction coefficient code C ⁇ , a linear prediction coefficient is converted into an LSP parameter, and a code corresponding to the LSP parameter is linearly predicted.
- a coding technique that uses a coefficient code C ⁇ a coding technique that converts a linear prediction coefficient into a PARCOR coefficient, and uses a code corresponding to the PARCOR coefficient as a linear prediction coefficient code C ⁇ .
- the linear prediction analyzer 112 the frequency spectrum sequence frequency domain transform section 111 has output X 0, X 1, ..., X in N-1, not linear from the sound signal in time is input to the encoding device 11 regions prediction coefficients ⁇ 1, ⁇ 2, ..., ⁇ p and the linear prediction coefficients ⁇ 1, ⁇ 2, ..., it may be output to obtain a linear prediction coefficient code C ⁇ corresponding to alpha p.
- the linear envelope coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p output from the linear prediction analysis unit 112 are input to the spectrum envelope generation unit 113.
- Spectrum envelope generating unit 113 linear prediction coefficients inputted alpha 1, alpha 2, ..., with alpha p, spectral envelope value H 0, H 1 obtained by the following equation (1), ..., H N -1 (A spectral envelope sequence of a time-series signal in a predetermined time interval) is obtained and output to the logarithmic envelope generation unit 114.
- k 0,..., N ⁇ 1, where exp is a real number, exp (•) is an exponential function with the Napier number as the base, and j is an imaginary unit.
- the spectrum envelope generation unit 113 generates a spectrum envelope sequence from the frequency spectrum sequence X 0 , X 1 ,..., X N-1 output from the frequency domain conversion unit 111 and the time domain sound signal input to the encoding device 11. H 0 , H 1 ,..., H N-1 may be obtained. In this case, without including the linear prediction analysis unit 112, the spectrum envelope generation unit 113 may obtain and output a code corresponding to the spectrum envelope sequence H 0 , H 1 ,..., H N-1 as the envelope code CL. .
- the linear prediction coefficient code C ⁇ corresponding to the linear prediction coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p obtained by the linear prediction analysis unit 112 is the spectral envelope sequence H 0 ,
- the logarithmic envelope generation unit 114 receives the spectral envelope sequences H 0 , H 1 ,..., H N ⁇ 1 output from the spectral envelope generation unit 113. Logarithmic envelope generator 114, the spectral envelope sequence H 0, H 1, ..., log spectrum from H N-1 envelope sequences L 0, L 1, ..., and outputs to obtain L N-1.
- the logarithmic envelope generation unit 114 performs the following steps I to IV to obtain and output logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 .
- Step II The logarithmic envelope generation unit 114 rounds each logarithmic value log 2 H k obtained in Step I to an integer value, and converts the sequence of each rounded integer value into a logarithmic spectrum envelope sequence L 0 , L 1 ,. Get as N-1 .
- Process rounding the logarithm log 2 H k an integer value for example, a process of obtaining the integer values by rounding off the first decimal place of the logarithm log 2 H k. That is, the logarithmic spectrum envelope sequence obtained here is an integer value sequence corresponding to the 2-base logarithm of each sample value of the spectrum envelope sequence.
- Step III The logarithmic envelope generation unit 114 obtains the sum of logarithmic spectrum envelope values L 0 , L 1 ,..., L N ⁇ 1 that are sample values of the logarithmic spectrum envelope sequence obtained in Step II. That is, the sum of the values included in the integer value sequence corresponding to the 2-base logarithm of each sample value of the spectrum envelope series is obtained.
- Step IV If the sum obtained in Step III is 0 (ie, the sum of the values included in the integer value sequence corresponding to the 2-base logarithm of each sample value of the spectrum envelope series is 0, the logarithmic envelope generation unit 114 is 0. In some cases, the logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 obtained in Step II are output to the signal smoothing unit 116. On the other hand, if the sum obtained in Step III is not 0 (that is, if the sum of the values included in the integer value sequence corresponding to the 2-base logarithm of each sample value of the spectrum envelope sequence is not 0), the logarithmic envelope is generated.
- the unit 114 adjusts a logarithmic spectrum envelope sequence L 0 , L 1 , that is adjusted according to a predetermined rule so that the sum is 0, for example, adjusted as shown in (a) and (b) below. ..., obtained as L N-1 and output to the signal smoothing unit 116.
- (a) If the sum obtained in Step III is greater than 0, the logarithmic spectrum envelope sequence L 0, L 1, ..., from the largest value among the L N-1 in this order, logarithmic spectrum envelope sequence L 0, L 1 , ..., so that the sum of the log-spectral envelope values contained in the L N-1 is 0, the logarithmic spectrum minus one value envelope sequence L 0, L 1, ..., and L N-1.
- a value obtained by subtracting one by one is defined as a logarithmic spectrum envelope sequence L 0 , L 1 ,..., L N ⁇ 1 .
- L k 0,1, ..., N-1
- Step a-4 L 0 , L 1, ..., L if (N-1) sum is zero the L 0, L 1, ..., signal smoothing unit series by L N-1 as the log spectral envelope sequence (Step a-5). If i + 1 exceeds N-1 in Step a-4, the process may return to Step a-1.
- Step III If the sum obtained in Step III is less than 0, the logarithmic spectrum envelope sequence L 0, L 1, ..., from the smallest value among the L N-1 in this order, logarithmic spectrum envelope sequence L 0, L 1 , ..., L logarithmic spectral envelope sequence what sum plus the value by 1 so that 0 of the logarithmic spectral envelope values contained in N-1 L 0, L 1 , ..., and L N-1. That is, if the sum of the values included in the integer value sequence obtained in Step III is smaller than 0, the sum of the values included in the integer value sequence becomes 0 in order from the smallest value in the integer value sequence.
- a value obtained by adding one by one is defined as a logarithmic spectrum envelope sequence L 0 , L 1 ,..., L N ⁇ 1 .
- the smaller the value L k the larger the absolute value
- Step b-4 If the sum of L 0 , L 1 ,..., L N-1 is not 0, i + 1 is set as a new i and the process returns to Step b-2 ( Step b-4), L 0 , L 1, ..., if the sum is 0 L N-1 the L 0, L 1, ..., a L N-1 to the signal smoothing unit 116 as a log spectral envelope sequence Output (Step b-5). If i + 1 exceeds N-1 in Step b-4, the process may return to Step b-1.
- logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N-1 may be output to the signal smoothing unit 116.
- the logarithmic envelope generator 114 logarithmic spectrum envelope sequence L 0, L 1 obtained in Step II, ..., L so that the sum of the N-1 becomes 0 L 0, L 1, ... , L N-1 adjusting at least some of the values of, it L 0 obtained by, L 1, ..., may be output L N-1 to the signal smoothing unit 116.
- the logarithmic envelope generation unit 114 logarithmic spectral envelope sequence L 0 obtained in II, L 1, ..., L N-1 log spectral envelope sequence L 0 a, L 1, ..., and outputs the L N-1 to the signal smoothing unit 116.
- the adjusted Adjust at least some of the integer values included in the integer value sequence so that the sum of the values included in the integer value sequence is 0, and convert the adjusted integer value sequence to the logarithmic spectrum envelope series L 0 , L 1 , ..., output to the signal smoothing unit 116 as L N-1 .
- the logarithmic spectrum envelope sequence L 0, L 1, ..., L N-1 log spectral envelope value L 0 contained, L 1, ..., such as the sum so as not to change as much as possible L N-1 is 0 is desirable to carry out the minimum adjustment, logarithmic spectrum envelope sequence L 0, L 1, ..., L N-1 log spectral envelope value L 0 contained, L 1, ..., such as significantly change L N-1 It is not preferable to make adjustments.
- the logarithmic spectrum envelope value that was a negative value was at least one of the logarithmic spectrum envelope values that were negative, and at least the logarithmic spectrum envelope value that was a positive value was a positive value
- the quantizing unit 115 receives the frequency spectrum series X 0 , X 1 ,..., X N ⁇ 1 output from the frequency domain transform unit 111.
- the quantization unit 115 is a quantized spectrum sequence that is a sequence based on the value of the integer part as a result of dividing each frequency spectrum value of the input frequency spectrum sequence X 0 , X 1 ,..., X N-1 by the quantization width.
- ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N ⁇ 1 are obtained and output to the signal smoothing unit 116.
- the quantization width may be determined in conventional manner, for example, the quantization unit 115 the frequency spectrum sequence was entered X 0, X 1, ..., so as to proportional to the maximum value of the energy or amplitude of the X N-1 An appropriate value may be determined as the quantization width.
- the quantization unit 115 obtains a code corresponding to the determined quantization width value, and outputs the obtained code to the multiplexing unit 117 as a quantization width code CQ.
- the quantizing unit 115 has the smallest quantization width in the signal smoothing unit 116 that can express the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 with a predetermined number of bits.
- the value may be obtained in a binary search to determine the quantization width value.
- the quantization unit 115 performs the process of obtaining the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and the quantization width and the process of the signal smoothing unit 116 described later a plurality of times.
- the quantization unit 115 outputs a quantization width code CQ corresponding to the finally determined quantization width to the multiplexing unit 117, and the signal smoothing unit 116 finally determines the quantized spectrum sequence ⁇ X 0. , ⁇ X 1 ,..., ⁇ X N ⁇ 1 are output to the multiplexing unit 117 as a signal code CX corresponding to the smoothed spectrum sequence.
- the signal smoothing unit 116 includes, for example, a smoothing unit 116a and a smoothed sequence encoding unit 116b.
- the signal smoothing unit 116 includes a quantized spectral sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 output from the quantizing unit 115 and a logarithmic spectral envelope sequence L 0 output from the logarithmic envelope generating unit 114. , L 1 ,..., L N-1 are input.
- the smoothing unit 116a of the signal smoothing unit 116 receives the input quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and inputs the logarithmic spectrum envelope sequence L 0 , L 1 , ..., smoothing based on L N-1 to obtain smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 and outputting them.
- the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X obtained by the smoothing sequence encoding part 116 b of the signal smoothing part 116 by the smoothing by the smoothing part 116 a of the signal smoothing part 116.
- the N-1 for example, every sample, such as four bits, and outputs to the multiplexing unit 117 to obtain the signal symbols CX expressed in fixed-length code of the number of bits determined in advance.
- Smoothing unit 116a performs smoothing of the signal smoothing unit 116, the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., a lower digit of the binary representation of the quantized spectral values of ⁇ X N-1, logarithmic spectral envelope sequence L 0, L 1, ..., carried out by operating at least based on the corresponding logarithm spectral envelope value among the L N-1.
- the smoothing unit 116a performs ⁇ X k with respect to ⁇ X k where L k corresponding to ⁇ X k (k is a sample number and k ⁇ ⁇ 0,..., N-1 ⁇ ) is a positive value.
- the predetermined rule Rs is a rule determined based on the sample number order and the digit number order so that the removed numerical value becomes a numerical value to be added without excess or deficiency.
- the "number that were removed” is a numerical value L k was removed from there in a positive ⁇ X k corresponding to the ⁇ X k
- a "numerical value to be added” is L k corresponding to the ⁇ X k
- the number to add to the negative ⁇ X k is the "number that were removed” is a numerical value L k was removed from there in a positive ⁇ X k corresponding to the ⁇ X k.
- the predetermined rule Rs is a numerical value of L k ′ digits removed from the least significant digit in the binary notation of ⁇ X k ′ corresponding to the positive logarithmic spectral envelope value L k ′ according to a predetermined procedure. Any one of the numerical values added to the -L k digits from the least significant digit in the binary notation of ⁇ X k corresponding to any logarithmic spectral envelope value L k ” that is a negative value there. However, k ", k' ⁇ ⁇ 0, ..., N-1 ⁇ is, and, k"'is.
- logarithm spectral envelope value L k is a positive value' ⁇ k corresponding to ⁇ X k '
- the number of digits in binary notation removed from is the same as the number of digits in binary notation added to ⁇ X k ” corresponding to the negative logarithmic spectral envelope value L k ′′ . to-one correspondence to the numbers to add a numeric value. that is, removed from the 'to ⁇ X k' corresponding to the logarithmic spectral envelope value L k which is positive All numbers are either digit numbers to be added to any of the corresponding logarithm spectral envelope value L k ⁇ X k is a negative value.
- the predetermined rule Rs illustrated in FIG. 3A to FIG. 3C is a quantization corresponding to each log spectrum envelope value (L 0 , L 1 , L 2 in the example of FIG. 3A) that is a positive value in the quantized spectrum sequence.
- Smoothing process smoothing unit 116a performs signal smoothing unit 116, the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., ⁇ X each quantized spectral values N-1 ⁇ X k corresponding log spectrum
- the process of dividing by the envelope value L k and the information contained in the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 are all smoothed spectrum sequences ⁇ X 0 , ⁇ X 1 , ..., ⁇ This is a process that makes the process included in X N-1 compatible.
- the original quantized spectrum sequence ⁇ X 0 ,..., ⁇ X 4 is a 6-bit precision range
- the smoothed spectrum sequence ⁇ X 0 ,. , ⁇ X 4 are substantially represented by a 4-bit range.
- the smoothing sequence coding section 116b of the signal smoothing unit 116 smoothed spectrum sequence was obtained by smoothing ⁇ X 0, ..., 4 bits each smoothed spectrum values ⁇ X k of ⁇ X 4 fixed
- the signal code CX can be obtained by encoding with the length.
- smoothing sequence coding section 116b of the signal smoothing unit 116 smoothes the spectrum sequence ⁇ X 0, ⁇ X 1, ..., ⁇ same number of bits all of the smoothed spectral values ⁇ X k of X N-1 Is not configured to obtain the signal code CX by encoding with the smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 of each smoothed spectrum value ⁇ X k for each sample position (ie, sample The signal code CX may be obtained by encoding with a predetermined number of bits for each number k).
- each smoothed spectrum value of the smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 is a predetermined bit for each range of sample positions (that is, for each range of sample number k).
- the signal code CX may be obtained by encoding with a number.
- the multiplexing unit 117 includes a linear prediction coefficient code C ⁇ or an envelope code CL (logarithmic spectrum envelope sequence L 0 , L 1 ,..., L, which is a code representing the spectrum envelope output from the linear prediction analysis unit 112 or the spectrum envelope generation unit 113.
- An envelope code CL which is a code that can identify N-1 , a quantization width code CQ output from the quantization unit 115, and a signal code CX output from the signal smoothing unit 116, and all these codes are received. Is output (for example, an output code obtained by connecting all the codes).
- the decoding device 12 includes a time domain transform unit 121, a spectrum envelope generation unit 123, a logarithmic envelope generation unit 124, an inverse quantization unit 125, a signal inverse smoothing unit 126, and a demultiplexing unit 127. Including.
- the spectrum envelope generation unit 123 and the logarithmic envelope generation unit 124 are included in the “logarithmic spectrum envelope decoding unit”.
- the output code output from the encoding device 11 is input to the decoding device 12 as an input code.
- the input code input to the decoding device 12 is input to the demultiplexing unit 127.
- the demultiplexing unit 127 receives the input code input to the decoding device 12.
- the demultiplexing unit 127 receives the input code for each frame, separates the input code, and supplies the linear prediction coefficient code C ⁇ or the envelope code CL, which is a code representing the spectrum envelope included in the input code, to the spectrum envelope generation unit 123.
- the quantization width code CQ included in the input code is output to the inverse quantization unit 125, and the signal code CX included in the input code is output to the signal inverse smoothing unit 126.
- the spectral envelope generation unit 123 receives the linear prediction coefficient code C ⁇ (envelope code CL) output from the demultiplexing unit 127.
- the spectrum envelope generation unit 123 decodes the linear prediction coefficient code C ⁇ by using, for example, a conventional decoding technique corresponding to the encoding method performed by the linear prediction analysis unit 112 of the encoding device 11, and linear prediction coefficients ⁇ 1 , ⁇ 2 , ..., ⁇ p is obtained.
- the spectral envelope generation unit 123 uses the obtained linear prediction coefficients ⁇ 1 , ⁇ 2 ,..., ⁇ p in the same procedure as the spectral envelope generation unit 113 of the encoding device 11 to perform spectral envelope sequences H 0 , H 1. ,..., H N-1 (that is, the envelope code is decoded to obtain a spectrum envelope sequence) and output to the logarithmic envelope generation unit 124.
- the conventional decoding technique is, for example, a linear prediction coefficient quantized by decoding the linear prediction coefficient code C ⁇ when the linear prediction coefficient code C ⁇ is a code corresponding to the quantized linear prediction coefficient.
- the linear prediction coefficient code C ⁇ is decoded to obtain the same LSP parameter as the quantized LSP parameter
- the linear prediction coefficient and the LSP parameter can be converted to each other, and the conversion process between the linear prediction coefficient and the LSP parameter is performed according to the input linear prediction coefficient code C ⁇ and information necessary for the subsequent processing. It is well known that From the above, what includes the decoding process of the linear prediction coefficient code C ⁇ and the conversion process performed as necessary is “decoding by a conventional decoding technique”.
- the spectrum envelope generating unit 113 the frequency spectrum sequence X 0 of the encoding device 11, X 1, ..., X N-1 and the time domain spectral envelope sequence H 0 from the sound signal, H 1, ..., H N -1
- the envelope code CL is decoded by the decoding method corresponding to the method in which the spectrum envelope generation unit 113 of the encoding device 11 obtains the envelope code CL.
- spectral envelope sequences H 0 , H 1 ,..., H N-1 are obtained.
- the linear prediction coefficient code C ⁇ is equivalent to the envelope code CL
- the envelope code CL is a code corresponding to the spectrum envelope.
- the above-described two processes that is, a process of obtaining a linear prediction coefficient by decoding the linear prediction coefficient code C ⁇ and obtaining a spectrum envelope sequence H 0 , H 1 ,..., H N-1 from the obtained linear prediction coefficient.
- the process of decoding the envelope code CL to obtain the spectrum envelope sequence H 0 , H 1 ,..., H N-1 is basically the spectrum envelope sequence H 0 , H 1 from the envelope code CL, which is the code corresponding to the spectrum envelope.
- ..., H N-1 is obtained. Therefore, the spectrum envelope generation unit 123 obtains spectrum envelope sequences H 0 , H 1 ,..., H N-1 from the envelope code CL, which is a code corresponding to the spectrum envelope.
- the logarithmic envelope generation unit 124 receives the spectral envelope sequences H 0 , H 1 ,..., H N ⁇ 1 output from the spectral envelope generation unit 123.
- the logarithmic envelope generation unit 124 uses the input spectral envelope sequences H 0 , H 1 ,..., H N-1 in the same procedure as the logarithmic envelope generation unit 114 of the encoding device 11, and performs the logarithmic spectral envelope sequence L. 0 , L 1 ,..., L N ⁇ 1 are obtained and output to the signal inverse smoothing unit 126.
- the integer value sequence corresponding to the 2 base logarithm of 1) is obtained and the sum of the values included in the integer value sequence is 0, the integer value sequence is represented as a logarithmic spectrum envelope sequence L 0 , L 1 ,. L N-1 and when the sum of the values included in the integer value sequence is not 0, the spectral envelope is set so that the sum of the values included in the adjusted integer value sequence is 0 according to a predetermined rule.
- At least a part of the integer values included in the integer value sequence corresponding to the two base logarithm of each sample value of the series H 0 , H 1 ,..., H N-1 is adjusted, and the adjusted integer value sequence is a logarithmic spectrum envelope. Obtained as a sequence L 0 , L 1 ,..., L N ⁇ 1 .
- the signal inverse smoothing unit 126 includes, for example, a smoothed sequence decoding unit 126b and an inverse smoothing unit 126a.
- the signal inverse smoothing unit 126 receives the signal code CX output from the demultiplexing unit 127 and the logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N-1 output from the logarithmic envelope generation unit 124.
- the smoothing sequence decoding section 126b of the signal inverse smoothing unit 126 decodes the inputted signal coding CX smoothed spectrum sequence ⁇ X 0, ⁇ X 1, ..., to give a ⁇ X N-1 output To do.
- the signal code CX has the same configuration as the signal code CX output from the signal smoothing unit 116 of the encoding device 11, that is, the smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 . It is represented by a fixed-length code having a predetermined number of bits corresponding to each sample to Xk . Therefore, smoothing sequence decoding unit 126b, by performing the fixed-length decoding on the signal code CX, smoothed spectrum sequence ⁇ X 0, ⁇ X 1, ..., are sample values of ⁇ X N-1 Smoothed spectrum values ⁇ Xk can be obtained.
- the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ obtained by the inverse smoothing part 126a of the signal inverse smoothing part 126 by the decoding by the smoothed series decoding part 126b of the signal inverse smoothing part 126
- the quantized spectral sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N ⁇ 1 is obtained and output to the inverse quantization unit 125.
- Inverse smoothing inverse smoothing section 126a of the signal inverse smoothing unit 126 performs the smoothed spectrum sequence ⁇ X 0, ⁇ X 1, ..., the lower the binary representation of the smoothed spectrum values of ⁇ X N-1
- the digit is manipulated based at least on the corresponding logarithmic spectral envelope value of the logarithmic spectral envelope sequence L 0 , L 1 ,..., L N ⁇ 1 .
- Quantized spectrum value obtained by taking a numerical value of -L k digits (ie, the same number of digits as the absolute value of the logarithmic spectrum envelope value L k ) from the least significant digit in the binary notation of the smoothed spectrum value ⁇ X k ⁇ X k and when the logarithmic spectral envelope value L k is positive, L k digits from the least significant digit in the binary notation of the smoothed spectral value ⁇ X k (ie, the same digit as the logarithmic spectral envelope value L
- the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 is obtained by adding the removed numerical values without excess or deficiency from the predetermined rule Rr.
- the inverse smoothing unit 126a removes the numerical value of ⁇ L k digits from the least significant digit in the binary notation of ⁇ X k for ⁇ X k where L k corresponding to ⁇ X k is a negative value.
- ⁇ X k a quantized spectral values ⁇ X k, for ⁇ X k corresponding to L k is a positive value ⁇ X k, in accordance with a predetermined rule Rr so as to correspond to the smoothing processing of the smoothing unit 116a, ⁇ X k Quantized spectrum value ⁇ Xk is the value obtained by adding L k digits to the least significant digit in binary notation, and if Lk corresponding to ⁇ Xk is 0, ⁇ Xk is quantized with spectral values ⁇ X k, the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., obtaining ⁇ X N-1.
- the predetermined rule Rr is a rule determined based on the sample number order and the digit number order so that the removed numerical value becomes a numerical value to be added without excess or deficiency.
- the "number that were removed” is a numerical value L k was removed from the ⁇ X k is a negative value corresponding to the ⁇ X k
- a "numerical value to be added” is L k corresponding to the ⁇ X k It is a numerical value added to ⁇ X k which is a positive value.
- the predetermined rule Rr is a numerical value of ⁇ L k ′ digits removed from the least significant digit in the binary notation of ⁇ X k ′ corresponding to the negative logarithmic spectrum envelope value L k ′ according to a predetermined procedure. Is any numerical value added to L k ” digits from the least significant digit in binary notation of ⁇ X k” corresponding to any logarithmic spectral envelope value L k ” which is a positive value. Where k ′′, k′ ⁇ ⁇ 0,..., N ⁇ 1 ⁇ and k ′′ ⁇ k ′.
- the predetermined rule Rr corresponds to the above-mentioned predetermined rule Rs.
- the de-smoothing performed by the de-smoothing unit 126a of the signal de-smoothing unit 126 according to a predetermined rule Rr is determined by the smoothing unit 116a of the signal smoothing unit 116 described above. It must be the inverse of smoothing according to the rule Rs: ⁇ X k ' corresponding to the negative logarithmic spectral envelope value L k' The number of digits in the binary notation is the same as the number of digits in the binary notation added to ⁇ X k ′′ corresponding to the logarithmic spectral envelope value L k ′′ which is a positive value.
- the predetermined rule Rr illustrated in FIGS. 4A to 4C is predetermined to correspond to the smoothing process of the smoothing unit 116a of the signal smoothing unit 116 of the encoding device 11 illustrated in FIGS. 3A to 3C. It is a rule.
- 4A X 3 is a negative value , ⁇ X 4 ), the digit numbers removed from the smoothed spectrum series in ascending order of the digits, and in the same digit, the sample number k in descending order is the quantized spectrum value before digit shift (FIG. 4B).
- ⁇ X 0 ', ⁇ X 1 ', ⁇ X 2 ' the smoothing corresponding to the positive logarithmic spectral envelope value is in order, starting from the largest digit, and in the same digit from the smallest sample number k.
- This is a rule to be added to the normalized spectral value ( ⁇ X 0 , ⁇ X 1 , ⁇ X 2 in the example of FIG. 4A).
- the predetermined rule Rr described with reference to FIGS. 4A to 4C is an example and does not limit the present invention. That is, this example is optional for the present invention.
- the predetermined rule Rr above the order of numbers removed, the least significant digit of the numerical binary 1 representation of the smoothed spectral values ⁇ X 4 0,0,1,1,1,1 First order (1), smoothed spectrum value ⁇ X 3 binary notation 0,0,1,0,0,0 numerical value 0 of the least significant digit is second order (2), smoothed spectrum value ⁇ X 4 binary notation 0,0,1,1,1,1 2nd digit number 1 in the third order (3), smoothed spectrum value ⁇ X 3 binary notation 0, 0,1,0,0,0 The second digit from the least significant digit is 0 in the fourth order (4), and the smoothed spectrum value ⁇ X 4 is expressed in binary notation 0,0,1,1,1,1 The numerical value 1 of the third digit from the least significant is the fifth order (5).
- the smoothed spectral value ⁇ X 4 binary notation 0,0
- the smoothed spectral value ⁇ X 3 in binary notation 0,0,1,0 , 0,0 adds the least significant digit 0 to this digit.
- the binary notation 0,0,1,1,1, of the smoothed spectral value ⁇ X 4 The number 1 of the 2nd digit from the lowest in 1 is added to this digit.
- the smoothed spectrum value ⁇ X 3 binary notation 0,0,1,0,0 Add the value 0 of the second digit from the least significant 0 to this digit.
- Inverse smoothing processing inverse smoothing section 126a of the signal inverse smoothing unit 126 performs the smoothed spectrum sequence ⁇ X 0, ⁇ X 1, ..., corresponding to each smoothed spectrum values ⁇ X k of ⁇ X N-1
- the process of multiplying the logarithmic spectral envelope value L k to be performed and all the information contained in the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 are quantized spectrum series ⁇ X 0 , ⁇ X 1 , .., ⁇ X N-1 is a process that achieves both, and is a process corresponding to the smoothing process performed by the smoothing unit 116a of the signal smoothing unit 116 of the encoding device 11.
- the smoothing sequence decoding unit 126b of the signal inverse smoothing unit 126 may perform a decoding process corresponding to the smoothing sequence encoding unit 116b of the signal smoothing unit 116 of the encoding device 11. That is, the smoothing sequence decoding unit 126b of the signal de-smoothing unit 126 decodes the signal code CX with the same number of bits for all samples, and smooths the spectral sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N- be configured to obtain the smoothed spectrum values ⁇ X k of 1, advance the number-determined bit by decoding the signal code CX smoothed spectrum sequence for each sample position ⁇ X 0, ⁇ X 1, ..., ⁇ X N-1 of be configured to obtain the smoothed spectrum values ⁇ X k, smoothed spectrum sequence number of bits which is predetermined for each range sample position decodes the signal code CX ⁇ X 0, ⁇ X 1, ..., may be configured to obtain the
- the inverse quantization unit 125 output by the quantization width code CQ demultiplexing unit 127, the quantized spectral sequence ⁇ X 0 signal inverse smoothing section 126 is output, ⁇ X 1, ..., ⁇ X N-1 And are input.
- the inverse quantization unit 125 decodes the input quantization width code CQ to obtain a quantization width. Further, the inverse quantization unit 125 multiplies each quantized spectrum value of the input quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and the quantization width obtained by decoding.
- decoded spectrum sequence X 0 has a sequence of samples, X 1, ..., and outputs the time domain conversion unit 121 obtains X N-1. That is, the inverse quantization unit 125, the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., ⁇ X N-1 the inverse quantization to the decoded spectral sequence X 0, X 1, ..., X N-1 ( Frequency (Region spectrum series) is obtained and output to the time domain converter 121.
- the inverse quantization unit 125 dequantizes the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and decodes a decoded spectrum sequence that is a sequence of frequency domain spectra decoded in a predetermined time interval.
- X 0 , X 1 ,..., X N-1 (frequency domain spectrum series) are obtained and output to the time domain transform unit 121.
- the time domain transform unit 121 receives the decoded spectrum sequence X 0 , X 1 ,..., X N ⁇ 1 output from the inverse quantization unit 125.
- the time domain transform unit 121 supplies the decoded spectrum sequence X 0 , X 1 ,..., X N ⁇ 1 , which is a sequence of N-point samples in the frequency domain, to the frequency domain transform unit 111 of the encoding device 11 for each frame.
- a corresponding inverse transform (for example, inverse MDCT) is used to convert the signal into a time domain signal to obtain a sound signal (decoded sound signal) in units of frames and output it as an output signal.
- a time domain conversion unit 121 first performs inverse transform corresponding to the filter processing and companding processing performed by the encoding device 11 on the decoded spectrum sequence X 0 , X 1 ,..., X N ⁇ 1 , and the sequence after inverse transform is performed in the time domain. Is converted into a signal and output. That is, the time domain conversion unit 121 converts the frequency domain spectrum sequence into the time domain to obtain a decoded time series signal in a predetermined time interval.
- the signal code CX included in the input code does not include an error
- the linear prediction coefficient code C ⁇ (code representing the spectral envelope) included in the input code includes an error
- the value of the smoothed spectrum in which the error occurs in the code among the smoothed spectrum sequence obtained by decoding the signal code CX causes an error, but no error occurs in the value of the smoothed spectrum in which no error has occurred in the code. That is, the error of the signal code CX affects only the value of the smoothed spectrum corresponding to the bit in which the error occurs in the signal code CX. Further, no matter how much an error occurs in the signal code CX, no error occurs in the number of samples of the quantized spectrum sequence.
- an encoding device that obtains a logarithmic spectrum envelope sequence by vector quantization as a method for directly obtaining a logarithmic spectrum envelope sequence from a frequency spectrum sequence, and a decoding device corresponding to the encoding device will be described.
- the encoding device 21 of the second embodiment includes a logarithmic envelope encoding unit 214 instead of the linear prediction analysis unit 112, the spectrum envelope generation unit 113, and the logarithmic envelope generation unit 114 in the encoding device 21 of the first embodiment. Except for this, the configuration is the same as that of the encoding device 11 of the first embodiment. Hereinafter, differences from the encoding device 11 of the first embodiment will be described. Hereinafter, the same reference numerals as those in the first embodiment are used to simplify the description of portions common to the first embodiment.
- the logarithmic envelope encoding unit 214 receives the frequency spectrum series X 0 , X 1 ,..., X N ⁇ 1 output from the frequency domain conversion unit 111.
- Logarithmic envelope coding unit 214, the frequency spectrum sequence X 0 input, X 1, ..., X N -1 to the logarithmic spectrum envelope sequence L 0 based on the frequency spectrum values contained, L 1, ..., L N- 1 obtains, logarithmic spectrum envelope sequence L 0, L 1, ..., a L N-1 to the signal smoothing unit 116, and outputs the envelope code CL is a code corresponding to the logarithmic spectrum envelope sequence to the multiplexing unit 117.
- logarithmic envelope encoding unit 214 obtains logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 .
- a method of performing vector quantization will be exemplified.
- a plurality of logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 composed of N integers whose sum is zero is stored in a storage unit (not shown) in the log envelope encoder 214.
- logarithmic spectrum envelope sequence L 0 of each candidate L 1, ..., L and N-1
- logarithmic spectrum envelope sequence L 0 of each candidate L 1, ..., each logarithm spectral envelope values of L N-1 spectral envelope sequence H 0, which is a power series of 2 and index, H 1, ..., a H N-1, logarithmic spectrum envelope sequence L 0 of each candidate, L 1, ..., corresponding to L N-1
- a storage unit (not shown) in the logarithmic envelope encoding unit 214 stores logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N-1 candidates and the logarithmic spectrum envelope sequences L 0 , L 1 ,.
- the logarithmic envelope encoding unit 214 is a frequency spectrum sequence X 0 , to which candidates of spectrum envelope sequences H 0 , H 1 ,..., H N ⁇ 1 among a plurality of sets stored in advance in the storage unit are input.
- X 1, ..., spectral envelope sequence H 0, H 1 corresponding to X N-1 time-series signal for a predetermined time interval
- ... selects a set corresponding to H N-1
- the selected set of codes envelope code CL (spectrum Obtained as a code representing an envelope) and output.
- logarithmic envelope coding unit 214 For example, logarithmic envelope coding unit 214, spectral envelope sequence H 0, which is stored in the storage portion, H 1, ..., for each of the H N-1, the input frequency spectrum sequence X 0, X 1, ..., X each frequency spectrum in N-1 values X k and the spectral envelope sequence H 0, H 1, ..., determine the energy of the ratio of sequences with the corresponding spectral envelope values H k in H N-1, energy is minimum spectral envelope sequence H 0, H 1 to be, ..., logarithmic spectrum envelope sequence L 0 corresponding to H N-1, L 1, ..., and outputs the L N-1 and the envelope code CL.
- the multiplexing unit 117 replaces the linear prediction coefficient code C ⁇ or the envelope code CL output from the linear prediction analysis unit 112 or the spectrum envelope generation unit 113 of the first embodiment as a code representing the spectrum envelope, and a logarithmic envelope coding unit The operation is the same as that of the multiplexing unit 117 of the first embodiment, except that the envelope code CL output by 214 is used.
- the decoding device 22 of the second embodiment is the same as that of the first embodiment, except that it includes a logarithmic envelope decoding unit 224 instead of the spectrum envelope generation unit 123 and the logarithmic envelope generation unit 114 in the decoding device 12 of the first embodiment.
- the configuration is the same as that of the decoding device 12.
- differences from the decoding device 12 of the first embodiment will be described.
- the demultiplexing unit 127 receives the input code input to the decoding device 12.
- the demultiplexing unit 127 receives the input code for each frame, demultiplexes the input code, and supplies the envelope code CL, which is a code representing the spectral envelope included in the input code, to the logarithmic envelope decoding unit 224.
- the quantization width code CQ is output to the inverse quantization unit 125, and the signal code CX included in the input code is output to the signal inverse smoothing unit 126.
- the storage unit (not shown) in the logarithmic envelope decoding unit 224 has a sum total of 0, which is the same as that stored in the storage unit (not shown) of the logarithmic envelope encoding unit 214 of the corresponding encoding device 21 in advance. consisting of N integers logarithm spectral envelope sequence L 0, L 1, ..., L the N-1 of the plurality of candidate, logarithmic spectrum envelope sequence L 0, L 1 of each candidate, ..., L N-1 And a set of codes corresponding to each series is stored.
- logarithmic envelope decoding unit 224 receives the envelope code CL output from the demultiplexing unit 127.
- the logarithmic envelope decoding unit 224 obtains logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N-1 corresponding to the input envelope code CL from the storage unit and outputs them to the signal inverse smoothing unit 126.
- the logarithmic envelope decoding unit 224 selects a pair whose code corresponds to the envelope code CL from among a plurality of sets stored in advance in the storage unit, and sets the logarithmic spectrum envelope sequence candidate of the selected set as a logarithm.
- Spectral envelope sequences L 0 , L 1 ,..., L N ⁇ 1 are obtained and output to the signal inverse smoothing unit 126.
- both the encoding device 11 of the first embodiment and the encoding device 21 of the second embodiment basically correspond to the encoding device 31 shown in FIG. 7A.
- the encoding device 31 includes a frequency domain transform unit 111, a logarithmic spectrum envelope generation unit 314, a quantization unit 115, a signal smoothing unit 116, and a multiplexing unit 117.
- the logarithmic spectrum envelope generation unit 314 is an integer value sequence corresponding to a 2-base logarithm of each sample value of a spectrum envelope sequence corresponding to a time series signal in a predetermined time interval, and is an integer value sequence whose sum is zero.
- logarithmic spectrum envelope sequence L 0, L 1, ..., a L N-1, and outputs the obtained the envelope code CL is a code capable of identifying the logarithmic spectrum envelope sequence, the.
- the functional configuration including the linear prediction analysis unit 112 (envelope encoding unit), the spectrum envelope generation unit 113, and the logarithmic envelope generation unit 114 corresponds to the logarithmic spectrum envelope generation unit 314.
- the functional configuration including the logarithmic envelope encoding unit 214 corresponds to the logarithmic spectrum envelope generation unit 314.
- the signal smoothing unit 116 performs ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N ⁇ 1 on the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,.
- L k corresponding to k L k digits from the least significant digit in binary notation of ⁇ X k a smoothed spectrum values ⁇ X k and minus the numerical value only, ⁇ X k L k corresponding to is a negative value for the ⁇ X k, in accordance with a predetermined rule, the lowest in the binary representation of ⁇ X k and the ones you add a numeric value only -L k digits in order of magnitude as the smoothed spectrum value ⁇ X k, ⁇ if X k L k corresponding to is zero, ⁇ X k and smoothed spectrum
- the decoding device 12 of the first embodiment and the decoding device 22 of the second embodiment correspond to the decoding device 32 shown in FIG. 7B.
- the decoding device 32 includes a time domain conversion unit 121, a logarithmic spectrum envelope decoding unit 324, an inverse quantization unit 125, a signal inverse smoothing unit 126, and a demultiplexing unit 127.
- the logarithmic spectrum envelope decoding unit 324 decodes the input envelope code CL, is an integer value sequence corresponding to the 2-base logarithm of each sample value of the spectrum envelope sequence, and is an integer value sequence whose sum is 0.
- the logarithmic spectrum envelope sequence L 0 , L 1 ,..., L N-1 is obtained.
- the functional configuration including the spectrum envelope generation unit 123 and the logarithmic envelope generation unit 124 corresponds to the logarithmic spectrum envelope decoding unit 324.
- the functional configuration including the logarithmic envelope decoding unit 224 corresponds to the logarithmic spectrum envelope decoding unit 324.
- the signal inverse smoothing unit 126 decodes a signal code that is a fixed-length code to obtain a smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 in a predetermined time interval, and a smoothed spectrum series For ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 , L k corresponding to ⁇ X k (k is a sample number and k ⁇ ⁇ 0, ..., N-1 ⁇ ) is negative ⁇ for X k, and quantized spectral values ⁇ X k and minus the number from the least significant digit by -L k digits in binary notation ⁇ X k, a L k is a positive value corresponding to ⁇ X k ⁇ for X k, according to a predetermined rule, a material obtained by adding a numerical value only L k digits to the least significant digit in the binary representation of ⁇
- the predetermined rule is a rule determined based on the sample number order and the digit number order so that the removed numerical value is a numerical value to be added without excess or deficiency.
- Inverse quantization unit 125 the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., ⁇ X (N-1) dequantized frequency domain spectrum sequence X 0, X 1, ..., to obtain X N-1 Output. That is, the inverse quantization unit 125 dequantizes the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and performs a frequency domain spectrum which is a sequence of frequency domain spectra decoded in a predetermined time interval.
- a sequence X 0 , X 1 ,..., X N-1 is obtained.
- the time domain conversion unit 121 converts the frequency domain spectrum series X 0 , X 1 ,..., X N-1 into the time domain, and obtains and outputs an output signal that is a decoded time series signal in a predetermined time interval.
- an input signal that is a time-series signal such as a sound signal is input, and the encoding device 11 of the first embodiment, the encoding device 21 of the second embodiment, or the code of the third embodiment
- the smoothing device 41 that outputs the smoothed spectrum sequences ⁇ X 0 , ⁇ X 1 , ..., X N-1 obtained by the smoothing unit 116a of the signal smoothing unit 116 of the converting apparatus 31 may be configured.
- the smoothing device 41 includes a frequency domain transform unit 111, a logarithmic spectrum envelope generation unit 414, a quantization unit 115, a smoothing unit 116a, and a multiplexing unit 117.
- the logarithmic spectrum envelope generation unit 414 is an integer value sequence corresponding to a 2-base logarithm of each sample value of a spectrum envelope sequence corresponding to a time series signal in a predetermined time interval, and is an integer value sequence whose sum is zero. , Obtain logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 and output them.
- the logarithmic spectrum envelope generation unit 414 may have the same configuration as the logarithmic spectrum envelope generation unit 413 of the third embodiment, or a functional configuration that obtains and outputs an envelope code CL from the functional configuration of the logarithmic spectrum envelope generation unit 413. It may be excluded.
- the smoothing unit 116a performs ⁇ X k (k) for the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 obtained by quantizing each sample value of the frequency domain spectrum sequence of the time series signal.
- the predetermined rule is a rule determined based on the sample number order and the digit number order so that the removed numerical value is a numerical value to be added without excess or deficiency. If the logarithmic spectrum envelope generation unit 414 outputs the envelope code CL, the smoothing device 41 may output the envelope code CL.
- the smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., X N-1 output from the smoothing device 41 are input, and the smoothed spectrum series ⁇ X 0 , ⁇ X 1 are input.
- ,..., .About.X N-1 may be configured as an inverse smoothing device 42 that performs inverse smoothing.
- the inverse smoothing device 42 includes an inverse smoothing unit 126a, an inverse quantization unit 125, and a time domain conversion unit 121.
- the inverse smoothing device 42 to which the envelope code CL output from the smoothing device 41 is input further includes the logarithmic spectrum envelope decoding unit 324 described above.
- the inverse smoothing device 42 can acquire logarithmic spectrum envelope sequences L 0 , L 1 ,..., L N ⁇ 1 , and smoothing spectrum sequences ⁇ X 0 , ⁇ X 1 ,.
- ⁇ 1 is output, the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 is input to the inverse smoothing unit 126a.
- the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 and the envelope code CL are output from the smoothing device 41, the smoothed spectrum series ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 is input to the inverse smoothing unit 126a, and the envelope code CL is input to the logarithmic spectrum envelope decoding unit 324.
- the logarithmic spectrum envelope decoding unit 324 to which the envelope code CL is input obtains the logarithmic spectrum envelope sequence L 0 , L 1 ,..., L N-1 by decoding the envelope code CL as described above, and the logarithmic spectrum envelope.
- the series L 0 , L 1 ,..., L N-1 are input to the inverse smoothing unit 126a.
- Inverse smoothing unit 126a is smoothed spectrum sequence ⁇ X 0, ⁇ X 1, ..., ⁇ X N-1 and the logarithmic spectral envelope sequence L 0, L 1, ..., as input L N-1, as described above
- inverse smoothing of the smoothed spectrum sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 using the logarithmic spectrum envelope series L 0 , L 1 , ..., L N-1 and the quantized spectrum
- the sequence ⁇ X 0 , ⁇ X 1 , ..., ⁇ X N-1 is obtained and output.
- the inverse smoothing unit 126a is a logarithmic spectrum envelope sequence L that is an integer value sequence corresponding to the 2 base logarithm of each sample value of the spectrum envelope sequence in a predetermined time interval and is an integer value sequence in which the sum is zero.
- the predetermined rule is a rule determined based on the sample number order and the digit number order so that the removed numerical value is a numerical value to be added without excess or deficiency.
- Inverse quantization unit 125 the quantized spectral sequence ⁇ X 0, ⁇ X 1, ..., ⁇ X (N-1) dequantized frequency domain spectrum sequence X 0, X 1, ..., to obtain X N-1 Output. That is, the inverse quantization unit 125 dequantizes the quantized spectrum sequence ⁇ X 0 , ⁇ X 1 ,..., ⁇ X N-1 and performs a frequency domain spectrum which is a sequence of frequency domain spectra decoded in a predetermined time interval.
- a sequence X 0 , X 1 ,..., X N-1 is obtained.
- the time domain conversion unit 121 converts the frequency domain spectrum series X 0 , X 1 ,..., X N-1 into the time domain, and obtains and outputs an output signal that is a decoded time series signal in a predetermined time interval.
- the smoothing sequence encoding unit 116b of the signal smoothing unit 116 of the encoding devices 11, 21, 31 of each of the above embodiments encodes each sample of the smoothed spectrum sequence obtained by the smoothing with a fixed length.
- the signal code CX is obtained.
- the signal code CX may be obtained by variable length coding.
- the smoothed sequence decoding unit 126b of the signal inverse smoothing unit 126 of the decoding devices 12, 22, and 32 may perform variable length decoding of the signal code CX to obtain a smoothed spectrum sequence.
- a sound signal (time-series signal) input to the encoding devices 11, 21, 31 and the smoothing device 41
- sounds such as voice and music are collected by a microphone, thereby
- the digital signal which AD-converted the analog signal showing the sound obtained was illustrated.
- a sound signal obtained by AD converting an analog signal representing sound obtained by other means into a digital signal may be input to the encoding devices 11, 21, 31 or the smoothing device 41.
- a sound signal which is a digital signal corresponding to an analog signal representing sound may be input to the encoding devices 11, 21, 31 or the smoothing device 41.
- a sound signal which is a digital signal representing sound may be input to the encoding devices 11, 21, 31 or the smoothing device 41. That is, a method for obtaining a sound signal is arbitrary.
- An analog signal representing sound may be input to the encoding devices 11, 21, 31 or the smoothing device 41.
- a digital signal obtained by A / D-converting the analog signal by the encoding device 11, 21, 31, or the smoothing device 41 may be used as the sound signal. That is, it is also optional that a digital signal is input to the encoding devices 11, 21, 31 or the smoothing device 41.
- a time-domain sound signal is input to the encoders 11, 21, 31 or the smoothing device 41, and the time-domain sound signals are frequency spectrum sequences X 0 , X 1 ,. Converted to -1 .
- frequency spectrum sequences X 0 , X 1 ,..., X N-1 may be input to the encoding devices 11, 21, 31 or the smoothing device 41.
- the encoding device 11, 21, 31 or the smoothing device 41 may not include the frequency domain transform unit 111. That is, the frequency domain transform unit 111 is an optional element for the encoding devices 11, 21, 31 or the smoothing device 41.
- the decoding device 12, 22, 32 or reverse smoothing device 42 is decoded spectrum sequence X 0, X 1,, ... , X N-1 a sound signal in units of frames is converted into a time domain signal And output it as an output signal.
- the decoding devices 12, 22, 32, or the inverse smoothing device 42 may output the decoded spectrum sequences X 0 , X 1 ,..., X N-1 as output signals.
- the decoding devices 12, 22, 32 or the inverse smoothing device 42 do not have to include the time domain conversion unit 121. That is, the time domain conversion unit 121 is an optional element for the decoding devices 12, 22, 32, or the inverse smoothing device 42.
- the decoding devices 12, 22, 32, or the inverse smoothing device 42 may output the function values of the decoded spectrum sequences X 0 , X 1 ,..., X N ⁇ 1 as output signals.
- the output signal output from the decoding device 12, 22, 32 or the inverse smoothing device 42 may be used as an input signal for other processing without being reproduced from the speaker. That is, the output signal output from the decoding device 12, 22, 32 or the inverse smoothing device 42 is optionally reproduced from the speaker.
- smoothing unit 116a of the smoothing unit 116a or smoothing device 41 of the signal smoothing unit 116 ⁇ X k for all ⁇ X k corresponding L k is positive value
- ⁇ X k of binary for all ⁇ X k and smoothed spectrum values ⁇ X k and minus the number from the least significant digit by L k digits is L k corresponding to ⁇ X k is a negative value in the notation in accordance with a predetermined rule
- ⁇ X k is preferably a value obtained by adding a numerical value by ⁇ L k digits to the least significant digit in the binary notation to be a smoothed spectrum value ⁇ X k .
- the smoothing unit 116a of the smoothing unit 116a or smoothing device 41 of the signal smoothing unit 116 ⁇ X corresponding to k L k is the ⁇ X k of a portion which is positive, a ⁇ X k two as the smoothed spectrum values ⁇ X k without removing a number from the least significant digit by L k digits in adic notation, ⁇ X corresponding to k L k is the part of the ⁇ X k is a negative value, a predetermined
- the smoothed spectrum value ⁇ X k may be used as it is without adding a numerical value by ⁇ L k digits to the least significant digit in the binary notation of ⁇ X k .
- inverse smoothing section 126a of the inverse smoothing unit 126a or reverse smoothing device 42 of the signal inverse smoothing unit 126 for all ⁇ X k L k is negative value corresponding to ⁇ X k, ⁇ the minus the number from the least significant digit by -L k digits in binary notation X k and quantized spectral values ⁇ X k, L k corresponding to ⁇ X k is for all ⁇ X k which is positive
- a value obtained by adding a numerical value by L k digits to the least significant digit in binary notation of ⁇ X k is preferably a quantized spectral value ⁇ X k .
- inverse smoothing section 126a of the inverse smoothing unit 126a or reverse smoothing device 42 of the signal inverse smoothing unit 126 for ⁇ X k of a portion L k corresponding to ⁇ X k has a negative value, - as a quantized spectral values ⁇ X k without removing a number from the least significant digit by -L k digits in binary notation X k, L k corresponding to ⁇ X k is part which is positive ⁇ X k According to a predetermined rule, the quantized spectral value ⁇ X k may be used as it is without adding a numerical value of L k digits to the least significant digit in the binary notation of ⁇ X k .
- the time series signal may be a time series signal other than a sound signal (for example, a moving image signal, a seismic wave signal, a biological signal, etc.). That is, it is also arbitrary that the time series signal is a sound signal.
- a sound signal for example, a moving image signal, a seismic wave signal, a biological signal, etc.
- Each of the above devices is a general-purpose or dedicated computer including a processor (hardware processor) such as a CPU (central processing unit) and a memory such as a random-access memory (RAM) and a read-only memory (ROM). Is configured by executing a predetermined program.
- the computer may include a single processor and memory, or may include a plurality of processors and memory.
- This program may be installed in a computer, or may be recorded in a ROM or the like in advance.
- some or all of the processing units are configured using an electronic circuit that realizes a processing function without using a program, instead of an electronic circuit (circuitry) that realizes a functional configuration by reading a program like a CPU. May be.
- An electronic circuit constituting one device may include a plurality of CPUs.
- a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.
- This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
- a computer that executes such a program first stores a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device.
- the computer reads a program stored in its own storage device, and executes a process according to the read program.
- the computer may read the program directly from the portable recording medium and execute processing according to the program, and each time the program is transferred from the server computer to the computer.
- the processing according to the received program may be executed sequentially.
- the above-described processing may be executed by a so-called ASP (Application Service Provider) type service that does not transfer a program from the server computer to the computer but implements a processing function only by the execution instruction and result acquisition. Good.
- ASP Application Service Provider
- the processing functions of this apparatus are not realized by executing a predetermined program on a computer, but at least a part of these processing functions may be realized by hardware.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1とその包絡符号とを得る。量子化スペクトル系列^X0,^X1,…,^XN-1について、Lkが正値である^Xkの最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、予め定めた規則に従って、Lkが負値である^Xkの最下位桁に-Lk桁だけ数値を追加したものを~Xkとし、Lkが0である場合には、^Xkを~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、この各サンプルを固定長で符号化して信号符号を得る。
Description
この発明は、音信号などの時系列信号の符号化技術などの信号処理技術に関し、特に、音信号などの時系列信号の周波数スペクトルに由来するサンプル列を、そのスペクトル包絡値に基づいて平滑化、あるいは逆平滑化する技術に関する。
一般的に、時系列信号などのサンプル列を圧縮符号化する場合には、そのサンプル列に対して線形予測分析を行い、それによって得られる線形予測係数に基づいて符号長を適切に割り当てる。これにより、少ない符号量で復号信号の歪みが小さくなるような効率のよい圧縮符号化を行う。音声音響信号のサンプル列を圧縮符号化する従来技術として非特許文献1の技術がある。
図9Aは、非特許文献1の符号化装置1011の機能構成図である。非特許文献1の符号化装置1011は、入力された音声音響信号のサンプル系列を周波数スペクトル系列X0,X1,…,XN-1(ただし、Nは正の整数)に変換する周波数領域変換部1111と、周波数スペクトル系列X0,X1,…,XN-1から線形予測係数α1,α2,…,αp(ただし、pは線形予測の次数であり、2以上の整数)と当該線形予測係数α1,α2,…,αpに対応する所定ビット数の線形予測係数符号Cαを得る線形予測分析部112と、線形予測係数α1,α2,…,αpに対応するスペクトル包絡系列H0,H1,…,HN-1を得るスペクトル包絡生成部1113と、周波数スペクトル系列X0,X1,…,XN-1に基づく系列の各サンプルを量子化幅で除算した結果の整数部分の系列である量子化スペクトル系列を得て、量子化スペクトル系列の各サンプルに当該サンプルに対応するスペクトル包絡の値に応じて符号長を割り当てて符号化して信号符号CXを得るとともに量子化幅に対応する符号である所定ビット数の量子化幅符号CQを得る量子化部1115と、線形予測係数符号Cαと信号符号CXと量子化幅符号CQとを多重化し、符号化装置1011の出力符号を得る多重化部1117とを含む。
図9Bは非特許文献1の復号装置1012の機能構成図である。非特許文献1の復号装置1012は、符号化装置1011が出力した出力符号を入力符号として得て、入力符号に含まれる量子化幅符号CQを逆量子化部1125に、入力符号に含まれる線形予測係数符号Cαをスペクトル包絡生成部1123に、入力符号に含まれる信号符号CXを逆量子化部1125に、それぞれ出力する多重分離部1127と、線形予測係数符号Cα(スペクトル包絡を表す符号)に対応するスペクトル包絡系列H0,H1,…,HN-1を得るスペクトル包絡生成部1123と、スペクトル包絡系列H0,H1,…,HN-1中の各サンプルの値に応じた符号長の信号符号CXを復号して量子化スペクトル系列の各サンプルの値を得て、量子化幅符号CQを復号して量子化幅を得て、量子化スペクトル系列の各サンプルの値に量子化幅を乗算して得られる系列から周波数スペクトル系列X0,X1,…,XN-1を得る逆量子化部1125と、周波数スペクトル系列X0,X1,…,XN-1を時間領域のサンプル列である出力信号に変換する時間領域変換部1121を含む。
T. Backstrom and C.R. Helmrich, "Arithmetic coding of speech and audio spectra using tcx based on linear predictive spectral envelopes," in Proc. ICASSP 2015, Apr. 2015, pp. 5127-5131.
非特許文献1の技術のように、各サンプルに割り当てられる符号長がスペクトル包絡に依存しているような符号化方式は、符号化装置が出力した出力符号が全く誤りなく入力符号として復号装置に入力されるような条件では有用である。しかし、非特許文献1の技術には、符号化装置が出力した出力符号に含まれる線形予測係数符号Cα(スペクトル包絡を表す符号)が復号装置に入力されるまでの間でひとたび誤りが生じてしまうと、信号符号に含まれる各サンプルに対応する符号の符号長に誤りが生じてしまい、復号により得られるサンプル数が変わってしまうことにより、復号処理自体が破綻してしまうという課題、或いは、復号により得られるサンプル数はたまたま正しくなるものの、入力信号とは全く異なる出力信号を出力してしまうという課題がある。このような課題は、「スペクトル包絡を表す符号」として線形予測係数符号Cαが用いられる場合のみならず、より一般的にスペクトル包絡に対応する情報を符号化した符号を「スペクトル包絡を表す符号」とし、符号化装置が出力した出力符号が復号装置に入力されるまでの間に、出力符号に含まれる「スペクトル包絡を表す符号」に誤りが生じた場合にも共通する。
本発明は、符号化装置が出力した符号が復号装置に入力されるまでの間にスペクトル包絡を表す符号に誤りが生じる可能性があるという条件下でも、スペクトル包絡の情報を活かして効率よく信号を圧縮すること、すなわち、少ない符号量で復号信号の歪みが小さくなるようにすることと、復号装置に入力される符号中のスペクトル包絡を表す符号に誤りが含まれていても復号により得られるサンプル数が符号化装置に入力されたサンプル数と同じになることを保証して誤りの影響を小さくとどめることと、を両立した符号化および復号を可能とすることを目的とする。
本発明では、まず、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、当該対数スペクトル包絡系列を特定可能な符号である包絡符号とを得る。次に、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得る。ただし、予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。
これにより、符号化装置が出力した符号が復号装置に入力されるまでの間にスペクトル包絡を表す符号に誤りが生じる可能性があるという条件下でも、スペクトル包絡の情報を活かして効率よく信号を圧縮できる。
以下、本発明の実施形態を説明する。
[原理]
各サンプルに対して予め決めた符号長を割り当てると、符号化装置が出力した符号が復号装置に入力されるまでの間に線形予測係数符号に誤りが生じる可能性があるという条件下でも、復号により得られるサンプルのサンプル数が符号化装置で符号化されたサンプルのサンプル数と同じになることが保証される。特に、符号化装置に入力された時系列信号の周波数スペクトル系列の各周波数スペクトル値を当該時系列信号のスペクトル包絡系列の各スペクトル包絡値で除算すること(すなわち平滑化すること)で得られた平滑化スペクトル系列は、系列に含まれる平滑化スペクトルの振幅値がおおよそ一定範囲内に収まっていることが多い。そのため、平滑化スペクトル系列の各サンプルには、短い符号長の固定長の符号を割り当てることができる。この場合、復号装置では符号を復号して得た平滑化スペクトル系列の各平滑化スペクトル値にスペクトル包絡系列の各スペクトル包絡値を乗算する処理(すなわち逆平滑化)を行う必要がある。
[原理]
各サンプルに対して予め決めた符号長を割り当てると、符号化装置が出力した符号が復号装置に入力されるまでの間に線形予測係数符号に誤りが生じる可能性があるという条件下でも、復号により得られるサンプルのサンプル数が符号化装置で符号化されたサンプルのサンプル数と同じになることが保証される。特に、符号化装置に入力された時系列信号の周波数スペクトル系列の各周波数スペクトル値を当該時系列信号のスペクトル包絡系列の各スペクトル包絡値で除算すること(すなわち平滑化すること)で得られた平滑化スペクトル系列は、系列に含まれる平滑化スペクトルの振幅値がおおよそ一定範囲内に収まっていることが多い。そのため、平滑化スペクトル系列の各サンプルには、短い符号長の固定長の符号を割り当てることができる。この場合、復号装置では符号を復号して得た平滑化スペクトル系列の各平滑化スペクトル値にスペクトル包絡系列の各スペクトル包絡値を乗算する処理(すなわち逆平滑化)を行う必要がある。
公知技術ではないが、周波数スペクトルを平滑化した後に量子化し、量子化後のサンプルに符号を割り当てることは可能である。この場合は、この符号化装置において、周波数スペクトル系列の各周波数スペクトル値を時系列信号のスペクトル包絡系列の各スペクトル包絡値で除算することにより得た平滑化スペクトル系列の各平滑化スペクトル値を量子化して得られるサンプル系列の各サンプルに符号を割り当てる構成となる。この構成とすると、復号装置において、量子化誤差がスペクトル包絡を乗算することにより拡大されてしまい、時系列信号を復元する精度の低下に繋がってしまう。
一方で、公知技術ではないが、周波数スペクトルを量子化した後に平滑化し、平滑化後のサンプルに符号を割り当てることも可能である。この場合は、周波数スペクトル系列の各周波数スペクトル値を量子化して量子化後の値による系列である量子化周波数スペクトル系列を得て、量子化周波数スペクトル系列の各量子化周波数スペクトル値をスペクトル包絡系列の各スペクトル包絡値で除算して平滑化量子化周波数スペクトル系列を得、平滑化量子化周波数スペクトル系列の各サンプルに符号を割り当てる構成となる。しかし、除算の結果である平滑化量子化周波数スペクトル系列の各サンプルは一般的には有限精度の値にならないため、平滑化量子化周波数スペクトル系列の各サンプルに短い符号長の固定長の符号を割り当ててしまうと量子化誤差が大きくなってしまう。
そこで本発明の各実施形態では、スペクトル包絡系列に含まれる各スペクトル包絡値の対数値の和が近似的に0になることを利用し、周波数スペクトル系列の各周波数スペクトル値を量子化することにより整数値になった量子化スペクトル系列に対するスペクトル包絡系列の整数領域での除算および乗算と、可逆性と、両立できる平滑化と逆平滑化を実現する。さらに、この除算によって量子化スペクトル系列を平滑化して得た平滑化スペクトル系列の各サンプルに固定長の符号を割り当てた符号化と復号をすることで、復号により得られるサンプル数が符号化装置に入力されたサンプル数と同じになることを保証したまま、信号の圧縮と復元を実現する。
以下に各実施形態で実現するスペクトル包絡に基づく可逆な除算および乗算の原理を述べる。周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値をスカラー量子化して得たN点の整数値の量子化スペクトル系列^X0,^X1,…,^XN-1について、そのスペクトル包絡の形状を表すスペクトル包絡系列の各スペクトル包絡値H0,H1,…,HN-1は、周波数スペクトル系列X0,X1,…,XN-1から得られた線形予測係数α1,α2,…,αpを用いて以下のように表せる。
ただし、Nは正の整数であり、pは2以上の整数である。・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。このスペクトル包絡値H0,H1,…,HN-1の対数値の合計は近似的に0となることが知られており、スペクトル包絡値Hkの2を底とする対数値Lk(=log2(Hk), k=0,…,N-1)の合計もほぼ0となる。また、スペクトル包絡値の対数値Lkが整数値である場合、量子化スペクトル系列の各量子化スペクトル値に対するスペクトル包絡値での除算^Xk/Hkは、量子化スペクトル値^Xkの2進数表記において桁を増やす、或いは減らす操作に相当する。上記2つの性質を用いて、符号化装置の信号平滑化部における情報の欠落の無い除算と、この除算と可逆な、復号装置の信号逆平滑化部における情報の欠落が無い乗算と、を実現する。
ただし、Nは正の整数であり、pは2以上の整数である。・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。このスペクトル包絡値H0,H1,…,HN-1の対数値の合計は近似的に0となることが知られており、スペクトル包絡値Hkの2を底とする対数値Lk(=log2(Hk), k=0,…,N-1)の合計もほぼ0となる。また、スペクトル包絡値の対数値Lkが整数値である場合、量子化スペクトル系列の各量子化スペクトル値に対するスペクトル包絡値での除算^Xk/Hkは、量子化スペクトル値^Xkの2進数表記において桁を増やす、或いは減らす操作に相当する。上記2つの性質を用いて、符号化装置の信号平滑化部における情報の欠落の無い除算と、この除算と可逆な、復号装置の信号逆平滑化部における情報の欠落が無い乗算と、を実現する。
<第一実施形態>
この発明の第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、フレーム単位で入力された時間領域の時系列信号、例えば、音声や音楽などの音信号(音響信号)を符号化して符号を得て、出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の時系列信号、例えば、音信号を出力する。以下、時系列信号が音信号である場合の符号化装置と復号装置について説明する。なお、符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた時系列信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
この発明の第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、フレーム単位で入力された時間領域の時系列信号、例えば、音声や音楽などの音信号(音響信号)を符号化して符号を得て、出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の時系列信号、例えば、音信号を出力する。以下、時系列信号が音信号である場合の符号化装置と復号装置について説明する。なお、符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた時系列信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
≪符号化装置11≫
図1Aおよび図1Bを参照して、第一実施形態の符号化装置11の機能構成、および符号化装置11が実行する符号化方法の処理手続きを説明する。
図1Aおよび図1Bを参照して、第一実施形態の符号化装置11の機能構成、および符号化装置11が実行する符号化方法の処理手続きを説明する。
図1Aに例示するように、符号化装置11は、周波数領域変換部111、線形予測分析部112(包絡符号化部)、スペクトル包絡生成部113、対数包絡生成部114、量子化部115、信号平滑化部116、および多重化部117を含む。なお、線形予測分析部112、スペクトル包絡生成部113、および対数包絡生成部114は「対数スペクトル包絡生成部」に含まれる。
符号化装置11には、時間領域の音信号(時系列信号である入力信号)が入力される。音信号は、例えば音声信号または音響信号である。符号化装置に入力された時間領域の音信号は周波数変換部へ入力される。
[周波数領域変換部111]
周波数領域変換部111には、符号化装置11に入力された時間領域の音信号が入力される。周波数領域変換部111は、所定の時間長のフレーム(所定時間区間)単位で、入力された時間領域の音信号を、例えば修正離散コサイン変換(MDCT)などで、周波数領域のN点のサンプルの系列である周波数スペクトル系列X0,X1,…,XN-1に変換して出力する。Nは正の整数であり、例えばN=1024などである。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。MDCTを用いた場合には、周波数スペクトル系列はMDCT係数列である。周波数領域変換部111は、変換により得た周波数スペクトル系列X0,X1,…,XN-1を、線形予測分析部112および量子化部115に出力する。なお、周波数領域変換部111は、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理を施し、フィルタ処理後や圧伸処理後の系列を周波数スペクトル系列X0,X1,…,XN-1として出力してもよい。
周波数領域変換部111には、符号化装置11に入力された時間領域の音信号が入力される。周波数領域変換部111は、所定の時間長のフレーム(所定時間区間)単位で、入力された時間領域の音信号を、例えば修正離散コサイン変換(MDCT)などで、周波数領域のN点のサンプルの系列である周波数スペクトル系列X0,X1,…,XN-1に変換して出力する。Nは正の整数であり、例えばN=1024などである。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。MDCTを用いた場合には、周波数スペクトル系列はMDCT係数列である。周波数領域変換部111は、変換により得た周波数スペクトル系列X0,X1,…,XN-1を、線形予測分析部112および量子化部115に出力する。なお、周波数領域変換部111は、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理を施し、フィルタ処理後や圧伸処理後の系列を周波数スペクトル系列X0,X1,…,XN-1として出力してもよい。
[線形予測分析部112]
線形予測分析部112には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。線形予測分析部112は、入力された周波数スペクトル系列X0,X1,…,XN-1に対応する線形予測係数α1,α2,…,αpと、当該線形予測係数α1,α2,…,αpに対応する線形予測係数符号Cα(包絡符号CL)と、を得て出力する。線形予測係数符号Cαの例は線形予測係数α1,α2,…,αpに対応するLSP(Line Spectrum Pairs)パラメータ列に対応する符号であるLSP符号である。pは、線形予測の次数であり、2以上の整数である。線形予測分析部112は、線形予測係数α1,α2,…,αpをスペクトル包絡生成部113に、線形予測係数符号Cαを多重化部117に、それぞれ出力する。
線形予測分析部112には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。線形予測分析部112は、入力された周波数スペクトル系列X0,X1,…,XN-1に対応する線形予測係数α1,α2,…,αpと、当該線形予測係数α1,α2,…,αpに対応する線形予測係数符号Cα(包絡符号CL)と、を得て出力する。線形予測係数符号Cαの例は線形予測係数α1,α2,…,αpに対応するLSP(Line Spectrum Pairs)パラメータ列に対応する符号であるLSP符号である。pは、線形予測の次数であり、2以上の整数である。線形予測分析部112は、線形予測係数α1,α2,…,αpをスペクトル包絡生成部113に、線形予測係数符号Cαを多重化部117に、それぞれ出力する。
線形予測分析部112は、例えば、入力された周波数スペクトル系列X0,X1,…,XN-1の各値の自乗の系列を逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを行うことにより線形予測係数を得て、得られた線形予測係数を符号化して線形予測係数符号Cαを得て出力するとともに、得られた線形予測係数符号Cαに対応する線形予測係数の量子化値を線形予測係数α1,α2,…,αpとして得て出力する。
線形予測分析部112による線形予測係数符号Cαの生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号Cαとする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号Cαとする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号Cαとする符号化技術などである。
なお、線形予測分析部112は、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1ではなく、符号化装置11に入力された時間領域の音信号から線形予測係数α1,α2,…,αpと当該線形予測係数α1,α2,…,αpに対応する線形予測係数符号Cαとを得て出力してもよい。
[スペクトル包絡生成部113]
スペクトル包絡生成部113には、線形予測分析部112が出力した線形予測係数α1,α2,…,αpが入力される。スペクトル包絡生成部113は、入力された線形予測係数α1,α2,…,αpを用いて、以下の式(1)により求まるスペクトル包絡値H0,H1,…,HN-1によるスペクトル包絡系列である(所定時間区間の時系列信号のスペクトル包絡系列)を得て対数包絡生成部114に出力する。
ただし、k=0,...,N-1であり、・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。
スペクトル包絡生成部113には、線形予測分析部112が出力した線形予測係数α1,α2,…,αpが入力される。スペクトル包絡生成部113は、入力された線形予測係数α1,α2,…,αpを用いて、以下の式(1)により求まるスペクトル包絡値H0,H1,…,HN-1によるスペクトル包絡系列である(所定時間区間の時系列信号のスペクトル包絡系列)を得て対数包絡生成部114に出力する。
ただし、k=0,...,N-1であり、・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。
なお、スペクトル包絡生成部113は、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1や符号化装置11に入力された時間領域の音信号からスペクトル包絡系列H0,H1,…,HN-1を得てもよい。この場合は、線形予測分析部112を備えずに、スペクトル包絡生成部113がスペクトル包絡系列H0,H1,…,HN-1に対応する符号を包絡符号CLとして得て出力すればよい。なお、スペクトル包絡生成部113の動作から分かる通り、線形予測分析部112が得た線形予測係数α1,α2,…,αpに対応する線形予測係数符号Cαは、スペクトル包絡系列H0,H1,…,HN-1に対応する符号である包絡符号CLと等価なものであり、スペクトル包絡に対応する符号である。
[対数包絡生成部114]
対数包絡生成部114には、スペクトル包絡生成部113が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部114は、スペクトル包絡系列H0,H1,…,HN-1から対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。ただし、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。例えば対数包絡生成部114は、以下のstep I~IVの各処理を行って対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。
対数包絡生成部114には、スペクトル包絡生成部113が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部114は、スペクトル包絡系列H0,H1,…,HN-1から対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。ただし、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。例えば対数包絡生成部114は、以下のstep I~IVの各処理を行って対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。
Step I:対数包絡生成部114は、入力されたスペクトル包絡系列H0,H1,…,HN-1の各スペクトル包絡値H0,H1,…,HN-1の2を底とする対数値log2Hk(ただし、k=0,1,...,N-1)を求める。
Step II:対数包絡生成部114は、Step Iで求めた各対数値log2Hkを整数値に丸め、丸め後の各整数値による系列を対数スペクトル包絡系列L0,L1,…,LN-1として得る。各対数値log2Hkを整数値に丸める処理は、例えば各対数値log2Hkの小数点第一位を四捨五入することにより整数値を得る処理である。すなわち、ここで得た対数スペクトル包絡系列は、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列である。
Step III:対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列の各サンプル値である対数スペクトル包絡値L0,L1,…,LN-1の総和を求める。すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和を求める。
Step IV:対数包絡生成部114は、Step IIIで求めた総和が0であれば(すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和が0である場合には)Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1を信号平滑化部116に出力する。一方、Step IIIで求めた総和が0でなければ(すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和が0でない場合には)、対数包絡生成部114は、予め定めた規則により、総和が0となるように調整したもの、例えば、以下の(a),(b)のように調整したもの、を対数スペクトル包絡系列L0,L1,…,LN-1として得て、信号平滑化部116に出力する。
(a) Step IIIで求めた総和が0よりも大きければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も大きい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも大きければ、整数値列の中で最も大きい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(大きいほうからの順序)を表す指標をφ(Lk)=0,…,N-1とする。ただし、大きな値のLkほどφ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step a-1)、φ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)から1を引いた値Lk(i)-1を新たなLk(i)とし(Step a-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step a-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep a-2に戻り(Step a-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1による系列を対数スペクトル包絡系列として信号平滑化部116に出力する(Step a-5)。なお、Step a-4においてi+1がN-1を超えてしまった場合にはStep a-1に戻ってもよい。
(b) Step IIIで求めた総和が0よりも小さければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も小さい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも小さければ、整数値列の中で最も小さい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(小さいほうからの順序)を表す指標をμ(Lk)=0,…,N-1とする。ただし、小さな値のLkほど(絶対値|Lk|が大きいほど)μ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step b-1)、μ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)に1を加えた値Lk(i)+1を新たなLk(i)とし(Step b-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step b-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep b-2に戻り(Step b-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1を対数スペクトル包絡系列として信号平滑化部116に出力する(Step b-5)。なお、Step b-4においてi+1がN-1を超えてしまった場合にはStep b-1に戻ってもよい。
(a) Step IIIで求めた総和が0よりも大きければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も大きい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも大きければ、整数値列の中で最も大きい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(大きいほうからの順序)を表す指標をφ(Lk)=0,…,N-1とする。ただし、大きな値のLkほどφ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step a-1)、φ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)から1を引いた値Lk(i)-1を新たなLk(i)とし(Step a-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step a-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep a-2に戻り(Step a-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1による系列を対数スペクトル包絡系列として信号平滑化部116に出力する(Step a-5)。なお、Step a-4においてi+1がN-1を超えてしまった場合にはStep a-1に戻ってもよい。
(b) Step IIIで求めた総和が0よりも小さければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も小さい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも小さければ、整数値列の中で最も小さい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(小さいほうからの順序)を表す指標をμ(Lk)=0,…,N-1とする。ただし、小さな値のLkほど(絶対値|Lk|が大きいほど)μ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step b-1)、μ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)に1を加えた値Lk(i)+1を新たなLk(i)とし(Step b-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step b-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep b-2に戻り(Step b-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1を対数スペクトル包絡系列として信号平滑化部116に出力する(Step b-5)。なお、Step b-4においてi+1がN-1を超えてしまった場合にはStep b-1に戻ってもよい。
上述の(a),(b)によれば乗除の可逆性を担保できる。すなわち、上述の(a),(b)により、後述する平滑化部116aの処理において、各量子化スペクトル値からの桁の削除(除算)と各量子化スペクトル値への桁の追加(乗算)とで数値の過不足がなくなるようにできる。しかし、上述の(a),(b)は一例であって、本発明を限定するものではない。Step IIIで求めた総和が0でない場合に、その他の基準(例えば、調整前後の対数スペクトル包絡系列の距離を最小化する基準)によって対数スペクトル包絡系列L0,L1,…,LN-1の総和が0になるように調整され、総和が0になる対数スペクトル包絡系列L0,L1,…,LN-1が信号平滑化部116に出力されてもよい。Step IIIで求めた対数スペクトル包絡系列L0,L1,…,LN-1の総和が0でない場合に、総和が0となるようにどのような順序で対数スペクトル包絡の値を調整するかは任意であるし、調整対象の対数スペクトル包絡値からどのような値を引いたり足したりするのかも任意である。すなわち、対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1の総和が0になるようにL0,L1,…,LN-1の少なくとも一部の値を調整し、それによって得られたL0,L1,…,LN-1を信号平滑化部116に出力すればよい。言い換えるとStep IIで得た対数スペクトル包絡系列L0,L1,…,LN-1(整数値列)に含まれる値の総和が0である場合には、対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1を対数スペクトル包絡系列L0,L1,…,LN-1として信号平滑化部116に出力する。一方、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1(整数値列)に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、当該整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を対数スペクトル包絡系列L0,L1,…,LN-1として信号平滑化部116に出力する。
なお、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値L0,L1,…,LN-1をなるべく変えないように総和が0となるような最小限の調整を行うのが望ましく、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値L0,L1,…,LN-1を大きく変えるような調整を行うのは好ましくない。また、すべてのL0,L1,…,LN-1を0にするような調整を行ってはならず、対数スペクトル包絡系列L0,L1,…,LN-1のうち、負値であった対数スペクトル包絡値が負値のうちの少なくとも何れかの対数スペクトル包絡値が負値であり、かつ、正値であった対数スペクトル包絡値のうちの少なくとも対数スペクトル包絡値が正値であるように、対数スペクトル包絡系列L0,L1,…,LN-1の少なくとも一部の値を調整する必要がある。
[量子化部115]
量子化部115には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。量子化部115は、入力された周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値を量子化幅で割り算した結果の整数部分の値による系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て信号平滑化部116へ出力する。この量子化幅は従来的な方法で決めればよく、例えば、量子化部115が入力された周波数スペクトル系列X0,X1,…,XN-1のエネルギーや振幅の最大値に比例するような値を量子化幅として決定すればよい。
量子化部115には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。量子化部115は、入力された周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値を量子化幅で割り算した結果の整数部分の値による系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て信号平滑化部116へ出力する。この量子化幅は従来的な方法で決めればよく、例えば、量子化部115が入力された周波数スペクトル系列X0,X1,…,XN-1のエネルギーや振幅の最大値に比例するような値を量子化幅として決定すればよい。
量子化部115は、決定した量子化幅の値に対応する符号を得て、得た符号を量子化幅符号CQとして多重化部117に出力する。なお、量子化部115は、信号平滑化部116において量子化スペクトル系列^X0,^X1,…,^XN-1を予め定めたビット数で表現できる量子化幅の中で最小の値を二分探索的に求め、量子化幅の値を決定してもよい。この場合には、量子化部115が量子化スペクトル系列^X0,^X1,…,^XN-1と量子化幅を得る処理と後述する信号平滑化部116の処理とを複数回行い、量子化部115は最終的に決定した量子化幅に対応する量子化幅符号CQを多重化部117に出力し、信号平滑化部116は最終的に決定した量子化スペクトル系列^X0,^X1,…,^XN-1が入力された際の平滑化スペクトル系列に対応する信号符号CXを多重化部117に出力する。
[信号平滑化部116]
図1Bに例示するように、信号平滑化部116は、例えば、平滑化部116aと平滑化系列符号化部116bとを備える。信号平滑化部116には、量子化部115が出力した量子化スペクトル系列^X0,^X1,…,^XN-1、および対数包絡生成部114が出力した対数スペクトル包絡系列L0,L1,…,LN-1が入力される。まず、信号平滑化部116の平滑化部116aが、入力された量子化スペクトル系列^X0,^X1,…,^XN-1を入力された対数スペクトル包絡系列L0,L1,…,LN-1に基づいて平滑化して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。次に、信号平滑化部116の平滑化系列符号化部116bが、信号平滑化部116の平滑化部116aによる平滑化により得た平滑化スペクトル系列~X0,~X1,…,~XN-1を、例えばサンプル毎に4ビットずつなどのように、予め定められたビット数の固定長符号で表現した信号符号CXを得て多重化部117に出力する。
図1Bに例示するように、信号平滑化部116は、例えば、平滑化部116aと平滑化系列符号化部116bとを備える。信号平滑化部116には、量子化部115が出力した量子化スペクトル系列^X0,^X1,…,^XN-1、および対数包絡生成部114が出力した対数スペクトル包絡系列L0,L1,…,LN-1が入力される。まず、信号平滑化部116の平滑化部116aが、入力された量子化スペクトル系列^X0,^X1,…,^XN-1を入力された対数スペクトル包絡系列L0,L1,…,LN-1に基づいて平滑化して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。次に、信号平滑化部116の平滑化系列符号化部116bが、信号平滑化部116の平滑化部116aによる平滑化により得た平滑化スペクトル系列~X0,~X1,…,~XN-1を、例えばサンプル毎に4ビットずつなどのように、予め定められたビット数の固定長符号で表現した信号符号CXを得て多重化部117に出力する。
信号平滑化部116の平滑化部116aが行う平滑化は、量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値の二進数表記における下位桁を、対数スペクトル包絡系列L0,L1,…,LN-1のうちの対応する対数スペクトル包絡値に少なくとも基づいて操作することにより行う。
信号平滑化部116の平滑化部116aが行う平滑化処理の具体例を説明する。平滑化部116aは、各サンプル番号k(ただし、k=0,…,N-1)に対して、量子化スペクトル値^Xkに対応する対数スペクトル包絡値Lkが正値である場合には、量子化スペクトル値^Xkの二進数表記における最下位桁からLk桁(すなわち、対数スペクトル包絡値Lkと同じ桁数)だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、対数スペクトル包絡値Lkが負値である場合には、量子化スペクトル値^Xkの二進数表記における最下位桁から-Lk桁(すなわち、対数スペクトル包絡値Lkの絶対値と同じ桁数)だけ数値を追加したものを平滑化スペクトル値~Xkとし、対数スペクトル包絡値Lkが0である場合には、量子化スペクトル値^Xkをそのまま平滑化スペクトル値~Xkとし、その際、予め定めた規則Rsにより、取り除いた数値を過不足なく追加する数値とすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得る。すなわち、平滑化部116aは、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則Rsに従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得る。この予め定めた規則Rsは、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。ここで「取り除いた数値」とは、^Xkに対応するLkが正値である^Xkから取り除いた数値であり、「追加する数値」とは、^Xkに対応するLkが負値である^Xkに追加する数値である。予め定めた規則Rsは、予め定めた手順に従って、正値である対数スペクトル包絡値Lk’に対応する^Xk’の二進数表記における最下位桁から取り除かれたLk’桁の数値の何れかを、負値である何れかの対数スペクトル包絡値Lk”に対応する^Xkの二進数表記における最下位桁から-Lk桁に追加する何れかの桁の数値とするものである。ただし、k”,k’∈{0,…,N-1}であり、かつ、k”≠k’である。正値である対数スペクトル包絡値Lk’に対応する^Xk’から取り除かれる二進数表記における桁の数値の個数は、負値である対数スペクトル包絡値Lk”に対応する^Xk”に追加する二進数表記における桁の数値の個数と同一である。取り除かれた数値と追加する数値とは一対一で対応する。すなわち、正値である対数スペクトル包絡値Lk’に対応する^Xk’から取り除かれたすべての数値が、負値である何れかの対数スペクトル包絡値Lkに対応する^Xkに追加される何れかの桁の数値とされる。
図3Aから図3Cを用いて予め定めた規則Rsの一例を説明する。図3Aから図3Cに例示する予め定めた規則Rsは、量子化スペクトル系列において、正値である対数スペクトル包絡値(図3Aの例ではL0,L1,L2)それぞれに対応する量子化スペクトル値(図3Aの例では^X0,^X1,^X2)から取り除かれた桁の数値を、当該量子化スペクトル系列において大きい桁から順、同じ桁についてはサンプル番号k(ただし、k=0,…,4)が小さい順のものを、負値である対数スペクトル包絡値(図3Aの例ではL3,L4)に対応する桁シフト前の平滑化スペクトル値(図3Bでは~X3’,~X4’)において小さい桁から順、同じ桁についてはサンプル番号kが小さい順、となるように、負値である対数スペクトル包絡値に対応する量子化スペクトル値(図3Aでは^X3,^X4)に追加する規則である。なお、図3Aから図3Cを用いて説明する予め定めた規則Rsは一例であって本発明を限定するものではない。すなわち、この例は本発明にとって任意的(オプショナル)なものである。
図3Aから図3Cの例を詳しく説明する。この例ではN=5であり、量子化スペクトル系列の各量子化スペクトル値は^X0=13, ^X1=52, ^X2=21, ^X3=2, ^X4=1であり、対数スペクトル包絡系列の各対数スペクトル包絡値はL0=1, L1=3, L2=1, L3=-2 L4=-3である。量子化スペクトル値^X0=13については、対応する対数スペクトル包絡値L0=1であるため、量子化スペクトル値^X0の二進数表記0,0,1,1,0,1の最下位の桁の数値1を取り除く。量子化スペクトル値^X1=52については、対応する対数スペクトル包絡値L0=3であるため、量子化スペクトル値^X1の二進数表記1,1,0,1,0,0の最下位から3桁の数値1, 0, 0を取り除く。量子化スペクトル値^X2=21については、対応する対数スペクトル包絡値L2=1であるため、量子化スペクトル値^X2の二進数表記0,1,0,1,0,1の最下位の桁の数値1を取り除く。量子化スペクトル値^X3=2については、対応する対数スペクトル包絡値L3=-2であるため、量子化スペクトル値^X3の二進数表記0,0,0,0,1,0の最下位桁より下位に2桁の数値を追加する。量子化スペクトル値^X4=1については、対応する対数スペクトル包絡値L4=-2であるため、量子化スペクトル値^X4の二進数表記0,0,0,0,0,1の最下位桁より下位に3桁の数値を追加する。
この際、上記の予め定めた規則Rsでは、取り除かれた数値の順位は、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位から3桁目の数値1が1番目の順(1)、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位から2桁目の数値0が2番目の順(2)、量子化スペクトル値^X0=13の二進数表記0,0,1,1,0,1の最下位桁の数値1が3番目の順(3)、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位桁の数値0が4番目の順(4)、量子化スペクトル値^X4=1の二進数表記0,0,0,0,0,1の最下位桁の数値1が5番目の順(5)である(図3A)。追加される側では、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位の桁の順位が1番目(1)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位から3桁目の数値1をこの桁に追加する(図3Aおよび図3B)。また、桁シフト前の平滑化スペクトル値~X3’の二進数表記における最下位の桁の順位が2番目(2)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位から2桁目の数値0をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位から2桁目の順位が3番目(3)であるので、量子化スペクトル値^X0=13の二進数表記0,0,1,1,0,1における最下位桁の数値1をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X3’の二進数表記における最下位から2桁目の順位が4番目(4)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位桁の数値0をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位から3桁目の順位が5番目(5)であるので、量子化スペクトル値^X2=21の二進数表記0,1,0,1,0,1における最下位桁の数値1をこの桁に追加する。その後、このように得られた桁シフト前の平滑化スペクトル値による系列~X0’,…,~X4’(図3B)の二進数表記における最下位桁を揃えたものを、平滑化スペクトル系列~X0,…,~X4(図3C)として得る。
信号平滑化部116の平滑化部116aが行う平滑化処理は、量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値^Xkを対応する対数スペクトル包絡値Lkで除算する処理と、量子化スペクトル系列^X0,^X1,…,^XN-1に含まれる情報が全て平滑化スペクトル系列~X0,~X1,…,~XN-1に含まれるようにする処理と、を両立させる処理である。
上記の図3Aから図3Cの例であれば、元の量子化スペクトル系列^X0,…,^X4が6ビット精度の値域であるのに対して、平滑化スペクトル系列~X0,…,~X4は実質的には4ビットの値域で表現される。これにより、信号平滑化部116の平滑化系列符号化部116bは、平滑化により得た平滑化スペクトル系列~X0,…,~X4の各平滑化スペクトル値~Xkを4ビットの固定長で符号化して信号符号CXを得ることができる。
なお、信号平滑化部116の平滑化系列符号化部116bは、平滑化スペクトル系列~X0,~X1,…,~XN-1の全ての平滑化スペクトル値~Xkを同じビット数で符号化して信号符号CXを得る構成ではなく、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを、サンプル位置毎(すなわち、サンプル番号k毎)に予め定められたビット数で符号化して信号符号CXを得る構成であってもよい。また、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値を、サンプル位置の範囲毎(すなわち、サンプル番号kの範囲毎)に予め定められたビット数で符号化して信号符号CXを得る構成にしてもよい。
[多重化部117]
多重化部117は、線形予測分析部112またはスペクトル包絡生成部113が出力したスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CL(対数スペクトル包絡系列L0,L1,…,LN-1を特定可能な符号である包絡符号CL)と、量子化部115が出力した量子化幅符号CQと、信号平滑化部116が出力した信号符号CXと、を受け取り、これらの符号全てを含む出力符号(例えば全ての符号を繋ぎ合わせて得た出力符号)を、出力する。
多重化部117は、線形予測分析部112またはスペクトル包絡生成部113が出力したスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CL(対数スペクトル包絡系列L0,L1,…,LN-1を特定可能な符号である包絡符号CL)と、量子化部115が出力した量子化幅符号CQと、信号平滑化部116が出力した信号符号CXと、を受け取り、これらの符号全てを含む出力符号(例えば全ての符号を繋ぎ合わせて得た出力符号)を、出力する。
≪復号装置12≫
図2Aおよび図2Bを参照して、第一実施形態の復号装置12の機能構成、およびが実行する復号方法の処理手続きを説明する。
図2Aおよび図2Bを参照して、第一実施形態の復号装置12の機能構成、およびが実行する復号方法の処理手続きを説明する。
図2Aに例示するように、復号装置12は、時間領域変換部121、スペクトル包絡生成部123、対数包絡生成部124、逆量子化部125、信号逆平滑化部126、および多重分離部127を含む。スペクトル包絡生成部123および対数包絡生成部124は、「対数スペクトル包絡復号部」に含まれる。
復号装置12には、符号化装置11が出力した出力符号が入力符号として入力される。復号装置12に入力された入力符号は多重分離部127へ入力される。
[多重分離部127]
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CLをスペクトル包絡生成部123へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CLをスペクトル包絡生成部123へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
[スペクトル包絡生成部123]
スペクトル包絡生成部123には、多重分離部127が出力した線形予測係数符号Cα(包絡符号CL)が入力される。スペクトル包絡生成部123は、符号化装置11の線形予測分析部112が行った符号化方法に対応する例えば従来的な復号技術によって、線形予測係数符号Cαを復号して線形予測係数α1,α2,…,αpを得る。さらに、スペクトル包絡生成部123は、得た線形予測係数α1,α2,…,αpを用いて符号化装置11のスペクトル包絡生成部113と同一の手順によりスペクトル包絡系列H0,H1,…,HN-1を生成し(すなわち、包絡符号を復号してスペクトル包絡系列を得)、対数包絡生成部124に出力する。ここで、従来的な復号技術とは、例えば、線形予測係数符号Cαが量子化された線形予測係数に対応する符号である場合に線形予測係数符号Cαを復号して量子化された線形予測係数と同じ線形予測係数を得る技術、線形予測係数符号Cαが量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号Cαを復号して量子化されたLSPパラメータと同じLSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号Cαと後段での処理において必要な情報に応じて、線形予測係数とLSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号Cαの復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。なお、符号化装置11のスペクトル包絡生成部113が周波数スペクトル系列X0,X1,…,XN-1や時間領域の音信号からスペクトル包絡系列H0,H1,…,HN-1と当該スペクトル包絡系列に対応する符号を包絡符号CLとして得た場合には、符号化装置11のスペクトル包絡生成部113が包絡符号CLを得た方法に対応する復号方法で包絡符号CLを復号してスペクトル包絡系列H0,H1,…,HN-1を得る。
スペクトル包絡生成部123には、多重分離部127が出力した線形予測係数符号Cα(包絡符号CL)が入力される。スペクトル包絡生成部123は、符号化装置11の線形予測分析部112が行った符号化方法に対応する例えば従来的な復号技術によって、線形予測係数符号Cαを復号して線形予測係数α1,α2,…,αpを得る。さらに、スペクトル包絡生成部123は、得た線形予測係数α1,α2,…,αpを用いて符号化装置11のスペクトル包絡生成部113と同一の手順によりスペクトル包絡系列H0,H1,…,HN-1を生成し(すなわち、包絡符号を復号してスペクトル包絡系列を得)、対数包絡生成部124に出力する。ここで、従来的な復号技術とは、例えば、線形予測係数符号Cαが量子化された線形予測係数に対応する符号である場合に線形予測係数符号Cαを復号して量子化された線形予測係数と同じ線形予測係数を得る技術、線形予測係数符号Cαが量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号Cαを復号して量子化されたLSPパラメータと同じLSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号Cαと後段での処理において必要な情報に応じて、線形予測係数とLSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号Cαの復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。なお、符号化装置11のスペクトル包絡生成部113が周波数スペクトル系列X0,X1,…,XN-1や時間領域の音信号からスペクトル包絡系列H0,H1,…,HN-1と当該スペクトル包絡系列に対応する符号を包絡符号CLとして得た場合には、符号化装置11のスペクトル包絡生成部113が包絡符号CLを得た方法に対応する復号方法で包絡符号CLを復号してスペクトル包絡系列H0,H1,…,HN-1を得る。
なお、符号化装置11のスペクトル包絡生成部113の説明箇所において上述したように、線形予測係数符号Cαは包絡符号CLと等価なものであり、包絡符号CLはスペクトル包絡に対応する符号であるので、上述した2つの処理、すなわち、線形予測係数符号Cαを復号して線形予測係数を得て、得た線形予測係数からスペクトル包絡系列H0,H1,…,HN-1を得る処理も、包絡符号CLを復号してスペクトル包絡系列H0,H1,…,HN-1を得る処理も、要するに、スペクトル包絡に対応する符号である包絡符号CLからスペクトル包絡系列H0,H1,…,HN-1を得る処理である。したがって、スペクトル包絡生成部123は、スペクトル包絡に対応する符号である包絡符号CLからスペクトル包絡系列H0,H1,…,HN-1を得るものである。
[対数包絡生成部124]
対数包絡生成部124には、スペクトル包絡生成部123が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部124は、入力されたスペクトル包絡系列H0,H1,…,HN-1を用いて、符号化装置11の対数包絡生成部114と同一の手順により、対数スペクトル包絡系列L0,L1,…,LN-1を得、信号逆平滑化部126に出力する。すなわち、対数包絡生成部124は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列を得、当該整数値列に含まれる値の総和が0である場合には、当該整数値列を対数スペクトル包絡系列L0,L1,…,LN-1とし、当該整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値の2底対数に対応する整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を対数スペクトル包絡系列L0,L1,…,LN-1として得る。前述のように、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。
対数包絡生成部124には、スペクトル包絡生成部123が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部124は、入力されたスペクトル包絡系列H0,H1,…,HN-1を用いて、符号化装置11の対数包絡生成部114と同一の手順により、対数スペクトル包絡系列L0,L1,…,LN-1を得、信号逆平滑化部126に出力する。すなわち、対数包絡生成部124は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列を得、当該整数値列に含まれる値の総和が0である場合には、当該整数値列を対数スペクトル包絡系列L0,L1,…,LN-1とし、当該整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値の2底対数に対応する整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を対数スペクトル包絡系列L0,L1,…,LN-1として得る。前述のように、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。
[信号逆平滑化部126]
図2Bに例示するように、信号逆平滑化部126は、例えば、平滑化系列復号部126bと逆平滑化部126aとを備える。信号逆平滑化部126には、多重分離部127が出力した信号符号CXと、対数包絡生成部124が出力した対数スペクトル包絡系列L0,L1,…,LN-1と、が入力される。まず、信号逆平滑化部126の平滑化系列復号部126bが、入力された信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。ここで、信号符号CXは、符号化装置11の信号平滑化部116が出力した信号符号CXと同じ構成、すなわち、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル~Xkに対応する予め定められたビット数の固定長符号で表現されたものである。そのため、平滑化系列復号部126bは、信号符号CXに対して固定長の復号を行うことで、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル値である平滑化スペクトル値~Xkを得ることができる。
図2Bに例示するように、信号逆平滑化部126は、例えば、平滑化系列復号部126bと逆平滑化部126aとを備える。信号逆平滑化部126には、多重分離部127が出力した信号符号CXと、対数包絡生成部124が出力した対数スペクトル包絡系列L0,L1,…,LN-1と、が入力される。まず、信号逆平滑化部126の平滑化系列復号部126bが、入力された信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。ここで、信号符号CXは、符号化装置11の信号平滑化部116が出力した信号符号CXと同じ構成、すなわち、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル~Xkに対応する予め定められたビット数の固定長符号で表現されたものである。そのため、平滑化系列復号部126bは、信号符号CXに対して固定長の復号を行うことで、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル値である平滑化スペクトル値~Xkを得ることができる。
次に、信号逆平滑化部126の逆平滑化部126aが、信号逆平滑化部126の平滑化系列復号部126bによる復号により得た平滑化スペクトル系列~X0,~X1,…,~XN-1と入力された対数スペクトル包絡系列L0,L1,…,LN-1に基づき、以下のように逆平滑化を行い量子化スペクトル系列^X0,^X1,…,^XN-1を得て逆量子化部125へ出力する。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化は、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値の二進数表記における下位桁を、対数スペクトル包絡系列L0,L1,…,LN-1のうちの対応する対数スペクトル包絡値に少なくとも基づいて操作することにより行う。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化処理の具体例を説明する。逆平滑化部126aは、各サンプル番号k(k=0,…,N-1)に対して、平滑化スペクトル値~Xkに対応する対数スペクトル包絡値Lkが負値である場合には、平滑化スペクトル値~Xkの二進数表記における最下位桁から-Lk桁(すなわち、対数スペクトル包絡値Lkの絶対値と同じ桁数)だけ数値を取いたものを量子化スペクトル値^Xkとし、対数スペクトル包絡値Lkが正値である場合には、平滑化スペクトル値~Xkの二進数表記における最下位桁からLk桁(すなわち、対数スペクトル包絡値Lkと同じ桁数)だけ数値を追加したものを量子化スペクトル値^Xkとし、対数スペクトル包絡値Lkが0である場合には、平滑化スペクトル値~Xkをそのまま量子化スペクトル値^Xkとし、その際、符号化装置11の信号平滑化部116の平滑化部116aの平滑化処理と対応するように予め定めた規則Rrより、取り除いた数値をを過不足なく追加する数値とすることにより、量子化スペクトル系列^X0,^X1,…,^XN-1を得る。すなわち、逆平滑化部126aは、~Xkに対応するLkが負値である^Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である^Xkについて、平滑化部116aの平滑化処理と対応するように予め定めた規則Rrに従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、量子化スペクトル系列^X0,^X1,…,^XN-1を得る。予め定めた規則Rrは、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。ここで「取り除いた数値」とは、^Xkに対応するLkが負値である^Xkから取り除いた数値であり、「追加する数値」とは、^Xkに対応するLkが正値である^Xkに追加する数値である。予め定めた規則Rrは、予め定めた手順に従って、負値である対数スペクトル包絡値Lk’に対応する~Xk’の二進数表記における最下位桁から取り除かれた-Lk’桁の数値の何れかを、正値である何れかの対数スペクトル包絡値Lk”に対応する~Xk”の二進数表記における最下位桁からLk”桁に追加する何れかの桁の数値とするものである。ただし、k”,k’∈{0,…,N-1}であり、かつ、k”≠k’である。予め定めた規則Rrは前述の予め定めた規則Rsに対応するものでなければならない。言い換えると、信号逆平滑化部126の逆平滑化部126aが予め定めた規則Rrに従って行う逆平滑化が、前述の信号平滑化部116の平滑化部116aが予め定めた規則Rsに従って行う平滑化の逆処理でなければならない。負値である対数スペクトル包絡値Lk’に対応する~Xk’から取り除かれる二進数表記における桁の数値の個数は、正値である対数スペクトル包絡値Lk”に対応する~Xk”に追加する二進数表記における桁の数値の個数と同一である。取り除かれた数値と追加する数値とは一対一で対応する。すなわち、負値である対数スペクトル包絡値Lk’に対応する~Xk’から取り除かれたすべての数値が、正値である何れかの対数スペクトル包絡値Lk”に対応する~Xkに追加される何れかの桁の数値とされる。
図4Aから図4Cを用いて予め定めた規則Rrの一例を説明する。図4Aから図4Cに例示する予め定めた規則Rrは、図3Aから図3Cで例示した符号化装置11の信号平滑化部116の平滑化部116aの平滑化処理と対応するように予め定めた規則である。予め定めた規則Rrは、平滑化スペクトル系列において、負値である対数スペクトル包絡値(図4Aの例ではL3,L4)それぞれに対応する平滑化スペクトル値(図4Aの例では~X3,~X4)から取り除かれた桁の数値を、当該平滑化スペクトル系列において小さい桁から順、同じ桁についてはサンプル番号kが大きい順のものを、桁シフト前の量子化スペクトル値(図4Bでは^X0’,^X1’,^X2’)において大きい桁から順、同じ桁についてはサンプル番号kが小さい順、となるように、正値である対数スペクトル包絡値に対応する平滑化スペクトル値(図4Aの例では~X0,~X1,~X2)に追加する規則である。なお、図4Aから図4Cを用いて説明する予め定めた規則Rrは一例であって本発明を限定するものではない。すなわち、この例は本発明にとって任意的なものである。
図4Aから図4Cの例を詳しく説明する。この例ではN=5であり、平滑化スペクトル系列の各平滑化スペクトル値は~X0=6, ~X1=6, ~X2=10, ~X3=8, ~X4=15であり、対数スペクトル包絡系列の各対数スペクトル包絡値はL0=1, L1=3, L2=1, L3=-2 L4=-3である。平滑化スペクトル値~X0=6については、対応する対数スペクトル包絡値L0=1であるため、平滑化スペクトル値~X0の二進数表記0,0,0,1,1,0の最下位より下位に1桁の数値を追加する。平滑化スペクトル値~X1=6については、対応する対数スペクトル包絡値L1=3であるため、平滑化スペクトル値~X1の二進数表記0,0,0,1,1,0の最下位より下位に3桁の数値を追加する。平滑化スペクトル値~X2=10については、対応する対数スペクトル包絡値L2=1であるため、平滑化スペクトル値~X2の二進数表記0,0,1,0,1,0の最下位より下位に1桁の数値を追加する。平滑化スペクトル値~X3=8については、対応する対数スペクトル包絡値L3=-2であるため、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位から2桁の数値0, 0を取り除く。平滑化スペクトル値~X4=15については、対応する対数スペクトル包絡値L4=-3であるため、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から3桁の数値1, 1, 1を取り除く。
この際、上記の予め定めた規則Rrでは、取り除かれた数値の順位は、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位桁の数値1が1番目の順(1)、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位桁の数値0が2番目の順(2)、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から2桁目の数値1が3番目の順(3)、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位から2桁目の数値0が4番目の順(4)、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から3桁目の数値1が5番目の順(5)である。追加する側では、量子化スペクトル値^X1の二進数表記における最下位から3桁目の順位が1番目(1)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位桁の数値1をこの桁に追加する。また、量子化スペクトル値^X1の二進数表記における最下位から2桁目の順位が2番目(2)であるので、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0における最下位桁の数値0をこの桁に追加する。また、量子化スペクトル値^X0の二進数表記における最下位桁の順位が3番目(3)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位から2桁目の数値1をこの桁に追加する。また、量子化スペクトル値^X1の二進数表記における最下位桁の順位が4番目(4)であるので、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0における最下位から2桁目の数値0をこの桁に追加する。また、量子化スペクトル値^X2の二進数表記における最下位桁の順位が5番目(5)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位から3桁目の数値1をこの桁に追加する。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化処理は、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkに対応する対数スペクトル包絡値Lkを乗算する処理と、平滑化スペクトル系列~X0,~X1,…,~XN-1に含まれる情報が全て量子化スペクトル系列^X0,^X1,…,^XN-1に含まれるようにする処理と、を両立させる処理であり、符号化装置11の信号平滑化部116の平滑化部116aが行う平滑化処理に対応する処理である。
なお、信号逆平滑化部126の平滑化系列復号部126bは、符号化装置11の信号平滑化部116の平滑化系列符号化部116bに対応する復号処理を行えばよい。すなわち、信号逆平滑化部126の平滑化系列復号部126bは、全てのサンプルを同じビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であっても、サンプル位置毎に予め定められたビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であっても、サンプル位置の範囲毎に予め定められたビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であってもよい。
[逆量子化部125]
逆量子化部125には、多重分離部127の出力した量子化幅符号CQと、信号逆平滑化部126が出力した量子化スペクトル系列^X0,^X1,…,^XN-1と、が入力される。逆量子化部125は、入力された量子化幅符号CQを復号して量子化幅を得る。また、逆量子化部125は、入力された量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値と、復号により得た量子化幅とを掛け合わせたサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を得て時間領域変換部121に出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。つまり、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。
逆量子化部125には、多重分離部127の出力した量子化幅符号CQと、信号逆平滑化部126が出力した量子化スペクトル系列^X0,^X1,…,^XN-1と、が入力される。逆量子化部125は、入力された量子化幅符号CQを復号して量子化幅を得る。また、逆量子化部125は、入力された量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値と、復号により得た量子化幅とを掛け合わせたサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を得て時間領域変換部121に出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。つまり、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。
[時間領域変換部121]
時間領域変換部121には、逆量子化部125が出力した復号スペクトル系列X0,X1,…,XN-1が入力される。時間領域変換部121は、フレーム毎に、周波数領域のN点のサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を、符号化装置11の周波数領域変換部111に対応する逆変換である(例えば逆MDCT)を用いて、時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得、出力信号として出力する。なお、符号化装置11における周波数領域変換部111において、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理が施されている場合には、時間領域変換部121は、まず、符号化装置11が行ったフィルタ処理や圧伸処理に対応する逆変換を復号スペクトル系列X0,X1,…,XN-1に行い、逆変換後の系列を時間領域の信号に変換して出力する。すなわち、時間領域変換部121は、周波数領域スペクトル系列を時間領域に変換して所定時間区間の復号された時系列信号を得る。
時間領域変換部121には、逆量子化部125が出力した復号スペクトル系列X0,X1,…,XN-1が入力される。時間領域変換部121は、フレーム毎に、周波数領域のN点のサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を、符号化装置11の周波数領域変換部111に対応する逆変換である(例えば逆MDCT)を用いて、時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得、出力信号として出力する。なお、符号化装置11における周波数領域変換部111において、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理が施されている場合には、時間領域変換部121は、まず、符号化装置11が行ったフィルタ処理や圧伸処理に対応する逆変換を復号スペクトル系列X0,X1,…,XN-1に行い、逆変換後の系列を時間領域の信号に変換して出力する。すなわち、時間領域変換部121は、周波数領域スペクトル系列を時間領域に変換して所定時間区間の復号された時系列信号を得る。
≪誤りが生じた場合≫
第一実施形態の符号化装置11が出力した出力符号が復号装置12に入力されるまでの間で誤りが生じた場合の例を、図5Aから図5Cを用いて説明する。この例では、入力符号に含まれる信号符号CXに誤りが含まれずに、信号符号CXの復号により正しい平滑化スペクトル系列~X0=6, ~X1=6, ~X2=10, ~X3=8, ~X4=15が得られたものの、入力符号に含まれる線形予測係数符号Cα(スペクトル包絡を表す符号)に誤りが含まれ、正しくは対数スペクトル包絡系列L0=1, L1=3, L2=1, L3=-2, L4=-3であるところが、線形予測係数符号Cαを復号して得た対数スペクトル包絡系列がL0=2, L1=2, L2=0, L3=-2, L4=-2であったとする。この場合、平滑化スペクトル値~X0=6については、対応する対数スペクトル包絡値L0=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X1=6については、対応する対数スペクトル包絡値L1=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X2=10については、対応する対数スペクトル包絡値L2=0であるため、桁の追加や削除は行わないことになる。平滑化スペクトル値~X3=8については、対応する対数スペクトル包絡値L3=-2であるため、最下位から2桁の数値0, 0を取り除くことになる。平滑化スペクトル値~X4=15については、対応する対数スペクトル包絡値L4=-2であるため、最下位から2桁の数値1, 1を取り除くことになる(図5A)。取り除かれた4つの数値は、上記の予め定めた規則Rrに従って、平滑化スペクトル値~X0および平滑化スペクトル値~X1に追加され(図5B)、量子化スペクトル値^Xo=24, ^X1=27, ^X2=10, ^X3=2, ^X4=3が得られる(図5C)。得られた量子化スペクトル値は正しくないものの、量子化スペクトル値には対数スペクトル包絡値の誤りと同程度の誤りが生じるだけである。例えば、対数スペクトル包絡の値が誤りにより1増えてしまった場合には、それに対応するスペクトル包絡値は2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の2倍程度の誤りで収まることになる。また例えば、対数スペクトル包絡の値が誤りにより1減ってしまった場合には、それに対応するスペクトル包絡値は1/2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の1/2倍程度の誤りで収まることになる。また、線形予測係数符号Cαにいくら誤りが生じても、量子化スペクトル系列のサンプル数には誤りは絶対に生じない。
第一実施形態の符号化装置11が出力した出力符号が復号装置12に入力されるまでの間で誤りが生じた場合の例を、図5Aから図5Cを用いて説明する。この例では、入力符号に含まれる信号符号CXに誤りが含まれずに、信号符号CXの復号により正しい平滑化スペクトル系列~X0=6, ~X1=6, ~X2=10, ~X3=8, ~X4=15が得られたものの、入力符号に含まれる線形予測係数符号Cα(スペクトル包絡を表す符号)に誤りが含まれ、正しくは対数スペクトル包絡系列L0=1, L1=3, L2=1, L3=-2, L4=-3であるところが、線形予測係数符号Cαを復号して得た対数スペクトル包絡系列がL0=2, L1=2, L2=0, L3=-2, L4=-2であったとする。この場合、平滑化スペクトル値~X0=6については、対応する対数スペクトル包絡値L0=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X1=6については、対応する対数スペクトル包絡値L1=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X2=10については、対応する対数スペクトル包絡値L2=0であるため、桁の追加や削除は行わないことになる。平滑化スペクトル値~X3=8については、対応する対数スペクトル包絡値L3=-2であるため、最下位から2桁の数値0, 0を取り除くことになる。平滑化スペクトル値~X4=15については、対応する対数スペクトル包絡値L4=-2であるため、最下位から2桁の数値1, 1を取り除くことになる(図5A)。取り除かれた4つの数値は、上記の予め定めた規則Rrに従って、平滑化スペクトル値~X0および平滑化スペクトル値~X1に追加され(図5B)、量子化スペクトル値^Xo=24, ^X1=27, ^X2=10, ^X3=2, ^X4=3が得られる(図5C)。得られた量子化スペクトル値は正しくないものの、量子化スペクトル値には対数スペクトル包絡値の誤りと同程度の誤りが生じるだけである。例えば、対数スペクトル包絡の値が誤りにより1増えてしまった場合には、それに対応するスペクトル包絡値は2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の2倍程度の誤りで収まることになる。また例えば、対数スペクトル包絡の値が誤りにより1減ってしまった場合には、それに対応するスペクトル包絡値は1/2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の1/2倍程度の誤りで収まることになる。また、線形予測係数符号Cαにいくら誤りが生じても、量子化スペクトル系列のサンプル数には誤りは絶対に生じない。
例示はしないが、入力符号に含まれる信号符号CXに誤りが含まれた場合には、信号符号CXの復号により得られる平滑化スペクトル系列のうち、符号に誤りが生じた平滑化スペクトルの値には誤りが生じるが、符号に誤りが生じていない平滑化スペクトルの値には誤りは生じない。すなわち、信号符号CXの誤りは、信号符号CX中の誤りが生じたビットが対応する平滑化スペクトルの値のみにしか影響しない。また、信号符号CXにいくら誤りが生じても、量子化スペクトル系列のサンプル数には誤りは絶対に生じない。
<第二実施形態>
フレームが十分短い場合、つまり上記Nが小さい場合(例えば、N=32の場合)においては、周波数スペクトル系列から線形予測係数を求めて、求めた線形予測係数に対応する対数スペクトル包絡系列を求めるよりも、周波数スペクトル系列から対数スペクトル包絡系列を直接求めるほうが、少ない演算量で実装できることがある。第二実施形態では、周波数スペクトル系列から対数スペクトル包絡系列を直接求める方法として対数スペクトル包絡系列をベクトル量子化により得る符号化装置、およびこの符号化装置に対応する復号装置について説明する。
フレームが十分短い場合、つまり上記Nが小さい場合(例えば、N=32の場合)においては、周波数スペクトル系列から線形予測係数を求めて、求めた線形予測係数に対応する対数スペクトル包絡系列を求めるよりも、周波数スペクトル系列から対数スペクトル包絡系列を直接求めるほうが、少ない演算量で実装できることがある。第二実施形態では、周波数スペクトル系列から対数スペクトル包絡系列を直接求める方法として対数スペクトル包絡系列をベクトル量子化により得る符号化装置、およびこの符号化装置に対応する復号装置について説明する。
≪符号化装置21≫
図6Aを参照して、第二実施形態の符号化装置21が実行する符号化方法の処理手続きを説明する。第二実施形態の符号化装置21は、第一実施形態の符号化装置21における線形予測分析部112、スペクトル包絡生成部113、および対数包絡生成部114に代えて、対数包絡符号化部214を備える以外は、第一実施形態の符号化装置11と同一の構成である。以下、第一実施形態の符号化装置11と異なる点について説明する。以降、第一実施形態と共通する部分については、第一実施形態と同じ参照番号を用いて説明を簡略化する。
図6Aを参照して、第二実施形態の符号化装置21が実行する符号化方法の処理手続きを説明する。第二実施形態の符号化装置21は、第一実施形態の符号化装置21における線形予測分析部112、スペクトル包絡生成部113、および対数包絡生成部114に代えて、対数包絡符号化部214を備える以外は、第一実施形態の符号化装置11と同一の構成である。以下、第一実施形態の符号化装置11と異なる点について説明する。以降、第一実施形態と共通する部分については、第一実施形態と同じ参照番号を用いて説明を簡略化する。
[対数包絡符号化部214]
対数包絡符号化部214には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。対数包絡符号化部214は、入力された周波数スペクトル系列X0,X1,…,XN-1に含まれる周波数スペクトル値に基づいて対数スペクトル包絡系列L0,L1,…,LN-1を求め、対数スペクトル包絡系列L0,L1,…,LN-1を信号平滑化部116へ、対数スペクトル包絡系列に対応する符号である包絡符号CLを多重化部117へ出力する。
対数包絡符号化部214には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。対数包絡符号化部214は、入力された周波数スペクトル系列X0,X1,…,XN-1に含まれる周波数スペクトル値に基づいて対数スペクトル包絡系列L0,L1,…,LN-1を求め、対数スペクトル包絡系列L0,L1,…,LN-1を信号平滑化部116へ、対数スペクトル包絡系列に対応する符号である包絡符号CLを多重化部117へ出力する。
対数包絡符号化部214が対数スペクトル包絡系列L0,L1,…,LN-1を得る方法として、ベクトル量子化を行う方法を例示する。対数包絡符号化部214内の図示しない記憶部に、予め、総和が0となるようなN個の整数で構成される対数スペクトル包絡系列L0,L1,…,LN-1の複数個の候補について、各候補の対数スペクトル包絡系列L0,L1,…,LN-1と、各候補の対数スペクトル包絡系列L0,L1,…,LN-1の各対数スペクトル包絡値を指数とした2のべき乗の系列であるスペクトル包絡系列H0,H1,…,HN-1と、各候補の対数スペクトル包絡系列L0,L1,…,LN-1に対応する符号と、による組を記憶しておく。すなわち、対数包絡符号化部214内の図示しない記憶部には、対数スペクトル包絡系列L0,L1,…,LN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補に対応するスペクトル包絡系列H0,H1,…,HN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補を特定可能な符号と、による組が複数組予め記憶されている。対数包絡符号化部214は、当該記憶部に予め記憶された複数個の組のうち、スペクトル包絡系列H0,H1,…,HN-1の候補が入力された周波数スペクトル系列X0,X1,…,XN-1(所定時間区間の時系列信号)に対応するスペクトル包絡系列H0,H1,…,HN-1に対応する組を選択して、当該選択した組の対数スペクトル包絡系列L0,L1,…,LN-1の候補を対数スペクトル包絡系列L0,L1,…,LN-1として得、当該選択した組の符号を包絡符号CL(スペクトル包絡を表す符号)として得て出力する。例えば、対数包絡符号化部214は、当該記憶部内に記憶されたスペクトル包絡系列H0,H1,…,HN-1のそれぞれについて、入力された周波数スペクトル系列X0,X1,…,XN-1中の各周波数スペクトル値Xkとスペクトル包絡系列H0,H1,…,HN-1中の対応するスペクトル包絡値Hkとの比の系列のエネルギーを求め、エネルギーが最小となるスペクトル包絡系列H0,H1,…,HN-1に対応する対数スペクトル包絡系列L0,L1,…,LN-1と包絡符号CLとを出力する。
[多重化部117]
多重化部117は、スペクトル包絡を表す符号として、第一実施形態の線形予測分析部112またはスペクトル包絡生成部113が出力した線形予測係数符号Cαまたは包絡符号CLに代えて、対数包絡符号化部214が出力した包絡符号CLを用いる以外は、第一実施形態の多重化部117と同じ動作をする。
多重化部117は、スペクトル包絡を表す符号として、第一実施形態の線形予測分析部112またはスペクトル包絡生成部113が出力した線形予測係数符号Cαまたは包絡符号CLに代えて、対数包絡符号化部214が出力した包絡符号CLを用いる以外は、第一実施形態の多重化部117と同じ動作をする。
≪復号装置22≫
図6Bを参照して、第二実施形態の復号装置22の機能構成、および復号装置22が実行する復号方法の処理手続きを説明する。第二実施形態の復号装置22は、第一実施形態の復号装置12におけるスペクトル包絡生成部123、および対数包絡生成部114に代えて、対数包絡復号部224を備える以外は、第一実施形態の復号装置12と同様の構成である。以下、第一実施形態の復号装置12と異なる点について説明する。
図6Bを参照して、第二実施形態の復号装置22の機能構成、および復号装置22が実行する復号方法の処理手続きを説明する。第二実施形態の復号装置22は、第一実施形態の復号装置12におけるスペクトル包絡生成部123、および対数包絡生成部114に代えて、対数包絡復号部224を備える以外は、第一実施形態の復号装置12と同様の構成である。以下、第一実施形態の復号装置12と異なる点について説明する。
[多重分離部127]
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である包絡符号CLを対数包絡復号部224へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である包絡符号CLを対数包絡復号部224へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
[対数包絡復号部224]
対数包絡復号部224内の図示しない記憶部には、予め、対応する符号化装置21の対数包絡符号化部214の図示しない記憶部に記憶されているのと同じ、総和が0となるようなN個の整数で構成される対数スペクトル包絡系列L0,L1,…,LN-1の複数個の候補について、各候補の対数スペクトル包絡系列L0,L1,…,LN-1と、各系列に対応する符号と、による組を記憶しておく。すなわち、対数包絡復号部224内の図示しない記憶部には、対数スペクトル包絡系列L0,L1,…,LN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補を特定可能な符号と、による組が複数組予め記憶されている。対数包絡復号部224には、多重分離部127が出力した包絡符号CLが入力される。対数包絡復号部224は、入力された包絡符号CLに対応する対数スペクトル包絡系列L0,L1,…,LN-1を記憶部から得て信号逆平滑化部126に出力する。すなわち、対数包絡復号部224は、当該記憶部に予め記憶された複数個の組のうち、符号が包絡符号CLに対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補を対数スペクトル包絡系列L0,L1,…,LN-1として得て信号逆平滑化部126に出力する。
対数包絡復号部224内の図示しない記憶部には、予め、対応する符号化装置21の対数包絡符号化部214の図示しない記憶部に記憶されているのと同じ、総和が0となるようなN個の整数で構成される対数スペクトル包絡系列L0,L1,…,LN-1の複数個の候補について、各候補の対数スペクトル包絡系列L0,L1,…,LN-1と、各系列に対応する符号と、による組を記憶しておく。すなわち、対数包絡復号部224内の図示しない記憶部には、対数スペクトル包絡系列L0,L1,…,LN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補を特定可能な符号と、による組が複数組予め記憶されている。対数包絡復号部224には、多重分離部127が出力した包絡符号CLが入力される。対数包絡復号部224は、入力された包絡符号CLに対応する対数スペクトル包絡系列L0,L1,…,LN-1を記憶部から得て信号逆平滑化部126に出力する。すなわち、対数包絡復号部224は、当該記憶部に予め記憶された複数個の組のうち、符号が包絡符号CLに対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補を対数スペクトル包絡系列L0,L1,…,LN-1として得て信号逆平滑化部126に出力する。
<第三実施形態>
以上説明したように、第一実施形態の符号化装置11も第二実施形態の符号化装置21も要するに図7Aに示す符号化装置31に相当する。符号化装置31は、周波数領域変換部111、対数スペクトル包絡生成部314、量子化部115、信号平滑化部116、および多重化部117を含む。対数スペクトル包絡生成部314は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、当該対数スペクトル包絡系列を特定可能な符号である包絡符号CLと、を得て出力する。第一実施形態の符号化装置11では、線形予測分析部112(包絡符号化部)、スペクトル包絡生成部113、および対数包絡生成部114を含む機能構成が対数スペクトル包絡生成部314に相当する。第二実施形態の符号化装置21では、対数包絡符号化部214を含む機能構成が対数スペクトル包絡生成部314に相当する。また、信号平滑化部116は、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るものである。この予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。
以上説明したように、第一実施形態の符号化装置11も第二実施形態の符号化装置21も要するに図7Aに示す符号化装置31に相当する。符号化装置31は、周波数領域変換部111、対数スペクトル包絡生成部314、量子化部115、信号平滑化部116、および多重化部117を含む。対数スペクトル包絡生成部314は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、当該対数スペクトル包絡系列を特定可能な符号である包絡符号CLと、を得て出力する。第一実施形態の符号化装置11では、線形予測分析部112(包絡符号化部)、スペクトル包絡生成部113、および対数包絡生成部114を含む機能構成が対数スペクトル包絡生成部314に相当する。第二実施形態の符号化装置21では、対数包絡符号化部214を含む機能構成が対数スペクトル包絡生成部314に相当する。また、信号平滑化部116は、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るものである。この予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。
同様に、第一実施形態の復号装置12も第二実施形態の復号装置22も図7Bに示す復号装置32に相当する。復号装置32は、時間領域変換部121、対数スペクトル包絡復号部324、逆量子化部125、信号逆平滑化部126、および多重分離部127を含む。対数スペクトル包絡復号部324は、入力された包絡符号CLを復号し、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る。第一実施形態の復号装置12では、スペクトル包絡生成部123および対数包絡生成部124を含む機能構成が対数スペクトル包絡復号部324に相当する。第二実施形態の復号装置22では、対数包絡復号部224を含む機能構成が対数スペクトル包絡復号部324に相当する。信号逆平滑化部126は、固定長の符号である信号符号を復号して所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、平滑化スペクトル系列~X0,~X1,…,~XN-1について、~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得る。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して周波数領域スペクトル系列X0,X1,…,XN-1を得て出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である周波数領域スペクトル系列X0,X1,…,XN-1を得る。時間領域変換部121は、周波数領域スペクトル系列X0,X1,…,XN-1を時間領域に変換して所定時間区間の復号された時系列信号である出力信号を得て出力する。
<第四実施形態>
図8Aに例示するように、音信号などの時系列信号である入力信号を入力とし、第一実施形態の符号化装置11、第二実施形態の符号化装置21、または第三実施形態の符号化装置31の信号平滑化部116の平滑化部116aで得られる平滑化スペクトル系列~X0,~X1,…,~XN-1を出力する平滑化装置41が構成されてもよい。平滑化装置41は、周波数領域変換部111、対数スペクトル包絡生成部414、量子化部115、平滑化部116a、および多重化部117を含む。対数スペクトル包絡生成部414は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。対数スペクトル包絡生成部414は、第三実施形態の対数スペクトル包絡生成部413と同一構成であってもよいし、対数スペクトル包絡生成部413の機能構成から包絡符号CLを得て出力する機能構成を除外したものであってもよい。平滑化部116aは、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。対数スペクトル包絡生成部414が包絡符号CLを出力するのであれば、平滑化装置41が包絡符号CLを出力してもよい。
図8Aに例示するように、音信号などの時系列信号である入力信号を入力とし、第一実施形態の符号化装置11、第二実施形態の符号化装置21、または第三実施形態の符号化装置31の信号平滑化部116の平滑化部116aで得られる平滑化スペクトル系列~X0,~X1,…,~XN-1を出力する平滑化装置41が構成されてもよい。平滑化装置41は、周波数領域変換部111、対数スペクトル包絡生成部414、量子化部115、平滑化部116a、および多重化部117を含む。対数スペクトル包絡生成部414は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。対数スペクトル包絡生成部414は、第三実施形態の対数スペクトル包絡生成部413と同一構成であってもよいし、対数スペクトル包絡生成部413の機能構成から包絡符号CLを得て出力する機能構成を除外したものであってもよい。平滑化部116aは、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。対数スペクトル包絡生成部414が包絡符号CLを出力するのであれば、平滑化装置41が包絡符号CLを出力してもよい。
図8Bに例示するように、平滑化装置41から出力された平滑化スペクトル系列~X0,~X1,…,~XN-1を入力とし、平滑化スペクトル系列~X0,~X1,…,~XN-1の逆平滑化を行う逆平滑化装置42が構成されてもよい。逆平滑化装置42は、逆平滑化部126a、逆量子化部125、および時間領域変換部121を含む。平滑化装置41から出力された包絡符号CLが入力される逆平滑化装置42は、さらに前述の対数スペクトル包絡復号部324を含む。逆平滑化装置42が対数スペクトル包絡系列L0,L1,…,LN-1を取得可能であり、平滑化装置41から平滑化スペクトル系列~X0,~X1,…,~XN-1が出力される場合、その平滑化スペクトル系列~X0,~X1,…,~XN-1が逆平滑化部126aに入力される。平滑化装置41から平滑化スペクトル系列~X0,~X1,…,~XN-1および包絡符号CLが出力される場合、平滑化スペクトル系列~X0,~X1,…,~XN-1は逆平滑化部126aに入力され、包絡符号CLは対数スペクトル包絡復号部324に入力される。包絡符号CLが入力された対数スペクトル包絡復号部324は、前述のように包絡符号CLを復号することで対数スペクトル包絡系列L0,L1,…,LN-1を得、当該対数スペクトル包絡系列L0,L1,…,LN-1を逆平滑化部126aに入力する。逆平滑化部126aは、平滑化スペクトル系列~X0,~X1,…,~XN-1および対数スペクトル包絡系列L0,L1,…,LN-1を入力とし、前述のように対数スペクトル包絡系列L0,L1,…,LN-1を用いて平滑化スペクトル系列~X0,~X1,…,~XN-1の逆平滑化を行って、量子化スペクトル系列^X0,^X1,…,^XN-1を得て出力する。すなわち、逆平滑化部126aは、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、平滑化スペクトル系列~X0,~X1,…,~XN-1について、~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て出力する。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して周波数領域スペクトル系列X0,X1,…,XN-1を得て出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である周波数領域スペクトル系列X0,X1,…,XN-1を得る。時間領域変換部121は、周波数領域スペクトル系列X0,X1,…,XN-1を時間領域に変換して所定時間区間の復号された時系列信号である出力信号を得て出力する。
<変形例等>
なお、本発明は上述の実施形態に限定されるものではない。例えば、上記の各実施形態の符号化装置11,21,31の信号平滑化部116の平滑化系列符号化部116bでは、平滑化により得た平滑化スペクトル系列の各サンプルを固定長で符号化して信号符号CXを得ているが、可変長符号化して信号符号CXを得る構成としてもよい。その際には、復号装置12,22,32の信号逆平滑化部126の平滑化系列復号部126bでは、信号符号CXを可変長復号して平滑化スペクトル系列を得ればよい。この変形例では、復号装置の入力符号に含まれる信号符号CXに誤りが含まれた場合には信号符号CX中の誤りが生じたビットが対応する平滑化スペクトルの値以外にも誤りの影響が生じることはあるが、復号装置12,22の入力符号に含まれる線形予測係数符号Cαにいくら誤りが生じても量子化スペクトル系列のサンプル数には誤りが生じないのは上記の各実施形態と同様である。
なお、本発明は上述の実施形態に限定されるものではない。例えば、上記の各実施形態の符号化装置11,21,31の信号平滑化部116の平滑化系列符号化部116bでは、平滑化により得た平滑化スペクトル系列の各サンプルを固定長で符号化して信号符号CXを得ているが、可変長符号化して信号符号CXを得る構成としてもよい。その際には、復号装置12,22,32の信号逆平滑化部126の平滑化系列復号部126bでは、信号符号CXを可変長復号して平滑化スペクトル系列を得ればよい。この変形例では、復号装置の入力符号に含まれる信号符号CXに誤りが含まれた場合には信号符号CX中の誤りが生じたビットが対応する平滑化スペクトルの値以外にも誤りの影響が生じることはあるが、復号装置12,22の入力符号に含まれる線形予測係数符号Cαにいくら誤りが生じても量子化スペクトル系列のサンプル数には誤りが生じないのは上記の各実施形態と同様である。
また、上記の実施形態では、符号化装置11,21,31、および平滑化装置41に入力される音信号(時系列信号)として、音声や音楽などの音をマイクロホンで収音し、それによって得られる音を表すアナログ信号をAD変換したデジタル信号を例示した。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、その他の手段によって得られた音を表すアナログ信号をデジタル信号にAD変換して得られた音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。音を表すアナログ信号に対応するデジタル信号である音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。音を表すデジタル信号である音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。すなわち、音信号を得る方法は任意的である。音を表すアナログ信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。この場合には、符号化装置11,21,31、または平滑化装置41でこのアナログ信号をAD変換して得られるデジタル信号を音信号として用いてもよい。すなわち、符号化装置11,21,31、または平滑化装置41にデジタル信号が入力されることも任意的である。
上記の実施形態では、符号化装置11,21,31、または平滑化装置41に時間領域の音信号が入力され、この時間領域の音信号が周波数スペクトル系列X0,X1,…,XN-1に変換された。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、周波数スペクトル系列X0,X1,…,XN-1が符号化装置11,21,31、または平滑化装置41に入力されてもよい。この場合には符号化装置11,21,31、または平滑化装置41が周波数領域変換部111を備えなくてもよい。すなわち、周波数領域変換部111は符号化装置11,21,31、または平滑化装置41にとって任意的な要素である。
上記の実施形態では、復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1を時間領域の信号に変換してフレーム単位の音信号を得、それを出力信号として出力した。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1を出力信号として出力してもよい。この場合には復号装置12,22,32、または逆平滑化装置42が時間領域変換部121を備えなくてもよい。すなわち、時間領域変換部121は復号装置12,22,32、または逆平滑化装置42にとって任意的な要素である。復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1の関数値を出力信号として出力してもよい。復号装置12,22,32、または逆平滑化装置42から出力される出力信号がスピーカから再生されることなく、他の処理の入力信号とされてもよい。すなわち、復号装置12,22,32、または逆平滑化装置42から出力される出力信号がスピーカから再生されることも任意的である。
なお、信号平滑化部116の平滑化部116aまたは平滑化装置41の平滑化部116aは、^Xkに対応するLkが正値であるすべての^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値であるすべての^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとするのが望ましい。ただし、信号平滑化部116の平滑化部116aまたは平滑化装置41の平滑化部116aは、^Xkに対応するLkが正値である一部の^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除かずにそのまま平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である一部の^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加せずにそのまま平滑化スペクトル値~Xkとしてもよい。同様に、信号逆平滑化部126の逆平滑化部126aまたは逆平滑化装置42の逆平滑化部126aは、~Xkに対応するLkが負値であるすべての~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値であるすべての~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとするのが望ましい。ただし、信号逆平滑化部126の逆平滑化部126aまたは逆平滑化装置42の逆平滑化部126aは、~Xkに対応するLkが負値である一部の~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除かずにそのまま量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である一部の~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加せずにそのまま量子化スペクトル値^Xkとしてもよい。
時系列信号が音信号以外の時系列信号(例えば、動画信号、地震波信号、生体信号など)であってもよい。すなわち、時系列信号が音信号であることも任意的である。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
上記の各装置は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。
上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されるのではなく、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。
11,21,31,1011 符号化装置
12,22,32,1012 復号装置
41 平滑化装置
42 逆平滑化装置
12,22,32,1012 復号装置
41 平滑化装置
42 逆平滑化装置
Claims (20)
- 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、
当該対数スペクトル包絡系列を特定可能な符号である包絡符号と、
を得る対数スペクトル包絡生成部と、
前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、
前記得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るものであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
信号平滑化部と、
を含む符号化装置。 - 請求項1の符号化装置であって、
前記対数スペクトル包絡生成部は、
前記対数スペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補に対応するスペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補を特定可能な符号と、による組が複数組予め記憶されており、
前記予め記憶された複数個の組のうち、スペクトル包絡系列の候補が前記所定時間区間の時系列信号に対応するスペクトル包絡系列に対応する組を選択して、当該選択した組の対数スペクトル包絡系列の候補を前記対数スペクトル包絡系列として得、当該選択した組の符号を包絡符号として得る対数包絡符号化部
を含む符号化装置。 - 請求項1の符号化装置であって、
前記対数スペクトル包絡生成部は、
前記時系列信号に対応するスペクトル包絡系列と、当該スペクトル包絡系列に対応する包絡符号と、を得、
前記スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列を得、
前記整数値列に含まれる値の総和が0である場合には、前記整数値列を前記対数スペクトル包絡系列とし、
前記整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、前記整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を前記対数スペクトル包絡系列として得る
ものである
符号化装置。 - 入力された包絡符号を復号し、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡復号部と、
固定長の符号である信号符号を復号して前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、
前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
信号逆平滑化部と、
を含む復号装置。 - 請求項4の復号装置であって、
前記対数スペクトル包絡復号部は、
前記対数スペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補を特定可能な符号と、による組が複数組予め記憶されており、
前記予め記憶された複数個の組のうち、符号が前記包絡符号に対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補を前記対数スペクトル包絡系列L0,L1,…,LN-1として得る対数包絡復号部を含む、復号装置。 - 請求項4の復号装置であって、
前記対数スペクトル包絡復号部は、
前記包絡符号を復号して前記スペクトル包絡系列を得るスペクトル包絡生成部と、
前記スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列を得、
前記整数値列に含まれる値の総和が0である場合には、前記整数値列を前記対数スペクトル包絡系列とし、
前記整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、前記整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を前記対数スペクトル包絡系列として得る対数包絡生成部と、
を含む復号装置。 - 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡生成部と、
前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得るものであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
平滑化部と、
を含む平滑化装置。 - 所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、
前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
逆平滑化部
を含む逆平滑化装置。 - 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、
当該対数スペクトル包絡系列を特定可能な符号である包絡符号と、
を得る対数スペクトル包絡生成ステップと、
前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、
前記得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るステップであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
信号平滑化ステップと、
を含む符号化方法。 - 入力された包絡符号を復号し、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡復号ステップと、
固定長の符号である信号符号を復号して前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、
前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るステップであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
信号逆平滑化ステップと、
を含む復号方法。 - 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡生成ステップと、
前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得るステップであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
平滑化ステップと、
を含む平滑化方法。 - 所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、
前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
逆平滑化ステップ
を含む逆平滑化方法。 - 請求項1から3の何れかの符号化装置としてコンピュータを機能させるためのプログラム。
- 請求項4から6の何れかの復号装置としてコンピュータを機能させるためのプログラム。
- 請求項7の平滑化装置としてコンピュータを機能させるためのプログラム。
- 請求項8の逆平滑化装置としてコンピュータを機能させるためのプログラム。
- 請求項1から3の何れかの符号化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項4から6の何れかの復号装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項7の平滑化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項8の逆平滑化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019523392A JP6780108B2 (ja) | 2017-06-07 | 2018-04-24 | 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム |
EP18813038.9A EP3637418B1 (en) | 2017-06-07 | 2018-04-24 | Encoding device, decoding device, smoothing device, reverse-smoothing device, methods therefor, and program |
US16/617,785 US11087774B2 (en) | 2017-06-07 | 2018-04-24 | Encoding apparatus, decoding apparatus, smoothing apparatus, inverse smoothing apparatus, methods therefor, and recording media |
CN201880037112.0A CN110709927B (zh) | 2017-06-07 | 2018-04-24 | 编码装置、解码装置、平滑化装置、逆平滑化装置、其方法及记录介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-112242 | 2017-06-07 | ||
JP2017112242 | 2017-06-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018225412A1 true WO2018225412A1 (ja) | 2018-12-13 |
Family
ID=64567301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2018/016564 WO2018225412A1 (ja) | 2017-06-07 | 2018-04-24 | 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11087774B2 (ja) |
EP (1) | EP3637418B1 (ja) |
JP (1) | JP6780108B2 (ja) |
CN (1) | CN110709927B (ja) |
WO (1) | WO2018225412A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016200750A (ja) * | 2015-04-13 | 2016-12-01 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1603262B1 (en) * | 2004-05-28 | 2007-01-17 | Alcatel | Multi-rate speech codec adaptation method |
KR101364979B1 (ko) * | 2006-02-24 | 2014-02-20 | 오렌지 | 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈 |
MX2011001253A (es) * | 2008-08-08 | 2011-03-21 | Panasonic Corp | Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral. |
US8463603B2 (en) * | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
US9031834B2 (en) * | 2009-09-04 | 2015-05-12 | Nuance Communications, Inc. | Speech enhancement techniques on the power spectrum |
ES2704742T3 (es) * | 2011-04-05 | 2019-03-19 | Nippon Telegraph & Telephone | Descodificación de una señal acústica |
KR101762210B1 (ko) * | 2012-05-30 | 2017-07-27 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
-
2018
- 2018-04-24 WO PCT/JP2018/016564 patent/WO2018225412A1/ja unknown
- 2018-04-24 CN CN201880037112.0A patent/CN110709927B/zh active Active
- 2018-04-24 EP EP18813038.9A patent/EP3637418B1/en active Active
- 2018-04-24 US US16/617,785 patent/US11087774B2/en active Active
- 2018-04-24 JP JP2019523392A patent/JP6780108B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016200750A (ja) * | 2015-04-13 | 2016-12-01 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
Non-Patent Citations (5)
Title |
---|
BACKSTROM, T. ET AL.: "Arithmetic coding of speech and audio spectra using TCX based on linear predictive spectral envelopes", 2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 19 April 2015 (2015-04-19), pages 5127 - 5131, XP033064629 * |
FERREIRA, A. J. S .: "Combined spectral envelope normalization and subtraction of sinusoidal components in the ODFT and MDCT frequency domains", 2001 IEEE WORKSHOP ON THE APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS, 21 October 2001 (2001-10-21), pages 51 - 54, XP010566872 * |
MORIYA, TAKEHIRO ET AL.: "Progress in LPC-based frequency-domain audio coding", APSIPA TRANSACTIONS ON SIGNAL AND INFORMATION PROCESSING, vol. 5, 31 May 2016 (2016-05-31), pages 1 - 10, XP055336101, [retrieved on 20180628] * |
See also references of EP3637418A4 |
T. BACKSTROMC.R. HELMRICH: "Arithmetic encoding of speech and audio spectra using tcx based on linear predictive spectral envelopes", PROC. ICASSP 2015, April 2015 (2015-04-01), pages 5127 - 5131 |
Also Published As
Publication number | Publication date |
---|---|
US20200194018A1 (en) | 2020-06-18 |
CN110709927A (zh) | 2020-01-17 |
JPWO2018225412A1 (ja) | 2020-03-19 |
US11087774B2 (en) | 2021-08-10 |
JP6780108B2 (ja) | 2020-11-04 |
EP3637418A1 (en) | 2020-04-15 |
CN110709927B (zh) | 2022-11-01 |
EP3637418A4 (en) | 2021-02-24 |
EP3637418B1 (en) | 2022-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2725178C1 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием коэффициента передачи побочного сигнала и коэффициента передачи остаточного сигнала | |
CA2804907C (en) | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction | |
JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
TWI590233B (zh) | 解碼器及其解碼方法、編碼器及其編碼方法、電腦程式 | |
CN1905010B (zh) | 编码音频数据的设备和方法及解码音频数据的设备和方法 | |
JP2002335161A (ja) | 信号処理装置及び方法、信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
WO2018225412A1 (ja) | 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム | |
JP5336942B2 (ja) | 符号化方法、復号方法、符号化器、復号器、プログラム | |
JP5336943B2 (ja) | 符号化方法、復号方法、符号化器、復号器、プログラム | |
JP5361565B2 (ja) | 符号化方法、復号方法、符号化器、復号器およびプログラム | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
CN111788628B (zh) | 声音信号的编码装置、声音信号的编码方法以及记录介质 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP5635213B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 18813038 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2019523392 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2018813038 Country of ref document: EP Effective date: 20200107 |