[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2006211243A - Device and method for digital signal encoding - Google Patents

Device and method for digital signal encoding Download PDF

Info

Publication number
JP2006211243A
JP2006211243A JP2005020000A JP2005020000A JP2006211243A JP 2006211243 A JP2006211243 A JP 2006211243A JP 2005020000 A JP2005020000 A JP 2005020000A JP 2005020000 A JP2005020000 A JP 2005020000A JP 2006211243 A JP2006211243 A JP 2006211243A
Authority
JP
Japan
Prior art keywords
encoding
prediction
digital signal
signal
prediction coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005020000A
Other languages
Japanese (ja)
Inventor
Takayuki Hiekata
孝之 稗方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2005020000A priority Critical patent/JP2006211243A/en
Publication of JP2006211243A publication Critical patent/JP2006211243A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enable encoding of high compressibility even with respect to random signals of measured data, etc. without being restricted to a voice signal, etc. by using another reversible encoding method not using a predictor, a reversible encoding by the predictor as well. <P>SOLUTION: This device is equipped with encoders 203-1 to 203-3 which encode a residue signal calculated by a subtractor 212, and prediction coefficient specification information for specifying a prediction coefficient applied when a prediction signal used to calculate the residue signal is predicted, an encoder 203-0 for encoding digital signals of a predetermined number of samples acquired by a buffer 201 without making them pass through a predictor 202, and a code length calculator/selector 204 which selects either the encoders 203-1 to 203-3 or the encoder 203-0, on the basis of the code length of a code acquired by the encoders 203-1 to 203-3 and the encoder 203-0. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は,入力されるディジタル信号を可逆符号化する符号化技術に係り,特に,符号長の異なる予測係数が適用される予測器を複数備え,それら予測器から最適な予測器を選択することで前記ディジタル信号の高効率な圧縮を実現するディジタル信号符号化装置並びにディジタル信号符号化方法に関する。   The present invention relates to an encoding technique for lossless encoding of an input digital signal, and in particular, includes a plurality of predictors to which prediction coefficients having different code lengths are applied, and selects an optimal predictor from these predictors. The present invention relates to a digital signal encoding apparatus and a digital signal encoding method for realizing highly efficient compression of the digital signal.

近年,音声信号やオーディオ信号等のディジタル信号の冗長性を利用して符号化することでデータ量を圧縮し,ディジタル信号の記録/再生,或いは送受信に関する効率を向上させる技術が数多く開発されている。
これらの技術は,大別すると非可逆符号化(非可逆圧縮)と可逆符号化(可逆圧縮)に分けられる。
前者は,圧縮されたデータを復号しても,圧縮前のデータを完全に復元することはできず,MP3やAAC方式に代表されるようにデータの圧縮による聴覚的劣化を伴うものの,比較的高い圧縮率(1/10以下程度でも聴覚上大きな問題がない)の符号化が可能なものである。
一方,後者は,ロスレス符号化とも呼ばれ,圧縮(符号化)前の信号の完全復元が可能であるため聴覚的劣化は生じないが,比較的低い圧縮率(符号化される音声データによるが,概ね1/2程度)の符号化しかできないものである。
そのため,特にメモリ容量に制限のある携帯端末等を用いて前記音声信号を記録,再生するといった使用状況では,その圧縮率の優位性から,非可逆符号化が利用されることが多い。
In recent years, many techniques have been developed to compress the amount of data by encoding using the redundancy of digital signals such as audio signals and audio signals, and to improve the efficiency of recording / reproduction of digital signals or transmission / reception of digital signals. .
These technologies are roughly classified into lossy coding (lossy compression) and lossless coding (lossless compression).
In the former case, even if the compressed data is decoded, the data before compression cannot be completely restored, and although it is accompanied by auditory deterioration due to data compression as represented by MP3 and AAC methods, It is possible to encode a high compression rate (no significant auditory problem even at about 1/10 or less).
On the other hand, the latter is also referred to as lossless coding, and since the signal before compression (encoding) can be completely restored, auditory degradation does not occur, but a relatively low compression rate (depending on the encoded speech data). , Approximately 1/2).
Therefore, irreversible encoding is often used because of the superior compression ratio, especially in situations where the audio signal is recorded and reproduced using a portable terminal with limited memory capacity.

しかしながら,プログラムや文字データなどはデータが1ビットでも欠落すると異なる結果となることから,これらのデータを圧縮する場合は必ず可逆符号化が用いられる。また,オーディオ分野においても,高性能なオーディオ製品には非可逆符号化による音質劣化さえも許容できないものもある。更に,昨今の計測器分野では,複数チャンネルでセンサ等の出力信号(電圧,電流値等)を長時間計測するような計測装置(データロガー等)にも圧縮技術が用いられるようになってきており,かかる装置で計測された計測データも前記プログラムと同様に圧縮前後におけるデータの欠落は許されないため可逆符号化が採用されている。このように,圧縮前の信号と全く同一の信号が得られる可逆符号化に対するニーズは益々強くなる傾向にあり,その技術的課題となっている圧縮率を向上させる技術の開発が強く望まれている。   However, since a program, character data, and the like have different results if even one bit is lost, lossless encoding is always used when compressing these data. Also in the audio field, some high-performance audio products cannot tolerate even the deterioration of sound quality due to lossy encoding. Furthermore, in the recent field of measuring instruments, compression technology has come to be used for measuring devices (data loggers, etc.) that measure output signals (voltage, current value, etc.) of sensors, etc. for a long time using multiple channels. In addition, the measurement data measured by such an apparatus adopts lossless encoding because data loss before and after compression is not allowed, as in the case of the program. Thus, there is a growing need for lossless encoding that can obtain exactly the same signal as before compression, and there is a strong demand for the development of a technology that improves the compression ratio, which is a technical issue. Yes.

そこで,可逆符号化における圧縮率を向上する技術として,特許文献1に提案される音声符号化装置がある。この装置は,特性の異なる(つまりは,適用される予測係数が異なる)複数の予測器により入力された音声信号を予測し,その予測結果に基づいて(つまりは,残差信号を最小とする)それら複数の予測器のうち一つを選択し,その選択された予測器からの出力信号(即ち,残差信号)と該予測器(即ち,予測係数)を特定する信号とを符号化した後に出力するよう構成されている。このように構成された音声符号化装置によれば,音声信号に応じて最適な(即ち,残差信号を最小とし得る)予測器(予測係数)が選択されるため,音声信号を予測する予測精度を向上させることが可能となり,ひいては,符号化後の圧縮率の向上に寄与し得る。
しかしながら,前記特許文献1の音声符号化装置では,特性の異なる複数の予測器を有するものの,各予測器における予測係数は固定長(一定)であることを前提としており,符号化後の音声信号の符号長を最小にするという観点からすれば,必ずしも最適な予測器が選択されているとは言い難い。言い換えれば,予測器による予測精度を向上させるという観点では,予測係数の係数を変更するだけでなく,各予測器毎の予測係数の次数を変える,或いは各予測器毎の予測方式を変える等,各予測器毎の予測係数の符号長を可変長にする方が有利であるが,前記特許文献1の技術では,各予測器の予測係数は固定長であることが前提とならざるを得ず,予測係数の符号長の異なる予測器を適用し,更なる圧縮率の向上を図ることは不可能であった。
Therefore, as a technique for improving the compression rate in lossless encoding, there is a speech encoding apparatus proposed in Patent Document 1. This device predicts speech signals input by multiple predictors with different characteristics (ie, different applied prediction coefficients), and based on the prediction results (ie, minimizes the residual signal) ) One of the plurality of predictors is selected, and an output signal (that is, a residual signal) from the selected predictor and a signal specifying the predictor (that is, a prediction coefficient) are encoded. It is configured to output later. According to the speech coding apparatus configured as described above, an optimal predictor (prediction coefficient) that can minimize the residual signal is selected according to the speech signal. The accuracy can be improved, which can contribute to the improvement of the compression rate after encoding.
However, although the speech encoding apparatus of Patent Document 1 has a plurality of predictors having different characteristics, the prediction coefficient in each predictor is premised on a fixed length (constant), and the speech signal after encoding From the viewpoint of minimizing the code length, it is difficult to say that the optimal predictor is necessarily selected. In other words, in terms of improving the prediction accuracy by the predictor, not only the coefficient of the prediction coefficient is changed, but also the order of the prediction coefficient for each predictor is changed, or the prediction method for each predictor is changed, etc. Although it is more advantageous to make the code length of the prediction coefficient for each predictor variable, in the technique of Patent Document 1, it is necessary to assume that the prediction coefficient of each predictor has a fixed length. Therefore, it was impossible to further improve the compression ratio by applying predictors with different code lengths of the prediction coefficients.

そこで,このような問題を解決する手法として,本願出願人が先に出願した特許文献2に記載の音声符号化装置(音声符号化方法)がある。この装置は,固定長の予測係数ではなく,例えばフレームデータに応じて適宜算出される異なる予測係数が各予測器に割り当てられ,各予測器では各々の予測係数に基づいて入力された音声信号を予測し,そして,各々の予測器から出力される様々なパターンの複数の符号長を比較して,最小の符号長を出力する予測器を選択するよう構成されている。このような構成により,音声信号の予測精度を向上させ,その結果として,圧縮率を高めている。
特開2001−175295号公報 特開2004−170494号公報
Therefore, as a technique for solving such a problem, there is a speech encoding apparatus (speech encoding method) described in Patent Document 2 previously filed by the applicant of the present application. In this apparatus, different predictive coefficients that are appropriately calculated according to frame data, for example, are assigned to each predictor instead of fixed-length predictive coefficients, and each predictor receives an audio signal input based on each predictive coefficient. The prediction is performed, and a plurality of code lengths of various patterns output from the respective predictors are compared to select a predictor that outputs the minimum code length. With such a configuration, the prediction accuracy of the audio signal is improved, and as a result, the compression rate is increased.
JP 2001-175295 A JP 2004-170494 A

しかしながら,前記各特許文献に記載の音声符号化装置は,音声信号,オーディオ信号などのように,ある程度その発音メカニズム(音声波形等)の推測が可能な信号に対しては,十分な予測精度(予測性能)を得ることができるが,音声信号,オーディオ信号などとは異なり,信号波形を推測できないような信号,例えば計測データ或いはこの計測信号に含まれるノイズ等のランダム雑音などのランダム信号に対しては,予測器による信号の予測が十分にできない場合があり,期待するほどの圧縮効果が得られない場合があり得る。その一方で,前記ランダム信号に限っては,予測器を用いない他の可逆符号化を用いた方が高い圧縮率を実現する場合もあり得る。
そこで,本発明は,前記事情に鑑みてなされたものであり,その目的とするところは,予測器による可逆符号化だけでなく,予測器を用いない他の可逆符号化を併用することで,音声信号等に限らず,測定データ等のランダム信号に対しても高い圧縮率の符号化を可能とするディジタル信号符号化装置並びにディジタル信号符号化方法を提供することにある。
However, the speech coding apparatus described in each of the above patent documents has sufficient prediction accuracy (such as speech signals, audio signals, etc.) for a signal whose sounding mechanism (speech waveform etc.) can be estimated to some extent ( Prediction performance), but unlike voice signals, audio signals, etc., for signals that cannot be estimated, such as measurement data or random signals such as random noise such as noise included in the measurement signal In some cases, the predictor cannot predict the signal sufficiently, and the compression effect as expected may not be obtained. On the other hand, for the random signal, a higher compression rate may be realized by using other lossless encoding that does not use a predictor.
Therefore, the present invention has been made in view of the above circumstances, and the object of the present invention is to use not only lossless encoding by a predictor but also other lossless encoding not using a predictor, An object of the present invention is to provide a digital signal encoding apparatus and a digital signal encoding method capable of encoding with a high compression rate not only for speech signals but also for random signals such as measurement data.

前記目的を達成するために,本発明は,入力されるディジタル信号を可逆符号化するディジタル信号符号化装置であって,入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得手段と,複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測手段と,前記予測手段により予測された予測信号と前記サンプル取得手段により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出手段と,前記残差信号算出手段により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化手段と,前記サンプル取得手段により取得された所定サンプル数のディジタル信号を前記予測手段を介さずに符号化する第2の符号化手段と,前記第1の符号化手段および前記第2の符号化手段により得られる符号の符号長に基づいて,前記第1の符号化手段および前記第2の符号化手段のいずれか一を選択する符号化選択手段と,を具備してなることを特徴とするディジタル信号符号化装置として構成される。
このように構成されることにより,予測器(予測手段)を用いた符号化では十分な圧縮効果を得られないランダム信号等のディジタル信号であっても,高い圧縮率で符号化することが可能となる。
また,前記サンプル取得手段により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出手段を更に備え,前記第2の符号化手段が,前記有効ビット数検出手段により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが望ましい。例えばフレームデータ中の有効ビットレンジが分かれば他のビットレンジは情報として必要ないため,当該フレームデータを有効ビットレンジ分のデータに圧縮することができる。もちろん,このような符号化(圧縮)は前記第2の符号化手段の一例であって,予測器を用いない符号化であれば他の種々の符号化を適用することが可能である。
In order to achieve the above object, the present invention provides a digital signal encoding device for reversibly encoding an input digital signal, and a sample acquisition means for acquiring the input digital signal every predetermined number of samples; A plurality of prediction coefficients applied, and at least one prediction means for predicting a prediction signal of the current digital signal from a past digital signal by each prediction coefficient; a prediction signal predicted by the prediction means; and the sample acquisition means At least one residual signal calculating means for calculating a residual signal between a predetermined number of digital signals actually acquired by the method, a residual signal calculated by the residual signal calculating means, and the residual signal. Encoding prediction coefficient specifying information for specifying the prediction coefficient applied when predicting the prediction signal used to calculate the difference signal At least one first encoding means, second encoding means for encoding a digital signal of a predetermined number of samples acquired by the sample acquisition means without going through the prediction means, and the first encoding Coding selection means for selecting one of the first coding means and the second coding means based on the code length of the code obtained by the means and the second coding means. Thus, the digital signal encoding device is configured.
With this configuration, even a digital signal such as a random signal for which a sufficient compression effect cannot be obtained by encoding using a predictor (prediction means) can be encoded at a high compression rate. It becomes.
Further, it further comprises effective bit number detecting means for detecting the effective bit number of the digital signal having the predetermined number of samples acquired by the sample acquiring means, and the second encoding means is detected by the effective bit number detecting means. It is desirable to encode the effective bit number and the effective bit number specifying information for specifying the effective bit number. For example, if the effective bit range in the frame data is known, the other bit ranges are not necessary as information, so that the frame data can be compressed into data for the effective bit range. Of course, such encoding (compression) is an example of the second encoding means, and other various encodings can be applied as long as the encoding does not use a predictor.

前記予測手段における予測係数の一例としては,前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数が考えられる。
また,前記予測手段における予測係数の他の例としては,前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が考えられる。
前記予測手段における予測係数の別の例としては,前記符合化選択手段により過去に選択された第1の符合化手段で用いられた前記予測係数が考えられる。
As an example of the prediction coefficient in the prediction means, a prediction coefficient calculated by linear prediction analysis from a predetermined number of samples of the speech signal acquired by the sample acquisition means can be considered.
Another example of the prediction coefficient in the prediction means is a prediction coefficient obtained by vector quantization based on a prediction coefficient calculated by linear prediction analysis from the speech signal of the predetermined number of samples acquired by the sample acquisition means. Conceivable.
As another example of the prediction coefficient in the prediction means, the prediction coefficient used in the first encoding means selected in the past by the encoding selection means can be considered.

尚,前述構成の音声符号化装置に適用される音声符号化方法として捉えることで,本発明は,入力されるディジタル信号を可逆符号化するディジタル信号符号化方法であって,入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得工程と,複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測工程と,前記予測工程により予測された予測信号と前記サンプル取得工程により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出工程と,前記残差信号算出工程により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化工程と,前記サンプル取得工程により取得された所定サンプル数のディジタル信号を前記予測工程を介さずに符号化する第2の符号化工程と,前記第1の符号化工程および前記第2の符号化工程により得られる符号の符号長に基づいて,前記第1の符号化工程および前記第2の符号化工程のいずれか一を選択する符号化選択工程と,を具備してなることを特徴とするディジタル信号符号化方法と考えることも可能である。
この場合,前記サンプル取得工程により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出工程を更に備え,前記第2の符号化工程が,前記有効ビット数検出工程により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが好ましい。
この場合の作用については,前述した形態と同様であるため,ここでは省略する。
Note that the present invention is a digital signal encoding method for reversibly encoding an input digital signal by grasping it as a speech encoding method applied to the speech encoding apparatus having the above-described configuration. A sample acquisition step for acquiring a signal every predetermined number of samples, and at least one prediction step in which a plurality of prediction coefficients are applied, and a prediction signal of the current digital signal is predicted from a past digital signal by each prediction coefficient; At least one residual signal calculation step for calculating a residual signal between the prediction signal predicted by the prediction step and the current digital signal of a predetermined number of samples actually acquired by the sample acquisition step; Before applying the residual signal calculated by the difference signal calculating step and the prediction signal used for calculating the residual signal Encode at least one first encoding step for encoding prediction coefficient specifying information for specifying a prediction coefficient, and a digital signal of a predetermined number of samples acquired by the sample acquisition step without going through the prediction step. Based on the second encoding step and the code length of the code obtained by the first encoding step and the second encoding step, the first encoding step and the second encoding step It can also be considered as a digital signal encoding method characterized by comprising an encoding selection step of selecting any one.
In this case, the method further comprises an effective bit number detection step for detecting the effective bit number of the digital signal of the predetermined number of samples acquired by the sample acquisition step, and the second encoding step is detected by the effective bit number detection step. It is preferable that the effective bit number and the effective bit number specifying information for specifying the effective bit number are encoded.
Since the operation in this case is the same as that described above, the description thereof is omitted here.

以上説明したように,本発明によれば,予測器を用いて符号化する第1の符号化手段と予測器を介さずに符号化する第2の符号化手段とが設けられているため,予測器(予測手段)を用いた符号化では十分な圧縮効果を得られないランダム信号等のディジタル信号であっても,前記第2の符号化手段で符号化されることにより符号化効率(圧縮率)を高めることができる。   As described above, according to the present invention, the first encoding means for encoding using the predictor and the second encoding means for encoding without using the predictor are provided. Even a digital signal such as a random signal for which a sufficient compression effect cannot be obtained by encoding using a predictor (prediction unit) is encoded by the second encoding unit (encoding efficiency (compression)). Rate).

以下添付図面を参照しながら,本発明の実施の形態及び実施例について説明し,本発明の理解に供する。尚,以下の実施形態及び実施例は,本発明を具体化した一例であって,本発明の技術的範囲を限定する性格のものではない。
ここに,図1は本発明の第1の実施形態に係るディジタル信号符号化装置Aの概略構成を示すブロック図,図2は本発明の第2の実施形態に係るディジタル信号符号化装置Bの概略構成を示すブロック図,図3は本発明の第1の実施形態に係るディジタル信号符号化装置Aにより生成されたビットストリームE1を復号化するディジタル信号復号化装置Cの概略構成を示すブロック図,図4は本発明の第2の実施形態に係るディジタル信号符号化装置Bにより生成されたビットストリームE2を復号化するディジタル信号復号化装置Dの概略構成を示すブロック図,図5は第2の実施形態の符合化の説明に用いるディジタル信号の一例を示す図,図6はビットストリーム中の予測器識別子及び予測係数特定情報の符号長を説明する図,図7はビットストリームの構成の一例を模式的に示す図,図8はビットストリームの構成の他の例を模式的に示す図,図9は所定のランダム信号に対してゴロム符号化を施した場合の平均ビット長を示すテーブル図,図10はディジタル信号の一例を示す図,図11は音声信号における振幅毎の出現頻度を示す図,図12は予測残差信号における振幅毎の出現頻度を示す図である。
Hereinafter, embodiments and examples of the present invention will be described with reference to the accompanying drawings so that the present invention can be understood. It should be noted that the following embodiments and examples are examples embodying the present invention and do not limit the technical scope of the present invention.
FIG. 1 is a block diagram showing a schematic configuration of a digital signal encoding apparatus A according to the first embodiment of the present invention. FIG. 2 is a block diagram of the digital signal encoding apparatus B according to the second embodiment of the present invention. FIG. 3 is a block diagram showing a schematic configuration, and FIG. 3 is a block diagram showing a schematic configuration of a digital signal decoding apparatus C for decoding the bitstream E1 generated by the digital signal encoding apparatus A according to the first embodiment of the present invention. FIG. 4 is a block diagram showing a schematic configuration of a digital signal decoding apparatus D that decodes the bit stream E2 generated by the digital signal encoding apparatus B according to the second embodiment of the present invention, and FIG. FIG. 6 is a diagram illustrating an example of a digital signal used for explaining the encoding of the embodiment, FIG. 6 is a diagram illustrating a code length of a predictor identifier and prediction coefficient specifying information in the bit stream, and FIG. FIG. 8 schematically shows another example of the bit stream configuration, FIG. 8 schematically shows another example of the bit stream configuration, and FIG. 9 shows the average bit when Golomb coding is applied to a predetermined random signal. FIG. 10 is a diagram showing an example of the digital signal, FIG. 11 is a diagram showing the appearance frequency for each amplitude in the speech signal, and FIG. 12 is a diagram showing the appearance frequency for each amplitude in the prediction residual signal. .

《第1の実施形態》
ここに,本発明の第1の実施形態に係るディジタル信号符号化装置A(以下「符号化装置A」と略す)は,図1に示すブロック図の如く具現化される。
同図に示す如く,本実施形態に係る符号化装置Aは,入力されるディジタル信号を可逆符号化する装置であって,バッファ201(サンプル取得手段の一例),予測器202−1〜202−3(予測手段の一例),減算器212−1〜212−3(残差信号算出手段の一例),符号器203−0(第2の符号化手段の一例),符号器203−1〜203−3(第1の符号化手段の一例),符号長計算/選択器204(符合化選択手段の一例),ビットストリーム生成器205,メモリ部213を具備して概略構成される。
以下に,当該符号化装置Aに入力されたPCMデータ(つまりは,音声信号や計測信号等のディジタル信号)が符号化(圧縮)され,符号データ(圧縮データ)として出力されるまでの各部の処理について,処理の流れ(フロー)に沿って説明する。
<< First Embodiment >>
Here, the digital signal encoding apparatus A (hereinafter abbreviated as “encoding apparatus A”) according to the first embodiment of the present invention is embodied as shown in the block diagram of FIG.
As shown in the figure, the encoding apparatus A according to the present embodiment is an apparatus that performs lossless encoding of an input digital signal, and includes a buffer 201 (an example of a sample acquisition unit) and predictors 202-1 to 202-. 3 (an example of prediction means), subtractors 212-1 to 212-3 (an example of residual signal calculation means), an encoder 203-0 (an example of a second encoding means), and encoders 203-1 to 203 -3 (an example of a first encoding unit), a code length calculator / selector 204 (an example of an encoding selection unit), a bit stream generator 205, and a memory unit 213.
The PCM data (that is, a digital signal such as a voice signal or a measurement signal) input to the encoding device A is encoded (compressed) below and is output as encoded data (compressed data). The processing will be described along the flow of processing.

(バッファ201)
先ず,当該符号化装置Aに入力されたPCMデータは,入力端子200から前記バッファ201に入力される。
該バッファ201では,あるサンプル数(例えば800サンプル)毎にフレームと呼ばれる単位で処理可能なように前記PCMデータがバッファリングされる。
該バッファ201に入力されたPCMデータがフレーム化されつつ順次バッファリングされる様子を模式的に示す図が図10である。同図に示す如く,入力されたPCMデータFは所定サンプル数毎にフレーム化され,該バッファ201に順次バッファリングされる。
尚,PCMデータのチャンネル数が複数の場合には,該バッファ201において,各チャンネル相互の相関性を除去する処理を行ってもよい。例えば,PCMデータがLchとRchの2チャンネルであるとすれば,Lch+Rch,或いはLch−Rchの演算処理がそれに該当する。
次に,前記バッファ201によりバッファリングされたフレーム単位のPCMデータ(以下,略して単に「フレームデータ」という)が符号器203−0及び予測器202−1〜202−3の夫々に入力される。
従来は,前記フレームデータは予測器202だけに入力していたが,本発明では,各予測器202だけでなく,直接的にフレームデータが符号器203−0に入力され,この符号器203−0において予測器202を介さずにフレームデータが符号化される。このように,予測器202を介さずに符号器203−0にフレームデータが直接入力される経路を設けた点において本発明は従来と異なる。このような経路を設けたのは,例えばフレームデータがランダム性を有する信号(ランダム信号)である場合は,予測器を介さずに符号化した方が圧縮率(符号化効率)が高い場合もあり得ることを考慮したためである。
(Buffer 201)
First, the PCM data input to the encoding device A is input from the input terminal 200 to the buffer 201.
In the buffer 201, the PCM data is buffered so that a certain number of samples (for example, 800 samples) can be processed in units called frames.
FIG. 10 schematically shows how PCM data input to the buffer 201 is sequentially buffered while being framed. As shown in the figure, the input PCM data F is framed every predetermined number of samples and sequentially buffered in the buffer 201.
When there are a plurality of PCM data channels, the buffer 201 may perform processing for removing the correlation between the channels. For example, if the PCM data is two channels of Lch and Rch, the calculation processing of Lch + Rch or Lch−Rch corresponds to this.
Next, frame-unit PCM data (hereinafter simply referred to as “frame data”) buffered by the buffer 201 is input to the encoder 203-0 and the predictors 202-1 to 202-3, respectively. .
Conventionally, the frame data is input only to the predictor 202. However, in the present invention, not only each predictor 202 but also the frame data is directly input to the encoder 203-0. At 0, the frame data is encoded without going through the predictor 202. As described above, the present invention is different from the conventional one in that a path for directly inputting the frame data to the encoder 203-0 is provided without using the predictor 202. For example, when the frame data is a signal having randomness (random signal), the compression rate (encoding efficiency) is higher when encoding without using a predictor. This is because the possibility is considered.

(予測器202)
まず,フレームデータが予測器202に入力された経路について説明する。
前記予測器202では,下式(1)の如く,夫々に割り当てられた所定の予測係数αnに基づいて線形予測処理が行われ,過去のサンプルデータx(i)から現在のサンプルの予測値

Figure 2006211243
が予測される。
Figure 2006211243
但し,αn(n=1,2,・・,N)は予測係数である。
ここで,該予測器202には,各予測器に対し,異なる符号長を有する予測係数が割り当てられ,その予測精度の向上が図られている。
そのため,当該符号化装置Aでは,後述するように,前記予測器202のうち一つの予測器を選択するに当たり,その予測器により予測された予測信号を用いて算出される残差信号だけでなく,その予測信号を予測する際に適用された「予測係数を特定する情報(以下「予測係数特定情報」と称す)」の符号長を考慮する必要がある。
ここでは,先ず,前記予測器202の夫々に適用される予測係数,及び予測係数特定情報の符号長について,以下に説明する。
(予測器202−1)
先ず,前記予測器202−1には,バッファリングされたフレームデータを対象として線形予測分析器207で算出された線形予測係数209を割り当てる。
これにより,フレームデータに応じて適宜算出される予測係数によって予測を行うことが可能となり,一定の予測係数による予測に較べ,予測精度を著しく向上させ得る。
尚,前記線形予測分析器207における線形予測係数209の算出方法に関する詳細は,「音のコミュニケーション工学」(社団法人日本音響学会編,コロナ社,1996/8/30初版)に詳しいため,ここでは省略する。
このように前記線形予測係数209が適用される当該予測器202−1では,前記予測係数特定情報の符号長を,前記線形予測分析器207で算出される前記線形予測係数209が4次,各次数毎の予測係数が8bitの場合を考えると,4×8bit=32bitに,後述する予測器識別子の2bitを加算した34bitとすることが可能である(図6(d)参照)。無論,この符号長は一例であって,予測係数の次数や各次数毎の符号長は前述の値に限定されるものではない。
(予測器202−2)
そして,前記予測器202−2には,1フレーム前で使用した予測係数211を割り当てる。つまり,前回,前記符号長計算/選択器204により選択された符号データの符号化の際に用いられた予測係数を一旦メモリ部213に保存しておき,現在のフレームデータを符号化する際に,その保存された前記予測係数211を前記メモリ部213から読み出して使用する。
これは,現在のフレームデータと前回のフレームデータとの間には何らかの相関性があるとの仮定に基づくものであり,例えば,同一或いは類似したデータが繰り返されるPCMデータに対して有効であると解される。
このように前記予測係数211が適用される当該予測器202−2では,前記予測係数特定情報の符号長を,過去の前記予測係数211を使用したことを表すインデックス(フラグ)のみとすることが可能である。つまり,前記フラグの「0」「1」に応じ,前記予測係数211の使用/不使用を判定するよう構成することができる。なお,本実施形態では,識別対象が多いため,前記予測係数211の使用/不使用の判定は,2bitで表された予測器識別子(図6(b)参照)を用いるが,もちろん,この予測器識別子は,識別対象数に応じた任意のビット数(ビット幅)とすることも可能である。尚,本実施形態では,簡単のため過去1フレームのみの予測係数を使用する形態としているが,更に過去のフレームに使用された予測係数を保存しておき,それらを使用する形態とすることも可能である。
(予測器202−3)
そして,前記予測器202−3には,複数の予測係数が予め記憶された予測係数テーブル210から選択された予測係数を割り当てる。
ここで,前記予測係数テーブル210から一つの予測係数を選択する手法として,本実施形態では,前記線形予測分析器207で算出された前記線形予測係数209に最も近い予測係数209′を選択し,該予測係数209′を特定する前記予測係数テーブル210の行番号(以下,テーブルインデックスといい,図1参照)を符号化する,いわゆるベクトル量子化法を用いる。
このような構成により,予め記憶された複数の予測係数から最も高い予測精度を発揮し得る予測係数を選択することが可能となり,より高い圧縮率での符号化を実現し得る。
このように前記予測係数209′が適用される当該予測器202−3では,前記予測係数特定情報の符号長を,該予測係数209′毎に設定された前記テーブルインデックスに,後述する予測器識別子の2bitを加算したbit数とすることが可能である。ここで,前記予測係数テーブル210のテーブルが256通りの場合を考えると,その符号長は,8bitとなるため,この場合の予測係数特定情報は10bitとなる(図6(c)参照)。無論,このテーブル数は一例であって,この値に特定されるものではない。
更に,前記予測係数テーブル210に記憶されている前記予測係数209′は,上述した線形予測係数に限定されるものではなく,これと等価なPARCOR係数,或いはLSP(Line Spectrum Pair)係数等を用いることも可能である。 (Predictor 202)
First, a path through which frame data is input to the predictor 202 will be described.
In the predictor 202, linear prediction processing is performed based on the predetermined prediction coefficient αn assigned to each as shown in the following equation (1), and the predicted value of the current sample from the past sample data x (i).
Figure 2006211243
Is predicted.
Figure 2006211243
Here, αn (n = 1, 2,..., N) is a prediction coefficient.
Here, to the predictor 202, prediction coefficients having different code lengths are assigned to the respective predictors, and the prediction accuracy is improved.
Therefore, in the encoding apparatus A, when selecting one predictor from the predictors 202 as described later, not only the residual signal calculated using the prediction signal predicted by the predictor but also the predictor 202 is selected. Therefore, it is necessary to consider the code length of “information for specifying a prediction coefficient (hereinafter referred to as“ prediction coefficient specifying information ”)” applied when predicting the prediction signal.
Here, first, the prediction coefficient applied to each of the predictors 202 and the code length of the prediction coefficient specifying information will be described below.
(Predictor 202-1)
First, a linear prediction coefficient 209 calculated by the linear prediction analyzer 207 with respect to the buffered frame data is assigned to the predictor 202-1.
As a result, it is possible to perform prediction using a prediction coefficient that is appropriately calculated according to the frame data, and the prediction accuracy can be significantly improved as compared with prediction using a constant prediction coefficient.
The details of the calculation method of the linear prediction coefficient 209 in the linear prediction analyzer 207 are detailed in “Sound Communication Engineering” (edited by the Acoustical Society of Japan, Corona, 1996/8/30, first edition). Omitted.
As described above, in the predictor 202-1 to which the linear prediction coefficient 209 is applied, the code length of the prediction coefficient specifying information is the fourth order of the linear prediction coefficient 209 calculated by the linear prediction analyzer 207. Considering the case where the prediction coefficient for each order is 8 bits, it is possible to obtain 34 bits obtained by adding 2 bits of a predictor identifier described later to 4 × 8 bits = 32 bits (see FIG. 6D). Of course, this code length is an example, and the order of the prediction coefficient and the code length for each order are not limited to the above-mentioned values.
(Predictor 202-2)
The predictor 202-2 is assigned the prediction coefficient 211 used one frame before. That is, the prediction coefficient used in the previous encoding of the code data selected by the code length calculator / selector 204 is temporarily stored in the memory unit 213, and the current frame data is encoded. The stored prediction coefficient 211 is read from the memory unit 213 and used.
This is based on the assumption that there is some correlation between the current frame data and the previous frame data. For example, it is effective for PCM data in which the same or similar data is repeated. It is understood.
In this way, in the predictor 202-2 to which the prediction coefficient 211 is applied, the code length of the prediction coefficient specifying information may be only an index (flag) indicating that the past prediction coefficient 211 has been used. Is possible. That is, the use / non-use of the prediction coefficient 211 can be determined according to “0” and “1” of the flag. In this embodiment, since there are many identification targets, the use / non-use determination of the prediction coefficient 211 uses a predictor identifier represented by 2 bits (see FIG. 6B). The device identifier can be an arbitrary number of bits (bit width) according to the number of identification objects. In this embodiment, for the sake of simplicity, the prediction coefficient of only one past frame is used. However, the prediction coefficients used in the past frame may be stored and used. Is possible.
(Predictor 202-3)
The predictor 202-3 is assigned a prediction coefficient selected from the prediction coefficient table 210 in which a plurality of prediction coefficients are stored in advance.
Here, as a method for selecting one prediction coefficient from the prediction coefficient table 210, in the present embodiment, the prediction coefficient 209 ′ closest to the linear prediction coefficient 209 calculated by the linear prediction analyzer 207 is selected, A so-called vector quantization method is used which encodes the row number (hereinafter referred to as a table index, see FIG. 1) of the prediction coefficient table 210 for specifying the prediction coefficient 209 ′.
With such a configuration, it is possible to select a prediction coefficient that can exhibit the highest prediction accuracy from a plurality of prediction coefficients stored in advance, and encoding at a higher compression rate can be realized.
As described above, in the predictor 202-3 to which the prediction coefficient 209 ′ is applied, the code length of the prediction coefficient specifying information is set in the table index set for each prediction coefficient 209 ′, as will be described later. It is possible to obtain the number of bits obtained by adding 2 bits. Here, considering the 256 cases of the prediction coefficient table 210, the code length is 8 bits, so the prediction coefficient specifying information in this case is 10 bits (see FIG. 6C). Of course, this number of tables is an example and is not specified by this value.
Further, the prediction coefficient 209 ′ stored in the prediction coefficient table 210 is not limited to the linear prediction coefficient described above, and a PARCOR coefficient equivalent to this, a LSP (Line Spectrum Pair) coefficient, or the like is used. It is also possible.

次に,図6を参照しつつ,前記予測器202に夫々に適用される予測係数における予測係数特定情報の符号長について詳説する。
この予測係数特定情報は,図6に示す如く,予測器識別子とそれ以外のデータ部分により構成される。
尚,前記予測器識別子とは,前記予測係数特定情報の先頭部分に配置され,該予測係数特定情報によって,その予測係数が,上述した前記予測器202のうち,どの予測器に適用された予測係数であるかを表すフラグである。
具体的には,図6(b)の如く,最初の1ビットが1,2ビット目が0であれば1フレーム前の予測係数である(つまりは,前記予測器202−2が適用されている)ことを示し,図6(c)の如く,最初の1ビットが0,2ビット目が1であれば前記予測係数テーブル210から選択された前記予測係数209’である(つまりは,前記予測器202−3が適用されている)ことを示し,図6(d)の如く,最初の1ビットが0,2ビット目も0であれば前記線形予測分析器207で算出された前記線形予測係数209である(つまりは,前記予測器202−1が適用されている)ことを示す。
一方,前記データ部分とは,前記予測器識別子の後に配置され,該データ部分によって,その予測係数を特定するために必要な情報が付与される。
具体的には,図6(b)の如く,1フレーム前の予測係数については前記予測器識別子のみより一意に識別されるため新たな情報(データ部分)は不要であるが,図6(c)の如く,前記予測係数テーブル210から選択された前記予測係数209′については該予測係数209′のテーブルインデックスがこれに該当し,図6(d)の如く,前記線形予測分析器207で算出された前記線形予測係数209については該線形予測係数209自体がこれに該当する。
このように,本実施形態に係る前記符号化装置Aでは,前記予測器202に適用された予測係数特定情報の符号長が,前記予測器202−1が選択される(図6(d)参照)場合には2+32=34bit,前記予測器202−2が選択される(図6(b)参照)場合には2bit,前記予測器202−3が選択される(図6(c)参照)場合には2+8=10bitとなり,各予測器毎に異なることが理解される。
そのため,本実施形態に係る前記符号化装置Aでは,後述する符号長計算/選択器204において,この「予測係数を特定する情報」の符合長の差異を考慮した上で,複数の前記予測器202から,最適な(つまりは,最も圧縮率の高い符号化を行い得る)予測器が選択される。
尚,上述説明では,前記予測器識別子が2bitの固定長であるが,無論,前記予測器識別子は可変長であってもよい。
Next, the code length of the prediction coefficient specifying information in the prediction coefficient applied to each of the predictors 202 will be described in detail with reference to FIG.
This prediction coefficient specifying information is composed of a predictor identifier and other data portions as shown in FIG.
The predictor identifier is arranged at the head portion of the prediction coefficient specifying information, and the prediction coefficient is applied to which predictor among the predictors 202 described above according to the prediction coefficient specifying information. It is a flag indicating whether it is a coefficient.
Specifically, as shown in FIG. 6B, if the first 1 bit is 1 and the 2nd bit is 0, it is the prediction coefficient of the previous frame (that is, the predictor 202-2 is applied). 6 (c), if the first bit is 0 and the second bit is 1, the prediction coefficient 209 ′ selected from the prediction coefficient table 210 (that is, The predictor 202-3 is applied), and if the first bit is 0 and the second bit is 0 as shown in FIG. 6 (d), the linear prediction analyzer 207 calculates the linear It indicates that the prediction coefficient is 209 (that is, the predictor 202-1 is applied).
On the other hand, the data portion is arranged after the predictor identifier, and information necessary for specifying the prediction coefficient is given by the data portion.
Specifically, as shown in FIG. 6B, the prediction coefficient of the previous frame is uniquely identified only by the predictor identifier, so that new information (data portion) is not necessary, but FIG. The prediction coefficient 209 ′ selected from the prediction coefficient table 210 corresponds to the table index of the prediction coefficient 209 ′, and is calculated by the linear prediction analyzer 207 as shown in FIG. For the linear prediction coefficient 209, the linear prediction coefficient 209 itself corresponds to this.
Thus, in the encoding apparatus A according to the present embodiment, the predictor 202-1 is selected as the code length of the prediction coefficient specifying information applied to the predictor 202 (see FIG. 6D). ) In the case of 2 + 32 = 34 bits and the predictor 202-2 is selected (see FIG. 6B), and in the case of 2 bits and the predictor 202-3 is selected (see FIG. 6C). 2 + 8 = 10 bits, which is understood to be different for each predictor.
Therefore, in the encoding apparatus A according to the present embodiment, the code length calculator / selector 204 described later takes into account the difference in code length of the “information for specifying the prediction coefficient”, and then the plurality of the predictors. From 202, an optimal predictor (that is, an encoder that can perform encoding with the highest compression rate) is selected.
In the above description, the predictor identifier has a fixed length of 2 bits. Of course, the predictor identifier may have a variable length.

(減算器212)
上述の如く所定の予測係数が夫々適用され,過去のサンプリングデータから現在のサンプリングデータの予測信号を予測した前記予測器202は,該予測信号を,減算器212−1〜212−3に出力する。
該減算器212では,前記予測器202から入力された前記予測信号

Figure 2006211243
と,前記バッファ201から入力されたサンプルデータx(i)とを用い,下式(2)の如く,残差信号d(i)が算出される。
Figure 2006211243
(Subtractor 212)
As described above, each of the predetermined prediction coefficients is applied, and the predictor 202 that has predicted the prediction signal of the current sampling data from the past sampling data outputs the prediction signal to the subtracters 212-1 to 212-3. .
In the subtractor 212, the prediction signal input from the predictor 202.
Figure 2006211243
Then, using the sample data x (i) input from the buffer 201, a residual signal d (i) is calculated as shown in the following equation (2).
Figure 2006211243

(符号器203−0)
前記符号化器203−0〜203−3のうち,符号化器203−0には,上述したように,前記予測器202を介さずに前記バッファ201でバッファリングされたフレームデータが直接入力される。このとき,例えば,前記バッファ201において,入力するフレームデータの先頭に,符号化に当たり予測係数を使用しない旨を示す予測器識別子(図6(a)参照)を付加するなどにより,前記フレームデータを前記符号器203−0に入力させることができる。具体的には,図6(a)の如く,最初の1ビットが1,2ビット目が1であれば符号化器203−0にフレームデータを直接入力する(つまりは,予測係数を使用しない)ことを示す。
前記符号器203−0に入力されたフレームデータは,該符号器203−0において符号化され,その後,符号化されたフレームデータ(以下「符号化フレーム」という)が前記符号長計算/選択器204に出力される。
前記符号化器203−0で行われるフレームデータの符号化については,特にその方法が限定されることはなく,例えば,後述するエントロピー符号化等の種々の符号化方法を適用することが可能である。
(Encoder 203-0)
Of the encoders 203-0 to 203-3, the frame data buffered in the buffer 201 is directly input to the encoder 203-0 without going through the predictor 202, as described above. The At this time, for example, by adding a predictor identifier (see FIG. 6A) indicating that a prediction coefficient is not used for encoding to the head of the input frame data in the buffer 201, the frame data is The encoder 203-0 can be input. Specifically, as shown in FIG. 6A, if the first 1 bit is 1 and the second bit is 1, the frame data is directly input to the encoder 203-0 (that is, the prediction coefficient is not used). )
The frame data input to the encoder 203-0 is encoded by the encoder 203-0, and then the encoded frame data (hereinafter referred to as “encoded frame”) is converted to the code length calculator / selector. It is output to 204.
The method of encoding the frame data performed by the encoder 203-0 is not particularly limited. For example, various encoding methods such as entropy encoding described later can be applied. is there.

(符号器203−1〜203−3)
一方,符号化器203−1〜203−3には,各予測器202毎の残差信号d(i)と,該残差信号d(i)に対応する(つまり,該残差信号d(i)の算出に使用された予測信号を予測する際に適用された)前記予測係数特定情報が入力される。該符号器203−1〜203−3では,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した前記予測係数特定情報を符号化し,しかる後,符号化された残差信号及び予測係数特定情報を前記符号長計算/選択器204に出力する。以下,符号化された残差信号及び予測係数特定情報と,前記符号化フレームとを総称して「符号化候補」という。
先ず,残差信号d(i)については,その出現頻度の偏りを利用した符号化方法(いわゆるエントロピー符号化)が行われることが望ましい。
該符号器203−1〜203−3において残差信号を符号化する利点は,エントロピー(振幅k[i]の出現確率をp[i]とした時,p[i]×log2(1/p[i])の合計)を小さくできることにある。
これについて,あるPCMデータ(16bit)の振幅の累積度数を表す図11,及び該PCMデータをある所定の予測係数を用いて予測値を予測し,その予測値を用いて算出された残差信号の振幅の累積度数を表した図12を用いて説明する。
両図より明らかな如く,PCMデータの残差信号を算出することによって,その信号に対する振幅の分布は0近傍に集中する。そこで,振幅の分布の偏り(集中)を利用して符号化すれば圧縮率の向上させ得る。
具体的には,振幅が0近傍の信号には短いビット長の符号を割当て,振幅が大きくなるに従いビット長の長い符号を割り当てるように符号化すれば,より圧縮効率を高めることが可能である。尚,上述した説明は,概念的な説明であるが,これら概念をさらに効率よく具現化した符号化手法として公知な技術であるHuffman符号方式,算術符号化方式,或いはレンジコーダ等の手法を用いることが可能である。
このように,該符号器203−1〜203−3において残差信号を符号化することで,より圧縮効率の高い符号化が可能である。
一方,予測係数特定情報については,特にその符号化方法に係る限定はなく,図6(b)〜(d)に示す構造を符号化として捉えることも可能であるし,図6(b)〜(d)に示す構造の予測係数特定情報を,上述したエントロピー符号化等を用い更に符号化してもよい。
つまり,該符号器203−1〜203−3は,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した予測係数特定情報と,を夫々符号化(両者の符号化方式は同一であっても異なってもよい)すると共に,符号化された夫々の符号を合わせて形成される前記符号化候補を前記符号長計算/選択器204に出力する機能を有する。
(Encoders 203-1 to 203-3)
On the other hand, the encoders 203-1 to 203-3 correspond to the residual signal d (i) for each predictor 202 and the residual signal d (i) (that is, the residual signal d ( The prediction coefficient specifying information (applied when predicting the prediction signal used for the calculation of i) is input. In the encoders 203-1 to 203-3, the residual signal d (i) acquired from the subtractor 212 and the prediction coefficient specifying information acquired from the predictor 202 are encoded, and then encoded. The residual signal and the prediction coefficient specifying information are output to the code length calculator / selector 204. Hereinafter, the encoded residual signal and prediction coefficient specifying information and the encoded frame are collectively referred to as “encoding candidates”.
First, with respect to the residual signal d (i), it is desirable to perform an encoding method (so-called entropy encoding) using the deviation in appearance frequency.
The advantage of encoding the residual signal in the encoders 203-1 to 203-3 is that entropy (p [i] × log2 (1 / p, where the appearance probability of the amplitude k [i] is p [i]). The sum of [i]) can be reduced.
In this regard, FIG. 11 showing the cumulative frequency of amplitude of certain PCM data (16 bits), and a predicted value of the PCM data using a predetermined prediction coefficient, and a residual signal calculated using the predicted value. This will be described with reference to FIG.
As apparent from both figures, by calculating the residual signal of the PCM data, the amplitude distribution for the signal is concentrated in the vicinity of zero. Therefore, the compression rate can be improved by encoding using the bias (concentration) of the amplitude distribution.
Specifically, it is possible to increase the compression efficiency by assigning a short bit length code to a signal with an amplitude close to 0 and assigning a long bit length code as the amplitude increases. . Although the above description is a conceptual explanation, a technique such as a Huffman coding method, an arithmetic coding method, or a range coder, which is a well-known technique, is used as a coding method that more efficiently embodies these concepts. It is possible.
In this way, encoding with higher compression efficiency is possible by encoding the residual signal in the encoders 203-1 to 203-3.
On the other hand, the prediction coefficient specifying information is not particularly limited with respect to the encoding method, and the structures shown in FIGS. 6B to 6D can be regarded as encoding, and FIGS. The prediction coefficient specifying information having the structure shown in (d) may be further encoded using the above-described entropy encoding or the like.
That is, the encoders 203-1 to 203-3 each encode the residual signal d (i) acquired from the subtractor 212 and the prediction coefficient specifying information acquired from the predictor 202 (both of them). The encoding method may be the same or different), and has a function of outputting the encoding candidates formed by combining the encoded codes to the code length calculator / selector 204.

(符号長計算/選択器204)
前記符号長計算/選択器204では,前記符号器203(203−0〜203−3)から入力される複数の符号化候補から一つを選択するに当たり,該符号化候補の符号長が最小であるものを選択し,選択された符号化候補をビットストリーム生成器205へと出力する。
即ち,該符号長計算/選択器204は,符号器203−1〜203−3で符号化された残差信号及び予測係数特定情報とを合わせて構成された符号化データだけでなく,符号器203−0で予測器を介さずに符号化されたフレームデータ(符号化フレーム)をも含めた全ての符号化候補の中から符号長が最小となるものを選択するよう構成されている。そのため,本実施形態によれば,前記予測器202を利用した符号化では高い圧縮率で符号化され,他の符号化方法によれば高い圧縮率で符号化することができるようなディジタル信号が入力される場合でも,該ディジタル信号に対して,高い圧縮率で符号化可能な適切な符号器が選択され得る。
なお,前記符号長計算/選択器204における選択は,フレームデータ単位で行われるため,後述するビットストリームE1(図7)には,符号器203−0で符号化されたデータ及び符号器203−1〜203−3で符号化されたデータが混在することになる。
(Code length calculator / selector 204)
In the code length calculator / selector 204, when selecting one of a plurality of encoding candidates input from the encoder 203 (203-0 to 203-3), the code length of the encoding candidate is the smallest. A certain one is selected, and the selected encoding candidate is output to the bit stream generator 205.
That is, the code length calculator / selector 204 includes not only encoded data composed of the residual signal encoded by the encoders 203-1 to 203-3 and the prediction coefficient specifying information, but also an encoder. It is configured to select the one with the shortest code length from all the encoding candidates including the frame data (encoded frame) encoded without a predictor in 203-0. Therefore, according to the present embodiment, a digital signal that is encoded at a high compression rate in the encoding using the predictor 202 and that can be encoded at a high compression rate according to another encoding method. Even when input, an appropriate encoder capable of encoding with high compression rate can be selected for the digital signal.
Since the selection by the code length calculator / selector 204 is performed in units of frame data, the bit stream E1 (FIG. 7) described later includes the data encoded by the encoder 203-0 and the encoder 203-. Data encoded in 1-203-3 will be mixed.

(ビットストリーム生成器205)
続いて,前記符号長計算/選択器204で選択された一つの符号化候補は,ビットストリーム生成器205でビットストリームとしてパッキングされた後,出力端子206から出力される。
ここに,前記ビットストリーム生成器205によりパッキングされたビットストリームの一例を図7に示す。尚,同図に示すビットストリームE1は,チャンネル数が1のPCMデータから生成されたビットストリームの一例を示す。
同図に示す如く,前記ビットストリームE1は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。ここに,前記フレームデータ(1)609は予測器202を介さずに符号器203−0で符号化されたフレームデータ(符号化フレーム)を含み,前記フレームデータ(2)610はいずれかの予測器202を用いて符号器203−1〜203−3のいずれかで符号化された残差情報等を含むものとする。
先ず,前記ファイルヘッダ608の構成要素について説明する。
該ファイルヘッダ608は,更にヘッダ601と先頭サンプル値602とに分けられる。なお,ビットストリームE1が,チャンネル数が2つ(例えばLchとRchからなるステレオ)のPCMデータから生成されたビットストリームである場合は,前記ファイルヘッダ608には,各チャンネル毎の先頭サンプル値が含まれる。
前記ヘッダ601は,例えば,ビットストリーム(PCMデータ)全体を司る情報,例えばサンプリングレート,チャンネル数,平均ビットレート等の情報が含まれる。
また,前記先頭サンプル値602には,所定のチャンネルの先頭サンプル値が格納される。尚,この先頭サンプル値602はデコードする最初の1フレームを復元するために必要であり,少なくとも予測係数αnの次数(すなわちn)分を各チャンネル毎に確保してあればよい。若しくは,線形予測のために必要な過去のサンプルの初期値をエンコーダ,デコーダ共に0とするなどして予測させるようにすれば,先頭サンプル値602は無くてもよい。このように,該ファイルヘッダ608を構成する前記ヘッダ601及び前記先頭サンプル値602は,固定長である。
(Bitstream generator 205)
Subsequently, one encoding candidate selected by the code length calculator / selector 204 is packed as a bit stream by the bit stream generator 205 and then output from the output terminal 206.
An example of the bit stream packed by the bit stream generator 205 is shown in FIG. The bit stream E1 shown in the figure shows an example of a bit stream generated from PCM data with one channel.
As shown in the figure, the bit stream E1 is roughly divided into a file header 608 and subsequent frame data. Further, the frame data is divided into frame data (1) 609, frame data (2) 610,. Here, the frame data (1) 609 includes frame data (encoded frame) encoded by the encoder 203-0 without passing through the predictor 202, and the frame data (2) 610 includes any prediction data. It is assumed that residual information and the like encoded by any of the encoders 203-1 to 203-3 are included.
First, the components of the file header 608 will be described.
The file header 608 is further divided into a header 601 and a head sample value 602. When the bit stream E1 is a bit stream generated from PCM data having two channels (for example, a stereo composed of Lch and Rch), the file header 608 includes a head sample value for each channel. included.
The header 601 includes, for example, information governing the entire bit stream (PCM data), for example, information such as sampling rate, number of channels, average bit rate, and the like.
Also, the first sample value 602 stores the first sample value of a predetermined channel. Note that the first sample value 602 is necessary to restore the first frame to be decoded, and at least the order (ie, n) of the prediction coefficient αn may be secured for each channel. Alternatively, if the initial values of past samples necessary for linear prediction are set to 0 for both the encoder and the decoder, the leading sample value 602 may be omitted. Thus, the header 601 and the head sample value 602 constituting the file header 608 have a fixed length.

次に,前記フレームデータ(1)609の構成要素について説明する。
前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,符号化フレーム604とに分けられる。
前記符号化フレーム604は言うまでもなく,前記符号長計算/選択器204において符号器203−0から入力された符号化候補(即ち,符号器203−0で符号化されたフレームデータ)が選択された場合のそのフレームデータである。また,前記方式情報603は前記符号化フレーム604の符号化方法(方式)を識別するための情報であって,具体的には,符号器203−0における符号化に適用された符号化方法を識別する情報である。なお,該方式情報603は,ビットストリームE1を復号化する際に用いられる。
Next, components of the frame data (1) 609 will be described.
The frame data (1) 609 is divided into system information 603 for identifying an encoding method (system) and an encoded frame 604.
Needless to say, the encoded frame 604 is selected by the code length calculator / selector 204 as an encoding candidate input from the encoder 203-0 (that is, frame data encoded by the encoder 203-0). In that case. The scheme information 603 is information for identifying the coding method (method) of the coded frame 604. Specifically, the coding method applied to the coding in the encoder 203-0 is selected. It is information to identify. The method information 603 is used when the bit stream E1 is decoded.

続いて,前記フレームデータ(2)610の構成要素について説明する。
前記フレームデータ(2)610は,更に方式情報605と,予測係数特定情報606と,残差信号情報607とに分けられる。
前記方式情報605は前記予測係数特定情報606及び残差信号情報607を符号化した符号化方法(方式)を識別するための情報であって,具体的には,対応する符号器における符号化方法,使用した予測器202,使用した予測係数等を識別する情報である。この方式情報605は,ビットストリームE1を復号化する際に用いられる。
前記予測係数特定情報606は,先に説明したように,予測係数を特定する情報であり,このビットストリームE1を復号化する際に用いられる。該予測係数特定情報606に基づいて,ビットストリームE1からPCMデータを復号する装置(ディジタル信号復号化装置C)については後述する。
また,前記残差信号情報607は,残差信号を符号化して得られた符号である。このように,該フレームデータ(2)610を構成する前記予測係数特定情報606及び前記残差信号情報607は両者とも可変長である。
尚,各情報の並び順,或いはチャンネル数は図7示す例に限定されず,任意の形態が可能であることは言うまでもない。
Next, components of the frame data (2) 610 will be described.
The frame data (2) 610 is further divided into method information 605, prediction coefficient specifying information 606, and residual signal information 607.
The method information 605 is information for identifying an encoding method (method) obtained by encoding the prediction coefficient specifying information 606 and the residual signal information 607, and specifically, an encoding method in a corresponding encoder. , Used predictor 202, used prediction coefficient, and the like. This method information 605 is used when the bit stream E1 is decoded.
As described above, the prediction coefficient specifying information 606 is information for specifying a prediction coefficient, and is used when the bit stream E1 is decoded. A device (digital signal decoding device C) for decoding PCM data from the bitstream E1 based on the prediction coefficient specifying information 606 will be described later.
The residual signal information 607 is a code obtained by encoding the residual signal. Thus, the prediction coefficient specifying information 606 and the residual signal information 607 constituting the frame data (2) 610 are both variable length.
Needless to say, the arrangement order of each information or the number of channels is not limited to the example shown in FIG.

次に,前記符号化装置Aにより生成されたビットストリームE1(図7参照)を取得し,復号化可能なディジタル信号復号化装置Cの一例について,図3を参照しながら説明する。
以下に,図3に示すディジタル信号復号化装置C(以下「復号化装置C」と略す)に入力されたビットストリームE1が復号化され,PCMデータとして出力されるまでの各部の処理について,処理の流れに沿って説明する。なお,図1のブロック図に示す符合化装置Aの構成要素と同名称の構成要素についてはその構成は同じであるため,上述した符合化装置Aの説明を参照し,ここではその詳細な説明を省略する。
先ず,前記音声復号化装置Cに入力されたビットストリームE1は、入力端子501を介してビットストリーム解読器502に入力される。
該ビットストリーム解読器502では、ビットストリームE1のセグメントを解読して該ビットストリームE1を各信号成分毎に分解した後に、それら信号成分の振り分けが行われる。
具体的には,前記ビットストリーム解読器502において,ビットストリームE1のファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
Next, an example of a digital signal decoding apparatus C that can acquire and decode the bit stream E1 (see FIG. 7) generated by the encoding apparatus A will be described with reference to FIG.
Hereinafter, the processing of each unit until the bit stream E1 input to the digital signal decoding device C (hereinafter referred to as “decoding device C”) shown in FIG. 3 is decoded and output as PCM data will be described. A description will be given along the flow. The components having the same names as the components of the encoding device A shown in the block diagram of FIG. 1 have the same configuration. Therefore, the description of the encoding device A is referred to above, and a detailed description thereof is given here. Is omitted.
First, the bit stream E1 input to the speech decoding apparatus C is input to the bit stream decoder 502 via the input terminal 501.
The bit stream decoder 502 decodes the segment of the bit stream E1 and decomposes the bit stream E1 into signal components, and then distributes the signal components.
Specifically, in the bitstream decoder 502, the file header 608 of the bitstream E1 is decomposed into a header 601 and a head sample value 602, and the head sample value 602 is distributed to the buffer 504 and the predictor 503, and PCM data Is output as a part (first PCM data).

また,ビットストリームE1に含まれるフレームデータ(1)609は,方式情報603と符合化フレーム604とに分割され,それぞれのデータが予測器503に出力される。ただし,フレームデータ(1)609は予測器202を用いずに符号器203−0で符合化されたデータであるため,前記予測器503では前記フレームデータ(1)609の先頭に付された予測器識別子(図6(a)参照)を判別して,予測係数を「0」として処理し,方式情報603で特定される符合化方式に対応する復号化方式で復号化した後に,復号されたPCMデータがバッファ504へ順次転送される。もちろん,前記予測器503にフレームデータ(1)609を出力せずに別経路に符号器203−0に対応する復号器(不図示)を設け,該復号器にフレームデータ(1)609を出力して復号化するようにしてもかまわない。   Also, the frame data (1) 609 included in the bit stream E1 is divided into the scheme information 603 and the encoded frame 604, and each data is output to the predictor 503. However, since the frame data (1) 609 is data encoded by the encoder 203-0 without using the predictor 202, the predictor 503 uses the prediction added to the head of the frame data (1) 609. The device identifier (see FIG. 6 (a)) is determined, the prediction coefficient is processed as “0”, decoded by a decoding method corresponding to the encoding method specified by the method information 603, and then decoded. PCM data is sequentially transferred to the buffer 504. Of course, without outputting the frame data (1) 609 to the predictor 503, a decoder (not shown) corresponding to the encoder 203-0 is provided in another path, and the frame data (1) 609 is output to the decoder. Then, the decryption may be performed.

一方,フレームデータ(2)610は方式情報605と予測係数特定情報606と残差信号情報607とに分割され,前記方式情報605と前記残差信号情報607は予測器503に出力され,前記予測係数特定情報606は予測係数形成部505に出力される。
前記予測係数特定情報606は予測係数形成部505に振り分けられ,予測器503に適用する予測係数を特定するために用いられる。具体的には、本実施形態に係る前記符号化装置Aを用いてPCMデータを符号化する際に、前記予測器202(図1参照)に適用された予測係数の特定を行う。つまり、前記予測係数特定情報606に含まれる前記予測器識別子及びそれに付随するデータ部分(図6参照)に基づいて、メモリ部509に記憶しておいた1フレーム前の予測係数506(前記予測器202−2に適用される予測係数211に相当)、予測係数テーブル507に予め記憶された予測係数(前記予測器202−3に適用される予測係数209’に相当)、或いは前記予測係数特定情報606のデータ部分として送信される線形予測係数209(前記予測器202−1に適用される予測係数209に相当)のいずれかが選択される。尚、この予測係数特定情報606は予測器202を用いて符合化されたフレームデータ毎に取得されるものであり、各フレームデータ毎にその符号化(予測)に適用された予測係数が適宜選択される。かかる手順により前記予測器503に適用する予測係数を選択することで、その予測係数は、PCMデータを前記符号化する際に前記予測器202(図1参照)に適用された予測係数と同一にすることが可能となる。
そして、前記予測器503の出力信号と、残差信号情報607とを加算することでPCMデータに復号され、その復号されたPCMデータがバッファ504へ順次転送される。
On the other hand, the frame data (2) 610 is divided into method information 605, prediction coefficient specifying information 606, and residual signal information 607. The method information 605 and the residual signal information 607 are output to the predictor 503, and the prediction data The coefficient specifying information 606 is output to the prediction coefficient forming unit 505.
The prediction coefficient specifying information 606 is distributed to the prediction coefficient forming unit 505 and used to specify a prediction coefficient to be applied to the predictor 503. Specifically, when encoding the PCM data using the encoding apparatus A according to the present embodiment, the prediction coefficient applied to the predictor 202 (see FIG. 1) is specified. That is, based on the predictor identifier included in the prediction coefficient specifying information 606 and a data portion accompanying the predictor identifier (see FIG. 6), the prediction coefficient 506 of the previous frame stored in the memory unit 509 (the predictor). The prediction coefficient 211 applied to 202-2), the prediction coefficient stored in the prediction coefficient table 507 in advance (corresponding to the prediction coefficient 209 ′ applied to the predictor 202-3), or the prediction coefficient specifying information. One of the linear prediction coefficients 209 (corresponding to the prediction coefficient 209 applied to the predictor 202-1) transmitted as the data portion 606 is selected. The prediction coefficient specifying information 606 is acquired for each frame data encoded using the predictor 202, and a prediction coefficient applied to the encoding (prediction) is appropriately selected for each frame data. Is done. By selecting a prediction coefficient to be applied to the predictor 503 by this procedure, the prediction coefficient is the same as the prediction coefficient applied to the predictor 202 (see FIG. 1) when the PCM data is encoded. It becomes possible to do.
The output signal of the predictor 503 and the residual signal information 607 are added to be decoded into PCM data, and the decoded PCM data is sequentially transferred to the buffer 504.

このようにして転送され,前記バッファ504に格納されたPCMデータは,該バッファ504の出力信号として出力端子508を介して出力され,これにより,PCMデータへの復号化が完了する。
このように、当該復号化装置Cにおいては、前記符号化装置Aの逆の手順に従って元のPCMデータをロスレス復号化することが可能である。
尚、当該復号化装置Cは、図1で説明した前記符号化装置Aにおける前記バッファ201と対応させるべく前記バッファ504を設けた形態としたが、該バッファ504は不可欠な構成要素ではなく、該バッファ504で順次バッファリングすることなく、復号されたPCMデータを順次出力端子508を介して出力する構成としてもよい。但し、上述の符号化の手順において説明したように、前記符号化装置Aにおける前記バッファ201において各チャンネル間の相関を利用した処理(例えば、2chの音声信号におけるLch+Rch、或いはLch−Rch)が実施される場合には、該バッファ504において逆処理を実施する必要がある。
The PCM data transferred in this way and stored in the buffer 504 is output as an output signal of the buffer 504 via the output terminal 508, thereby completing the decoding into PCM data.
Thus, in the decoding apparatus C, it is possible to perform lossless decoding of the original PCM data according to the reverse procedure of the encoding apparatus A.
The decoding apparatus C has a configuration in which the buffer 504 is provided so as to correspond to the buffer 201 in the encoding apparatus A described with reference to FIG. 1. However, the buffer 504 is not an indispensable component. The decoded PCM data may be sequentially output via the output terminal 508 without being sequentially buffered by the buffer 504. However, as described in the above-described encoding procedure, the buffer 201 in the encoding apparatus A performs processing using the correlation between the channels (for example, Lch + Rch or Lch-Rch in a 2ch audio signal). If so, it is necessary to perform reverse processing in the buffer 504.

《第2の実施形態》
次に,本発明の第2の実施形態に係るディジタル信号符号化装置B(以下「符号化装置B」と略す)について図2のブロック図を用いて説明する。なお,図2中において,上述した第1の実施形態の符号化装置Aと同じ構成要素については同符号を付すことによりその説明を省略する。
上述説明した図1示す第1の実施形態の符号化装置Aでは,前記符号器203−0において,エントロピー符号化等の種々の符号化方法を適用することができることについて説明した。
しかし,入力されるディジタル信号のランダム性が強い場合,即ち,入力されるディジタル信号がランダム信号である場合は,振幅の累積度数(図11,図12参照)に偏りが少ないため,エントロピー符号化が効果的に実行されず,即ち,符号化率(圧縮率)が低くなる。前記ランダム信号の一例として,例えば,データロガー等の計測装置により計測された計測データが挙げられる。このような計測データにはランダム雑音が含まれるため,そのデータのランダム性は強い傾向にある。
一般に,ディジタル信号(ディジタルデータ)は,そのデータ長(例えば16bit)の全てのビット数で所定の情報が表されるが,前記計測データ等に代表されるランダム信号においては,実質的に全てのビット数で情報が表されているのではなく,データの先頭から所定のビット数(ビットレンジ,ビット幅)だけで情報を表す場合がある。一般にこのようなビット数は有効ビット数と呼ばれる。
この有効ビット数は,前記ランダム信号にあっては比較的小さい値となることが知られている。
ここで,図9に,16ビット幅のあるランダム信号に対してエントロピー符号化の一つである周知のゴロム符号化(ゴロム・ライス符号化)を施した場合の平均ビット長(平均符号長)を示す。具体的には,図9に示す表の最下欄に,−4〜3の整数値がランダムに発生するランダム信号をゴロム符合化した場合の平均ビット長(平均符号長)を示している。
このように,−4〜3の整数値がランダムに発生するランダム信号に対して,ゴラム符合化1〜4のいずれの符合化方法を適用したとしても,符合化後の平均ビット長は3.5乃至4.5である。しかしながら,前記ランダム信号が示す−4〜3の整数値は3ビットで表すことができるため,16ビット幅のうち,先頭の3ビット以外のビット列を全て除去して,16ビットのランダム信号を3ビットのデータに符号化することができるはずである。
<< Second Embodiment >>
Next, a digital signal encoding device B (hereinafter abbreviated as “encoding device B”) according to a second embodiment of the present invention will be described with reference to the block diagram of FIG. In FIG. 2, the same components as those of the encoding device A of the first embodiment described above are denoted by the same reference numerals, and the description thereof is omitted.
In the encoding apparatus A according to the first embodiment shown in FIG. 1 described above, it has been described that the encoder 203-0 can apply various encoding methods such as entropy encoding.
However, when the randomness of the input digital signal is strong, that is, when the input digital signal is a random signal, there is little bias in the cumulative frequency of amplitude (see FIGS. 11 and 12), so entropy coding is performed. Is not executed effectively, that is, the coding rate (compression rate) is lowered. An example of the random signal is measurement data measured by a measuring device such as a data logger. Since such measurement data includes random noise, the randomness of the data tends to be strong.
In general, a digital signal (digital data) has predetermined information represented by all the bits of the data length (for example, 16 bits). However, in a random signal typified by the measurement data, substantially all In some cases, information is not represented by the number of bits, but only by a predetermined number of bits (bit range, bit width) from the beginning of the data. In general, such a bit number is called an effective bit number.
It is known that the number of effective bits is a relatively small value for the random signal.
Here, in FIG. 9, an average bit length (average code length) when a known Golomb encoding (Golomb-Rice encoding), which is one of entropy encoding, is performed on a random signal having a 16-bit width. Indicates. Specifically, the lowermost column of the table shown in FIG. 9 shows an average bit length (average code length) when a random signal in which integer values of −4 to 3 are randomly generated is Golomb encoded.
As described above, even if any coding method of Goram coding 1 to 4 is applied to a random signal in which integer values of −4 to 3 are randomly generated, the average bit length after the coding is 3. 5 to 4.5. However, since the integer value of -4 to 3 indicated by the random signal can be represented by 3 bits, all the bit strings other than the leading 3 bits are removed from the 16-bit width, and the 16-bit random signal is converted to 3 It should be possible to encode into bit data.

そこで,本発明の第2の実施形態の符号化装置Bでは,図2のブロック図に示すように,前記バッファ201から前記符号器203−0へ入力されるフレームデータの有効ビット数を検出するビットレンジ検出器302(有効ビット数検出手段の一例)を設け,該ビットレンジ検出器302で検出された有効ビット数を特定する情報(以下「有効ビット数特定情報」という)を前記符号器203−0に入力し,該符号器203−0においては,所定のビット幅(例えば16ビット幅)のフレームデータを前記有効ビット数のデータに符合化するように構成される。このように構成されることにより,ランダム性の高いデータの符合化率(圧縮率)を更に高めることが可能となる。   Therefore, in the encoding device B according to the second embodiment of the present invention, as shown in the block diagram of FIG. 2, the number of effective bits of the frame data input from the buffer 201 to the encoder 203-0 is detected. A bit range detector 302 (an example of effective bit number detection means) is provided, and information for specifying the effective bit number detected by the bit range detector 302 (hereinafter referred to as “effective bit number specifying information”) is the encoder 203. The encoder 203-0 is configured to encode frame data having a predetermined bit width (for example, 16-bit width) into data having the effective number of bits. With this configuration, it is possible to further increase the coding rate (compression rate) of highly random data.

ここで,図2,図5及び図8を参照しながら前記有効ビット数を用いた符合化の具体例を以下に説明する。
いま,説明を簡単にするため,図5に示すように,10進数表示で−4〜3のいずれかの整数値を示す16ビットのサンプルデータが16個(サンプル401〜416)集まって構成されるフレームデータ40を考える。このフレームデータ40は,縦方向に時間軸をとったデータ群である。また,このフレームデータ40は,先頭から2つのビット(ビット番号0と1)で−4〜3の整数値の絶対値を表し,先頭から3つ目のビット(ビット番号2)がその符号を表す。即ち,先頭から3つ目までのビットが有効ビットであり,その有効ビット数は3である。なお,前記サンプルデータの性質上,前記有効ビットを除く他のビットは,符号と同じビット値となっている。
まず,前記バッファ201でフレーム化され,バッファリングされることにより前記フレームデータ40が取得されると,その後,該フレームデータ40が前記符号器203−0に入力される。このとき,前記フレームデータ40の入力経路に設けられた前記前記ビットレンジ検出器302によって,前記フレームデータ40の有効ビット数が検出される。かかる検出は,例えば,サンプルデータの各ビット番号の値がランダムに出現しているかどうか等により有効ビットの範囲を判定することにより検出することが可能である。もちろん,かかる手法に限定されることはない。
前記有効ビット数が検出されると,その有効ビット数を特定する有効ビット数特定情報が前記ビットレンジ検出器302から前記符号器203−0に入力される。
次に,前記符号器203−0では,入力されたフレームデータ40と有効ビット数情報に基づいて前記フレームデータ40を符合化する。具体的は,16ビットのサンプルデータ401〜416のデータを有効ビット数分の16個のサンプルデータ(以下「ビット制限情報」という,図5中の範囲43)に符合化し,この符合化されたビット制限情報43に前記有効ビット数情報(図5中のビット幅42)を付加した符号データ44に圧縮する。
Here, a specific example of encoding using the number of effective bits will be described below with reference to FIG. 2, FIG. 5 and FIG.
For the sake of simplicity, as shown in FIG. 5, 16 pieces of 16-bit sample data (samples 401 to 416) representing any integer value of −4 to 3 in decimal notation are assembled. Consider the frame data 40. The frame data 40 is a data group having a time axis in the vertical direction. The frame data 40 represents the absolute value of an integer value of −4 to 3 with the two bits (bit numbers 0 and 1) from the beginning, and the third bit (bit number 2) from the beginning represents the sign. To express. That is, the third bit from the head is a valid bit, and the number of valid bits is three. Due to the nature of the sample data, the other bits except the valid bits have the same bit value as the sign.
First, when the frame data 40 is obtained by being framed and buffered by the buffer 201, the frame data 40 is then input to the encoder 203-0. At this time, the number of effective bits of the frame data 40 is detected by the bit range detector 302 provided in the input path of the frame data 40. Such detection can be performed by, for example, determining the valid bit range based on whether or not the value of each bit number of the sample data appears at random. Of course, it is not limited to such a method.
When the effective bit number is detected, effective bit number specifying information for specifying the effective bit number is input from the bit range detector 302 to the encoder 203-0.
Next, the encoder 203-0 encodes the frame data 40 based on the input frame data 40 and effective bit number information. Specifically, 16-bit sample data 401 to 416 are encoded into 16 sample data corresponding to the number of effective bits (hereinafter referred to as “bit limit information”, range 43 in FIG. 5). The bit limit information 43 is compressed into code data 44 obtained by adding the effective bit number information (bit width 42 in FIG. 5).

ここに,符合化装置Bのビットストリーム生成器205によりパッキングされたビットストリームの一例を図8に示す。尚,同図に示すビットストリームE2は,チャンネル数が1のPCMデータから生成されたビットストリームの一例を示す。
同図に示す如く,前記ビットストリームE2は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。更に,前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,前記符号データ44(図5参照)とに分けられる。なお,前記ビットストリームE1に含まれる同一データ(情報)については,同符号を付してその説明を省略する。
このように,有効ビット数を用いた符合化がなされることにより,符合化前は256ビット(16×16ビット)のフレームデータ40が,51ビット(3+3×16ビット)の符号データ,即ち,約20%に圧縮された符号データ44に符合化される。
An example of the bit stream packed by the bit stream generator 205 of the encoding device B is shown in FIG. The bit stream E2 shown in the figure shows an example of a bit stream generated from PCM data with one channel.
As shown in the figure, the bit stream E2 is roughly divided into a file header 608 and subsequent frame data. Further, the frame data is divided into frame data (1) 609, frame data (2) 610,. Further, the frame data (1) 609 is divided into method information 603 for identifying an encoding method (method) and the code data 44 (see FIG. 5). Note that the same data (information) included in the bit stream E1 is denoted by the same reference numeral and description thereof is omitted.
Thus, by encoding using the effective number of bits, before encoding, 256 bits (16 × 16 bits) of frame data 40 is converted into 51 bits (3 + 3 × 16 bits) of code data, that is, It is encoded into code data 44 compressed to about 20%.

次に,前記符号化装置Bにより生成されたビットストリームE2(図8参照)を取得し,復号化可能なディジタル信号復号化装置Dの一例について,図4を参照しながら説明する。以下に,図4に示すディジタル信号復号化装置D(以下「復号化装置D」と略す)に入力されたビットストリームE2が復号化され,PCMデータとして出力されるまでの各部の処理について,処理の流れに沿って説明する。なお,前記復号化装置Cと同じ構成要素には同符号を付して表すことによりその詳細な説明を省略する。
この第2の実施の形態における復号化装置Dは前記復号化装置Cと略同様の構成を有するが,図4に示すように,ビットレンジ拡張器510と経路切換器511とを更に具備する点において構成が異なる。
先ず,前記音声復号化装置Dに入力されたビットストリームE2は、入力端子501を介してビットストリーム解読器502に入力され,ビットストリームE2のセグメントを解読して各信号成分毎に分解された後に、それら信号成分の振り分けが行われる。
具体的には,ファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
ビットストリームE2に含まれるフレームデータ(1)609は,方式情報603とビット数特定情報42とビット制限情報43とに分割され,フレームデータ(2)610は方式情報605と予測係数特定情報606と残差信号情報607とに分割される。
この分割されたデータのうち,方式情報603,605,ビット制限情報43及び残差信号情報607が前記経路切換器511に出力される。一方,前記ビット数特定情報42は前記ビットレンジ拡張器510に出力される。
前記経路切換器511は,前記ビットストリーム解読器502から出力された情報を予測器503或いは前記ビットレンジ拡張器510のいずれかにデータを出力するため,入力された方式情報603や入力されたフレームデータ等を参照して,経路R1と経路R2とを切り換えるものである。具体的には,入力されたデータがビット制限情報43を含むものであるか,残差信号情報607を含むものであるかどうかを判定し,ビット制限情報43を含むものである場合には経路R2に切り換えられ,残差信号情報607を含むものである場合には経路R1に切り換えられる。このようにして,データが各部に振り分けられる。なお,前記予測器503で行われる処理については前記復号化装置Cの説明を参照されたい。
前記ビットレンジ拡張器510にビット制限情報43が出力されると,該ビットレンジ拡張器510では,入力したビット制限情報43の制限を該ビット制限情報43に対応するビット数特定情報42に基づいて元のフレームデータに拡張(復号化)する処理が実行される。例えば,図5に示すように,3ビットからなるビット数特定情報42を得てビット制限情報43を,1サンプル16ビットのサンプルデータが16集合したフレームデータ40に拡張する処理が行われる。その後,元に復号化されたフレームデータ40がバッファ504に転送され,前記バッファ504に格納されたフレームデータ40が,該バッファ504の出力信号として出力端子508を介して出力されることにより,PCMデータへの復号化が完了する。
Next, an example of a digital signal decoding apparatus D that can acquire and decode the bit stream E2 (see FIG. 8) generated by the encoding apparatus B will be described with reference to FIG. Hereinafter, the processing of each unit until the bit stream E2 input to the digital signal decoding device D (hereinafter referred to as “decoding device D”) shown in FIG. 4 is decoded and output as PCM data will be described. A description will be given along the flow. Note that the same components as those of the decoding device C are denoted by the same reference numerals and detailed description thereof is omitted.
The decoding device D according to the second embodiment has substantially the same configuration as the decoding device C, but further includes a bit range extender 510 and a path switch 511 as shown in FIG. The configuration is different.
First, the bit stream E2 input to the speech decoding apparatus D is input to the bit stream decoder 502 via the input terminal 501, and after the segments of the bit stream E2 are decoded and decomposed for each signal component. The signal components are sorted.
Specifically, the file header 608 is decomposed into a header 601 and a head sample value 602, the head sample value 602 is distributed to the buffer 504 and the predictor 503, and is output as a part of PCM data (head PCM data). .
Frame data (1) 609 included in the bit stream E2 is divided into method information 603, bit number specifying information 42, and bit restriction information 43, and frame data (2) 610 includes method information 605, prediction coefficient specifying information 606, It is divided into residual signal information 607.
Among the divided data, system information 603, 605, bit restriction information 43, and residual signal information 607 are output to the path switch 511. Meanwhile, the bit number specifying information 42 is output to the bit range extender 510.
The path switch 511 outputs the information output from the bit stream decoder 502 to either the predictor 503 or the bit range extender 510 in order to output the input method information 603 and the input frame. The route R1 and the route R2 are switched with reference to data and the like. Specifically, it is determined whether the input data includes the bit limit information 43 or the residual signal information 607. If the input data includes the bit limit information 43, the input data is switched to the route R2, and the remaining data is included. When the difference signal information 607 is included, the route R1 is switched. In this way, data is distributed to each part. For the processing performed by the predictor 503, refer to the description of the decoding device C.
When the bit limit expander 510 outputs the bit limit information 43 to the bit range extender 510, the bit range extender 510 determines the limit of the input bit limit information 43 based on the bit number specifying information 42 corresponding to the bit limit information 43. A process of extending (decoding) the original frame data is executed. For example, as shown in FIG. 5, processing is performed to obtain bit number specifying information 42 consisting of 3 bits and extend the bit restriction information 43 to frame data 40 in which 16 sample data of 16 bits per sample are gathered. Thereafter, the originally decoded frame data 40 is transferred to the buffer 504, and the frame data 40 stored in the buffer 504 is output as an output signal of the buffer 504 through the output terminal 508, whereby the PCM Decryption to data is complete.

本発明の第1の実施形態に係るディジタル信号符号化装置Aの概略構成を示すブロック図。1 is a block diagram showing a schematic configuration of a digital signal encoding apparatus A according to a first embodiment of the present invention. 本発明の第2の実施形態に係るディジタル信号符号化装置Bの概略構成を示すブロック図。The block diagram which shows schematic structure of the digital signal encoding apparatus B which concerns on the 2nd Embodiment of this invention. 本発明の第1の実施形態に係るディジタル信号符号化装置Aにより生成されたビットストリームE1を復号化するディジタル信号復号化装置Cの概略構成を示すブロック図。1 is a block diagram showing a schematic configuration of a digital signal decoding apparatus C that decodes a bitstream E1 generated by a digital signal encoding apparatus A according to a first embodiment of the present invention. 本発明の第2の実施形態に係るディジタル信号符号化装置Bにより生成されたビットストリームE2を復号化するディジタル信号復号化装置Dの概略構成を示すブロック図。The block diagram which shows schematic structure of the digital signal decoding apparatus D which decodes the bit stream E2 produced | generated by the digital signal encoding apparatus B which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態の符合化の説明に用いるディジタル信号の一例を示す図。The figure which shows an example of the digital signal used for description of the encoding of the 2nd Embodiment of this invention. ビットストリーム中の予測器識別子及び予測係数特定情報の符号長を説明する図。The figure explaining the code length of the predictor identifier and prediction coefficient specific information in a bit stream. ビットストリームの構成の一例を模式的に示す図。The figure which shows an example of a structure of a bit stream typically. ビットストリームの構成の他の例を模式的に示す図。The figure which shows the other example of a structure of a bit stream typically. 所定のランダム信号に対してゴロム符号化を施した場合の平均ビット長を示すテーブル図。The table figure which shows the average bit length at the time of performing Golomb encoding with respect to a predetermined random signal. ディジタル信号の一例を示す図。The figure which shows an example of a digital signal. 音声信号における振幅毎の出現頻度を示す図。The figure which shows the appearance frequency for every amplitude in an audio | voice signal. 予測残差信号における振幅毎の出現頻度を示す図。The figure which shows the appearance frequency for every amplitude in a prediction residual signal.

符号の説明Explanation of symbols

A,B…ディジタル信号符号化装置
C,D…ディジタル信号復号化装置
201…バッファ
202…予測器
203…符号器
204…符号長計算/選択器
205…ビットストリーム生成器
210…予測係数テーブル
212…減算器
213…メモリ部
502…ビットストリーム解読器
503…予測器
504…バッファ
505…予測係数形成部
507…予測係数テーブル
509…メモリ部
510…ビットレンジ拡張部
511…経路切換器
A, B: Digital signal encoding device C, D: Digital signal decoding device 201 ... Buffer 202 ... Predictor 203 ... Encoder 204 ... Code length calculator / selector 205 ... Bit stream generator 210 ... Prediction coefficient table 212 ... Subtractor 213 Memory unit 502 Bit stream decoder 503 Predictor 504 Buffer 505 Prediction coefficient forming unit 507 Prediction coefficient table 509 Memory unit 510 Bit range extension unit 511 Path switch

Claims (7)

入力されるディジタル信号を可逆符号化するディジタル信号符号化装置であって,
入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得手段と,
複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測手段と,
前記予測手段により予測された予測信号と前記サンプル取得手段により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出手段と,
前記残差信号算出手段により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化手段と,
前記サンプル取得手段により取得された所定サンプル数のディジタル信号を前記予測手段を介さずに符号化する第2の符号化手段と,
前記第1の符号化手段および前記第2の符号化手段により得られる符号の符号長に基づいて,前記第1の符号化手段および前記第2の符号化手段のいずれか一を選択する符号化選択手段と,
を具備してなることを特徴とするディジタル信号符号化装置。
A digital signal encoding device for reversibly encoding an input digital signal,
Sample acquisition means for acquiring the input digital signal every predetermined number of samples;
A plurality of prediction coefficients applied, and at least one prediction means for predicting a prediction signal of the current digital signal from a past digital signal by each prediction coefficient;
At least one residual signal calculation means for calculating a residual signal between the prediction signal predicted by the prediction means and the current digital signal of a predetermined number of samples actually acquired by the sample acquisition means;
The residual signal calculated by the residual signal calculating means and the prediction coefficient specifying information for specifying the prediction coefficient applied when predicting the prediction signal used for calculating the residual signal are encoded. At least one first encoding means;
Second encoding means for encoding a digital signal of a predetermined number of samples acquired by the sample acquisition means without going through the prediction means;
Encoding that selects one of the first encoding unit and the second encoding unit based on the code length of the code obtained by the first encoding unit and the second encoding unit A selection means;
A digital signal encoding apparatus comprising:
前記サンプル取得手段により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出手段を更に備え,
前記第2の符号化手段が,
前記有効ビット数検出手段により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものである請求項1に記載のディジタル信号符号化装置。
Further comprising effective bit number detecting means for detecting the effective bit number of the digital signal of the predetermined number of samples acquired by the sample acquiring means,
The second encoding means comprises:
2. The digital signal encoding apparatus according to claim 1, wherein the effective bit number detected by the effective bit number detecting means and effective bit number specifying information for specifying the effective bit number are encoded.
前記予測手段における予測係数には,前記サンプル取得手段で取得された所定サンプル数の前記ディジタル信号から線形予測分析により計算された予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。   2. The digital signal encoding apparatus according to claim 1, wherein the prediction coefficient in the prediction means includes a prediction coefficient calculated by linear prediction analysis from the digital signal of a predetermined number of samples acquired by the sample acquisition means. . 前記予測手段における予測係数には,前記サンプル取得手段で取得された所定サンプル数の前記ディジタル信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。   The prediction coefficient in the prediction means includes a prediction coefficient obtained by vector quantization based on a prediction coefficient calculated by linear prediction analysis from the digital signal of a predetermined number of samples acquired by the sample acquisition means. 2. The digital signal encoding device according to 1. 前記予測手段における予測係数には,前記符合化選択手段により過去に選択された第1の符合化手段で用いられた前記予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。   The digital signal encoding apparatus according to claim 1, wherein the prediction coefficient in the prediction means includes the prediction coefficient used in the first encoding means selected in the past by the encoding selection means. 入力されるディジタル信号を可逆符号化するディジタル信号符号化方法であって,
入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得工程と,
複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測工程と,
前記予測工程により予測された予測信号と前記サンプル取得工程により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出工程と,
前記残差信号算出工程により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化工程と,
前記サンプル取得工程により取得された所定サンプル数のディジタル信号を前記予測工程を介さずに符号化する第2の符号化工程と,
前記第1の符号化工程および前記第2の符号化工程により得られる符号の符号長に基づいて,前記第1の符号化工程および前記第2の符号化工程のいずれか一を選択する符号化選択工程と,
を具備してなることを特徴とするディジタル信号符号化方法。
A digital signal encoding method for lossless encoding of an input digital signal,
A sample acquisition step of acquiring the input digital signal every predetermined number of samples;
A plurality of prediction coefficients are applied, and each prediction coefficient predicts a prediction signal of the current digital signal from a past digital signal;
At least one residual signal calculation step of calculating a residual signal between the prediction signal predicted by the prediction step and the current digital signal of a predetermined number of samples actually acquired by the sample acquisition step;
The residual signal calculated by the residual signal calculating step and the prediction coefficient specifying information for specifying the prediction coefficient applied when predicting the prediction signal used for calculating the residual signal are encoded. At least one first encoding step;
A second encoding step for encoding the digital signal of a predetermined number of samples acquired by the sample acquisition step without going through the prediction step;
Encoding that selects one of the first encoding step and the second encoding step based on the code length of the code obtained by the first encoding step and the second encoding step A selection process;
A digital signal encoding method comprising:
前記サンプル取得工程により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出工程を更に備え,
前記第2の符号化工程が,
前記有効ビット数検出工程により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものである請求項6に記載のディジタル信号符号化方法。
An effective bit number detecting step of detecting an effective bit number of the digital signal of the predetermined number of samples acquired by the sample acquiring step;
The second encoding step comprises:
7. The digital signal encoding method according to claim 6, wherein the effective bit number detected by the effective bit number detection step and the effective bit number specifying information for specifying the effective bit number are encoded.
JP2005020000A 2005-01-27 2005-01-27 Device and method for digital signal encoding Pending JP2006211243A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005020000A JP2006211243A (en) 2005-01-27 2005-01-27 Device and method for digital signal encoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005020000A JP2006211243A (en) 2005-01-27 2005-01-27 Device and method for digital signal encoding

Publications (1)

Publication Number Publication Date
JP2006211243A true JP2006211243A (en) 2006-08-10

Family

ID=36967614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005020000A Pending JP2006211243A (en) 2005-01-27 2005-01-27 Device and method for digital signal encoding

Country Status (1)

Country Link
JP (1) JP2006211243A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012111512A1 (en) * 2011-02-16 2012-08-23 日本電信電話株式会社 Encoding method, decoding method, encoding apparatus, decoding apparatus, program and recording medium
JP2020008875A (en) * 2013-01-08 2020-01-16 ドルビー・インターナショナル・アーベー Model based prediction in critically sampled filter bank
CN111968653A (en) * 2020-07-15 2020-11-20 上海今日信息科技有限公司 Light-load double-Bit self-adaptive incremental speech coding and decoding method and device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012111512A1 (en) * 2011-02-16 2012-08-23 日本電信電話株式会社 Encoding method, decoding method, encoding apparatus, decoding apparatus, program and recording medium
JPWO2012111512A1 (en) * 2011-02-16 2014-07-07 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP5613781B2 (en) * 2011-02-16 2014-10-29 日本電信電話株式会社 Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP2020008875A (en) * 2013-01-08 2020-01-16 ドルビー・インターナショナル・アーベー Model based prediction in critically sampled filter bank
JP7053545B2 (en) 2013-01-08 2022-04-12 ドルビー・インターナショナル・アーベー Model-based predictions in critically sampled filter banks
JP7053545B6 (en) 2013-01-08 2022-05-16 ドルビー・インターナショナル・アーベー Model-based predictions in critically sampled filter banks
US11651777B2 (en) 2013-01-08 2023-05-16 Dolby International Ab Model based prediction in a critically sampled filterbank
US11915713B2 (en) 2013-01-08 2024-02-27 Dolby International Ab Model based prediction in a critically sampled filterbank
CN111968653A (en) * 2020-07-15 2020-11-20 上海今日信息科技有限公司 Light-load double-Bit self-adaptive incremental speech coding and decoding method and device
CN111968653B (en) * 2020-07-15 2023-10-27 上海今日信息科技有限公司 Light-load double-Bit self-adaptive incremental voice coding and decoding method and device

Similar Documents

Publication Publication Date Title
KR100818268B1 (en) Apparatus and method for audio encoding/decoding with scalability
KR100561869B1 (en) Lossless audio decoding/encoding method and apparatus
KR101343267B1 (en) Method and apparatus for audio coding and decoding using frequency segmentation
KR101330362B1 (en) Modification of codewords in dictionary used for efficient coding of digital media spectral data
JP5530454B2 (en) Audio encoding apparatus, decoding apparatus, method, circuit, and program
JP6450802B2 (en) Speech coding apparatus and method
JP5688861B2 (en) Entropy coding to adapt coding between level mode and run length / level mode
WO2002103685A1 (en) Encoding apparatus and method, decoding apparatus and method, and program
KR20120125513A (en) Encoder for audio signal including generic audio and speech frames
KR20050087956A (en) Lossless audio decoding/encoding method and apparatus
JP3824607B2 (en) Improved audio encoding and / or decoding method and apparatus using time-frequency correlation
US7444289B2 (en) Audio decoding method and apparatus for reconstructing high frequency components with less computation
Liebchen An introduction to MPEG-4 audio lossless coding
JP2008203315A (en) Audio encoding/decoding device and method, and software
JP2006211243A (en) Device and method for digital signal encoding
JP2004246038A (en) Speech or musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
JP4195598B2 (en) Encoding method, decoding method, encoding device, decoding device, encoding program, decoding program
CN113129913A (en) Coding and decoding method and coding and decoding device for audio signal
Hidayat et al. A critical assessment of advanced coding standards for lossless audio compression
JP2004170494A (en) Device and method for voice encoding
KR20080092823A (en) Apparatus and method for encoding and decoding signal
JP4438655B2 (en) Encoding device, decoding device, encoding method, and decoding method
JPH0918348A (en) Acoustic signal encoding device and acoustic signal decoding device
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal
JP4438654B2 (en) Encoding device, decoding device, encoding method, and decoding method