[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2000078018A - Voice coding system and device and data recording medium - Google Patents

Voice coding system and device and data recording medium

Info

Publication number
JP2000078018A
JP2000078018A JP11160383A JP16038399A JP2000078018A JP 2000078018 A JP2000078018 A JP 2000078018A JP 11160383 A JP11160383 A JP 11160383A JP 16038399 A JP16038399 A JP 16038399A JP 2000078018 A JP2000078018 A JP 2000078018A
Authority
JP
Japan
Prior art keywords
bit allocation
encoding
band
coding method
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11160383A
Other languages
Japanese (ja)
Other versions
JP3466507B2 (en
Inventor
Eiji Kawahara
栄治 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP16038399A priority Critical patent/JP3466507B2/en
Publication of JP2000078018A publication Critical patent/JP2000078018A/en
Application granted granted Critical
Publication of JP3466507B2 publication Critical patent/JP3466507B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To produce the coded data of high sound quality in real time and with no sound break by switching the using bit allocation means to execute the bit allocation and then the coding so as to perform the due processing by means of the prescribed one of plural bit allocation means. SOLUTION: A sub-band analyzing means 102 divides the inputted digital audio signals into 32 frequency components. A grouping means 111 divides the 32 frequency components into the number of groups that is designated by the throughput control information 121. An allocatable bit arithmetic means 113 decides each allocatable bit number to an aural psychological model bit allocation means 110 and a band output adaptive bit allocation means 109 based on the total allocatable bit number. Each of sub-band signals is coded by a quantizing/coding means 106 and an auxiliary information coding means 107, and a bit stream forming means 108 forms and outputs a bit stream.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声符号化方式、
及び音声符号化装置、及びデータ記憶媒体に関し、特に
MPEG(Motion Picture Experts Group)方式で用い
られているようなサブバンド符号化方式を用いる音声符
号化方式、及び音声符号化装置、及び前記音声符号化方
式を実行するためのプログラムを格納したデータ記憶媒
体に関するものである。
[0001] The present invention relates to a speech coding system,
And an audio encoding device and a data storage medium, particularly an audio encoding method using a subband encoding method as used in the MPEG (Motion Picture Experts Group) method, an audio encoding device, and the audio code The present invention relates to a data storage medium storing a program for executing a conversion method.

【0002】[0002]

【従来の技術】近年、パソコンのマルチメディア化やイ
ンターネットの普及により、パソコン(以下、PCとも
いう)等の上で、ソフトウエアによってMPEG等の動
画や音声を再生できる環境が整ってきており、MPEG
等の符号化データの利用範囲が広がっている。しかしな
がら、符号化データを作るエンコーダに関しては、いま
だに高価なハードウエアを用いられるのが主流である。
また、ソフトウエアで符号化データを作るものもある
が、符号化対象となる動画や音声の再生時間の実時間の
何倍もの処理時間をかけて符号化を行うものであるた
め、多大な時間、及び手間を要し、広く普及するに至っ
ていない。
2. Description of the Related Art In recent years, with the use of multimedia in personal computers and the spread of the Internet, an environment in which moving images and audio such as MPEG can be reproduced by software on personal computers (hereinafter, also referred to as PCs) has been prepared. MPEG
And the like, the use range of encoded data is expanding. However, with respect to encoders for producing encoded data, expensive hardware is still mainly used.
In some cases, the encoded data is created by software, but the encoding takes a lot of processing time compared to the real time of the video or audio to be encoded, and the encoding takes a lot of time. , And it is troublesome and has not yet spread widely.

【0003】このため、特に一般のパソコンユーザが安
価で簡単に符号化データを作成できるようになるために
は、ソフトウエア処理により実時間での符号化データの
作成を実現したいという要望がある。
[0003] For this reason, there is a demand for realizing encoded data in real time by software processing in order for ordinary personal computer users to be able to create encoded data easily and cheaply.

【0004】以下に従来の音声符号化方式の一例につい
て説明する。図11は音声に関する符号化データフォー
マットとして、ISO/IEC11172-3にて規格化されているM
PEGオーディオエンコーダのブロック図である。図1
1において、入力デジタルオーディオ信号は、サブバン
ド分析手段202において32個の周波数成分に分割さ
れ、各サブバンド信号に対し、スケールファクタ抽出手
段203においてスケールファクタを計算し、ダイナミ
ックレンジをそろえる。また、入力デジタルオーディオ
信号は、FFT手段204において、高速フーリエ変換
(FFT:Fast Fourier Transform)され、この結果を用い
て、聴覚心理分析手段205により人間の聴覚の特性を
利用した聴覚心理モデルに基づく信号対マスク比(SM
R)値の関係モデルを利用し、ビット割り当て手段20
6により各サブバンド信号に対するビット割り当て数を
決める。各サブバンド信号へのビット割り当て数に応じ
て、各サブバンド信号を量子化/符号化手段207によ
り量子化/符号化する。そして、ビットストリーム形成
手段209により、補助情報符号化手段208により符
号化されたヘッダ情報と補助情報を共にしてビットスト
リームを形成して出力する。
[0004] An example of a conventional speech coding system will be described below. FIG. 11 shows an M format standardized by ISO / IEC11172-3 as an encoded data format related to audio.
FIG. 2 is a block diagram of a PEG audio encoder. FIG.
In 1, the input digital audio signal is divided into 32 frequency components by a sub-band analysis unit 202, and a scale factor is calculated for each sub-band signal by a scale factor extraction unit 203 to make the dynamic range uniform. The input digital audio signal is subjected to a fast Fourier transform by the FFT unit 204.
(FFT: Fast Fourier Transform), and using the result, the signal-to-mask ratio (SM) based on the psychoacoustic model utilizing the characteristics of human hearing by the psychoacoustic analysis means 205
R) Using the value relation model, the bit allocation means 20
The number of bits allocated to each sub-band signal is determined by 6. Quantization / encoding means 207 quantizes / encodes each subband signal in accordance with the number of bits allocated to each subband signal. Then, the bit stream forming unit 209 forms and outputs a bit stream by using the header information and the auxiliary information encoded by the auxiliary information encoding unit 208 together.

【0005】この従来の音声符号化方式は、各帯域電力
の偏在を利用して各帯域(サブバンド)毎に符号化を行
うような符号化方式であるため、聴覚心理モデルを利用
した各サブバンド信号に対するビット配分が音質を左右
することになる。また、蓄積媒体を利用目的として規格
化されたため、符号化データの高音質化には適している
が、実時間での符号化には適しておらず、音質を左右す
る聴覚心理モデルは非常に演算量の多いものとなってい
る。
[0005] Since this conventional speech coding system is a coding system in which coding is performed for each band (sub-band) using uneven distribution of power in each band, each sub-band using an psychoacoustic model is used. The bit allocation to the band signal affects the sound quality. In addition, since it was standardized for the purpose of using storage media, it is suitable for high-quality sound of coded data, but not suitable for real-time coding. The calculation amount is large.

【0006】[0006]

【発明が解決しようとする課題】従来の音声符号化方
式、及び音声符号化装置は以上のように構成されてお
り、蓄積媒体を対象とする高音質な符号化データを作成
するには適しているが、聴覚心理モデルの利用は多くの
処理能力が必要とされるため、ソフトウエアで処理する
には現在のCPU能力ではPC上で実時間処理するには
不適当である。また、実時間処理可能な高性能なCPU
を搭載したPC上で動作させた場合においても、他のア
プリケーションのCPU占有率が大きくなった時などで
は、実時間での処理が不可能となる恐れがあり、その結
果、音途切れが発生する可能性があるという問題点があ
る。
The conventional speech coding system and the conventional speech coding apparatus are constructed as described above, and are suitable for producing high-quality coded data for a storage medium. However, since the use of the psychoacoustic model requires a large amount of processing capability, the current CPU capability for processing by software is inappropriate for real-time processing on a PC. Also, a high-performance CPU capable of real-time processing
Even if the application is operated on a PC equipped with the application, when the CPU occupancy of another application becomes large, there is a possibility that the processing in real time may become impossible, and as a result, the sound is interrupted. There is a problem that there is a possibility.

【0007】この発明は、以上のような問題点を解決す
るためになされたもので、パソコンのCPU処理能力、
及び他のアプリケーションのCPU占有率に左右され
ず、実時間で音途切れがない高音質の符号化データの作
成をソフトウエア処理により実現することができる音声
符号化方式、音声符号化装置、及び上記符号化を実行す
るためのプログラムを格納したデータ記憶媒体を提供す
ることを目的とする。
The present invention has been made in order to solve the above problems, and has a CPU processing capability of a personal computer.
And a voice coding method and a voice coding device capable of realizing, by software processing, creation of high-quality coded data in which sound is not interrupted in real time without being affected by the CPU occupancy of another application. An object of the present invention is to provide a data storage medium storing a program for executing encoding.

【0008】[0008]

【課題を解決するための手段】この発明の請求項1にか
かる音声符号化方式は、デジタルオーディオ信号を複数
の周波数帯域に分割し、各帯域毎に符号化を行う音声符
号化方式であって、上記分割された各帯域に対するビッ
ト割り当て情報を生成し、それぞれ処理量の異なるビッ
ト割り当て手段を複数有し、外部からの制御情報に基づ
いて、上記複数のビット割り当て手段の中から、所定の
ビット割り当て手段を用いて処理がなされるように、使
用するビット割り当て手段を切り替えてビット割り当て
を実行して、符号化するものである。
According to a first aspect of the present invention, there is provided a voice coding system for dividing a digital audio signal into a plurality of frequency bands and performing coding for each band. Generating bit allocation information for each of the divided bands, having a plurality of bit allocation units each having a different processing amount, and determining a predetermined bit from among the plurality of bit allocation units based on external control information. In order to perform processing using the allocating means, the bit allocating means to be used is switched to execute bit allocation and perform encoding.

【0009】また、本発明の請求項2にかかる音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、上記外部からの制御情報として、符号化処理を行う
ために占有できる中央演算処理装置の処理量を表す負荷
値を用い、該負荷値に基づいて上記中央演算処理装置で
符号化処理において各ビット割り当て手段を用いて符号
化動作を行った時の各処理量を予め記憶したデータテー
ブルを参照して、上記符号化処理が占有できる中央演算
処理装置の処理量を超えないよう上記ビット割り当て手
段の選択を行うものである。
According to a second aspect of the present invention, there is provided a speech encoding system according to the first aspect, wherein the central processing unit can occupy for performing an encoding process as the external control information. Using the load value representing the processing amount of the processing device, based on the load value, the processing amount when performing the encoding operation using each bit allocating unit in the encoding process in the central processing unit is stored in advance. With reference to the data table, the bit allocation means is selected so that the processing amount of the central processing unit that can be occupied by the encoding processing does not exceed the processing amount.

【0010】また、本発明の請求項3にかかる音声符号
化方式は、上記請求項2記載の音声符号化方式におい
て、上記負荷値として、符号化処理を行うために占有可
能な上記中央演算処理装置の処理量を監視する監視手段
からの処理量制御情報を用いるものである。
According to a third aspect of the present invention, there is provided the voice encoding system according to the second aspect, wherein the load value is a central processing process which can be occupied for performing a coding process. It uses processing amount control information from monitoring means for monitoring the processing amount of the apparatus.

【0011】また、本発明の請求項4にかかる音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、上記ビット割り当て手段によるビット割り当て処理
として、符号化データの高音質化を実現可能な高効率に
ビット割り当てを行う高効率ビット割り当て方法を用い
た処理と、上記高効率ビット割り当て方法を用いた処理
と比較して処理量の少ない低負荷でビット割り当てを行
う低負荷ビット割り当て方法を用いた処理とが行われる
ものである。
According to a fourth aspect of the present invention, in the audio coding system according to the first aspect of the present invention, high quality sound of the encoded data is realized as the bit allocation processing by the bit allocation means. A process using a high-efficiency bit allocation method for allocating bits at a possible high efficiency, and a low-load bit allocation method for performing bit allocation with a low load with a small processing amount as compared with the process using the above-mentioned high efficiency bit allocation method Is performed.

【0012】また、本発明の請求項5にかかる音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、上記符号化時に使用されるビット割り当て手段の切
り替えを、オーディオ信号に復号可能な最小単位である
フレーム単位で行うものである。
According to a fifth aspect of the present invention, there is provided the audio coding system according to the first aspect, wherein the switching of the bit allocation means used at the time of the encoding can be decoded into an audio signal. This is performed on a frame basis which is a minimum unit.

【0013】また、本発明の請求項6にかかる音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、複数の周波数帯域に分割された各帯域のサブバンド
信号を、各々予め定められた所定個数のサブバンド信号
からなるグループとなるように分けを行うグループ分け
を行い、各グループに対して独立したビット割り当て処
理行い、各帯域に対するビット割り当て情報を生成する
ものである。
According to a sixth aspect of the present invention, there is provided the speech encoding system according to the first aspect, wherein the sub-band signals of each band divided into a plurality of frequency bands are respectively predetermined. The group is divided into groups each having a predetermined number of sub-band signals, and bit allocation processing is performed independently for each group to generate bit allocation information for each band.

【0014】また、本発明の請求項7にかかる音声符号
化方式は、上記請求項6記載の音声符号化方式におい
て、上記グループ分けは、グループの数、又はグループ
内の周波数軸方向に連続したサブバンド信号の数を、上
記外部からの制御情報により指定された数、又は上記監
視手段からの処理量制御情報に基づいて指定された数に
可変的に行われるものである。
According to a seventh aspect of the present invention, in the audio coding system according to the sixth aspect, the grouping is performed in the number of groups or in the frequency axis direction within the groups. The number of subband signals is variably set to the number specified by the external control information or the number specified based on the processing amount control information from the monitoring unit.

【0015】また、本発明の請求項8にかかる音声符号
化方式は、上記請求項7記載の音声符号化方式におい
て、上記サブバンド信号の数の変更処理を、オーディオ
信号に復号可能な最小単位であるフレーム単位で行うも
のである。
According to an eighth aspect of the present invention, in the audio coding system according to the seventh aspect, the process of changing the number of the sub-band signals is a minimum unit which can be decoded into an audio signal. Is performed in frame units.

【0016】また、本発明の請求項9にかかる音声符号
化方式は、上記請求項8記載の音声符号化方式におい
て、上記グループ分け時に、ビット割り当てを行わない
グループを少なくとも1つ設けるものである。
According to a ninth aspect of the present invention, there is provided the audio coding system according to the eighth aspect, wherein at least one group to which no bit is allocated is provided at the time of the grouping. .

【0017】また、本発明の請求項10にかかる音声符
号化方式は、上記請求項6記載の音声符号化方式におい
て、上記サブバンド信号のグループ分けにより、低帯域
に属するグループにグループ分けされたサブバンド信号
に対し、符号化データの高音質化を実現可能な高効率ビ
ット割り当て方法を用いて、グループ内のサブバンド信
号にビット割り当てを行い、グループ内のサブバンド信
号にビット割り当てを行う一方、高帯域に属するグルー
プにグループ分けされたサブバンド信号に対し、高効率
ビット割り当て方法と比較して処理量の少ない低負荷ビ
ット割り当て処理を用いて、グループ内のサブバンド信
号にビット割り当てを行うものである。また、本発明の
請求項11にかかる音声符号化方式は、上記請求項6記
載の音声符号化方式において、各グループ毎に独立した
ビット割り当て手段に対する割り当て可能ビット数を決
定する割り当て可能ビット演算手段を設け、各グループ
のグループ全体に対する割合に各グループに属する各帯
域毎の特性に基づいた重み付けを加味したものを用い
て、グループ全体に対する割り当て可能ビット数を各グ
ループ毎に独立したビット割り当て手段に対し振り分け
るものである。
According to a tenth aspect of the present invention, in the audio coding system according to the sixth aspect, the subband signals are grouped into groups belonging to a low band by grouping the subband signals. For a subband signal, using a highly efficient bit allocation method capable of realizing high quality sound of encoded data, assigning bits to subband signals within a group and assigning bits to subband signals within a group For the sub-band signals grouped into the group belonging to the high band, the bits are allocated to the sub-band signals in the group by using a low-load bit allocation process with a smaller processing amount compared to the high-efficiency bit allocation method Things. An audio encoding method according to claim 11 of the present invention is the audio encoding method according to claim 6, wherein the assignable bit calculating means determines the number of assignable bits for the independent bit allocating means for each group. And using the ratio of each group to the entire group, taking into account the weight based on the characteristics of each band belonging to each group, and assigning the number of bits that can be allocated to the entire group to the bit allocation means independent for each group. It is something to sort.

【0018】また、本発明の請求項12にかかる音声符
号化方式は、上記請求項11記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、各帯域毎の所定の最小可聴限界値に基づいた
重み付けとするものである。また、本発明の請求項13
にかかる音声符号化方式は、上記請求項11記載の音声
符号化方式において、各グループに属する各帯域毎の特
性に基づいた重み付けを、入力デジタルオーディオ信号
にサブバンド分析を施して得られる各グループに属する
各周波数帯域のサブバンド信号レベルに基づいた重み付
けとするものである。
According to a twelfth aspect of the present invention, in the audio coding system according to the eleventh aspect, weighting based on characteristics of each band belonging to each group is performed for each band. The weighting is based on a predetermined minimum audible limit value. Claim 13 of the present invention
The audio coding method according to claim 11, wherein each group obtained by performing a sub-band analysis on an input digital audio signal is weighted based on a characteristic of each band belonging to each group. Are weighted based on the subband signal level of each frequency band belonging to.

【0019】また、本発明の請求項14にかかる音声符
号化方式は、上記請求項11記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、入力デジタルオーディオ信号に線形変換を施
して得られる各グループに属するスペクトル信号レベル
に基づいた重み付けとするものである。
According to a fourteenth aspect of the present invention, in the audio coding system according to the eleventh aspect, weighting based on characteristics of each band belonging to each group is performed by the input digital audio signal. Are weighted based on the spectral signal level belonging to each group obtained by performing a linear transformation on

【0020】また、本発明の請求項15にかかる音声符
号化方式は、上記請求項6記載の音声符号化方式におい
て、各グループに属する信号レベルが所定のしきい値以
上の高レベルな信号に対しては、符号化データの高音質
化を実現可能な高効率ビット割り当て方法を用いてビッ
ト割り当てを行い、各グループに属する信号レベルが、
所定のしきい値以下の低レベルな信号に対しては、上記
高効率ビット割り当て方法と比較して処理量の少ない低
負荷ビット割り当て方法を用いてビット割り当てを行う
ものである。
According to a fifteenth aspect of the present invention, in the voice coding system according to the sixth aspect of the present invention, a high level signal whose signal level belonging to each group is equal to or higher than a predetermined threshold value is obtained. On the other hand, bit allocation is performed using a high-efficiency bit allocation method that can realize high sound quality of encoded data, and the signal level belonging to each group is
For low-level signals equal to or lower than a predetermined threshold value, bit allocation is performed using a low-load bit allocation method that requires less processing than the above-described high-efficiency bit allocation method.

【0021】また、本発明の請求項16にかかる音声符
号化方式は、上記請求項15記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、入力デジ
タルオーディオ信号にサブバンド分析を施して得られる
サブバンド信号レベルとするものである。
According to a sixteenth aspect of the present invention, in the audio coding system according to the fifteenth aspect, a signal level belonging to each of the groups is subjected to sub-band analysis of an input digital audio signal. The sub-band signal level is obtained as follows.

【0022】また、本発明の請求項17にかかる音声符
号化方式は、上記請求項15記載の音声符号化方式にお
いて、上記各グループに属する信号レベルが、入力デジ
タルオーディオ信号に線形変換を施して得られるスペク
トル信号レベルであるものである。
According to a seventeenth aspect of the present invention, in the audio coding system according to the fifteenth aspect, the signal level belonging to each group is obtained by performing a linear conversion on an input digital audio signal. This is the spectral signal level obtained.

【0023】また、本発明の請求項18にかかる音声符
号化方式は、上記請求項15記載の音声符号化方式にお
いて、上記各グループに属する信号レベルを、所定の各
帯域毎の最小可聴限界値とするものである。
[0023] In the speech coding system according to claim 18 of the present invention, in the speech coding system according to claim 15, the signal level belonging to each group is set to a minimum audible threshold value for each predetermined band. It is assumed that.

【0024】また、本発明の請求項19にかかる音声符
号化方式は、上記請求項4, 10,15のいずれかに記
載の音声符号化方式において、上記符号化データの高音
質化を実現可能な高効率ビット割り当て処理は、所定の
聴覚心理モデルに基づく信号対マスク比値との関係を使
用して行われるビット割り当て処理であり、上記高効率
ビット割り当て処理と比較して処理量の少ない低負荷ビ
ット割り当て処理は、複数の周波数帯域に分割された信
号レベルに各帯域毎の所定の最小可聴限界値を加味して
行われるビット割り当て処理であるものとしたものであ
る。
According to a nineteenth aspect of the present invention, in the speech coding system according to any one of the fourth, tenth, and fifteenth aspects, it is possible to realize high-quality sound of the encoded data. The high-efficiency bit allocation process is a bit allocation process that is performed using a relationship between a signal and a mask ratio value based on a predetermined psychoacoustic model. The load bit allocation process is a bit allocation process performed by adding a predetermined minimum audible limit value for each band to a signal level divided into a plurality of frequency bands.

【0025】また、本発明の請求項20にかかる音声符
号化方式は、上記請求項19記載の音声符号化方式にお
いて、聴覚心理モデルがMPEG(Motion Picture Exp
ertsGroup)によって指定された聴覚心理モデルである
ものである。
[0025] According to a twentieth aspect of the present invention, in the above-mentioned nineteenth aspect, the psychoacoustic model is MPEG (Motion Picture Exposure).
ertsGroup).

【0026】また、本発明の請求項21記載の音声符号
化方式は、上記請求項5または請求項8記載の音声符号
化方式において、上記オーディオ信号に復号可能な最小
単位であるフレームが、MPEG(Motion Picture Exp
erts Group)によって指定されたフレームであるもので
ある。
According to a twenty-first aspect of the present invention, in the audio coding system according to the fifth or eighth aspect, a frame which is a minimum unit that can be decoded into the audio signal is an MPEG signal. (Motion Picture Exp
erts Group).

【0027】また、本発明の請求項22記載の音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、上記ビット割り当て手段は、分割化された各帯域に
対し、所定の聴覚心理モデルから出力される情報に基づ
いてビット割り当て情報を生成するものであり、N(N=
1,2,3...)フレームに1度、上記所定の聴覚心理モ
デルから出力される情報に基づいてビット割り当て情報
を生成し、上記ビット割り当て情報を生成しなかったフ
レームに対しては、上記聴覚心理モデルから出力された
情報と上記分割された各帯域の信号情報に基づいてビッ
ト割り当て情報を生成し、符号化を行なうものである。
[0027] According to a speech encoding system of the present invention, in the speech encoding system of the first aspect, the bit allocating means may include a predetermined auditory psychology for each of the divided bands. The bit allocation information is generated based on the information output from the model, and N (N =
Once every 1,2,3 ...) frame, bit allocation information is generated based on information output from the predetermined psychoacoustic model. For a frame for which the bit allocation information is not generated, Bit allocation information is generated based on the information output from the psychoacoustic model and the signal information of each of the divided bands, and is encoded.

【0028】また、本発明の請求項23記載の音声符号
化方式は、上記請求項項1記載の音声符号化方式におい
て、段階的に処理量の制御可能な聴覚心理モデルを有
し、外部からの制御情報に基づいて、上記聴覚心理モデ
ルの処理量制御を行ない、所定の処理量の聴覚心理モデ
ルを用いて処理がなされるように、各帯域に対するビッ
ト割り当て情報を生成するものである。
According to a twenty-third aspect of the present invention, there is provided a speech encoding system according to the first aspect, wherein the speech encoding system has an auditory psychological model capable of controlling a processing amount in a stepwise manner. Based on the control information, the processing amount of the psychoacoustic model is controlled, and bit allocation information for each band is generated so that the processing is performed using the psychoacoustic model having a predetermined processing amount.

【0029】また、本発明の請求項24記載の音声符号
化方式は、上記請求項1記載の音声符号化方式におい
て、それぞれ処理量の異なる聴覚心理モデルを複数有
し、外部からの制御情報に基づいて、上記複数の聴覚心
理モデルの中から、所定の聴覚心理モデルを用いて処理
が成されるように、使用する聴覚心理モデルを切り替え
て、各帯域に対するビット割り当て情報を生成するもの
である。
A speech coding method according to a twenty-fourth aspect of the present invention is the speech coding method according to the first aspect, wherein a plurality of psychoacoustic models having different processing amounts are provided, and control information from outside is provided. On the basis of the plurality of psychoacoustic models, a psychoacoustic model to be used is switched so that processing is performed using a predetermined psychological model, and bit allocation information for each band is generated. .

【0030】また、本発明の請求項25記載の音声符号
化方式は、デジタルオーディオ信号を複数の周波数帯域
に分割し、該分割された各帯域に対するビット割り当て
情報を生成し、所定ビットレートでの伝送を目的として
各帯域毎に符号化を行なう音声符号化方式であって、符
号化データストリーム中にデータを挿入するフレームに
おけるビット割り当て範囲を制御し、符号化オーディオ
データ量を可変に制御するものである。
Further, according to the speech coding system of the present invention, a digital audio signal is divided into a plurality of frequency bands, bit allocation information for each of the divided bands is generated, A voice coding method that performs coding for each band for transmission purposes, and controls the bit allocation range in a frame in which data is inserted into a coded data stream, and variably controls the amount of coded audio data. It is.

【0031】また、本発明の請求項26記載の音声符号
化方式は、上記請求項25記載の音声符号化方式におい
て、外部からの制御情報に基づいて、フレーム単位でビ
ット割り当て範囲を制御し、符号化オーディオデータ量
を可変に制御するものである。
According to a speech coding method according to claim 26 of the present invention, in the speech coding method according to claim 25, a bit allocation range is controlled in frame units based on external control information. It controls the amount of encoded audio data variably.

【0032】また、本発明の請求項27にかかる音声符
号化方式は、上記請求項26記載の音声符号化方式にお
いて、上記外部からの制御情報として、付加データのバ
ッファを監視する監視手段からのデータ量制御情報を用
いるものである。
According to a twenty-seventh aspect of the present invention, in the audio coding system according to the twenty-sixth aspect, as the external control information, a monitor means for monitoring a buffer of additional data is provided. It uses data amount control information.

【0033】また、本発明の請求項28にかかる音声符
号化方式は、上記請求項1記載の音声符号化方式におい
て、符号化処理が実行される中央演算処理装置の性能に
応じて、符号化処理動作前の初期化時に複数のビット割
り当て手段、または複数の聴覚心理モデルの各処理負荷
値情報を外部へ出力するものである。
According to a twenty-eighth aspect of the present invention, in the voice coding system according to the first aspect, the coding is performed in accordance with the performance of the central processing unit in which the coding process is performed. At the time of initialization before the processing operation, the processing load value information of a plurality of bit allocation means or a plurality of psychoacoustic models is output to the outside.

【0034】また、本発明の請求項29にかかる音声符
号化方式は、上記請求項28記載の音声符号化方式にお
いて、外部への情報として出力される複数のビット割り
当て手段、または複数の聴覚心理モデルの各処理負荷値
情報が、降順、あるいは昇順で出力されるものである。
According to a twenty-seventh aspect of the present invention, in the speech coding system according to the twenty-eighth aspect, a plurality of bit allocation means output as information to the outside, or a plurality of psychoacoustic systems are provided. Each processing load value information of the model is output in descending order or ascending order.

【0035】また、本発明の請求項30にかかる音声符
号化方式は、映像信号,音声信号の符号化処理が同一の
中央演算処理装置にて処理がなされる音声符号化方式に
おいて、異なる複数の演算量で符号化を行うものであっ
て、上記音声信号もしくは映像信号の符号化の演算量を
変更することで、上記中央演算処理装置上での処理の全
体的な演算量を制御するものである。
The audio coding method according to claim 30 of the present invention is different from the audio coding method in which the video signal and the audio signal are encoded by the same central processing unit. The encoding is performed by the amount of operation, and the overall amount of operation of the processing on the central processing unit is controlled by changing the amount of operation of encoding the audio signal or the video signal. is there.

【0036】また、本発明の請求項31にかかる音声符
号化方式は、映像信号,音声信号の符号化処理が同一の
中央演算処理装置にて処理がなされる音声符号化方式に
おいて、演算量の異なる複数の符号化方式を用いて符号
化を行うものであって、上記音声信号の符号化の符号化
方式を変更することで、上記中央演算処理装置上での処
理の全体的な演算量を制御するものである。
The audio coding method according to claim 31 of the present invention is the same as the audio coding method in which the video signal and the audio signal are processed by the same central processing unit. The encoding is performed using a plurality of different encoding methods, and by changing the encoding method of the audio signal encoding, the overall operation amount of the processing on the central processing unit is reduced. To control.

【0037】また、本発明の請求項32にかかる音声符
号化方式は、上記請求項30または31記載の音声符号
化方式において、上記中央演算処理装置上での処理の制
御を、外部からの制御情報に基づいて行うものである。
According to a thirty-second aspect of the present invention, in the audio coding system according to the thirty-first or thirty-first aspect, the control of the processing on the central processing unit is controlled by an external control. This is performed based on information.

【0038】また、本発明の請求項33にかかる音声符
号化方式は、ディジタルオーディオ信号に対して、時間
/周波数変換を施し、量子化情報を生成することで符号
化を行う音声符号化方式であって、それぞれ演算量の異
なる複数の量子化情報算出手段を有し、外部からの制御
情報に基づいて、上記複数の量子化情報算出手段の中か
ら、所定の量子化情報算出手段を選択して処理が行われ
るように、使用する量子化情報算出手段を切り替えて量
子化情報を算出して符号化を行うものである。
[0038] Further, a voice coding method according to claim 33 of the present invention is a voice coding method for performing time / frequency conversion on a digital audio signal and generating quantization information to perform coding. There is provided a plurality of quantization information calculation means each having a different operation amount, and a predetermined quantization information calculation means is selected from the plurality of quantization information calculation means based on external control information. In order to perform the processing, the quantization information calculating means to be used is switched to calculate the quantization information and perform the encoding.

【0039】また、本発明の請求項34記載の音声符号
化装置は、上記請求項1ないし請求項33のいずれかに
記載の音声符号化方式を用いて音声符号化を行うもので
ある。
A speech coding apparatus according to a thirty-fourth aspect of the present invention performs speech coding using the speech coding method according to any one of the first to thirty-third aspects.

【0040】また、本発明の請求項35記載の記録媒体
は、上記請求項1ないし請求項33のいずれかに記載の
音声符号化方式のステップが記録されているものであ
る。
A recording medium according to a thirty-fifth aspect of the present invention has recorded thereon the steps of the audio encoding system according to any one of the first to thirty-third aspects.

【0041】[0041]

【発明の実施の形態】以下、本発明の実施の形態による
音声符号化方式、音声符号化装置について、図面を参照
しながら説明する。 (実施の形態1)ここでは、例えば、入力信号を複数の
周波数成分に分割し、各帯域電力の偏在を利用して各帯
域(サブバンド)毎に符号化を行うような符号化方式の
場合について説明する。図1は例えば、上記符号化方式
による音声符号化装置としてパーソナルコンピュータ
(以下、PCともいう)が用いられた場合のシステム全
体の概念図であり、図において、1はカメラ17とマイ
ク19などの外部機器よりのデータ入力が可能な、いわ
ゆるマルチメディア型のPCであり、各種データ及びプ
ログラムを格納する記憶容量が大きく固定式の記録媒体
であるハードディスクドライブ(HDD)11と、HD
D11とプログラムやデータなどの入出力を行うための
比較的記憶容量の小さな着脱自在な記憶媒体であるPD
ドライブ12a, FDドライブ12bを有し、上記HD
Dに格納されたプログラムが中央演算処理装置(CP
U)14からの命令により適宜ランダムアクセスメモリ
(RAM)などで構成されたメモリ13上に読み出され
て実行されるように構成されている。また、外部機器で
あるカメラ17、マイク19の映像、音声を取り込むた
めに、それぞれビデオキャプチャーカード16、サウン
ドカード18が内蔵されている。そして以上のような構
成を有するPC1は、内部のデータバス15によって各
要素が接続されている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A speech coding system and a speech coding apparatus according to an embodiment of the present invention will be described below with reference to the drawings. (Embodiment 1) Here, for example, in the case of an encoding system in which an input signal is divided into a plurality of frequency components, and encoding is performed for each band (subband) using uneven distribution of power in each band. Will be described. FIG. 1 is a conceptual diagram of the entire system in the case where a personal computer (hereinafter, also referred to as a PC) is used as an audio encoding device according to the above encoding method. A hard disk drive (HDD) 11, which is a so-called multimedia type PC capable of inputting data from an external device, has a large storage capacity for storing various data and programs, and is a fixed recording medium;
PD which is a detachable storage medium having a relatively small storage capacity for inputting / outputting programs, data, etc. from D11
Drive 12a, FD drive 12b, and the HD
D is stored in a central processing unit (CP)
U) It is configured to be appropriately read out and executed on a memory 13 constituted by a random access memory (RAM) or the like by an instruction from the U) 14. In addition, a video capture card 16 and a sound card 18 are respectively incorporated in the camera 17 and the microphone 19 as external devices in order to capture images and sounds. The components of the PC 1 having the above configuration are connected by the internal data bus 15.

【0042】図2は図1に示したPC1により実行され
る音声符号化処理を実現するための音声符号化装置の符
号化器20のブロック構成図であり、実際にはHD11
からメモリ13に読み出されたプログラムによって実現
されているものである。図2において、21はCPU1
4の負荷状態を監視するためのCPU負荷監視情報であ
り、22はCPU負荷監視情報21に基づいて、低帯域
符号化処理手段23と高帯域符号化処理手段24の動作
を制御する符号化手段制御手段である。また、25は上
記2つの符号化処理手段23, 24の出力をそれぞれス
トリーム信号とするためのビットストリーム形成処理手
段である。さらに、26は、ユーザが指定することによ
り上記符号化手段制御手段22に入力される符号化モー
ド指定信号である。
FIG. 2 is a block diagram of the encoder 20 of the audio encoding apparatus for implementing the audio encoding process executed by the PC 1 shown in FIG.
This is realized by a program read from the memory 13 into the memory 13. In FIG. 2, reference numeral 21 denotes a CPU1.
Reference numeral 4 denotes CPU load monitoring information for monitoring the load state. Reference numeral 22 denotes an encoding unit that controls the operations of the low-band coding processing unit 23 and the high-band coding processing unit 24 based on the CPU load monitoring information 21. Control means. Reference numeral 25 denotes a bit stream forming processing unit for converting the outputs of the two encoding processing units 23 and 24 into stream signals. Further, reference numeral 26 denotes an encoding mode designation signal input to the encoding means control means 22 when designated by the user.

【0043】図2における低帯域符号化処理手段23の
構成としては、例えば、図11の従来例に示したような
構成を用いられる。また、高帯域符号化処理手段24の
構成としては、例えば、図3に示すように、図11の例
と同様に、各帯域電力の偏在を利用して各帯域(サブバ
ンド)毎に符号化を行うような符号化方式を用いている
が、聴覚心理モデルを利用した各サブバンド信号に対す
るビット配分は行なわず、その代替手段として、帯域出
力適応ビット割り当て手段304を設け、サブバンド信
号毎のスケールファクタに人間の聴覚特性に基づいた重
み付けを行い、高音質化よりも低負荷処理を第1の目的
とし、演算量の少ない構成とする。また、特定帯域への
過度なビット割り当て集中を排除するために、ビットの
割り当て毎に各帯域に応じた重み付けの調整を行なうも
のとしている。
As the configuration of the low-band coding processing means 23 in FIG. 2, for example, the configuration as shown in the conventional example of FIG. 11 is used. Also, as shown in FIG. 3, for example, as shown in FIG. 3, the configuration of the high-band coding processing unit 24 performs coding for each band (sub-band) using the uneven distribution of each band power. However, the bit allocation to each sub-band signal using the psychoacoustic model is not performed, and a band output adaptive bit allocating unit 304 is provided as an alternative to the sub-band signal. The scale factor is weighted based on human auditory characteristics, the first purpose is to perform low-load processing rather than high sound quality, and the configuration is such that the amount of calculation is small. Also, in order to eliminate excessive concentration of bit allocation to a specific band, weight adjustment according to each band is performed for each bit allocation.

【0044】図4は図2に示した符号化器20の詳細な
構成を示すブロック図であり、101は符号化器であ
り、後述するサブバンド分析手段102,スケールファ
クタ抽出手段103,FFT手段104,聴覚心理分析
手段105,量子化/符号化手段106,補助情報符号
化手段107,ビットストリーム形成手段108,帯域
出力適応ビット割り当て手段109,聴覚心理モデルビ
ット割り当て手段110,グループ分け手段111,ビ
ット割り当て処理制御手段112,割り当て可能ビット
演算手段113から構成されている。
FIG. 4 is a block diagram showing a detailed configuration of the encoder 20 shown in FIG. 2. Reference numeral 101 denotes an encoder, which is a subband analyzing means 102, a scale factor extracting means 103, and an FFT means, which will be described later. 104, psychoacoustic analysis means 105, quantization / encoding means 106, auxiliary information encoding means 107, bit stream forming means 108, band output adaptive bit allocating means 109, psychoacoustic model bit allocating means 110, grouping means 111, It comprises a bit allocation processing control means 112 and an allocatable bit operation means 113.

【0045】上記サブバンド解析手段102は、入力さ
れたデジタルオーディオ信号を32個の周波数成分に分
割する。スケールファクタ抽出手段103は、各サブバ
ンド信号に対するスケールファクタを計算し、各サブバ
ンドダイナミックレンジをそろえる。グループ分け手段
111は、上記分割された32個の周波数成分を、外部
からの制御情報である処理量制御情報121で指定され
たグループ数に分割する。本実施の形態1では、図5に
示すように、グループ数を3とし、各グループを周波数
軸方向に連続したサブバンド信号として、0〜15サブ
バンドの低帯域グループA、16〜29サブバンドの高
帯域グループB、及びビット割り当てを行わない30〜
31サブバンドの無効グループCにグループ分けを行
う。なお、上記処理量制御情報121にはCPU負荷監
視情報21と符号化モード設定信号26の情報が含まれ
ているものとする。また、本実施の形態1では、上記各
サブバンドグループにビットを割り当てるビット割り当
て手段として、人間の耳に対して感度のよい低帯域に、
MPEGによって指定された聴覚心理モデルに基づく信
号対マスク比値との関係を使用して、高効率にビット割
り当てを行う聴覚心理モデルビット割り当て手段110
を使用し、人間の耳に対して比較的感度の低い高帯域
に、スケールファクタ抽出手段103からのスケールフ
ァクタ情報に予め設定された各帯域毎の最小可聴限界値
を加えたものを使用して、聴覚心理モデルビット割り当
て方法と比較して低負荷でビット割り当てを行う帯域出
力適応ビット割り当て手段109を使用するように構成
している。
The sub-band analyzer 102 divides the input digital audio signal into 32 frequency components. The scale factor extracting means 103 calculates a scale factor for each sub-band signal and aligns each sub-band dynamic range. The grouping unit 111 divides the 32 divided frequency components into the number of groups specified by the processing amount control information 121 which is external control information. In the first embodiment, as shown in FIG. 5, the number of groups is 3, and each group is a low-band group A of 0 to 15 sub-bands and 16 to 29 sub-bands as sub-band signals continuous in the frequency axis direction. High band group B, and 30 to not perform bit allocation
Grouping into invalid group C of 31 subbands. It is assumed that the processing amount control information 121 includes information of the CPU load monitoring information 21 and the encoding mode setting signal 26. Further, in the first embodiment, as a bit allocating means for allocating bits to each of the sub-band groups, a low band that is sensitive to the human ear is
Psychoacoustic model bit allocation means 110 for highly efficient bit allocation using the relationship between signal and mask ratio values based on the psychoacoustic model specified by MPEG
Using a high-frequency band relatively low in sensitivity to the human ear, and adding a preset minimum audible limit value for each band to the scale factor information from the scale factor extracting means 103. The configuration is such that band output adaptive bit allocating means 109 for allocating bits with a lower load as compared with the psychoacoustic model bit allocation method is used.

【0046】また、ビット割り当て処理制御手段112
は、入力されたデジタルオーディオ信号を、聴覚心理モ
デルビット割り当てを行う0〜15サブバンドの低帯域
グループAに対して、必要とされる聴覚心理分析を行う
ために、FFT(高速フーリエ変換)手段104にて高
速フーリエ変換を施すようにFFT手段104を制御す
る。そしてこの変換結果を用いて、聴覚心理分析手段1
05は、人間の聴覚の特性を利用した聴覚心理モデルに
基づく信号対マスク比(SMR)値の関係モデルを導き
出す。
The bit allocation processing control means 112
Is to perform an FFT (Fast Fourier Transform) means on the input digital audio signal to perform a required psychoacoustic analysis on a low-band group A of 0 to 15 sub-bands for which psychoacoustic model bits are allocated. At 104, the FFT means 104 is controlled so as to perform fast Fourier transform. Then, using this conversion result, psychoacoustic analysis means 1
05 derives a relational model of a signal-to-mask ratio (SMR) value based on a psychoacoustic model utilizing characteristics of human hearing.

【0047】また、割り当て可能ビット演算手段113
は、サンプリング周波数や符号化のビットレート値か
ら、確定するグループ全体に対する割り当て可能ビット
数を,ビット割り当ての対象となる各グループのグルー
プ全体に対する割合に、各グループに属する各帯域毎の
特性に基づいた重み付けを加えたものを用いて、各グル
ープ毎に独立したビット割り当て手段に対する割り当て
可能ビット数を演算する。本実施の形態1では、聴覚心
理モデルビット割り当て手段110、及び帯域出力適応
ビット割り当て手段113に対し、スケール・ファクタ
・インデックス値、及び低帯域/高帯域の領域の比を考
慮し、全体の割り当て可能ビット数から、両手段11
0,113への各割り当て可能ビット数を決定する。す
なわち、実際には、スケールファクタ抽出手段103に
より求められた各スケール・ファクタ・インデックス値
scf _index [ i]から、下記の数式1,数式2に示す
ように、両領域内のscf _index [ i]の加算値Vpsy,V
non を算出する。
The assignable bit operation means 113
Calculates the number of bits that can be allocated to the entire group determined from the sampling frequency and the bit rate value of the coding, based on the characteristics of each band belonging to each group, based on the ratio of each group to be allocated to the entire group. The number of bits that can be allocated to the independent bit allocation means is calculated for each group by using the weighted values. In the first embodiment, the whole psychological model is assigned to the psychoacoustic model bit allocating unit 110 and the band output adaptive bit allocating unit 113 in consideration of the scale factor index value and the ratio of the low band / high band region. From the possible number of bits, both means 11
The number of bits that can be allocated to each of 0 and 113 is determined. That is, actually, each scale factor index value obtained by the scale factor extraction means 103
From scf_index [i], as shown in the following Expressions 1 and 2, the added value Vpsy, V of scf_index [i] in both regions is obtained.
Calculate non.

【数1】 (Equation 1)

【数2】 ここで、 psy _end=16: 聴覚心理モデルビット割り当てを行うサ
ブバンド数 subband _end=30: 全ビット割り当てサブバンド数 である。
(Equation 2) Here, psy_end = 16: the number of subbands for which the psychoacoustic model bits are allocated subband_end = 30: the number of subbands to which all bits are allocated.

【0048】次いで、人間の耳に感度のよい低帯域に、
よりビットを多く配分するために、Vpsyに対し重み付け
を行い、 Vpsy=Vpsy*0.75 聴覚心理モデルビット割り当て可能数psy _num 、及び
帯域出力適応ビット割り当て可能数non _num を下記の
式に基づいて求める。 Vnon=Vnon*psy-ratio psy _num=all _alloc _num*Vnon/(Vpsy+Vnon) non _num=all _alloc _num-psy _num ここで、 all _alloc _num:全体の割り当て可能ビット数 psy _ratio:psy _end/(subband_end-psy _end) である。
Next, to a low band that is sensitive to the human ear,
In order to allocate more bits, Vpsy is weighted, and Vpsy = Vpsy * 0.75 perceptual psychological model bit assignable number psy_num and band output adaptive bit assignable number non_num are obtained based on the following equations. Vnon = Vnon * psy-ratio psy_num = all_alloc_num * Vnon / (Vpsy + Vnon) non_num = all_alloc_num-psy_num where all_alloc_num: total number of allocatable bits psy_ratio: psy_end / ( subband_end-psy_end).

【0049】グループ毎の割り当て可能ビット数の範囲
内(psy_num,non _num)で、聴覚心理モデルビット割り
当て手段110は、聴覚心理分析手段105からのSM
R値の関係モデルを利用し、低帯域グループAである0
〜15サブバンドに対してビット割り合てを行う。一
方、帯域出力適応ビット割り当て手段109において
は、高帯域グループBである16〜29サブバンドに対
してビット割り合てを行う。また、無効グループCであ
る30〜31サブバンドに対しては、無効なサブバンド
としたため、ビット割り当ては行われない。
The psychoacoustic model bit allocating means 110 receives the SM from the psychoacoustic analyzing means 105 within the range of the number of assignable bits (psy_num, non_num) for each group.
Using the relation model of the R value, the low band group A of 0
Bit allocation is performed for ~ 15 subbands. On the other hand, the band output adaptive bit allocating unit 109 performs bit allocation on the 16 to 29 subbands that are the high band group B. In addition, no bits are assigned to the 30 to 31 subbands that are invalid group C because they are invalid subbands.

【0050】これらのビット割り当て手段により決定さ
れた各サブバンド信号へのビット割り当て数に応じて、
各サブバンド信号を量子化/符号化手段106において
量子化/符号化し、補助情報符号化手段107により符
号化されたヘッダ情報と補助情報とをともに、ビットス
トリーム形成手段108においてビットストリームを形
成して出力する。
According to the number of bits allocated to each subband signal determined by these bit allocation means,
Each sub-band signal is quantized / encoded by the quantization / encoding means 106, and the header information and the auxiliary information encoded by the auxiliary information encoding means 107 are formed into a bit stream by the bit stream forming means 108. Output.

【0051】処理量制御情報121からの情報が、例え
ば、符号化処理量を減少させるための情報であった場合
には、図6に示すように、処理量の多い聴覚心理モデル
ビット割り当て手段110のビット割り当ての対象とな
る0〜15サブバンド低帯域グループAのバンド幅を、
0〜7サブバンド低帯域グループA' に減少させ、反対
に処理量の小さい帯域出力適応ビット割り当て手段10
9のビット割り当ての対象となるバンド幅を、8〜29
サブバンド低帯域グループB' となるように増加させ
る。さらに、符号化処理量の減少を考えた時の最終的な
形態は、帯域出力適応ビット割り当て手段109のビッ
ト割り当ての対象を0〜29サブバンドグループとする
ことで処理量を制御する。この場合においては、実質的
に聴覚心理モデルビット割り当て手段110は動作しな
いため、FFT手段104、及び聴覚心理分析手段10
5も動作しないことになる。
When the information from the processing amount control information 121 is, for example, information for reducing the encoding processing amount, as shown in FIG. The bandwidth of the 0-15 sub-band low band group A to be allocated to the bits is
0-7 sub-band low band group A ', and conversely, a band output adaptive bit allocating means 10 with a small processing amount.
The bandwidth subject to the bit allocation of 9 is 8 to 29.
It is increased so as to be the sub-band low band group B ′. Furthermore, when the encoding processing amount is considered to decrease, the processing amount is controlled by setting the bit allocation target of the band output adaptive bit allocation means 109 to 0 to 29 subband groups. In this case, since the psychoacoustic model bit assignment means 110 does not substantially operate, the FFT means 104 and the psychoacoustic analysis means 10
5 will also not work.

【0052】一方、処理量制御情報121からの情報
が、例えば、符号化データの高音質化を図るための情報
であった場合には、高効率(高音質)なビット配分が可
能な聴覚心理モデルビット割り当て手段110のビット
割り当ての対象となるバンド幅を増加させる。さらに、
高音質を考えた時の最終的な形態は、聴覚心理モデルビ
ット割り当て手段110のビット割り当ての対象を0〜
29サブバンドグループとすることである。本実施の形
態では以上のようにサブバンドグループの増減やビット
割り当て手段の切り替えを、オーディオ信号に復号可能
な最小単位であるフレーム単位で行うことで、リアルタ
イムに符号化処理量を制御可能としている。
On the other hand, if the information from the processing amount control information 121 is, for example, information for improving the sound quality of the coded data, the psychoacoustic which enables highly efficient (high sound quality) bit allocation. The bandwidth to which the model bit allocation means 110 performs bit allocation is increased. further,
The final form when considering high sound quality is that the bit allocation target of the psychoacoustic model bit allocation means 110 is 0 to 0.
29 subband groups. In this embodiment, as described above, the number of sub-band groups is increased or decreased and the bit allocation means is switched in units of frames, which is the minimum unit that can be decoded into an audio signal, so that the amount of encoding processing can be controlled in real time. .

【0053】次に本実施の形態1による音声符号化装置
の全体的な動作の流れについて図7を参照しつつ説明す
る。まず、図7(a)に示されるような構成を用い、各
エンコーダ(23,24)の処理負荷を認識するため
に、各エンコーダの各モード(ビット割り当ての対象と
なるバンド幅の変化)において、所定時間分のダミーデ
ータを符号化することにより、CPU負荷監視部700
は各モードでのCPU負荷値をデータテーブル701に
格納する。そして、サンプル(データ)が入力される
と、図7(b)のステップS70において、サブバンド
分析が行われて32の周波数成分に分割され、続いてス
テップS71において各サブバンド信号のスケールファ
クタが計算される。
Next, an overall operation flow of the speech coding apparatus according to the first embodiment will be described with reference to FIG. First, using the configuration shown in FIG. 7A, in order to recognize the processing load of each encoder (23, 24), in each mode of each encoder (change in the bandwidth to be allocated to bits) By encoding dummy data for a predetermined time, the CPU load monitoring unit 700
Stores the CPU load value in each mode in the data table 701. When the sample (data) is input, in step S70 of FIG. 7B, sub-band analysis is performed to divide the frequency components into 32 frequency components. Then, in step S71, the scale factor of each sub-band signal is Is calculated.

【0054】次いで、ステップS72において、CPU
負荷の検出データがあるかどうかの判定が行われ、ここ
では、動作開始直後なのでCPU負荷検出データはな
く、従ってステップS74に進んで最も高音質な音声再
生を行うことができる通常のグループ分けを行い、ステ
ップS75に進んで聴覚心理モデルビット割り当て処理
が行われる。そして、ステップS76に進んで量子化/
符号化処理が行われ、さらにステップS79においてビ
ットストリーム形成が行われて一連の処理が終了すると
ともに、処理終了時に、入力された所定数のサンプルの
符号化に要した時間をCPU負荷監視部700に通知
し、現在のCPUの負荷が検出される。
Next, in step S72, the CPU
It is determined whether or not there is load detection data. Here, since the operation has just started, there is no CPU load detection data. Therefore, the process proceeds to step S74, where normal grouping that can perform the highest-quality sound reproduction is performed. Then, the process proceeds to step S75, where the psychoacoustic model bit allocation process is performed. Then, the process proceeds to step S76 to perform quantization /
An encoding process is performed, and a bit stream is formed in step S79 to complete a series of processes. At the end of the process, a time required for encoding a predetermined number of input samples is determined by the CPU load monitoring unit 700. And the current CPU load is detected.

【0055】すると、次回からの処理に際しては、ステ
ップS72において、CPU負荷検出が「有」と判定さ
れるようになり、ステップS73において、検出された
CPU負荷が実時間での符号化が不可能であると判定さ
れた場合には、ステップS77に進んで、データテーブ
ル701を参照して最適なモード(グループ分け)を選
択し、ステップS78における帯域ビット割り当て処理
を併用してステップS75における聴覚心理モデルビッ
ト割り当て処理をそれぞれ、所定の割合にて行い、ステ
ップS76に進んで量子化/符号化処理が行われ、ステ
ップS79において、これら符号化されたデータを用い
たビットストリームが形成されることになる。
Then, in the processing from the next time, the CPU load detection is determined to be "present" in step S72, and in step S73, the detected CPU load cannot be encoded in real time. If it is determined that the mode is not the same, the process proceeds to step S77, where the optimum mode (grouping) is selected with reference to the data table 701, and the psychological psychology in step S75 is performed together with the band bit allocation process in step S78. Each of the model bit allocation processes is performed at a predetermined ratio, and the process proceeds to step S76 where quantization / encoding process is performed. In step S79, a bit stream using these encoded data is formed. Become.

【0056】なお、本実施の形態1における割り当て可
能ビット演算手段113の演算を、スケール・ファクタ
・インデックス値、及び低帯域、高帯域の領域の比を考
慮し、各グループ毎に独立したビット割り当て手段に対
する割り当て可能ビット数を演算するものとしたが、ス
ケール・ファクタ・インデックス値の代わりにFFT手
段104からの各グループに属するスペクトル信号レベ
ルとしてもよく、各帯域毎に予め設定した最小可聴限界
値としてもよい。
The operation of the assignable bit operation means 113 according to the first embodiment is performed by considering the scale factor index value and the ratio of the low band and the high band to the independent bit allocation for each group. Although the number of bits that can be assigned to the means is calculated, the level of the spectrum signal belonging to each group from the FFT means 104 may be used instead of the scale factor index value. It may be.

【0057】また、実施の形態1における符号化器10
1の処理量を制御するための情報を、符号化器101の
内部に、CPUの処理量を監視するCPU負荷監視手段
700を設け、CPUの処理能力を超えないように符号
化器101を動作させるように構成したが、ユーザ入力
などによる外部からの制御情報としてもよい。ユーザ入
力を行うことにより、音質,画質をユーザの好みに応じ
て優先させたエンコード処理を行うことが可能となる。
The encoder 10 according to the first embodiment
1 is provided inside the encoder 101 with CPU load monitoring means 700 for monitoring the processing amount of the CPU, and operates the encoder 101 so as not to exceed the processing capacity of the CPU. Although it is configured to perform the control, external control information such as a user input may be used. By performing the user input, it is possible to perform the encoding process in which the sound quality and the image quality are prioritized according to the user's preference.

【0058】また、実施の形態1における符号化器10
1のビット割り当て手段として、人間の耳に対して感度
のよい低帯域に、高効率にビット割り当てを行う聴覚心
理モデルビット割り当て手段110を用い、高帯域に、
低負荷でビット割り当てを行う帯域出力適応ビット割り
当て手段109を固定的に用いるようにしたが、スケー
ルファクタ抽出手段103からの信号により、各グルー
プに属するサブバンド信号レベルが、予め設定した各帯
域のしきい値以下の場合には、つまり、図8に示すよう
に、低帯域に符号化データとして意味のある信号が高帯
域に比べ少ない場合などには、ビット割り当て手段を帯
域に応じて固定的に用いる必要はなく、高帯域に聴覚心
理モデルビット割り当て手段110を用いるようにして
もよい。
The encoder 10 according to the first embodiment
As one bit allocation unit, an psychoacoustic model bit allocation unit 110 that performs bit allocation with high efficiency in a low band that is sensitive to the human ear is used.
Although the band output adaptive bit allocating means 109 for performing bit allocation with low load is fixedly used, the signal from the scale factor extracting means 103 causes the sub-band signal level belonging to each group to be set to a predetermined level for each band. In the case of being equal to or less than the threshold value, that is, as shown in FIG. 8, when the number of signals that are significant as encoded data in the low band is smaller than that in the high band, the bit allocating means is fixed according to the band. It is not necessary to use the psychoacoustic model bit allocation means 110 for a high band.

【0059】また、図9に示すように、スケールファク
タ抽出手段103からの信号により、各グループに属す
るサブバンド信号レベルと閾値とを比較判断するのでは
なく、スケールファクタ抽出手段103からの信号より
も分解能(周波数の)の高い、FFT手段104からの
信号をビット割り当て処理制御手段112へ入力して、
各グループに属するサブバンド信号のレベルと、予め設
定した各帯域の閾値との比較判断を行うように構成して
もよい。
Also, as shown in FIG. 9, the signal from the scale factor extracting means 103 does not compare and determine the subband signal level belonging to each group with the threshold value. Also, the signal from the FFT means 104 having a high resolution (of high frequency) is input to the bit allocation processing control means 112,
The configuration may be such that a comparison between a level of a subband signal belonging to each group and a preset threshold value of each band is performed.

【0060】(実施の形態2)次に本発明の実施の形態
2によるデータ記録媒体について説明する。上記実施の
形態1で示した音声符号化装置あるいは符号化方法の構
成を実現するための符号化プログラムを、フロッピーデ
ィスク等のデータ記憶媒体に記録するようにすることに
より、本発明の各実施の形態で示した処理を、独立した
コンピュータシステムにおいて簡単に実施することが可
能となる。
(Embodiment 2) Next, a data recording medium according to Embodiment 2 of the present invention will be described. By recording an encoding program for realizing the configuration of the audio encoding device or the encoding method shown in the first embodiment on a data storage medium such as a floppy disk, each embodiment of the present invention is realized. The processing described in the embodiment can be easily performed by an independent computer system.

【0061】すなわち、図10は、上記実施の形態1の
符号化処理を、上記符号化プログラムを格納したフロッ
ピーディスクを用いて、コンピュータシステムにより実
施する場合を説明するための図である。図10(a)
は、フロッピーディスクの正面からみた外観、断面構
造、及びフロッピーディスク本体を示し、図10(b)
は、該フロッピーディスク本体の物理フォーマットの例
を示している。
That is, FIG. 10 is a diagram for explaining a case where the encoding process of the first embodiment is executed by a computer system using a floppy disk storing the encoding program. FIG. 10 (a)
FIG. 10B shows the appearance, cross-sectional structure, and floppy disk main body viewed from the front of the floppy disk, and FIG.
Shows an example of the physical format of the floppy disk body.

【0062】上記フロッピーディスクFDは、上記フロ
ッピーディスク本体DをフロッピーディスクケースFC
内に収容した構造となっており、該フロッピーディスク
本体Dの表面には、同心円状に外周からは内周に向かっ
て複数のトラックTrが形成され、各トラックTrは角
度方向に16のセクタSeに分割されている。従って、
上記プログラムを格納したフロッピーディスクFDで
は、上記フロッピーディスク本体Dは、その上に割り当
てられた領域(セクタ)Seに、上記プログラムとして
のデータが記録されたものとなっている。
The above-mentioned floppy disk FD is composed of the above-mentioned floppy disk main body D and a floppy disk case FC.
A plurality of tracks Tr are formed concentrically from the outer circumference toward the inner circumference on the surface of the floppy disk main body D, and each track Tr has 16 sectors Se in the angular direction. Is divided into Therefore,
In the floppy disk FD storing the program, the floppy disk main body D has data as the program recorded in an area (sector) Se allocated thereon.

【0063】また、図10(c)は、フロッピーディス
クFDに対する上記プログラムの記録、及びフロッピー
ディスクFDに格納したプログラムを用いた音声符号化
処理を行うための構成を示している。上記プログラムを
フロッピーディスクFDに記録する場合は、コンピュー
タシステムCsから上記プログラムとしてのデータを、
フロッピーディスクドライブFDDを介してフロッピーデ
ィスクFDに書き込む。また、フロッピーディスクFD
に記録されたプログラムにより、上記音声符号化装置を
コンピュータシステムCs中に構築する場合は、フロッ
ピーディスクドライブFDDによりプログラムをフロッピ
ーディスクFDから読み出し、コンピュータシステムC
sにロードする。
FIG. 10C shows a configuration for recording the program on the floppy disk FD and performing audio encoding processing using the program stored on the floppy disk FD. When the above program is recorded on the floppy disk FD, data as the above program is transmitted from the computer system Cs.
Writing to the floppy disk FD via the floppy disk drive FDD. In addition, floppy disk FD
When the speech encoding device is constructed in the computer system Cs by the program recorded in the computer system Cs, the program is read from the floppy disk FD by the floppy disk drive FDD, and the computer system Cs is read.
Load to s.

【0064】なお、上記説明では、データ記録媒体とし
てフロッピーディスクを用いて説明を行ったが、光ディ
スクを用いても上記フロッピーディスクの場合と同様に
ソフトウェアによる音声符号化処理を行うことができ
る。また、記録媒体は上記光ディスクやフロッピーディ
スクに限るものではなく、ICカード、ROMカセット
等、プログラムを記録できるものであればよく、これら
の記録媒体を用いる場合でも、上記フロッピーディスク
等を用いる場合と同様にソフトウェアによる音声符号化
処理を実施することができる。
In the above description, the description has been made using a floppy disk as a data recording medium. However, even when an optical disk is used, audio encoding processing by software can be performed in the same manner as in the case of the floppy disk. The recording medium is not limited to the above-mentioned optical disk or floppy disk, but may be any one capable of recording a program such as an IC card, a ROM cassette, or the like. Similarly, voice coding processing by software can be performed.

【0065】(実施の形態3)次に本発明の実施の形態
3による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図2で示した高帯域符号化
処理手段24の構成としては、例えば、図3に示したよ
うな構成を用いる。また、低帯域符号化処理手段23の
構成としては、例えば、図12示すように、図11で示
したのと同様に、各帯域電力の偏在を利用して各帯域
(サブバンド)毎に符号化を行うような符号化方式を用
いるが、所定の聴覚心理モデル分析手段のみを利用した
各サブバンド信号に対するビット配分は行わず、新たに
処理量の少ない簡易聴覚心理モデル部4062を設け、
前フレームに出力された聴覚心理モデル部4061のマ
スキング閾値と当該フレームの帯域分割信号に基づき生
成されたビット割り当て情報からビット配分を行うこと
を可能としている。
(Embodiment 3) Next, a speech coding system and a speech coding apparatus according to Embodiment 3 of the present invention will be described with reference to the drawings. As the configuration of the high-band coding processing unit 24 shown in FIG. 2, for example, the configuration shown in FIG. 3 is used. Further, as shown in FIG. 12, for example, as shown in FIG. 12, the low-band coding processing means 23 uses the uneven distribution of each band power to code each band (sub-band). Although a coding method that performs encoding is used, bit allocation is not performed for each subband signal using only a predetermined psychoacoustic model analysis means, and a simplified psychoacoustic model unit 4062 with a small processing amount is newly provided.
Bit allocation can be performed from the masking threshold of the psychoacoustic model unit 4061 output in the previous frame and the bit allocation information generated based on the band division signal of the frame.

【0066】すなわち、図12は図2に示した低帯域符
号化処理手段23の詳細な構成を示すブロック図であ
り、401は符号化器であり、後述するサブパンド分析
手段402,スケールファクタ抽出手段403,ビット
削り当て処理制御手段404,FFT処理手段405,
聴覚心理分析乎段406,聴覚心理モデルピツト割り当
て手段407,量子化/符号化手段408,補助情報符
号化手段409,ビットストリーム形成手段410から
構成されている。
That is, FIG. 12 is a block diagram showing a detailed configuration of the low-band coding processing means 23 shown in FIG. 2. Reference numeral 401 denotes an encoder, which is a sub-band analyzing means 402 and a scale factor extracting means which will be described later. 403, bit scraping processing control means 404, FFT processing means 405,
It comprises a psychoacoustic analysis stage 406, a psychoacoustic model pit assigning means 407, a quantization / encoding means 408, an auxiliary information encoding means 409, and a bit stream forming means 410.

【0067】以下、動作について説明する。上記サブバ
ンド分析手段402は、入力されたデジタルオーデイオ
信号を32個の周波数成分に分割する。スケールファク
タ抽出手段403は、各サブバンド信号に対するスケー
ルファクタを計算し、各サブバンドダイナミックレンジ
をそろえる。FFT処理手段405は、入力されたデジ
タルオーディオ信号に対して、高速フーリエ変換を施
す。聴覚心理分析手段406は、例えば、MPEGによ
って指定された通常聴覚心理モデル部4061,及び上
記通常聴覚心理モデル部4061に比べて処理量の少な
い上記簡易聴覚心理モデル部4062からなり、各モデ
ルは信号対マスク比を算出する。
The operation will be described below. The sub-band analyzer 402 divides the input digital audio signal into 32 frequency components. The scale factor extracting means 403 calculates a scale factor for each sub-band signal and aligns each sub-band dynamic range. The FFT processing means 405 performs a fast Fourier transform on the input digital audio signal. The psychoacoustic analysis means 406 comprises, for example, a normal psychoacoustic model unit 4061 specified by MPEG and the simple psychoacoustic model unit 4062 having a smaller processing amount than the normal psychoacoustic model unit 4061. Calculate the mask ratio.

【0068】なお、上記通常聴覚心理モデル部4061
は、下記の数式3に基づき各サブバンド信号の信号対マ
スク比を算出するのに対し、上記簡易聴覚心理モデル部
4062は、下記の数式4に示すように、該当フレーム
においては、各サブハンドの最小マスキング・レベルの
算出は行なわず、上記通常聴覚心理モデル部4061に
よって算出された最近の前フレームでの最小マスキング
・レベルを用い、音圧は該当フレームのスケールファク
タ抽出手段403によって抽出されたスケール・ファク
タ値を用いて信号対マスク比を算出する。
The normal auditory psychological model section 4061
Calculates the signal-to-mask ratio of each subband signal based on the following equation 3, whereas the simplified psychoacoustic model unit 4062 calculates the signal-to-mask ratio of each sub-hand in the corresponding frame as shown in the following equation 4. The minimum masking level is not calculated, and the minimum masking level in the latest previous frame calculated by the normal psychoacoustic model unit 4061 is used, and the sound pressure is determined by the scale extracted by the scale factor extracting unit 403 of the corresponding frame. Calculate the signal-to-mask ratio using the factor values.

【数3】 ここで、 Lsb(n):各サブバンドの奢圧 LTmin(n):各サブバンドの最小マスキング・レベル である。(Equation 3) Here, Lsb (n): Ogo圧LT min each subband (n): is the minimum masking level of each subband.

【数4】 ここで、 Lsb(n)=20・log(scfmax(n) ・32768-10) db scfmax(n):該当フレームの各サブバンドに対するスケ
ール・ファクタ値 LTmin(n):最近の上記通常聴覚心理モデル部4061
にて算出された各サブバンドの最小マスキング・レベル
(Equation 4) Here, Lsb (n) = 20 · log (scf max (n) · 32768-10) db scf max (n): scale factor value for each subband of the corresponding frame LT min (n): recent normal Auditory psychological model 4061
Minimum masking level of each subband calculated in

【0069】ビット割り当て処理制御手段404は、処
理量制御情報121の情報を基に、本実施の形態3で
は、図13に示すように、Nを3とし、低負荷処理が実
現可能な上記簡易聴覚心理モデル部4062と高□質化
を実現することができる最適なビット配分情報を出力す
ることが可能な上記通常聴覚心理モデル部4061を、
何フレームに一度行なうかの制御,及びFFT処理手段
405における高速フーリエ変換を行なうか否かの制御
を行なう。例えば、図13の状態において、処理量制御
情報121の情報として、符号化処理に割くCPU占有
率を下げるという情報が、上記ビット割り当て処理制御
手段404に知らされると、処理量の小さい上記簡易聴
覚心理モデル部4062の使用を多くするために、Nの
値を大きくする。反対に、符号化処理に割くCPU占有
率をもっと使用してもよいという情報が、上記ビット割
り当て処理制御手段404に知らされると、高音質化が
実現可能な上記通常聴覚心理モデル部4061の使用を
多くするためにNの値を小さくする。これにより、処理
量の制御を可能とすることができる。
In the third embodiment, the bit allocation processing control means 404 sets N to 3 based on the information of the processing amount control information 121 as shown in FIG. The normal psychoacoustic model unit 4061 capable of outputting the optimal bit allocation information capable of realizing high quality with the psychoacoustic model unit 4062,
It controls how many frames are performed once and whether the FFT processing means 405 performs fast Fourier transform. For example, in the state of FIG. 13, when information indicating that the CPU occupation rate to be allocated to the encoding process is reduced is notified to the bit allocation processing control unit 404 as the information of the processing amount control information 121, To increase the use of the psychoacoustic model unit 4062, the value of N is increased. Conversely, when information indicating that the CPU occupation rate used for the encoding process may be used more is notified to the bit allocation processing control unit 404, the normal auditory psychological model unit 4061 capable of realizing high sound quality can be realized. Decrease the value of N for more use. Thereby, it is possible to control the processing amount.

【0070】聴覚心理モデルビット割り当て手段407
は、上記ビット割り当て処理制御手段404からの情報
である信号対マスク比の関係から上記サブパンド分析手
段402により分割された各サブパンド信号に対し、ピ
ツトの割り当てを行なう。量子化/符号化手段408に
より、各サブバンド信号の量子化,及び符号化を行い、
補助情報符号化手段409からの補助データと共にビツ
トストリーム形成手段410によりピツトストリームが
形成され出力される。
Acoustic psychological model bit allocation means 407
Performs bit allocation to each sub-band signal divided by the sub-band analysis unit 402 based on the relationship between the signal and the mask ratio, which is information from the bit allocation processing control unit 404. Quantization / encoding means 408 performs quantization and encoding of each subband signal,
A bit stream is formed by the bit stream forming means 410 together with the auxiliary data from the auxiliary information encoding means 409, and is output.

【0071】このように本実施の形態3によれば、ビッ
ト割り当てをNフレームに一度の割合で行うようにした
ので、時間軸方向でのCPU負荷を低減することができ
るようになる。
As described above, according to the third embodiment, the bit allocation is performed once every N frames, so that the CPU load in the time axis direction can be reduced.

【0072】なお、ここでは仮に符号化器401を、図
2に示した低帯域符号化処理手段23としたが、低帯域
信号に対してのみ適用されるのではなく、全帯域信号に
対して適用するようにしてもよい。
Although the encoder 401 is supposed to be the low-band coding processing means 23 shown in FIG. 2, it is not applied only to low-band signals but to all-band signals. You may make it apply.

【0073】(実施の形態4)次に本発明の実施の形態
4による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図14は、図11で示した
のと同様に、各帯域電力の偏在を利用して各帯域(サブ
バンド)毎に符号化を行なうような符号化方式を用いて
いるが、出カビットストリーム中に、オーディオデータ
以外の外部データを付加する機能を備えている点が異な
る。上記外部データとしては、画像データやテキストデ
ータなどが想定される。
(Embodiment 4) Next, a speech coding method and a speech coding apparatus according to Embodiment 4 of the present invention will be described with reference to the drawings. FIG. 14 uses an encoding method in which encoding is performed for each band (sub-band) using the uneven distribution of power in each band, as shown in FIG. The difference is that a function for adding external data other than audio data is provided. As the external data, image data and text data are assumed.

【0074】すなわち、図14に示す符号化器501
は、後述するサブパンド分析手段502,スケールファ
クタ抽出手段503,FFT処理手段504,聴覚心理
分析手段505,ビット割り当て手段506,量子化/
符号化手段507,補助情報符号化手段508,ビット
ストリーム形成手段509,ビット割り当て処理制御手
段510,付加データ符号化手段511から構成されて
いる。
That is, the encoder 501 shown in FIG.
Are sub-band analysis means 502, scale factor extraction means 503, FFT processing means 504, psychoacoustic analysis means 505, bit allocation means 506, and quantization /
It comprises an encoding unit 507, an auxiliary information encoding unit 508, a bit stream forming unit 509, a bit allocation control unit 510, and an additional data encoding unit 511.

【0075】以下、動作について説明する。上記サブバ
ンド分析手段502は、入力されたデジタルオーディオ
信号を32個の周波数成分に分割する。スケールファク
タ抽出手段503は、各サブバンド信号に対するスケー
ルファクタを計算し、各サブバンドダイナミックレンジ
をそろえる。FFT処理手段504は、入力されたデジ
タルオーディオ信号に対して、高速フーリエ変換を施
す。聴覚心理分析手段505は、例えば、MPEGによ
って指定された聴覚心理モデルにより、信号対マスク比
を算出する。
Hereinafter, the operation will be described. The sub-band analyzer 502 divides the input digital audio signal into 32 frequency components. The scale factor extracting means 503 calculates a scale factor for each subband signal, and aligns each subband dynamic range. The FFT processing means 504 performs a fast Fourier transform on the input digital audio signal. The psychoacoustic analysis unit 505 calculates a signal-to-mask ratio using a psychoacoustic model specified by MPEG, for example.

【0076】ビット割り当て処理制御手段510は、出
カビットストリーム中に付加するデータを一時的に格納
しておく付加データバッファ512を監視し、付加デー
タがあるか否かの判断、あるいは付加データがオーバフ
ローするか否かの判断から生成された割り当て範囲制御
情報513を基に、ビット割り当て手段506に対し、
ビット割り当てを行なう範囲を指定する。
Bit allocation processing control means 510 monitors additional data buffer 512 for temporarily storing data to be added in the output bit stream, and determines whether or not there is additional data, or Based on the allocation range control information 513 generated from the determination as to whether or not to overflow, the bit allocation unit 506
Specify the range for bit allocation.

【0077】例えば、付加データバッファ512にデー
タが存在しない場合には、図15に示すように、サブバ
ンド0〜29に対してビット割り当てが行われる。この
場合、全体の割り当て可能ビット数を100とし、サブ
バンド0〜15に80ビット、サブバンド16〜29に
20ビットが割り当てられている。
For example, when there is no data in the additional data buffer 512, as shown in FIG. 15, bits are allocated to the subbands 0 to 29. In this case, the total number of assignable bits is 100, and 80 bits are allocated to subbands 0 to 15 and 20 bits are allocated to subbands 16 to 29.

【0078】そして、付加データバッファ512に外部
よりデータが書き込まれ、付加データが存在する状態に
なった場合には、つまり、割り当て範囲制御情報513
として、付加データを挿入するという指示が、ビット割
り当て処理制御手段510に対して知らされ、本実施の
形態4では、例えば、サブバンド0〜15に80ビット
を割り当て、本来割り当てられるべきサブバンド16〜
29に対してはビット割り当てを行なわず、余った20
ビットをデータの付加ビット数として割り当てられる。
また、ビット割り当てが行われないサブバンド16以降
のサブバンドに対しては、処理量を削減するために、該
当範囲のFFT処理,及び聴覚心理分析を行なわないよ
うにしてもよい。
When data is written from the outside to the additional data buffer 512 and the additional data is present, that is, the allocation range control information 513
As a result, an instruction to insert additional data is notified to the bit allocation processing control means 510. In the fourth embodiment, for example, 80 bits are allocated to subbands 0 to 15, and subband 16 to be originally allocated is allocated. ~
No bit allocation is performed for 29 and the remaining 20
Bits are allocated as additional bits of data.
Also, for the sub-bands after the sub-band 16 for which bit allocation is not performed, the FFT processing and the psychoacoustic analysis of the corresponding range may not be performed in order to reduce the processing amount.

【0079】そして、上記ビット割り当てが行われたサ
ブバンドに対し、量子化/符号化手段507により、量
子化,及び符号化を行い、補助情報符号化手段508か
らの補助データと、例えば、MPEGのアンシラリーデ
ータとして符号化された付加データと共に、ビットスト
リーム形成手段509によりットストリームが形成され
出力される。
Then, quantization and encoding are performed on the sub-bands to which the above-mentioned bit allocation has been performed by the quantization / encoding unit 507, and the auxiliary data from the auxiliary information encoding unit 508 and, for example, MPEG A bit stream is formed and output by the bit stream forming means 509 together with the additional data coded as the ancillary data of.

【0080】このように本実施の形態4によれば、定ビ
ットレートでの伝送を行う際に、オーディオデータ以外
の付加データの量に応じて、符号化時のビット割り当て
範囲を制御して符号化するオーディオデータの量を可変
として符号化データストリーム中に付加データを挿入す
るようにしたので、余剰帯域に様々なデータを重畳して
帯域を有効に利用することができる。なお、ビット割り
当て処理制御乎段510により実行されるビット割りあ
て範囲の制御は、フレーム単位で行い、そのビット割り
当て範囲も付加データバツファ512のデータ量に応じ
て、可変可能としている。
As described above, according to the fourth embodiment, when performing transmission at a constant bit rate, the bit allocation range during encoding is controlled according to the amount of additional data other than audio data. Since the amount of audio data to be encoded is made variable and the additional data is inserted into the coded data stream, various data can be superimposed on the surplus bandwidth to make effective use of the bandwidth. The control of the bit allocation range executed by the bit allocation processing control stage 510 is performed on a frame basis, and the bit allocation range can be varied according to the data amount of the additional data buffer 512.

【0081】これらの処理により、付加データ挿入時に
おいてもピット割り当て範囲内の音質を損なうことな
く、リアルタイムにデータ挿入量の制御を可能とするこ
とができる。
With these processes, even when additional data is inserted, the data insertion amount can be controlled in real time without deteriorating the sound quality in the pit allocation range.

【0082】(実施の形態5)次に本発明の実施の形態
5による音声符号化方式、音声符号化装置について、図
面を参照しながら説明する。図16は本実施の形態5に
よる音声符号化方式を用いた音声符号化装置の符号化器
の構成を示すブロック図であり、図において、図2と同
一符号は同一または相当部分を示し、160〜162は
それぞれ独立的に動作可能な符号化処理手段A〜C、1
63は各符号化処理手段A〜Cの処理負荷値情報を格納
するための処理負荷値格納バッファ、164は上記各符
号化処理手段A〜Cにサンプルとなるデータを供給する
ためのサンプルデータバッファである。
(Embodiment 5) Next, a speech coding method and a speech coding apparatus according to Embodiment 5 of the present invention will be described with reference to the drawings. FIG. 16 is a block diagram showing a configuration of an encoder of a voice coding apparatus using a voice coding method according to the fifth embodiment. In the figure, the same reference numerals as those in FIG. 162 are independently operable encoding processing means A to C, 1
63 is a processing load value storage buffer for storing processing load value information of each of the encoding processing means A to C, and 164 is a sample data buffer for supplying sample data to each of the encoding processing means A to C. It is.

【0083】次に動作について説明する。符号化処理を
行う前の初期化時に、まず、サンプルデータバッファ1
64に格納されている所定のサンプルデータを各符号化
処理手段A〜Cに供給し、これによって発生する符号化
処理手段A〜C、あるいは聴覚心理モデルの処理負荷値
を処理負荷値格納バッファ163に格納する。
Next, the operation will be described. At the time of initialization before performing the encoding process, first, the sample data buffer 1
The predetermined sample data stored in H.64 is supplied to each of the encoding processing means A to C, and the processing load value of the encoding processing means A to C or the psychoacoustic model generated thereby is stored in the processing load value storage buffer 163. To be stored.

【0084】そして、上記処理負荷値を昇順、もしくは
降順にて出力することによって、装置にて使用されるC
PUの性能に見合った符号化処理手段を迅速に選択し、
当該符号化処理手段によって符号化処理を行う。符号化
処理の内容については、実施の形態1で示したものと同
じであるので個々では省略する。
By outputting the processing load values in ascending or descending order, the C used in the device is output.
Quickly select an encoding processing means that matches the performance of the PU,
Encoding processing is performed by the encoding processing means. The contents of the encoding process are the same as those described in the first embodiment, and therefore will not be described here.

【0085】このように本実施の形態によれば、符号化
処理前の初期化時に、サンプルデータを用いて各符号化
処理手段を動作させ、そのときの負荷値を取得して、使
用するCPUの処理能力に適した符号化処理手段を選択
して用いるようにしたので、CPUの負荷が減少して、
最適な符号化処理を行うことができるようになる。
As described above, according to the present embodiment, at the time of initialization before the encoding process, each encoding processing means is operated using the sample data, the load value at that time is obtained, and the CPU to be used is obtained. Since the encoding processing means suitable for the processing capacity of the CPU is selected and used, the load on the CPU is reduced,
Optimum encoding processing can be performed.

【0086】なお、以上の各実施の形態では、音声符号
化装置として、PCを用いて実現する構成を例に挙げて
説明したが、例えばVTRカメラやDVDエンコーダな
どの機器に組み込んで用いるような場合にも適用するこ
とができる。
In each of the above embodiments, the configuration realized by using a PC as an audio encoding device has been described as an example. However, for example, the audio encoding device may be incorporated in a device such as a VTR camera or a DVD encoder. The case can also be applied.

【0087】また、上記各実施の形態では、音声のみを
取り扱うようにしたが、音声とともに映像を処理する場
合には、図17に示すように、図2の構成において、音
声信号とは別に映像信号を入力し、低帯域符号化処理手
段と高帯域符号化処理手段に代えて、映像符号化処理手
段170と音声符号化処理手段171を設け、さらに、
ビットストリーム形成処理手段に代えてシステムストリ
ーム処理手段172を設けた構成とすることにより、対
応することができる。以上のような構成を用いて、外部
からの制御情報に基づいて、上記各実施の形態で説明し
たような方法で、音声符号化の演算量を変更したり、演
算量の異なる複数の音声符号化方式を切り替えたりする
ことによって、CPUとしての全体の演算量を制御する
ことが可能となる。また、あるいは、符号化すべき音声
信号の量に応じて、符号化する映像信号の処理量を変化
させるように構成してもよい。
In each of the above embodiments, only audio is handled. However, when processing video together with audio, as shown in FIG. 17, in the configuration shown in FIG. A signal is input, and a video encoding unit 170 and an audio encoding unit 171 are provided instead of the low band encoding unit and the high band encoding unit.
This can be coped with by providing a system stream processing unit 172 in place of the bit stream forming processing unit. Using the configuration described above, based on control information from the outside, in the method described in each of the above embodiments, the operation amount of speech coding is changed, and a plurality of speech codes with different operation amounts are changed. By switching the scheme, it is possible to control the total amount of computation as the CPU. Alternatively, the processing amount of the video signal to be encoded may be changed according to the amount of the audio signal to be encoded.

【0088】さらに、サブバンド方式のコーディングを
行うMPEG1以外に、時間/周波数変換を行うMPE
G2,AAC,Dolby AC−3、ATRAC(M
D)などのコーディング方式を行う場合についても、符
号化処理に関わる各手段を、図18に示すように、演算
量の異なる第1の量子情報算出手段181と第2の量子
化情報算出手段182に置換するとともに、これらを量
子化手段制御手段180によって選択して使用し、符号
化情報の代わりに量子化情報を取り扱う構成とすること
で、同様に対応することが可能である。
Further, in addition to MPEG1 which performs subband coding, MPE which performs time / frequency conversion
G2, AAC, Dolby AC-3, ATRAC (M
Also in the case of performing a coding method such as D), as shown in FIG. 18, each means related to the encoding process is replaced with a first quantum information calculation means 181 and a second quantization information calculation means 182 having different calculation amounts. It is also possible to cope with the above by replacing these with the quantization means control means 180 and selecting and using these to handle the quantization information instead of the coded information.

【0089】[0089]

【発明の効果】以上のように、この発明の請求項1にか
かる音声符号化方式によれば、デジタルオーディオ信号
を複数の周波数帯域に分割し、各帯域毎に符号化を行う
音声符号化方式であって、上記分割された各帯域に対す
るビット割り当て情報を生成し、それぞれ処理量の異な
るビット割り当て手段を複数有し、外部からの制御情報
に基づいて、上記複数のビット割り当て手段の中から、
所定のビット割り当て手段を用いて処理がなされるよう
に、使用するビット割り当て手段を切り替えてビット割
り当てを実行して、符号化を行うようにしたので、常に
最適な処理量のビット割り当て手段を選択して使用する
ことができ、稼動状態において占有できるCPUの処理
量を超えないような符号化が可能となり、リアルタイム
エンコード時に処理が入力信号に対して間に合わないと
いうことがない、つまり再生音に音切れがない符号化を
行うことができるという効果がある。
As described above, according to the audio coding system according to the first aspect of the present invention, the digital audio signal is divided into a plurality of frequency bands, and the audio coding system performs encoding for each band. Generating bit allocation information for each of the divided bands, each having a plurality of bit allocation means having different processing amounts, based on external control information, from among the plurality of bit allocation means,
Since the bit allocation means to be used is switched and the bit allocation is performed and the encoding is performed so that the processing is performed using the predetermined bit allocation means, the bit allocation means having the optimum processing amount is always selected. It is possible to perform encoding that does not exceed the processing amount of the CPU that can be occupied in the operating state, and the processing does not fall short of the input signal during real-time encoding. There is an effect that coding without interruption can be performed.

【0090】また、本発明の請求項2にかかる音声符号
化方法によれば、上記外部からの制御情報として、符号
化処理を行うために占有できる中央演算処理装置の処理
量を表す負荷値を用い、上記負荷値に基づいて、上記中
央演算処理装置上で符号化処理において各ビット割り当
て手段を用いて符号化動作を行った時の各処理量を予め
記憶したデータテーブルを参照して、上記符号化処理が
占有できる中央演算処理装置の処理量を超えないようビ
ット割り当て手段の選択を行うようにしたので、中央演
算処理装置は常に稼動能力を超えるような要求を受ける
ことが無くなり、システム全体の制御をスムーズに行う
ことができるという効果がある。
Further, according to the speech encoding method of the present invention, the load value representing the processing amount of the central processing unit which can be occupied for performing the encoding process is provided as the external control information. Using, based on the load value, with reference to a data table that stores in advance each processing amount when performing an encoding operation using each bit allocation means in the encoding process on the central processing unit, Since the bit allocation means is selected so as not to exceed the processing amount of the central processing unit that can be occupied by the encoding process, the central processing unit does not always receive a request that exceeds the operation capacity, and the entire system is not received. Has an effect that the control of can be performed smoothly.

【0091】また、本発明の請求項3にかかる音声符号
化方式によれば、上記請求項2記載の行う音声符号化方
式において、上記負荷値として、符号化処理を行うため
に占有可能な上記中央演算処理装置の処理量を監視する
監視手段からの処理量制御情報を用いるとしたので、占
有可能な中央演算処理装置の最高パフォーマンスの範囲
内で、最適な処理量のビット割り当て手段を選択するこ
とができ、リアルタイムエンコード時に処理が入力信号
に対して間に合わないということがない、つまり再生音
に音切れがない符号化を行うことができるという効果が
ある。
According to a third aspect of the present invention, in the audio coding system according to the second aspect, the load value may be occupied for performing an encoding process. Since the processing amount control information from the monitoring means for monitoring the processing amount of the central processing unit is used, the bit allocation means having the optimum processing amount is selected within the range of the occupiable maximum performance of the central processing unit. Thus, there is an effect that the processing does not fall short of the input signal during the real-time encoding, that is, there is an effect that encoding can be performed without a break in the reproduced sound.

【0092】また、本発明の請求項4にかかる音声符号
化方式によれば、上記請求項1記載の音声符号化方式に
おいて、上記ビット割り当て手段によるビット割り当て
処理として、符号化データの高音質化を実現可能な高効
率にビット割り当てを行う高効率ビット割り当て方法を
用いた処理と、該高効率ビット割り当て方法を用いた処
理と比較して処理量の少ない低負荷でビット割り当てを
行う低負荷ビット割り当て方法を用いた処理を行うよう
にしたので、符号化器が符号化データの高音質化を優先
するか、又は音質よりも符号化処理の低負荷性を優先す
るかの処理を適宜切り替えて実行することができる符号
化を実現することができるという効果がある。
According to a fourth aspect of the present invention, in the audio coding system according to the first aspect of the present invention, the bit allocation processing by the bit allocation means is performed to improve the sound quality of the encoded data. Processing using a high-efficiency bit allocation method that performs bit allocation with high efficiency, and low-load bits that perform bit allocation with a low processing load with a small processing amount as compared with the processing using the high-efficiency bit allocation method. Since the process using the allocation method is performed, the encoder may appropriately switch the process of giving priority to the high sound quality of the encoded data or giving priority to the low load property of the encoding process over the sound quality. There is an effect that encoding that can be performed can be realized.

【0093】また、本発明の請求項5にかかる音声符号
化方式によれば、上記請求項1記載の音声符号化方式に
おいて、上記符号化時に使用されるビット割り当て手段
の切り替えを、オーディオ信号に復号可能な最小単位で
あるフレーム単位で行うようにしたので、リアルタイム
エンコード時に、動作CPU上で該CPUを共有する他
のアプリケーションなどのCPU占有率が突然大きくな
った場合などにおいても、フレーム単位時間で符号化処
理が占有できるCPUの処理量に追従可能となり、ま
た、リアルタイムで音質や処理量を制御可能とすること
ができるという効果がある。
[0093] According to the speech encoding system of the fifth aspect of the present invention, in the speech encoding system of the first aspect, the switching of the bit allocating means used at the time of encoding is changed to an audio signal. Since the decoding is performed in frame units, which are the minimum units that can be decoded, even if the CPU occupancy of other applications sharing the CPU on the operating CPU suddenly increases during real-time encoding, the frame unit time can be reduced. This makes it possible to follow the processing amount of the CPU that can be occupied by the encoding process, and also to control the sound quality and the processing amount in real time.

【0094】また、本発明の請求項6にかかる音声符号
化方式によれば、上記請求項1記載の音声符号化方式に
おいて、複数の周波数帯域に分割された各帯域のサブバ
ンド信号を、各々予め定められた所定個数のサブバンド
信号からなるグループとなるようにグループ分けを行
い、各グループに対して独立したビット割り当て処理を
行い、各帯域に対するビット割り当て情報を生成するよ
うにしたので、各帯域毎の特性に応じたビット割り当て
処理を選択して符号化を行うことができるという効果が
ある。
[0094] According to the speech encoding system of the sixth aspect of the present invention, in the speech encoding system of the first aspect, each of the sub-band signals divided into a plurality of frequency bands is divided into a plurality of frequency bands. Grouping was performed so as to be a group consisting of a predetermined number of subband signals, and independent bit allocation processing was performed for each group, so that bit allocation information for each band was generated. There is an effect that encoding can be performed by selecting a bit allocation process according to the characteristics of each band.

【0095】また、本発明の請求項7にかかる音声符号
化方式によれば、上記請求項6記載の音声符号化方式に
おいて、上記グループ分けが、グループの数、又はグル
ープ内の周波数軸方向に連続したサブバンド信号の数
を、上記外部からの制御情報により指定された数、又は
上記監視手段からの処理量制御情報に基づいて指定され
た数となるように可変的に行われるようにしたので、C
PUの使用状況に応じてダイナミックにグループ分けを
行うことができるという効果がある。
According to the speech coding method of the present invention, in the speech coding method of the sixth aspect, the grouping is performed in the number of groups or in the frequency axis direction within the groups. The number of continuous subband signals is variably set to be the number specified by the external control information or the number specified based on the processing amount control information from the monitoring means. So C
There is an effect that the grouping can be dynamically performed according to the usage status of the PU.

【0096】また、本発明の請求項8にかかる音声符号
化方式によれば、上記請求項7記載の音声符号化方式に
おいて、上記サブバンド信号の数の変更処理を、オーデ
ィオ信号に復号可能な最小単位であるフレーム単位で行
うようにしたので、ビット割り当て方式の変更をきめ細
かく行うことができ、高精度な符号化器を実現すること
ができるという効果がある。
[0096] According to the speech encoding system of the eighth aspect of the present invention, in the speech encoding system of the seventh aspect, the process of changing the number of subband signals can be decoded into an audio signal. Since it is performed in the frame unit which is the minimum unit, the change of the bit allocation method can be finely performed, and there is an effect that a highly accurate encoder can be realized.

【0097】また、本発明の請求項9にかかる音声符号
化方式によれば、請求項8記載の音声符号化方式におい
て、上記グループ分け時に、ビット割り当てを行わない
グループを少なくとも1つ設けるようにしたので、オー
ディオ信号に復号可能な最小単位であるフレーム単位
で、グループの数、またはグループ内の周波数軸方向に
連続したサブバンド信号の数を、外部からの制御情報に
より指定された数、または監視手段からの処理量制御情
報により指定された数に変えることで、ビット割り当て
が行われないグループに属する帯域の信号を符号化処理
する必要がなくなり、また、ビット割り当てが行われな
いグループに属する帯域に割り当てられるべきビット
を、ビット割り当てが行われる他のグループの帯域に分
配することができ、その結果、符号化処理が占有するC
PUの処理量を制御可能となるとともに、ビット割り当
てが行われる他のグループの帯域の音質を向上すること
ができるという効果がある。
According to the speech coding system of the ninth aspect of the present invention, in the speech coding system of the eighth aspect, at least one group in which bit allocation is not performed at the time of grouping is provided. Therefore, the number of groups, or the number of sub-band signals that are continuous in the frequency axis direction within the group, in a frame unit, which is the minimum unit that can be decoded into an audio signal, is the number specified by external control information, or By changing the number to the number specified by the processing amount control information from the monitoring unit, it is not necessary to perform the encoding process on the signal of the band belonging to the group to which bit allocation is not performed, and to belong to the group to which bit allocation is not performed. The bits to be allocated to a band can be distributed to other groups of bands where the bit allocation is made, Result, C encoding process occupies
There is an effect that the processing amount of the PU can be controlled and the sound quality of the band of another group to which bit allocation is performed can be improved.

【0098】また、本発明の請求項10にかかる音声符
号化方式によれば、上記請求項6記載の音声符号化方式
において、上記サブバンド信号のグループ分けにより、
低帯域に属するグループにグループ分けされたサブバン
ド信号に対し、符号化データの高音質化を実現可能な高
効率ビット割り当て方法を用いて、グループ内のサブバ
ンド信号にビット割り当てを行う一方、高帯域に属する
グループにグループ分けされたサブバンド信号に対し、
上記高効率ビット割り当て方法と比較して処理量の少な
い低負荷ビット割り当て処理を用いて、グループ内のサ
ブバンド信号にビット割り当てを行うようにしたので、
人間の耳に対して感度のよい低帯域については符号化デ
ータの高音質化を図ることができ、一方、人の耳に対し
て感度の悪い高帯域については処理量優先の低負荷ビッ
ト割り当てを用いられるようになり、全体として処理量
を削減した符号化を行うことができるという効果があ
る。
[0098] According to the speech coding system of claim 10 of the present invention, in the speech coding system of claim 6, the subband signal is divided into groups.
For the sub-band signals grouped into the group belonging to the low band, the bit allocation is performed on the sub-band signals within the group using a high-efficiency bit allocation method capable of realizing high sound quality of the encoded data, For subband signals grouped into groups belonging to the band,
Using a low-load bit allocation process with a small processing amount compared to the high-efficiency bit allocation method, so as to perform bit allocation to sub-band signals in the group,
Higher sound quality of coded data can be achieved for low-bands that are sensitive to the human ear, while low-load bit allocation that prioritizes processing amount is assigned to high-bands that are insensitive to the human ear. As a result, it is possible to perform encoding with a reduced processing amount as a whole.

【0099】また、本発明の請求項11にかかる音声符
号化方式によれば、上記請求項6記載の音声符号化方式
において、各グループ毎に独立したビット割り当て手段
に対する割り当て可能ビット数を決定する割り当て可能
ビット演算手段を設け、各グループのグループ全体に対
する割合に各グループに属する各帯域毎の特性に基づい
た重み付けを加味したものを用いて、グループ全体に対
する割り当て可能ビット数を、各グループ毎に独立した
ビット割り当て手段に対し振り分けるようにしたので、
入力信号、又は各帯域の特性に対して、聴覚特性を考慮
した符号化データの高音質を実現するのに最適な各グル
ープのビット割り当て手段に対するビット配分が可能な
符号化を行うことができるという効果がある。
According to the speech coding system of the present invention, the number of bits that can be assigned to the bit assignment means independent for each group is determined in the speech coding system of the sixth embodiment. Allocatable bit calculation means is provided, and the number of bits that can be allocated to the entire group is determined for each group by using a ratio of each group to the entire group and weighting based on characteristics of each band belonging to each group. Since it is distributed to independent bit allocation means,
It is possible to perform encoding capable of performing bit allocation to bit allocation means of each group optimal for realizing high sound quality of encoded data in consideration of auditory characteristics with respect to characteristics of an input signal or each band. effective.

【0100】また、本発明の請求項12にかかる音声符
号化方式によれば、上記請求項11記載の音声符号化方
式において、各グループに属する各帯域毎の特性に基づ
いた重み付けを、各帯域毎の所定の最小可聴限界値に基
づいた重み付けとすることにより、上記人間が聴く際に
意味の有る効果的なビット割り当て処理を行うことがで
きるという効果がある。
According to the speech coding system of the present invention, weighting based on the characteristics of each band belonging to each group is performed in each speech coding system. The weighting based on the predetermined minimum audible limit value for each has an effect that a meaningful and effective bit allocation process can be performed when the human listens.

【0101】また、本発明の請求項13にかかる音声符
号化方式によれば、上記請求項11記載の音声符号化方
式において、各グループに属する各帯域毎の特性に基づ
いた重み付けを、入力デジタルオーディオ信号にサブバ
ンド分析を施して得られる、各グループに属する各周波
数帯域のサブバンド信号レベルに基づいた重み付けとす
ることにより、効果的なビット割り当て処理を行うこと
ができるという効果がある。
According to the speech coding system of the present invention, the weighting based on the characteristics of each band belonging to each group is performed by the input digital coding system. The weighting based on the subband signal level of each frequency band belonging to each group obtained by performing subband analysis on the audio signal has an effect that an effective bit allocation process can be performed.

【0102】また、本発明の請求項14にかかる音声符
号化方式は、上記請求項11記載の音声符号化方式にお
いて、各グループに属する各帯域毎の特性に基づいた重
み付けを、入力デジタルオーディオ信号に線形変換を施
して得られる、各グループに属するスペクトル信号レベ
ルに基づいた重み付けとすることにより、効果的なビッ
ト割り当て処理を行うことができるという効果がある。
According to a fourteenth aspect of the present invention, in the audio coding system according to the eleventh aspect, the weighting based on the characteristics of each band belonging to each group is applied to the input digital audio signal. By performing weighting based on the spectrum signal level belonging to each group, which is obtained by performing a linear conversion on the group, there is an effect that an effective bit allocation process can be performed.

【0103】また、本発明の請求項15にかかる音声符
号化方式によれば、上記請求項6記載の音声符号化方式
において、各グループに属する信号レベルが、所定のし
きい値以上の高レベルな信号に対しては、符号化データ
の高音質化を実現可能な高効率ビット割り当て方法を用
いてビット割り当てを行い、各グループに属する信号レ
ベルが、所定のしきい値以下の低レベルな信号に対して
は、上記高効率ビット割り当て方法と比較して処理量の
少ない低負荷ビット割り当て方法を用いてビット割り当
てを行うようにしたので、他の帯域に比べ符号化データ
としてそれほど重要でない信号に対し、処理負荷を割く
ことなく、符号化データの高音質化を図ることができる
符号化を行うことができるという効果がある。
According to a speech coding method according to claim 15 of the present invention, in the speech coding method according to claim 6, the signal level belonging to each group is set to a high level equal to or higher than a predetermined threshold value. Bit allocation using a highly efficient bit allocation method capable of realizing high-quality encoded data for a low-level signal, and the signal level belonging to each group is a low-level signal of a predetermined threshold or less. In contrast, the bit allocation is performed using a low-load bit allocation method that requires less processing compared to the above-described high-efficiency bit allocation method, so that a signal that is not so important as encoded data compared to other bands is used. On the other hand, there is an effect that it is possible to perform encoding that can achieve high sound quality of encoded data without dividing a processing load.

【0104】また、本発明の請求項16にかかる音声符
号化方式によれば、上記請求項15記載の音声符号化方
式において、上記各グループに属する信号レベルを、入
力デジタルオーディオ信号にサブバンド分析を施して得
られるサブバンド信号レベルとすることにより、効果的
なビット割り当て処理を行うことができるという効果が
ある。
According to a speech coding system of the present invention, in the speech coding system of the present invention, a signal level belonging to each group is converted into an input digital audio signal by sub-band analysis. By applying the sub-band signal level obtained by performing the above, there is an effect that an effective bit allocation process can be performed.

【0105】また、本発明の請求項17にかかる音声符
号化方式によれば、上記請求項15記載の音声符号化方
式において、上記各グループに属する信号レベルを、入
力デジタルオーディオ信号に線形変換を施して得られる
スペクトル信号レベルとしたので、することにより、効
果的なビット割り当て処理を行うことができるという効
果がある。
According to the speech coding system of claim 17 of the present invention, in the speech coding system of claim 15, the signal level belonging to each group is converted linearly into an input digital audio signal. Since the spectrum signal level is obtained by performing the above, there is an effect that it is possible to perform an effective bit allocation process.

【0106】また、本発明の請求項18にかかる音声符
号化方式によれば、上記請求項15記載の音声符号化方
式において、上記各グループに属する信号レベルを、所
定の各帯域毎の最小可聴限界値としたので、上記人間が
聴く際に意味の有る効果的なビット割り当て処理を行う
ことができるという効果がある。
According to the speech coding system of the present invention, in the speech coding system of the present invention, the signal level belonging to each of the groups is set to a minimum audible level for each predetermined band. Since the threshold value is set, there is an effect that the effective and effective bit allocation processing can be performed when the human listens.

【0107】また、本発明の請求項19にかかる音声符
号化方式によれば、上記請求項4,10, 15のいずれ
かに記載の音声符号化方式において、上記符号化データ
の高音質化を実現可能な高効率ビット割り当て処理とし
て、所定の聴覚心理モデルに基づく信号対マスク比値と
の関係を使用してビット割り当てを行うものとし、一
方、上記高効率ビット割り当て処理と比較して処理量の
少ない低負荷ビット割り当て処理として、複数の周波数
帯域に分割された信号レベルに各帯域毎の所定の最小可
聴限界値を加味してビット割り当てを行うものとしたの
で、全体として人間の耳で聞いた限りは音質を損なうこ
となく、システムの処理量を軽減することができるとい
う効果がある。
According to the speech coding method of claim 19 of the present invention, in the speech coding method of any one of claims 4, 10, and 15, it is possible to improve the sound quality of the encoded data. As feasible high-efficiency bit allocation processing, bit allocation is performed using a relationship between a signal and a mask ratio value based on a predetermined psychoacoustic model. As a low-load bit allocation process with a small number of bits, bit allocation is performed by adding a predetermined minimum audible limit value for each band to a signal level divided into a plurality of frequency bands. As long as the sound quality is not impaired, the processing amount of the system can be reduced.

【0108】また、本発明の請求項20にかかる音声符
号化方式は、上記請求項19記載の音声符号化方式にお
いて、上記聴覚心理モデルがMPEGによって指定され
た聴覚心理モデルとすることにより、MPEG(Motion
Picture Experts Group)を用いた音声符号化処理にお
いても上記同様の効果を得ることができるという効果が
ある。
According to a twentieth aspect of the present invention, there is provided a speech encoding system according to the nineteenth aspect, wherein the psychoacoustic model is a psychoacoustic model specified by MPEG. (Motion
The same effect as described above can be obtained even in audio encoding processing using Picture Experts Group.

【0109】また、本発明の請求項21にかかる音声符
号化方式は、上記請求項5または請求項8記載の音声符
号化方式において、上記オーディオ信号に復号可能な最
小単位であるフレームが、MPEG(Motion Picture E
xperts Group)によって指定されたフレームとすること
により、MPEGを用いた音声符号化処理においても上
記同様の効果を得ることができるという効果がある。
According to a twenty-first aspect of the present invention, in the audio coding system according to the fifth or eighth aspect, a frame which is a minimum unit which can be decoded into the audio signal is an MPEG signal. (Motion Picture E
xperts Group), the same effect as described above can be obtained even in audio encoding processing using MPEG.

【0110】また、本発明の請求項22にかかる音声符
号化方式によれば、上記請求項1記載の音声符号化方式
において、上記ビット割り当て手段は、分割化された各
帯域に対し、所定の聴覚心理モデルから出力される情報
に基づいてビット割り当て情報を生成するものであり、
N(N=1,2,3...)フレームに1度、上記所定の聴覚
心理モデルから出力される情報に基づいてビット割り当
て情報を生成し、上記ビット割り当て情報を生成しなか
ったフレームに対しては、上記聴覚心理モデルから出力
された情報と上記分割された各帯域の信号情報に基づい
てビット割り当て情報を生成し、符号化を行なうように
したので、時間軸方向でのCPU負荷を低減することが
できるという効果がある。
[0110] According to a speech coding method according to claim 22 of the present invention, in the speech coding method according to claim 1, the bit allocation means assigns a predetermined value to each of the divided bands. Generates bit allocation information based on information output from the psychoacoustic model,
Once every N (N = 1, 2, 3,...) Frames, bit allocation information is generated based on information output from the predetermined psychoacoustic model. On the other hand, bit allocation information is generated and encoded based on the information output from the psychoacoustic model and the signal information of each of the divided bands, so that the CPU load in the time axis direction is reduced. There is an effect that it can be reduced.

【0111】また、本発明の請求項23にかかる音声符
号化方式によれば、上記請求項項1記載の音声符号化方
式において、段階的に処理量の制御可能な聴覚心理モデ
ルを有し、外部からの制御情報に基づいて、上記聴覚心
理モデルの処理量制御を行ない、所定の処理量の聴覚心
理モデルを用いて処理がなされるように、各帯域に対す
るビット割り当て情報を生成するようにしたので、聴覚
的な効果を加味したCPU負荷制御を行うことができる
という効果がある。
[0111] According to the speech coding method of claim 23 of the present invention, the speech coding method of claim 1 has an auditory psychological model whose processing amount can be controlled step by step. Based on external control information, the processing amount of the psychoacoustic model is controlled, and bit allocation information for each band is generated so that processing is performed using the psychoacoustic model of a predetermined processing amount. Therefore, there is an effect that CPU load control in consideration of an auditory effect can be performed.

【0112】また、本発明の請求項24にかかる音声符
号化方式によれば、上記請求項1記載の音声符号化方式
において、それぞれ処理量の異なる聴覚心理モデルを複
数有し、外部からの制御情報に基づいて、上記複数の聴
覚心理モデルの中から、所定の聴覚心理モデルを用いて
処理が成されるように、使用する聴覚心理モデルを切り
替えて、各帯域に対するビット割り当て情報を生成する
ようにしたので、より簡単に聴覚的な効果を加味したC
PU負荷制御を行うことができるという効果がある。
Further, according to the speech coding method of claim 24 of the present invention, the speech coding method of claim 1 has a plurality of psychoacoustic models each having a different processing amount, and is controlled by an external control. Based on the information, a psychoacoustic model to be used is switched to generate bit allocation information for each band so that processing is performed using a predetermined psychoacoustic model from among the plurality of psychoacoustic models. , So it is easier to add auditory effects to C
There is an effect that PU load control can be performed.

【0113】また、本発明の請求項25にかかる音声符
号化方式によれば、デジタルオーディオ信号を複数の周
波数帯域に分割し、該分割された各帯域に対するビット
割り当て情報を生成し、所定ビットレートでの伝送を目
的として各帯域毎に符号化を行なう音声符号化方式であ
って、符号化データストリーム中にデータを挿入するフ
レームにおけるビット割り当て範囲を制御し、符号化オ
ーディオデータ量を可変に制御するようにしたから、C
PU処理の負荷が一定となるとともに、余剰帯域に様々
なデータを重畳して帯域を有効に利用することができる
という効果が得られる。
Further, according to the speech coding system of the present invention, a digital audio signal is divided into a plurality of frequency bands, bit allocation information for each of the divided bands is generated, and a predetermined bit rate is determined. This is a voice coding method that performs coding for each band for the purpose of transmission in the CDMA system, and controls the bit allocation range in a frame where data is inserted into the coded data stream, and variably controls the amount of coded audio data C
The effect is obtained that the load of the PU processing becomes constant, and that various data can be superimposed on the surplus bandwidth to effectively use the bandwidth.

【0114】また、本発明の請求項26にかかる音声符
号化方式によれば、上記請求項25記載の音声符号化方
式において、外部からの制御情報に基づいて、フレーム
単位でビット割り当て範囲を制御し、符号化オーディオ
データ量を可変に制御するようにしたので、CPUの処
理負荷を効率よく低減することができるという効果があ
る。
According to the speech coding system of the present invention, in the speech coding system of the present invention, the bit allocation range is controlled on a frame basis based on external control information. Since the amount of encoded audio data is variably controlled, the processing load on the CPU can be reduced efficiently.

【0115】また、本発明の請求項27にかかる音声符
号化方式によれば、上記請求項26記載の音声符号化方
式において、上記外部からの制御情報として、付加デー
タのバッファを監視する監視手段からのデータ量制御情
報を用いるようにしたので、負荷データを優先的に重畳
することができるという効果がある。
According to the speech coding system of claim 27 of the present invention, in the speech coding system of claim 26, monitoring means for monitoring a buffer of additional data as the external control information. Is used, the load data can be preferentially superimposed.

【0116】また、本発明の請求項28にかかる音声符
号化方式によれば、上記請求項1記載の音声符号化方式
において、符号化処理が実行される中央演算処理装置の
性能に応じて、符号化処理動作前の初期化時に複数のビ
ット割り当て手段、または複数の聴覚心理モデルの各処
理負荷値情報を外部へ出力するようにしたので、実際に
符号化を行う前に、使用されるCPUの性能に関する情
報を取得することができ、CPUの処理負荷を効率的に
低減することができるという効果がある。
[0116] According to the speech encoding system of claim 28 of the present invention, in the speech encoding system of claim 1, depending on the performance of the central processing unit in which the encoding process is executed, Since the processing load value information of the plurality of bit allocation means or the plurality of psychoacoustic models is output to the outside at the time of initialization before the encoding processing operation, the CPU used before the actual encoding is performed. Information about the performance of the CPU can be obtained, and the processing load on the CPU can be efficiently reduced.

【0117】また、本発明の請求項29にかかる音声符
号化方式によれば、上記請求項28記載の音声符号化方
式において、外部への情報として出力される複数のビッ
ト割り当て手段、または複数の聴覚心理モデルの各処理
負荷値情報が、降順、あるいは昇順で出力されるように
したので、符号化処理手段の選択を迅速に行うことがで
きるという効果がある。
According to the speech coding system of claim 29 of the present invention, in the speech coding system of claim 28, a plurality of bit allocation means output as information to the outside, or a plurality of Since each piece of processing load value information of the psychoacoustic model is output in descending order or ascending order, there is an effect that the encoding processing means can be selected quickly.

【0118】また、本発明の請求項30にかかる音声符
号化方式によれば、映像信号,音声信号の符号化処理が
同一の中央演算処理装置にて処理がなされる音声符号化
方式において、異なる複数の演算量で符号化を行うもの
であって、上記音声信号もしくは映像信号の符号化の演
算量を変更することで、上記中央演算処理装置上での処
理の全体的な演算量を制御するようにしたので、音声と
ともに映像信号を符号化する処理においても、CPUの
負荷処理を行うことができるという効果がある。
Further, according to the audio coding method according to claim 30 of the present invention, the coding processing of the video signal and the audio signal is different in the audio coding method in which the processing is performed by the same central processing unit. The encoding is performed with a plurality of computation amounts, and the overall computation amount of processing on the central processing unit is controlled by changing the encoding amount of the audio signal or the video signal. As a result, there is an effect that the load processing of the CPU can be performed also in the process of encoding the video signal together with the audio.

【0119】また、本発明の請求項31にかかる音声符
号化方式によれば、映像信号,音声信号の符号化処理が
同一の中央演算処理装置にて処理がなされる音声符号化
方式において、演算量の異なる複数の符号化方式を用い
て符号化を行うものであって、上記音声信号の符号化の
符号化方式を変更することで、上記中央演算処理装置上
での処理の全体的な演算量を制御するようにしたので、
音声とともに映像信号を符号化する処理においても、C
PUの負荷処理を行うことができるという効果がある。
Further, according to the audio coding method according to claim 31 of the present invention, in the audio coding method in which the encoding processing of the video signal and the audio signal is performed by the same central processing unit, The encoding is performed using a plurality of encoding schemes having different amounts, and by changing the encoding scheme for encoding the audio signal, the overall operation of the processing on the central processing unit is performed. Because I controlled the amount,
In the process of encoding a video signal together with audio, C
There is an effect that the load processing of the PU can be performed.

【0120】また、本発明の請求項32にかかる音声符
号化方式によれば、上記請求項30または31記載の音
声符号化方式において、上記中央演算処理装置上での処
理の制御を、外部からの制御情報に基づいて行うように
したので、CPUの処理負荷を効率よく低減することが
できるという効果がある。
According to the speech coding system of claim 32 of the present invention, in the speech coding system of claim 30 or 31, control of processing on the central processing unit is externally controlled. Is performed based on the control information described above, so that the processing load on the CPU can be efficiently reduced.

【0121】また、本発明の請求項33にかかる音声符
号化方式によれば、ディジタルオーディオ信号に対し
て、時間/周波数変換を施し、量子化情報を生成するこ
とで符号化を行う音声符号化方式であって、それぞれ演
算量の異なる複数の量子化情報算出手段を有し、外部か
らの制御情報に基づいて、上記複数の量子化情報算出手
段の中から、所定の量子化情報算出手段を選択して処理
が行われるように、使用する量子化情報算出手段を切り
替えて量子化情報を算出して符号化を行うようにしたの
で、時間/周波数変換方式のコーディングを行う符号化
処理装置においても、CPUの処理負荷を低減すること
ができるという効果がある。
Further, according to the speech coding method of claim 33 of the present invention, the speech coding method performs time / frequency conversion on a digital audio signal and generates quantization information to perform coding. A plurality of quantization information calculation means each having a different operation amount, and a predetermined quantization information calculation means is selected from the plurality of quantization information calculation means based on control information from the outside. Since the quantization information calculation means to be used is switched so as to select and perform the processing, the quantization information is calculated and the coding is performed. Therefore, in the coding processing apparatus for performing the coding of the time / frequency conversion method, This also has the effect that the processing load on the CPU can be reduced.

【0122】また、本発明の請求項34にかかる音声符
号化装置によれば、上記請求項1ないし請求項33のい
ずれかに記載の音声符号化方式を用いて音声符号化を行
うようにしたので、該音声符号化方式を組み込んだVT
Rカメラなどの機器においても上記同様の効果を得るこ
とができるという効果がある。
According to a speech coding apparatus according to claim 34 of the present invention, speech coding is performed using the speech coding method according to any one of claims 1 to 33. Therefore, the VT incorporating the audio coding method
There is an effect that the same effect as described above can be obtained in a device such as an R camera.

【0123】また、本発明の請求項35にかかるデータ
記憶媒体は、上記請求項1ないし請求項33のいずれか
に記載の音声符号化方式のステップが記録されているの
で、該記憶媒体を用いて上記音声符号化方式を装置に組
み込むことにより、上記同様の効果を得ることができる
という効果がある。
Also, in the data storage medium according to claim 35 of the present invention, since the steps of the audio coding method according to any one of claims 1 to 33 are recorded, the data storage medium is used. By incorporating the above-mentioned speech coding system into the apparatus, the same effect as described above can be obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1による音声符号化方式を
用いた音声符号化装置を実現するために、パーソナルコ
ンピュータを用いた全体的なシステムとしての構成を示
すブロック図である。
FIG. 1 is a block diagram showing a configuration of an entire system using a personal computer in order to realize a speech encoding device using a speech encoding method according to a first embodiment of the present invention.

【図2】上記実施の形態1による音声符号化装置を構成
する符号化器の構成を示すブロック図である。
FIG. 2 is a block diagram illustrating a configuration of an encoder included in the speech encoding device according to the first embodiment.

【図3】上記符号化器を構成する高帯域符号化処理手段
の詳細な構成を示すブロック図である。
FIG. 3 is a block diagram showing a detailed configuration of high-band coding processing means constituting the encoder.

【図4】上記実施の形態1による音声符号化装置を構成
する符号化器のより詳細な構成を示すブロック図であ
る。
FIG. 4 is a block diagram illustrating a more detailed configuration of an encoder included in the speech encoding device according to the first embodiment.

【図5】上記実施の形態1による音声符号化方式で使用
する、各グループに対するビット割り当て処理の一例を
示した模式図である。
FIG. 5 is a schematic diagram showing an example of a bit allocation process for each group used in the audio coding scheme according to the first embodiment.

【図6】上記実施の形態1による音声符号化方式で使用
する、各グループに対するビット割り当て処理の他の一
例を示した模式図である。
FIG. 6 is a schematic diagram showing another example of a bit allocation process for each group used in the audio coding method according to the first embodiment.

【図7】上記実施の形態1による音声符号化装置を構成
する符号化器の符号化動作を説明するためのフローを示
す図である。
FIG. 7 is a diagram showing a flow for describing an encoding operation of an encoder included in the speech encoding device according to the first embodiment.

【図8】上記実施の形態1による音声符号化方式で使用
する、各グループに対するビット割り当て処理の、閾値
を用いて処理を行う例を示した模式図である。
FIG. 8 is a schematic diagram showing an example in which a bit allocation process for each group is performed using a threshold value, which is used in the audio encoding method according to the first embodiment.

【図9】本発明の上記実施の形態1による音声符号化装
置を構成する符号化器の変形例の詳細な構成を示すブロ
ック図である。
FIG. 9 is a block diagram illustrating a detailed configuration of a modified example of the encoder included in the speech encoding device according to the first embodiment of the present invention.

【図10】本発明の実施の形態2によるデータ記憶媒体
及び該記憶媒体を用いて音声符号化装置を構成する場合
の構成を示すブロック図である。
FIG. 10 is a block diagram illustrating a data storage medium according to a second embodiment of the present invention and a configuration in a case where a speech encoding device is configured using the storage medium.

【図11】従来の音声符号化装置を構成する符号化器の
構成を示すブロック図である。
FIG. 11 is a block diagram illustrating a configuration of an encoder that forms a conventional speech encoding device.

【図12】本発明の実施の形態3による音声符号化装置
を構成する低帯域符号化処理手段の詳細な構成を示す図
である。
FIG. 12 is a diagram illustrating a detailed configuration of a low-band coding processing unit included in a speech coding device according to a third embodiment of the present invention.

【図13】上記実施の形態3による音声符号化装置によ
る低帯域符号化時の各フレームにおける聴覚心理モデル
の状態を説明するための図である。
FIG. 13 is a diagram for explaining the state of the psychoacoustic model in each frame at the time of low-band coding by the speech coding apparatus according to the third embodiment.

【図14】本発明の実施の形態4による音声符号化装置
を構成する低帯域符号化処理手段の詳細な構成を示す図
である。
FIG. 14 is a diagram illustrating a detailed configuration of a low-band coding processing unit included in a speech coding device according to a fourth embodiment of the present invention.

【図15】上記実施の形態4による音声符号化装置を用
いたビット割り当て処理の一例を示す図である。
FIG. 15 is a diagram illustrating an example of a bit allocation process using the speech encoding device according to the fourth embodiment.

【図16】本発明の実施の形態5による音声符号化装置
を構成する符号化器の構成を示すブロック図である。
FIG. 16 is a block diagram illustrating a configuration of an encoder included in a speech encoding device according to a fifth embodiment of the present invention.

【図17】音声信号とともに映像信号を取り扱う場合の
符号化器の構成を示すブロック図である。
FIG. 17 is a block diagram illustrating a configuration of an encoder when a video signal is handled together with an audio signal.

【図18】時間/周波数変換方式のコーディングを行う
符号化処理装置における符号化処理において本発明を適
用した場合の構成を示すブロック図である。
FIG. 18 is a block diagram illustrating a configuration in a case where the present invention is applied to encoding processing in an encoding processing device that performs time / frequency conversion coding.

【符号の説明】[Explanation of symbols]

1 パーソナルコンピュータ(音声符号化装置) 11 HDD 12a PDD 12b FDD 13 メモリ 14 CPU(中央演算処理装置) 15 データバス 16 ビデオキャプチャーカード 17 カメラ 18 サウンドカード 19 マイク 20 符号化器 21 CPU負荷監視情報 22 符号化手段制御手段 23 低帯域符号化処理手段 24 高帯域符号化処理手段 25 ビットストリーム形成処理手段 26 符号化モード指定信号 101 符号化器 102 サブバンド分析手段 103 スケールファクタ抽出手段 104 FFT手段 105 聴覚心理分析手段 106 量子化/符号化手段 107 補助情報符号化手段 108 ビットストリーム形成手段 109 帯域出力適応ビット割り当て手段 110 聴覚心理モデルビット割り当て手段 111 グループ分け手段 112 ビット割り当て処理制御手段 121 処理量制御情報 160〜162 符号化処理手段A〜C 163 処理負荷値格納バッファ 164 サンプルデータバッファ 170 映像符号化処理手段 171 音声符号化処理手段 172 システムストリーム形成処理手段 180 量子化手段制御手段 181 第1の量子化情報算出手段 182 第2の量子化情報算出手段 FC フロッピーディスクケース FD フロッピーディスク D フロッピーディスク本体 Se セクタ Tr トラック Cs コンピュータシステム FDD フロッピーディスクドライブ DESCRIPTION OF SYMBOLS 1 Personal computer (sound encoding device) 11 HDD 12a PDD 12b FDD 13 Memory 14 CPU (Central processing unit) 15 Data bus 16 Video capture card 17 Camera 18 Sound card 19 Microphone 20 Encoder 21 CPU load monitoring information 22 Code Coding means control means 23 low-band coding processing means 24 high-band coding processing means 25 bit stream forming processing means 26 coding mode designation signal 101 coder 102 sub-band analysis means 103 scale factor extraction means 104 FFT means 105 psychoacoustic Analysis means 106 quantization / encoding means 107 auxiliary information encoding means 108 bit stream forming means 109 band output adaptive bit allocation means 110 psychoacoustic model bit allocation means 111 group Processing means 112 bit allocation processing control means 121 processing amount control information 160 to 162 coding processing means A to C 163 processing load value storage buffer 164 sample data buffer 170 video coding processing means 171 audio coding processing means 172 system stream forming processing Means 180 Quantization means control means 181 First quantization information calculation means 182 Second quantization information calculation means FC Floppy disk case FD Floppy disk D Floppy disk body Se Sector Tr Track Cs Computer system FDD Floppy disk drive

Claims (35)

【特許請求の範囲】[Claims] 【請求項1】 デジタルオーディオ信号を複数の周波数
帯域に分割し、各帯域毎に符号化を行う音声符号化方式
であって、 上記分割された各帯域に対するビット割り当て情報を生
成し、それぞれ処理量の異なるビット割り当て手段を複
数有し、 外部からの制御情報に基づいて、上記複数のビット割り
当て手段の中から、所定のビット割り当て手段を用いて
処理がなされるように、使用するビット割り当て手段を
切り替えてビット割り当てを実行して、符号化を行うこ
とを特徴とする音声符号化方式。
1. An audio coding method for dividing a digital audio signal into a plurality of frequency bands and performing encoding for each band, wherein bit allocation information for each of the divided bands is generated, and A plurality of different bit allocation means, and based on control information from the outside, a bit allocation means to be used is selected from the plurality of bit allocation means so that processing is performed using a predetermined bit allocation means. A speech coding method characterized by performing coding by switching and performing bit allocation.
【請求項2】 請求項1記載の音声符号化方式におい
て、 上記外部からの制御情報として、符号化処理を行うため
に占有できる中央演算処理装置の処理量を表す負荷値を
用い、 上記負荷値に基づいて、上記中央演算処理装置上で符号
化処理において各ビット割り当て手段を用いて符号化動
作を行った時の各処理量を予め記憶したデータテーブル
を参照して、上記符号化処理が占有できる中央演算処理
装置の処理量を超えないよう上記ビット割り当て手段の
選択を行うことを特徴とする音声符号化方式。
2. The speech coding method according to claim 1, wherein a load value representing a processing amount of a central processing unit that can be occupied for performing an encoding process is used as the external control information. Based on the above, the encoding process is occupied by referring to a data table that stores in advance the processing amount when the encoding operation is performed using each bit allocation unit in the encoding process on the central processing unit. A speech coding method, wherein the bit allocation means is selected so as not to exceed a processing amount of a central processing unit which can be processed.
【請求項3】 請求項2記載の音声符号化方式におい
て、 上記負荷値として、符号化処理を行うために占有可能な
上記中央演算処理装置の処理量を監視する監視手段から
の処理量制御情報を用いることを特徴とする音声符号化
方式。
3. The speech coding method according to claim 2, wherein the load value is a processing amount control information from a monitoring unit that monitors a processing amount of the central processing unit that can be occupied for performing an encoding process. A speech coding method characterized by using.
【請求項4】 請求項1記載の音声符号化方式におい
て、 上記ビット割り当て手段によるビット割り当て処理とし
て、 符号化データの高音質化を実現可能な高効率にビット割
り当てを行う高効率ビット割り当て方法を用いた処理
と、 上記高効率ビット割り当て方法を用いた処理と比較して
処理量の少ない低負荷でビット割り当てを行う低負荷ビ
ット割り当て方法を用いた処理とが行なわれることを特
徴とする音声符号化方式。
4. The high-efficiency bit allocation method according to claim 1, wherein the bit allocation processing by the bit allocation means performs high-efficiency bit allocation capable of realizing high-quality sound of encoded data. And a process using a low-load bit allocation method for performing bit allocation with a low load with a smaller processing amount compared to the process using the high-efficiency bit allocation method. System.
【請求項5】 請求項1記載の音声符号化方式におい
て、 上記符号化時に使用されるビット割り当て手段の切り替
えを、オーディオ信号に復号可能な最小単位であるフレ
ーム単位で行うことを特徴とする音声符号化方式。
5. The audio encoding system according to claim 1, wherein the switching of the bit allocation means used at the time of encoding is performed in a frame unit which is a minimum unit that can be decoded into an audio signal. Encoding method.
【請求項6】 請求項1記載の音声符号化方式におい
て、 複数の周波数帯域に分割された各帯域のサブバンド信号
を、各々予め定められた所定個数のサブバンド信号から
なるグループとなるようにグループ分けを行い、各グル
ープに対して独立したビット割り当て処理を行い、各帯
域に対するビット割り当て情報を生成することを特徴と
する音声符号化方式。
6. A speech coding system according to claim 1, wherein the sub-band signals of each band divided into a plurality of frequency bands are formed into groups each including a predetermined number of sub-band signals. A speech coding method characterized by performing grouping, performing independent bit allocation processing for each group, and generating bit allocation information for each band.
【請求項7】 請求項6記載の音声符号化方式におい
て、 上記グループ分けは、 グループの数、又はグループ内の周波数軸方向に連続し
たサブバンド信号の数を、上記外部からの制御情報によ
り指定された数、又は上記監視手段からの処理量制御情
報に基づいて指定された数になるように、可変的に行わ
れることを特徴とする音声符号化方式。
7. The audio coding method according to claim 6, wherein the grouping is performed by specifying the number of groups or the number of subband signals continuous in the frequency axis direction within the group by the external control information. A voice coding method, which is variably performed such that the number becomes the specified number or the number specified based on the processing amount control information from the monitoring means.
【請求項8】 請求項7記載の音声符号化方式におい
て、 上記サブバンド信号の数の変更処理を、オーディオ信号
に復号可能な最小単位であるフレーム単位で行うことを
特徴とする音声符号化方式。
8. The audio encoding method according to claim 7, wherein the process of changing the number of subband signals is performed in frame units, which are minimum units that can be decoded into audio signals. .
【請求項9】 請求項8記載の音声符号化方式におい
て、 上記グループ分け時に、ビット割り当てを行わないグル
ープを少なくとも1つ設けることを特徴とする音声符号
化方法。
9. The speech encoding method according to claim 8, wherein at least one group to which bit allocation is not performed is provided at the time of grouping.
【請求項10】 請求項6記載の音声符号化方式におい
て、 上記サブバンド信号のグループ分けにより、低帯域に属
するグループにグループ分けされたサブバンド信号に対
し、符号化データの高音質化を実現可能な高効率ビット
割り当てを行う処理を用いて、グループ内のサブバンド
信号にビット割り当てを行い、一方、高帯域に属するグ
ループにグループ分けされたサブバンド信号に対し、上
記高効率ビット割り当て処理と比較して処理量の少ない
低負荷ビット割り当て処理を用いて、グループ内のサブ
バンド信号にビット割り当てを行うことを特徴とする音
声符号化方式。
10. The audio coding method according to claim 6, wherein the sub-band signals are grouped to realize high-quality encoded data for the sub-band signals grouped into a group belonging to a low band. By using a process for performing a possible high-efficiency bit allocation, the bits are allocated to the sub-band signals in the group. A voice coding method characterized by performing bit allocation to subband signals in a group using low-load bit allocation processing with a relatively small processing amount.
【請求項11】 請求項6記載の音声符号化方式におい
て、 各グループ毎に独立したビット割り当て手段に対する割
り当て可能ビット数を決定する割り当て可能ビット演算
手段を設け、各グループのグループ全体に対する割合
に、各グループに属する各帯域毎の特性に基づいた重み
付けを加味したものを用いて、グループ全体に対する割
り当て可能ビット数を、各グループ毎に独立したビット
割り当て手段に対し振り分けることを特徴とする音声符
号化方式。
11. A speech coding method according to claim 6, further comprising: assignable bit operation means for determining the number of assignable bits to the independent bit assignment means for each group, wherein the ratio of each group to the entire group is: Speech coding characterized by distributing the number of bits that can be allocated to the entire group to independent bit allocating means for each group using weights based on characteristics of each band belonging to each group. method.
【請求項12】 請求項11記載の音声符号化方式にお
いて、 各グループに属する各帯域毎の特性に基づいた重み付け
を、各帯域毎の所定の最小可聴限界値に基づいた重み付
けとすることを特徴とする音声符号化方式。
12. The speech coding method according to claim 11, wherein the weighting based on the characteristics of each band belonging to each group is weighted based on a predetermined minimum audible limit value for each band. Audio coding method.
【請求項13】 請求項11記載の音声符号化方式にお
いて、 各グループに属する各帯域毎の特性に基づいた重み付け
を、入力デジタルオーディオ信号にサブバンド分析を施
して得られる、各グループに属する各周波数帯域のサブ
バンド信号レベルに基づいた重み付けとすることを特徴
とする音声符号化方式。
13. A speech coding method according to claim 11, wherein weights based on characteristics of each band belonging to each group are obtained by subjecting an input digital audio signal to sub-band analysis. A speech coding method characterized by weighting based on a subband signal level of a frequency band.
【請求項14】 請求項11記載の音声符号化方式にお
いて、 各グループに属する各帯域毎の特性に基づいた重み付け
を、入力デジタルオーディオ信号に線形変換を施して得
られる、各グループに属するスペクトル信号レベルに基
づいた重み付けとすることを特徴とする音声符号化方
式。
14. The speech coding method according to claim 11, wherein weighting based on characteristics of each band belonging to each group is performed by performing a linear conversion on an input digital audio signal, and the spectrum signal belonging to each group is obtained. A speech coding method characterized by weighting based on levels.
【請求項15】 請求項6記載の音声符号化方式におい
て、 各グループに属する信号レベルが、所定のしきい値以上
の高レベルな信号に対しては、符号化データの高音質化
を実現可能な高効率ビット割り当て方法を用いてビット
割り当てを行い、 各グループに属する信号レベルが、所定のしきい値以下
の低レベルな信号に対しては、上記高効率ビット割り当
て方法と比較して処理量の少ない低負荷ビット割り当て
方法を用いてビット割り当てを行うことを特徴とする音
声符号化方式。
15. The audio coding method according to claim 6, wherein for a high-level signal whose signal level belonging to each group is equal to or more than a predetermined threshold value, it is possible to realize high-quality encoded data. Bit allocation is performed using a high-efficiency bit allocation method, and a signal level belonging to each group whose signal level is lower than or equal to a predetermined threshold is processed in a smaller amount than the high-efficiency bit allocation method. A voice coding method characterized in that bit allocation is performed by using a low-load bit allocation method with less noise.
【請求項16】 請求項15記載の音声符号化方式にお
いて、 上記各グループに属する信号レベルを、入力デジタルオ
ーディオ信号にサブバンド分析を施して得られるサブバ
ンド信号レベルとすることを特徴とする音声符号化方
式。
16. The audio coding method according to claim 15, wherein the signal level belonging to each group is a subband signal level obtained by performing a subband analysis on an input digital audio signal. Encoding method.
【請求項17】 請求項15記載の音声符号化方式にお
いて、 上記各グループに属する信号レベルが、入力デジタルオ
ーディオ信号に線形変換を施して得られるスペクトル信
号レベルであることを特徴とする音声符号化方式。
17. The speech coding method according to claim 15, wherein the signal level belonging to each group is a spectrum signal level obtained by performing a linear conversion on an input digital audio signal. method.
【請求項18】 請求項15記載の音声符号化方式にお
いて、 上記各グループに属する信号レベルを、所定の各帯域毎
の最小可聴限界値とすることを特徴とする音声符号化方
式。
18. The speech coding system according to claim 15, wherein the signal levels belonging to each group are set to a minimum audible limit value for each predetermined band.
【請求項19】 請求項4, 10, 15のいずれかに記
載の音声符号化方式において、 上記符号化データの高音質化を実現可能な高効率ビット
割り当て処理は、所定の聴覚心理モデルに基づく信号対
マスク比値との関係を使用して行われるビット割り当て
処理であり、 上記高効率ビット割り当て処理と比較して処理量の少な
い低負荷ビット割り当て処理は、複数の周波数帯域に分
割された信号レベルに各帯域毎の所定の最小可聴限界値
を加味して行われるビット割り当て処理であることを特
徴とする音声符号化方式。
19. The speech encoding method according to claim 4, wherein the high-efficiency bit allocation process capable of realizing high-quality sound of the encoded data is based on a predetermined psychoacoustic model. A bit allocation process performed using a relationship with a signal-to-mask ratio value. The low-load bit allocation process with a smaller processing amount compared to the high-efficiency bit allocation process is performed on a signal divided into a plurality of frequency bands. A speech coding method, which is a bit allocation process performed by adding a predetermined minimum audible limit value for each band to a level.
【請求項20】 請求項19記載の音声符号化方式にお
いて、 上記聴覚心理モデルが、MPEG(Motion Picture Exp
erts Group)によって指定された聴覚心理モデルである
ことを特徴とする音声符号化方式。
20. The audio coding method according to claim 19, wherein the psychoacoustic model is MPEG (Motion Picture Exposure).
erts Group).
【請求項21】 請求項5または請求項8記載の音声符
号化方式において、 上記オーディオ信号に復号可能な最小単位であるフレー
ムが、MPEG(Motion Picture Experts Group)によ
って指定されたフレームであることを特徴とする音声符
号化方式。
21. The audio coding method according to claim 5, wherein a frame that is a minimum unit that can be decoded into the audio signal is a frame specified by an MPEG (Motion Picture Experts Group). Characteristic speech coding method.
【請求項22】 請求項1記載の音声符号化方式におい
て、 上記ビット割り当て手段は、分割化された各帯域に対
し、所定の聴覚心理モデルから出力される情報に基づい
てビット割り当て情報を生成するものであり、 N(N=1,2,3...)フレームに1度、上記所定の聴覚
心理モデルから出力される情報に基づいてビット割り当
て情報を生成し、 上記ビット割り当て情報を生成しなかったフレームに対
しては、上記聴覚心理モデルから出力された情報と上記
分割された各帯域の信号情報に基づいてビット割り当て
情報を生成し、符号化を行なうことを特徴とする音声符
号化方式。
22. The speech coding method according to claim 1, wherein the bit allocation means generates bit allocation information for each of the divided bands based on information output from a predetermined psychoacoustic model. Generating bit allocation information once every N (N = 1, 2, 3,...) Frames based on information output from the predetermined psychoacoustic model, and generating the bit allocation information. For a frame that did not exist, bit allocation information is generated based on the information output from the psychoacoustic model and the signal information of each of the divided bands, and coding is performed. .
【請求項23】 請求項項1記載の音声符号化方式にお
いて、 段階的に処理量の制御可能な聴覚心理モデルを有し、 外部からの制御情報に基づいて、上記聴覚心理モデルの
処理量制御を行ない、所定の処理量の聴覚心理モデルを
用いて処理がなされるように、各帯域に対するビット割
り当て情報を生成することを特徴とする音声符号化方
式。
23. The speech encoding method according to claim 1, further comprising: an psychoacoustic model capable of controlling a processing amount in a stepwise manner, and a processing amount control of the psychoacoustic model based on external control information. And generating bit allocation information for each band such that processing is performed using a psychoacoustic model of a predetermined processing amount.
【請求項24】 請求項1記載の音声符号化方式におい
て、 それぞれ処理量の異なる聴覚心理モデルを複数有し、 外部からの制御情報に基づいて、上記複数の聴覚心理モ
デルの中から、所定の聴覚心理モデルを用いて処理が成
されるように、使用する聴覚心理モデルを切り替えて、
各帯域に対するビット割り当て情報を生成することを特
徴とする音声符号化方式。
24. The speech encoding method according to claim 1, comprising a plurality of psychoacoustic models each having a different processing amount, and based on control information from the outside, a predetermined psychoacoustic model is selected from the plurality of psychoacoustic models. Switch the psychoacoustic model to be used so that processing is performed using the psychoacoustic model,
A speech coding method for generating bit allocation information for each band.
【請求項25】 デジタルオーディオ信号を複数の周波
数帯域に分割し、該分割された各帯域に対するビット割
り当て情報を生成し、所定ビットレートでの伝送を目的
として各帯域毎に符号化を行なう音声符号化方式であっ
て、 符号化データストリーム中にデータを挿入するフレーム
におけるビット割り当て範囲を制御し、符号化オーディ
オデータ量を可変に制御することを特徴とする音声符号
化方式。
25. A speech code which divides a digital audio signal into a plurality of frequency bands, generates bit allocation information for each of the divided bands, and encodes each band for transmission at a predetermined bit rate. An audio encoding method, comprising: controlling a bit allocation range in a frame into which data is inserted into an encoded data stream; and variably controlling an encoded audio data amount.
【請求項26】 請求項25記載の音声符号化方式にお
いて、 外部からの制御情報に基づいて、フレーム単位でビット
割り当て範囲を制御し、符号化オーディオデータ量を可
変に制御することを特徴とする音声符号化方式。
26. The audio encoding method according to claim 25, wherein a bit allocation range is controlled in frame units based on external control information, and an encoded audio data amount is variably controlled. Audio coding method.
【請求項27】 請求項26記載の音声符号化方式にお
いて、 上記外部からの制御情報として、付加データのバッファ
を監視する監視手段からのデータ量制御情報を用いるこ
とを特徴とする音声符号化方式。
27. A speech coding method according to claim 26, wherein data control information from monitoring means for monitoring a buffer for additional data is used as said external control information. .
【請求項28】 請求項1記載の音声符号化方式におい
て、 符号化処理が実行される中央演算処理装置の性能に応じ
て、符号化処理動作前の初期化時に複数のビット割り当
て手段、または複数の聴覚心理モデルの各処理負荷値情
報を外部へ出力することを特徴とする音声符号化方式。
28. The audio coding method according to claim 1, wherein a plurality of bit allocation means or a plurality of bit allocation means are provided at the time of initialization before the encoding processing operation, depending on the performance of the central processing unit on which the encoding processing is performed. A speech encoding method for outputting each processing load value information of the psychoacoustic model of the present invention to the outside.
【請求項29】 請求項28記載の音声符号化方式にお
いて、 外部への情報として出力される複数のビット割り当て手
段、または複数の聴覚心理モデルの各処理負荷値情報
が、降順、あるいは昇順で出力されることを特徴とする
音声符号化方式。
29. The speech coding method according to claim 28, wherein a plurality of bit allocation means output as information to the outside or processing load value information of a plurality of psychoacoustic models are output in descending order or ascending order. A speech coding method characterized by being performed.
【請求項30】 映像信号,音声信号の符号化処理が同
一の中央演算処理装置にて処理がなされる音声符号化方
式において、 異なる複数の演算量で符号化を行うものであって、 上記音声信号もしくは映像信号の符号化の演算量を変更
することで、上記中央演算処理装置上での処理の全体的
な演算量を制御することを特徴とする音声符号化方式。
30. An audio encoding method in which encoding processing of a video signal and an audio signal is performed by the same central processing unit, wherein encoding is performed with a plurality of different computational amounts. An audio coding method characterized by controlling the overall calculation amount of processing on the central processing unit by changing the calculation amount of signal or video signal coding.
【請求項31】 映像信号,音声信号の符号化処理が同
一の中央演算処理装置にて処理がなされる音声符号化方
式において、 演算量の異なる複数の符号化方式を用いて符号化を行う
ものであって、 上記音声信号の符号化の符号化方式を変更することで、
上記中央演算処理装置上での処理の全体的な演算量を制
御することを特徴とする音声符号化方式。
31. An audio encoding system in which video and audio signals are encoded by the same central processing unit, wherein the encoding is performed by using a plurality of encoding systems having different arithmetic operations. By changing the encoding method of the audio signal encoding,
A speech coding system for controlling an overall operation amount of processing on the central processing unit.
【請求項32】 請求項30または31記載の音声符号
化方式において、 上記中央演算処理装置上での処理の制御を、外部からの
制御情報に基づいて行うことを特徴とする音声符号化方
式。
32. The speech coding method according to claim 30, wherein control of processing on the central processing unit is performed based on control information from outside.
【請求項33】 ディジタルオーディオ信号に対して、
時間/周波数変換を施し、量子化情報を生成することで
符号化を行う音声符号化方式であって、 それぞれ演算量の異なる複数の量子化情報算出手段を有
し、 外部からの制御情報に基づいて、上記複数の量子化情報
算出手段の中から、所定の量子化情報算出手段を選択し
て処理が行われるように、使用する量子化情報算出手段
を切り替えて量子化情報を算出して符号化を行うことを
特徴とする音声符号化方式。
33. For a digital audio signal,
A speech coding method for performing coding by performing time / frequency conversion and generating quantization information. The coding method includes a plurality of quantization information calculation units each having a different operation amount, and is based on control information from outside. The quantization information calculation means to be used is switched to calculate the quantization information by switching the quantization information calculation means to be used so that a predetermined quantization information calculation means is selected from the plurality of quantization information calculation means and the processing is performed. A speech coding method characterized by performing coding.
【請求項34】 請求項1ないし請求項33のいずれか
に記載の音声符号化方式を用いて音声符号化を行うこと
を特徴とする音声符号化装置。
34. A speech encoding apparatus that performs speech encoding using the speech encoding method according to claim 1. Description:
【請求項35】 請求項1ないし請求項33のいずれか
に記載の音声符号化方式のステップが記録されているこ
とを特徴とするデータ記録媒体。
35. A data recording medium on which is recorded the steps of the speech encoding method according to claim 1. Description:
JP16038399A 1998-06-15 1999-06-08 Audio coding method, audio coding device, and data recording medium Expired - Lifetime JP3466507B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16038399A JP3466507B2 (en) 1998-06-15 1999-06-08 Audio coding method, audio coding device, and data recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16724598 1998-06-15
JP10-167245 1998-06-15
JP16038399A JP3466507B2 (en) 1998-06-15 1999-06-08 Audio coding method, audio coding device, and data recording medium

Publications (2)

Publication Number Publication Date
JP2000078018A true JP2000078018A (en) 2000-03-14
JP3466507B2 JP3466507B2 (en) 2003-11-10

Family

ID=26486919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16038399A Expired - Lifetime JP3466507B2 (en) 1998-06-15 1999-06-08 Audio coding method, audio coding device, and data recording medium

Country Status (1)

Country Link
JP (1) JP3466507B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668299B1 (en) 2004-05-12 2007-01-12 삼성전자주식회사 Digital signal encoding/decoding method and apparatus through linear quantizing in each section
JP2010156837A (en) * 2008-12-26 2010-07-15 Fujitsu Ltd Audio encoder
JP2010197862A (en) * 2009-02-26 2010-09-09 Toshiba Corp Signal bandwidth expanding apparatus
JP2015524574A (en) * 2012-07-13 2015-08-24 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for assigning bits in an audio signal
JP2015534129A (en) * 2012-10-26 2015-11-26 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for assigning bits of an audio signal
JP2019191594A (en) * 2012-12-13 2019-10-31 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Sound encoder, sound decoder, sound encoding method, and sound decoding method

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100668299B1 (en) 2004-05-12 2007-01-12 삼성전자주식회사 Digital signal encoding/decoding method and apparatus through linear quantizing in each section
US7983346B2 (en) 2004-05-12 2011-07-19 Samsung Electronics Co., Ltd. Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US8149927B2 (en) 2004-05-12 2012-04-03 Samsung Electronics Co., Ltd. Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP2010156837A (en) * 2008-12-26 2010-07-15 Fujitsu Ltd Audio encoder
JP2010197862A (en) * 2009-02-26 2010-09-09 Toshiba Corp Signal bandwidth expanding apparatus
US8271292B2 (en) 2009-02-26 2012-09-18 Kabushiki Kaisha Toshiba Signal bandwidth expanding apparatus
JP2015524574A (en) * 2012-07-13 2015-08-24 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for assigning bits in an audio signal
US9424850B2 (en) 2012-07-13 2016-08-23 Huawei Technologies Co., Ltd. Method and apparatus for allocating bit in audio signal
JP2017107224A (en) * 2012-07-13 2017-06-15 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for allocating bits in audio signal
JP2015534129A (en) * 2012-10-26 2015-11-26 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for assigning bits of an audio signal
US9530420B2 (en) 2012-10-26 2016-12-27 Huawei Technologies Co., Ltd. Method and apparatus for allocating bits of audio signal
JP2017138614A (en) * 2012-10-26 2017-08-10 華為技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for allocating bits of audio signal
US9972326B2 (en) 2012-10-26 2018-05-15 Huawei Technologies Co., Ltd. Method and apparatus for allocating bits of audio signal
JP2019191594A (en) * 2012-12-13 2019-10-31 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Sound encoder, sound decoder, sound encoding method, and sound decoding method
JP2022050609A (en) * 2012-12-13 2022-03-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Audio-acoustic coding device, audio-acoustic decoding device, audio-acoustic coding method, and audio-acoustic decoding method

Also Published As

Publication number Publication date
JP3466507B2 (en) 2003-11-10

Similar Documents

Publication Publication Date Title
KR100548891B1 (en) Audio coding apparatus and method
JPH0591061A (en) Audio signal processing meth0d
JP5175028B2 (en) Digital signal encoding method and apparatus, and decoding method and apparatus
JP2002196792A (en) Audio coding system, audio coding method, audio coder using the method, recording medium, and music distribution system
JP2002023799A (en) Speech encoder and psychological hearing sense analysis method used therefor
JP2001343997A (en) Method and device for encoding digital acoustic signal and recording medium
JP2002533790A (en) Adaptive bit allocator and audio encoder
KR100750115B1 (en) Method and apparatus for encoding/decoding audio signal
JP4628861B2 (en) Digital signal encoding method using a plurality of lookup tables, digital signal encoding apparatus, and a plurality of lookup table generation methods
JP3466507B2 (en) Audio coding method, audio coding device, and data recording medium
JP2000151413A (en) Method for allocating adaptive dynamic variable bit in audio encoding
JP3371462B2 (en) Audio signal recording / playback device
JP3481918B2 (en) Audio signal encoding / decoding device
JP2001249699A (en) Sound compression device
JPH06289900A (en) Audio encoding device
JPH06291671A (en) Encoding method for digital audio signal
JP2002534039A (en) Apparatus and method for effectively achieving a fixed masking threshold in an audio encoding device
JPH0750589A (en) Sub-band coding device
KR0152016B1 (en) Encoding and decoding system using variable bit allocation
JP2003280697A (en) Method and apparatus for compressing audio
KR100590340B1 (en) Digital audio encoding method and device thereof
JP2001242895A (en) Audio encode device and audio encode method
JPH1093441A (en) Digitized audio signal encoding method and its device
JP2003280695A (en) Method and apparatus for compressing audio
JP2000295110A (en) Audio signal encoder

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R150 Certificate of patent or registration of utility model

Ref document number: 3466507

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070829

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100829

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term