JP3329216B2 - 音声符号化装置及び音声復号装置 - Google Patents
音声符号化装置及び音声復号装置Info
- Publication number
- JP3329216B2 JP3329216B2 JP01247797A JP1247797A JP3329216B2 JP 3329216 B2 JP3329216 B2 JP 3329216B2 JP 01247797 A JP01247797 A JP 01247797A JP 1247797 A JP1247797 A JP 1247797A JP 3329216 B2 JP3329216 B2 JP 3329216B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoding
- circuit
- audio
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005284 excitation Effects 0.000 claims description 49
- 230000005236 sound signal Effects 0.000 claims description 31
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 238000003786 synthesis reaction Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 230000004913 activation Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 33
- 238000013139 quantization Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
たパラメータで高品質に符号化する音声符号化装置及び
音声復号装置(以下音声符号化復号装置と呼ぶ)に関す
る。
符号化復号装置として、例えば、CDMA(Code
Division Multiple Access)
システムに用いられている“Enhanced Var
iable Rate Codec,Speech S
ervice Option 3 for Wideb
and Spread Spectrum Digit
al Systems”(IS−127,TIA.TR
45)と題した標準化勧告仕様書(文献1)に記載され
た装置(方式)が知られている。
ットレートを決定して、この決定結果に応じて予め定め
られたテーブルからCELP(Code Excite
dLinear Prediction)符号化方式の
制御パラメータを設定する。そして、設定制御パラメー
タに応じて入力信号を符号化している。さらに、この方
式では、ビットレートを外部信号により強制的に設定す
る機能も備えられている。
符号化復号装置について概説する。図11に示す音声符
号化復号装置では、外部信号に応じてビットレートを制
御している。
置及び音声復号装置を備えており、音声符号化装置及び
音声復号装置にはそれぞれ符号化パラメータ制御回路5
1及び55が備えられている。音声符号化装置では、符
号化パラメータ制御回路51にビットレートが与えら
れ、符号化パラメータ制御回路51は、CELP符号化
回路52の動作を制御する制御パラメータが複数記載さ
れたテーブル(図示せず:例えば、ビットレートをアド
レスとするROM(Read Only Memor
y))を参照してビットレートに対応する制御パラメー
タを選択して、この制御パラメータをCELP符号化回
路52に出力する。制御パラメータは、CELP符号化
における励振信号符号化の処理単位であるサブフレーム
長及びビット配分である。
力音声信号)が与えられており、CELP符号化回路5
2では入力信号を予め定められたフレーム毎に線形予測
分析して、音声信号のスペクトル包絡特性を表す線形予
測係数を算出する。そして、そのスペクトル包絡特性に
対応する線形予測合成フィルタを駆動して励振信号を算
出し、励振信号をそれぞれビット配分に従って符号化す
る。そして、励振信号の符号化はフレームをさらにサブ
フレームに分割してサブフレーム毎に行なわれる。この
サブフレーム長は前述のようにして符号化パラメータ制
御回路51により設定される。
を表す周期成分と残りの残差成分とそれらのゲインとに
よって構成される。入力信号のピッチ周期を表す周期成
分は、適応コードブックと呼ばれる過去の励振信号を保
持するコードブックに格納された適応コードベクトルと
して表され、残差成分は、例えば、J−P.Adoul
氏らによる“Fast CELP coding ba
sed on algebraic codes”(P
roc.ICASSP,pp.1957−1960,1
987年)と題した論文(文献2)に記載されたマルチ
パルス信号として表される。そして、適応コードベクト
ルとマルチパルス信号をゲインコードブックに保持され
たゲインによって重み付け加算して励振信号を生成す
る。なお、再生信号は励振信号で線形予測合成フィルタ
を駆動することによって合成することができる。
ス信号、及びゲインを選択する際には、再生信号と入力
信号との間の誤差信号を聴感重み付けした上での誤差電
力が最小となるように選択制御が行われる。そして、C
ELP符号化回路52では適応コードベクトル、マルチ
パルス信号、及びゲインに対応するインデックスと線形
予測係数に対応するインデックスとをマルチプレクサ5
3に出力する。
ル、マルチパルス信号、及びゲインに対応するインデッ
クスと線形予測係数に対応するインデックスとをフレー
ム毎にビットストリームに変換して出力する。なお、ビ
ットレートを表す情報はビットストリームのヘッダ部分
に格納される。
ビットストリームを受けると、ビットストリームのヘッ
ダ部分に存在するビットレートを表す情報を抽出して、
符号化パラメータ制御回路55に出力した後、フレーム
毎にビットストリームから適応コードベクトル、マルチ
パルス信号、及びゲインに対応するインデックスと線形
予測係数に対応するインデックスとを抽出し、CELP
復号回路56に出力する。
化パラメータ制御回路51と同様の処理を行い、入力さ
れたビットレート情報に応じて制御パラメータを選択し
て、CELP復号回路56に出力する。
クトル、マルチパルス信号、及びゲインに対応するイン
デックスと線形予測係数に対応するインデックスを用い
るとともにサブフレーム長及びビットレートとを用い
て、復号処理を行なう。励振信号は、適応コードベクト
ル及びマルチパルス信号をゲインコードブックに保持さ
れたゲインで重み付け加算するして得られる。そして、
CELP復号回路56では励振信号で線形予測合成フィ
ルタを駆動して再生信号をとして再生する。
て、ビットレートを制御する際には、励振信号符号化の
処理単位であるサブフレーム長及びビット配分を制御し
てビットレートを制御する。
符号化復号装置では、符号化処理単位であるフレーム長
が固定値であるため、入力信号サンプルが最初に入力さ
れてから符号化処理が始まるまでの時間として定義され
る符号化遅延を制御することができないという問題点が
ある。
マルチパルス信号を生成するために必要なパラメータを
予め備えておく必要があり、このため、予め設定された
ビットレートにしか対応できないという問題点がある。
声信号の励振信号を複数のパルスから成るマルチパルス
信号で表して前記励起信号によって前記入力音声信号の
線形予測係数で規定された線形予測合成フィルタを励振
して得られる再生音声信号と前記入力音声信号との間の
歪みを最小化するように前記励起信号を決定する音声符
号化手段を有する音声符号化装置であって、指定された
ビットレートと符号化遅延とを制御情報として受け該制
御情報に応じて制御パラメータを生成する制御回路と、
前記制御パラメータのうち予め定められたパラメータが
与えられ該予め定められたパラメータに応じて前記マル
チパルス信号の符号化に必要なパラメータを設定パラメ
ータとして設定する設定回路とを備えており、前記音声
符号化手段は前記制御パラメータ及び前記設定パラメー
タに基づいて前記入力音声信号を符号化するようにした
ことを特徴とする音声符号化装置が得られる。
タを受け、前記符号化音声データから再生音声信号を再
生する音声復号装置であって、前記符号化音声データは
音声信号の励振信号及び線形予測合成フィルタ係数を有
するとともにビットレート及び符号化遅延を含み、前記
励振信号は複数のパルスから成るマルチパルス信号で表
されており、前記ビットレート及び前記符号化遅延に基
づいて制御パラメータを生成する制御回路と、前記制御
パラメータのうち予め定められたパラメータが与えられ
該予め定められたパラメータに応じて前記マルチパルス
信号の符号化に必要なパラメータを設定パラメータとし
て設定する設定回路と、前記制御パラメータ及び前記設
定パラメータに基づいて前記符号化音声データから前記
励振信号と前記線形予測合成フィルタ係数を復号して前
記励起信号に応じて前記線形予測合成フィルタ係数で規
定される線形予測合成フィルタを励振して前記再生音声
信号を再生する復号手段とを有することを特徴とする音
声復号装置が得られる。
は、指定されたビットレートと符号化遅延で符号化する
ために必要なフレーム長とサブフレーム長とビット配分
とを制御パラメータとして生成する符号化パラメータ制
御回路を備えており、設定されたフレーム長で入力音声
信号をフレームに分割する。そして、マルチパルス生成
パラメータ設定回路では指定されたビットレートと符号
化遅延からマルチパルス信号を生成するために必要なパ
ラメータを設定する。
サブフレーム長とビット配分とを生成し、このフレーム
長に応じて入力音声信号をフレームに分割しているか
ら、符号化処理単位であるフレーム長を可変にできる。
このため、ビットレートに加えて符号化遅延も制御でき
ることになる。
回路において、マルチパルス信号を生成するためのパラ
メータを設定することにより、指定できるビットレート
の自由度が増加する。このため、対応できるビットレー
トを予め設定する必要がない。
て説明する。
置は音声符号化装置及び音声復号装置を有しており、音
声符号化装置は符号化パラメータ制御回路11、CEL
P符号化回路12、及びマルチプレクサ13を備えてい
る。一方、音声復号装置はデマルチプレクサ14、符号
化パラメータ制御回路15、及びCELP復号回路16
を備えている。
タ制御回路11にはビットレート及び符号化遅延が制御
情報として与えられ、これらビットレートと符号化遅延
とからCELP符号化における分析処理に必要な先読み
長を引いてフレーム長を算出する。例えば、符号化遅延
が25msで、線形予測分析の先読み長が5msの場
合、フレーム長は20msとなる。
は、算出したフレーム長に基づいてCELP符号化回路
12の動作を制御する制御パラメータが複数記載された
テーブルの中から入力ビットレートに応じて制御パラメ
ータを選択し、CELP符号化回路12に出力する。制
御パラメータは、フレーム長とサブフレーム長(例え
ば、5ms)とビット配分である。CELP符号化回路
12には入力信号(入力音声信号)が与えられ、設定さ
れたフレーム長、サブフレーム長、及びビット配分に従
って入力信号を符号化する。
回路12の動作を説明する。
定されたフレーム長(F)は、入力端子213を介して
フレーム分割回路201及び線形予測係数量子化回路2
04に入力される。
って設定されサブフレーム長(S)は、入力端子214
を介してサブフレーム分割回路202、線形予測分析回
路203、線形予測係数量子化回路204、聴感重み付
け信号作成回路205、聴感重み付け再生信号作成回路
206、ターゲット信号作成回路208、適応コードブ
ック探索回路209、マルチパルス探索回路210、及
びゲイン探索回路211に入力される。
よって設定された各パラメータへのビット配分は、入力
端子215を介して線形予測係数量子化回路204、適
応コードブック探索回路209、マルチパルス探索回路
210、及びゲイン探索回路211に入力される。
長(F)に応じて入力信号をフレーム毎に分割して、つ
まり、フレーム毎にサブフレーム分割回路202に出力
する。
フレーム長(S)に応じてフレームをさらに分割してサ
ブフレームとし、このサブフレームを線形予測分析回路
203及び聴感重み付け信号作成回路205に出力す
る。
分割回路202から与えられた信号(サブフレーム信
号)を設定サブフレーム長(S)に基づいてサブフレー
ム毎に線形予測分析して、線形予測係数a(i),i=
1,…,Npを線形予測係数量子化回路204、聴感重
み付け信号作成回路205、聴感重み付け再生信号作成
回路206、適応コードブック探索回路209、及びマ
ルチパルス探索回路210に出力する。ここで、Npは
線形予測分析の次数であり、例えば、10である。線形
予測分析法には、自己相関法、共分散法があり、例え
ば、古井による“ディジタル音声処理”と題された文献
(東海大学出版会)(文献3)に詳説されている。
フレーム毎に得られた線形予測係数を設定フレーム長
(F)及び設定サブフレーム長(S)に応じてフレーム
で一括して量子化する。この際、ビットレートを低減す
るために、例えば、フレーム内の最後のサブフレームで
量子化を行ない、他のサブフレームの量子化値は、当該
フレーム及び直前のフレームの量子化値の補間値を用い
る手法が利用される。そして、この量子化及び補間は、
線形予測係数を線スペクトル対(以後、LSPとする)
に変換した後行なわれる。なお、線形予測係数からLS
Pへの変換は、例えば、菅村他による“線スペクトル対
(LSP)音声分析合成方式による音声情報圧縮”と題
された論文(電子通信学会論文誌、J64−A、pp.
599−606、1981年)(文献4)に記載されて
いる。また、LSPの量子化法は、周知の手法を用いる
ことができる。例えば、LSPの量子化法については、
特開平4−171500号公報(文献5)に記載されて
いるので、ここでは説明を省略する。線形予測係数量子
化回路204では、量子化LSPを線形予測係数に変換
し、量子化線形予測係数a′(i),i=1,…,Np
として聴感重み付け信号作成回路205、聴感重み付け
再生信号作成回路206、適応コードブック探索回路2
09、及びマルチパルス探索回路210とに出力する。
は出力端子216を介してマルチプレクサ13に出力さ
れる。なお、線形予測合成フィルタHs(z)は、数1
で表される。
用いて、数2で表される聴感重み付けフィルタHw
(z)を構成し、サブフレーム内の入力信号で聴感重み
付けフィルタを駆動して、聴感重み付け信号を作成す
る。そして、この聴感重み付け信号をターゲット信号作
成回路208に出力する。
係数である。例えば、R1=0.6、R2=0.9であ
る。
は、サブフレームバッファ207を介して得られる一つ
前のサブフレームの励振信号を用いて同回路内で保持し
た一つ前のサブフレームの線形予測合成フィルタと聴感
重み付け合成フィルタとを駆動して、駆動後の両フィル
タの状態をターゲット信号作成回路208に出力する。
重み付け再生信号作成回路206から得られた線形予測
合成フィルタ及び聴感重み付けフィルタの状態を入力
し、両フィルタを継続接続したフィルタの零入力応答を
作成して、聴感重み付け信号から減算した後、ターゲッ
ト信号として適応コードブック探索回路209、マルチ
パルス探索回路210、及びゲイン探索回路211に出
力する。
ブフレームバッファ207を介して得られる一つ前のサ
ブフレームの励振信号によって適応コードブックと呼ば
れる過去の励振信号を保持するコードブックを更新した
後、適応コードブックからピッチdに対応する適応コー
ドベクトルを選択する。ここで、ピッチdがサブフレー
ム長よりも短い場合には、適応コードブックに格納され
た過去の励振信号から遅れdのセグメントを切り出し、
サブフレーム長になるまで繰り返し接続して適応コード
ベクトルを作成する。そして、作成した適応コードベク
トル信号Ad(n)を用いて、線形予測合成フィルタと
聴感重み付けフィルタを零状態で駆動して、再生信号S
Ad(n)を作成し、数3で表されるターゲット信号X
(n)と再生信号SAd(n)との誤差Edを最小とす
るピッチdを選択する。
定されたサブフレーム長である。さらに、適応コードブ
ック探索回路209は、選択されたピッチdを出力端子
216を介してマルチプレクサ13に出力するとともに
選択された適応コードベクトル信号Ad(n)及びその
再生信号SAd(n)をゲイン探索回路211に出力す
る。また、適応コードブック探索回路209は、再生信
号SAd(n)をゲイン探索回路211に出力するとと
もに再生信号SAd(n)をマルチパルス探索回路21
0に出力する。
パルス信号を複数個の非零のパルスから構成する。ここ
で、各パルスは、パルス毎に予め定められたパルス位置
候補から選択される。各パルスの振幅は、極性のみであ
る。例えば、8kHzサンプリングでサブフレーム長が
5msの場合(N=40サンプル)、マルチパルス励振
信号をP(例えば、5)個のパルスから構成する。P個
のパルスは、それぞれ予め定められたM(p),p=
0,…,P−1(例えば、各8)個のパルス候補位置か
ら選択される。マルチパルス探索回路210は、パルス
数Pと各パルスのM(p)個のパルス候補位置とを組合
せたものを復数個保持しており、符号化パラメータ制御
回路11によって指定されたビット配分に応じてパルス
数Pと各パルスのM(p)個のパルス候補位置との組合
せを選択する。選択したパルス数P(チャンネル数に等
しい)と各チャンネルのM個のパルス候補位置を用い
て、マルチパルス信号Cj(n)を作成し、数4を最小
化するマルチパルス信号Cj(n)を選択する。
コードベクトルの再生信号SAd(n)を減算した信号
であり、数5で与えられる。
18071号明細書(文献6)に記載された手法を用い
演算量を低減する。さらに、マルチパルス探索回路21
0は、選択されたマルチパルス信号Cj(n)及びその
再生信号SCj(n)をゲイン探索回路211に出力す
るとともに対応するインデックスjを出力端子216を
介してマルチプレクサ13に出力する。
コードベクトルの再生信号SAd(n)、マルチパルス
の再生信号SCj(n)、及びターゲット信号X(n)
を用いて、数6を最小化するようにゲインGA、GCを
量子化する。
ン、適応コードベクトル、及びマルチパルス信号を用い
て励振信号を作成して、励振信号をサブフレームバッフ
ァ207を介して聴感重み付け再生信号作成回路206
及び適応コードブック探索回路209に出力し、ゲイン
に対応するインデックスkを出力端子216を介してマ
ルチプレクサ13に出力する。
3では、量子化LSPを表すインデックス、ピッチとマ
ルチパルス信号のインデックス、及び量子化ゲインを表
すインデックスをフレーム毎にビットストリームに変換
して出力する。なお、ビットレートと符号化遅延を表す
情報は、ビットストリームのヘッダ部分に格納される。
14には、ビットストリームが与えられ、デマルチプレ
クサ14では、ビットストリームのヘッダ部分に存在す
るビットレートと符号化遅延とを表す情報を符号化パラ
メータ制御回路15に出力した後、フレーム毎にビット
ストリームから量子化LSPを表すインデックス、ピッ
チとマルチパルス信号のインデックス、及び量子化ゲイ
ンを表すインデックスを抽出して、CELP復号回路1
6に出力する。
側の符号化パラメータ制御回路11と同様の動作を行
い、入力されたビットレートと符号化遅延に応じて制御
パラメータを選択して、CELP復号回路16に出力す
る。
動作について説明する。
とマルチパルス信号のインデックス、及び量子化ゲイン
を表すインデックスは、入力端子227を介して線形予
測係数復号回路221、適応コードブック復号回路22
2、マルチパルス復号回路223、及びゲイン復号回路
224に入力される。
定されたフレーム長は、入力端子228を介して線形予
測係数復号回路221及びフレーム統合回路226に入
力される。
定されたサブフレーム長は、入力端子229を介して線
形予測係数復号回路221、適応コードブック復号回路
222、マルチパルス復号回路223、ゲイン復号回路
224、再生信号作成回路225、及びフレーム統合回
路226に入力される。
定されたビット配分は、入力端子230を介して線形予
測係数復号回路221、適応コードブック復号回路22
2、マルチパルス復号回路223、及びゲイン復号回路
224に入力される。
LSPを表すインデックスをフレーム毎に入力して、サ
ブフレーム毎に量子化線形予測係数a′(i),i=
1,…,Npを復号し、再生信号合成回路225に出力
する。
ブフレーム毎に入力したピッチから適応コードベクトル
を復号して、ゲイン復号回路224に出力する。マルチ
パルス復号回路223では、サブフレーム毎に入力した
インデックスからマルチパルス信号を復号して、ゲイン
復号回路224に出力する。
毎に入力したインデックスからゲインを復号して、適応
コードベクトル、マルチパルス信号、及びゲインを用い
て励振信号を作成して、再生信号合成回路225に出力
する。
ム毎に励振信号で線形予測合成フィルタHs(z)を駆
動して再生信号を作成し、フレーム統合回路226に出
力する。なお、線形予測合成フィルタHs(z)は、前
述の数1で表される。フレーム統合回路226は、サブ
フレーム毎に入力される再生信号をフレーム長分繋げて
フレーム毎に出力する。
復号装置の他の例について説明する。
置及び音声復号装置を有しており、音声符号化装置は符
号化パラメータ制御回路31、CELP符号化回路3
2、マルチパルス符号化パラメータ設定回路33、及び
マルチプレクサ13を備えている。一方、音声復号装置
はデマルチプレクサ14、符号化パラメータ制御回路3
4、CELP復号回路35、及びマルチパルス符号化パ
ラメータ設定回路16を備えている。
タ制御回路31は、ビットレートと符号化遅延とを制御
情報として受け、入力されたビットレートと符号化遅延
とからCELP符号化における分析処理に必要な先読み
長を引いてフレーム長を算出する。また、算出したフレ
ーム長に基づいてCELP符号化回路32の動作を制御
する制御パラメータが複数記載されたテーブルの中から
入力されたビットレートに応じて制御パラメータを選択
して、CELP符号化回路32に出力する。制御パラメ
ータは、フレーム長、サブフレーム長、及びビット配分
である。さらに、符号化パラメータ制御回路31は、サ
ブフレーム長及びマルチパルス信号に配分されたビット
数をマルチパルス生成パラメータ設定回路33に出力す
る。
では、入力したサブフレーム長Nとマルチパルス信号の
ビット数Yとからマルチパルス励振信号の符号化に必要
なパルス数P、各パルスのパルス候補位置数M(p)、
及びその候補位置を数7及び数8を満たすように算出す
る。ここで、各パルスのパルス候補位置は、前述の文献
2に記載されているように、数列0,2,3,…,N−
1をパルス数Pでインターリブした形で設定する。例え
ば、サブフレーム長が40サンプル(N=40)、マル
チパルス信号のビット数が20ビット(Y=20)の場
合、パルス数Pは5、パルス候補位置数M(p)は8と
なる。この際のパルス候補位置の例を表1に示す。
31によって設定されたフレーム長、サブフレーム長、
及びビット配分と、マルチパルス生成パラメータ設定回
路33で設定されたパルス数P、各パルスのパルス候補
位置数M(p)、及びその候補位置とに基づいて入力信
号を符号化する。
の動作について説明する。
明したCELP符号化回路と比べてマルチパルス探索回
路の動作のみが異なっている。従って、ここでは、マル
チパルス探索回路401の動作についてのみ説明する。
217を介してマルチパルス生成パラメータ設定回路3
3で設定されたパルス数Pと各パルスのM(p)個のパ
ルス候補位置とを入力し、マルチパルス信号Cj(n)
を作成して、前述の数4を最小化するマルチパルス信号
Cj(n)を選択する。なお、前述のように、数4の最
小化の際には、文献6に記載の手法を用いることによっ
てその演算量を低減できる。
択されたマルチパルス信号Cj(n)及びその再生信号
SCj(n)をゲイン探索回路211に出力するととも
に対応するインデックスjを出力端子216を介してマ
ルチプレクサ13に出力する。そして、図1に関連して
説明したようにして、マルチプレクサ13はビットスト
リームを出力する。
ビットストリームはデマルチプレクサ14で受信され
る。そして、図1に関連して説明したように、デマルチ
プレクサ14は、ビットストリームのヘッダ部分に存在
するビットレートと符号化遅延とを表す情報を符号化パ
ラメータ制御回路34に出力した後、フレーム毎にビッ
トストリームから量子化LSPを表すインデックス、ピ
ッチとマルチパルス信号のインデックス、及び量子化ゲ
インを表すインデックスを抽出して、CELP復号回路
35に出力する。
パラメータ制御回路31と同様の動作を行って、制御パ
ラメータを選択して、CELP復号回路35に出力す
る。
は、符号化側のマルチパルス生成パラメータ設定回路3
3と同様の動作を行って、マルチパルス励振信号を表す
パルス数、各パルスのパルス候補位置数、及びその候補
位置とを算出して、CELP復号回路35に出力する。
動作について説明する。
したCELP復号回路と比べて、マルチパルス復号回路
の動作のみが異なっている。従って、ここでは、マルチ
パルス復号回路402の動作についてのみ説明する。
ラメータ制御回路34によって設定されたサブフレーム
長を入力端子229を介して入力し、マルチパルス生成
パラメータ設定回路36で設定されたパルス数、各パル
スのパルス候補位置数、及びその候補位置を入力端子2
32を介して入力して、サブフレーム毎に入力したイン
デックスからマルチパルス信号を復号する。
装置のさらに他の例について説明する。
タ制御回路61、CELP符号化回路62、及びマルチ
プレクサ13を備えている。符号化パラメータ制御回路
61は、図1で説明した符号化パラメータ制御回路11
と同様な動作を行い、入力されたビットレート及び符号
化遅延からフレーム長、サブフレーム長、及びビット配
分を設定する。さらに、符号化パラメータ制御回路61
では入力された演算量からマルチパルス信号の符号化に
費やせる演算量であるマルチパルス符号化許容演算量を
算出する。これは、予め他のパラメータの符号化に必要
な演算量を記憶しておき、入力された演算量からこれら
の値を差し引くことにより算出できる。符号化パラメー
タ制御回路61は、フレーム長、サブフレーム長、及び
ビット配分とマルチパルス符号化許容演算量とを制御パ
ラメータとしてCELP符号化回路62に出力する。
ム長、サブフレーム長、及びビット配分とマルチパルス
符号化許容演算量とに従って入力信号を符号化する。
の動作について説明する。
明したCELP符号化装置と比べて、マルチパルス探索
回路の動作のみが異なっている。従って、ここでは、マ
ルチパルス探索回路301についてのみ説明する。
明したマルチパルス探索回路210と同様な動作を行っ
て、前述の数4を最小化するマルチパルス信号Cj
(n)を選択する。この際に、マルチパルス信号の符号
化に費やす演算量が入力端子218を介して入力された
マルチパルス符号化許容演算量を越えないように予備選
択を行なう。この予備選択は、数9で表されるElの値
が大きいものを選択することにより実現できる。
チパルス信号Cj(n)及びその再生信号SCj(n)
をゲイン探索回路211に出力するとともに対応するイ
ンデックスjを出力端子216を介してマルチプレクサ
13に出力する。
装置のさらに他の例について説明する。
タ制御回路71、マルチパルス生成パラメータ設定回路
33、及びCELP符号化回路72、及びマルチプレク
サ13を備えている。
説明した符号化パラメータ制御回路31と同様な動作を
行い、入力されたビットレートと符号化遅延とからフレ
ーム長、サブフレーム長、及びビット配分を設定する。
さらに、符号化パラメータ制御回路71は、入力された
演算量からマルチパルス信号の符号化に費やせる演算量
であるマルチパルス符号化許容演算量を算出する。そし
て、符号化パラメータ制御回路71は、フレーム長、サ
ブフレーム長、及びビット配分とマルチパルス符号化許
容演算量とをCELP符号化回路72に出力する。さら
に、符号化パラメータ制御回路71は、サブフレーム長
とマルチパルス信号に配分されたビット数とをマルチパ
ルス生成パラメータ設定回路33に出力する。
ータ制御回路71によって設定されたフレーム長、サブ
フレーム長、及びビット配分とマルチパルス符号化許容
演算量と、マルチパルス生成パラメータ設定回路33で
設定されたパルス数P、各パルス候補位置数M(p)、
及びその候補位置とに応じて入力信号を符号化する。
2の動作について説明する。
明したCELP符号化装置と比べてマルチパルス探索回
路の動作のみが異なっている。従って、ここでは、マル
チパルス探索回路501の動作についてのみ説明する。
明したマルチパルス探索回路401と同様な動作を行
い、数4を最小化するマルチパルス信号Cj(n)を選
択する。この際に、マルチパルス信号の符号化に費やす
演算量が入力端子218を介して入力されたマルチパル
ス符号化許容演算量を越えないように予備選択を行な
う。また、マルチパルス探索回路501は、選択された
マルチパルス信号Cj(n)及びその再生信号SCj
(n)をゲイン探索回路211に出力するとともに対応
するインデックスjを出力端子216を介してマルチプ
レクサ13に出力する。
化処理単位であるフレーム長を可変にしてマルチパルス
信号の符号化に必要なパラメータを指定されたビットレ
ート及び符号化遅延に基づいて生成するようにしたか
ら、ビットレートだけでなく符号化遅延や演算量も制御
できるという効果がある。従って、本発明によれば、テ
レビ会議システムなどで符号化遅延をできる限り短くし
たい場合又は音声メールなどの符号化遅延よりもビット
レートをできる限り少なくしたい場合にも、同一の符号
化復号装置で対応できるため、符号化復号装置の規模を
小さくできる。
示すブロック図である。
のブロック図である。
ブロック図である。
示すブロック図である。
のブロック図である。
ブロック図である。
ブロック図である。
のブロック図である。
ブロック図である。
めのブロック図である。
ック図である。
Claims (8)
- 【請求項1】入力音声信号の励振信号を複数のパルスで
表して前記励振信号によって前記入力音声信号の線形予
測係数で規定された線形予測合成フィルタを励振して得
られる再生音声信号と前記入力音声信号との間の歪みを
最小化するように前記励振信号を決定する音声符号化手
段を有する音声符号化装置であって、 指定されたビットレートと符号化遅延とを制御情報とし
て受け該制御情報に応じて制御パラメータを生成する制
御回路を備えており、前記音声符号化手段は前記制御パ
ラメータに応じて前記入力音声信号を符号化するように
したことを特徴とする音声符号化装置。 - 【請求項2】入力音声信号の励振信号を複数のパルスか
ら成るマルチパルス信号で表して前記励振信号によって
前記入力音声信号の線形予測係数で規定された線形予測
合成フィルタを励振して得られる再生音声信号と前記入
力音声信号との間の歪みを最小化するように前記励振信
号を決定する音声符号化手段を有する音声符号化装置で
あって、 指定されたビットレートと符号化遅延とを制御情報とし
て受け該制御情報に応じて制御パラメータを生成する制
御回路と、前記制御パラメータのうち予め定められたパ
ラメータが与えられ該予め定められたパラメータに応じ
て前記マルチパルス信号の符号化に必要なパラメータを
設定パラメータとして設定する設定回路とを備えてお
り、前記音声符号化手段は前記制御パラメータ及び前記
設定パラメータに基づいて前記入力音声信号を符号化す
るようにしたことを特徴とする音声符号化装置。 - 【請求項3】入力音声信号の励振信号を複数のパルスで
表して前記励振信号によって前記入力音声信号の線形予
測係数で規定された線形予測合成フィルタを励振して得
られる再生音声信号と前記入力音声信号との間の歪みを
最小化するように前記励振信号を決定する音声符号化手
段を有する音声符号化装置であって、 指定されたビットレート、符号化遅延、及び演算量を制
御情報として受け該制御情報に応じて制御パラメータを
生成する制御回路を備えており、前記音声符号化手段は
前記制御パラメータに応じて前記入力音声信号を符号化
するようにしたことを特徴とする音声符号化装置。 - 【請求項4】入力音声信号の励振信号を複数のパルスか
ら成るマルチパルス信号で表して前記励振信号によって
前記入力音声信号の線形予測係数で規定された線形予測
合成フィルタを励振して得られる再生音声信号と前記入
力音声信号との間の歪みを最小化するように前記励振信
号を決定する音声符号化手段を有する音声符号化装置で
あって、 指定されたビットレート、符号化遅延、及び演算量を制
御情報として受け該制御情報に応じて制御パラメータを
生成する制御回路と、前記制御パラメータのうち予め定
められたパラメータが与えられ該予め定められたパラメ
ータに応じて前記マルチパルス信号の符号化に必要なパ
ラメータを設定パラメータとして設定する設定回路とを
備えており、前記音声符号化手段は前記制御パラメータ
及び前記設定パラメータに基づいて前記入力音声信号を
符号化するようにしたことを特徴とする音声符号化装
置。 - 【請求項5】符号化音声データを受け、前記符号化音声
データから再生音声信号を再生する音声復号装置であっ
て、 前記符号化音声データは音声信号の励振信号及び線形予
測合成フィルタ係数を有するとともにビットレート及び
符号化遅延を含んでおり、前記ビットレート及び前記符
号化遅延に基づいて制御パラメータを生成する制御回路
と、 前記制御パラメータに応じて前記符号化音声データから
前記励振信号と前記線形予測合成フィルタ係数を復号し
て前記励振信号に応じて前記線形予測合成フィルタ係数
で規定される線形予測合成フィルタを励振して前記再生
音声信号を再生する復号手段とを有することを特徴とす
る音声復号装置。 - 【請求項6】請求項1又は請求項3に記載された音声符
号化装置と請求項5に記載された音声復号装置とを有す
ることを特徴とする音声符号化復号装置。 - 【請求項7】符号化音声データを受け、前記符号化音声
データから再生音声信号を再生する音声復号装置であっ
て、 前記符号化音声データは音声信号の励振信号及び線形予
測合成フィルタ係数を有するとともにビットレート及び
符号化遅延を含み、前記励振信号は複数のパルスから成
るマルチパルス信号で表されており、前記ビットレート
及び前記符号化遅延に基づいて制御パラメータを生成す
る制御回路と、前記制御パラメータのうち予め定められ
たパラメータが与えられ該予め定められたパラメータに
応じて前記マルチパルス信号の符号化に必要なパラメー
タを設定パラメータとして設定する設定回路と、 前記制御パラメータ及び前記設定パラメータに基づいて
前記符号化音声データから前記励振信号と前記線形予測
合成フィルタ係数を復号して前記励振信号に応じて前記
線形予測合成フィルタ係数で規定される線形予測合成フ
ィルタを励振して前記再生音声信号を再生する復号手段
とを有することを特徴とする音声復号装置。 - 【請求項8】請求項2又は請求項4に記載された音声符
号化装置と請求項7に記載された音声復号装置とを有す
ることを特徴とする音声符号化復号装置。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01247797A JP3329216B2 (ja) | 1997-01-27 | 1997-01-27 | 音声符号化装置及び音声復号装置 |
CA002228183A CA2228183C (en) | 1997-01-27 | 1998-01-27 | Speech coder/decoder |
EP98101335A EP0855699B1 (en) | 1997-01-27 | 1998-01-27 | Multipulse-excited speech coder/decoder |
DE1998623398 DE69823398T2 (de) | 1997-01-27 | 1998-01-27 | Mehrimpuls-angeregter Sprachkodierer/-dekodierer |
US09/795,386 US7024355B2 (en) | 1997-01-27 | 2001-02-28 | Speech coder/decoder |
US10/632,974 US7076424B2 (en) | 1997-01-27 | 2003-08-04 | Speech coder/decoder |
US11/209,802 US7251598B2 (en) | 1997-01-27 | 2005-08-24 | Speech coder/decoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP01247797A JP3329216B2 (ja) | 1997-01-27 | 1997-01-27 | 音声符号化装置及び音声復号装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002035066A Division JP3845316B2 (ja) | 2002-02-13 | 2002-02-13 | 音声符号化装置及び音声復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10207496A JPH10207496A (ja) | 1998-08-07 |
JP3329216B2 true JP3329216B2 (ja) | 2002-09-30 |
Family
ID=11806474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01247797A Expired - Lifetime JP3329216B2 (ja) | 1997-01-27 | 1997-01-27 | 音声符号化装置及び音声復号装置 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP0855699B1 (ja) |
JP (1) | JP3329216B2 (ja) |
CA (1) | CA2228183C (ja) |
DE (1) | DE69823398T2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3166697B2 (ja) | 1998-01-14 | 2001-05-14 | 日本電気株式会社 | 音声符号化・復号装置及びシステム |
US6721280B1 (en) | 2000-04-19 | 2004-04-13 | Qualcomm Incorporated | Method and apparatus for voice latency reduction in a voice-over-data wireless communication system |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
CN101116137B (zh) * | 2005-02-10 | 2011-02-09 | 松下电器产业株式会社 | 语音编码中的脉冲分配方法 |
JP5174651B2 (ja) * | 2005-03-09 | 2013-04-03 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 低演算量符号励振線形予測符号化 |
US8000967B2 (en) | 2005-03-09 | 2011-08-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Low-complexity code excited linear prediction encoding |
EP3685376A4 (en) * | 2017-09-20 | 2021-11-10 | VoiceAge Corporation | METHOD AND DEVICE FOR ALLOCATING A BIT BUDGET BETWEEN SUBFRAMES IN THE CASE OF A CELP CODEC |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
-
1997
- 1997-01-27 JP JP01247797A patent/JP3329216B2/ja not_active Expired - Lifetime
-
1998
- 1998-01-27 EP EP98101335A patent/EP0855699B1/en not_active Expired - Lifetime
- 1998-01-27 DE DE1998623398 patent/DE69823398T2/de not_active Expired - Lifetime
- 1998-01-27 CA CA002228183A patent/CA2228183C/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69823398T2 (de) | 2005-01-13 |
DE69823398D1 (de) | 2004-06-03 |
EP0855699A2 (en) | 1998-07-29 |
EP0855699A3 (en) | 1999-04-07 |
EP0855699B1 (en) | 2004-04-28 |
CA2228183C (en) | 2001-05-29 |
JPH10207496A (ja) | 1998-08-07 |
CA2228183A1 (en) | 1998-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP2009134303A (ja) | 音声復号化方法及び音声復号化装置 | |
JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
JPH0612098A (ja) | 音声符号化装置 | |
JP3137176B2 (ja) | 音声符号化装置 | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
JP3329216B2 (ja) | 音声符号化装置及び音声復号装置 | |
JPH0944195A (ja) | 音声符号化装置 | |
JPH09185397A (ja) | 音声情報記録装置 | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP3845316B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP4179232B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JP3003531B2 (ja) | 音声符号化装置 | |
JP2001051699A (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JP2001318698A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP2004126628A (ja) | 音声符号化装置及び音声復号装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20011219 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020618 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070719 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080719 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090719 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100719 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110719 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110719 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120719 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120719 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130719 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |