JP3212123B2 - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JP3212123B2 JP3212123B2 JP07677792A JP7677792A JP3212123B2 JP 3212123 B2 JP3212123 B2 JP 3212123B2 JP 07677792 A JP07677792 A JP 07677792A JP 7677792 A JP7677792 A JP 7677792A JP 3212123 B2 JP3212123 B2 JP 3212123B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- codebook
- vector
- drive signal
- code book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【産業上の利用分野】本発明は、音声符号化装置に係
り、特に音声信号を8kbps 程度以下の低ビットレート
で符号化するのに適した音声符号化装置に関する。
り、特に音声信号を8kbps 程度以下の低ビットレート
で符号化するのに適した音声符号化装置に関する。
【0002】
【従来の技術】音声信号を低ビットレートで高能率に符
号化する技術は、自動車電記などの移動体通信や、企業
内通信において、電波の有効利用や通信コスト削減のた
めの重要な技術である。8 kbps 以下のビットレートで
品質の優れた音声符号化方式として、CELP(Code E
xcited Linear Prediction)方式が知られている。
号化する技術は、自動車電記などの移動体通信や、企業
内通信において、電波の有効利用や通信コスト削減のた
めの重要な技術である。8 kbps 以下のビットレートで
品質の優れた音声符号化方式として、CELP(Code E
xcited Linear Prediction)方式が知られている。
【0003】このCELP方式は、AT&Tベル研のM,
R,Schroeder 氏とB.S.Atal氏によりCode-Excited Linea
r Prediction(CELP)“High-Quality Speech at Very
LowBit Rates ”Proc.ICASSP ;1985,pp.937-939 (文
献1)で発表されて以来、高品質の音声が合成できる方
式として注目され、品質の改善や、計算量の削減など、
種々の検討がなされて来た。CELP方式の特徴は、L
PC(Liner Predictive Coding :線形予測符号化)合
成フィルタの駆動信号を駆動信号ベクトルとしてコード
ブックに格納し、合成音声信号と入力音声信号の誤差を
評価しながら、最適な駆動信号ベクトルをコードブック
から探索する点にある。
R,Schroeder 氏とB.S.Atal氏によりCode-Excited Linea
r Prediction(CELP)“High-Quality Speech at Very
LowBit Rates ”Proc.ICASSP ;1985,pp.937-939 (文
献1)で発表されて以来、高品質の音声が合成できる方
式として注目され、品質の改善や、計算量の削減など、
種々の検討がなされて来た。CELP方式の特徴は、L
PC(Liner Predictive Coding :線形予測符号化)合
成フィルタの駆動信号を駆動信号ベクトルとしてコード
ブックに格納し、合成音声信号と入力音声信号の誤差を
評価しながら、最適な駆動信号ベクトルをコードブック
から探索する点にある。
【0004】図5は、最新のCELP方式による音声符
号化装置のブロック図である。同図において、入力信号
であるサンプリングされた音声信号系列は入力端子60
0からフレーム単位で入力される。フレームL個の信号
サンプルからなり、サンプリング周波数が8kHzの場
合、一般にL=160が用いられる。図5には示されて
いないが、駆動信号ベクトルの探索に先立ち、入力され
たLサンプルの音声信号系列に対してLPC分析が行わ
れ、LPC予測パラメータ{αi ,i=1,2,…p}
が抽出される。このLPC予測パラメータαi は、LP
C合成フィルタ630に供給される。なお、pは予測次
第であり、一般にp=10が用いられる。LPC合成フ
ィルタ630の伝達関数H(z) は、[数1]で与えられ
る。
号化装置のブロック図である。同図において、入力信号
であるサンプリングされた音声信号系列は入力端子60
0からフレーム単位で入力される。フレームL個の信号
サンプルからなり、サンプリング周波数が8kHzの場
合、一般にL=160が用いられる。図5には示されて
いないが、駆動信号ベクトルの探索に先立ち、入力され
たLサンプルの音声信号系列に対してLPC分析が行わ
れ、LPC予測パラメータ{αi ,i=1,2,…p}
が抽出される。このLPC予測パラメータαi は、LP
C合成フィルタ630に供給される。なお、pは予測次
第であり、一般にp=10が用いられる。LPC合成フ
ィルタ630の伝達関数H(z) は、[数1]で与えられ
る。
【0005】
【数1】
【0006】次に、音声信号を合成しながら最適な駆動
信号ベクトルを探索する過程について説明する。まず、
入力端子600に入力された1フレームの音声信号か
ら、減算器610で前フレームでの合成フィルタ630
の内部状態が現フレームに与える影響が減算される。減
算器610から得られた信号系列は4個のサブフレーム
に分割され、各サブフレームの目標信号ベクトルとな
る。
信号ベクトルを探索する過程について説明する。まず、
入力端子600に入力された1フレームの音声信号か
ら、減算器610で前フレームでの合成フィルタ630
の内部状態が現フレームに与える影響が減算される。減
算器610から得られた信号系列は4個のサブフレーム
に分割され、各サブフレームの目標信号ベクトルとな
る。
【0007】LPC合成フィルタ630の入力信号であ
る駆動信号ベクトルは、適応コードブック640から選
択された駆動信号ベクトルに乗算器650で所定のゲイ
ンを乗算したものと、白色雑音コードブック710から
選択された雑音ベクトルに乗算器720で所定のゲイン
を乗算したものとを加算器660で加算することで得ら
れる。
る駆動信号ベクトルは、適応コードブック640から選
択された駆動信号ベクトルに乗算器650で所定のゲイ
ンを乗算したものと、白色雑音コードブック710から
選択された雑音ベクトルに乗算器720で所定のゲイン
を乗算したものとを加算器660で加算することで得ら
れる。
【0008】ここで、適応コードブック640は文献1
に記載されているピッチ予測分析を閉ループ動作または
合成による分析(Analysis by Synthesis )によって行
うものであり、詳細はW.B.Kleijin D.J.Krasinski and
R.H.Ketchum,"Imptoved Speech Quality and Efficient
Vector Quantization in CELP",Proc.ICASSP,1988,pp.
155-158 (文献2)に述べられている。この文献2によ
ると、LPC合成フィルタ630の駆動信号をピッチ探
索範囲a〜b(a,bは駆動信号のサンプル番号であ
り、通常a=20,b=147)にわたって遅延回路6
70で1サンプルづつ遅延させることにより、a〜bサ
ンプルのピッチ周期に対する駆動信号ベクトルを作成
し、これがコードワードとして適応コードブックに格納
される。
に記載されているピッチ予測分析を閉ループ動作または
合成による分析(Analysis by Synthesis )によって行
うものであり、詳細はW.B.Kleijin D.J.Krasinski and
R.H.Ketchum,"Imptoved Speech Quality and Efficient
Vector Quantization in CELP",Proc.ICASSP,1988,pp.
155-158 (文献2)に述べられている。この文献2によ
ると、LPC合成フィルタ630の駆動信号をピッチ探
索範囲a〜b(a,bは駆動信号のサンプル番号であ
り、通常a=20,b=147)にわたって遅延回路6
70で1サンプルづつ遅延させることにより、a〜bサ
ンプルのピッチ周期に対する駆動信号ベクトルを作成
し、これがコードワードとして適応コードブックに格納
される。
【0009】最適な駆動信号ベクトルの探索を行う場
合、適応コードブック640から各ピッチ周期に対応す
る駆動信号ベクトルのコードワードが1個ずつ読み出さ
れ、乗算器650で所定のゲインと乗算される。そし
て、白色雑音コードブック10から選択された雑音ベク
トルに乗算器720で所定のゲインを乗算したものとを
加算器660で加算して、この信号をLPC合成フィル
タ630によりフィルタ演算が行われ、合成音声信号ベ
クトルが生成される。生成された合成音声信号ベクトル
は、減算器620で目標信号ベクトルと減算される。こ
の減算器620の出力は聴感重み付けフィルタ680を
経て誤差計算回路690に入力され、平均2乗誤差が求
められる。平均2乗誤差の情報は更に最小歪探索回路7
00に入力され、その最小値が検出される。
合、適応コードブック640から各ピッチ周期に対応す
る駆動信号ベクトルのコードワードが1個ずつ読み出さ
れ、乗算器650で所定のゲインと乗算される。そし
て、白色雑音コードブック10から選択された雑音ベク
トルに乗算器720で所定のゲインを乗算したものとを
加算器660で加算して、この信号をLPC合成フィル
タ630によりフィルタ演算が行われ、合成音声信号ベ
クトルが生成される。生成された合成音声信号ベクトル
は、減算器620で目標信号ベクトルと減算される。こ
の減算器620の出力は聴感重み付けフィルタ680を
経て誤差計算回路690に入力され、平均2乗誤差が求
められる。平均2乗誤差の情報は更に最小歪探索回路7
00に入力され、その最小値が検出される。
【0010】以上の過程は、適応コードブック640中
の全ての駆動信号ベクトルのコードワードについて行わ
れ、最小歪探索回路700において平均2乗誤差の最小
値を与えるコードワードの番号が求められる。また、乗
算器650で乗じられるゲインも平均2乗誤差が最小に
なるよう決定される。
の全ての駆動信号ベクトルのコードワードについて行わ
れ、最小歪探索回路700において平均2乗誤差の最小
値を与えるコードワードの番号が求められる。また、乗
算器650で乗じられるゲインも平均2乗誤差が最小に
なるよう決定される。
【0011】次に、同様の方法で最適な白色雑音ベクト
ルの探索が行われる。すなわち、白色雑音コードブック
710から雑音ベクトルのコードワードが1個ずつ読み
出され、乗算器720でのゲインとの乗算、白色雑音コ
ードブック10から選択された雑音ベクトルに乗算器7
20で所定のゲインを乗算したものとを加算器660で
加算してこの結果を、LPC合成フィルタ630でのフ
ィルタ演算を経て、更に聴感重み付けフィルタ680を
経て誤差計算回路690に入力され、合成音声信号ベク
トルの生成が行われ、誤差計算回路690で目標ベクト
ルとの平均2乗誤差の計算が全ての雑音ベクトルについ
て行われる。そして、最小歪探索回路700で平均2乗
誤差の最小値を与える雑音ベクトルの番号及びゲインが
求められる。なお、聴感重み付けフィルタ680は減算
器620から出力される誤差信号のスペクトルを整形し
て、人間に知覚される歪を低減するために用いられる。
ルの探索が行われる。すなわち、白色雑音コードブック
710から雑音ベクトルのコードワードが1個ずつ読み
出され、乗算器720でのゲインとの乗算、白色雑音コ
ードブック10から選択された雑音ベクトルに乗算器7
20で所定のゲインを乗算したものとを加算器660で
加算してこの結果を、LPC合成フィルタ630でのフ
ィルタ演算を経て、更に聴感重み付けフィルタ680を
経て誤差計算回路690に入力され、合成音声信号ベク
トルの生成が行われ、誤差計算回路690で目標ベクト
ルとの平均2乗誤差の計算が全ての雑音ベクトルについ
て行われる。そして、最小歪探索回路700で平均2乗
誤差の最小値を与える雑音ベクトルの番号及びゲインが
求められる。なお、聴感重み付けフィルタ680は減算
器620から出力される誤差信号のスペクトルを整形し
て、人間に知覚される歪を低減するために用いられる。
【0012】このようにCELP方式は、合成音声信号
と入力音声信号との誤差が最小になるような最適の駆動
信号ベクトルを求めているので、8kbps 程度の低ビッ
トレートでも高品質の音声を合成することができる。
と入力音声信号との誤差が最小になるような最適の駆動
信号ベクトルを求めているので、8kbps 程度の低ビッ
トレートでも高品質の音声を合成することができる。
【0013】一方、音声符号化装置(コーデック)を自
動車電話等の移動体通信に適用する場合には電波を利用
して通信しているので、周囲の環境によっては伝送誤り
が生じるため、この誤りを低減させるために伝送路符号
化技術が併用される。また、この音声符号化装置の技術
をATM通信やパケット通信に適用する場合には、パケ
ット状にデータ化された音声がパケットの処理状態によ
り輻輳が生じてこれが原因でセル廃棄やパケット廃棄が
発生するので、これによる音声自体の品質劣化を防止す
る工夫が必要となる。伝送路符号の適用に当っては、符
号化パラメータの内誤り感度の高いパラメータのみに誤
り訂正符号を付加する方法や誤り感度の大きさに応じて
訂正能力の異なる誤り訂正符号を付加する方法が伝送路
符号の効率的割当ての観点から従来用いられていた。
動車電話等の移動体通信に適用する場合には電波を利用
して通信しているので、周囲の環境によっては伝送誤り
が生じるため、この誤りを低減させるために伝送路符号
化技術が併用される。また、この音声符号化装置の技術
をATM通信やパケット通信に適用する場合には、パケ
ット状にデータ化された音声がパケットの処理状態によ
り輻輳が生じてこれが原因でセル廃棄やパケット廃棄が
発生するので、これによる音声自体の品質劣化を防止す
る工夫が必要となる。伝送路符号の適用に当っては、符
号化パラメータの内誤り感度の高いパラメータのみに誤
り訂正符号を付加する方法や誤り感度の大きさに応じて
訂正能力の異なる誤り訂正符号を付加する方法が伝送路
符号の効率的割当ての観点から従来用いられていた。
【0014】また、ATM通信やパケット通信では、伝
送するセルやパケットに優先度(以下プライオリティー
という)をつけ、誤り感度の高いパラメータをプライオ
リティーの高いセル、又はパケットとして設定して伝送
する。
送するセルやパケットに優先度(以下プライオリティー
という)をつけ、誤り感度の高いパラメータをプライオ
リティーの高いセル、又はパケットとして設定して伝送
する。
【0015】図5に示したCELP方式において、伝送
する符号化パラメータは、LPC予測パラメータ(合成
フイルタ630の保数)と適応コードブック640の番
号(以下インデックスという)及びゲイン、白色雑音コ
ードブック10の番号(以下インデックスという)及び
ゲインである。これらのパラメータの内、低次のLPC
予測パラメータと適応コードブックのインデックス及び
ゲインは誤りに弱い(誤り感度が高い)と考えられ、誤
り訂正符号が付加されるものの、白色雑音コードブック
のインデックス及びゲインは保護されないのが一般的で
ある。
する符号化パラメータは、LPC予測パラメータ(合成
フイルタ630の保数)と適応コードブック640の番
号(以下インデックスという)及びゲイン、白色雑音コ
ードブック10の番号(以下インデックスという)及び
ゲインである。これらのパラメータの内、低次のLPC
予測パラメータと適応コードブックのインデックス及び
ゲインは誤りに弱い(誤り感度が高い)と考えられ、誤
り訂正符号が付加されるものの、白色雑音コードブック
のインデックス及びゲインは保護されないのが一般的で
ある。
【0016】しかしながら、白色雑音コードブックのイ
ンデックスやゲインに誤りが生じた場合、誤りによる復
号音声の品質劣化が長く続いてしまう。なぜなら、合成
フィルタの駆動信号は適応コードブックの寄与(コード
ベクトルとゲインの乗算結果)と白色雑音コードブック
の寄与の和として表され、この和によって求まった駆動
信号は適応コードブックに逐次蓄えられ、現フレームに
続く次のフレームで次々と用いられるためである。
ンデックスやゲインに誤りが生じた場合、誤りによる復
号音声の品質劣化が長く続いてしまう。なぜなら、合成
フィルタの駆動信号は適応コードブックの寄与(コード
ベクトルとゲインの乗算結果)と白色雑音コードブック
の寄与の和として表され、この和によって求まった駆動
信号は適応コードブックに逐次蓄えられ、現フレームに
続く次のフレームで次々と用いられるためである。
【0017】
【発明が解決しようとする課題】上述したように、従来
のCELP方式を適用した音声符号化装置には適応コー
ドブックと雑音コードブックが備えられており、これら
を用いて音声の符号化を行うので、従来誤り訂正の処理
がとられていない雑音コードブックのパラメータに誤り
が発生した場合には、この誤りが低減できないために復
号された音声の品質劣化が長く続くという問題点があっ
た。
のCELP方式を適用した音声符号化装置には適応コー
ドブックと雑音コードブックが備えられており、これら
を用いて音声の符号化を行うので、従来誤り訂正の処理
がとられていない雑音コードブックのパラメータに誤り
が発生した場合には、この誤りが低減できないために復
号された音声の品質劣化が長く続くという問題点があっ
た。
【0018】本発明は、上記問題点に鑑みてなされたも
ので、雑音コードブックのパラメータに誤りが生じても
復号音声の品質劣化が少ない音声符号化装置を提供する
ことを目的とするものである。
ので、雑音コードブックのパラメータに誤りが生じても
復号音声の品質劣化が少ない音声符号化装置を提供する
ことを目的とするものである。
【0019】
【課題を解決するための手段】上記目的を達成するため
に本発明においては、入力した音声信号を参照しながら
複数の駆動信号を格納したコードブック及び複数の雑音
パラメータを格納した雑音コードブックに基づいて前記
音声信号を符号化する音声符号化装置であって、第1の
駆動信号を複数格納した適応コードブックと、第1の雑
音パラメータを複数格納した第1の雑音コードブック
と、第1の雑音パラメータより優先度の低い第2の雑音
パラメータを複数格納した第2の雑音コードブックと、
適応コードブック及び第1の雑音コードブックからの情
報に基づいて、第1の駆動信号を生成する第1の駆動信
号生成手段と、適応コードブック及び第1及び第2の雑
音コードブックからの情報に基づいて、第2の駆動信号
を生成する第2の駆動信号生成手段と、この生成された
第1の駆動信号を遅延させて適応コードブックに格納す
る手段と、第1の駆動信号に基づく情報が第2の駆動信
号に基づく情報より伝送誤りが少なくなるように伝送処
理する伝送処理手段と、を具備したことを特徴とするも
のである。
に本発明においては、入力した音声信号を参照しながら
複数の駆動信号を格納したコードブック及び複数の雑音
パラメータを格納した雑音コードブックに基づいて前記
音声信号を符号化する音声符号化装置であって、第1の
駆動信号を複数格納した適応コードブックと、第1の雑
音パラメータを複数格納した第1の雑音コードブック
と、第1の雑音パラメータより優先度の低い第2の雑音
パラメータを複数格納した第2の雑音コードブックと、
適応コードブック及び第1の雑音コードブックからの情
報に基づいて、第1の駆動信号を生成する第1の駆動信
号生成手段と、適応コードブック及び第1及び第2の雑
音コードブックからの情報に基づいて、第2の駆動信号
を生成する第2の駆動信号生成手段と、この生成された
第1の駆動信号を遅延させて適応コードブックに格納す
る手段と、第1の駆動信号に基づく情報が第2の駆動信
号に基づく情報より伝送誤りが少なくなるように伝送処
理する伝送処理手段と、を具備したことを特徴とするも
のである。
【0020】
【作用】第1の雑音コードブックに格納されている雑音
パラメータの方が第2の雑音コードブックに格納されて
いる雑音パラメータより優先度が高く設定されており、
第2の駆動信号としては、これらの雑音コードブットと
適応コードブックに格納されている情報で生成される。
しかし、適応コードブックに格納する第1の駆動信号
は、適応コードと優先度の高い第1の雑音コードブック
とから生成される。
パラメータの方が第2の雑音コードブックに格納されて
いる雑音パラメータより優先度が高く設定されており、
第2の駆動信号としては、これらの雑音コードブットと
適応コードブックに格納されている情報で生成される。
しかし、適応コードブックに格納する第1の駆動信号
は、適応コードと優先度の高い第1の雑音コードブック
とから生成される。
【0021】従って、優先度の低い誤りの生じやすい第
2の雑音コードブックは、適応コードブックの更新には
用いられない為、誤りによる影響は長く残ることなく音
声の品質劣化も少なくなる。
2の雑音コードブックは、適応コードブックの更新には
用いられない為、誤りによる影響は長く残ることなく音
声の品質劣化も少なくなる。
【0022】
【実施例】以下、図面を参照しながら本発明の一実施例
を説明する。図1は、本発明の一実施例に係る音声符号
化装置のブロック図である。
を説明する。図1は、本発明の一実施例に係る音声符号
化装置のブロック図である。
【0023】図1において、入力音声信号は入力端子1
00からフレームバッファ101に入力される。フレー
ムバッファ101では、入力音声信号系列をL個のサン
プル単位で切出し、1フレーム毎の信号として記憶す
る。Lは、通常160ぐらいである。フレームバッファ
101からの1フレーム毎の入力音声信号系列は、LP
C分析回路102及び重み付けフィルタ106へ供給さ
れる。
00からフレームバッファ101に入力される。フレー
ムバッファ101では、入力音声信号系列をL個のサン
プル単位で切出し、1フレーム毎の信号として記憶す
る。Lは、通常160ぐらいである。フレームバッファ
101からの1フレーム毎の入力音声信号系列は、LP
C分析回路102及び重み付けフィルタ106へ供給さ
れる。
【0024】LPC分析回路102は、例えば自己相関
法を用いて入力音声信号に対してLPC(Linear Predi
ctive Coding:線形予測符号化)分析を行い、P個のL
PC予測係数{αi 、i=1,2,…p、}、または反
射係数{ki ,i=1,2,…,p}を抽出する。抽出
された予測係数または反射係数は、符号化回路103に
おいて所定のビット数で符号化された後、重み付け合成
フィルタ107、112、122、152で利用され
る。
法を用いて入力音声信号に対してLPC(Linear Predi
ctive Coding:線形予測符号化)分析を行い、P個のL
PC予測係数{αi 、i=1,2,…p、}、または反
射係数{ki ,i=1,2,…,p}を抽出する。抽出
された予測係数または反射係数は、符号化回路103に
おいて所定のビット数で符号化された後、重み付け合成
フィルタ107、112、122、152で利用され
る。
【0025】重み付けフィルタ106は、適応コードブ
ック110および雑音コードブック120、150から
合成フィルタの駆動信号ベクトルを探索する際に、入力
音声信号系列に重み付けを行うものである。一般的な合
成フィルタの伝達関数H(z)は、前述した[数1]で記
述される。この時、重み付けフィルタ106の伝達関数
W(z) は[数2]で表される。
ック110および雑音コードブック120、150から
合成フィルタの駆動信号ベクトルを探索する際に、入力
音声信号系列に重み付けを行うものである。一般的な合
成フィルタの伝達関数H(z)は、前述した[数1]で記
述される。この時、重み付けフィルタ106の伝達関数
W(z) は[数2]で表される。
【0026】
【数2】 但し、γは重み付けの強さを制御するパラメータである
(0≦γ≦1)。
(0≦γ≦1)。
【0027】重み付け合成フィルタ107、112、1
22、152は、HW(z) なる伝達関数の合成フィルタ
と、W(z) なる伝達関数の重み付けフィルタを縦続接続
したフィルタで構成されており、その伝達関数HW(z)
は[数3]で記述される。
22、152は、HW(z) なる伝達関数の合成フィルタ
と、W(z) なる伝達関数の重み付けフィルタを縦続接続
したフィルタで構成されており、その伝達関数HW(z)
は[数3]で記述される。
【0028】
【数3】
【0029】本実施例のように重み付けフィルタ106
を用いると、聴感上の符号化歪を低減することが可能に
なる。また、本実施例では重み付けフィルタ106を駆
動信号ベクトルの探索ループの外に設けた構成になって
おり、この結果、探索に要する計算量が大幅に削減され
る。
を用いると、聴感上の符号化歪を低減することが可能に
なる。また、本実施例では重み付けフィルタ106を駆
動信号ベクトルの探索ループの外に設けた構成になって
おり、この結果、探索に要する計算量が大幅に削減され
る。
【0030】さらに、重み付け合成フィルタ112、1
22、152が駆動信号ベクトルの探索に影響を与えな
いように、初期メモリを持った重み付け合成フィルタ1
07が設けられている。この重み付け合成フィルタ10
7は、前フレームの最後の重み付け合成フィルタ11
2、122、152が保持していた内部状態を初期状態
として持つ。
22、152が駆動信号ベクトルの探索に影響を与えな
いように、初期メモリを持った重み付け合成フィルタ1
07が設けられている。この重み付け合成フィルタ10
7は、前フレームの最後の重み付け合成フィルタ11
2、122、152が保持していた内部状態を初期状態
として持つ。
【0031】そして、重み付け合成フィルタ107の零
入力応答ベクトルを作成し、減算器108において重み
付けフィルタ106の出力から上記零入力応答ベクトル
を減算する。これにより、重み付け合成フィルタ11
2、122、152の初期状態を零とさせることがで
き、前フレームの影響を考慮せずに駆動信号ベクトルの
探索を行うことができる。以上の処理は、全てフレーム
単位で行われる。次に、フレームをM個(通常、M=
4)のサブフレームに分割し、サブフレーム単位で行う
駆動信号ベクトル探索の処理について説明する。
入力応答ベクトルを作成し、減算器108において重み
付けフィルタ106の出力から上記零入力応答ベクトル
を減算する。これにより、重み付け合成フィルタ11
2、122、152の初期状態を零とさせることがで
き、前フレームの影響を考慮せずに駆動信号ベクトルの
探索を行うことができる。以上の処理は、全てフレーム
単位で行われる。次に、フレームをM個(通常、M=
4)のサブフレームに分割し、サブフレーム単位で行う
駆動信号ベクトル探索の処理について説明する。
【0032】駆動信号ベクトルの探索は適応コードブッ
ク110、雑音コードブック120、150の順に行わ
れる。まず、適応コードブック110からピッチ周期j
に対応する駆動信号ベクトルXj (ベクトルの次元は、
L/M=K)を順次読み出し、乗算器111でXj に所
定のゲインβを乗じた後、重み付け合成フィルタ112
に供給する。重み付け合成フィルタ112では、フィル
タリング演算を行って合成音声ベクトルを作成する。
ク110、雑音コードブック120、150の順に行わ
れる。まず、適応コードブック110からピッチ周期j
に対応する駆動信号ベクトルXj (ベクトルの次元は、
L/M=K)を順次読み出し、乗算器111でXj に所
定のゲインβを乗じた後、重み付け合成フィルタ112
に供給する。重み付け合成フィルタ112では、フィル
タリング演算を行って合成音声ベクトルを作成する。
【0033】一方、フレームバッファ101から読み出
された入力音声信号は、重み付けフィルタ106によっ
て重み付けられた後、減算器108で前フレームの影響
が差し引かれる。この減算器108から出力される音声
信号ベクトルYを目標ベクトルとして、減算器113で
重み付け合成フィルタ112からの合成音声ベクトルと
の誤差ベクトルEj が計算される。そして、2乗誤差計
算回路114で誤差の2乗和‖Ej ‖が計算され、この
‖Ej ‖の最小値および最小値が与えるインデックスj
が最小歪探索回路115で検出される。このインデック
スjが適応コードブック110に与えられる。
された入力音声信号は、重み付けフィルタ106によっ
て重み付けられた後、減算器108で前フレームの影響
が差し引かれる。この減算器108から出力される音声
信号ベクトルYを目標ベクトルとして、減算器113で
重み付け合成フィルタ112からの合成音声ベクトルと
の誤差ベクトルEj が計算される。そして、2乗誤差計
算回路114で誤差の2乗和‖Ej ‖が計算され、この
‖Ej ‖の最小値および最小値が与えるインデックスj
が最小歪探索回路115で検出される。このインデック
スjが適応コードブック110に与えられる。
【0034】具体的には、誤差ベクトルEj は例えば
[数4]で表わされる。この誤差ベクトル‖Ej ‖をβ
で偏微分して零と置くことによって、βを最適化した場
合の‖Ej ‖の最小値が[数5]で表される。但し、β
は乗算器111で与えられるゲインである。
[数4]で表わされる。この誤差ベクトル‖Ej ‖をβ
で偏微分して零と置くことによって、βを最適化した場
合の‖Ej ‖の最小値が[数5]で表される。但し、β
は乗算器111で与えられるゲインである。
【0035】
【数4】
【0036】
【数5】
【0037】ここで、‖X‖は2乗ノルム、(X、Y)
は内積をそれぞれ表し、Hは[数6]で与えられる重み
付け合成フィルタ(伝達関数:HW(z) のインパルス応
答行列である。
は内積をそれぞれ表し、Hは[数6]で与えられる重み
付け合成フィルタ(伝達関数:HW(z) のインパルス応
答行列である。
【0038】
【数6】
【0039】[数5]から明らかなように、適応コード
ブック110からの駆動信号ベクトルの探索は、全ての
コードワードXj に対し[数5]の右辺第2項を計算
し、それが最大になるインデックスjを検出することに
よって行う。
ブック110からの駆動信号ベクトルの探索は、全ての
コードワードXj に対し[数5]の右辺第2項を計算
し、それが最大になるインデックスjを検出することに
よって行う。
【0040】このようにして適応コードブック110か
ら最適な駆動信号ベクトルXopt が探索されると、減算
器113で目標ベクトルYからXopt に対応する重み付
け合成フィルタ112の出力が差し引かれ、この減算器
113の出力が雑音コードブック120からの雑音ベク
トル探索の目標ベクトルとされる。雑音コードブック1
20からの雑音ベクトルの探索も、適応コードブック1
10らの駆動信号ベクトルの探索と全く同様に行うこと
ができる。さらに、雑音コードブック150からの雑音
ベクトルの探索も同様に行うことができる。雑音ベクト
ル120からの探索で得られたコードベクトルを
Nopt 、雑音コードベクトル150からの探索で得られ
たコードベクトルをMopt 、雑音コードベクトル150
からの探索で得られたコードベクトルMopt とすると、
合成フィルタの駆動信号ベクトルXは X=β・Xopt +g・Nopt +f・Mopt と表される。但し、β、g、fはそれぞれ乗算器11
1、121、151において適応コードブック110お
よび雑音コードブック120、150から探索された駆
動信号ベクトルおよび雑音ベクトルに与えられるゲイン
である。次に、駆動信号ベクトルを適応コードブック1
10に格納する方法について説明する。
ら最適な駆動信号ベクトルXopt が探索されると、減算
器113で目標ベクトルYからXopt に対応する重み付
け合成フィルタ112の出力が差し引かれ、この減算器
113の出力が雑音コードブック120からの雑音ベク
トル探索の目標ベクトルとされる。雑音コードブック1
20からの雑音ベクトルの探索も、適応コードブック1
10らの駆動信号ベクトルの探索と全く同様に行うこと
ができる。さらに、雑音コードブック150からの雑音
ベクトルの探索も同様に行うことができる。雑音ベクト
ル120からの探索で得られたコードベクトルを
Nopt 、雑音コードベクトル150からの探索で得られ
たコードベクトルをMopt 、雑音コードベクトル150
からの探索で得られたコードベクトルMopt とすると、
合成フィルタの駆動信号ベクトルXは X=β・Xopt +g・Nopt +f・Mopt と表される。但し、β、g、fはそれぞれ乗算器11
1、121、151において適応コードブック110お
よび雑音コードブック120、150から探索された駆
動信号ベクトルおよび雑音ベクトルに与えられるゲイン
である。次に、駆動信号ベクトルを適応コードブック1
10に格納する方法について説明する。
【0041】適応コードブック110に格納する駆動ベ
クトルXs は次式に示すように適応コードブック110
と雑音コードブック110の探索で得られたコードベク
トルを用いて作成する。 Xs =β・Xopt +g・Nopt
クトルXs は次式に示すように適応コードブック110
と雑音コードブック110の探索で得られたコードベク
トルを用いて作成する。 Xs =β・Xopt +g・Nopt
【0042】上式の加算は、加算器130で行われ、そ
の結果は、遅延回路131に供給される。遅延回路で
は、駆動信号ベクトルをピッチ探索範囲a〜b(a、b
は駆動符号のサンプル番号であり、通常a=20、b=
147)にわたって1サンプルづつ遅延させることによ
り、a〜bサンプルのピッチ周期に対する駆動信号ベク
トルを作成し、これをコードワードとして適応コードブ
ック110に格納する。
の結果は、遅延回路131に供給される。遅延回路で
は、駆動信号ベクトルをピッチ探索範囲a〜b(a、b
は駆動符号のサンプル番号であり、通常a=20、b=
147)にわたって1サンプルづつ遅延させることによ
り、a〜bサンプルのピッチ周期に対する駆動信号ベク
トルを作成し、これをコードワードとして適応コードブ
ック110に格納する。
【0043】以上の処理で求められた符号化パルメータ
のビット列は、ビット列クラス分け部160において、
誤り感度が高くプライオリティーの高いクラス1のビッ
ト列と誤り感度の低いプライオリティーの低いクラス2
のビット列に分けられる。図2に符号化パラメータのク
ラス分けの例を示す。
のビット列は、ビット列クラス分け部160において、
誤り感度が高くプライオリティーの高いクラス1のビッ
ト列と誤り感度の低いプライオリティーの低いクラス2
のビット列に分けられる。図2に符号化パラメータのク
ラス分けの例を示す。
【0044】次に、クラス1のビット列に対しては、誤
り訂正符号器170で、クラス2のビット列に対しては
誤り訂正符号器171で誤り訂正符号化を行う。この
時、クラス1に対する誤り訂正符号はクラス2に対する
誤り訂正符号より訂正能力、検出能力の高い符号を用い
る。例えば、クラス1に対してはリードソロモン符号、
クラス2に対してはBCH符号を用いる。また、クラス
2に対しては誤り訂正符号を付加しない方法もある。
り訂正符号器170で、クラス2のビット列に対しては
誤り訂正符号器171で誤り訂正符号化を行う。この
時、クラス1に対する誤り訂正符号はクラス2に対する
誤り訂正符号より訂正能力、検出能力の高い符号を用い
る。例えば、クラス1に対してはリードソロモン符号、
クラス2に対してはBCH符号を用いる。また、クラス
2に対しては誤り訂正符号を付加しない方法もある。
【0045】なお、本発明では、図2からわかるよう
に、適応コードブック110のインデックス及び140
から出力されるゲインの符号と雑音コードブック120
のインデックス及びゲインは、訂正能力の高い誤り訂正
符号で保護されている。そして、図1の構成からわかる
ように、訂正能力の高い誤り訂正符号で保護されたプラ
イオリティーの高い適応コードブック110のインデッ
クス及びゲインと雑音コードブック120のインデック
ス及びゲインのみを用いて、適用コードブックに逐次格
納される駆動符号を作成しているので、伝送誤りがあっ
ても音声の品質劣化の少ない符号化が達成できる。
に、適応コードブック110のインデックス及び140
から出力されるゲインの符号と雑音コードブック120
のインデックス及びゲインは、訂正能力の高い誤り訂正
符号で保護されている。そして、図1の構成からわかる
ように、訂正能力の高い誤り訂正符号で保護されたプラ
イオリティーの高い適応コードブック110のインデッ
クス及びゲインと雑音コードブック120のインデック
ス及びゲインのみを用いて、適用コードブックに逐次格
納される駆動符号を作成しているので、伝送誤りがあっ
ても音声の品質劣化の少ない符号化が達成できる。
【0046】誤り訂正符号器170、171の出力はイ
ンタリーバ180によって複数フレームにわたって分散
させられる。これにより、符号化パラメータがバースト
的に誤るのが防止される。
ンタリーバ180によって複数フレームにわたって分散
させられる。これにより、符号化パラメータがバースト
的に誤るのが防止される。
【0047】次に、図1に示した音声符号化装置で、符
号化された音声を復号化する音声復号化装置について図
3にその一実施例を示しておいた。図3を用いてこの装
置の概要について説明する。
号化された音声を復号化する音声復号化装置について図
3にその一実施例を示しておいた。図3を用いてこの装
置の概要について説明する。
【0048】図1で符号化されたパラメータのビット列
は、入力端子200からデインタリーバ201に入力さ
れる。デインタリーバ201では、このビット列を正式
な並びに並び換えを行い、フレーム単位に構成させる。
その結果、クラス1のビット列は誤り訂正復号器210
へ、クラス2のビット列は誤り訂正復号器211へ入力
される。入力されたビット列は、それぞれの誤り訂正復
号器210、211で誤り訂正復号化処理されて、ビッ
ト列統合器220で符号化パラメータに構成される。ビ
ット列統合器220で構成された符号化パラメータは、
復号化器230、231、232、233に入力され
て、それぞれ復号化される。
は、入力端子200からデインタリーバ201に入力さ
れる。デインタリーバ201では、このビット列を正式
な並びに並び換えを行い、フレーム単位に構成させる。
その結果、クラス1のビット列は誤り訂正復号器210
へ、クラス2のビット列は誤り訂正復号器211へ入力
される。入力されたビット列は、それぞれの誤り訂正復
号器210、211で誤り訂正復号化処理されて、ビッ
ト列統合器220で符号化パラメータに構成される。ビ
ット列統合器220で構成された符号化パラメータは、
復号化器230、231、232、233に入力され
て、それぞれ復号化される。
【0049】一方、ビット列統合器220からのビット
列は適応コードブック260と雑音コードブック24
0、250に入力される。そして、雑音コードブック2
40、250の出力は乗算器241、251に入力さ
れ、復号化器233、232の復号化出力と乗算され
る。この乗算された値は加熱器262、263に入力さ
れ、駆動信号を作成させる処理に用いられる。適応コー
ドブック260に入力されたビット列に基づいて、これ
に格納されている駆動信号は乗算器261に入力され、
復号化器231から出力された復号化信号と乗算され
る。また加算器262の出力は、遅延器263に入力さ
れ、ピッチ探索範囲a〜bに渡って1サンプルづつ遅延
が施された後、適応コードブック260に入力される。
そしてループ状の処理が行われる。加算器263の出力
は、合成フィルタに入力され復号化器230の出力信号
に基づき、フィルタリングされ、この出力がポストフィ
ルタ271に入力される。このポストフィルタ271で
は復号化器230の信号によりスペクトルの整形が行わ
れ、聴感的が歪が抑圧された後出力端子272より出力
される。
列は適応コードブック260と雑音コードブック24
0、250に入力される。そして、雑音コードブック2
40、250の出力は乗算器241、251に入力さ
れ、復号化器233、232の復号化出力と乗算され
る。この乗算された値は加熱器262、263に入力さ
れ、駆動信号を作成させる処理に用いられる。適応コー
ドブック260に入力されたビット列に基づいて、これ
に格納されている駆動信号は乗算器261に入力され、
復号化器231から出力された復号化信号と乗算され
る。また加算器262の出力は、遅延器263に入力さ
れ、ピッチ探索範囲a〜bに渡って1サンプルづつ遅延
が施された後、適応コードブック260に入力される。
そしてループ状の処理が行われる。加算器263の出力
は、合成フィルタに入力され復号化器230の出力信号
に基づき、フィルタリングされ、この出力がポストフィ
ルタ271に入力される。このポストフィルタ271で
は復号化器230の信号によりスペクトルの整形が行わ
れ、聴感的が歪が抑圧された後出力端子272より出力
される。
【0050】上述したブロックでも、復号化された適応
コードブック260のインデックス及びゲイン、雑音コ
ードブック240、250のインデックス及びゲインに
基づいて駆動信号は作成される。適応コードブックのコ
ードベクトル、インデックス、ゲインを各々X、I、β
雑音コードブック250のコードベクトル、インデック
ス、ゲインを各々N、j、g雑音コードブック240の
コードベクトル、インデックス、ゲインを各々M、k、
fとすると駆動信号Xは次式のように表される。 X=β・Xi +g・Nj +f・Mk 次に、本発明をATM通信に適用した他の実施例に係る
音声符号化装置のブロック図を図4に示す。
コードブック260のインデックス及びゲイン、雑音コ
ードブック240、250のインデックス及びゲインに
基づいて駆動信号は作成される。適応コードブックのコ
ードベクトル、インデックス、ゲインを各々X、I、β
雑音コードブック250のコードベクトル、インデック
ス、ゲインを各々N、j、g雑音コードブック240の
コードベクトル、インデックス、ゲインを各々M、k、
fとすると駆動信号Xは次式のように表される。 X=β・Xi +g・Nj +f・Mk 次に、本発明をATM通信に適用した他の実施例に係る
音声符号化装置のブロック図を図4に示す。
【0051】図1に示した先の実施例と異なる部分は、
ビット列クラス分け器160においてビット列をクラス
1とクラス2に分けた後、クラス1のビット列を優先セ
ルにクラス2のビット列を非優先セルにセル化部190
でセル化することである。
ビット列クラス分け器160においてビット列をクラス
1とクラス2に分けた後、クラス1のビット列を優先セ
ルにクラス2のビット列を非優先セルにセル化部190
でセル化することである。
【0052】以上説明した実施例において、雑音コード
ブックのコードワードは白色雑音系列から作成するが、
コードワードを複数の基底ベクトルの和として与えても
よい。このようなコードブックをもつ符号化方式はVS
EP(Vector Sum Excited Linear Prediction)方式と
呼ばれ、Ira A.Gerson氏とMark A.Jasiuk 氏による“VE
CTOR SUM EXCITED LINEAR PRIDICTION(VSELP )SPEECH
CODING AT 8KBPS”、International Conterence on Ac
oustiecs,Speech and Signal Processing,April 1990で
詳細に記述されている。この方法を用いると雑音コード
ブックの探索に要する計算量が大幅に削減されると共に
伝送誤りに強くなるという効果がある。また、この文献
で用いられているように雑音コードブック120、15
0の探索において各コードワードを目標ベクトルと直交
化させ、ゲインをベクトル量子化することによって合成
音声の品質を向上させることができる。
ブックのコードワードは白色雑音系列から作成するが、
コードワードを複数の基底ベクトルの和として与えても
よい。このようなコードブックをもつ符号化方式はVS
EP(Vector Sum Excited Linear Prediction)方式と
呼ばれ、Ira A.Gerson氏とMark A.Jasiuk 氏による“VE
CTOR SUM EXCITED LINEAR PRIDICTION(VSELP )SPEECH
CODING AT 8KBPS”、International Conterence on Ac
oustiecs,Speech and Signal Processing,April 1990で
詳細に記述されている。この方法を用いると雑音コード
ブックの探索に要する計算量が大幅に削減されると共に
伝送誤りに強くなるという効果がある。また、この文献
で用いられているように雑音コードブック120、15
0の探索において各コードワードを目標ベクトルと直交
化させ、ゲインをベクトル量子化することによって合成
音声の品質を向上させることができる。
【0053】
【発明の効果】以上説明してきた様に、本発明によれ
ば、繰り返し用いられる第1の駆動信号の生成には、適
応コードブックに格納された情報と雑音コードブックの
中でも優先度の高い第1の雑音コードブックに格納され
た情報とから行われているので、優先度の低い第2の雑
音コードブックに格納された情報が誤ったとしても、そ
の影響は音声の品質には受けず、音声品質の劣化の少な
い音声符号化装置を提供できる。
ば、繰り返し用いられる第1の駆動信号の生成には、適
応コードブックに格納された情報と雑音コードブックの
中でも優先度の高い第1の雑音コードブックに格納され
た情報とから行われているので、優先度の低い第2の雑
音コードブックに格納された情報が誤ったとしても、そ
の影響は音声の品質には受けず、音声品質の劣化の少な
い音声符号化装置を提供できる。
【図1】 本発明の一実施例に係る音声符号化装置のブ
ロック図。
ロック図。
【図2】 本発明の音声符号化に用いるパラメータの一
クラス分けを示した図。
クラス分けを示した図。
【図3】 本発明の一実施例に係る音声復号化装置のブ
ロック図。
ロック図。
【図4】 本発明の他の実施例を示した図。
【図5】 従来例を示した図。
100…音声信号入力端子 101…フレームバッファ 102…LPC分析回路 103…符号化回路 104…ピッチ分析回路 106…重み付けフィルタ 107…重み付け合成フィルタ 110…適応コードブック 112…重み付け合成フィルタ 114…2乗誤差計算回路 115…最小歪探索回路 120…雑音コードブック 122…重み付け合成フィルタ 124…2乗誤差計算回路 125…最小歪探索回路 131…フップサンプリング回路 132…遅延回路 133…間引き回路 140…ゲイン符号化回路 141…ゲイン符号化回路 152…重み付け合成フィルタ 154…2乗誤差計算回路 155…最小歪探索回路 160…ビット列クラス分け器 170…誤り訂正符号器 171…誤り訂正符号器 180…インタリーバ 181…出力端子
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/12
Claims (1)
- 【請求項1】 入力した音声信号を参照しながら複数の
駆動信号を格納したコードブック及び複数の雑音パラメ
ータを格納した雑音コードブックに基づいて前記音声信
号を符号化する音声符号化装置において、 第1の駆動信号を複数格納した適応コードブックと、 第1の雑音パラメータを複数格納した第1の雑音コード
ブックと、 前記第1の雑音パラメータより優先度の低い第2の雑音
パラメータを複数格納した第2の雑音コードブックと、 前記適応コードブック及び前記第1の雑音コードブック
からの情報に基づいて、前記第1の駆動信号を生成する
第1の駆動信号生成手段と、 前記適応コードブック及び前記第1及び第2の雑音コー
ドブックからの情報に基づいて、第2の駆動信号を生成
する第2の駆動信号生成手段と、 この生成された前記第1の駆動信号を遅延させて前記適
応コードブックに格納する手段と、 前記第1の駆動信号に基づく情報が前記第2の駆動信号
に基づく情報より伝送誤りが少なくなるように伝送処理
する伝送処理手段と、を具備したことを特徴とする音声
符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07677792A JP3212123B2 (ja) | 1992-03-31 | 1992-03-31 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07677792A JP3212123B2 (ja) | 1992-03-31 | 1992-03-31 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05281998A JPH05281998A (ja) | 1993-10-29 |
JP3212123B2 true JP3212123B2 (ja) | 2001-09-25 |
Family
ID=13615028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07677792A Expired - Fee Related JP3212123B2 (ja) | 1992-03-31 | 1992-03-31 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3212123B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
-
1992
- 1992-03-31 JP JP07677792A patent/JP3212123B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05281998A (ja) | 1993-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3102015B2 (ja) | 音声復号化方法 | |
Campbell Jr et al. | The DoD 4.8 kbps standard (proposed federal standard 1016) | |
US7016831B2 (en) | Voice code conversion apparatus | |
US5729655A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
EP0409239B1 (en) | Speech coding/decoding method | |
EP0573398B1 (en) | C.E.L.P. Vocoder | |
JP3392412B2 (ja) | 音声コーディング装置及び音声エンコーディング方法 | |
KR100487943B1 (ko) | 음성 코딩 | |
EP0802524B1 (en) | Speech coder | |
JP2003512654A (ja) | 音声の可変レートコーディングのための方法およびその装置 | |
WO2001020595A1 (en) | Voice encoder/decoder | |
US5659659A (en) | Speech compressor using trellis encoding and linear prediction | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JPH10177398A (ja) | 音声符号化装置 | |
JP3212123B2 (ja) | 音声符号化装置 | |
Gerson et al. | A 5600 bps VSELP speech coder candidate for half-rate GSM | |
JP3249144B2 (ja) | 音声符号化装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP3089967B2 (ja) | 音声符号化装置 | |
JP3102017B2 (ja) | 音声符号化方法 | |
US7716045B2 (en) | Method for quantifying an ultra low-rate speech coder | |
JP3192051B2 (ja) | 音声符号化装置 | |
KR20060064694A (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JP3270146B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |