JP3754819B2 - 音声通信方法及び音声通信装置 - Google Patents
音声通信方法及び音声通信装置 Download PDFInfo
- Publication number
- JP3754819B2 JP3754819B2 JP07518098A JP7518098A JP3754819B2 JP 3754819 B2 JP3754819 B2 JP 3754819B2 JP 07518098 A JP07518098 A JP 07518098A JP 7518098 A JP7518098 A JP 7518098A JP 3754819 B2 JP3754819 B2 JP 3754819B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- codebook
- frame
- information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、適応符号帳(又は長期予測とも呼ばれる)を使用する音声符号化・復号化技術を用いた音声通信方法及び音声通信装置に係り、特に再生音声の品質を向上できる音声通信方法及び音声通信装置に関する。
【0002】
【従来の技術】
まず、従来の音声通信装置の概略構成について図5を使って説明する。図5は、従来の音声通信装置の概略構成を示すブロック図である。
従来の音声通信装置は、図5に示すように、送信部分として、送信する音声を入力してサンプリング、量子化しフレーム単位で入力音声を出力する音声入力部1と、入力音声を符号化して音声符号化情報を出力する音声符号化器2と、音声符号化情報を送信する送信部3とから構成されている。
また、受信部分としては、伝送されたフレーム単位の音声符号化情報を受信する受信部4と、受信音声符号化情報を復号化して音声を再生する音声復号化器5と、再生された音声を出力する音声出力部6から構成されている。
【0003】
ここで、音声符号化器2は、適応符号帳(又は長期予測とも呼ばれる)を使用する音声符号化技術で符号化を行うもので、例えば、移動体通信等で最も広く用いられている音声の符号化方式である符号励振型線形予測(Code Excited Linear Prediction:CELP)音声符号化方式がよく知られている。
【0004】
符号励振型線形予測(CELP)音声符号化方式は、フレーム単位で符号化を行い、1つ前のフレームの符号化情報に基づいて現在のフレームの音声を予測し、予測結果を最適化してその情報を現フレームの音声符号化情報とし、更に当該最適化された予測結果を次のフレームの符号化の際に使用するようになっている。
【0005】
従って、音声復号化器5で行う符号励振型線形予測(CELP)の音声復号化方式は、フレーム単位で復号化を行い、1つ前のフレームで復号化した結果を利用して、受信した音声符号化情報に従って復号化を行い、更に当該復号結果を次のフレームの復号化の際に使用するようになっている。
【0006】
送信部3は、音声符号化器2で符号化されたフレーム単位の音声符号化情報を送信するものであるが、送信側の音声符号化器2と受信側の音声復号器との間でフレーム同期を保持、および補正するために、音声符号化情報を送信する際に所定のフレーム周期毎にフレーム同期信号を音声符号化情報と入れ替えて送信するようになっている。
【0007】
そして、受信部4では、フレーム単位で伝送される音声符号化情報又はフレーム同期信号を受信し、音声符号化情報の場合は記憶エリアに記憶してから当該音声符号化情報を音声復号化器5に出力し、フレーム同期信号の場合は、記憶エリアに記憶されている例えば1つ前のフレームの音声符号化情報を音声復号化器5に出力するようになっている。
【0008】
次に、従来の音声通信装置の動作について、図6を使って具体的に説明する。図6は、従来の音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。尚、図6では、音声符号化処理に要する処理時間は1フレームであり、再生音声の復号処理に要する処理時間は1フレームであるとして示している。
【0009】
図6においてftn(n=0、1、2、…)は送信側(音声符号化器側)でのフレーム番号を示すインデックスであり、frn(n=0、1、2、…)は受信側(音声復号器側)でのフレーム番号を示すインデックスである。
【0010】
従来の音声通信装置では、送信側の動作として、音声入力部1において図6(a)に示すように、音声が入力されサンプリング,量子化され、1フレーム分の長さを有する入力バッファに蓄積される。
【0011】
そして、音声入力部1で蓄積された音声は、音声符号化器2で図6(b)に示すようにフレーム単位で音声符号化情報が抽出される(図6では音声情報抽出と表示している)。
ここで、音声符号化情報の抽出は、入力バッファに1フレーム分の音声信号の蓄積が終了した後に開始される。例えば、フレームft0の区間で蓄積された音声はフレームft1の区間で抽出処理(符号化処理)が為される。
【0012】
そして、音声符号化器2で抽出された音声符号化情報が、出力部3で図6(c)に示すように送信される(図6では音声情報送信と表示している)。
ここで、音声符号化情報送信は抽出処理が完了した後に開始される。例えば、フレームft1の区間で抽出された音声情報はフレームft2の先頭から送信が開始される。
【0013】
従来の音声通信装置において通常は、この音声入力、音声情報抽出、音声情報送信が繰り返されるが、受信側とのフレームの同期を確保するために、送信部3における送信処理において所定のフレーム周期毎に音声符号化情報の代わりにフレーム同期信号を送信する。
【0014】
図6の例では、50フレーム毎(フレームft2、ft52、…)にフレーム同期信号を送信しており、この時送信すべき音声符号化情報は送信されない。例えば、フレームft2で送信すべきフレームft1で抽出された音声符号化情報は送信されないことになる。
【0015】
一方、従来の音声通信装置の受信側の動作は、受信部4で図6(d)に示すように音声符号化情報が受信されて受信バッファに蓄積される。
但し、図6の例では1フレーム分の音声符号化情報を受信するのに1フレーム分の時間を要するものとし、また、50フレーム毎(フレームfr2、fr52、…)にフレーム同期信号を受信している。
【0016】
そして、受信部4で蓄積された音声符号化情報によって、次のフレーム区間では復号化のための符号化情報が更新されて図6(e)に示すように音声復号化器5で音声復号処理により音声が再生され(図6では音声情報更新と表示している)、音声出力部6によって図6(f)に示すように再生音声が出力される(図6では再生音声出力と表示している)。
【0017】
例えば、フレームfr0で受信した音声符号化情報に対し、次フレームの区間fr1で復号処理を行い、次のフレーム区間fr2で再生音声を出力する。
【0018】
但し、受信部4が50フレーム毎(例えばフレームfr2、fr52、… )にフレーム同期信号を受信した場合は、これらのフレームに対しフレームfr3、fr531、… で音声復号処理する際、該当するフレームの音声符号化情報が存在しないため、他のフレームで受信した音声符号化情報により補間処理を行う。
補間処理の一例としては、前フレームで受信した音声符号化情報で置換する方法などがある。
【0019】
そして、補間された音声符号化情報を用いて音声符号化器5で復号化が行われ、再生音声が出力される。
【0020】
【発明が解決しようとする課題】
しかしながら、上記従来の音声通信方法及び音声通信機装置は、フレーム同期信号を送信するフレーム区間は送信すべき音声符号化情報を廃棄してしまい、受信側で当該区間の音声符号化情報を補間により生成して復号化を行うので、当該フレーム区間の実際の音声符号化情報を用いた復号化に比べて再生音声の品質が劣下するという問題点があった。
【0021】
更に、従来の音声通信方法及び音声通信装置では、前フレームの音声符号化情報を反映させながら次フレームの符号化を行い、復号化においても前フレームの音声復号結果を反映させながら次フレームの復号化を行う符号化・復号化方法を用いているので、上記再生音声出力の品質劣下がそれに続くフレームの復号化にも影響し、再生音声の品質劣下が数フレームに及び連続的に発生するという問題点があった。
【0022】
本発明は上記実情に鑑みて為されたもので、フレーム同期信号送信に伴う受信側での音声符号化情報の補間と同様の処理を送信側で施すことによって、フレーム同期信号送信によって音声符号化情報が廃棄されたフレームの再生音声の品質劣下をそれに続くフレームに影響しないようにして、再生音声の品質劣化を軽減できる音声通信方法及び音声通信装置を提供することを目的とする。
【0023】
【課題を解決するための手段】
上記従来例の問題点を解決するための請求項1記載の発明は、適応符号帳を使用する音声符号化・復号化処理を用いた音声通信方法であって、送信側で入力音声信号を前記音声符号化処理することで音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報を音声復号化処理することで音声信号を再生する音声通信方法において、送信側から周期的に音声符号化情報に替えて同期信号が送信される場合に、前記送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【0024】
上記従来例の問題点を解決するための請求項2記載の発明は、請求項1記載の音声通信方法において、音声符号化情報の補間処理は、1つ前のフレームで得られた音声符号化情報を用いるようにしたものが考えられる。
【0025】
上記従来例の問題点を解決するための請求項3記載の発明は、音声通信装置において、音声を入力して音声信号を出力する音声入力部と、前記音声信号を適応符号帳を用いて音声符号化処理を行い、音声符号化情報を抽出する音声符号化器と、前記音声符号化情報を送信すると共に周期的に音声符号化情報に替えて同期信号を送信する送信部とを有する送信側と、送信された音声符号化情報を受信すると共に、前記同期信号を受信すると音声符号化情報の補間処理として前フレームで得られた音声符号化情報を出力する受信部と、音声符号化情報を適応符号帳を用いて復号化して音声信号を出力する音声復号化器と、前記音声信号を音声として出力する音声出力部とを有する受信側とを備え、前記音声符号化器が、前記送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信部で為される補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【0026】
上記従来例の問題点を解決するための請求項4記載の発明は、音声通信装置において、入力音声信号についてフレーム単位で音声生成系における声道特性を表現するスペクトル包絡情報を抽出し、同期信号が送信されるフレームでは前フレームのスペクトル包絡情報を当該フレームのスペクトル包絡情報とするスペクトル包絡パラメータ抽出器と、入力音声信号についてフレーム単位でフレーム電力計算を行ってフレーム電力情報を出力し、同期信号が送信されるフレームでは前フレームのフレーム電力情報を当該フレームのフレーム電力情報とするフレーム電力計算器と、入力音声信号に対して前記スペクトル包絡情報を用いて聴覚重み付け処理を行い、聴覚重み付けされた入力音声信号を出力する聴覚重み付けフィルタと、音源信号における周期成分を表現するための符号帳であって入力される制御信号に従って選択された最適な適応符号の候補ベクトルを出力すると共に音源信号の入力を受けて適応符号の候補ベクトルの内容を更新する適応符号帳と、音源信号における雑音成分を表現するための符号帳であって入力される制御信号に従って選択された最適な雑音符号の候補ベクトルを出力する雑音符号帳と、利得を調整するための符号帳であって入力される制御信号に従って選択された適応符号帳用の利得候補ベクトルと雑音符号帳用の利得候補ベクトルとを出力する利得符号帳と、最適な適応符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な適応符号帳ベクトルを出力する第1の乗算器と、最適な雑音符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な雑音符号帳ベクトルを出力する第2の乗算器と、利得調整された最適な適応符号帳ベクトルと利得調整された最適な雑音符号帳ベクトルとを加算し、音源信号を出力する加算器と、前記音源信号に対して前記スペクトル包絡情報を付加すると共に聴覚重み付けを行い、再生音声信号を生成して出力する聴覚重み付け合成フィルタと、前記適応符号帳、前記雑音符号帳、前記利得符号帳における最適の各符号帳ベクトルを探索して各符号帳最適インデックスを出力する符号帳探索処理を行い、同期信号が送信されないフレームでは、前記探索処理で選択された最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させ、同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理にて得られた音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させる適応符号帳更新処理を行う最適候補ベクトル選択器とを有する音声符号化器を具備する送信側の装置を備えたことを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【0027】
上記従来例の問題点を解決するための請求項5記載の発明は、請求項3又は請求項4記載の音声通信装置において、音声符号化情報の補間処理は、1つ前のフレームで得られた音声符号化情報を用いるようにしたものが考えられる。
【0028】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。
本発明の実施の形態に係る音声通信方法及び音声通信装置は、周期的に音声符号化情報の替わりに同期信号が送信されて、受信側で音声符号化情報の補間処理が為される場合に、送信側で同期信号が送信されるフレームに対して受信側で為される音声符号化情報の補間処理と同様の処理を行う音声通信方法及び音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同様の音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができるものである。
【0029】
本発明の実施の形態に係る音声通信装置(本装置)は、図5に示す構成と基本的に同様になっており、但し、音声符号化器2における処理動作が従来のものと相違している。この音声符号化器2の構成及び動作については後述する。
【0030】
まず、本発明の実施の形態に係る音声通信方法を図1を用いて説明する。図1は、本発明の実施の形態に係る音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。尚、図1において、音声符号化処理に要する処理時間は1フレームであり、再生音声の復号処理に要する処理時間は1フレームであるとして示している。
【0031】
ここで、図1に示す処理は、図6に示す処理とほぼ同様であり、但し、音声符号化器2でフレーム単位で音声符号化情報が抽出される処理(図1(b)の処理)が相違している。
具体的には、受信側とのフレームの同期を確保するために、フレームft2で送信部3にて音声符号化情報の代わりにフレーム同期信号を送信する場合には、従来ではフレームft0で音声入力を行い、フレームft1で音声情報抽出を行い、フレームft2で音声情報を送信せずにフレーム同期信号を送信していたが、本発明の実施の形態ではフレームft0で音声入力を行い、フレームft1では音声情報抽出を行わず、音声情報の補間を行い、フレームft2でフレーム同期信号を送信するものである。
【0032】
ここで、フレームft1及びフレームft51における音声情報の補間は、受信側の音声復号化器5における補間と同様のものとする。例えば、前のフレームの音声符号化情報で置換する補間を送信側で行うのであれば、受信側も同様に前のフレームの音声復号化情報で置換する補間を行うこととなる。要するに、送信側と受信側とで同じ補間が為されれば、どのような補間方法を用いても構わない。
【0033】
次に、本発明の実施の形態に係る音声通信方法を実現する音声通信装置について、現在、移動体通信等で最も広く用いられている音声の符号化方式である符号励振型線形予測(Code Excited Linear Prediction:CELP)音声符号化・復号化方法を例にとって説明する。
【0034】
CELP音声符号化・復号化方法では、送信側でフレーム単位で音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報に基づいて復号化を行うようになっている。
ここで、CELP音声符号化・復号化方法における音声符号化情報は、[表1]に示す項目がある。尚、[表1]では、入力音声が8kHzでサンプリングされ、16ビットで量子化されている場合の例で、1フレームが40ms,320サンプル、サブフレームが10ms,8サンプルとして示している。
【0035】
【表1】
【0036】
ここで、スペクトル包絡情報b1は、人間の音声生成系における声道特性を表現する情報であり、1フレーム(40ms)毎に抽出される情報である。
また、フレーム電力情報c1は、フレーム(40ms)単位の電力を表す情報である。
【0037】
適応符号帳最適インデックスm1は、音源信号における周期成分を表現するための適応符号帳における最適な候補ベクトルの番号を示す情報であり、雑音符号帳最適インデックスo1は、音源信号における雑音成分を表現するための雑音符号帳における最適な候補ベクトルの番号を示す情報であり、利得符号帳最適インデックスp1は、利得を調整するための利得符号帳における最適な候補ベクトルの番号を示す情報であり、いずれのインデックスもサブフレーム(10ms)毎に抽出される情報である。
【0038】
その結果、フレーム単位で抽出されて送信される音声符号化情報は、1セットのスペクトル包絡情報b1及びフレーム電力情報c1と、4セットの適応符号帳最適インデックスm1及び雑音符号帳最適インデックスo1及び利得符号帳最適インデックスp1で構成される。
【0039】
次に、本発明の実施の形態に係る音声通信装置における音声符号化器(本音声符号化器)について、図2を用いて説明する。図2は、本発明の実施の形態に係る音声通信装置における音声符号化器の構成ブロック図である。
【0040】
本音声符号化器は、図2に示すように、スペクトル包絡パラメータ抽出器11と、フレーム電力計算器12と、適応符号帳13と、聴覚重み付け合成フィルタ14と、最適候補ベクトル選択器15と、雑音符号帳16と、利得符号帳17と、乗算器18と、乗算器19と、加算器20と、聴覚重み付けフィルタ21とから構成されている。
【0041】
次に、本音声符号化器の各部について説明する。
スペクトル包絡パラメータ抽出器11は、音声入力部1において入力されサンプリングされ、更に量子化された入力音声a1をフレーム単位で入力して、スペクトル包絡情報b1を抽出し、音声符号化情報の一部として出力するものである。
【0042】
但し、本発明のスペクトル包絡パラメータ抽出器11の特徴部分として、後述する最適候補ベクトル選択器15から出力される抽出/置換の制御信号q1を入力し、制御信号が抽出を指示している場合は、入力音声a1のフレームのスペクトル包絡情報b1を抽出し、制御信号が置換を指示している場合は、抽出を行わずに補間用の音声情報で置き換えを行ってスペクトル包絡情報b1を出力するようになっている。
【0043】
尚、補間用の音声情報とは、例えば1つ前のフレームの音声情報(スペクトル包絡情報b1)である。
また、抽出と置換との切り替えは、最適候補ベクトル選択器15からの制御信号q1によらず、内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【0044】
ここで、スペクトル包絡情報は、人間の音声生成系における声道特性を表現する情報であり、スペクトル包絡情報b1は量子化された後、復号器側に伝送され再生音声信号を生成するのに用いられる。また、後述するように聴覚重み付けフィルタ21及び聴覚重み付け合成フィルタ14において聴覚重み付けを行う時に用いられる。
【0045】
フレーム電力計算器12は、音声入力部1からの入力音声a1をフレーム単位で入力して、フレーム電力計算を行い、フレーム電力情報c1を音声符号化情報の一部として出力するものである。
ここで、フレーム電力情報c1は復号器側に伝送され再生音声信号を生成するのに用いられる。また、後述するように最適候補ベクトル選択器15で利得符号帳17を探索する処理においてフレーム電力情報が用いられる。
【0046】
但し、本発明のフレーム電力計算器12の特徴部分として、後述する最適候補ベクトル選択器15から出力される抽出/置換の制御信号q1を入力し、制御信号が抽出を指示している場合は、入力音声a1のフレームのフレーム電力情報c1を抽出し、制御信号が置換を指示している場合は、抽出を行わずに補間用の音声情報で置き換えを行ってフレーム電力情報c1を出力するようになっている。
【0047】
尚、補間用の音声情報とは、例えば1つ前のフレームの音声情報(フレーム電力情報c1)である。
また、抽出と置換との切り替えは、最適候補ベクトル選択器15からの制御信号q1によらず、内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【0048】
聴覚重み付けフィルタ21は、音声入力部1からの入力信号a1に対し、サブフレーム単位でスペクトル包絡情報(パラメータ)b1を用いて聴覚重み付け処理(公知の技術)を行い、聴覚重み付けされた入力音声nlを出力するものである。
【0049】
適応符号帳13は、音源信号における周期成分を表現するための符号帳であり、例えば、128種類のピッチ成分のパターンを予め記憶しており(サイズ128、80次元)、更に1つ前のサブフレームで抽出された最適な適応符号帳ベクトル及び雑音符号帳ベクトル及び利得符号帳ベクトルにより生成された音源信号を記憶する前音源信号エリアが設けられている。
そして、入力される制御信号l1に従って選択された最適な適応符号の候補ベクトルd1を出力するようになっている。
【0050】
雑音符号帳16は、音源信号における雑音成分を表現するための符号帳であり、例えば、512種類の雑音成分のパターンを記憶していて(サイズ512、80次元)、入力される制御信号l1に従って選択された最適な雑音符号の候補ベクトルf1を出力するようになっている。
【0051】
利得符号帳17は、利得を調整するための符号帳であり、例えば、128種類の利得パターンを記憶していて(サイズ128、2次元)、入力される制御信号l1に従って選択された適応符号用の利得候補ベクトルh1と、雑音符号用の利得候補ベクトルi1とを出力するようになっている。
【0052】
乗算器18は、最適な適応符号帳ベクトルd1に利得の候補ベクトルh1を乗算し、利得調整された最適な適応符号帳ベクトルe1を出力するものである。
乗算器19は、最適な雑音符号帳ベクトルf1に利得の候補ベクトルi1を乗算し、利得調整された最適な雑音符号帳ベクトルg1を出力するものである。
加算器20は、利得調整された最適な適応符号帳ベクトルe1と利得調整された最適な雑音符号帳ベクトルg1とを加算し、音源信号j1を出力するものである。
【0053】
聴覚重み付け合成フィルタ14は、音源信号j1に対してスペクトル包絡情報b1を付加すると共に聴覚重み付けを行い、再生音声k1を生成して出力するものである。
【0054】
具体的には、音源信号j1にスペクトル包絡情報b1を付加するための合成フィルタの係数に聴覚重み付けをするための修正を施してからフィルタリングを行うことになる。
【0055】
最適候補ベクトル選択器15は、基本的にはサブフレーム単位で適応符号帳13,雑音符号帳16,利得符号帳17における最適な符号帳ベクトルを選択するものであるが、本発明の特徴部分としてスペクトル包絡パラメータ抽出器11及びフレーム電力計算器12への抽出/置換の制御信号q1を出力するようになっている。
【0056】
ここで、抽出/置換の制御信号q1は、スペクトル包絡パラメータ抽出器11及びフレーム電力計算器12において音声情報を抽出するか、又は音声情報を抽出せずに補間用の音声情報で置き換えるかを指示する信号である。
つまり、最適候補ベクトル選択器15は、通常のフレームの際にはスペクトル包絡パラメータ抽出器11及びフレーム電力計算器12に対して抽出/置換の制御信号q1で抽出を指示し、同期信号が送信されるフレームの際には、抽出/置換の制御信号q1で置換を指示するようになっている。
【0057】
尚、最適候補ベクトル選択器15から制御信号q1は出力せずに、スペクトル包絡パラメータ抽出器11及びフレーム電力計算器12において内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【0058】
また、最適候補ベクトル選択器15における最適な符号帳ベクトルの探索は、サブフレーム単位で、適応符号帳13,雑音符号帳16,利得符号帳17における最適な各符号帳ベクトルを探索して各最適な各符号帳ベクトルの番号を符号帳最適インデックスm1、o1、p1として出力する符号帳探索処理と、抽出した音声符号化情報又は補間した音声符号化情報を次のフレームの符号帳探索に適応するための適応符号帳更新処理を行い、これをサブフレームの数だけ繰り返す。その結果、例えば1フレームが40ms、サブフレームが10msの場合は、1フレームについて4セットの各符号帳最適ベクトルを抽出して音声符号化情報の一部として出力するようになっている。
【0059】
但し、本発明の特徴部分として、フレーム内の最後のサブフレームについては、符号帳探索処理終了後に、所定フレーム毎に復号器側と同様の音声符号化情報の補間を行う音声情報補間処理を行うようになっている。
音声情報補間処理の詳細については、後述する。
【0060】
符号帳探索処理は具体的に、制御信号l1により適応符号帳13、雑音符号帳16、利得符号帳17から出力される各候補ベクトルを制御し、各候補ベクトルに対する再生音声k1と聴覚重み付けされた入力音声n1との自乗平均誤差を計算して、それが最小となる候補ベクトルを最適ベクトルとして選定する符号帳探索を行い、各符号帳(適応、雑音および利得符号帳)の最適ベクトルの番号を符号帳最適インデックスm1、o1、p1とし、音声符号化情報の一部として出力する処理である。
【0061】
ここで、最適候補ベクトル選択器15によりサブフレーム毎に実行される符号帳探索の手順について説明する。
最適候補ベクトル選択器15における符号帳探索の概要は、まず第1段階として適応符号帳13における最適な適応符号帳ベクトルを探索する適応符号帳探索(長期予測とも呼ばれる)を行い、次に第2段階として雑音符号帳16における最適な雑音符号帳ベクトルを探索する雑音符号帳探索を行い、最適な適応符号帳ベクトル及び雑音符号帳ベクトルが決定した後に、最後の第3段階として利得符号帳探索を行うようになっている。
なお、各符号帳探索の詳細については、本発明の音声通信装置の動作で説明する。
【0062】
そして、適応符号帳更新処理は、選択された最適な適応、雑音、利得符号帳ベクトルで生成される音源信号j1、又は補間処理によって前フレームの音声符号化情報で置換された符号帳ベクトルで生成される音源信号j1により、適応符号帳13の内部メモリを更新することによって、次サブフレームで用いる適応符号帳13を作成する処理である。
【0063】
ここで、適応符号帳13の内部メモリを更新する具体的な方法は、例えば、現在記憶されている適応符号帳13(例えば、160サンプル記憶している)の内容をサブフレーム長(80サンプル)分過去の方向にシフトし、その結果後半部分(新しい部分)には0が入ることになり、その部分に現サブフレームで得られた音源信号(80サンプル)を代入するようになっている。
【0064】
次に、本発明の特徴部分である音声符号化情報補間処理は、音声符号化情報抽出対象のフレームが所定フレーム毎に送信部3からフレーム同期信号を送信するフレームである場合に、復号化の際の音声符号化情報の補間処理と同様の処理を行うものである。
【0065】
具体的には、補間処理方法が例えば前フレームの音声符号化情報での置換を施すような場合には、最適候補ベクトル選択器15内に前フレームの音声符号化情報を記憶し、最後のサブフレームの符号帳探索終了後に、記憶されている前フレームの音声符号化情報の中の各符号帳の最適インデックスm1,o1,p1に従って、適応符号帳13,雑音符号帳16,利得符号帳17から前フレームの適応符号帳最適ベクトルd1及び雑音符号帳最適ベクトルf1及び利得符号帳最適ベクトルh1,i1が出力されるように制御信号l1を制御し、その結果得られた音源信号j1で前述した適応符号帳更新処理を行って適応符号帳13の内部メモリ内容の更新が行われるようになっている。
【0066】
ここで、音声符号化情報補間処理の制御フローについて、図3を用いて説明する。図3は、本音声符号化器の最適候補ベクトル選択器15における音声符号化情報補間処理の流れを示すフローチャート図である。尚、図3において、フレームカウンタCfは符号化開始時にリセットされているものとし、50フレーム毎にフレーム同期信号が挿入されるものとする。
【0067】
本音声符号化器の最適候補ベクトル選択器15における音声符号化情報補間処理は、フレームカウンタCfをインクリメントし(100)、Cfが50より大きいか判断し(102)、Cfが50より大きくない場合(No)は、選択された適応、雑音、利得の符号帳最適インデックスm1,o1,p1を現フレームの音声符号化情報として記憶し(110)、補間処理を終了する。
【0068】
一方、処理102において、Cfが50より大きくなった場合(Yes)は、フレームカウンタCfをリセットし(104)、前フレームの音声符号化情報を現フレームの音声符号化情報として置換し(106)、補間処理を終了する。
【0069】
次に、本音声符号化器の動作について、図2を使って説明する。
本音声符号化器では、フレーム単位で入力音声a1が入力されると、スペクトル包絡パラメータ抽出器11でスペクトル包絡情報b1が抽出されて音声符号化情報の一部として送信部3に出力されると共に、聴覚重み付け合成フィルタ14及び聴覚重み付けフィルタ21に与えられる。
一方、フレーム電力計算器12において入力音声a1からフレーム電力情報c1が抽出されて、送信部3に音声符号化情報の一部として出力されると共に、最適候補ベクトル選択器15に与えられる。
【0070】
尚、この時、スペクトル包絡パラメータ抽出器11及びフレーム電力計算器12では、最適候補ベクトル選択器15からの抽出/置換の制御信号q1に従って、同期信号が送信されるフレームの時には、抽出を行わずにそれぞれ補間用の情報で置換されたスペクトル包絡情報b1及びフレーム電力情報c1が出力される。
【0071】
そして以降はサブフレーム単位で、入力音声a1に対して、聴覚重み付けフィルタ21でスペクトル包絡パラメータ抽出器11からのスペクトル包絡情報b1を用いて聴覚重み付けが為され、聴覚重み付けされた入力音声nlが最適候補ベクトル選択器15に出力される。
【0072】
また、最適候補ベクトル選択器15において、符号帳探索処理の第1段階である適応符号帳探索の動作として、制御信号l1によって、まず適応符号帳13に記憶された候補ベクトルd1が順に適応符号帳13から出力されるようにし、この時雑音符号帳16及び利得符号帳17からは候補ベクトルが出力されないように制御信号l1を制御する。
【0073】
すると、適応符号帳13から記憶された候補ベクトルd1が順に出力され、乗算器18及び加算器20をスルーし、周期性を有する音源信号j1として出力され、聴覚重み付け合成フィルタ14でスペクトル包絡パラメータ抽出器11からのスペクトル包絡情報b1を付加すると共に聴覚重み付けが行われ、部分的な再生音声(適応符号帳寄与分)k1が生成されて出力される。
【0074】
そして、最適候補ベクトル選択器15では、各候補ベクトルd1に対して生成された部分的な再生音声(適応符号帳寄与分)k1に対し最適な利得が与えられた後に、聴覚重み付けフィルタ21から出力される聴覚重み付けされた入力音声n1との自乗平均誤差が各々計算され、それが最小となる候補ベクトルd1が最適な適応符号帳ベクトルとして選定され、選定されたベクトルの番号が適応符号帳13の符号帳最適インデックスm1として出力される。
【0075】
ここで、最適な利得とは、自乗平均誤差の計算式で再生信号k1に乗算される利得に対して偏微分した結果を0とおくことにより、自乗平均誤差が最小となる利得(最適な利得)を求め、この利得を固定して再生信号ベクトルk1を順次取り替えて自乗平均誤差を求めることにより最適な適応符号帳ベクトルの探索が行われるようになっている。
尚、自乗平均誤差の計算方法については、公知の技術であるので、ここでは詳細な説明を省略する。
【0076】
次に、最適候補ベクトル選択器15において、符号帳探索処理の第2段階である雑音符号帳探索の動作として、制御信号l1によって、まず雑音符号帳16に記憶された候補ベクトルf1が順に雑音符号帳16ら出力されるようにし、この時適応符号帳13及び利得符号帳17からは候補ベクトルが出力されないように制御信号l1を制御する。
【0077】
すると、雑音符号帳16から記憶された候補ベクトルf1が順に出力され、乗算器19及び加算器20をスルーし、雑音の音源信号j1として出力され、聴覚重み付け合成フィルタ14でスペクトル包絡パラメータ抽出器11からのスペクトル包絡情報b1を付加すると共に聴覚重み付けが行われ、部分的な再生音声(雑音符号帳寄与分)k1が生成されて出力される。
【0078】
ここで、雑音符号帳探索において、各候補ベクトルf1には、再生音声の量子化誤差を低減するため、聴覚重み付け合成フィルタ処理された最適な適応符号帳ベクトルに対し直交化処理が施される(公知の技術)。
しかし、便宜上各候補ベクトルに対する再生音声k1について直交化処理を行っても同じ結果が得られるので、本発明では直交化処理が最適候補ベクトル選択器15で行われるものとする。
【0079】
そこで、最適候補ベクトル選択器15では、各候補ベクトルf1に対して生成された部分的な再生音声(雑音符号帳寄与分)k1に対し直交化処理を施し、更に最適な利得が与えられた後に、聴覚重み付けフィルタ21から出力される聴覚重み付けされた入力音声n1との自乗平均誤差が各々計算され、それが最小となる候補ベクトルf1が最適な雑音符号帳ベクトルとして選定され、選定されたベクトルの番号が雑音符号帳の符号帳最適インデックスo1として出力される。
【0080】
次に、最適候補ベクトル選択器15において、符号帳探索処理の第3段階である利得符号帳探索の動作として、制御信号l1によって、適応符号帳13からは上記適応符号帳探索で決定した最適な適応符号帳ベクトルd1が、また雑音符号帳16からは上記雑音符号帳探索で決定した最適な雑音符号帳ベクトルf1が出力されるようにして、更に利得符号帳17から適応符号用の利得候補ベクトルh1と、雑音符号用の利得候補ベクトルi1とが記憶されている全てについて順番に出力されるようにする。
【0081】
これにより、適応符号帳13からは最適な適応符号帳ベクトルd1が出力され、乗算器18で利得符号帳17から出力される適応符号用の利得候補ベクトルh1と乗算されて、利得調整が為された最適な適応符号帳ベクトルe1が出力される。
一方、雑音符号帳16からは最適な雑音符号帳ベクトルf1が出力され、乗算器19で利得符号帳17から出力される雑音符号用の利得候補ベクトルi1と乗算されて、利得調整が為された最適な雑音符号帳ベクトルg1とが出力される。
【0082】
そして、利得調整が為された最適な適応符号帳ベクトルe1と利得調整が為された最適な雑音符号帳ベクトルg1とが加算器20で加算されて音源信号j1が生成され、聴覚重み付け合成フィルタ14で、スペクトル包絡情報b1が付加されるとともに聴覚重み付けが施された再生音声k1が出力されることになる。
【0083】
そして、最適候補ベクトル選択器15においてフレーム電力計算器12から出力されるフレーム電力情報c1を用いて聴覚重み付けフィルタ21から出力される聴覚重み付けされた入力音声n1に正規化が施され、再生音声k1の前記正規化された入力音声n1に対する聴覚重み付き自乗平均誤差を求め、それが最小となる適応符号用の利得候補ベクトルh1と、雑音符号用の利得候補ベクトルi1とが最適な利得符号帳ベクトルとして選定され、選定されたベクトルの番号が利得符号帳の最適利得インデックスp1として出力されるようになっている。
【0084】
そして、符号帳探索処理の結果選択された適応符号帳最適ベクトルd1及び雑音符号帳最適ベクトルf1及び利得符号帳最適ベクトルh1,i1が適応符号帳13,雑音符号帳16,利得符号帳17から出力されるように制御信号l1を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号j1で適応符号帳13の内部メモリ内容が更新され、その更新結果が次サブフレームの適応符号帳13として用いられるようになっている。
【0085】
上記サブフレーム単位の動作が繰り返され、最適候補ベクトル選択器15において、最後のサブフレームについての符号帳探索処理が終了したなら、本発明の特徴部分である音声符号化情報補間処理の動作として、フレーム同期信号が送信されるフレームである場合に、最適候補ベクトル選択器15内に記憶されている前フレームの音声符号化情報の中の最後のサブフレームの各符号帳最適インデックスm1,o1,p1に従って、適応符号帳13,雑音符号帳16,利得符号帳17から前フレームの適応符号帳最適ベクトルd1及び雑音符号帳最適ベクトルf1及び利得符号帳最適ベクトルh1,i1が出力されるように制御信号l1を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号j1で適応符号帳13の内部メモリ内容が更新され、その補間による更新結果が次サブフレームの適応符号帳13として用いられるようになっている。
【0086】
また、フレーム同期信号が送信されるフレームでない場合には、そのまま符号帳探索処理の結果選択された適応符号帳最適ベクトルd1及び雑音符号帳最適ベクトルf1及び利得符号帳最適ベクトルh1,i1が適応符号帳13,雑音符号帳16,利得符号帳17から出力されるように制御信号l1を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号j1で適応符号帳13の内部メモリ内容が更新され、その更新結果が次サブフレームの適応符号帳13として用いられるようになっている。
【0087】
次に、本発明の実施の形態に係る音声通信装置における音声復号化器(本音声復号化器)について、図4を用いて説明する。図4は、本発明の実施の形態に係る音声通信装置における音声復号化器の構成ブロック図である。
【0088】
本音声復号化器は、図4に示すように、適応符号帳31と、雑音符号帳32と、利得符号帳33と、乗算器34と、乗算器35と、加算器36と、合成フィルタ37と、ポストフィルタ38とから構成されている。
【0089】
次に、本音声符号化器の各部について説明する。
適応符号帳31は、音声符号器(図1)の適応符号帳13と同じ内容の適応符号帳であり、更に1つ前のサブフレームで生成された音源信号を記憶する前音源信号エリアが設けられている。
そして、受信して入力される適応符号帳最適インデックスm2に従って選択された適応符号帳最適ベクトルd2を出力するようになっている。
【0090】
雑音符号帳32は、音声符号器(図1)の雑音符号帳16と同じ内容の雑音符号帳であり、受信して入力される雑音符号帳最適インデックスo2に従って選択された雑音符号帳最適ベクトルf2を出力するようになっている。
【0091】
利得符号帳33は、音声符号器(図1)の利得符号帳17と同じ内容の利得符号帳であり、受信して入力される利得符号帳最適インデックスp2に従って選択された適応符号帳ベクトルの最適利得h2と雑音符号帳ベクトルの最適利得i2を出力するようになっている。
【0092】
利得制御器39は、適応符号帳ベクトルの利得h2と雑音符号帳ベクトルの利得i2とを入力して、受信したフレーム電力情報c2を用いて利得調整を行い、利得調整された適応符号帳ベクトルの利得h2′と雑音符号帳ベクトルの利得i2′とを出力するものである。
【0093】
乗算器34は、最適な適応符号帳ベクトルd2に利得調整された利得h2′を乗算し、利得調整された最適な適応符号帳ベクトルe2を出力するものである。
乗算器35は、最適な雑音符号帳ベクトルf2に利得調整された利得i2′を乗算し、利得調整された最適な雑音符号帳ベクトルg2を出力するものである。
加算器36は、利得調整された最適な適応符号帳ベクトルe2と利得調整された最適な雑音符号帳ベクトルg2とを加算し、音源信号j2を再生するものである。
【0094】
合成フィルタ37は、音源信号j2に受信したベクトル包絡情報b2を付加することにより再生音声k2を生成するものである。
ポストフィルタ38は、聴感上の再生音声品質を向上するため、再生音声k2に対しホルマント強調処理を行いホルマント強調処理された再生音声a2を出力するものである。
【0095】
次に、本音声復号化器の動作について図4を用いて説明する。
本音声復号化器では、フレーム単位で受信した表1に示す音声符号化情報に従って再生音声を生成する。以下にその動作を説明する。
まず、サブフレーム(10ms、80サンプル)毎に以下の処理を行い、音源信号j2が再生される。
【0096】
具体的には、受信した適応符号帳最適インデックスm2、雑音符号帳最適インデックスo2を基に、適応符号帳31、雑音符号帳32からそれぞれ適応符号帳最適ベクトルd2、雑音符号帳最適ベクトルf2が出力される。
一方、受信した利得符号帳最適インデックスp2を基に、利得符号帳33から適応符号帳ベクトルの利得h2と雑音符号帳ベクトルの利得i2とが出力され、受信したフレーム電力情報c2を用いて利得制御器39で利得調整が行われ、利得調整された適応符号帳ベクトルの利得h2′と雑音符号帳ベクトルの利得i2′とが出力される。
【0097】
適応符号帳31から出力された適応符号帳最適ベクトルd2は、乗算器34で利得制御器39からの利得調整された適応符号帳ベクトルの利得h2′が乗算されて利得調整された最適な適応符号帳ベクトルe2が出力され、同様に雑音符号帳32から出力された雑音符号帳最適ベクトルf2は、乗算器35で利得制御器39からの利得調整された雑音符号帳ベクトルの利得i2′が乗算されて利得調整された最適な適応符号帳ベクトルg2が出力され、加算器36でe2とg2が加算されて音源信号j1が再生される。
【0098】
適応符号帳31では音源信号j2の再生が終了した後に、その音源信号j2により更新され、その更新結果が次サブフレームの適応符号帳として用いられる。
ここで、本音声復号化器の適応符号帳31の更新結果は、伝送誤りがない場合には本音声符号化器の適応符号帳13の更新結果と全く等しくなるはずである。
【0099】
そして、フレーム(40m雑音符号帳320サンプル)毎に以下の処理が実行される。
加算器36から出力された音源信号j2は、合成フィルタ37で受信したベクトル包絡情報b2が付加されて再生音声k2が生成され、更にポストフィルタ38で聴感上の再生音声品質を向上するためのホルマント強調処理が施されて再生音声a2が出力されるようになっている。
【0100】
本発明の実施の形態の音声通信方法によれば、送信側の音声符号化側(送信側)においてフレーム同期信号を送信するフレームに対する音声符号化情報抽出処理で、復号化側(受信側)での音声符号化情報補間処理と同一の補間処理を施すので、送信側の音声符号化器と受信側の音声復号器の適応符号帳の内部メモリ内容の更新結果が常に等しく保たれ、フレーム同期信号挿入による再生音声品質劣下が複数フレームに影響せず、再生音声信号の品質劣下を低減できる効果がある。
【0101】
本発明の実施の形態の音声通信装置によれば、音声符号化器の最適候補ベクトル選択器15において、フレーム内の最後のサブフレームの符号帳探索処理と適応符号帳更新処理との間に音声符号化情報補間処理を挿入して、フレーム同期信号を送信するフレームに対して補間処理を行うので、音声符号化器の最適候補ベクトル選択器15以外の部分及び音声復号化器側は従来のまま使用できるので、容易に実現できる効果がある。
【0102】
また、本発明の音声符号化器は、DSP(デジタル・シグナル・プロセッサ)またはCPUで実現されるため、本発明はそれらのソフトウエアを変更することで容易に実現できる効果がある。
【0103】
【発明の効果】
請求項1,2記載の発明によれば、周期的に送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を送信側で行い、補間処理によって得られた音声符号化情報に従って適応符号帳を更新する音声通信方法としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【0104】
請求項3記載の発明によれば、送信側の音声符号化器が、送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して受信部で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新する音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【0105】
請求項4記載の発明によれば、周期的に同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同様の処理をスペクトル包絡パラメータ抽出器及びフレーム電力計算器及び最適候補ベクトル選択器で行い、補間処理された音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、適応符号帳、雑音符号帳、利得符号帳に制御信号を出力し、適応符号帳、雑音符号帳、利得符号帳で制御信号に従って適応符号、雑音符号、利得の候補ベクトルを出力し、その結果得られる音源信号の入力を受けて適応符号帳が適応符号の候補ベクトルの内容を更新する音声符号化器を具備する送信側装置を備えた音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【0106】
請求項5記載の発明によれば、送信側の音声符号化器が、送信部にて同期信号が送信されるフレームについて受信部で為される音声符号化情報の補間処理と同様に1つ前のフレームで得られた音声符号化情報を用いる補間処理を行う請求項3又は請求項4記載の音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、簡単な処理によって送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。
【図2】本発明の実施の形態に係る音声通信装置における音声符号化器の構成ブロック図である。
【図3】本音声符号化器の最適候補ベクトル選択器15における音声符号化情報補間処理の流れを示すフローチャート図である。
【図4】本発明の実施の形態に係る音声通信装置における音声復号化器の構成ブロック図である。
【図5】従来の音声通信装置の概略構成を示すブロック図である。
【図6】従来の音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。
【符号の説明】
1…音声入力部、 2…音声符号化器、 3…送信部、 4…受信部、 5…音声復号化器、 6…音声出力部、 11…スペクトル包絡パラメータ抽出器、12…フレーム電力計算器、 13…適応符号帳、 14…聴覚重み付け合成フィルタ、 15…最適候補ベクトル選択器、 16…雑音符号帳、 17…利得符号帳、 18…乗算器、 19…乗算器、 20…加算器、 21…聴覚重み付けフィルタ、 31…適応符号帳、 32…雑音符号帳、 33…利得符号帳、 34…乗算器、 35…乗算器、 36…加算器、 37…合成フィルタ、 38…ポストフィルタ、 39…利得制御器
Claims (5)
- 適応符号帳を使用する音声符号化・復号化処理を用いた音声通信方法であって、送信側で入力音声信号を前記音声符号化処理することで音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報を音声復号化処理することで音声信号を再生する音声通信方法において、送信側から周期的に音声符号化情報に替えて同期信号が送信される場合に、前記送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴とする音声通信方法。
- 音声符号化情報の補間処理は、1つ前のフレームで得られた音声符号化情報を用いることを特徴とする請求項1記載の音声通信方法。
- 音声を入力して音声信号を出力する音声入力部と、前記音声信号を適応符号帳を用いて音声符号化処理を行い、音声符号化情報を抽出する音声符号化器と、前記音声符号化情報を送信すると共に周期的に音声符号化情報に替えて同期信号を送信する送信部とを有する送信側と、送信された音声符号化情報を受信すると共に、前記同期信号を受信すると音声符号化情報の補間処理として前フレームで得られた音声符号化情報を出力する受信部と、音声符号化情報を適応符号帳を用いて復号化して音声信号を出力する音声復号化器と、前記音声信号を音声として出力する音声出力部とを有する受信側とを備え、
前記音声符号化器が、前記送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信部で為される補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴とする音声通信装置。 - 入力音声信号についてフレーム単位で音声生成系における声道特性を表現するスペクトル包絡情報を抽出し、同期信号が送信されるフレームでは前フレームのスペクトル包絡情報を当該フレームのスペクトル包絡情報とするスペクトル包絡パラメータ抽出器と、
入力音声信号についてフレーム単位でフレーム電力計算を行ってフレーム電力情報を出力し、同期信号が送信されるフレームでは前フレームのフレーム電力情報を当該フレームのフレーム電力情報とするフレーム電力計算器と、
入力音声信号に対して前記スペクトル包絡情報を用いて聴覚重み付け処理を行い、聴覚重み付けされた入力音声信号を出力する聴覚重み付けフィルタと、
音源信号における周期成分を表現するための符号帳であって入力される制御信号に従って選択された最適な適応符号の候補ベクトルを出力すると共に音源信号の入力を受けて適応符号の候補ベクトルの内容を更新する適応符号帳と、
音源信号における雑音成分を表現するための符号帳であって入力される制御信号に従って選択された最適な雑音符号の候補ベクトルを出力する雑音符号帳と、
利得を調整するための符号帳であって入力される制御信号に従って選択された適応符号帳用の利得候補ベクトルと雑音符号帳用の利得候補ベクトルとを出力する利得符号帳と、
最適な適応符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な適応符号帳ベクトルを出力する第1の乗算器と、
最適な雑音符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な雑音符号帳ベクトルを出力する第2の乗算器と、
利得調整された最適な適応符号帳ベクトルと利得調整された最適な雑音符号帳ベクトルとを加算し、音源信号を出力する加算器と、
前記音源信号に対して前記スペクトル包絡情報を付加すると共に聴覚重み付けを行い、再生音声信号を生成して出力する聴覚重み付け合成フィルタと、
前記適応符号帳、前記雑音符号帳、前記利得符号帳における最適の各符号帳ベクトルを探索して各符号帳最適インデックスを出力する符号帳探索処理を行い、
同期信号が送信されないフレームでは、前記探索処理で選択された最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させ、
同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理にて得られた音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させる適応符号帳更新処理を行う最適候補ベクトル選択器とを有する音声符号化器を具備する送信側の装置を備えたことを特徴とする音声通信装置。 - 音声符号化情報の補間処理は、1つ前のフレームで得られた音声符号化情報を用いることを特徴とする請求項3又は請求項4記載の音声通信装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07518098A JP3754819B2 (ja) | 1998-03-24 | 1998-03-24 | 音声通信方法及び音声通信装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07518098A JP3754819B2 (ja) | 1998-03-24 | 1998-03-24 | 音声通信方法及び音声通信装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11272298A JPH11272298A (ja) | 1999-10-08 |
JP3754819B2 true JP3754819B2 (ja) | 2006-03-15 |
Family
ID=13568762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07518098A Expired - Fee Related JP3754819B2 (ja) | 1998-03-24 | 1998-03-24 | 音声通信方法及び音声通信装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3754819B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002229599A (ja) | 2001-02-02 | 2002-08-16 | Nec Corp | 音声符号列の変換装置および変換方法 |
JP2004151123A (ja) * | 2002-10-23 | 2004-05-27 | Nec Corp | 符号変換方法、符号変換装置、プログラム及びその記憶媒体 |
CN111653283B (zh) * | 2020-06-28 | 2024-03-01 | 讯飞智元信息科技有限公司 | 一种跨场景声纹比对方法、装置、设备及存储介质 |
-
1998
- 1998-03-24 JP JP07518098A patent/JP3754819B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11272298A (ja) | 1999-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9153237B2 (en) | Audio signal processing method and device | |
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
JPH10187197A (ja) | 音声符号化方法及び該方法を実施する装置 | |
JPWO2008072701A1 (ja) | ポストフィルタおよびフィルタリング方法 | |
JP3564144B2 (ja) | “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 | |
JPWO2006120931A1 (ja) | 符号化装置、復号化装置及びこれらの方法 | |
WO2014077254A1 (ja) | 音声符号化装置、音声符号化方法、音声符号化プログラム、音声復号装置、音声復号方法及び音声復号プログラム | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
JP3628268B2 (ja) | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 | |
JP2005338200A (ja) | 音声・楽音復号化装置および音声・楽音復号化方法 | |
JPH07129195A (ja) | 音声復号化装置 | |
JPH08305398A (ja) | 音声復号化装置 | |
JP3426871B2 (ja) | 音声信号のスペクトル形状調整方法および装置 | |
JP3754819B2 (ja) | 音声通信方法及び音声通信装置 | |
JP3905706B2 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JPH11219196A (ja) | 音声合成方法 | |
JP3824706B2 (ja) | 音声符号化/復号化装置 | |
JPH11259098A (ja) | 音声符号化/復号化方法 | |
JP3232728B2 (ja) | 音声符号化方法 | |
JPH11243421A (ja) | デジタル音声通信方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111222 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121222 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |