JP3754819B2

JP3754819B2 - 音声通信方法及び音声通信装置

Info

Publication number: JP3754819B2
Application number: JP07518098A
Authority: JP
Inventors: 誠司佐々木
Original assignee: Hitachi Kokusai Electric Inc
Current assignee: Hitachi Kokusai Electric Inc
Priority date: 1998-03-24
Filing date: 1998-03-24
Publication date: 2006-03-15
Anticipated expiration: 2018-03-24
Also published as: JPH11272298A

Description

【０００１】
【発明の属する技術分野】
本発明は、適応符号帳（又は長期予測とも呼ばれる）を使用する音声符号化・復号化技術を用いた音声通信方法及び音声通信装置に係り、特に再生音声の品質を向上できる音声通信方法及び音声通信装置に関する。
【０００２】
【従来の技術】
まず、従来の音声通信装置の概略構成について図５を使って説明する。図５は、従来の音声通信装置の概略構成を示すブロック図である。
従来の音声通信装置は、図５に示すように、送信部分として、送信する音声を入力してサンプリング、量子化しフレーム単位で入力音声を出力する音声入力部１と、入力音声を符号化して音声符号化情報を出力する音声符号化器２と、音声符号化情報を送信する送信部３とから構成されている。
また、受信部分としては、伝送されたフレーム単位の音声符号化情報を受信する受信部４と、受信音声符号化情報を復号化して音声を再生する音声復号化器５と、再生された音声を出力する音声出力部６から構成されている。
【０００３】
ここで、音声符号化器２は、適応符号帳（又は長期予測とも呼ばれる）を使用する音声符号化技術で符号化を行うもので、例えば、移動体通信等で最も広く用いられている音声の符号化方式である符号励振型線形予測（Code Excited Linear Prediction：ＣＥＬＰ）音声符号化方式がよく知られている。
【０００４】
符号励振型線形予測（ＣＥＬＰ）音声符号化方式は、フレーム単位で符号化を行い、１つ前のフレームの符号化情報に基づいて現在のフレームの音声を予測し、予測結果を最適化してその情報を現フレームの音声符号化情報とし、更に当該最適化された予測結果を次のフレームの符号化の際に使用するようになっている。
【０００５】
従って、音声復号化器５で行う符号励振型線形予測（ＣＥＬＰ）の音声復号化方式は、フレーム単位で復号化を行い、１つ前のフレームで復号化した結果を利用して、受信した音声符号化情報に従って復号化を行い、更に当該復号結果を次のフレームの復号化の際に使用するようになっている。
【０００６】
送信部３は、音声符号化器２で符号化されたフレーム単位の音声符号化情報を送信するものであるが、送信側の音声符号化器２と受信側の音声復号器との間でフレーム同期を保持、および補正するために、音声符号化情報を送信する際に所定のフレーム周期毎にフレーム同期信号を音声符号化情報と入れ替えて送信するようになっている。
【０００７】
そして、受信部４では、フレーム単位で伝送される音声符号化情報又はフレーム同期信号を受信し、音声符号化情報の場合は記憶エリアに記憶してから当該音声符号化情報を音声復号化器５に出力し、フレーム同期信号の場合は、記憶エリアに記憶されている例えば１つ前のフレームの音声符号化情報を音声復号化器５に出力するようになっている。
【０００８】
次に、従来の音声通信装置の動作について、図６を使って具体的に説明する。図６は、従来の音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。尚、図６では、音声符号化処理に要する処理時間は１フレームであり、再生音声の復号処理に要する処理時間は１フレームであるとして示している。
【０００９】
図６においてｆｔｎ（ｎ＝０、１、２、…）は送信側（音声符号化器側）でのフレーム番号を示すインデックスであり、ｆｒｎ（ｎ＝０、１、２、…）は受信側（音声復号器側）でのフレーム番号を示すインデックスである。
【００１０】
従来の音声通信装置では、送信側の動作として、音声入力部１において図６（ａ）に示すように、音声が入力されサンプリング，量子化され、１フレーム分の長さを有する入力バッファに蓄積される。
【００１１】
そして、音声入力部１で蓄積された音声は、音声符号化器２で図６（ｂ）に示すようにフレーム単位で音声符号化情報が抽出される（図６では音声情報抽出と表示している）。
ここで、音声符号化情報の抽出は、入力バッファに１フレーム分の音声信号の蓄積が終了した後に開始される。例えば、フレームｆｔ０の区間で蓄積された音声はフレームｆｔ１の区間で抽出処理（符号化処理）が為される。
【００１２】
そして、音声符号化器２で抽出された音声符号化情報が、出力部３で図６（ｃ）に示すように送信される（図６では音声情報送信と表示している）。
ここで、音声符号化情報送信は抽出処理が完了した後に開始される。例えば、フレームｆｔ１の区間で抽出された音声情報はフレームｆｔ２の先頭から送信が開始される。
【００１３】
従来の音声通信装置において通常は、この音声入力、音声情報抽出、音声情報送信が繰り返されるが、受信側とのフレームの同期を確保するために、送信部３における送信処理において所定のフレーム周期毎に音声符号化情報の代わりにフレーム同期信号を送信する。
【００１４】
図６の例では、５０フレーム毎（フレームｆｔ２、ｆｔ５２、…）にフレーム同期信号を送信しており、この時送信すべき音声符号化情報は送信されない。例えば、フレームｆｔ２で送信すべきフレームｆｔ１で抽出された音声符号化情報は送信されないことになる。
【００１５】
一方、従来の音声通信装置の受信側の動作は、受信部４で図６（ｄ）に示すように音声符号化情報が受信されて受信バッファに蓄積される。
但し、図６の例では１フレーム分の音声符号化情報を受信するのに１フレーム分の時間を要するものとし、また、５０フレーム毎（フレームｆｒ２、ｆｒ５２、…）にフレーム同期信号を受信している。
【００１６】
そして、受信部４で蓄積された音声符号化情報によって、次のフレーム区間では復号化のための符号化情報が更新されて図６（ｅ）に示すように音声復号化器５で音声復号処理により音声が再生され（図６では音声情報更新と表示している）、音声出力部６によって図６（ｆ）に示すように再生音声が出力される（図６では再生音声出力と表示している）。
【００１７】
例えば、フレームｆｒ０で受信した音声符号化情報に対し、次フレームの区間ｆｒ１で復号処理を行い、次のフレーム区間ｆｒ２で再生音声を出力する。
【００１８】
但し、受信部４が５０フレーム毎（例えばフレームｆｒ２、ｆｒ５２、… ）にフレーム同期信号を受信した場合は、これらのフレームに対しフレームｆｒ３、ｆｒ５３１、… で音声復号処理する際、該当するフレームの音声符号化情報が存在しないため、他のフレームで受信した音声符号化情報により補間処理を行う。
補間処理の一例としては、前フレームで受信した音声符号化情報で置換する方法などがある。
【００１９】
そして、補間された音声符号化情報を用いて音声符号化器５で復号化が行われ、再生音声が出力される。
【００２０】
【発明が解決しようとする課題】
しかしながら、上記従来の音声通信方法及び音声通信機装置は、フレーム同期信号を送信するフレーム区間は送信すべき音声符号化情報を廃棄してしまい、受信側で当該区間の音声符号化情報を補間により生成して復号化を行うので、当該フレーム区間の実際の音声符号化情報を用いた復号化に比べて再生音声の品質が劣下するという問題点があった。
【００２１】
更に、従来の音声通信方法及び音声通信装置では、前フレームの音声符号化情報を反映させながら次フレームの符号化を行い、復号化においても前フレームの音声復号結果を反映させながら次フレームの復号化を行う符号化・復号化方法を用いているので、上記再生音声出力の品質劣下がそれに続くフレームの復号化にも影響し、再生音声の品質劣下が数フレームに及び連続的に発生するという問題点があった。
【００２２】
本発明は上記実情に鑑みて為されたもので、フレーム同期信号送信に伴う受信側での音声符号化情報の補間と同様の処理を送信側で施すことによって、フレーム同期信号送信によって音声符号化情報が廃棄されたフレームの再生音声の品質劣下をそれに続くフレームに影響しないようにして、再生音声の品質劣化を軽減できる音声通信方法及び音声通信装置を提供することを目的とする。
【００２３】
【課題を解決するための手段】
上記従来例の問題点を解決するための請求項１記載の発明は、適応符号帳を使用する音声符号化・復号化処理を用いた音声通信方法であって、送信側で入力音声信号を前記音声符号化処理することで音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報を音声復号化処理することで音声信号を再生する音声通信方法において、送信側から周期的に音声符号化情報に替えて同期信号が送信される場合に、前記送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【００２４】
上記従来例の問題点を解決するための請求項２記載の発明は、請求項１記載の音声通信方法において、音声符号化情報の補間処理は、１つ前のフレームで得られた音声符号化情報を用いるようにしたものが考えられる。
【００２５】
上記従来例の問題点を解決するための請求項３記載の発明は、音声通信装置において、音声を入力して音声信号を出力する音声入力部と、前記音声信号を適応符号帳を用いて音声符号化処理を行い、音声符号化情報を抽出する音声符号化器と、前記音声符号化情報を送信すると共に周期的に音声符号化情報に替えて同期信号を送信する送信部とを有する送信側と、送信された音声符号化情報を受信すると共に、前記同期信号を受信すると音声符号化情報の補間処理として前フレームで得られた音声符号化情報を出力する受信部と、音声符号化情報を適応符号帳を用いて復号化して音声信号を出力する音声復号化器と、前記音声信号を音声として出力する音声出力部とを有する受信側とを備え、前記音声符号化器が、前記送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信部で為される補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【００２６】
上記従来例の問題点を解決するための請求項４記載の発明は、音声通信装置において、入力音声信号についてフレーム単位で音声生成系における声道特性を表現するスペクトル包絡情報を抽出し、同期信号が送信されるフレームでは前フレームのスペクトル包絡情報を当該フレームのスペクトル包絡情報とするスペクトル包絡パラメータ抽出器と、入力音声信号についてフレーム単位でフレーム電力計算を行ってフレーム電力情報を出力し、同期信号が送信されるフレームでは前フレームのフレーム電力情報を当該フレームのフレーム電力情報とするフレーム電力計算器と、入力音声信号に対して前記スペクトル包絡情報を用いて聴覚重み付け処理を行い、聴覚重み付けされた入力音声信号を出力する聴覚重み付けフィルタと、音源信号における周期成分を表現するための符号帳であって入力される制御信号に従って選択された最適な適応符号の候補ベクトルを出力すると共に音源信号の入力を受けて適応符号の候補ベクトルの内容を更新する適応符号帳と、音源信号における雑音成分を表現するための符号帳であって入力される制御信号に従って選択された最適な雑音符号の候補ベクトルを出力する雑音符号帳と、利得を調整するための符号帳であって入力される制御信号に従って選択された適応符号帳用の利得候補ベクトルと雑音符号帳用の利得候補ベクトルとを出力する利得符号帳と、最適な適応符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な適応符号帳ベクトルを出力する第１の乗算器と、最適な雑音符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な雑音符号帳ベクトルを出力する第２の乗算器と、利得調整された最適な適応符号帳ベクトルと利得調整された最適な雑音符号帳ベクトルとを加算し、音源信号を出力する加算器と、前記音源信号に対して前記スペクトル包絡情報を付加すると共に聴覚重み付けを行い、再生音声信号を生成して出力する聴覚重み付け合成フィルタと、前記適応符号帳、前記雑音符号帳、前記利得符号帳における最適の各符号帳ベクトルを探索して各符号帳最適インデックスを出力する符号帳探索処理を行い、同期信号が送信されないフレームでは、前記探索処理で選択された最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させ、同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理にて得られた音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させる適応符号帳更新処理を行う最適候補ベクトル選択器とを有する音声符号化器を具備する送信側の装置を備えたことを特徴としており、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる。
【００２７】
上記従来例の問題点を解決するための請求項５記載の発明は、請求項３又は請求項４記載の音声通信装置において、音声符号化情報の補間処理は、１つ前のフレームで得られた音声符号化情報を用いるようにしたものが考えられる。
【００２８】
【発明の実施の形態】
本発明の実施の形態について図面を参照しながら説明する。
本発明の実施の形態に係る音声通信方法及び音声通信装置は、周期的に音声符号化情報の替わりに同期信号が送信されて、受信側で音声符号化情報の補間処理が為される場合に、送信側で同期信号が送信されるフレームに対して受信側で為される音声符号化情報の補間処理と同様の処理を行う音声通信方法及び音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同様の音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができるものである。
【００２９】
本発明の実施の形態に係る音声通信装置（本装置）は、図５に示す構成と基本的に同様になっており、但し、音声符号化器２における処理動作が従来のものと相違している。この音声符号化器２の構成及び動作については後述する。
【００３０】
まず、本発明の実施の形態に係る音声通信方法を図１を用いて説明する。図１は、本発明の実施の形態に係る音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。尚、図１において、音声符号化処理に要する処理時間は１フレームであり、再生音声の復号処理に要する処理時間は１フレームであるとして示している。
【００３１】
ここで、図１に示す処理は、図６に示す処理とほぼ同様であり、但し、音声符号化器２でフレーム単位で音声符号化情報が抽出される処理（図１（ｂ）の処理）が相違している。
具体的には、受信側とのフレームの同期を確保するために、フレームｆｔ２で送信部３にて音声符号化情報の代わりにフレーム同期信号を送信する場合には、従来ではフレームｆｔ０で音声入力を行い、フレームｆｔ１で音声情報抽出を行い、フレームｆｔ２で音声情報を送信せずにフレーム同期信号を送信していたが、本発明の実施の形態ではフレームｆｔ０で音声入力を行い、フレームｆｔ１では音声情報抽出を行わず、音声情報の補間を行い、フレームｆｔ２でフレーム同期信号を送信するものである。
【００３２】
ここで、フレームｆｔ１及びフレームｆｔ５１における音声情報の補間は、受信側の音声復号化器５における補間と同様のものとする。例えば、前のフレームの音声符号化情報で置換する補間を送信側で行うのであれば、受信側も同様に前のフレームの音声復号化情報で置換する補間を行うこととなる。要するに、送信側と受信側とで同じ補間が為されれば、どのような補間方法を用いても構わない。
【００３３】
次に、本発明の実施の形態に係る音声通信方法を実現する音声通信装置について、現在、移動体通信等で最も広く用いられている音声の符号化方式である符号励振型線形予測（Code Excited Linear Prediction：ＣＥＬＰ）音声符号化・復号化方法を例にとって説明する。
【００３４】
ＣＥＬＰ音声符号化・復号化方法では、送信側でフレーム単位で音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報に基づいて復号化を行うようになっている。
ここで、ＣＥＬＰ音声符号化・復号化方法における音声符号化情報は、［表１］に示す項目がある。尚、［表１］では、入力音声が８ｋＨｚでサンプリングされ、１６ビットで量子化されている場合の例で、１フレームが４０ｍｓ，３２０サンプル、サブフレームが１０ｍｓ，８サンプルとして示している。
【００３５】
【表１】

【００３６】
ここで、スペクトル包絡情報ｂ１は、人間の音声生成系における声道特性を表現する情報であり、１フレーム（４０ｍｓ）毎に抽出される情報である。
また、フレーム電力情報ｃ１は、フレーム（４０ｍｓ）単位の電力を表す情報である。
【００３７】
適応符号帳最適インデックスｍ１は、音源信号における周期成分を表現するための適応符号帳における最適な候補ベクトルの番号を示す情報であり、雑音符号帳最適インデックスｏ１は、音源信号における雑音成分を表現するための雑音符号帳における最適な候補ベクトルの番号を示す情報であり、利得符号帳最適インデックスｐ１は、利得を調整するための利得符号帳における最適な候補ベクトルの番号を示す情報であり、いずれのインデックスもサブフレーム（１０ｍｓ）毎に抽出される情報である。
【００３８】
その結果、フレーム単位で抽出されて送信される音声符号化情報は、１セットのスペクトル包絡情報ｂ１及びフレーム電力情報ｃ１と、４セットの適応符号帳最適インデックスｍ１及び雑音符号帳最適インデックスｏ１及び利得符号帳最適インデックスｐ１で構成される。
【００３９】
次に、本発明の実施の形態に係る音声通信装置における音声符号化器（本音声符号化器）について、図２を用いて説明する。図２は、本発明の実施の形態に係る音声通信装置における音声符号化器の構成ブロック図である。
【００４０】
本音声符号化器は、図２に示すように、スペクトル包絡パラメータ抽出器１１と、フレーム電力計算器１２と、適応符号帳１３と、聴覚重み付け合成フィルタ１４と、最適候補ベクトル選択器１５と、雑音符号帳１６と、利得符号帳１７と、乗算器１８と、乗算器１９と、加算器２０と、聴覚重み付けフィルタ２１とから構成されている。
【００４１】
次に、本音声符号化器の各部について説明する。
スペクトル包絡パラメータ抽出器１１は、音声入力部１において入力されサンプリングされ、更に量子化された入力音声ａ１をフレーム単位で入力して、スペクトル包絡情報ｂ１を抽出し、音声符号化情報の一部として出力するものである。
【００４２】
但し、本発明のスペクトル包絡パラメータ抽出器１１の特徴部分として、後述する最適候補ベクトル選択器１５から出力される抽出／置換の制御信号ｑ１を入力し、制御信号が抽出を指示している場合は、入力音声ａ１のフレームのスペクトル包絡情報ｂ１を抽出し、制御信号が置換を指示している場合は、抽出を行わずに補間用の音声情報で置き換えを行ってスペクトル包絡情報ｂ１を出力するようになっている。
【００４３】
尚、補間用の音声情報とは、例えば１つ前のフレームの音声情報（スペクトル包絡情報ｂ１）である。
また、抽出と置換との切り替えは、最適候補ベクトル選択器１５からの制御信号ｑ１によらず、内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【００４４】
ここで、スペクトル包絡情報は、人間の音声生成系における声道特性を表現する情報であり、スペクトル包絡情報ｂ１は量子化された後、復号器側に伝送され再生音声信号を生成するのに用いられる。また、後述するように聴覚重み付けフィルタ２１及び聴覚重み付け合成フィルタ１４において聴覚重み付けを行う時に用いられる。
【００４５】
フレーム電力計算器１２は、音声入力部１からの入力音声ａ１をフレーム単位で入力して、フレーム電力計算を行い、フレーム電力情報ｃ１を音声符号化情報の一部として出力するものである。
ここで、フレーム電力情報ｃ１は復号器側に伝送され再生音声信号を生成するのに用いられる。また、後述するように最適候補ベクトル選択器１５で利得符号帳１７を探索する処理においてフレーム電力情報が用いられる。
【００４６】
但し、本発明のフレーム電力計算器１２の特徴部分として、後述する最適候補ベクトル選択器１５から出力される抽出／置換の制御信号ｑ１を入力し、制御信号が抽出を指示している場合は、入力音声ａ１のフレームのフレーム電力情報ｃ１を抽出し、制御信号が置換を指示している場合は、抽出を行わずに補間用の音声情報で置き換えを行ってフレーム電力情報ｃ１を出力するようになっている。
【００４７】
尚、補間用の音声情報とは、例えば１つ前のフレームの音声情報（フレーム電力情報ｃ１）である。
また、抽出と置換との切り替えは、最適候補ベクトル選択器１５からの制御信号ｑ１によらず、内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【００４８】
聴覚重み付けフィルタ２１は、音声入力部１からの入力信号ａ１に対し、サブフレーム単位でスペクトル包絡情報（パラメータ）ｂ１を用いて聴覚重み付け処理（公知の技術）を行い、聴覚重み付けされた入力音声ｎｌを出力するものである。
【００４９】
適応符号帳１３は、音源信号における周期成分を表現するための符号帳であり、例えば、１２８種類のピッチ成分のパターンを予め記憶しており（サイズ１２８、８０次元）、更に１つ前のサブフレームで抽出された最適な適応符号帳ベクトル及び雑音符号帳ベクトル及び利得符号帳ベクトルにより生成された音源信号を記憶する前音源信号エリアが設けられている。
そして、入力される制御信号ｌ１に従って選択された最適な適応符号の候補ベクトルｄ１を出力するようになっている。
【００５０】
雑音符号帳１６は、音源信号における雑音成分を表現するための符号帳であり、例えば、５１２種類の雑音成分のパターンを記憶していて（サイズ５１２、８０次元）、入力される制御信号ｌ１に従って選択された最適な雑音符号の候補ベクトルｆ１を出力するようになっている。
【００５１】
利得符号帳１７は、利得を調整するための符号帳であり、例えば、１２８種類の利得パターンを記憶していて（サイズ１２８、２次元）、入力される制御信号ｌ１に従って選択された適応符号用の利得候補ベクトルｈ１と、雑音符号用の利得候補ベクトルｉ１とを出力するようになっている。
【００５２】
乗算器１８は、最適な適応符号帳ベクトルｄ１に利得の候補ベクトルｈ１を乗算し、利得調整された最適な適応符号帳ベクトルｅ１を出力するものである。
乗算器１９は、最適な雑音符号帳ベクトルｆ１に利得の候補ベクトルｉ１を乗算し、利得調整された最適な雑音符号帳ベクトルｇ１を出力するものである。
加算器２０は、利得調整された最適な適応符号帳ベクトルｅ１と利得調整された最適な雑音符号帳ベクトルｇ１とを加算し、音源信号ｊ１を出力するものである。
【００５３】
聴覚重み付け合成フィルタ１４は、音源信号ｊ１に対してスペクトル包絡情報ｂ１を付加すると共に聴覚重み付けを行い、再生音声ｋ１を生成して出力するものである。
【００５４】
具体的には、音源信号ｊ１にスペクトル包絡情報ｂ１を付加するための合成フィルタの係数に聴覚重み付けをするための修正を施してからフィルタリングを行うことになる。
【００５５】
最適候補ベクトル選択器１５は、基本的にはサブフレーム単位で適応符号帳１３，雑音符号帳１６，利得符号帳１７における最適な符号帳ベクトルを選択するものであるが、本発明の特徴部分としてスペクトル包絡パラメータ抽出器１１及びフレーム電力計算器１２への抽出／置換の制御信号ｑ１を出力するようになっている。
【００５６】
ここで、抽出／置換の制御信号ｑ１は、スペクトル包絡パラメータ抽出器１１及びフレーム電力計算器１２において音声情報を抽出するか、又は音声情報を抽出せずに補間用の音声情報で置き換えるかを指示する信号である。
つまり、最適候補ベクトル選択器１５は、通常のフレームの際にはスペクトル包絡パラメータ抽出器１１及びフレーム電力計算器１２に対して抽出／置換の制御信号ｑ１で抽出を指示し、同期信号が送信されるフレームの際には、抽出／置換の制御信号ｑ１で置換を指示するようになっている。
【００５７】
尚、最適候補ベクトル選択器１５から制御信号ｑ１は出力せずに、スペクトル包絡パラメータ抽出器１１及びフレーム電力計算器１２において内部にフレームカウンタ等を設けて、補間処理を行うタイミングをカウントするようにしても構わない。
【００５８】
また、最適候補ベクトル選択器１５における最適な符号帳ベクトルの探索は、サブフレーム単位で、適応符号帳１３，雑音符号帳１６，利得符号帳１７における最適な各符号帳ベクトルを探索して各最適な各符号帳ベクトルの番号を符号帳最適インデックスｍ１、ｏ１、ｐ１として出力する符号帳探索処理と、抽出した音声符号化情報又は補間した音声符号化情報を次のフレームの符号帳探索に適応するための適応符号帳更新処理を行い、これをサブフレームの数だけ繰り返す。その結果、例えば１フレームが４０ｍｓ、サブフレームが１０ｍｓの場合は、１フレームについて４セットの各符号帳最適ベクトルを抽出して音声符号化情報の一部として出力するようになっている。
【００５９】
但し、本発明の特徴部分として、フレーム内の最後のサブフレームについては、符号帳探索処理終了後に、所定フレーム毎に復号器側と同様の音声符号化情報の補間を行う音声情報補間処理を行うようになっている。
音声情報補間処理の詳細については、後述する。
【００６０】
符号帳探索処理は具体的に、制御信号ｌ１により適応符号帳１３、雑音符号帳１６、利得符号帳１７から出力される各候補ベクトルを制御し、各候補ベクトルに対する再生音声ｋ１と聴覚重み付けされた入力音声ｎ１との自乗平均誤差を計算して、それが最小となる候補ベクトルを最適ベクトルとして選定する符号帳探索を行い、各符号帳（適応、雑音および利得符号帳）の最適ベクトルの番号を符号帳最適インデックスｍ１、ｏ１、ｐ１とし、音声符号化情報の一部として出力する処理である。
【００６１】
ここで、最適候補ベクトル選択器１５によりサブフレーム毎に実行される符号帳探索の手順について説明する。
最適候補ベクトル選択器１５における符号帳探索の概要は、まず第１段階として適応符号帳１３における最適な適応符号帳ベクトルを探索する適応符号帳探索（長期予測とも呼ばれる）を行い、次に第２段階として雑音符号帳１６における最適な雑音符号帳ベクトルを探索する雑音符号帳探索を行い、最適な適応符号帳ベクトル及び雑音符号帳ベクトルが決定した後に、最後の第３段階として利得符号帳探索を行うようになっている。
なお、各符号帳探索の詳細については、本発明の音声通信装置の動作で説明する。
【００６２】
そして、適応符号帳更新処理は、選択された最適な適応、雑音、利得符号帳ベクトルで生成される音源信号ｊ１、又は補間処理によって前フレームの音声符号化情報で置換された符号帳ベクトルで生成される音源信号ｊ１により、適応符号帳１３の内部メモリを更新することによって、次サブフレームで用いる適応符号帳１３を作成する処理である。
【００６３】
ここで、適応符号帳１３の内部メモリを更新する具体的な方法は、例えば、現在記憶されている適応符号帳１３（例えば、１６０サンプル記憶している）の内容をサブフレーム長（８０サンプル）分過去の方向にシフトし、その結果後半部分（新しい部分）には０が入ることになり、その部分に現サブフレームで得られた音源信号（８０サンプル）を代入するようになっている。
【００６４】
次に、本発明の特徴部分である音声符号化情報補間処理は、音声符号化情報抽出対象のフレームが所定フレーム毎に送信部３からフレーム同期信号を送信するフレームである場合に、復号化の際の音声符号化情報の補間処理と同様の処理を行うものである。
【００６５】
具体的には、補間処理方法が例えば前フレームの音声符号化情報での置換を施すような場合には、最適候補ベクトル選択器１５内に前フレームの音声符号化情報を記憶し、最後のサブフレームの符号帳探索終了後に、記憶されている前フレームの音声符号化情報の中の各符号帳の最適インデックスｍ１，ｏ１，ｐ１に従って、適応符号帳１３，雑音符号帳１６，利得符号帳１７から前フレームの適応符号帳最適ベクトルｄ１及び雑音符号帳最適ベクトルｆ１及び利得符号帳最適ベクトルｈ１，ｉ１が出力されるように制御信号ｌ１を制御し、その結果得られた音源信号ｊ１で前述した適応符号帳更新処理を行って適応符号帳１３の内部メモリ内容の更新が行われるようになっている。
【００６６】
ここで、音声符号化情報補間処理の制御フローについて、図３を用いて説明する。図３は、本音声符号化器の最適候補ベクトル選択器１５における音声符号化情報補間処理の流れを示すフローチャート図である。尚、図３において、フレームカウンタＣｆは符号化開始時にリセットされているものとし、５０フレーム毎にフレーム同期信号が挿入されるものとする。
【００６７】
本音声符号化器の最適候補ベクトル選択器１５における音声符号化情報補間処理は、フレームカウンタＣｆをインクリメントし（１００）、Ｃｆが５０より大きいか判断し（１０２）、Ｃｆが５０より大きくない場合（Ｎｏ）は、選択された適応、雑音、利得の符号帳最適インデックスｍ１，ｏ１，ｐ１を現フレームの音声符号化情報として記憶し（１１０）、補間処理を終了する。
【００６８】
一方、処理１０２において、Ｃｆが５０より大きくなった場合（Ｙｅｓ）は、フレームカウンタＣｆをリセットし（１０４）、前フレームの音声符号化情報を現フレームの音声符号化情報として置換し（１０６）、補間処理を終了する。
【００６９】
次に、本音声符号化器の動作について、図２を使って説明する。
本音声符号化器では、フレーム単位で入力音声ａ１が入力されると、スペクトル包絡パラメータ抽出器１１でスペクトル包絡情報ｂ１が抽出されて音声符号化情報の一部として送信部３に出力されると共に、聴覚重み付け合成フィルタ１４及び聴覚重み付けフィルタ２１に与えられる。
一方、フレーム電力計算器１２において入力音声ａ１からフレーム電力情報ｃ１が抽出されて、送信部３に音声符号化情報の一部として出力されると共に、最適候補ベクトル選択器１５に与えられる。
【００７０】
尚、この時、スペクトル包絡パラメータ抽出器１１及びフレーム電力計算器１２では、最適候補ベクトル選択器１５からの抽出／置換の制御信号ｑ１に従って、同期信号が送信されるフレームの時には、抽出を行わずにそれぞれ補間用の情報で置換されたスペクトル包絡情報ｂ１及びフレーム電力情報ｃ１が出力される。
【００７１】
そして以降はサブフレーム単位で、入力音声ａ１に対して、聴覚重み付けフィルタ２１でスペクトル包絡パラメータ抽出器１１からのスペクトル包絡情報ｂ１を用いて聴覚重み付けが為され、聴覚重み付けされた入力音声ｎｌが最適候補ベクトル選択器１５に出力される。
【００７２】
また、最適候補ベクトル選択器１５において、符号帳探索処理の第１段階である適応符号帳探索の動作として、制御信号ｌ１によって、まず適応符号帳１３に記憶された候補ベクトルｄ１が順に適応符号帳１３から出力されるようにし、この時雑音符号帳１６及び利得符号帳１７からは候補ベクトルが出力されないように制御信号ｌ１を制御する。
【００７３】
すると、適応符号帳１３から記憶された候補ベクトルｄ１が順に出力され、乗算器１８及び加算器２０をスルーし、周期性を有する音源信号ｊ１として出力され、聴覚重み付け合成フィルタ１４でスペクトル包絡パラメータ抽出器１１からのスペクトル包絡情報ｂ１を付加すると共に聴覚重み付けが行われ、部分的な再生音声（適応符号帳寄与分）ｋ１が生成されて出力される。
【００７４】
そして、最適候補ベクトル選択器１５では、各候補ベクトルｄ１に対して生成された部分的な再生音声（適応符号帳寄与分）ｋ１に対し最適な利得が与えられた後に、聴覚重み付けフィルタ２１から出力される聴覚重み付けされた入力音声ｎ１との自乗平均誤差が各々計算され、それが最小となる候補ベクトルｄ１が最適な適応符号帳ベクトルとして選定され、選定されたベクトルの番号が適応符号帳１３の符号帳最適インデックスｍ１として出力される。
【００７５】
ここで、最適な利得とは、自乗平均誤差の計算式で再生信号ｋ１に乗算される利得に対して偏微分した結果を０とおくことにより、自乗平均誤差が最小となる利得（最適な利得）を求め、この利得を固定して再生信号ベクトルｋ１を順次取り替えて自乗平均誤差を求めることにより最適な適応符号帳ベクトルの探索が行われるようになっている。
尚、自乗平均誤差の計算方法については、公知の技術であるので、ここでは詳細な説明を省略する。
【００７６】
次に、最適候補ベクトル選択器１５において、符号帳探索処理の第２段階である雑音符号帳探索の動作として、制御信号ｌ１によって、まず雑音符号帳１６に記憶された候補ベクトルｆ１が順に雑音符号帳１６ら出力されるようにし、この時適応符号帳１３及び利得符号帳１７からは候補ベクトルが出力されないように制御信号ｌ１を制御する。
【００７７】
すると、雑音符号帳１６から記憶された候補ベクトルｆ１が順に出力され、乗算器１９及び加算器２０をスルーし、雑音の音源信号ｊ１として出力され、聴覚重み付け合成フィルタ１４でスペクトル包絡パラメータ抽出器１１からのスペクトル包絡情報ｂ１を付加すると共に聴覚重み付けが行われ、部分的な再生音声（雑音符号帳寄与分）ｋ１が生成されて出力される。
【００７８】
ここで、雑音符号帳探索において、各候補ベクトルｆ１には、再生音声の量子化誤差を低減するため、聴覚重み付け合成フィルタ処理された最適な適応符号帳ベクトルに対し直交化処理が施される（公知の技術）。
しかし、便宜上各候補ベクトルに対する再生音声ｋ１について直交化処理を行っても同じ結果が得られるので、本発明では直交化処理が最適候補ベクトル選択器１５で行われるものとする。
【００７９】
そこで、最適候補ベクトル選択器１５では、各候補ベクトルｆ１に対して生成された部分的な再生音声（雑音符号帳寄与分）ｋ１に対し直交化処理を施し、更に最適な利得が与えられた後に、聴覚重み付けフィルタ２１から出力される聴覚重み付けされた入力音声ｎ１との自乗平均誤差が各々計算され、それが最小となる候補ベクトルｆ１が最適な雑音符号帳ベクトルとして選定され、選定されたベクトルの番号が雑音符号帳の符号帳最適インデックスｏ１として出力される。
【００８０】
次に、最適候補ベクトル選択器１５において、符号帳探索処理の第３段階である利得符号帳探索の動作として、制御信号ｌ１によって、適応符号帳１３からは上記適応符号帳探索で決定した最適な適応符号帳ベクトルｄ１が、また雑音符号帳１６からは上記雑音符号帳探索で決定した最適な雑音符号帳ベクトルｆ１が出力されるようにして、更に利得符号帳１７から適応符号用の利得候補ベクトルｈ１と、雑音符号用の利得候補ベクトルｉ１とが記憶されている全てについて順番に出力されるようにする。
【００８１】
これにより、適応符号帳１３からは最適な適応符号帳ベクトルｄ１が出力され、乗算器１８で利得符号帳１７から出力される適応符号用の利得候補ベクトルｈ１と乗算されて、利得調整が為された最適な適応符号帳ベクトルｅ１が出力される。
一方、雑音符号帳１６からは最適な雑音符号帳ベクトルｆ１が出力され、乗算器１９で利得符号帳１７から出力される雑音符号用の利得候補ベクトルｉ１と乗算されて、利得調整が為された最適な雑音符号帳ベクトルｇ１とが出力される。
【００８２】
そして、利得調整が為された最適な適応符号帳ベクトルｅ１と利得調整が為された最適な雑音符号帳ベクトルｇ１とが加算器２０で加算されて音源信号ｊ１が生成され、聴覚重み付け合成フィルタ１４で、スペクトル包絡情報ｂ１が付加されるとともに聴覚重み付けが施された再生音声ｋ１が出力されることになる。
【００８３】
そして、最適候補ベクトル選択器１５においてフレーム電力計算器１２から出力されるフレーム電力情報ｃ１を用いて聴覚重み付けフィルタ２１から出力される聴覚重み付けされた入力音声ｎ１に正規化が施され、再生音声ｋ１の前記正規化された入力音声ｎ１に対する聴覚重み付き自乗平均誤差を求め、それが最小となる適応符号用の利得候補ベクトルｈ１と、雑音符号用の利得候補ベクトルｉ１とが最適な利得符号帳ベクトルとして選定され、選定されたベクトルの番号が利得符号帳の最適利得インデックスｐ１として出力されるようになっている。
【００８４】
そして、符号帳探索処理の結果選択された適応符号帳最適ベクトルｄ１及び雑音符号帳最適ベクトルｆ１及び利得符号帳最適ベクトルｈ１，ｉ１が適応符号帳１３，雑音符号帳１６，利得符号帳１７から出力されるように制御信号ｌ１を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号ｊ１で適応符号帳１３の内部メモリ内容が更新され、その更新結果が次サブフレームの適応符号帳１３として用いられるようになっている。
【００８５】
上記サブフレーム単位の動作が繰り返され、最適候補ベクトル選択器１５において、最後のサブフレームについての符号帳探索処理が終了したなら、本発明の特徴部分である音声符号化情報補間処理の動作として、フレーム同期信号が送信されるフレームである場合に、最適候補ベクトル選択器１５内に記憶されている前フレームの音声符号化情報の中の最後のサブフレームの各符号帳最適インデックスｍ１，ｏ１，ｐ１に従って、適応符号帳１３，雑音符号帳１６，利得符号帳１７から前フレームの適応符号帳最適ベクトルｄ１及び雑音符号帳最適ベクトルｆ１及び利得符号帳最適ベクトルｈ１，ｉ１が出力されるように制御信号ｌ１を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号ｊ１で適応符号帳１３の内部メモリ内容が更新され、その補間による更新結果が次サブフレームの適応符号帳１３として用いられるようになっている。
【００８６】
また、フレーム同期信号が送信されるフレームでない場合には、そのまま符号帳探索処理の結果選択された適応符号帳最適ベクトルｄ１及び雑音符号帳最適ベクトルｆ１及び利得符号帳最適ベクトルｈ１，ｉ１が適応符号帳１３，雑音符号帳１６，利得符号帳１７から出力されるように制御信号ｌ１を制御し、適応符号帳更新処理の動作としてその結果得られた音源信号ｊ１で適応符号帳１３の内部メモリ内容が更新され、その更新結果が次サブフレームの適応符号帳１３として用いられるようになっている。
【００８７】
次に、本発明の実施の形態に係る音声通信装置における音声復号化器（本音声復号化器）について、図４を用いて説明する。図４は、本発明の実施の形態に係る音声通信装置における音声復号化器の構成ブロック図である。
【００８８】
本音声復号化器は、図４に示すように、適応符号帳３１と、雑音符号帳３２と、利得符号帳３３と、乗算器３４と、乗算器３５と、加算器３６と、合成フィルタ３７と、ポストフィルタ３８とから構成されている。
【００８９】
次に、本音声符号化器の各部について説明する。
適応符号帳３１は、音声符号器（図１）の適応符号帳１３と同じ内容の適応符号帳であり、更に１つ前のサブフレームで生成された音源信号を記憶する前音源信号エリアが設けられている。
そして、受信して入力される適応符号帳最適インデックスｍ２に従って選択された適応符号帳最適ベクトルｄ２を出力するようになっている。
【００９０】
雑音符号帳３２は、音声符号器（図１）の雑音符号帳１６と同じ内容の雑音符号帳であり、受信して入力される雑音符号帳最適インデックスｏ２に従って選択された雑音符号帳最適ベクトルｆ２を出力するようになっている。
【００９１】
利得符号帳３３は、音声符号器（図１）の利得符号帳１７と同じ内容の利得符号帳であり、受信して入力される利得符号帳最適インデックスｐ２に従って選択された適応符号帳ベクトルの最適利得ｈ２と雑音符号帳ベクトルの最適利得ｉ２を出力するようになっている。
【００９２】
利得制御器３９は、適応符号帳ベクトルの利得ｈ２と雑音符号帳ベクトルの利得ｉ２とを入力して、受信したフレーム電力情報ｃ２を用いて利得調整を行い、利得調整された適応符号帳ベクトルの利得ｈ２′と雑音符号帳ベクトルの利得ｉ２′とを出力するものである。
【００９３】
乗算器３４は、最適な適応符号帳ベクトルｄ２に利得調整された利得ｈ２′を乗算し、利得調整された最適な適応符号帳ベクトルｅ２を出力するものである。
乗算器３５は、最適な雑音符号帳ベクトルｆ２に利得調整された利得ｉ２′を乗算し、利得調整された最適な雑音符号帳ベクトルｇ２を出力するものである。
加算器３６は、利得調整された最適な適応符号帳ベクトルｅ２と利得調整された最適な雑音符号帳ベクトルｇ２とを加算し、音源信号ｊ２を再生するものである。
【００９４】
合成フィルタ３７は、音源信号ｊ２に受信したベクトル包絡情報ｂ２を付加することにより再生音声ｋ２を生成するものである。
ポストフィルタ３８は、聴感上の再生音声品質を向上するため、再生音声ｋ２に対しホルマント強調処理を行いホルマント強調処理された再生音声ａ２を出力するものである。
【００９５】
次に、本音声復号化器の動作について図４を用いて説明する。
本音声復号化器では、フレーム単位で受信した表１に示す音声符号化情報に従って再生音声を生成する。以下にその動作を説明する。
まず、サブフレーム（１０ｍｓ、８０サンプル）毎に以下の処理を行い、音源信号ｊ２が再生される。
【００９６】
具体的には、受信した適応符号帳最適インデックスｍ２、雑音符号帳最適インデックスｏ２を基に、適応符号帳３１、雑音符号帳３２からそれぞれ適応符号帳最適ベクトルｄ２、雑音符号帳最適ベクトルｆ２が出力される。
一方、受信した利得符号帳最適インデックスｐ２を基に、利得符号帳３３から適応符号帳ベクトルの利得ｈ２と雑音符号帳ベクトルの利得ｉ２とが出力され、受信したフレーム電力情報ｃ２を用いて利得制御器３９で利得調整が行われ、利得調整された適応符号帳ベクトルの利得ｈ２′と雑音符号帳ベクトルの利得ｉ２′とが出力される。
【００９７】
適応符号帳３１から出力された適応符号帳最適ベクトルｄ２は、乗算器３４で利得制御器３９からの利得調整された適応符号帳ベクトルの利得ｈ２′が乗算されて利得調整された最適な適応符号帳ベクトルｅ２が出力され、同様に雑音符号帳３２から出力された雑音符号帳最適ベクトルｆ２は、乗算器３５で利得制御器３９からの利得調整された雑音符号帳ベクトルの利得ｉ２′が乗算されて利得調整された最適な適応符号帳ベクトルｇ２が出力され、加算器３６でｅ２とｇ２が加算されて音源信号ｊ１が再生される。
【００９８】
適応符号帳３１では音源信号ｊ２の再生が終了した後に、その音源信号ｊ２により更新され、その更新結果が次サブフレームの適応符号帳として用いられる。
ここで、本音声復号化器の適応符号帳３１の更新結果は、伝送誤りがない場合には本音声符号化器の適応符号帳１３の更新結果と全く等しくなるはずである。
【００９９】
そして、フレーム（４０ｍ雑音符号帳３２０サンプル）毎に以下の処理が実行される。
加算器３６から出力された音源信号ｊ２は、合成フィルタ３７で受信したベクトル包絡情報ｂ２が付加されて再生音声ｋ２が生成され、更にポストフィルタ３８で聴感上の再生音声品質を向上するためのホルマント強調処理が施されて再生音声ａ２が出力されるようになっている。
【０１００】
本発明の実施の形態の音声通信方法によれば、送信側の音声符号化側（送信側）においてフレーム同期信号を送信するフレームに対する音声符号化情報抽出処理で、復号化側（受信側）での音声符号化情報補間処理と同一の補間処理を施すので、送信側の音声符号化器と受信側の音声復号器の適応符号帳の内部メモリ内容の更新結果が常に等しく保たれ、フレーム同期信号挿入による再生音声品質劣下が複数フレームに影響せず、再生音声信号の品質劣下を低減できる効果がある。
【０１０１】
本発明の実施の形態の音声通信装置によれば、音声符号化器の最適候補ベクトル選択器１５において、フレーム内の最後のサブフレームの符号帳探索処理と適応符号帳更新処理との間に音声符号化情報補間処理を挿入して、フレーム同期信号を送信するフレームに対して補間処理を行うので、音声符号化器の最適候補ベクトル選択器１５以外の部分及び音声復号化器側は従来のまま使用できるので、容易に実現できる効果がある。
【０１０２】
また、本発明の音声符号化器は、ＤＳＰ（デジタル・シグナル・プロセッサ）またはＣＰＵで実現されるため、本発明はそれらのソフトウエアを変更することで容易に実現できる効果がある。
【０１０３】
【発明の効果】
請求項１，２記載の発明によれば、周期的に送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を送信側で行い、補間処理によって得られた音声符号化情報に従って適応符号帳を更新する音声通信方法としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【０１０４】
請求項３記載の発明によれば、送信側の音声符号化器が、送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して受信部で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新する音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【０１０５】
請求項４記載の発明によれば、周期的に同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同様の処理をスペクトル包絡パラメータ抽出器及びフレーム電力計算器及び最適候補ベクトル選択器で行い、補間処理された音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、適応符号帳、雑音符号帳、利得符号帳に制御信号を出力し、適応符号帳、雑音符号帳、利得符号帳で制御信号に従って適応符号、雑音符号、利得の候補ベクトルを出力し、その結果得られる音源信号の入力を受けて適応符号帳が適応符号の候補ベクトルの内容を更新する音声符号化器を具備する送信側装置を備えた音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【０１０６】
請求項５記載の発明によれば、送信側の音声符号化器が、送信部にて同期信号が送信されるフレームについて受信部で為される音声符号化情報の補間処理と同様に１つ前のフレームで得られた音声符号化情報を用いる補間処理を行う請求項３又は請求項４記載の音声通信装置としているので、適応符号帳を用いた音声符号化・復号化に際して、前の音声符号化情報を反映させながら処理が為されるような場合、簡単な処理によって送信側と受信側で同じ音声符号化情報の補間処理が為されるようになるため、送信側の音声符号化の影響と受信側の音声復号化の影響とが等しくなり、再生音声の品質向上を図ることができる効果がある。
【図面の簡単な説明】
【図１】本発明の実施の形態に係る音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。
【図２】本発明の実施の形態に係る音声通信装置における音声符号化器の構成ブロック図である。
【図３】本音声符号化器の最適候補ベクトル選択器１５における音声符号化情報補間処理の流れを示すフローチャート図である。
【図４】本発明の実施の形態に係る音声通信装置における音声復号化器の構成ブロック図である。
【図５】従来の音声通信装置の概略構成を示すブロック図である。
【図６】従来の音声通信装置における音声符号化・復号化処理とフレーム同期信号送受信タイミングを示す説明図である。
【符号の説明】
１…音声入力部、２…音声符号化器、３…送信部、４…受信部、５…音声復号化器、６…音声出力部、１１…スペクトル包絡パラメータ抽出器、１２…フレーム電力計算器、１３…適応符号帳、１４…聴覚重み付け合成フィルタ、１５…最適候補ベクトル選択器、１６…雑音符号帳、１７…利得符号帳、１８…乗算器、１９…乗算器、２０…加算器、２１…聴覚重み付けフィルタ、３１…適応符号帳、３２…雑音符号帳、３３…利得符号帳、３４…乗算器、３５…乗算器、３６…加算器、３７…合成フィルタ、３８…ポストフィルタ、３９…利得制御器

Claims

適応符号帳を使用する音声符号化・復号化処理を用いた音声通信方法であって、送信側で入力音声信号を前記音声符号化処理することで音声符号化情報を抽出して送信し、受信側で受信した音声符号化情報を音声復号化処理することで音声信号を再生する音声通信方法において、送信側から周期的に音声符号化情報に替えて同期信号が送信される場合に、前記送信側にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴とする音声通信方法。
音声符号化情報の補間処理は、１つ前のフレームで得られた音声符号化情報を用いることを特徴とする請求項１記載の音声通信方法。
音声を入力して音声信号を出力する音声入力部と、前記音声信号を適応符号帳を用いて音声符号化処理を行い、音声符号化情報を抽出する音声符号化器と、前記音声符号化情報を送信すると共に周期的に音声符号化情報に替えて同期信号を送信する送信部とを有する送信側と、送信された音声符号化情報を受信すると共に、前記同期信号を受信すると音声符号化情報の補間処理として前フレームで得られた音声符号化情報を出力する受信部と、音声符号化情報を適応符号帳を用いて復号化して音声信号を出力する音声復号化器と、前記音声信号を音声として出力する音声出力部とを有する受信側とを備え、
前記音声符号化器が、前記送信部にて同期信号が送信されるフレームの音声符号化情報について、当該同期信号を受信したフレームの音声符号化情報に対して前記受信部で為される補間処理と同じ補間処理を行い、前記補間処理によって得られた音声符号化情報に従って前記適応符号帳を更新することを特徴とする音声通信装置。
入力音声信号についてフレーム単位で音声生成系における声道特性を表現するスペクトル包絡情報を抽出し、同期信号が送信されるフレームでは前フレームのスペクトル包絡情報を当該フレームのスペクトル包絡情報とするスペクトル包絡パラメータ抽出器と、
入力音声信号についてフレーム単位でフレーム電力計算を行ってフレーム電力情報を出力し、同期信号が送信されるフレームでは前フレームのフレーム電力情報を当該フレームのフレーム電力情報とするフレーム電力計算器と、
入力音声信号に対して前記スペクトル包絡情報を用いて聴覚重み付け処理を行い、聴覚重み付けされた入力音声信号を出力する聴覚重み付けフィルタと、
音源信号における周期成分を表現するための符号帳であって入力される制御信号に従って選択された最適な適応符号の候補ベクトルを出力すると共に音源信号の入力を受けて適応符号の候補ベクトルの内容を更新する適応符号帳と、
音源信号における雑音成分を表現するための符号帳であって入力される制御信号に従って選択された最適な雑音符号の候補ベクトルを出力する雑音符号帳と、
利得を調整するための符号帳であって入力される制御信号に従って選択された適応符号帳用の利得候補ベクトルと雑音符号帳用の利得候補ベクトルとを出力する利得符号帳と、
最適な適応符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な適応符号帳ベクトルを出力する第１の乗算器と、
最適な雑音符号帳ベクトルに利得候補ベクトルを乗算し、利得調整された最適な雑音符号帳ベクトルを出力する第２の乗算器と、
利得調整された最適な適応符号帳ベクトルと利得調整された最適な雑音符号帳ベクトルとを加算し、音源信号を出力する加算器と、
前記音源信号に対して前記スペクトル包絡情報を付加すると共に聴覚重み付けを行い、再生音声信号を生成して出力する聴覚重み付け合成フィルタと、
前記適応符号帳、前記雑音符号帳、前記利得符号帳における最適の各符号帳ベクトルを探索して各符号帳最適インデックスを出力する符号帳探索処理を行い、
同期信号が送信されないフレームでは、前記探索処理で選択された最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させ、
同期信号が送信されるフレームでは、当該フレームの音声符号化情報について当該同期信号を受信したフレームの音声符号化情報に対して受信側で為される音声符号化情報の補間処理と同じ補間処理を行い、前記補間処理にて得られた音声符号化情報に従って最適の各符号帳ベクトルが出力されるよう、前記適応符号帳、前記雑音符号帳、前記利得符号帳に制御信号を出力して、前記適応符号帳を更新させる適応符号帳更新処理を行う最適候補ベクトル選択器とを有する音声符号化器を具備する送信側の装置を備えたことを特徴とする音声通信装置。
音声符号化情報の補間処理は、１つ前のフレームで得られた音声符号化情報を用いることを特徴とする請求項３又は請求項４記載の音声通信装置。