[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4295372B2 - 音声符号化装置 - Google Patents

音声符号化装置 Download PDF

Info

Publication number
JP4295372B2
JP4295372B2 JP25835298A JP25835298A JP4295372B2 JP 4295372 B2 JP4295372 B2 JP 4295372B2 JP 25835298 A JP25835298 A JP 25835298A JP 25835298 A JP25835298 A JP 25835298A JP 4295372 B2 JP4295372 B2 JP 4295372B2
Authority
JP
Japan
Prior art keywords
speech
encoding
signal
distortion
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25835298A
Other languages
English (en)
Other versions
JP2000089797A (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP25835298A priority Critical patent/JP4295372B2/ja
Publication of JP2000089797A publication Critical patent/JP2000089797A/ja
Application granted granted Critical
Publication of JP4295372B2 publication Critical patent/JP4295372B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システム等におけるCELP(Code Excited Linear Prediction)型の音声符号化装置及び音声復号化装置に関する。
【0002】
【従来の技術】
ディジタル移動通信や音声蓄積の分野においては、電波や記憶媒体の有効利用のために音声情報を圧縮し、高能率で符号化するための音声符号化装置が用いられている。中でもCELP(Code Excited Linear Prediction:符号励振線形予測符号化)方式をベースにした方式が中・低ビットレートにおいて広く実用化されている。CELPの技術については、M.R.Schroeder and B.S.Atal:"Code-Excited Linear Prediction (CELP):High-quality Speech at Very Low Bit Rates",Proc.ICASSP-85, 25.1.1, pp.937-940, 1985" に示されている。
【0003】
CELP型音声符号化方式は、音声をある一定のフレーム長(5ms〜50ms程度)に区切り、各フレーム毎に音声の線形予測を行い、フレーム毎の線形予測による予測残差(励振信号)を既知の波形からなる適応符号ベクトルと雑音符号ベクトルを用いて符号化するものである。適応符号ベクトルは過去に生成した駆動音源ベクトルを格納している適応符号帳から、雑音符号ベクトルは予め用意された定められた数の定められた形状を有するベクトルを格納している雑音符号帳から選択されて使用される。雑音符号帳に格納される雑音符号ベクトルには、ランダムな雑音系列のベクトルや何本かのパルスを異なる位置に配置することによって生成されるベクトルなどが用いられる。
【0004】
【発明が解決しようとする課題】
しかしながら、上記従来の音声符号化装置においては、符号化歪みが大きい合成信号も符号化歪みが小さい合成信号も同様に符号化・復号化するため、非音声信号等従来の音声符号化装置において高品質で符号化できない信号の合成音が耳障りで不自然な音として聞こえてしまうという問題があった。
【0005】
本発明は、以上のような実情に鑑みてなされたものであり、必要に応じて入力信号の振幅を小さくしてから符号化することにより、耳障りな雑音となる信号の振幅レベルを抑圧し、不快感を軽減できる音声符号化装置及び音声復号化装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明は、上記目的を達成するために、符号化歪みが特に大きくなる入力信号に対しては、利得符号帳探索の直前にターゲット信号の振幅を減衰させることにより、耳障りな雑音となる信号の振幅レベルを抑圧するようにしたものである。
【0007】
【発明の実施の形態】
本発明の音声符号化装置は、適応符号帳成分及び雑音符号帳成分の振幅を符号化する符号化手段と、前記符号化手段の処理の前に、符号化対象の音声信号に減衰係数を乗じる減衰手段と、を具備し、前記減衰手段は、符号化対象とするターゲットベクトルについての符号化歪みを算出する歪み算出器と、算出された符号化歪みが、所定の閾値未満の場合には減衰係数を1に設定し、前記閾値以上の場合には減衰係数を1以下に設定する減衰係数決定器と、設定された減衰係数を前記音声信号に乗算する乗算器と、を具備する構成を採る。
【0027】
本発明の音声符号化方法は、音声のスペクトル特性を表すパラメータを符号化し、過去に生成した駆動音源ベクトルを格納した適応符号帳を用いて駆動音源の周期性を符号化し、予め定められた数の定められた駆動音源ベクトルを格納する雑音符号帳を用いて前記適応符号帳では表せない駆動音源成分を符号化し、適応符号帳成分と雑音符号帳成分の振幅を符号化し、これらの符号化情報によって入力音声信号を表現する音声符号化方法であって、符号化された適応符号帳成分と雑音符号帳成分から合成される信号と、符号化対象とされている入力信号との歪みを算出する工程と、算出された前記歪みのフレーム間における変動を平滑化するための処理を行う工程と、前記平滑化処理後の前記歪みが、所定の閾値未満の場合には係数を1に設定し、前記閾値以上の場合には係数を1以下に設定する工程と、前記設定した係数を前記入力音声信号に乗じて前記入力音声信号の振幅減衰を行う工程と、を具備する構成を採る。
【0031】
本発明のプログラムを記録した機械読取可能な記録媒体は、コンピュータに、音声のスペクトル特性を表すパラメータを符号化する手順と、過去に生成した駆動音源ベクトルを格納した適応符号帳を用いて駆動音源の周期性を符号化する手順と、予め定められた数の定められた駆動音源ベクトルを格納する雑音符号帳を用いて前記適応符号帳では表せない駆動音源成分を符号化する手順と、適応符号帳成分と雑音符号帳成分の振幅を符号化する手順と、符号化された適応符号帳成分と雑音符号帳成分から合成される信号と、符号化対象とされている入力信号との歪みを算出する手順と、算出された前記歪みのフレーム間における変動を平滑化するための処理を行う手順と、前記平滑化処理後の前記歪みが、所定の閾値未満の場合には係数を1に設定し、前記閾値以上の場合には係数を1以下に設定するする手順と、前記設定した係数を前記入力音声信号に乗じて前記入力音声信号の振幅減衰を行う手順と、を実行させる構成を採る。
【0033】
以下、本発明の実施の形態について図面を参照しながら説明する。
【0034】
(実施の形態1)
図1に、実施の形態1にかかる音声符号化装置の機能ブロックを示す。本実施の形態では、符号化歪みの大きさに基づいてターゲットベクトルの振幅を制御する機構が備えられている。
【0035】
本実施の形態1の音声符号化装置は、入力ディジタル音声信号を1フレーム分づつ更新しながら符号化に必要な長さのデータが入力バッファ101にバッファリングされる。入力バッファ101にバッファリングされたデータはLPC分析器102、逆フィルタ103及びターゲット算出器104に出力される。
【0036】
LPC分析器102は、入力バッファ101から分析に必要なディジタル音声信号を入力してLPC分析を行い線形予測係数aを出力する。LPC量子化器105は、LPC分析器102から出力された線形予測係数を量子化して量子化LPCをqaとして出力し、同時に量子化LPCの符号Lを復号器に出力する。
【0037】
逆フィルタ103は、入力バッファ101から入力した1フレーム分のディジタル音声信号とLPC量子化器105から出力される線形予測係数qaとを入力として、逆フィルタリング処理を行い、線形予測残差信号をピッチ候補選択器106へ出力する。ピッチ候補選択器106は、逆フィルタ103から出力された残差信号を入力としてピッチ周期性の抽出を行いピッチ周期候補を閉ループピッチ探索器107に出力する。
【0038】
ターゲット算出器104は、入力バッファ101から入力されるディジタル音声信号と直前のフレームにおいてフィルタ状態更新器112から出力されたフィルタ状態stと量子化および未量子化LPCであるqaおよびaを入力として、ターゲットベクトルを算出する。ターゲット算出器104の算出したターゲットベクトルは閉ループピッチ探索器107、雑音符号帳探索器108及び減衰係数算出器110に入力される。
【0039】
閉ループピッチ探索器107は、ターゲットベクトルがターゲット算出器104から入力し、ピッチ候補がピッチ候補選択器106から入力し、ピッチ候補に対応する適応符号ベクトル候補とインパルス応答ベクトルとが適応符号帳115とインパルス応答算出器114とからそれぞれ入力する。閉ループピッチ探索器107では、各ピッチ候補に対して閉ループピッチ探索を行い閉ループピッチ周期Pを復号器に出力し、適応符号ベクトルを音源生成器113に出力し、適応符号ベクトルにインパルス応答を畳み込んだ合成ベクトルを雑音符号帳探索器108と利得符号帳探索器109とフィルタ状態更新器112と減衰係数算出器110とにそれぞれ出力する。
【0040】
雑音符号帳探索器108は、ターゲットベクトルと適応符号合成ベクトルとインパルス応答ベクトルとをそれぞれターゲット算出器104と閉ループピッチ探索器107とインパルス応答算出器114とから入力する。そして、雑音符号ベクトルにインパルス応答を畳み込んだ雑音符号合成ベクトルと適応符号合成ベクトルと組合わせた場合において、ターゲットベクトルとの歪みを最小とする雑音符号合成ベクトルを生成する雑音符号ベクトルを雑音符号帳116の中から選択し、雑音符号帳インデックスを復号器に、雑音符号ベクトルを音源生成器113に、雑音符号合成ベクトルを減衰係数算出器110と利得符号帳109とフィルタ状態更新器112とにそれぞれ出力する。
【0041】
利得符号帳探索器は、減衰係数乗算後のターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルとをそれぞれ乗算器111と閉ループピッチ探索器107と雑音符号帳探索器108とからそれぞれ入力して利得符号帳117の中から最適な量子化利得を選択して音源生成器113とフィルタ状態更新器112とに出力する。
【0042】
フィルタ状態更新器112は、減衰係数乗算後のターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルと量子化利得をそれぞれ乗算器111と閉ループピッチ探索器107と雑音符号帳探索器108と利得符号帳探索器109とからそれぞれ入力する。そして、合成フィルタの状態更新を行いフィルタ状態stを出力する。
【0043】
インパルス応答算出器114は、未量子化LPCであるaと量子化LPCであるqaとを入力として聴覚重みづけフィルタと合成フィルタとを縦続接続したフィルタのインパルス応答を算出し閉ループピッチ探索器107と雑音符号帳探索器108とに出力する。
【0044】
雑音符号帳116は、予め定められた数の予め定められた形状を有する雑音符号ベクトルを格納し、雑音符号帳探索器108に雑音符号ベクトルを出力する。
音源生成器113は、適応符号ベクトルと雑音符号ベクトルと量子化利得をそれぞれ閉ループピッチ探索器107と雑音符号帳探索器108と利得符号帳探索器109とから入力し、音源ベクトルを生成し、生成した音源ベクトルを適応符号帳115に出力する。
【0045】
適応符号帳115は、音源生成器113から出力される音源ベクトルを入力として、適応符号帳を更新し、適応符号ベクトル候補を閉ループピッチ探索器107に出力する。また利得符号帳117は、予め用意された量子化利得(適応符号ベクトル成分と雑音符号ベクトル成分)を格納し、利得符号帳探索器109に出力する。
【0046】
減衰係数算出器110は、ターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルとをそれぞれターゲット算出器104と閉ループピッチ探索器107と雑音符号帳探索器108とから入力して減衰係数を算出し、乗算器111に出力する。
【0047】
乗算器111は、減衰係数算出器110から入力された減衰係数をターゲット算出器104から出力されたターゲットベクトルに乗算して、減衰係数乗算後のターゲットベクトルをフィルタ状態更新器112と利得符号帳探索器109とにそれぞれ出力する。
【0048】
なお、LPC量子化器105から出力される量子化LPC符号Lと、閉ループピッチ探索器107から出力されるピッチ周期Pと雑音符号帳探索器108から出力される雑音符号帳インデックスSと利得符号帳探索器109から出力される利得符号帳インデックスGは符号化されビット列として伝送路を介して復号器に出力される。
【0049】
以上のように構成された音声符号化装置の動作について説明する。
【0050】
まず、図1において、音声信号は入力バッファ101に入力される。入力バッファ101は入力された符号化対象となるディジタル音声信号を1フレーム(例えば10ms)単位で更新し、LPC分析器102と逆フィルタ103とターゲット算出器104に対して必要なバッファリングデータを供給する。
【0051】
LPC分析器102は入力バッファ101から供給されたデータを用いて線形予測分析を行い、線形予測係数(LPC)を算出し、LPC量子化器105に出力する。なお、LPC分析器102で得られたLPCはaとして出力され、ターゲット算出器104およびインパルス応答算出器114で用いられる。
【0052】
LPC量子化器105はLPCをLSP領域に変換して量子化を行い、量子化LSPをqaとして出力し、量子化LPCの符号Lを復号器に出力する。
【0053】
逆フィルタ103は、入力バッファ101から量子化対象となるディジタルデータ列を1フレーム分(例えば10ms)入力し、量子化LPCであるqaを用いて構成された逆フィルタでフィルタリングすることによって残差信号を算出し、ピッチ候補選択器106に出力する。
【0054】
ピッチ候補選択器106は過去に生成した残差信号をバッファリングしており、新たに生成した残差信号をバッファに付け加えたデータ列から正規化自己相関関数を求め、これに基づいて残差信号の周期を抽出する。この時、正規化自己相関関数が大きいものから順に、定められた数以下のピッチ候補が選択される。選択されたピッチ周期の候補は閉ループピッチ探索器107に出力される。
【0055】
ターゲット算出器104は量子化LPCであるqaと未量子化LPCであるaとを用いて量子化合成フィルタと重み付け合成フィルタとを構成し、直前のフレームにおいてフィルタ状態更新器112で求められたフィルタ状態stを用いて量子化合成フィルタの零入力応答を除去した後の重み付け入力音声信号(ターゲットベクトル)を算出し、閉ループピッチ探索器107と雑音符号帳探索器108と減衰係数算出器110と乗算器111とにターゲットベクトルを出力する。
インパルス応答算出器114は、量子化LPCであるqaを用いて構成された量子化合成フィルタと未量子化LPCであるaを用いて構成された重み付け合成フィルタとを縦続接続したフィルタのインパルス応答を求め、閉ループピッチ探索器107と雑音符号帳探索器108とに出力する。
【0056】
閉ループピッチ探索器107は適応符号帳115の中から取り出した適応符号ベクトルにインパルス応答を畳み込むことにより、重み付け合成音声ベクトル(適応符号帳成分)を算出し、ターゲットベクトルとの誤差を最小とする適応符号ベクトルを生成するピッチ周期を抽出する。この時行われるピッチ探索は、ピッチ候補選択器106から入力されたピッチ周期候補またはその近傍についてのみ行われる。求められたピッチ周期によって生成される適応符号ベクトルは音源生成器113に出力されて音源ベクトルの生成に用いられ、適応符号ベクトルにインパルス応答を畳み込んで生成される適応符号合成ベクトルは雑音符号帳探索器108とフィルタ状態更新器112と利得符号帳探索器109と減衰係数算出器110とに出力される。
【0057】
雑音符号帳探索器108は、雑音符号帳116の中から取り出した雑音符号ベクトルにインパルス応答を畳み込むことにより、重み付け合成音声ベクトル(雑音符号帳成分)を算出し、適応符号合成ベクトルと組合わせて用いた場合においてターゲットベクトルとの誤差を最小とする雑音符号ベクトルを選び出す。選ばれた雑音符号ベクトルは音源生成器113に出力され音源ベクトルの生成に用いられる。また、雑音符号ベクトルにインパルス応答を畳み込んで生成される雑音符号合成ベクトルは利得符号帳探索器109とフィルタ状態更新器112と減衰係数算出器110とに出力される。
【0058】
減衰係数算出器110は、ターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルとをそれぞれターゲット算出器104と閉ループピッチ探索器107と雑音符号帳探索器108とから入力し、ターゲットベクトルと合成される音声ベクトルとの歪みに基づいてターゲットベクトルを減衰させる係数を算出して乗算器111に出力する。
【0059】
乗算器111は、減衰係数算出器110から出力される減衰係数をターゲットベクトルに乗算してフィルタ状態更新器112と利得符号帳探索器109とに出力する。
【0060】
利得符号帳探索器117は、乗算器111と閉ループピッチ探索器107と雑音符号帳探索器108とから減衰係数乗算後のターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルとをそれぞれ入力する。そして、減衰係数乗算後のターゲットベクトルと、適応符号合成ベクトルに量子化適応符号帳利得を乗じたものと雑音符号合成ベクトルに量子化雑音符号帳利得を乗じたものとの和のベクトルとの2乗誤差が最小となる、量子化適応符号帳利得と量子化雑音符号帳利得との組合わせを利得符号帳117の中から選択する。
【0061】
選択された量子化利得は音源生成器113とフィルタ状態更新器112とに出力され、音源ベクトルの生成と合成フィルタの状態更新とに用いられる。音源生成器113は、閉ループピッチ探索器107から入力される適応符号ベクトルと、雑音符号帳探索器108から入力される雑音符号ベクトルとに、利得符号帳探索器109から入力される量子化利得(適応符号帳成分)と量子化利得(雑音符号帳成分)とをそれぞれ乗じ、量子化利得乗算後の適応符号ベクトルと雑音符号ベクトルの加算を行って音源ベクトルを生成する。生成された音源ベクトルは適応符号帳115に出力されて適応符号帳が更新される。適応符号帳の更新はフレーム毎に1回行われ、適応符号帳のバッファを1フレーム分シフトした後、新たに生成された音源信号がバッファの最後にコピーされる。
【0062】
フィルタ状態更新器112は、量子化合成フィルタと重み付け合成フィルタを縦続接続したフィルタの状態を更新する。フィルタの状態は乗算器111から入力される減衰係数乗算後のターゲットベクトルから、利得符号帳探索器109から出力される量子化利得(適応符号帳成分)を乗じた閉ループピッチ探索器107から出力される適応符号合成ベクトルと利得符号帳探索器109から出力される量子化利得(雑音符号帳成分)を乗じた雑音符号帳探索器108から出力される雑音符号合成ベクトルとを、減じることによって求められる。求められたフィルタ状態はstとして出力され、次のフレームのフィルタ状態として、ターゲット算出器104で使用される。
【0063】
次に、図2を用いて減衰係数算出器110の詳細について説明する。
【0064】
減衰係数算出器110は、最適利得算出器201、歪み算出器202、切換スイッチ203、206、第1、第2の平滑化フィルタ204、205、減衰係数決定器207を備えている。
【0065】
最適利得算出器201は、ターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルとをそれぞれターゲット算出器104と閉ループピッチ探索器107と雑音符号帳探索器108とからそれぞれ入力し、これら3つのベクトルを用いて最適適応符号帳利得と最適雑音符号帳利得を計算し、両利得を歪み算出器202に出力する。また歪み算出器202は、ターゲットベクトルと適応符号合成ベクトルと雑音符号合成ベクトルと最適利得(適応符号成分と雑音符号成分)とをそれぞれターゲット算出器104と閉ループピッチ探索器107と雑音符号帳探索器108と最適利得算出器201とからそれぞれ入力し、最適利得を用いた場合における合成ベクトルとターゲットベクトルとの歪みを算出して切換スイッチ203に出力する。切換スイッチ203は、歪み算出器202から出力される歪みの値に応じて前記歪みを第1の平滑化フィルタ204または第2の平滑化フィルタ205のどちらかに出力させるスイッチである。第1の平滑化フィルタ204はスイッチ203を介して入力した前記歪みをフレーム間での変動を滑らかにするための平滑化処理を行い、スイッチ206へ出力する。また第2の平滑化フィルタ205はスイッチ203を介して入力した前記歪みをフレーム間での変動を滑らかにするための平滑化処理を行い、スイッチ206へ出力するフィルタである。切換スイッチ206は、第1の平滑化フィルタ204または第2の平滑化フィルタ205から出力される平滑化処理後の歪みを減衰係数決定器207に出力する。減衰係数決定器207はスイッチ206を介して第1の平滑化フィルタまたは第2の平滑化フィルタから平滑化処理後の歪みを入力として、減衰係数の決定を行い、乗算器111に出力する。
【0066】
以上の様に構成された減衰係数算出器について、その動作を説明する。図3は、図2の減衰係数算出器の処理の流れ図を示したものである。
【0067】
図2において、最適利得算出器201は、図3のステップ301に示した式によって最適適応符号帳利得と最適雑音符号帳利得とを算出する。ステップ301に示した式において、Xはターゲットベクトル、Yは適応符号合成ベクトル、Zは雑音符号合成ベクトル、Gpは最適適応符号帳利得、Gsは最適雑音符号帳利得をそれぞれ示している。なお、ステップ301に示した式は、ターゲットベクトルと、最適利得乗算後の適応符号合成ベクトルと雑音符号合成ベクトルとの和ベクトルとの2乗誤差((X−Gp*Y−Gs*Z)*(X−Gp*Y−Gs*Z))を最小化することと等価である。
【0068】
次に、歪み算出器202において、図3のステップ302に示した式によって歪み尺度Dが算出される。ステップ302ではDはいわゆるS/N比であり、以下このS/N比Dの値を用いて符号化歪みの大小を判定する。なお、歪み尺度Dとしては、S/N比の他に代用できる尺度を用いることもでき、その場合は後述する閾値や大小の判定の仕方を代用する尺度用に変更すれば良い。
【0069】
次に、スイッチ203はS/N比Dの値によって切り替わり、これは図3の条件分岐303の処理に相当する。ステップ303において、Th1は第1の閾値であり、これによってS/N比Dの大小を分別する。D>Th1の場合(S/N比がTh1より高い、即ち符号化歪みが少ない場合)は計算したS/N比Dを第1の平滑化フィルタ204に入力し、D≦Th1の場合(S/N比がTh1以下、即ち符号化歪みが大きい場合)は計算したS/N比Dを第2の平滑化フィルタ205に入力する。
【0070】
図3において、ステップ304が第1の平滑化フィルタ、ステップ305が第2の平滑化フィルタに相当する。第1の平滑化フィルタと第2の平滑化フィルタの違いは、平滑化の強さである。第1の平滑化フィルタの方は平滑化が比較的弱く、ある程度のフレーム間での変動を反映する出力が得られるが、第2の平滑化フィルタの方は平滑化が強く、フレーム間での変動が非常に滑らかになるような出力が得られる。この平滑化処理はフレーム間における激しい変動を避けるため行われる。フレーム間での変動が激しいと、閾値処理の判定結果もフレーム間で激しく変動する場合が有り、安定した判定結果を得難いからである。
【0071】
しかしながら、常に強い平滑化処理を行っていると、無音部から有音部に切り替わったときのようにS/N比Dが急激に上昇しても、平滑化処理後のS/N比の上昇が鈍くなるため、有音部の立ち上がり部に対して閾値処理による有音部の判定が正確に行われなくなる。
【0072】
そこで、特にS/N比Dが大きく、明らかに有声部に移行したと考えられる場合は、S/N比Dに対する平滑化処理を弱めにしてS/N比の急な上昇に対応できるようにしている。なお、図3のステップ304および305において、0<α<β<1である。
【0073】
次に、第1の平滑化フィルタ204または第2の平滑化フィルタ205から出力された平滑化処理後のS/N比Dはスイッチ206を介して減衰係数決定器207に入力する。
【0074】
減衰係数決定器207は、入力した平滑化処理後のS/N比Dによって、減衰係数を決定するが、その具体的方法の一例が図3の条件分岐306とステップ307とステップ308に示されている。
【0075】
まず、図3のステップ306において平滑化処理後のS/N比Dが閾値Th2を越えているかどうかを評価し、閾値Th2を越えていれば、符号化歪みは小さく音声部であると判断し、ステップ308において減衰係数は1(即ちターゲットの減衰はしない)とする。一方、平滑化処理後のS/N比Dが閾値Th2以下の場合は、符号化歪みが大きく非音声部である可能性が高いと判断し、ステップ307において1以下の減衰係数を設定する。ステップ307ではさらに閾値Th3を用いた閾値処理によって非音声部か音声部かの判定を行うが、判定結果がフレーム間で頻繁に変化した場合に減衰係数が大きく変動してしまうことを避けるために、減衰係数が最大値(=1.0)から最小値(例えば0.25)の間で徐々に変化するような操作を行っている。
【0076】
具体的には、減衰係数の急な変動を避けるために現在のフレームを含む過去Nフレームで決定された減衰係数の移動平均をとるような形で減衰係数を求めるようにしている。すなわち、図3のステップ307に示したように、減衰係数を現在を含む過去Nフレームにおけるγの和で表し、γの値をS/N比Dが大きいか小さいかによって各フレームにおけるγの値を切替える(γの値は配列M_sup[N]に保持される)。つまり、D<Th3の場合はγの値を小さくし(=γ1)、D≧Th3の場合はγの値を大きくする(=γ2)。例えば、25フレーム連続して平滑化処理後のS/N比DがTh3未満であった場合に減衰係数が0.25になる様にすると、ステップ307におけるγ1=0.01となり、その反対に25フレーム連続して平滑化処理後のS/N比DがTh3以上であった場合には減衰係数を1.00になるようにすると、ステップ307におけるγ2=0.04となる。このようにすることによって、フレーム間で平滑化処理後のS/N比が閾値Th3の前後を変動するようなことがあっても、減衰係数G_supが大きく変動しないようにしている。また、過度に減衰係数が小さくなるのを防ぐために減衰係数の最小値(G_sup_min)も定められていて、それ以下の値にはならないようなクリッピング処理も行う。
【0077】
最後にステップ309において、M_sup[i](i=0,...、N-1)の総和によって求められた減衰係数G_supが出力される。出力された減衰係数は乗算器111において、ターゲットベクトルに乗ぜられる。
【0078】
なお、Th1≧Th2>Th3であり、Th1は平滑化フィルタの選択に用いられ、Th2は音声部かどうかの判定に用いられ、Th3は非音声部かどうかの判定に用いられる。
なお、Th2≧D≧Th3の範囲にある場合は、音声部と判定されるが、過去Nフレームにおける判定結果によって減衰係数が決定される。
【0079】
図4は復号化装置を示している。以下、図4を参照してその構成および動作を説明する。
【0080】
図4において、401は符号器側から伝送されたLPCの情報LからLPCを復号してqaとして復号LPCを出力するLPC復号器、402は符号器側から伝送されてきたピッチ周期Pを入力し、ピッチ周期Pに基づいて適応符号帳403から適応符号ベクトルを取り出して音源生成器408に出力する適応符号ベクトル復号器、403は音源生成器408から出力された音源ベクトルをフレーム毎に更新しながらバッファリングし、適応符号ベクトル復号器402に出力する適応符号帳、404は符号器側から伝送されてきた雑音符号帳インデックスSを入力し、Sに対応する雑音符号ベクトルを雑音符号帳405から取り出して音源生成器408に出力する雑音符号ベクトル復号器、405は符号器のものと同一の内容を格納しており、雑音符号ベクトルを雑音符号ベクトル復号器404に出力する雑音符号帳、406は符号器側から伝送されてきた利得符号帳インデックスGを入力し、Gに対応する利得を利得符号帳407から取り出して量子化利得を復号し、音源生成器408に出力する利得復号器、407は符号器のものと同一の内容を格納しており、量子化利得を利得復号器406に出力する利得符号帳、408は適応符号ベクトルと雑音符号ベクトルと復号利得とをそれぞれ適応符号ベクトル復号器402と雑音符号ベクトル復号器404と利得復号器406とからそれぞれ入力し、生成した音源ベクトルを合成フィルタ409と適応符号帳403とに出力する音源生成器、409はLPC復号器401から出力されたqaを用いて合成フィルタを構築し、音源生成器408から出力された音源ベクトルをフィルタ入力としてフィルタ処理を行い、復号音声信号を出力する合成フィルタである。
【0081】
以上のように構成された復号器について、以下にその動作を図4を参照しながら説明する。符号器側から伝送されてきたLPC情報LはLPC復号器401によって復号される、復号LPCはqaとして出力され、合成フィルタ409を構成するのに用いられる。符号器側から伝送されてきたピッチ周期Pは適応符号ベクトル復号器402に入力される。Pを用いて適応符号ベクトルが適応符号帳403から切り出されて復号適応符号ベクトルとして音源生成器408に出力される。符号器側から伝送されてきた雑音符号帳インデックスSは雑音符号ベクトル復号器に入力され、Sを用いて雑音符号ベクトルが雑音符号帳405から取り出されて音源生成器408に出力される。符号器側から伝送されてきた利得符号帳インデックスGは利得復号器406に入力され、Gを用いて量子化利得が利得符号帳407から取り出され適応符号帳利得と雑音符号帳利得が復号されて音源生成器408に出力される。音源生成器408は適応符号ベクトル復号器402から出力された適応符号ベクトルに利得復号器406から出力された適応符号帳利得とを乗算したベクトルと、雑音符号ベクトル復号器404から出力された雑音符号ベクトルと利得復号器406から出力された雑音符号帳利得とを乗算したベクトルとの加算を行い、合成フィルタ409に出力する。合成フィルタ409に出力された復号音源ベクトルは同時に適応符号帳403にも出力され、次のサブフレームで用いる適応符号帳の一部となる。合成フィルタ409は音源生成器408から出力された復号音源ベクトルを入力としてqaを用いて構成した合成フィルタを用いて復号音声を合成し、出力する。
【0082】
このように上記実施の形態によれば、入力信号の中から連続して符号化歪みが大きいような部分を選んで利得を減衰させるため、非音声信号のように符号化歪みが大きくなる信号が連続するような背景雑音部等を雑音抑圧装置等を用いずに抑圧し、抑圧しない場合に発生する聴覚的な不快感を軽減することができる音声符号化装置および音声符号化復号化装置を実現することが出来る。
【0083】
また、判定を誤って音声部分に対して減衰処理が適応された場合においても、減衰係数の変動が緩衝されているため大きな不快感はなく、単に振幅レベルが小さくなるだけなので、音色に対しては影響がほとんどない。
【0084】
なお、本実施の形態においては、ピッチ探索、雑音符号帳探索、利得符号帳探索をフレーム単位で行うように示したが、1フレームを複数のサブフレームに分割してサブフレーム単位の処理で行う場合も同様である。
【0085】
また、復号化装置において合成された復号音声は、後処理を加えることによって聴覚的な品質を向上することができる。
【0086】
なお、本実施例では減衰係数110と乗算器111を有する部分に特徴があるので、図1のその他のブロックについてはどのような構成であっても良く、図1に示した構成以外のCELP型音声符号化装置に対して適用できるものである。
【0087】
(実施の形態2)
図5は上記実施の形態1の音声符号化装置、復号化装置を備えた音声信号送信機および受信機を示したブロック図である。図5において、501はマイク等音声信号を電気的信号に変換してA/D変換器502に出力する音声信号入力装置、502は音声信号入力装置から出力されたアナログ音声信号をディジタル信号に変換して音声符号化器503に出力するA/D変換器、503は本発明の第1の実施の形態の音声符号化装置によって音声符号化を行ってRF変調器504に出力する音声符号化器、504は音声符号化器503によって符号化された音声情報を電波等の伝播媒体に載せて送出するための信号に変換し、送信アンテナ505に出力するRF変調器、505はRF変調器504から出力された送出信号を電波(RF信号)として送出する送信アンテナ、506は送信アンテナ505から送出された電波(RF信号)である。また、507は電波(RF信号)506を受信してRF変調器508に出力する受信アンテナ、508は受信アンテナ507から入力した受信信号を符号化された音声信号に変換して音声復号化器509へ出力するRF復調器、509はRF復調器から出力された符号化された音声信号を入力として本発明の第1の実施の形態に示される音声復号化装置によって復号処理を行い、復号音声信号をD/A変換器510に出力する音声復号化器、510は音声復号化器509から復号音声信号を入力してアナログ音声信号に変換し、音声出力装置511に出力するD/A変換器、511はD/A変換器510からアナログ音声信号を入力して音声を出力するスピーカ等の音声出力装置である。
【0088】
以上のように構成された音声信号送信機および受信機について、図5を参照して説明する。まず、音声が音声入力装置501によって電気的アナログ信号に変換され、A/D変換器502に出力される。続いて前記アナログ音声信号がA/D変換器502によってディジタル音声信号に変換され、音声符号化器503に出力される。続いて音声符号化器503は音声符号化処理を行い、符号化した情報をRF変調器504に出力する。続いてRF変調器は符号化された音声信号の情報を変調・増幅・符号拡散等の電波として送出するための操作を行い、送信アンテナ505に出力する。最後に送信アンテナ505から電波(RF信号)506が送出される。一方、受信機においては、電波(RF信号)506を受信アンテナ507で受信し、受信信号はRF復調器508に送られる。RF復調器508は符号逆拡散・復調等電波信号を符号化情報に変換するための処理を行い、符号化情報を音声復号化器509に出力する。音声復号化器509は、符号化情報の復号処理を行ってディジタル復号音声信号をD/A変換器510へ出力する。D/A変換器510は音声復号化器509から出力されたディジタル復号音声信号をアナログ復号音声信号に変換して音声出力装置511に出力する。最後に音声出力装置511が電気的アナログ復号音声信号を復号音声に変換して出力する。
【0089】
上記送信装置および受信装置は携帯電話等の移動通信機器の移動機または基地局装置として利用することが可能である。
【0090】
なお、情報を伝送する媒体は本実施の形態に示したような電波に限らず、光信号などを利用することも可能であり、さらには有線の伝送路を使用することも可能である。
【0091】
なお、上記実施の形態1に示した音声符号化装置または符号化復号化装置および上記実施の形態2に示した送信装置および送受信装置と同等の機能を提供するプログラムを、磁気ディスク、光磁気ディスク、ROMカートリッジ等の記録媒体にソフトウェアとして記録する。その記録媒体を使用することにより、このような記録媒体を使用するパーソナルコンピュータ等により音声符号化装置/復号化装置および送信装置/受信装置を実現するとができる。
【0092】
【発明の効果】
以上詳記したように本発明によれば、符号化歪みが大きくなるような背景雑音等の非音声部分において合成信号の振幅を減衰させる機能を符号器側の利得符号化手段の前段に設けているため、新たな伝送情報を要せずに背景雑音等の抑圧を行い、符号化歪みの大きい信号を生成する際に生じる聴覚的な不快感を軽減することができるものである。
【0093】
また本発明によれば、上記音声符号化装置または音声符号化復号化装置を音声符号化器または音声符号化復号化器として備えることにより、より背景雑音の不快感を軽減できる音声信号送信装置または送受信装置を実現できるものである。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声符号化装置の構成を示すブロック図
【図2】実施の形態1における減衰係数算出器の構成を示すブロック図
【図3】実施の形態1における減衰係数算出器の処理の流れを示す流れ図
【図4】実施の形態1における音声復号化装置の構成を示すブロック図
【図5】本発明の実施の形態2における音声信号送信装置および受信装置の構成を示すブロック図
【符号の説明】
101 入力バッファ
102 LPC分析器
103 逆フィルタ
104 ターゲット算出器
105 LPC量子化器
106 ピッチ候補選択器
107 閉ループピッチ探索器
108 雑音符号帳探索器
109 利得符号帳探索器
110 減衰係数算出器
111 乗算器
112 フィルタ状態更新器
113 音源生成器
114 インパルス応答算出器
115 適応符号帳
116 雑音符号帳
117 利得符号帳
201 最適利得算出器
202 歪み算出器
203 切換スイッチ
204 第1の平滑化フィルタ
205 第2の平滑化フィルタ
206 切換スイッチ
207 減衰係数決定器

Claims (11)

  1. 適応符号帳成分及び雑音符号帳成分の振幅を符号化する符号化手段と、前記符号化手段の処理の前に、符号化対象の音声信号に減衰係数を乗じる減衰手段と、を具備し、
    前記減衰手段は、符号化対象とするターゲットベクトルについての符号化歪みを算出する歪み算出器と、算出された符号化歪みが、所定の閾値未満の場合には減衰係数を1に設定し、前記閾値以上の場合には減衰係数を1以下に設定する減衰係数決定器と、設定された減衰係数を前記音声信号に乗算する乗算器と、を具備する、
    ことを特徴とする音声符号化装置。
  2. 前記減衰手段は、現在を含む過去有限時間長において算出された複数の係数の総和により前記減衰係数を定義することを特徴とする請求項1記載の音声符号化装置。
  3. 各々異なる強度で符号化歪みを平滑化する複数の平滑化フィルタと、前記歪み算出器の算出した符号化歪みの大きさに応じて当該符号化歪みを平滑化する平滑化フィルタを切り替える第1のスイッチとを備え、平滑化された符号化歪みを前記減衰係数決定器へ入力することを特徴とする請求項1記載の音声符号化装置。
  4. 減衰係数がフレーム間で最大値から最小値の間で徐々に変化するように制御することを特徴とする請求項3記載の音声符号化装置。
  5. 音声信号を電気的信号に変換する音声入力装置と、前記音声入力信号装置から出力される信号をディジタル信号に変換するA/D変換器と、前記A/D変換器から出力されるディジタル信号を符号化する請求項1から請求項4のいずれかに記載の音声符号化装置と、前記音声符号化装置から出力される符号化情報に対して変調処理を行うRF変調器と、前記RF変調器から出力された信号を電波(RF信号)として送信する送信アンテナと、を備える音声信号送信装置。
  6. 請求項1から請求項4のいずれかに記載の音声符号化装置とCELP型音声復号化装置とからなり、前記CELP型音声復号化装置は、スペクトル特性を表すパラメータの符号化情報を復号化する手段と、過去に生成した駆動音源ベクトルを格納した適応符号帳を用いて適応符号ベクトルを復号化する手段と、予め定められた数の定められた駆動音源ベクトルを格納する雑音符号帳を用いて雑音符号ベクトルを復号化する手段と、適応符号帳成分と雑音符号帳成分の振幅を復号化する手段と、復号化されたスペクトルパラメータと駆動音源信号によって復号音声信号を合成する手段とを具備する音声符号化復号化装置。
  7. 受信電波を受信する受信アンテナと、前記アンテナで受信した信号の復調処理を行うRF復調器と、前記RF復調器によって得られた情報の復号化処理を行う請求項6記載の音声符号化復号化装置と、前記音声符号化復号化装置によって復号されたディジタル音声信号のD/A変換を行うD/A変換器と、前記D/A変換器によって出力される電気的信号を音声信号に変換する音声出力装置とを具備する音声信号受信装置。
  8. 請求項1から請求項4のいずれかに記載の音声符号化装置を備えたことを特徴とする移動局装置。
  9. 請求項1から請求項4のいずれかに記載の音声符号化装置を備えたことを特徴とする基地局装置。
  10. 音声のスペクトル特性を表すパラメータを符号化し、過去に生成した駆動音源ベクトルを格納した適応符号帳を用いて駆動音源の周期性を符号化し、予め定められた数の定められた駆動音源ベクトルを格納する雑音符号帳を用いて前記適応符号帳では表せない駆動音源成分を符号化し、適応符号帳成分と雑音符号帳成分の振幅を符号化し、これらの符号化情報によって入力音声信号を表現する音声符号化方法であって、
    符号化された適応符号帳成分と雑音符号帳成分から合成される信号と、符号化対象とされている入力信号との歪みを算出する工程と、
    算出された前記歪みのフレーム間における変動を平滑化するための処理を行う工程と、
    前記平滑化処理後の前記歪みが、所定の閾値未満の場合には係数を1に設定し、前記閾値以上の場合には係数を1以下に設定する工程と、
    前記設定した係数を前記入力音声信号に乗じて前記入力音声信号の振幅減衰を行う工程と、
    を具備することを特徴とする音声符号化方法。
  11. コンピュータに、
    音声のスペクトル特性を表すパラメータを符号化する手順と、
    過去に生成した駆動音源ベクトルを格納した適応符号帳を用いて駆動音源の周期性を符号化する手順と、
    予め定められた数の定められた駆動音源ベクトルを格納する雑音符号帳を用いて前記適応符号帳では表せない駆動音源成分を符号化する手順と、
    適応符号帳成分と雑音符号帳成分の振幅を符号化する手順と、
    符号化された適応符号帳成分と雑音符号帳成分から合成される信号と、符号化対象とされている入力信号との歪みを算出する手順と、
    算出された前記歪みのフレーム間における変動を平滑化するための処理を行う手順と、
    前記平滑化処理後の前記歪みが、所定の閾値未満の場合には係数を1に設定し、前記閾値以上の場合には係数を1以下に設定する手順と、
    前記設定した係数を前記入力音声信号に乗じて前記入力音声信号の振幅減衰を行う手順と、
    を実行させるためのプログラムを記録した機械読取可能な記録媒体。
JP25835298A 1998-09-11 1998-09-11 音声符号化装置 Expired - Fee Related JP4295372B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25835298A JP4295372B2 (ja) 1998-09-11 1998-09-11 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25835298A JP4295372B2 (ja) 1998-09-11 1998-09-11 音声符号化装置

Publications (2)

Publication Number Publication Date
JP2000089797A JP2000089797A (ja) 2000-03-31
JP4295372B2 true JP4295372B2 (ja) 2009-07-15

Family

ID=17319050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25835298A Expired - Fee Related JP4295372B2 (ja) 1998-09-11 1998-09-11 音声符号化装置

Country Status (1)

Country Link
JP (1) JP4295372B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3273599B2 (ja) * 1998-06-19 2002-04-08 沖電気工業株式会社 音声符号化レート選択器と音声符号化装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
EP2099025A4 (en) * 2006-12-14 2010-12-22 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
JP2011027757A (ja) * 2007-11-22 2011-02-10 Mitsubishi Electric Corp オーディオ機器用音声認識装置

Also Published As

Publication number Publication date
JP2000089797A (ja) 2000-03-31

Similar Documents

Publication Publication Date Title
Chen et al. Real-time vector APC speech coding at 4800 bps with adaptive postfiltering
KR100367267B1 (ko) 멀티모드 음성 부호화 장치 및 복호화 장치
US6574593B1 (en) Codebook tables for encoding and decoding
US6735567B2 (en) Encoding and decoding speech signals variably based on signal classification
AU714752B2 (en) Speech coder
JP3678519B2 (ja) オーディオ周波数信号の線形予測解析方法およびその応用を含むオーディオ周波数信号のコーディングならびにデコーディングの方法
US6581032B1 (en) Bitstream protocol for transmission of encoded voice signals
US6714907B2 (en) Codebook structure and search for speech coding
EP0732686B1 (en) Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec
JP4176349B2 (ja) マルチモードの音声符号器
US20070088543A1 (en) Multimode speech coding apparatus and decoding apparatus
KR20030046451A (ko) 음성 코딩을 위한 코드북 구조 및 탐색 방법
JPH09127996A (ja) 音声復号化方法及び装置
CN101006495A (zh) 语音编码装置、语音解码装置、通信装置以及语音编码方法
JP3062226B2 (ja) 条件付き確率的励起符号化法
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
JP3343082B2 (ja) Celp型音声符号化装置
JP4295372B2 (ja) 音声符号化装置
JP3074680B2 (ja) 音声復号器のポスト雑音整形フィルタ
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
EP0971337A1 (en) Method and device for emphasizing pitch
JP4527175B2 (ja) スペクトルパラメータ平滑化装置及びスペクトルパラメータ平滑化方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees