JP3291004B2 - 音声符号化回路 - Google Patents
音声符号化回路Info
- Publication number
- JP3291004B2 JP3291004B2 JP19989591A JP19989591A JP3291004B2 JP 3291004 B2 JP3291004 B2 JP 3291004B2 JP 19989591 A JP19989591 A JP 19989591A JP 19989591 A JP19989591 A JP 19989591A JP 3291004 B2 JP3291004 B2 JP 3291004B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- processing
- vector
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
等のディジタル通信機器に用いられる音声符号化回路に
関するものである。
ル音声通信に使用する音声符号化回路のブロック図であ
る。アナログ音声入力はA/D変換器1でディジタル変
換され割り込み信号(一般に8kHz/125μS毎を
使用する)が入る毎に割り込み処理が行われてフレーム
メモリ3に音声データが蓄積される。それらの蓄積され
た音声データに対し、エンコーダ2によって音声符号化
処理が行われる。エンコーダ2はディジタルシグナルプ
ロセッサ(DSP)が用いられる。それらの処理された
信号はディジタル音声データ(符号化データ)として、
例えば8kHzの速度で伝送路へ出力される。このDS
Pはクロックに同期して動作しており、後述の例では1
0MHzのクロックに同期して動作する。
て、音声分析合成法の一つであるコード駆動LPC符号
化(CELP:Code excited linear predictionまたは
符号化励振法)方式が用いられるようになっている。
表的な一つであり、音源符号帳(コードブック)内に多
数用意された雑音源ベクトルから合成音を再生し、その
中で入力音声に最も近い合成音声を与える雑音源ベクト
ルを選択してそのインデックス(コード番号)を伝送す
る方法である。
P方式によって符号化する部分の詳細を示すブロック図
であり、図7はそのフレーム単位の処理を示すフローチ
ャートである。図6の音声入力は、DSP内でフレーム
単位に取り込んだフレームメモリ3からのディジタル音
声入力である(図7のステップ71)。この音声入力は
音声の有無にかかわらず符号化処理が行われる。
合成器4で線形予測分析(以下、LPCと記述する)を
行い(ステップ72)、その残差部について長期予測分
析合成器5で長期予測(以下、LTPと記述する)を行
い(ステップ73)、最後にLTPの残差に対してベク
トル量子化器6でベクトル量子化を行い(ステップ7
4)符号化する。ベクトル量子化とは複数の白色雑音サ
ンプルが用意されたコードブックの中から残差波形に最
も良く当てはまるものを求め、そのコード番号を符号と
して伝送するもので、情報圧縮率の高い符号化が可能な
手法である。
あり、図9はこのときの1フレーム内の処理部分を示す
タイムチャートである。ここで、図9の斜線部は、音声
データを取り込むための割り込み処理であり、それ以外
の部分が音声符号化処理(ENCODE処理)に要する
時間である。なお、割り込み処理は割り込み信号に、通
常の処理はクロックにそれぞれ同期して動作し、一般に
割り込み信号は8kHz、クロックは10MHzが使用
される。
ては、DSP内での無音声時の音声符号化処理に伴う消
費電力の無駄がある。即ち、音声符号化処理として前述
のCELP方式を使用した場合、低ビットレートでも良
好な音質が得られる点では有効であるが、処理量が多く
ベクトル探索に多大な演算量を必要とする。現在入手可
能なDSPを使用した場合でも1フレーム長での処理の
ほとんどが占有される。ところが、実際の会話において
は片方の送話者が発声する時間は会話全体の35%程度
であるとされており、通話中に音声がない部分が多く存
在し、そういった部分でも音声符号化処理を行っている
ため無駄な電力を消費している。
理量の代表例としてBB−CELP/8kbpsの場
合、信号処理量は表1のようになる。
ことを考えると、表1から120.4Kステップ必要で
あり、これを音声符号化に通常使用される1フレームあ
たり20msecという時間で処理するには6.02M
ipsのDSPが必要となる。
Pを使用することを考えると、上記の符号化・復号化処
理は約61%の時間内に処理できることからその消費電
力は152.5mWとなる。ただし、このDSPが信号
処理を実行していない時間はパワーダウンモードを使用
しているものとし、その時の消費電力は0mWとした。
本発明の目的は、前述の無音時におけるDSPの消費電
力の無駄を低減することのできる音声符号化回路を提供
することにある。
は、フレーム化されたディジタル音声入力を線形予測分
析し長期予測を行って得られる残差信号をベクトル量子
化器に入力し、該ベクトル量子化器内のコードブックに
用意された複数の雑音源ベクトルから合成音を再生しそ
の中で前記音声入力に最も近い合成音声を与える雑音源
べクトルを選択してそのコード番号を出力して伝送する
CELP方式の音声符号化回路において、前記音声入力
の音声の有無をフレーム単位に検出する音声検出器と、
該音声検出器の音声検出結果が無音のとき、該音声検出
器からの信号により前記ベクトル量子化器の雑音源べク
トル検索処理を休止させるパワーダウンモードに制御す
るモード切替器と、雑音を発生させる雑音発生器と、前
記音声検出器の音声検出結果が無音のとき、該音声検出
器からの信号により前記ベクトル量子化器からの前記コ
ード番号の代りに前記雑音発生器からの出力を伝送する
ように制御する切替器とを備えたことを特徴とするもの
である。
る。図において、4〜7は図6と同じ構成要素を示す。
この中でベクトル量子化器6内のコードブックに用意さ
れた雑音源ベクトルの中から入力音声に最も近い合成音
声を与える雑音源ベクトルを探索する膨大な演算量を軽
減するために、音声検出器(VAD:voice activity d
etector)8によって音声入力が有音か無音かをフレーム
単位に検出し、無音のときはモード切替器9にベクトル
量子化器6に対してパワーダウンモード(またはスリー
プモード)を指示する信号を与える。これによってベク
トル量子化器6は演算処理を休止しこの部分の電力消費
がなくなる。
ード番号が出力されなくなるので、コード番号の代りに
乱数発生器10からの乱数を符号化器7に入力するため
に、音声検出器8からの信号によって切替器11を制御
する。図2は本発明の処理のアルゴリズムを示すフロー
チャートである。図2において、音声データをフレーム
メモリに蓄積(ステップ21)した後、従来と同様にL
PC(ステップ22),LTP(ステップ23)を行
う。次に音声検出処理(ステップ24)を施すことによ
り、音声の有無を判定(ステップ25)し、その結果に
よって次のステップの処理を行う。すなわち、そのフレ
ームが有音のときはベクトル量子化により符号化(ステ
ップ26)し、無声のときは乱数を発生(ステップ2
7)し、コード番号を乱数の値で置き換えて符号化を行
う。このことは、雑音の場合はスペクトル情報のみを伝
送し、音源情報は乱数に置き換えても聴感上特に問題は
ないという事実に基づく。次にDSPのベクトル量子化
器6をパワーダウンモードで動作(ステップ28)さ
せ、次のフレームの処理に移る際にそのモードを解除
(ステップ29)する。
ャートである。音声検出処理により、フレームのは無
音声、フレームは有音声、フレームは無音声と判定
され、フレームとフレームではDSPはパワーダウ
ンモードとなり、フレームではベクトル量子化による
符号化が行われる。
分について示すタイムチャートである。図4(A)は入
力音声が無音声の場合のタイムチャートであり、(B)
は入力音声が有音声の場合のタイムチャートである。斜
線部分は割り込み処理(音声データ取り込み)を表し、
格子斜線の部分は処理モードを表す。また、斜線のない
白い部分はパワーダウンモードを表す。DSPはそのモ
ードに関わらず割り込み処理を行って音声データを取り
込み、同時にカウンタにより割り込み回数をカウント
し、1フレーム長のデータを取り込むと音声検出処理を
行う。パワーダウンモードの場合はデータを取り込むと
同時にパワーダウンモードを解除して通常の処理モード
に切替えて処理が行われる。
の代表的なものとしてBB−CELP/8kbpsにつ
いて比較説明する。ここで使用したDSPは10Mip
s/250mWである。従来例に対して新たに付加され
た処理量は音声検出に要する1.5Kステップである。
また、音声データ以外の入力に対しては、コードブック
の検索・符号化の処理のうちで検索処理(44Kステッ
プ)は不要になる。従って本発明による処理量をまとめ
ると次の表2のようになる。
処理を行った場合について説明する。音声信号処理の時
間率を35%,非音声信号の時間率を65%、また復号
化処理を100%として全体の処理量を求めると93.
3Kステップとなる。これはフレーム長を20msec
とし、10MipsのDSPで実行すると47%の処理
量となり消費電力の平均値は117.5mWとなる。こ
の値は従来比で35mW低減されている。このようにD
SPを使用した音声符号器の消費電力を低減することが
できる。
音源情報は、コードブックの適当なパターンを伝送する
ことにより復号側では特別の処理は必要にならず、ま
た、本符号化回路を使用するシステムには全く変更を必
要としないため、音声符号化回路のみの処置ですむため
産業上の利用効果は大である。
施することにより、DSP自体の消費電力を20%程度
低減することができる。これにより電池動作の無線機に
あっては、従来の方式に比べ、電池の使用時間を増すこ
とができる。更に本発明は通信のプロトコルには影響を
一切与えず、音声符号化回路のみの対応であるためシス
テムから見た場合も装置製作に非常に有効である。
ート
ャート
ト
ート
Claims (1)
- 【請求項1】 フレーム化されたディジタル音声入力を
線形予測分析し長期予測を行って得られる残差信号をベ
クトル量子化器に入力し、該ベクトル量子化器内のコー
ドブックに用意された複数の雑音源ベクトルから合成音
を再生しその中で前記音声入力に最も近い合成音声を与
える雑音源べクトルを選択してそのコード番号を出力し
て伝送するCELP方式の音声符号化回路において、 前記音声入力の音声の有無をフレーム単位に検出する音
声検出器と、 該音声検出器の音声検出結果が無音のとき、該音声検出
器からの信号により前記ベクトル量子化器の雑音源べク
トル検索処理を休止させるパワーダウンモードに制御す
るモード切替器と、 雑音を発生させる雑音発生器と、 前記音声検出器の音声検出結果が無音のとき、該音声検
出器からの信号により前記ベクトル量子化器からの前記
コード番号の代りに前記雑音発生器からの出力を伝送す
るように制御する切替器とを備えたことを特徴とする音
声符号化回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19989591A JP3291004B2 (ja) | 1991-07-16 | 1991-07-16 | 音声符号化回路 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19989591A JP3291004B2 (ja) | 1991-07-16 | 1991-07-16 | 音声符号化回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0522153A JPH0522153A (ja) | 1993-01-29 |
JP3291004B2 true JP3291004B2 (ja) | 2002-06-10 |
Family
ID=16415393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19989591A Expired - Lifetime JP3291004B2 (ja) | 1991-07-16 | 1991-07-16 | 音声符号化回路 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3291004B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2697642B2 (ja) | 1994-11-24 | 1998-01-14 | 日本電気株式会社 | Atm音声符号化装置 |
JPH1049199A (ja) * | 1996-08-02 | 1998-02-20 | Nec Corp | 無音圧縮音声符号化復号化装置 |
JP2856185B2 (ja) * | 1997-01-21 | 1999-02-10 | 日本電気株式会社 | 音声符号化復号化システム |
-
1991
- 1991-07-16 JP JP19989591A patent/JP3291004B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH0522153A (ja) | 1993-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5752223A (en) | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals | |
CN1307614C (zh) | 合成语音的方法和装置 | |
JPS5870300A (ja) | パラメ−タのコ−ド化法及び解析コ−ド化装置 | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
JP3092652B2 (ja) | 音声再生装置 | |
US4716591A (en) | Speech synthesis method and device | |
JP3223966B2 (ja) | 音声符号化/復号化装置 | |
JP2001053869A (ja) | 音声蓄積装置及び音声符号化装置 | |
JP3291004B2 (ja) | 音声符号化回路 | |
JP2013250582A (ja) | 複雑さ分散によるデジタル信号の転送誤り偽装 | |
KR100847391B1 (ko) | 음성 통신용 컴포트 노이즈 생성 방법 | |
JPH10247093A (ja) | オーディオ情報分類装置 | |
JP3055608B2 (ja) | 音声符号化方法および装置 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
US6385574B1 (en) | Reusing invalid pulse positions in CELP vocoding | |
JPH07334197A (ja) | 音声符号化装置 | |
JP3235526B2 (ja) | 音声圧縮伸長方法及びその装置 | |
JPH05252121A (ja) | 音声符号化処理回路 | |
JPH10124097A (ja) | 音声記録再生装置 | |
JP2762938B2 (ja) | 音声符号化装置 | |
JP2860991B2 (ja) | 音声蓄積再生装置 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JPH08234796A (ja) | 符号化音声の復号化器装置 | |
JP2000020097A (ja) | 低消費電力型背景雑音生成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080322 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090322 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100322 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100322 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110322 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120322 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120322 Year of fee payment: 10 |