JP3423906B2

JP3423906B2 - 音声の動作特性検出装置および検出方法

Info

Publication number: JP3423906B2
Application number: JP32819899A
Authority: JP
Inventors: ダニエル・ケネス・フリーマン; イヴン・ボイド
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 1988-03-11
Filing date: 1999-11-18
Publication date: 2003-07-07
Anticipated expiration: 2018-07-07
Also published as: JP2000148172A; IE890774L; KR900700993A; AU3355489A; NO316610B1; FI20010933A; ES2188588T3; NO982568D0; CA1335003C; IE61863B1; FI904410A0; PT89978B; DK175478B1; NZ228290A; DE68910859T2; BR8907308A; EP0335521A1; WO1989008910A1; EP0548054B1; DK215690D0

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】音声の動作特性検出器（ｖｏ
ｉｃｅａｃｔｉｖｉｔｙｄｅｔｅｃｔｏｒ）は、会
話の期間、又はノイズのみを含む期間を検出する目的を
有する信号が供給される装置である。この発明はこれら
の応用に限るものではなく、そのような検出器に関する
この発明の特定な実施例には、移動ラジオ電話システム
があり、このシステムにおいて会話は会話コ−ダ（ｃｏ
ｄｅｒ）によって利用され、電波スペクトルの有効な利
用法を改善し、又、それらのシステムではノイズレベル
（車に搭載されたユニットからの）は一般に大きい。

【０００２】

【発明が解決しようとする課題】音声の動作特性検出の
本質は、会話と会話ではない期間の間で異なる分量を探
すことである。会話コ−ダを含む装置において、一つコ
−ダから、又は他のステ−ジから、多くのパラメ−タを
容易に用いることができ、従ってそのようなパラメ−タ
を利用することによって、必要な処理を経済的に簡素に
することが望まれる。多くの状況において、主要なノイ
ズはある周波数スペクトルの限られた領域内に発生す
る。例えば移動する車（自動車）のノイズ（例えばエン
ジンノイズ）は、低い周波数帯域スペクトルである。ノ
イズスペクトルのそのような位置に関する認識が利用で
きる場合は、比較的少ないノイズを含むスペクトル部分
から得られた測定量について、会話が存在するかどうか
の判断の基準を置くのが望ましい。勿論、会話の動作特
性を検出して分析する前に、信号を濾波することが実際
に可能であるが、音声の動作特性検出器が会話コ−ダの
出力に依存している場合、この前段濾波はコ−ド化され
る音声信号を妨害する。

【０００３】

【課題を解決するための手段】第３図にその実施の形態
を示す本発明によれば、入力信号内に会話が存在するか
存在しないかを示す出力信号を作成するため、入力信号
成分と会話がないと判断される入力信号の成分との間の
スペクトル的類似性の値を形成するように動作する第１
音声動作特性検出器と、前記会話がない部分から導かれ
たデータを格納するメモリと、補助的な音声動作特性検
出器とを有し、前記補助的な音声動作特性検出器は前記
メモリの更新を制御し、前記補助的な動作特性検出器は
入力信号の最新の成分と入力信号のより早期の成分との
間のスペクトル的類似性の値を形成するように動作する
音声動作特性検出装置が提供される。

【０００４】また、入力信号の会話動作特性を検出する
方法であって、入力信号を受信し、入力信号のノイズ信
号部分を概算し、ノイズ信号部分を表現するデータを格
納し、入力信号の一部とノイズ信号部分との間のスペク
トル的類似性の値Ｍを形成し、スレショルド値（ｔｈｒ
ｅｓｈｏｌｄｖａｌｕｅ）より高いか否かに従って会
話が存在するか存在しないかを示す第１の音声動作特性
指示を作成するため、上記値Ｍから導かれるパラメータ
を第１のスレショルド値Ｔと比較し、ここで概算するス
テップは補助的な音声動作特性指示の作成を含み、そし
て、補助的な音声動作特性指示の作成は、入力信号の最
新の成分と入力信号のより早期の成分との間の類似性の
スペクトル歪み値を形成し、その値を超えるか超えない
かに対応して会話が存在するか存在しないかの指示を作
成するために前記スペクトル歪み値を第２のスレショル
ド値と比較し、補助的な音声動作特性指示が会話が存在
しないと指示する期間においてのみ入力信号により前記
格納されたデータを更新するステップを含む方法が提供
される。

【０００５】上記値Ｍは、板倉・斎藤による歪み値であ
ることが望ましい。

【０００６】この発明の他の局面は特許請求の範囲に含
まれる。

【０００７】

【発明の実施の形態】この発明の幾つかの実施例が添付
図面を参照してこれより説明される。

【０００８】この発明による音声の動作特性検出器の第
１実施例を特徴付ける一般原則が次に示される。

【０００９】ｎ個の信号サンプル（ｓ_０，ｓ_１，ｓ_２，ｓ_３，ｓ_４ … ｓ_ｎ−１）は、
パルス応答（１，ｈ_０，ｈ_２，ｈ_３）の概念上の４次有
限パルス応答（ＦＩＲ）デジタルフィルタを通過すると
き、濾波された信号となり（以前のフレ−ムからのサン
プルを無視する）、

【００１０】

【数１】

【００１１】０次の自己相関係数は、各項の２乗の合計
値であり、それは正規化され、即ち項の全数によって分
割され（一定フレ−ム長に関し、その分割を省略するの
が容易である）、従って濾波された信号の合計値は、

【００１２】

【数２】

【００１３】従ってこれは、論理的に濾波された信号ｓ
´の電力量、即ち概念的フィルタの通過帯域内の信号ｓ
の部分の電力量である。

【００１４】最初の４項を無視して拡張すると、

【００１５】

【数３】

【００１６】従って、Ｒ´_０は、値Ｒ´_０が応答する周
波数帯域を決定する括弧でくくった定数によって重み付
けされた自己相関係数Ｒ_ｉの結合によって得られる。実
際、括弧でくくった項は論理フィルタのパルス応答の自
己相関係数であり、従って上記表現は次のように簡単に
現すことができる。

【００１７】

【数４】

【００１８】ここで、Ｎはフィルタの次数、Ｈ_ｉはフィ
ルタのパルス応答の（正規化されていない）自己相関係
数。

【００１９】即ち、信号濾波の信号自己相関係数に関す
る効果は、要求されるフィルタが有するパルス応答を用
い、（濾波されていない）信号の自己相関係数の合計を
生成することによってシミュレ−ト（ｓｉｍｕｌａｔ
ｅ）することができる。

【００２０】従って、乗算動作の小さい数を含む比較的
簡単なアルゴリズムは、この数の１００回の乗算動作を
一般に必要とするデジタルフィルタのシミュレ−ション
を行うことができる。

【００２１】一方、この濾波動作は、信号スペクトルが
参照スペクトルに対して整合している（ｍａｔｃｈｅ
ｄ）状態で（論理フィルタの逆相応答）、スペクトル比
較の形式として見ることができる。この応用における論
理フィルタはノイズスペクトルの逆を概算するように選
択されるので、この動作は、スペクトル間の非類似性を
を示す値のような、会話及びノイズのスペクトルと、生
成される０次自己相関係数（即ち逆濾波された信号のエ
ネルギ）とのスペクトル的比較として見ることができ
る。板倉・斎藤による歪み値が、予測フィルタ（ｐｒｅ
ｄｉｓｔｏｒｆｉｌｔｅｒ）と入力スペクトルの整合
を評価するＬＰＣ内に用いられ、一つの形式は次のよう
に示される。

【００２２】

【数５】

【００２３】ここで、Ａ_０などはＬＰＣパラメ−タ・セ
ットの自己相関係数である。これは前記得られた関係に
非常に類似していることが判り、ＬＰＣ係数が入力信号
の逆スペクト応答を有するＦＩＲのタップ（ｔａｐｓ）
であり、それによってＬＰＣ係数セットは逆ＬＰＣフィ
ルタのパルス応答であることを考えれば、実際、板倉・
斎藤による歪み値は単に式１の一形式であり、そこでフ
ィルタ応答Ｈは入力信号の全ポ−ルモデル（ａｌｌ−ｐ
ｏｌｅｍｏｄｅｌ）であることは明らかである。

【００２４】事実、試験スペクトルのＬＰＣ係数と参照
スペクトルの自己相関係数を用いて、転換し、スペクト
ル的類似性の異なる値を得ることができる。

【００２５】Ｉ−Ｓによる歪み値は、”ベクトル量子化
に基づく会話の符号化”（”ＳｐｅｅｃｈＣｏｄｉｎ
ｇｂａｓｅｄｕｐｏｎＶｅｃｔｏｒＱｕａｎｔ
ｉｓａｔｉｏｎ”ｂｙＡＢｕｚｏ，ＡＨＧｒａ
ｙ，ＲＭＧｒａｙａｎｄＪＤＭａｒｋｅ
ｌ，ＩＥＥＴｒａｎｓｏｎＡＳＳＰ，ＶｏｌＡ
ＳＳＰ−２８，Ｎｏ５，Ｏｃｔｏｂｅｒ１９８０）に
更に詳細に説明されている。

【００２６】信号のフレ−ムは単に有限値長を有し、項
の数（Ｎ、ここでＮはフィルタ次数）は無視されるの
で、前述の結果は単に概算である。しかし、それは会話
があるかどうかを非常に良く示し、従って会話報告の値
Ｍとして用いられる。ノイズスペクトルが既知であり、
それが静的ノイズの場合、固定のｈ_０、ｈ_１などの係数
を逆ノイズフィルタに適用することは十分可能である。

【００２７】しかし、異なるノイズ状況に適合すること
ができる装置は更に有益である。

【００２８】第１図にはこの発明の第１実施例が示さ
れ、マイクロホン（図示されず）からの信号ｓは入力１
に受信され、アナログ・デジタルコンバ−タ２によっ
て、適切なサンプリングレ−ト（ｓａｍｐｌｉｎｇｒ
ａｔｅ）でデジタルサンプルに変換される。ＬＰＣ分析
ユニット３（一般的なＬＰＣコ−ダ［ｃｏｄｅｒ］）
は、ｎ個（例えば１６０個）のサンプルの連続するフレ
−ムについて、入力の会話を示すために送信されるＮ個
（例えば８又は１２個）のＬＰＣフィルタ係数Ｌ_ｉの一
組を得る。会話信号ｓは又、相関ユニット（ｃｏｒｒｅ
ｌａｔｏｒｕｎｉｔ）４（通常これはＬＰＣコ−ダ３
の一部分である。なぜならば、ここで分離相関器［ｓｅ
ｐａｒａｔｅｃｒｒｅｌａｔｏｒ］を供給することが
評価できるが、会話の自己相関ベクトルＲ_ｉは通常ＬＰ
Ｃ分析の１ステップとして生成されるからである）に入
力される。相関器４は自己相関ベクトルＲ_ｉを発生し、
ベクトルＲ_ｉは０次相関係数Ｒ_０、及び少なくとも更に
２つの自己相関係数Ｒ１、Ｒ２、Ｒ３を含む。これらは
マルチプライアユニット（ｍｕｌｔｉｐｌｉｅｒｕｎ
ｉｔ）５に供給される。

【００２９】第２入力１１はスピ−カから離れて配置さ
れる第２マイクロホンに接続され、背景ノイズのみが受
信される。このマイクロホンからの入力は、ＡＤコンバ
−タ１２によってデジタル入力サンプル列に変換され、
ＬＰＣアナライザ１３によってＬＰＣ分析される。アナ
ライザ１３から発生した”ノイズ”ＬＰＣ係数は相関ユ
ニット１４を通過し、それによって発生した自己相関ベ
クトルは、マルチプライア５の会話マイクロホンからの
入力信号の自己相関係数Ｒ_ｉによって項ごとに乗算さ
れ、それによって生成された重み係数は等式１に従って
加算器６によって加算され、それによってノイズのみの
マイクロホンからのノイズスペクトルの逆相形状を有す
るフィルタを提供し（実際は信号・パルス・ノイズ・マ
イクロホンにおけるノイズスペクトルと同一形状であ
る）、従って殆どのノイズを濾波する。その結果的測定
値Ｍはスレショルダ（ｔｈｒｅｓｈｏｌｄｅｒ）７によ
ってスレショルド値（ｔｈｒｅｓｈｏｌｄ）と比較さ
れ、会話が存在するかどうかを示すロジック出力８を発
生する。ここでＭが大きい場合、会話が存在すると考え
られる。

【００３０】この実施例では２つのマイクロホンと２つ
のＬＰＣアナライザを使用するが、費用と複雑性が増大
するが、必要であればこれらを増やすことができる。

【００３１】一方、他の実施例では、ノイズマイクロホ
ン１１からの自己相関、及びメインマイクロホン１から
のＬＰＣ係数を使用して形成される対応する値を使用す
る。その場合、ＬＰＣアナライザではなく、更に他の自
己相関器が必要となる。

【００３２】従ってこれらの実施例は、異なる周波数の
ノイズを有する異なる状況、又は与えられた一つの状況
において、変化するノイズスペクトルの存在する所で動
作することが可能である。

【００３３】第２図の好適実施例においては、ＬＰＣ係
数の一組（又はその一組の自己相関ベクトル）を格納す
るバッファ１５が提供され、これらの値は、”ノンスピ
−チ（ｎｏｎ−ｓｐｅｅｃｈ）（即ちノイズのみ）”と
して定義される期間に、マイクロホン入力１から得られ
る。これらの値は等式１による値を得るために使用さ
れ、勿論この測定は、板倉・斎藤による歪み測定法に対
応するが、ＬＰＣ係数の現在のフレ−ムではなく、逆相
ノイズスペクトルの概算値に一致する、ＬＰＣ係数の格
納された単一フレ−ムが使用されるところが異なる。

【００３４】アナライザ３によって出力されるＬＰＣ係
数ベクトルＬ_ｉも又、相関器１４に導かれ、それによっ
てＬＰＣ係数ベクトルの自己相関ベクトルを発生する。
バッファメモリ１５はスレショルダ７のスピ−チ／ノン
スピ−チ出力によって制御され、 ”スピ−チ”フレ−
ムの間、バッファは”ノイズ”自己相関係数を保持する
が、”ノイズ”フレ−ムの間は、ＬＰＣ係数の新たな一
組が、例えば複合スイッチ１６によってバッファを更新
するのに使用することができ、このスイッチ１６を介し
て、各自己相関係数を伝送する相関器１４の出力がバッ
ファ１５に接続される。相関器１４がバッファ１５の後
に配置されてもよい。更に、係数更新のためのスピ−チ
／ノンスピ−チの決定は出力８からである必要はなく、
（好適に）他の方法で得ることができる。

【００３５】会話の無い期間がしばしば発生するので、
バッファに格納されたＬＰＣ係数は時折更新され、それ
によって装置はノイズスペクトル内の変化に追随するこ
とができる。ノイズスペクトルが時間的に比較的安定し
ている場合（多くの場合そうであるが）、そのようなバ
ッファの更新は、極く希に、又は検出器の初期の動作の
みに必要とされると考えられが、移動する（車の）ラジ
オのような状況のときには、しばしば更新するのが望ま
しい。

【００３６】この実施例の変更例として、簡単な固定ハ
イパス・フィルタに一致する係数項を有する等式１をシ
ステムは適用し、次に”ノイズ期間”ＬＰＣ係数を使用
して切り替わることによってシステムは適合を開始す
る。幾つかの理由によって会話検出が失敗した場合、シ
ステムは簡単なハイパスフィルタを再び用いることがで
きる。

【００３７】上記値をＲ_０で割ることによって正規化す
ることができ、スレショルドと比較される表現は、

【００３８】

【数６】

【００３９】この値はフレ−ムの総合信号電力とは独立
しており、従って総合信号レベル変化に関しては補償さ
れるが、”ノイズ”と”会話”レベルの間の著しい対比
を与えず、従ってノイズの大きな環境では好適に使用さ
れることはない。

【００４０】（後述されるように）ノイズスペクトルが
徐々に変化するとき、（前述の様々な実施例におけるノ
イズマイクロホン又はノイズのみの期間から得られる）
ノイズ信号の逆フィルタ係数を得るためにＬＰＣ分析を
用いる代わりに、一般的な適合性フィルタ（ａｄａｐｔ
ｉｖｅｆｉｌｔｅｒ）を用いて逆相ノイズスペクトル
の原型を生成することができ、そのようなフィルタに共
通する比較的低速な適合率を得ることができる。第１図
に一致する実施例において、ＬＰＣ分析ユニット１３は
容易に適合性フィルタ（例えばトランスバ−サル（ｔ
ｒａｎｓｖｅｒｓａｌ）ＦＩＲ又はラティスフィルタ
（ｌａｔｔｉｃｅｆｉｌｔｅｒ））と交換することが
でき、そのフィルタは、逆フィルタの原型を生成するこ
とによって、ノイズ入力をホワイトノイズに転換するた
めにシステムに接続され、その係数は前述のように自己
相関器１４に供給される。

【００４１】第２図に示される第２実施例において、Ｌ
ＰＣ分析手段３は、そのような適合性フィルタと置換さ
れ、バッファ手段１５は省略される。しかし、スイッチ
１６は、適合性フィルタが会話期間の間、その係数を適
合するのを防止するために動作する。

【００４２】この発明の他の実施例に使用される第２の
音声の動作特性検出器がこれより説明される。

【００４３】以下の説明において、ＬＰＣ係数ベクトル
は、ＦＩＲフィルタの単にパルス応答であり、ＦＩＲフ
ィルタは入力信号の逆位相スペクトル形状であることは
明らかである。隣接するフレ−ムの間に板倉・斎藤によ
る歪み値が形成されるとき、以前のフレ−ムのＬＰＣフ
ィルタによって濾波されているので、実際にその値は信
号の電力に等しい。従って隣接するフレ−ムのスペクト
ルに違いが殆どない場合、フレ−ムの対応する僅かなス
ペクトル電力は濾波を免れ、その値は小さいであろう。
同時に、フレ−ム間の大きなスペクトルの相違は大きな
板倉・斎藤歪み値を発生し、それによってその値は隣接
するフレ−ムのスペクトルの類似性を反映する。スピ−
チコ−ダに関して、デ−タレ−トを最小とすることによ
って、フレ−ム長をできるだけ長くするのが望ましい。
即ち、フレ−ム長が十分長ければ、会話信号はフレ−ム
からフレ−ムへの重要なスペクトル変化を示す（もしそ
うでなければコ−ド化は冗長である）。一方、ノイズは
フレ−ムからフレ−ムへ徐々に変化するスペクトル形状
を有し、会話が信号に存在しない期間において、以前の
フレ−ムから逆相ＬＰＣフィルタを適用し、殆どのノイ
ズ電力を”フィルタアウト（ｆｉｌｔｅｒｏｕｔ）”
するので、板倉・斎藤による歪み値はそれに対応して少
ない。

【００４４】断続的な会話を含み、ノイズの多い信号の
隣接するフレ−ム間の板倉・斎藤歪み値は、一般にノイ
ズの期間より会話の期間の方が大きく、変化の程度（標
準偏倚によって示されるように）も大きく、断続的な変
化は少ない。

【００４５】ここで、Ｍの標準偏差（ｓｔａｎｄａｒｄ
ｄｅｖｉａｔｉｏｎ）も信頼できる値であり、各標準
偏差をとる効果は本質的に値を円滑にすることである。

【００４６】音声の動作特性検出器のこの第２の形態に
おいて、会話が存在するかどうかを判断するのに用いる
測定されたパラメ−タは、板倉・斎藤歪み値の標準偏差
であることが望ましいが、変化を測定する他の方法、及
び（例えばＦＦＴ分析に基づく）スペクトル歪みを測定
する他の方法を適用することができる。

【００４７】音声の動作特性検出に適合性スレショルド
（ａｄａｐｔｉｖｅｔｈｒｅｓｈｏｌｄ）を用いるこ
とにも利点がある。そのようなスレショルドは、会話期
間の間は調整されるべきではなく、調整されると会話信
号はスレショルドアウト（ｔｈｒｅｓｈｏｌｄｏｕ
ｔ）される。従ってスピ−チ／ノンスピ−チ制御信号を
用いてスレショルド・アダプタを制御する必要があり、
この制御信号はスレショルド・アダプタの出力から独立
しているのが望ましい。スレショルドＴは、ノイズのみ
が存在するとき、値Ｍのレベル以上のレベルに保たれる
ように調整される。その値はノイズが存在するとき一般
にランダムに変化するので、多くのブロックについての
平均レベルを決定し、スレショルドをこの平均レベルに
比例するレベルに設定することによって、スレショルド
が変化する。しかし、これはノイズの多い状況では一般
に十分ではなく、幾つかのブロックについてのパラメ−
タの変化程度に関する査定が考慮される。

【００４８】従ってスレショルド値Ｔは次式に従って計
算される。

【００４９】

【数７】

【００５０】ここでＭは、連続する多くのフレ−ムにつ
いての測定値の平均値であり、ｄはそれらフレ−ムにつ
いての測定値の標準偏差であり、Ｋは定数である（代表
的には２である）。

【００５１】実際的に、会話の存在しないことが示され
た直後に再び適合動作を開始すべきではなく、（適合及
び非適合状態の間に繰り返される急速なスイッチングを
避けるために）降下が安定したことを確認するまで待つ
べきである。

【００５２】第３図は前述の事柄を具備する本発明の好
適実施例であり、入力１はアナログ・デジタルコンバ−
タ（ＡＤＣ）２によってサンプルされ、デジタル化され
た信号を受信し、逆相フィルタアナライザ３の入力に信
号を供給し、逆相フィルタアナライザ３は実際に音声の
動作特性検出器が動作するスピ−チコ−ダの一部であ
り、又、入力信号スペクトルの逆相に一致するフィルタ
の係数Ｌ_ｉ（代表的に８）を発生する。デジタル信号は
又、（アナライザ３の一部である）自己相関器４に供給
され、自己相関器４は入力信号（又は少なくともそれら
がＬＰＣ係数と同じくらい多くの低次項）の自己相関ベ
クトルＲ_ｉを発生する。装置のこれらの部分の動作は第
１図及び第２図に示される。自己相関係数Ｒ_ｉは好適
に、連続する幾つかのスピ−チフレ−ム（代表的に５〜
２０ｍｓ）について平均値がとられ、それらの信頼度が
改善される。この平均化は、バッファ４ａ内の自己相関
器４によって出力される自己相関係数の各組を格納し、
平均器（ａｖｅｒａｇｅｒ）４ｂを用いて、現在の自己
相関係数Ｒ_ｉ、及びバッファ４ａに格納されバッファ４
ａから供給される以前のフレ−ムからの係数の重み付け
された加算値を生成することによって達成される。それ
によって得られた平均化された自己相関係数Ｒａ _ｉは重
み付け及び加算手段５、６に供給され、この手段は又、
バッファ１５を介して自己相関器１４から格納されたノ
イズ期間の逆相フィルタ係数Ｌ_ｉの自己相関ベクトルＡ
_ｉを受信し、Ｒａ_ｉ及びＡ_ｉから次式により定義される
値Ｍを形成する。

【００５３】

【数８】

【００５４】この値はスレショルダ７によって、スレシ
ョド値と比較され、会話が存在するかしないかを示す論
理結果が出力８に発生する。

【００５５】逆相フィルタ係数Ｌ_ｉがノイズスペクトル
の逆相の適切な概算に一致するために、これらの係数を
ノイズの期間に更新するのが望ましい（勿論、会話の期
間には更新しない）。しかし、その更新に基づくスピ−
チ／ノンスピ−チの決定はその更新の結果に影響され
ず、又は誤って確認された信号の単一フレ−ムによっ
て、音声の動作特性検出器は結果的に”ロックはずれ
（ｏｕｔｏｆｌｏｃｋ）”となり、次のフレ−ムを
誤って認識する。従って制御信号発生回路２０、即ち分
離音声の補助的な動作特性検出器が提供され、この検出
器は会話が存在するかどうかを示す独立制御信号を形成
し、逆相フィルタアナライザ３（又はバッファ８）を制
御し、それによって値Ｍを形成するのに用いられる逆相
フィルタ自己相関係数Ａ_ｉは”ノイズ”期間にのみ更新
される。制御信号発生回路２０はＬＰＣアナライザ２１
を含み（これは再び会話コ−ダの一部であり、特にアナ
ライザ３によって実行される）、このアナライザは、入
力信号及び自己相関器２１ａ（自己相関器３ａによって
実行することができる）に一致する一組のＬＰＣ係数Ｍ
_ｉを発生し、自己相関器２１ａはＭ_ｉの自己相関係数Ｂ
_ｉを得る。アナライザ２１がアナライザ３によって実行
された場合は、Ｍ_ｉ＝Ｌ_ｉ、及びＢ_ｉ＝Ａ_ｉである。こ
れら自己相関係数は、重み付け及び加算手段２２、２３
（５、６に同等）に供給され、この手段も自己相関器４
からの入力信号の自己相関ベクトルＲ_ｉを受信する。従
って、入力スピ−チフレ−ムと以前のスピ−チフレ−ム
の間のスペクトル的類似性が計算される。これは前記し
たように、現在のフレ−ムのＲ_ｉと以前のフレ−ムのＢ
_ｉの間の板倉・斎藤歪み値、又現在のフレ−ムのＲｉと
Ｂ_ｉに関する板倉・斎藤歪み値を計算することによって
得られ、又は対応する値をバッファ２４に格納された以
前のフレ−ムに関して減算することによって得られ、ス
ペクトル的に異なる信号を発生する（それぞれの場合、
その値はＲｏで分割することによってエネルギ・正規化
されるのが望ましい）。勿論ここでバッファ２４は更新
される。このスペクトル的に異なる信号は、スレショル
ダ２６によってスレショルドと比較されたとき、前述の
ように、会話が存在するかどうかを示す。音声とはなら
ない会話からのノイズを区別するためにこの方法は優れ
ているが（従来のシステムにおいて可能なタスク（ｔａ
ｓｋ））、音声となった会話からノイズを区別する能力
は一般に少ないことが発見された。従って、回路２０に
は、ピッチアナライザ（ｐｉｔｃｈａｎａｌｙｓｅ
ｒ）２７（実際にスピ−チコ−ダの一部として動作する
ことができ、特にマルチパルスＬＰＣコ−ダ内に生成さ
れる算定器（ｐｒｅｄｉｃｔｏｒ）の長い遅延値測定す
ることができる）を具備する音声の会話検出回路が提供
されるのが望ましい。ピッチアナライザ２７は、音声と
なった会話が検出されたとき”真理（ｔｒｕｅ）”であ
るロジック信号を発生し、この信号は、スレショルダ２
６（音声とはならない会話が存在するとき、一般に”真
理”である）から得られるスレショルド値と結合され、
ＮＯＲゲ−ト２８の入力に供給され、会話が存在すると
き”誤り（ｆａｌｓｅ）”であり、ノイズが存在すると
き”真理”である信号を発生する。この信号はバッファ
８（又は逆相フィルタアナライザ３）に供給され、それ
によって逆相フィルタ係数Ｌｉは、ノイズ期間のみに更
新される。

【００５６】スレショルドアダプタ２９も又接続され、
制御信号発生回路２０のノンスピ−チ信号制御出力を受
信する。スレショルドアダプタ２９の出力はスレショル
ダ７に供給される。スレショルドアダプタ２９の出力は
スレショルダ７に供給される。スレショルドアダプタ
は、スレショルドがノイズ電力レベルに近付くまで（こ
れは、例えば回路２２、２３の加算及び重み付けするこ
とによって容易に得られる）、瞬時スレショルドレベル
に比例するステップに、スレショルドをインクリメント
（ｉｎｃｒｅｍｅｎｔ）又はデクリメント（ｄｅｃｒｅ
ｍｅｎｔ）するように動作する。入力信号が非常に小さ
いとき、スレショルドは自動的にロ−レベルに設定され
るのが望ましい。なぜならば、小さい信号レベルのと
き、ＡＤＣ２によって生成される信号量は信頼できる結
果を生成できないからである。

【００５７】更に”ハングオ−バ（ｈａｎｇｏｖｅ
ｒ）”発生手段３０が提供され、これはスレショルダ７
の後の会話を示す期間を測定し、所定時定数を越える期
間の間、会話の存在が示されたとき、その出力は短い”
ハングオ−バ”の間、ハイに維持される。このようにし
て、ロ−レベルな会話バ−ストの中間の欠損（ｃｌｉｐ
ｐｉｎｇ）が避けられ、適切な時定数の選択によって、
会話のときに誤って示された短いスパイクノイズにより
ハングオ−バ発生器３０の起動を防ぐことができる。勿
論、前述した全ての機能は、適切にプログラムされた単
一のデジタル処理手段、例えば、ＬＰＣコ−デックの一
部として構成され（これは所望される構成である）、又
は関連するメモリ装置を有する適切にプログラムされた
マイクロコンピュ−タやマイクロコントロ−ラチップと
して構成されるデジタル信号処理チップ（ＤＳＰ）など
のような手段によって実行することができる。

【００５８】前述したように、音声検出装置はＬＰＣコ
−デックの一部として容易に構成されることができる。
一方、信号の自己相関係数、又はそれに関連する値（部
分相関又は”パルコ−ル（ｐａｒｃｏｒ）”係数）が離
れたステ−ションに送信される場合、音声検出はコ−デ
ックから離れて行われる。

【図面の簡単な説明】

【図１】第１図はこの発明の第１実施例を示すブロック
図である。

【図２】第２図はこの発明の第２実施例を示すブロック
図である。

【図３】第３図はこの発明の好適な第３実施例を示す。

【符号の説明】

１ … 入力２ … ADコンバータ３ … アナライザ４ … AFC ５ … マルチプライア６ … 加算器７ … スレショルダ８ … 出力１１ … ノイズマイクロホン１２ … ADコンバータ１３ … アナライザ１４ … AFC １５ … バッファメモリ１６ … スイッチ

フロントページの続き (72)発明者ダニエル・ケネス・フリーマンイギリス国アイ・ピー４，２エツチテイ，サフォーク，アイプスウイツチ, フインチレイ・ロード 42 (72)発明者イヴン・ボイドイギリス国アイ・ピー９，２エツクス・イー，サフォーク，アイプスウイツチ，カペル・エス・テイ・マリー，ホームフイールド５ (56)参考文献特開昭63−98700（ＪＰ，Ａ) 特公昭62−50837（ＪＰ，Ｂ２)

Claims

(57)【特許請求の範囲】

【請求項１】 (i)入力信号に会話が存在するか存在し
ないかを示す出力信号を作成するため、入力信号成分と
会話がないと判断される入力信号の成分との間のスペク
トル的類似性の値を形成するように動作する第１音声動
作特性検出器（３−６、１４）と、 (ii)前記会話がない部分から導かれたデータを格納する
メモリ（１５）と、 (iii)補助的な音声動作特性検出器（２０）とを有し、前記補助的な音声動作特性検出器（２０）は単独で前記
メモリ（１５）の更新を制御し、前記補助的な動作特性
検出器（２０）は、入力信号に会話が存在するか存在し
ないかを示す前記出力信号から独立の制御信号を生成す
るために、入力信号の最新の成分と入力信号のより早期
の成分との間のスペクトル的類似性の値を形成するよう
に動作することを特徴とする音声動作特性検出装置。
【請求項２】 (i)入力信号を受信する手段（１）と、 (ii)前記入力信号の概算されたノイズ部分を表現するノ
イズ表現信号を格納するメモリ（１５）と、 (iii)前記入力信号と前記ノイズ表現信号から、前記入
力信号の一部と前記概算されたノイズ部分との間のスペ
クトル的類似性の値を周期的に形成する手段（３−６、
１４）と、 (iv)会話が存在するか存在しないかを示す出力信号を作
成するため前記値をスレショルド値と比較する手段
（７）と、（v）補助的な音声動作特性検出器（２０）と、そして（vi）前記入力信号により前記メモリを更新するメモリ
更新手段とを有し、前記補助的な音声動作特性検出器は、会話が存在するか
又は存在しないかを示す前記出力信号から独立の制御信
号を生成するため、入力信号の最新の部分と入力信号の
以前の部分との間のスペクトル的類似性の値に対応して
動作し、そして前記制御信号は入力信号に会話が存在す
るか又は存在しないかを示し、そして前記メモリ更新手
段は前記制御信号が会話が存在しないことを示す場合の
み前記入力信号により前記メモリを更新するために動作
することを特徴とする音声動作特性検出装置。
【請求項３】さらに前記制御信号により会話が存在し
ないと示された期間の間に前記スレショルド値を調整す
る手段を含むことを特徴とする請求項２に記載の装置。
【請求項４】前記補助的な音声動作特性検出器はさら
に音声となった会話の存在を表示する信号を生成するピ
ッチアナライザ手段を含む音声となった会話を検出する
手段（２７）を含み、これに前記補助的な音声動作特性
検出器（２０）によって作成された前記制御信号がさら
に従うことを特徴とする請求項２または請求項３に記載
の装置。
【請求項５】請求項１乃至請求項４のいずれか１項に
記載の装置を含む会話信号をエンコードする装置。
【請求項６】請求項１乃至請求項５のいずれか１項に
記載の装置を含む自動車電話装置。
【請求項７】入力信号の会話動作特性を検出する方法
であって、前記入力信号を受信し、前記入力信号のノイズ信号部分を概算し、前記ノイズ信号部分を表現するデータを格納し、入力信号の一部と前記ノイズ信号部分との間のスペクト
ル的類似性の値Ｍを形成し、スレショルド値より高いか否かに従って会話が存在する
か存在しないかを示す第１の音声動作特性指示を作成す
るため、値Ｍから導かれるパラメータを第１のスレショ
ルド値Ｔと比較し、ここで前記概算するステップは補助的な音声動作特性指
示の作成を含み、そして、前記補助的な音声動作特性指示の作成は、入力信号の最新の成分と入力信号のより早期の成分との
間の類似性のスペクトル歪み値を形成し、その値を超えるか超えないかに対応して会話が存在する
か存在しないかを指示する前記補助的な音声動作特性指
示を作成するために前記スペクトル歪み値を第２のスレ
ショルド値と比較し、前記補助的な音声指示は前記第１
の音声動作特性指示から独立しており、前記補助的な音声動作特性指示が会話が存在しないと指
示する期間においてのみ入力信号により前記格納された
データを更新するステップを含むことを特徴とする方
法。