[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5006279B2 - 音声活性検出装置及び移動局並びに音声活性検出方法 - Google Patents

音声活性検出装置及び移動局並びに音声活性検出方法 Download PDF

Info

Publication number
JP5006279B2
JP5006279B2 JP2008184572A JP2008184572A JP5006279B2 JP 5006279 B2 JP5006279 B2 JP 5006279B2 JP 2008184572 A JP2008184572 A JP 2008184572A JP 2008184572 A JP2008184572 A JP 2008184572A JP 5006279 B2 JP5006279 B2 JP 5006279B2
Authority
JP
Japan
Prior art keywords
signal
noise
voice activity
sub
snr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008184572A
Other languages
English (en)
Other versions
JP2008293038A (ja
Inventor
ベヘタロ アンチ
ヘッキネン ユハ
パーヤネン エルッキ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2008293038A publication Critical patent/JP2008293038A/ja
Application granted granted Critical
Publication of JP5006279B2 publication Critical patent/JP5006279B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)

Description

本発明は入力信号中の音声活性を検出し、その検出結果に基づいて音声活性判定を行うための手段をそなえる音声活性検出装置に関する。本発明は、音声活性を検出する方法と、音声活性検出手段を含む通信装置とにも関する。
音声活性検出器(Voice Activity Detector (VAD))は、入力が音声又は暗騒音を含むか否か判定する。VADの典型的なアプリケーションは無線通信システムにあり、無線通信システムでは、音声が検出されないときには送信が禁止される不連続送信システムを制御するために音声活性検出方法を利用することができる。例えばエコー消去及び雑音消去のためにもVADを使用することができる。
音声活性検出のための種々の方法が従来公知である。主な問題は、騒々しい環境で暗騒音から音声を確実に検出することである。特許公報US5、459、814は、音声信号について平均信号レベルとゼロ点交差とを計算する音声活性検出方法を開示している。この手法は、計算に関しては単純な方法であるけれども、検出結果の信頼性が余り良くはないという問題点を有する。特許公報WO95/08170及びUS5、276、765は、音声信号と雑音推定値とのスペクトル差をLPC(Liner Prediction Coding (線形予測符号化))パラメータを用いて計算する音声活性検出方法を開示している。これらの公報は雑音推定値の更新を制御する補助VAD検出器を提示している。上記の全ての公報に示されるVAD方法は、音声のパワーが雑音のパワーと比べて小さいときに確実に音声を検出しなければならないという問題がある。
本発明は、入力音声信号を、特定の周波数帯域を表すサブ信号に分割し、該サブ信号において音声活性を検出する音声活性検出装置に関する。該サブ信号の検出に基づいて、副判定信号が生成され、入力音声信号についての音声活性判定が該副判定信号に基づいて形成される。本発明では、入力音声信号の各スペクトル成分と雑音推定値とが計算されて比較される。より具体的に言えば、信号対雑音比が各サブ信号について計算され、各信号対雑音比が副判定信号を表す。その信号対雑音比から、それらの合計に比例する値が計算されて閾値と比較され、入力音声信号についての音声活性判定信号がその比較に基づいて形成される。
各サブ信号について信号対雑音比を得るために、各サブ周波数帯域について(即ち各サブ信号について)雑音推定値が計算される。このことは、雑音をより精密に推定でき、その雑音推定値を各サブ周波数帯域について別々に更新することもできることを意味する。雑音推定値の精度が向上することによって音声活性検出の判定がより精密かつ信頼性のあるものとなる。音声活性検出装置の音声/雑音・判定を用いて暗騒音推定値の更新を制御することにより、雑音推定値の精度も向上する。
本発明の音声活性検出装置及び通信装置は、前記入力信号を特定の周波数帯域を表すサブ信号に分割するための手段と、該サブ信号中の雑音を推定するための手段と、該サブ信号中の雑音に基づいて副判定信号を計算するための手段と、該副判定信号に基づいて該入力信号について音声活性判定を行うための手段とを有することを特徴とする。
本発明の方法は、前記入力信号を特定の周波数帯域を表すサブ信号に分割し、該サブ信号中の雑音を推定し、該サブ信号中の雑音に基づいて副判定信号を計算し、該副判定信号に基づいて該入力信号について音声活性判定を行う各ステップを有することを特徴とする。
次に、添付図面を参照して本発明を詳しく説明する。
図1は、本発明の音声活性検出(Voice activity detection(VAD))装置4の使用状況を簡単に示す。以下の記述において提示されるパラメータの値は、例示の値であって本発明の1実施例を記載するものであり、それらの値は本発明の方法の機能を特定のパラメータの値のみに限定するものではない。図1を参照すると、マイクロホン1から到来する信号はA/D変換器2でサンプリングされる。例示的な値として、A/D変換器2のサンプリング速度は8000Hz、音声コーデック3のフレーム長は80サンプル、各音声フレームは10msの音声から成るものとする。該VAD装置4は音声コーデック3と同じ入力フレーム長を用いることができ、或いはその長さは音声コーデックが用いるフレーム長の均等商(even quotient)であることができる。符号化された音声信号は、更に送信部において例えば不連続送信ハンドラー5に供給され、これは、該VAD4から受け取った判定Vindに従って送信を制御する。
本発明の音声活性検出装置の1実施例が図2により詳しく示されている。マイクロホン1から来る音声信号はA/D変換器2でサンプリングされてデジタル信号 x(n) となる。図2のVAD装置への入力フレームは、デジタル信号 x(n) から各サンプルを取り出すことにより形成される。このフレームはブロック6に供給され、ここで所定の帯域のパワーを表すパワースペクトル成分が計算される。FFT、フィルター群を使って、又は線形予測係数を使って、入力フレームの振幅又はパワースペクトルに比例する各成分を計算することができる。このことについて後に詳しく説明する。該VADが線形予測係数を計算する音声コーデックと共に作動する場合には、それらの係数をその音声コーデックから受け取ることができる。
各パワースペクトル成分 P(f) は、始めに図3に示されているように高速フーリエ変換(FFT)を用いて入力フレームから計算される。実施例では、FFT計算の長さが128であることが仮定されている。また、パワースペクトル成分 P(f) は再結合されて計算スペクトル成分 S(s) とされ、スペクトル成分の数が65から8まで減少する。
図3を参照すると、音声フレームは窓掛けブロック10に入力され、ここで音声フレームに所定の窓が乗算される。窓掛けの目的は、一般に信号のスペクトル推定の質を高め、信号を時間領域の各フレームに分割することである。この実施例で使われる窓掛けでは、窓同士が部分的に重複するので、重複する各サンプルが次のフレームのためにメモリ(ブロック15)に記憶される。信号から80個のサンプルが取られ、それらのサンプルは、前のフレームの際に記憶された16個のサンプルと組み合わされて、合計で96個のサンプルとなる。また、最後に収集された80個のサンプルの中から、その中の最後の16個のサンプルが次のフレームを計算するときに使われるべく記憶される。
この様にして与えられた96個のサンプルに、窓掛けブロック10において96個のサンプル値から成る窓が乗算される。図7に示されているように、窓の始めの8個の値は窓の立ち上がり部 IU を形成し、終わりの8個の値は窓の立ち下がり部 ID を形成する。窓 I(n) を次のように定義することができ、そしてブロック11(図6)において実施される:
Figure 0005006279
窓掛け(ブロック11)をデジタル的に実施することはデジタル信号処理として当業者には従来から知られていることである。この窓掛けでは、中央の80個の値(n = 8,..,87 即ち中央の部分 IM )は1に等しいので、それらを乗算しても結果は変わらないから乗算を省略することができる。従って窓の始めの8個のサンプルと終わりの8個のサンプルとを乗算するだけでよい。FFTの長さは2の累乗でなければならないので、ブロック12(図6)においてブロック11から得られた96個のサンプルの終わりに32個の「0」が付加され、128個のサンプルから成る音声フレームとなる。サンプル列の終わりにサンプルを付加することは単純な操作であって、ブロック12をデジタル的に実現することは当業者の技術の範囲内のことである。
窓掛け用ブロック10で窓掛けが実行された後、ブロック20で高速フーリエ変換FFTを用いて音声フレームのスペクトルが計算される。FFTブロック20に到達したフレームの中のサンプル x(0), x(1),.., x(n); n = 127 (即ち前記の128個のサンプル)は実(real) FFT(高速フーリエ変換)により周波数領域へ変換されて周波数領域サンプル X(0), X(1),.., X(f); f = 64(より一般的には f=(n+1)/2)となり、その各サンプルは実数成分 Xr(f) と虚数成分 Xi(f) とから成る:
Figure 0005006279
高速フーリエ変換をデジタル的に実現することは当業者にとっては従来公知のことである。FFTから得られた実数成分及び虚数成分は平方ブロック(squaring block) 50において二乗されて対をなして加え合わされ、その出力は音声フレームのパワースペクトルである。FFTの長さが128であるならば、得られるパワースペクトル成分の数は65であり、これはFFT変換の長さを2で割り、その結果を1だけ大きくする(インクリメントする)ことにより得られる、即ち(FFTの長さ/2)+1である。従って、パワースペクトルは、実数成分及び虚数成分の2乗の和を成分毎に計算することにより平方ブロック50から得られる:
Figure 0005006279
平方ブロック50の機能は、図8に示されているように、実数成分及び虚数成分を平方ブロック(squaring blocks)51及び52(これらは、デジタル的に実行されるものとして従来公知の単純な数学的平方の計算を実行する)に入力し、その平方された各成分を総和ユニット(summing unit) 53で合計することにより実現されることができる。この様にして、平方ブロック50の出力として、パワースペクトル成分 P(0), P(1),.., P(f); f = 64が得られ、これらのパワースペクトル成分は、次に述べるように時間領域信号の種々の周波数での成分の各パワーに対応する(8kHzのサンプリング速度が使用されるものとする):
f = 0,...,64の値についての P(f) は中間周波数(f ・4000/64 Hz) に対応する。
(4)
この後、ブロック60で8個の新しいパワースペクトル成分、即ちパワースペクトル成分結合 S(s), s = 0,..,7 が形成され、それらは本明細書では計算スペクトル成分と呼ばれる。計算スペクトル成分 S(s) は、次のように常に各計算スペクトル成分 S(s) について隣り合う7個のパワースペクトル成分 P(f) の合計を計算することにより形成される:
Figure 0005006279
図9に示されているように、カウンタ61と総和ユニット62とを使って、カウンタ61に常に7まで数え上げさせ、カウンタに制御させて総和ユニット62に常に7個の連続する成分の合計を計算させて出力として総和(sum)を出させることにより、これを実現することができる。この場合、最低位の結合成分 S(0) は中間周波数 [62.5 Hz 〜 437.5 Hz]に対応し、最高位の結合成分 S(7) は中間周波数 [3125 Hz 〜 3500 Hz] に対応する。これより低い周波数(62.5 Hz より下)や、これより高い周波数(3500 Hz より上)は、音声については重要でなくて、無視することができる。
図3の手法を使う代わりに、図4に示されている様にフィルタ列を用いて入力フレームからパワースペクトル成分 P(f) を計算することもできる。このフィルタ列は、問題の周波数帯域をカバーする帯域フィルタ Hj (z), j = 0,...,7から成る。該フィルタ列は、均一な帯域幅フィルタであってもよいが、可変帯域幅フィルタからなっていてもよい。効率を改善するために、通常は該フィルタ列の出力は複数のうちから1個選択される(decimated)。フィルタ列のデザイン及びデジタル実施形態は当業者には従来公知の事項である。各帯域 jの副帯域(sub−band) サンプル zj (i) は、フィルタ Hj (z) を用いて入力信号 x(n) から計算される。各帯域の信号パワーを次のように計算することができる:
Figure 0005006279
ここで Lは1入力フレーム内の副帯域中のサンプルの個数である。
VADを音声コーデックと共に用いるときには、デジタル移動電話システムで使われる殆どの音声コーデックにより計算される線形予測係数(Linear Prediction Coefficients (LPC)) を使って計算スペクトル成分 S(s) を計算することができる。その様な構成が図5に示されている。LPC係数は線形予測(linear prediction)と呼ばれる手法により音声コーデック3で計算され、そこに線形フィルターが形成される。該フィルターのLPC係数は直接順序係数 d(i) (direct order coefficients)であり、これを自己相関係数(autocorrelation coefficients) ACF(k)から計算することができる。後述するように、直接順序係数 d(i) を使って計算スペクトル成分 S(s) を計算することができる。入力フレームサンプル x(n) から計算することのできる自己相関係数ACF(k)を使ってLPC係数を計算することができる。もしLPC係数又はACF(k)係数を音声コーデックから得ることができないならば、それらを入力フレームから計算することができる。
自己相関係数ACF(k)は音声コーデック3で次のように計算される:
Figure 0005006279
ここで、
N は入力フレーム中のサンプルの個数、
M はLPC次数(order)(例えば8)、
x(i)は入力フレーム中のサンプルである。
短周期分析フィルタ(short term analysis filter) のインパルス応答を表すLPC係数 d(i) を、例えばシュール巡回アルゴリズム(the Schur recursion algorithm)やレビンソン・ダービンのアルゴリズム(the Levinson-Durbin algorithm)などの従来公知の方法により自己相関係数ACF(k)から計算することができる。
図5に示されているブロック8において高速フーリエ変換(FFT)を使って下記の式に従ってLPCの値から所望の周波数での振幅が計算される:
Figure 0005006279
ここで、
K は定数、例えば8000、であり、
k はパワーが計算される周波数に対応し(即ち、A(k)は周波数 k/K・fsに対応し、ここで
fs はサンプル周波数である)、また、
M は短周期分析の次数(order)である。
所望の周波数帯域の振幅を次のようにして推定することができる:
Figure 0005006279
ここで、
k1は周波数帯域のスタート指標(start index)であり、k2は周波数帯域のエンド指標(end index)である。
各係数 C(k1,k2,i) を前もって計算しておき、それらをメモリ(図示せず)に記憶させておくことにより、必要な計算ロードを少なくすることができる。それらの係数を次のように計算することができる:
Figure 0005006279
振幅 A(k1,k2) の平方の逆数を取り、更に ACF(0) と掛け合わせることにより、計算スペクトル成分 S(s) での信号パワーの近似値を計算することができる。この逆数を取る計算が必要なのは、線形予測係数が入力信号の反転スペクトル(inverse spectrum)を表すからである。ACF(0)は、信号のパワーを表し、式7で計算される。
Figure 0005006279
ここで各計算スペクトル成分 S(s) は、帯域の両端(band limits)を定義する特定の定数 k1 及び k2 を用いて計算される。以上、パワー(計算)スペクトル成分 S(s) を計算する種々の方法を説明した。
更に図2において、音声活性検出装置が音声を検出しないときに推定ブロック80(図11により詳しく示されている)で雑音のスペクトル N(s), s = 0,..,7 が推定される。推定はブロック80においてブロック6から入力された信号の各スペクトル成分 S(s), s = 0,..,7 について時間平均された平均値を巡回的に計算することにより実行される:
Figure 0005006279
この文脈で、Nn-1(s)は図11に示されているようにメモリ83から得られる前のフレームについて計算された雑音スペクトル推定値を意味し、Nn (s) は上の式による現在のフレーム(n = フレーム順序番号)についての推定値を意味する。この計算はブロック81で好ましくはデジタル的に実行される。このブロックへの入力は、ブロック6からのスペクトル成分 S(s) と、メモリ83から得られる前のフレームについての推定値Nn-1(s)と、ブロック82で計算される時定数変数λ(s) の値とである。入力スペクトル成分が雑音推定値Nn-1(s)成分より低い S(s) であるときに、より速い時定数を使って更新を行うことができる。変数λ(s) の値は次の表(λ(s) の代表的な値)に従って決定される:
Figure 0005006279
値Vind 及びSTcount については後に詳しく説明する。
以下の記述においては記号 N(s) は、現在のフレームについて計算された雑音スペクトル推定用に用いられる。上記の推定による計算は好ましくはデジタル的に実行される。上記の式に従ってデジタル的に乗算、加算及び減算を行うことは当業者に周知されていることである。
更に図2において計算ブロック90で入力スペクトル S(s) 及び雑音スペクトル N(s) から比 SNR(s), s = 0,..,7 が成分毎に計算され、この比は信号対雑音比と呼ばれる:
Figure 0005006279
信号対雑音比 SNR(s) は、計算スペクトル成分の各周波数帯域についての一種の音声活性判定を表す。信号対雑音比 SNR(s) から、その周波数帯域信号が音声又は雑音を含むか否か判定することができ、従ってこれは音声活性(voice activity) を表す。計算ブロック90も好ましくはデジタル的に実現され、上記の割り算を実行する。割り算をデジタル的に実行する方法自体は当業者に従来から知られている。
Figure 0005006279
図2において相対雑音レベルが計算ブロック70で計算される。このブロックは図10に詳しく示されており、ここでパワースペクトル推定値 S(s), s = 0,..,7 を用いて音声についての時間平均された平均値(ロ)が計算される。音声が検出されたとき、時間平均された平均値(ロ)は更新される。始めに現在のフレームでのパワースペクトル成分の平均値(ハ)がブロック71で計算され、このブロック71に次のようにブロック60からスペクトル成分 S(s) が入力として与えられる:
Figure 0005006279
ブロック72で、時間平均された平均値(ロ)は、前のフレームの時に計算された時間平均された平均値が記憶されているメモリ78から得られる前のフレームについての時間平均された平均値(ニ)と、ブロック71から得られる計算スペクトル平均値(ハ)と、前もってメモリ79aに記憶されている時定数αとに基づいて(例えば巡回的に)計算されることにより得られる:
Figure 0005006279
ここで nはフレームの順序番号であり、αは前記の時定数であり、その値は 0.0〜 1.0であり、通常は 0.9〜 1.0である。時間平均された平均値に非常に弱い音声(例えば文の終わりで)を含ませないために、現在のフレームについての各スペクトル成分の平均値が時間平均された平均値に依存する閾値を上回る場合に限ってそれは更新される。この閾値は通常は時間平均された平均値の1/4である。前の2つの式の計算は好ましくはデジタル的に実行される。
同様に、雑音パワーの時間平均された平均値(ホ)は、雑音のパワースペクトル推定値 N(s), s = 0,..,7 及び次の式に従ってそれから計算される成分平均値(ヘ)を用いて計算ブロック73から得られる:
Figure 0005006279
ここでβは時定数であり、その値は 0.0〜 1.0であり、通常は 0.9と 1.0との間である。雑音パワーの時間平均された平均値は各フレームにおいて更新される。雑音スペクトル成分の平均値(へ)は、スペクトル成分 N(s) に基づいて、ブロック76で次のようにして計算される:
Figure 0005006279
そして前のフレームの時にメモリ74に記憶された前のフレームについての雑音パワーの時間平均された平均値(ト)がメモリ74から得られる。相対雑音レベルηは、雑音及び音声の時間平均された各平均値のスケーリングされ(scaled) 且つ最大値を限定された商(maximum limited quotient) としてブロック75で計算される:
Figure 0005006279
ここでκは前もってメモリ77に記憶されているスケーリング定数(scaling constant) であり(代表的な値は 4.0)、 max_ηはメモリ79bに記憶されている相対雑音レベルの最大値(代表的な値は 1.0)である。
図2の装置でVAD判定を生成するために、VAD判定ブロック110で信号対雑音比 SNR(s) を利用して入力信号と雑音モデルとの間の距離DSNR が計算され、それはデジタル計算により次の式を実現する:
Figure 0005006279
ここで s_l 及び s_h は、含まれている最低周波数成分及び最高周波数成分の指標値(index values) であり、υs は成分重み付け係数であり、これらは予め決められて前もってメモリに記憶され、そこからそれらは計算のために検索される。通常は、全ての信号対雑音推定値成分が使われ(s l = 0及び s_h= 7) であり、それらに等しい重みが付けられる:υs = 1.0/8.0; s = 0,.., 7 。
次に、図12を参照してVAD判定ブロック110の実施例を詳しく解説する。音声活性検出器における総和ユニット(summing unit) 111は、種々の周波数帯域から得られる信号対雑音比 SNR(s) の値を合計し、それにより、入力信号と雑音モデルとの間のスペクトル距離を表すパラメータDSNR が上記の式(19)に従って得られ、総和ユニット111からの値DSNR は比較ユニット112で所定の閾値 vthと比較される。閾値 vthの方が小さければ、そのフレームは音声を含むと見なされる。信号対雑音比が良好であると期待することのできる周波数に一層大きな重みが付けられるように、合計の計算(summing)に重み付けを行うこともできる。音声活性検出器の出力及び判定を変数Vind で表すことができ、その値について下記の条件が得られる:
Figure 0005006279
該VADは背景(background)スペクトル推定値 N(s) の更新を制御し、後者はそれに代わって上記したように音声活性検出器の機能に影響を及ぼすので、もし背景雑音(暗騒音)レベルが急に増大すると雑音及び音声の両方が音声と指摘される可能性がある(Vind = 1)。このことは、更に背景スペクトル推定値 N(s) の更新が禁止されることになる。それを防止するために、その間は連続するフレームが音声を含んでいないと見なされる時間(フレームの個数)が監視される。安定していて、有声と指摘されない連続するフレームは音声を含んでいないものとされる。
図2のブロック7で、ピッチ分析(pitch analysis)とも呼ばれる長周期予測(Long Term Prediction (LTP)) 分析が計算される。有声検出は長周期予測パラメータを用いて行われる。長周期予測パラメータは、遅れ(即ちピッチ周期)と長周期予測利得(long term predictor gain) とである。これらのパラメータは殆どの音声コーデック(符号器を含む)で計算される。よって音声コーデックの他に音声活性検出器を使用するならば(図5に記載されているように)、それらのパラメータを音声コーデックから得ることができる。
フレーム長 Nに等しいサンプルの量 Mから長周期予測分析を計算することができ、或いは入力フレーム長をサブフレームに分割し(例えば4サブフレーム、4 ・M = N )、長周期パラメータを各サブフレームから別々に計算することもできる。入力フレームのこれらのサブフレームへの分割はLTP分析ブロック7(図2)で行われる。該サブフレーム・サンプルは xs(i)で表される。
従って、ブロック7では始めに各サブフレーム・サンプル xs(i)から自己相関 R(l) が計算される:
Figure 0005006279
ここで
l = Lmin,..., Lmax (例えば Lmin = 40、Lmax = 160)
である。
上記の計算のために、旧サブフレームから最後の Lmax 個のサンプルを保存しておかなければならない。
次に該 R(l) からRmax = max(R(l))となるような最大値 Rmax を探す。ここで l = 40,..., 160である。
長周期予測(long term predictor)の遅れ LTP_lag(j)は、Rmaxに対応する指標(index) lである。変数 jはサブフレームの指標(index)を表す(j = 0...3 )。
LTP_gainを次のように計算することができる:
LTP_gain(j) = Rmax/Rtot
ここで
Figure 0005006279
サブフレームの長周期予測の遅れ利得(LTP_gain(j) )を合計することによってフレームの長周期予測の遅れ利得(LTP_gain_sum )を表すパラメータを計算することができる:
Figure 0005006279
もし LTP_gain_sum が一定の閾値 thr_lag より大きければ、そのフレームは有声であるとされる:
Figure 0005006279
更に図2においてブロック100で次のように平均雑音スペクトル推定値 NA(s)が計算される:
Figure 0005006279
ここで aは 0 < a < 1の値(例えば 0.9)の時定数である。
平均雑音スペクトル推定値 NA(s)とスペクトル推定値 S(s) との間のスペクトル距離 Dもブロック100で次のように計算される:
Figure 0005006279
Low_Limit は小さな定数で、いくつかの周波数帯域での雑音スペクトル又は信号スペクトルが低いときに割り算の結果を小さく保つために使われる。
もしスペクトル距離 Dが所定の閾値 Dlim より大きければ、定常度カウンタ stat_cnt は 0にセットされる。もしスペクトル距離 Dが閾値 Dlim より小さくて、信号が有声とは検出されなければ(voiced = 0)、定常度カウンタの値が増やされる(インクリメントされる)。定常度カウンタについて下記の条件が受け入れられる:
Figure 0005006279
ブロック100は出力stat_cnt を与え、これは次の条件に合致するようにVind の値が 0になると、 0にリセットされる:
Figure 0005006279
もしこの連続するフレームの個数が所定の閾値 max_spf (その値は例えば50である)より大きければ、STcount の値は1にセットされる。これによりカウンタ値stat_cnt との関連で出力STcount に関して下記の条件が与えられる:
Figure 0005006279
また、本発明では、背景スペクトル推定値 N(s) の精度は、相対雑音レベルη(これはブロック70で計算される)を利用して音声活性検出器の前記閾値 vthを調整することにより改善される。信号対雑音比が非常に良好である(或いは相対雑音レベルηが低い)ような環境では、相対雑音レベルηに基づいて閾値 vthの値が大きくされる。これにより、背景雑音(暗騒音)の急激な変化を音声と解釈することが少なくなる。閾値 vthの適応化は下記の式に従ってブロック113で実行される:
Figure 0005006279
ここで vth_fix1、 vth_min1、及び vth_slope1は正の定数であり、それらの代表的な値は例えば次の通りである: vth_fix1 = 2.5;vth_min1 = 2.0;vth_slope1 = 8.0。
Figure 0005006279
雑音レベルの高い環境では、音声を雑音として検出する確率を低くするために閾値が低くされる。そのとき、閾値 vth を低くするために次のように雑音スペクトル成分の平均値(チ)が使われる:
Figure 0005006279
ここで vth_fix2及び vth_slope2は正の定数である。よって、もし雑音スペクトル成分の平均値(チ)が充分に大きければ、閾値 vth2 は閾値 vth1 より小さい。
音声バースト時に閾値 vth2 が更に小さくされるようにして本発明の音声活性検出器を改善することもできる。これにより、音声がゆっくりと静かになってゆくときに音声の終わりが雑音と解される可能性が無くなるので、動作が改善する。この付加的な閾値適応化を下記のようにように(ブロック113で)実施することができる。
始めに、次の条件に従ってDSNR を所望の最大値(代表的には5)及び最小値(代表的には2)の間に限定する:
Figure 0005006279
その後、閾値適応化係数 ta0を次のように計算する:
Figure 0005006279
ここでthmin 及びthmax はそれぞれ最小スケーラ値(the minimum scaler value) (代表的には 0.5)及び最大スケーラ値(the maximum scaler value)(代表的には1)である。
フレーム nについての実際のスケーラ ta(n)は、値を増減するために種々の時定数を有するフィルターで ta0を平滑化することにより計算される。この平滑化を下記の式に従って実行することができる:
Figure 0005006279
ここで、λ0 及びλ1 はアタック時定数(増加期間(increase period);代表的な値は 0.9)及びリリース時定数(減少期間(decrease period);代表的な値は 0.5)である。最後に、スケーラ ta(n)を用いて、新しいVAD閾値 vthを得るために閾値 vthをスケーリングすることができ、これにより次のようになる:
Figure 0005006279
音声活性検出器においてしばしば起こる問題は、音声のちょうど始まりの時には音声が直ぐには検出されず、また音声の終わりも正しく検出されないということである。そのために暗騒音推定値 N(s) が誤った値となり、そのために音声活性検出器の後の結果に影響が及ぶことになる。遅延を用いて暗騒音推定値を更新することにより、この問題を無くすることができる。この場合、暗騒音推定値 N(s) を更新する前に最後のフレームの或る数 N(例えば N = 2)のパワースペクトル(ここでは計算スペクトル)S1(s),..., SN (s) が記憶される(例えば、図11には示されていない、ブロック80の入力に設けられるバッファに)。もし最後の2倍の量のフレームの間に(即ち 2・N 個のフレームの間に)音声活性検出器が音声を検出していなければ暗騒音推定値 N(s) はメモリの中の最も古いパワースペクトル S1(s)で更新され、その他の場合には更新は行われない。これにより、更新時に使用されるフレームの前後の N個のフレームが雑音であったことが保証される。
本発明の方法及び音声活性検出装置は移動局や移動通信システム(例えば基地局の)などの通信装置に用いるのに特に適しており、この方法及び装置は特定のアーキテクチャ(TDMA、CDMA、デジタル/アナログ)に限定されない。図13は本発明の移動局を示しており、これに本発明の音声活性検出方法が採用されている。マイクロホン1から出る送信されるべき音声信号はA/D変換器2でサンプリングされ、音声コーデック3で音声符号化され、その後に基本周波数信号処理(例えばチャネル符号化、インタリーブなど)、混合及び無線周波数への変調及び送信がブロックTXで行われる。音声活性検出器4(VAD)を使って、該VADの出力Vind に従ってブロックTXを制御することにより不連続送信を制御することができる。移動局がエコー及び/又は雑音消去装置(キャンセラ)ENCを含んでいるならば、本発明のVAD4をブロックENCを制御するためにも使うことができる。ブロックTXから信号は複式フィルターDPLX及びアンテナANTを通して送信される。受信された音声に対して受信部RXの公知の動作が受信時に行われて、その音声はスピーカー9を通して再生される。VAD4を使って受信部RXの如何なる動作も、例えばエコー消去と関連して、制御することができる。
本発明の方法及び装置の実施例を本明細書に開示した。本発明は、ここに開示した実施例の細目に限定されるものではなく、本発明の範囲から逸脱せずに他の形で本発明を実施し得ることは当業者には明かである。ここに開示した実施例は単なる例に過ぎず、発明を限定するものではないと解されるべきである。従って本発明を実施し使用する可能性は特許請求の範囲の請求項のみにより限定される。各請求項により定義される発明を実施するための、均等実施態様を含む種々の選択肢が本発明の範囲に含まれる。
本発明の音声活性検出装置(VAD)の使用状況を示すブロック図である。 本発明のVADの実施態様を示すブロック図である。 図2のパワースペクトル計算ブロックの実施態様を示す図である。 パワースペクトル計算ブロックの別の実施態様を示す図である。 本発明の装置の別の実施例のブロック図である。 窓掛けブロックの実施態様を示すブロック図である。 本発明による窓掛けの際の連続する音声信号フレームを示す図である。 平方ブロックの実施態様を示す図である。 スペクトル再結合ブロックの実施態様を示す図である。 相対雑音レベルを計算するためのブロックの実施態様を示す図である。 暗騒音モデルを計算するための構成を示す図である。 VAD判定ブロックの実施態様を示すブロック図である。 本発明の移動局を示す図である。
符号の説明
3 音声コーデック
4 音声活性検出装置(VAD)
50 平方ブロック
70 計算ブロック
80 推定ブロック
90 計算ブロック
110 VAD判定ブロック

Claims (7)

  1. 入力信号(x(n))中の音声活性を検出するための手段と、
    その検出に基づいて音声活性判定(Vind )を行うための手段とを有する音声活性検出装置において、
    前記入力信号(x(n))を特定の周波数帯域を表すサブ信号(S(s))に分割するための手段(6)と、
    該サブ信号中の雑音(N(s))を推定するための手段(80)と、
    前記の推定された雑音(N(s))の平均レベル(イ)を計算するための手段(70)と、
    該サブ信号中の雑音に基づいて各サブ信号についての信号対雑音比(SNR)を計算し、前記信号対雑音比を副判定信号(SNR(s))として供給するための手段(90)と、
    該副判定信号に基づいて該入力信号について音声活性判定(Vind )を行うための手段(110)とをそなえ、
    ここに前記の入力信号について音声活性判定(Vind )を行うための手段(110)は、
    異なる周波数帯域から得られた前記の信号対雑音比(SNR(s))の線形和を求めることによって値(DSNR )を生成するための手段(111)と、
    前記の値(DSNR ) を閾値(vth)と比較し、前記の比較に基づいて音声活性判定信号(Vind )を出力するための手段(112)とを有し、ここに前記閾値(vth)は前記の推定された雑音の平均レベル(イ)により調整され、前記の推定された雑音は、前記の入力信号の定常度によって更新されることを特徴とし、
    長周期予測分析を計算し、長周期予測利得(LTP_gain_sum)を含む長周期予測パラメータを生成するための手段(7)と、
    前記長周期予測利得を閾値(thr_lag)と比較するための手段(7)と、
    前記比較に基づいて有声検出判定を生成するための手段(7)とを有し、前記手段(7)において生成された有声検出判定が前記手段(80)において推定される雑音推定値の更新を制御する、音声活性検出装置。
    Figure 0005006279
  2. 入力信号に含まれている音声成分の平均レベル(ロ)を決定するための手段(70)と、雑音成分及び音声成分の平均レベル(ハ)に基づいて前記閾値(vth)を調整するための手段(113)とを有する、請求項1に記載の音声活性検出装置。
    Figure 0005006279
  3. 過去の信号対雑音比(SNR(s))に基づいて前記閾値(vth)を調整するための手段(113)を有する、請求項1に記載の音声活性検出装置。
  4. 前記音声活性検出装置は、推定された雑音の値(N(s))を記憶するための手段(80)を有し、前記雑音(N(s))は過去のサブ信号(S(s))で更新される、請求項1に記載の音声活性検出装置。
  5. 入力信号(x(n))に基づいて線形予測係数を計算するための手段(3)と、前記線形予測係数に基づいて前記サブ信号(S(s))を計算するための手段(8)とを有する、請求項1に記載の音声活性検出装置。
  6. 音声メッセージ(x(n))中の音声活性を検出するための手段と、
    その検出に基づいて音声活性判定(Vind )を行うための手段とを有する、音声メッセージを送受信するための移動局において、
    前記音声メッセージ(x(n))を特定の周波数帯域を表すサブ信号(S(s))に分割するための手段(6)と、
    該サブ信号中の雑音(N(s))を推定するための手段(80)と、
    前記の推定された雑音(N(s))の平均レベル(ニ)を計算するための手段(70)と、
    該サブ信号中の雑音に基づいて各サブ信号についての信号対雑音比(SNR)を計算し、前記信号対雑音比を副判定信号(SNR(s))として供給するための手段(90)と、
    該副判定信号に基づいて該入力信号について音声活性判定(Vind )を行うための手段(110)とをそなえ、
    ここに前記の入力信号について音声活性判定(Vind )を行うための手段(110)は、
    異なる周波数帯域から得られた前記の信号対雑音比(SNR(s))の線形和を求めることによって値(DSNR )を生成するための手段(111)と、
    前記の値(DSNR ) を閾値(vth)と比較し、前記の比較に基づいて音声活性判定信号(Vind )を出力するための手段(112)とを有し、ここに前記閾値(vth)は前記の推定された雑音の平均レベル(ニ)により調整され、前記の推定された雑音は、前記の入力信号の定常度によって更新されることを特徴とし、
    長周期予測分析を計算し、長周期予測利得(LTP_gain_sum)を含む長周期予測パラメータを生成するための手段(7)と、
    前記長周期予測利得を閾値(thr_lag)と比較するための手段(7)と、
    前記比較に基づいて有声検出判定を生成するための手段(7)とを有し、前記手段(7)において生成された有声検出判定が前記手段(80)において推定される雑音推定値の更新を制御する、移動局。
    Figure 0005006279
  7. 入力信号(x(n))を受信し、
    該入力信号中の音声活性を検出し、
    その検出に基づいて音声活性判定(Vind )を行う各ステップを有する、通信装置における音声活性を検出する方法において、
    前記入力信号を特定の周波数帯域を表すサブ信号(S(s))に分割し(6)、
    該サブ信号中の雑音(N(s))を推定し(80)、
    前記の推定された雑音(N(s))の平均レベル(ホ)を計算し(70)、
    該サブ信号中の雑音に基づいて各サブ信号についての信号対雑音比(SNR)を計算して、前記信号対雑音比を副判定信号(SNR(s))として供給し(90)、
    該副判定信号に基づいて該入力信号についての音声活性判定(Vind )を行う(110)各ステップをそなえ、
    ここに前記の入力信号について音声活性判定を行うステップは、
    異なる周波数帯域から得られた前記の信号対雑音比(SNR(s))の線形和を求めることによって値(DSNR)を生成する(111)ステップと、
    前記の値(DSNR)を閾値(vth)と比較し、前記の比較に基づいて音声活性判定信号(Vind )を出力する(112)ステップとを有し、ここに前記閾値(vth)は前記の推定された雑音の平均レベル(ホ)により調整され、前記の推定された雑音は、前記の入力信号の定常度によって更新されることを特徴とし、
    長周期予測分析を計算し、長周期予測利得(LTP_gain_sum)を含む長周期予測パラメータを生成するステップ(7)と、
    前記長周期予測利得を閾値(thr_lag)と比較するステップ(7)と、
    前記比較に基づいて有声検出判定を生成するステップ(7)とを有し、前記ステップ(7)において生成された有声検出判定が前記ステップ(80)において推定される雑音推定値の更新を制御する、方法。
    Figure 0005006279
JP2008184572A 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法 Expired - Lifetime JP5006279B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI955947A FI100840B (fi) 1995-12-12 1995-12-12 Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
FI955947 1995-12-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007051941A Division JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法

Publications (2)

Publication Number Publication Date
JP2008293038A JP2008293038A (ja) 2008-12-04
JP5006279B2 true JP5006279B2 (ja) 2012-08-22

Family

ID=8544524

Family Applications (4)

Application Number Title Priority Date Filing Date
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法

Country Status (7)

Country Link
US (2) US5963901A (ja)
EP (2) EP0790599B1 (ja)
JP (4) JP4163267B2 (ja)
AU (2) AU1067797A (ja)
DE (2) DE69630580T2 (ja)
FI (1) FI100840B (ja)
WO (2) WO1997022117A1 (ja)

Families Citing this family (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998001847A1 (en) * 1996-07-03 1998-01-15 British Telecommunications Public Limited Company Voice activity detector
US6744882B1 (en) * 1996-07-23 2004-06-01 Qualcomm Inc. Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
US6510408B1 (en) * 1997-07-01 2003-01-21 Patran Aps Method of noise reduction in speech signals and an apparatus for performing the method
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
CA2722196C (en) 1997-12-24 2014-10-21 Mitsubishi Denki Kabushiki Kaisha A method for speech coding, method for speech decoding and their apparatuses
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
FI116505B (fi) 1998-03-23 2005-11-30 Nokia Corp Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6067646A (en) * 1998-04-17 2000-05-23 Ameritech Corporation Method and system for adaptive interleaving
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
JPH11344999A (ja) * 1998-06-03 1999-12-14 Nec Corp ノイズキャンセラ
JP2000047696A (ja) * 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US6272460B1 (en) * 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US6188981B1 (en) 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
FI114833B (fi) * 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
FI118359B (fi) 1999-01-18 2007-10-15 Nokia Corp Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin
US6604071B1 (en) 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6349278B1 (en) 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
SE514875C2 (sv) 1999-09-07 2001-05-07 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
FI19992453A (fi) 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
JP4510977B2 (ja) * 2000-02-10 2010-07-28 三菱電機株式会社 音声符号化方法および音声復号化方法とその装置
US6885694B1 (en) 2000-02-29 2005-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Correction of received signal and interference estimates
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
DE10026872A1 (de) * 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7457750B2 (en) * 2000-10-13 2008-11-25 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
FI110564B (fi) * 2001-03-29 2003-02-14 Nokia Corp Järjestelmä automaattisen kohinanvaimennuksen (ANC) kytkemiseksi päälle ja poiskytkemiseksi matkapuhelimessa
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US20020147585A1 (en) * 2001-04-06 2002-10-10 Poulsen Steven P. Voice activity detection
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
US6978010B1 (en) * 2002-03-21 2005-12-20 Bellsouth Intellectual Property Corp. Ambient noise cancellation for voice communication device
JP3946074B2 (ja) * 2002-04-05 2007-07-18 日本電信電話株式会社 音声処理装置
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
KR100506224B1 (ko) * 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20040234067A1 (en) * 2003-05-19 2004-11-25 Acoustic Technologies, Inc. Distributed VAD control system for telephone
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置
US6873279B2 (en) * 2003-06-18 2005-03-29 Mindspeed Technologies, Inc. Adaptive decision slicer
GB0317158D0 (en) * 2003-07-23 2003-08-27 Mitel Networks Corp A method to reduce acoustic coupling in audio conferencing systems
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
KR101058003B1 (ko) * 2004-02-11 2011-08-19 삼성전자주식회사 소음 적응형 이동통신 단말장치 및 이 장치를 이용한통화음 합성방법
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
FR2875633A1 (fr) * 2004-09-17 2006-03-24 France Telecom Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
CN1763844B (zh) * 2004-10-18 2010-05-05 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别系统
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
CN100593197C (zh) * 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
FR2882458A1 (fr) * 2005-02-18 2006-08-25 France Telecom Procede de mesure de la gene due au bruit dans un signal audio
WO2006104555A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
JP4395772B2 (ja) * 2005-06-17 2010-01-13 日本電気株式会社 ノイズ除去方法及び装置
WO2007017993A1 (ja) 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8204754B2 (en) * 2006-02-10 2012-06-19 Telefonaktiebolaget L M Ericsson (Publ) System and method for an improved voice detector
US8032370B2 (en) 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US7680657B2 (en) * 2006-08-15 2010-03-16 Microsoft Corporation Auto segmentation based partitioning and clustering approach to robust endpointing
JP4890195B2 (ja) * 2006-10-24 2012-03-07 日本電信電話株式会社 ディジタル信号分波装置及びディジタル信号合波装置
WO2008074350A1 (en) * 2006-12-20 2008-06-26 Phonak Ag Wireless communication system
US8069039B2 (en) * 2006-12-25 2011-11-29 Yamaha Corporation Sound signal processing apparatus and program
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
JP4840149B2 (ja) * 2007-01-12 2011-12-21 ヤマハ株式会社 発音期間を特定する音信号処理装置およびプログラム
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
JP5229216B2 (ja) * 2007-02-28 2013-07-03 日本電気株式会社 音声認識装置、音声認識方法及び音声認識プログラム
KR101009854B1 (ko) * 2007-03-22 2011-01-19 고려대학교 산학협력단 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
WO2008137870A1 (en) * 2007-05-04 2008-11-13 Personics Holdings Inc. Method and device for acoustic management control of multiple microphones
US9191740B2 (en) * 2007-05-04 2015-11-17 Personics Holdings, Llc Method and apparatus for in-ear canal sound suppression
US8526645B2 (en) 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8374851B2 (en) * 2007-07-30 2013-02-12 Texas Instruments Incorporated Voice activity detector and method
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
KR101437830B1 (ko) * 2007-11-13 2014-11-03 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8180634B2 (en) 2008-02-21 2012-05-15 QNX Software Systems, Limited System that detects and identifies periodic interference
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
WO2009145192A1 (ja) * 2008-05-28 2009-12-03 日本電気株式会社 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
JP5103364B2 (ja) 2008-11-17 2012-12-19 日東電工株式会社 熱伝導性シートの製造方法
JP2010122617A (ja) 2008-11-21 2010-06-03 Yamaha Corp ノイズゲート、及び収音装置
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
GB2473266A (en) * 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
CN104485118A (zh) 2009-10-19 2015-04-01 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
CA2778342C (en) * 2009-10-19 2017-08-22 Martin Sehlstedt Method and background estimator for voice activity detection
GB0919672D0 (en) 2009-11-10 2009-12-23 Skype Ltd Noise suppression
WO2011077924A1 (ja) * 2009-12-24 2011-06-30 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5424936B2 (ja) * 2010-02-24 2014-02-26 パナソニック株式会社 通信端末及び通信方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5870476B2 (ja) * 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
EP3726530B1 (en) 2010-12-24 2024-05-22 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
ES2665944T3 (es) 2010-12-24 2018-04-30 Huawei Technologies Co., Ltd. Aparato para realizar una detección de actividad de voz
EP2686846A4 (en) * 2011-03-18 2015-04-22 Nokia Corp DEVICE FOR AUDIO SIGNAL PROCESSING
US20120265526A1 (en) * 2011-04-13 2012-10-18 Continental Automotive Systems, Inc. Apparatus and method for voice activity detection
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US9280984B2 (en) * 2012-05-14 2016-03-08 Htc Corporation Noise cancellation method
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN103730110B (zh) * 2012-10-10 2017-03-01 北京百度网讯科技有限公司 一种检测语音端点的方法和装置
CN103903634B (zh) * 2012-12-25 2018-09-04 中兴通讯股份有限公司 激活音检测及用于激活音检测的方法和装置
US9210507B2 (en) * 2013-01-29 2015-12-08 2236008 Ontartio Inc. Microphone hiss mitigation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
US9978394B1 (en) * 2014-03-11 2018-05-22 QoSound, Inc. Noise suppressor
CN107086043B (zh) * 2014-03-12 2020-09-08 华为技术有限公司 检测音频信号的方法和装置
ES2664348T3 (es) 2014-07-29 2018-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Estimación de ruido de fondo en señales de audio
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9450788B1 (en) 2015-05-07 2016-09-20 Macom Technology Solutions Holdings, Inc. Equalizer for high speed serial data links and method of initialization
JP6447357B2 (ja) * 2015-05-18 2019-01-09 株式会社Jvcケンウッド オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US9691413B2 (en) * 2015-10-06 2017-06-27 Microsoft Technology Licensing, Llc Identifying sound from a source of interest based on multiple audio feeds
CN109076294B (zh) 2016-03-17 2021-10-29 索诺瓦公司 多讲话者声学网络中的助听系统
WO2018152034A1 (en) * 2017-02-14 2018-08-23 Knowles Electronics, Llc Voice activity detector and methods therefor
US10224053B2 (en) * 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
US10339962B2 (en) * 2017-04-11 2019-07-02 Texas Instruments Incorporated Methods and apparatus for low cost voice activity detector
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
US10911052B2 (en) 2018-05-23 2021-02-02 Macom Technology Solutions Holdings, Inc. Multi-level signal clock and data recovery
CN109273021B (zh) * 2018-08-09 2021-11-30 厦门亿联网络技术股份有限公司 一种基于rnn的实时会议降噪方法及装置
US11005573B2 (en) 2018-11-20 2021-05-11 Macom Technology Solutions Holdings, Inc. Optic signal receiver with dynamic control
TW202143665A (zh) 2020-01-10 2021-11-16 美商Macom技術方案控股公司 最佳等化分割
US11575437B2 (en) 2020-01-10 2023-02-07 Macom Technology Solutions Holdings, Inc. Optimal equalization partitioning
CN111508514A (zh) * 2020-04-10 2020-08-07 江苏科技大学 基于补偿相位谱的单通道语音增强算法
US12013423B2 (en) 2020-09-30 2024-06-18 Macom Technology Solutions Holdings, Inc. TIA bandwidth testing system and method
US11658630B2 (en) 2020-12-04 2023-05-23 Macom Technology Solutions Holdings, Inc. Single servo loop controlling an automatic gain control and current sourcing mechanism
US11616529B2 (en) 2021-02-12 2023-03-28 Macom Technology Solutions Holdings, Inc. Adaptive cable equalizer
CN113707167A (zh) * 2021-08-31 2021-11-26 北京地平线信息技术有限公司 残留回声抑制模型的训练方法和训练装置

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4071826A (en) * 1961-04-27 1978-01-31 The United States Of America As Represented By The Secretary Of The Navy Clipped speech channel coded communication system
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
DE3230391A1 (de) * 1982-08-14 1984-02-16 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur signalverbesserung von gestoerten sprachsignalen
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
JPS6023899A (ja) * 1983-07-19 1985-02-06 株式会社リコー 音声認識装置における音声切り出し方式
JPS61177499A (ja) * 1985-02-01 1986-08-09 株式会社リコー 音声区間検出方式
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8801014D0 (en) 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5276765A (en) 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
US5285165A (en) * 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
FI80173C (fi) 1988-05-26 1990-04-10 Nokia Mobile Phones Ltd Foerfarande foer daempning av stoerningar.
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JP2701431B2 (ja) * 1989-03-06 1998-01-21 株式会社デンソー 音声認識装置
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
JPH02296297A (ja) * 1989-05-10 1990-12-06 Nec Corp 音声認識装置
EP0763813B1 (en) * 1990-05-28 2001-07-11 Matsushita Electric Industrial Co., Ltd. Speech signal processing apparatus for detecting a speech signal from a noisy speech signal
JP2658649B2 (ja) * 1991-07-24 1997-09-30 日本電気株式会社 車載用音声ダイヤラ
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
JP3176474B2 (ja) * 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
DE69331719T2 (de) * 1992-06-19 2002-10-24 Agfa-Gevaert, Mortsel Verfahren und Vorrichtung zur Geräuschunterdrückung
JPH0635498A (ja) * 1992-07-16 1994-02-10 Clarion Co Ltd 音声認識装置及び方法
FI100154B (fi) * 1992-09-17 1997-09-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä kohinan vaimentamiseksi
EP0683916B1 (en) * 1993-02-12 1999-08-11 BRITISH TELECOMMUNICATIONS public limited company Noise reduction
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
US5459814A (en) 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5446757A (en) * 1993-06-14 1995-08-29 Chang; Chen-Yi Code-division-multiple-access-system based on M-ary pulse-position modulated direct-sequence
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp., Peabody Verringerung des hintergrundrauschens zur sprachverbesserung
US5406622A (en) * 1993-09-02 1995-04-11 At&T Corp. Outbound noise cancellation for telephonic handset
IN184794B (ja) 1993-09-14 2000-09-30 British Telecomm
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
JPH08506434A (ja) * 1993-11-30 1996-07-09 エイ・ティ・アンド・ティ・コーポレーション 通信システムにおける伝送ノイズ低減
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
KR100316116B1 (ko) * 1993-12-06 2002-02-28 요트.게.아. 롤페즈 잡음감소시스템및장치와,이동무선국
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5550893A (en) * 1995-01-31 1996-08-27 Nokia Mobile Phones Limited Speech compensation in dual-mode telephone
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech

Also Published As

Publication number Publication date
DE69630580T2 (de) 2004-09-16
US5839101A (en) 1998-11-17
JP4163267B2 (ja) 2008-10-08
JP2007179073A (ja) 2007-07-12
JPH09212195A (ja) 1997-08-15
EP0784311B1 (en) 2001-09-05
DE69614989T2 (de) 2002-04-11
AU1067797A (en) 1997-07-03
WO1997022116A2 (en) 1997-06-19
EP0790599B1 (en) 2003-11-05
WO1997022117A1 (en) 1997-06-19
US5963901A (en) 1999-10-05
AU1067897A (en) 1997-07-03
FI955947A0 (fi) 1995-12-12
WO1997022116A3 (en) 1997-07-31
JP2008293038A (ja) 2008-12-04
EP0790599A1 (en) 1997-08-20
EP0784311A1 (en) 1997-07-16
JPH09204196A (ja) 1997-08-05
FI955947A (fi) 1997-06-13
FI100840B (fi) 1998-02-27
DE69614989D1 (de) 2001-10-11
DE69630580D1 (de) 2003-12-11

Similar Documents

Publication Publication Date Title
JP5006279B2 (ja) 音声活性検出装置及び移動局並びに音声活性検出方法
KR100546468B1 (ko) 잡음 억제 시스템 및 방법
US9646621B2 (en) Voice detector and a method for suppressing sub-bands in a voice detector
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
JP3224132B2 (ja) 音声活動検出装置
US8135587B2 (en) Estimating the noise components of a signal during periods of speech activity
EP1086453B1 (en) Noise suppression using external voice activity detection
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
JP4423300B2 (ja) 雑音抑圧装置
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
US20110066429A1 (en) Voice activity detector and a method of operation
EP0848374A2 (en) A method and a device for speech encoding
EP1229520A2 (en) Silence insertion descriptor (sid) frame detection with human auditory perception compensation
US20010001853A1 (en) Low frequency spectral enhancement system and method
US5430826A (en) Voice-activated switch
US8144862B2 (en) Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation
US8165872B2 (en) Method and system for improving speech quality
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term