JP2008005094A - Echo suppressing method and device, echo suppressing program, and recording medium - Google Patents
Echo suppressing method and device, echo suppressing program, and recording medium Download PDFInfo
- Publication number
- JP2008005094A JP2008005094A JP2006171045A JP2006171045A JP2008005094A JP 2008005094 A JP2008005094 A JP 2008005094A JP 2006171045 A JP2006171045 A JP 2006171045A JP 2006171045 A JP2006171045 A JP 2006171045A JP 2008005094 A JP2008005094 A JP 2008005094A
- Authority
- JP
- Japan
- Prior art keywords
- level
- gain
- echo
- value
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
Description
本発明はテレビ会議や音声会議などハンズフリー通信のエコー抑圧方法および装置に関する。 The present invention relates to an echo suppression method and apparatus for hands-free communication such as a video conference and an audio conference.
従来技術のエコー抑圧装置について説明する。
図8は特許文献1で開示された従来技術のエコー抑圧装置800の構成図である。従来技術のエコー抑圧装置800は、ゲイン乗算部801と、音響結合量推定部802と、送話判定部803と、受話判定部804と、ゲイン制御部805により構成される。
本エコー抑圧装置800は、スピーカとマイクロホンを用いた拡声通話においてマイク受音信号に混入するスピーカ音であるエコーを抑圧する。入力信号は、通話相手からの受信信号である受話信号と、自地点のマイクロホンで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。本装置は、マイク受音信号にエコーが主に含まれる場合は1よりも小さいゲインをマイク受音信号に乗算し、送話信号とすることで、マイク受音信号に含まれるエコーを抑圧する。
以下に、本装置の詳細について述べる。
音響結合量推定部802は、スピーカとマイクロホン間の伝達特性の振幅値である音響結合量A(t)を求める。ここではtは離散化された時刻を表す。スピーカ出力信号とマイク受音信号の時間平均レベルを観測し、その比をとって、音響結合量を求める。スピーカ出力信号をX(t)、マイク受音信号をY(t)とした場合、音響結合量A(t)は式(1)により求められる。
A(t)=E{|Y(t)|/|X(t)|} 式(1)
ただし、E{・}は平均時間をとること、|・|は絶対値を取ることを表す。
A conventional echo suppressor will be described.
FIG. 8 is a configuration diagram of a conventional echo suppression apparatus 800 disclosed in
The echo suppression apparatus 800 suppresses an echo which is a speaker sound mixed in a microphone reception signal in a loudspeaking call using a speaker and a microphone. The input signal is a reception signal that is a reception signal from the other party, and a microphone reception signal that is received by a microphone at the local location, and the output signal is a speaker output that is a signal output from the local speaker. A signal and a transmission signal which is a transmission signal to the other party. This apparatus suppresses the echo contained in the microphone sound reception signal by multiplying the microphone sound reception signal by a gain smaller than 1 when the microphone sound reception signal mainly includes an echo to obtain a transmission signal. .
Details of this apparatus will be described below.
The acoustic coupling
A (t) = E {| Y (t) | / | X (t) |} Equation (1)
However, E {·} represents an average time, and | · | represents an absolute value.
送話判定部803は、受話信号X(t)と音響結合量A(t)とマイク受音信号Y(t)より、送話の判定をする。マイク受音信号Y(t)の時間平滑レベルを観測し、その時間平滑レベルがあらかじめ与えられた固定閾値を越え、さらに、音響結合量A(t)に受話信号X(t)の時間平滑レベルを乗じた推定音響エコーレベルを定数倍した閾値を越えた場合に送話と判定する。
受話判定部804は、受話信号から、受話の判定をする。受話信号X(t)の時間平滑レベルを観測し、そのレベルがあらかじめ与えた固定閾値を越えた場合に受話と判定する。
The
The
ゲイン制御部805は、送話判定部803と受話判定部804の判定結果より、ゲイン値を制御する。受話が検出され、送話が検出されない場合は、マイク受音信号にエコーのみが含まれるので、あらかじめ設定したエコー抑圧ゲインをゲイン値とし、これ以外の場合には、ゲイン値を1とする。また、ゲイン値の不連続な変化による音声の劣化を防ぐため、ゲイン値が滑らかに変化するように、時間平滑化が行われる。
ゲイン乗算部801は、ゲイン制御部805で設定されたゲイン値を、マイク受音信号に乗じ、送話信号とする。
以上の処理により、マイク受音信号にエコーのみが含まれる期間のみ、1未満のゲイン値がマイク受音信号に乗じられ、エコーが抑圧された送話信号となる。マイク受音信号にエコーが含まれないか、近端話者の音声が含まれる場合は、マイク受音信号がそのまま送話信号となり、通話相手に送話音声を伝えることができる。
The
By the above processing, the microphone sound reception signal is multiplied by a gain value less than 1 only during a period in which only the echo is included in the microphone sound reception signal, and a transmission signal in which the echo is suppressed is obtained. When the microphone sound reception signal does not include an echo or includes the voice of the near-end speaker, the microphone sound reception signal becomes a transmission signal as it is, and the transmission voice can be transmitted to the other party.
しかし、従来技術のエコー抑圧方法では、受話音声と近端話者の音声が同時に存在するダブルトーク時において問題が生じる。ダブルトーク時に送話が検出された場合には、エコーが抑圧されずに、そのまま送話信号となってしまい、相手側に伝わってしまうために、会話がしづらくなる。もし、送話が検出されなかった場合には、近端話者の音声が抑圧され、小さいレベルの音声となってしまうため、相手側で、音声が聞き取りづらくなる。このように、従来のエコー抑圧技術では双方向通話性能が充分ではない。
本発明の目的は、受話音声と近端話者の音声が同時に存在するダブルトーク時の双方向通話性能を向上するエコー抑圧方法を提供することにある。
However, the conventional echo suppression method has a problem in double talk in which the received voice and the voice of the near-end speaker exist simultaneously. When transmission is detected during double talk, the echo is not suppressed, but is directly transmitted and transmitted to the other party, making it difficult to communicate. If the transmission is not detected, the near-end speaker's voice is suppressed and becomes a low level voice, making it difficult for the other party to hear the voice. Thus, the conventional echo suppression technology does not have sufficient two-way call performance.
An object of the present invention is to provide an echo suppression method for improving the bidirectional communication performance during double talk in which the received voice and the near-end talker voice are present simultaneously.
本発明によるエコー抑圧方法は、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換処理と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、周波数領域信号に変換されたマイク受音信号にゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理とを含むことを特徴とする。 An echo suppression method according to the present invention includes a first frequency domain conversion process for converting a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components, and a speaker output signal having a frequency composed of N frequency domain components. The amplitude of the transfer function between the speaker and the microphone from the ratio of the second frequency domain conversion processing to convert the signal into the domain signal, the microphone sound reception signal converted into the frequency domain signal, and the speaker output signal converted into the frequency domain signal. The amount of acoustic coupling, which is the value, is estimated for each frequency domain, and the speaker output signal converted to the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain the time smoothing level. An echo level estimation process for multiplying the time smoothing level by an acoustic coupling amount to estimate the level of the echo component included in the microphone received signal for each frequency band; The microphone level estimation processing that calculates the time smoothing level of the microphone sound reception signal converted to the frequency domain signal and estimates the microphone level for each frequency band, and compares the estimated echo level with the estimated microphone level, and the estimated echo level When the estimated echo level is sufficiently low, a gain control process that sets a preset fixed gain value for each frequency band and microphone sound reception converted to a frequency domain signal are set. Gain multiplication processing that multiplies the signal with the gain value set by gain control processing for each frequency band, and inverse frequency domain transformation processing that performs inverse frequency domain transformation of the output signal multiplied by gain multiplication processing and outputs it as a transmission signal It is characterized by including.
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施される前記ゲイン制御処理は、推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、推定マイクレベルとを比較し、推定マイクレベルが閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、推定エコーレベルに予め設定した固定係数を乗じて求めた複数の閾値と、推定マイクレベルとをそれぞれ比較し、推定マイクレベルが何れかの閾値よりも小さい場合は、推定マイクレベル以上の値を持つ閾値のうち最も推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数値と定め、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これら瞬時利得係数値を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
The echo suppression method according to the present invention is further characterized in that, in the echo suppression method, the gain control processing performed for each frequency band includes a threshold obtained by multiplying an estimated echo level by a preset fixed coefficient, and an estimated microphone level. In comparison, when the estimated microphone level is smaller than the threshold value, the preset echo suppression gain is set as the instantaneous gain coefficient value. In other cases, the preset fixed value is set as the instantaneous gain coefficient value. The time-smoothed value is set for each frequency band as a gain value used in the gain multiplication process.
The echo suppression method according to the present invention further compares the estimated microphone level with a plurality of threshold values obtained by multiplying the estimated echo level by a preset fixed coefficient in the echo suppression method. If the value is smaller than the threshold value, the preset echo suppression gain corresponding to the threshold value having the value closest to the estimated microphone level among the threshold values having a value equal to or higher than the estimated microphone level is determined as the instantaneous gain coefficient value. Is characterized in that a fixed value set in advance is used as an instantaneous gain coefficient value, and a value obtained by time-smoothing these instantaneous gain coefficient values is set as a gain value used in the gain multiplication processing for each frequency band.
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号からスピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、推定エコーレベルに予め設定した固定係数を乗じた値と、推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値をゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。 The echo suppression method according to the present invention further includes microphone noise level estimation for estimating the level of stationary noise included in the microphone reception signal for each frequency domain from the microphone reception signal converted into the frequency domain signal in the echo suppression method. From the speaker output signal converted into the frequency domain signal, the received noise level estimation process for estimating the level of stationary noise included in the speaker output signal for each frequency band from the speaker output signal converted into the frequency domain signal, and the speaker output signal converted into the frequency domain signal An echo level estimation process for estimating the estimated echo level of the echo component included in the microphone received signal for each frequency band by multiplying the time smoothing level of the signal obtained by reducing the stationary noise level included in the speaker output signal by the acoustic coupling amount. Is compared with the estimated microphone level and the value obtained by multiplying the estimated echo level by a preset fixed coefficient. -When the level is high, the preset echo suppression gain is the instantaneous echo suppression gain coefficient value.In other cases, the preset fixed value is the instantaneous echo suppression gain coefficient value. The estimated microphone level is compared with a value obtained by multiplying the level by a preset fixed coefficient. If the noise level is high, the noise suppression gain instantaneous noise suppression gain coefficient value is set in advance. Otherwise, the fixed value is set in advance. Is the instantaneous noise suppression gain coefficient value, and the instantaneous echo coefficient value is the smallest value of the instantaneous echo suppression coefficient value and the instantaneous noise suppression gain coefficient value. The gain value used in the processing is set for each frequency band.
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施されるゲイン制御処理の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化処理を付加し、周波数帯域毎に施されるゲイン乗算処理は、周波数領域に変換されたマイク受音信号に周波数特性平滑化処理において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、スピーカ出力信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換処理と、マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とする。
The echo suppression method according to the present invention further includes a frequency characteristic smoothing process for smoothing a gain value as an output of a gain control process performed for each frequency band on the frequency axis in the echo suppression method. The gain multiplication processing applied to the above is characterized in that the microphone sound signal converted into the frequency domain is multiplied for each frequency band by the gain value after smoothing in the frequency characteristic smoothing processing.
The echo suppression method according to the present invention further includes N ′ speaker signals having N frequency components converted into frequency domain signals by frequency domain conversion processing of the speaker output signal in the echo suppression method. The microphone sound reception signals of N frequency components converted into frequency domain signals by the frequency division conversion processing of the speaker output signal and the frequency domain conversion processing of the microphone sound reception signal are converted into N. 'None frequency band gain value of N' frequency bands, which is the output of the microphone sound reception signal to be converted into the microphone sound reception signal of the frequency component and the gain control process, and the gain value of the N frequency bands The frequency division number conversion process of the gain to be converted into is added, and the process performed for each of the N frequency bands is performed for each N ′ frequency band after the band division number conversion.
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、エコーレベル推定処理は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算処理部を有し、周波数帯域ごとに設けられたゲイン制御処理は、M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、M個の瞬時エコー抑圧利得係数値と瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とする。 The echo suppression method according to the present invention is further characterized in that, in the echo suppression method, the echo level estimation processing is performed by performing time smoothing with a time constant corresponding to preset M reverberation times to calculate echo levels of two or more M The gain control processing provided for each frequency band, which has an echo level calculation processing unit, compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to M reverberation times by a preset fixed coefficient. If the estimated echo level is high, the echo suppression gain set for each reverberation time in advance is used as the instantaneous echo suppression gain coefficient value. In other cases, the preset fixed value is set to M as the instantaneous echo suppression gain coefficient value. The instantaneous echo suppression gain coefficient is calculated by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient and the estimated microphone level. If the noise level is high, the preset noise suppression gain is the instantaneous noise suppression gain coefficient value. Otherwise, the preset fixed value is the instantaneous noise suppression gain coefficient value, and M instantaneous echoes are used. The smallest value of the suppression gain coefficient value and the instantaneous noise suppression gain coefficient value is set as the instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set for each frequency band as a gain value used in the gain multiplication processing. It is characterized by that.
本発明の以上で説明する第1〜5の実施例によれば、マイク受音信号に対し、帯域別にエコー抑圧のためのゲインを与えることで、受話音声と近端話者音声の両方が存在するダブルトーク区間においても、エコーを抑圧しながら、近端話者音声のレベル変動を抑え、高品質な双方向通信を行うことが可能である。
更に本発明の第2の実施例によれば、空調やファンなどの定常雑音を抑圧することができる。本発明の第3の実施例によれば、不連続な周波数特性を軽減し、より自然な音質を実現することができる。本発明の第4の実施例によれば、演算する帯域数を軽減し、演算量を削減することができる。本発明の第5の実施例によれば、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
According to the first to fifth embodiments of the present invention described above, both the received voice and the near-end talker voice exist by giving the microphone received signal a gain for echo suppression for each band. Even in the double talk section, high-quality bidirectional communication can be performed while suppressing echo and suppressing level fluctuation of the near-end talker voice.
Furthermore, according to the second embodiment of the present invention, stationary noise such as air conditioning and a fan can be suppressed. According to the third embodiment of the present invention, discontinuous frequency characteristics can be reduced, and more natural sound quality can be realized. According to the fourth embodiment of the present invention, it is possible to reduce the number of bands to be calculated and reduce the amount of calculation. According to the fifth embodiment of the present invention, voice degradation of a near-end speaker can be minimized while sufficiently suppressing echoes even in an environment with a long reverberation time.
本発明によるエコー抑圧装置はハードウェアによって構成し、ハードウェアによって構成したエコー抑圧装置により本発明によるエコー抑圧方法を実行させる実施形態も可能であるが、最も簡素に実現するには本発明によるエコー抑圧プログラムをコンピュータにインストールし、コンピュータにエコー抑圧装置として機能させ、本発明によるエコー抑圧方法を実行させる実施形態が最良の実施形態である。
コンピュータにより本発明によるエコー抑圧装置を構成するには、コンピュータにインストールしたエコー抑圧プログラムによりコンピュータには少なくとも、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換部と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達係数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、周波数領域信号に変換されたマイク受音信号にゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部とを構築し、エコー抑圧装置として機能させる。
The echo suppressor according to the present invention is configured by hardware, and an embodiment in which the echo suppression method according to the present invention is executed by the hardware configured echo suppressor is also possible. An embodiment in which a suppression program is installed in a computer, causes the computer to function as an echo suppression device, and executes the echo suppression method according to the present invention is the best embodiment.
In order to configure the echo suppressor according to the present invention by a computer, the computer converts at least the microphone sound reception signal into a frequency domain signal composed of two or more N frequency components by an echo suppression program installed in the computer. A frequency domain converter, a second frequency domain converter for converting the speaker output signal into a frequency domain signal composed of N frequency domain components, a microphone sound signal converted into the frequency domain signal, and a frequency domain signal An acoustic coupling amount estimation unit that estimates an acoustic coupling amount, which is an amplitude value of a transfer coefficient between the speaker and the microphone, for each frequency domain based on a ratio with the speaker output signal thus obtained, and a speaker output signal converted into the frequency domain signal. The time smoothing level is obtained by smoothing with a time constant corresponding to the preset reverberation time. Echo level estimator that multiplies the acoustic coupling amount to estimate the level of the echo component contained in the microphone sound reception signal for each frequency band, and calculates the time smoothing level of the microphone sound reception signal converted to the frequency domain signal to calculate the frequency When the microphone level estimator that estimates the microphone level for each band, the estimated echo level and the estimated microphone level are compared, and the larger the estimated echo level, the larger the suppression value is set, and the estimated echo level is sufficiently low Includes a gain control unit that sets a preset fixed gain value for each frequency band, and a gain multiplication unit that multiplies the microphone sound signal converted into the frequency domain signal by the gain value set by the gain control unit for each frequency band. And an inverse frequency domain transform unit that performs inverse frequency domain transform on the output signal multiplied by the gain multiplication unit and outputs it as a transmission signal, To function as a pressure device.
本発明の実施例を説明する前に、本発明によるエコー抑圧装置の利用状況の概要を図7を用いて説明する。図7に示す700は本発明の各実施例で説明するエコー抑圧装置を示す。本発明によるエコー抑圧装置700の入力信号は通話相手からの受信信号である受話信号と、自地点のマイクロホンMで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカSPから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。
図7に示すように、マイク受音信号は、近端話者の音声に加えて、スピーカ出力音がマイクロホンMに回り込んだ信号(エコー)が含まれる。エコー抑圧装置700はこのエコーを抑圧し、会話をしやすくする。また、エコー抑圧装置700の各入力信号は、AD変換により、アナログ信号から離散時間の信号に変換され、各出力信号は、離散時間信号からDA変換によりアナログ信号に変換されている。
本発明では、マイク受音信号をN個の周波数帯域信号に分割し、周波数帯域ごとでエコーを抑圧するためのゲインを信号に乗じ、エコーを抑圧する。ただし、Nは2以上の整数である。エコー成分の多く含まれる帯域はゲインを小さくして抑圧し、近端話者の音声が多く含まれる帯域はゲインを予め定めた固定値、例えば1として通過させるようにゲイン値を制御する。このようにすることで、エコーと近端話者の音声が同時に存在するダブルトーク期間であっても、近端話者の音声のレベルの減衰を抑えながら、エコーを抑圧することが可能となり、双方向通話性能を向上させることができる。
Before explaining the embodiment of the present invention, an outline of the use situation of the echo suppressor according to the present invention will be described with reference to FIG.
As shown in FIG. 7, the microphone sound reception signal includes a signal (echo) in which the speaker output sound circulates into the microphone M in addition to the near-end speaker's voice. The
In the present invention, the microphone sound reception signal is divided into N frequency band signals, and the signal is multiplied by a gain for suppressing the echo for each frequency band to suppress the echo. However, N is an integer of 2 or more. The gain value is controlled so that the band containing a lot of echo components is suppressed by reducing the gain, and the band containing a lot of near-end speaker's voice is passed as a predetermined fixed value, for example, 1. This makes it possible to suppress the echo while suppressing the attenuation of the level of the near-end speaker's voice even in the double talk period in which the echo and the near-end speaker's voice exist simultaneously. Two-way call performance can be improved.
図1に、本発明の第1実施例であるエコー抑圧装置100のブロック図を示す。本発明の第1実施例で提案するエコー抑圧装置100は、マイク受音信号を周波数領域信号に変換する第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103と、ゲイン乗算部1041〜104Nと、音響結合量推定部1051〜105Nと、エコーレベル推定部1061〜106Nと、マイクレベル推定部1071〜107Nと、ゲイン制御部1081〜108Nとにより構成される。
第1周波数領域変換部101は、マイク受音信号をN個の周波数成分を持つ周波数領域信号に変換する。周波数領域への変換はフーリエ変換や帯域分割フィルタバンクにより行うことができる。変換後のマイク受話信号をY(Ω)で表す。ただし、Ωは周波数領域変換でのN個の周波数帯域の中心周波数ω0〜ωN−1に対応した離散的な周波数である。この周波数領域変換は、1サンプル以上の複数サンプルごとに行われる。この周波数領域変換が行われる間隔を1フレームと表す。このような処理により、1フレームごとに、周波数領域に変換された受話信号Y(Ω)が得られる。
FIG. 1 shows a block diagram of an echo suppression apparatus 100 according to the first embodiment of the present invention. The echo suppression apparatus 100 proposed in the first embodiment of the present invention includes a first frequency
The first
スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103は、マイク受音信号の第1周波数領域変換部101と同様の処理によりスピーカ出力信号をN個の周波数成分に変換する。変換後のスピーカ出力信号をX(Ω)で表す。
周波数帯域ごとに設けられた音響結合量推定部1051〜105Nは、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)とスピーカ出力信号の第2周波数領域変換部103の出力X(Ω)から、周波数帯域ごとの音響結合量A(Ω)を求める。音響結合量とは、スピーカとマイク間の伝達関数の振幅値であり、周波数領域変換後のスピーカ出力信号とマイク受音信号の絶対値の比で求められる。また、音響結合量の精度を向上するために時間平滑化が行われる。スピーカ出力信号の周波数領域変換信号をX(Ω)、マイク受音信号の周波数領域変換信号をY(Ω)とした場合、音響結合量A(Ω)は式(2)により求められる。
A(Ω)=E{|Y(Ω)|/|X(Ω)|} 式(2)
ただし、E{・}は平均値を取ることを表し、|・|は絶対値をとることを表す。
周波数帯域ごとに設けられたエコーレベル推定部1061〜106Nは、音響結合量推定部1051〜105Nで求められた音響結合量A(Ω)と、スピーカ出力信号の周波数領域変換部103の出力X(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。部屋の反響を無視した場合、エコーレベルは、受話信号の周波数ベクトル|X(Ω)|に音響結合量A(Ω)を乗じることで推定可能できる。しかし、実際には部屋の音響が存在するため、反響成分も含めてエコーを推定する必要がある。通常、部屋の音響成分は時間とともに指数減衰するので、以下の式(3)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=|X(Ω)| for P'(Ω)≦|X(Ω)|
P(Ω)=u・P'(Ω)+(l-u)・|X(Ω)| for P'(Ω)>|X(Ω)| 式(3)
ただし、P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
The second frequency
The acoustic
A (Ω) = E {| Y (Ω) | / | X (Ω) |} Equation (2)
However, E {·} represents taking an average value, and | · | represents taking an absolute value.
The echo
R (Ω) = A (Ω) ・ P (Ω)
P (Ω) = | X (Ω) | for P '(Ω) ≦ | X (Ω) |
P (Ω) = u ・ P '(Ω) + (lu) ・ | X (Ω) | for P'(Ω)> | X (Ω) | Equation (3)
However, P (Ω) is a speaker output signal after performing time smoothing corresponding to reverberation, P ′ (Ω) is P (Ω) one frame before, and u is the length of reverberation (reverberation time). ) Is a coefficient for adjusting the assumed value, and a fixed value is set in advance. For example, u has a value of 0 ≦ u <1, and the closer to 1, the longer the reverberation time is simulated, and the closer to 0, the shorter the reverberation time is simulated.
周波数帯域ごとに設けられたマイクレベル推定部1071〜107Nは、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)からマイク受音信号のレベル(マイクレベル)S(Ω)を推定する。マイクレベルS(Ω)はY(Ω)の絶対値で求められる。これは、式(4)で表される。
S(Ω)=|Y(Ω)| 式(4)
もしくは、Y(Ω)の絶対値を時間平滑化して求めても良い。これは例えば式(5)で表される。
S(Ω)=w・S'(Ω)+(l-w)・|Y(Ω)| 式(5)
ただし、S'(Ω)は1フレーム前のマイクレベルであり、wは時間平滑化の係数であり、例えば0≦w<1の値をとる。wが1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
周波数帯域ごとに設けられたゲイン制御1081〜108Nは、エコーレベル推定部1061〜106Nで推定されたエコーレベルR(Ω)と、マイクレベル推定部1071〜107Nで推定されたマイクレベルS(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
Microphone
S (Ω) = | Y (Ω) | Formula (4)
Alternatively, the absolute value of Y (Ω) may be obtained by time smoothing. This is expressed, for example, by equation (5).
S (Ω) = w ・ S '(Ω) + (lw) ・ | Y (Ω) | Formula (5)
However, S ′ (Ω) is a microphone level one frame before, w is a coefficient of time smoothing, and takes a value of 0 ≦ w <1, for example. As w is closer to 1, smoothing is performed in a longer time, and as w is closer to 0, time smoothing is performed in a shorter time.
The gain controls 108 1 to 108 N provided for each frequency band were estimated by the echo level R (Ω) estimated by the echo
まず、マイク受音信号にエコー成分が多く含まれている場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め設定した固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(6)で表される。
S(Ω)≦C・R(Ω) 式(6)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時利得係数g(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D<1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時利得係数g(Ω)を予め設定した固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(7)となる。
g(Ω)=D for S(Ω)≦C・R(Ω)
g(Ω)=1 for S(Ω)>C・R(Ω)
次に、瞬時利得係数g(Ω)を時間平滑化して、ゲイン乗算部1041〜104Nに
出力するゲインG(Ω)を求める。時間平滑化することでゲインの急激な変化による音質劣化を抑えることができる。時間平滑化は、例えば式(8)のように行われる。
G(Ω)=a・G'(Ω)+(l-a)・g(Ω) for g(Ω)≦G'(Ω)
G(Ω)=b・G'(Ω)+(l-b)・g(Ω) for g(Ω)>G'(Ω) 式(8)
ただし、G'(Ω)は1フレーム前のゲインG(Ω)である。aはゲイン下降時の平滑化係数、bはゲイン上昇時の平滑化係数であり、あらかじめ固定値で設定される。aとbは0から1の間の値をとり、1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
First, when the echo signal contains a lot of echo components, the estimated echo level R (Ω) and the estimated microphone level S (Ω) are close to each other. When the estimated microphone level S (Ω) is smaller than a fixed value, for example, a value obtained by multiplying a fixed coefficient C of 1 or more, it is detected as a period in which many echo components are included. This condition is expressed by equation (6).
S (Ω) ≦ C ・ R (Ω) Formula (6)
If it is detected as a period in which many echo components are included, the instantaneous gain coefficient g (Ω) of that band is set to an echo suppression amount D set in advance as a fixed value. However, the echo suppression amount D takes a value of 0 ≦ D <1, for example, and the smaller the value, the more the echo suppression amount increases, but the deterioration of the near-end speaker voice during double talk increases. Next, when it is not detected as a period in which many echo components are included, the echo component is small, so the instantaneous gain coefficient g (Ω) is set to a preset fixed value, for example, 1, and the microphone sound reception signal is left as it is. Let it pass. If this gain control is expressed by an equation, equation (7) is obtained.
g (Ω) = D for S (Ω) ≦ C ・ R (Ω)
g (Ω) = 1 for S (Ω)> C ・ R (Ω)
Next, the instantaneous gain coefficient g (Ω) is time-smoothed to obtain the gain G (Ω) output to the
G (Ω) = a ・ G '(Ω) + (la) ・ g (Ω) for g (Ω) ≦ G' (Ω)
G (Ω) = b · G '(Ω) + (lb) · g (Ω) for g (Ω)>G' (Ω) Equation (8)
However, G ′ (Ω) is the gain G (Ω) one frame before. a is a smoothing coefficient when the gain is lowered, b is a smoothing coefficient when the gain is raised, and is set in advance as a fixed value. a and b take values between 0 and 1, and the closer to 1, the longer the smoothing, and the closer to 0, the shorter the time.
更に、ゲイン制御部1081〜108Nで、複数のエコー抑圧量を設定することもできる。この場合のゲイン制御は、マイク受音信号にエコー成分が多く含まれるほど、エコー抑圧量を増加させるように行われ、エコー成分が含まれない場合は近端話者音声を通過させるように行われる。具体的な例としては、エコー成分が多く含まれる期間を検出するために固定係数CをK個のC1〜CKとし、推定エコーレベルR(Ω)にこれらの係数C1〜CKを乗じた値と、推定マイクレベルS(Ω)の値を比較して、エコー抑圧量D1〜DKを設定する。すなわち、式(9)により、瞬時利得係数g(Ω)を設定する。
g(Ω)=DK for S(Ω)≦CK・R(Ω)
g(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
g(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
g(Ω)=1 for S(Ω)>C1・R(Ω) 式(9)
ただし、固定係数C1〜CKは、それぞれ予め定めた固定値、例えば1以上の値をとり、係数の大小関係はC1>C2>…>CKとなるように、あらかじめ固定値を設定する。エコー抑圧量D1〜DKは、それぞれ0≦DK≦1の値をとり、その大小関係はD1>D2>…>DKとなるようにあらかじめ固定値を設定する。次に、瞬時利得係数g(Ω)を時間平滑化してゲイン乗算部1041〜104Nで用いるゲインG(Ω)を求める。時間平滑化は、前述と同様に例えば式(8)により行われる。このように、複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコー抑圧量を上げても、ダブルトーク時の通話品質を保つことが可能となる。
Further, a plurality of echo suppression amounts can be set by the
g (Ω) = D K for S (Ω) ≦ C K・ R (Ω)
g (Ω) = D K-1 for C K・ R (Ω) <S (Ω) ≦ C K-1・ R (Ω)
::
g (Ω) = D 1 for C 2・ R (Ω) <S (Ω) ≦ C 1・ R (Ω)
g (Ω) = 1 for S (Ω)> C 1・ R (Ω) Equation (9)
However, the fixed coefficient C 1 -C K is a fixed value determined in advance, respectively, for example, take the value of 1 or greater, as the magnitude relationship coefficient is C 1> C 2>...> C K, previously fixed value Set.
周波数帯域ごとに設けられたゲイン乗算部1041〜104Nは、ゲイン制御部1081〜108Nで計算された周波数帯域ごとの時間平滑化後のゲインG(Ω)を、周波数領域後のマイク受音信号Y(Ω)に、周波数帯域ごとで乗算する。
逆周波数領域変換部102は、ゲイン乗算部1041〜104Nの出力信号を逆周波数領域変換して、送話信号として出力する。
以上の処理により、本実施例のエコー抑圧装置はマイク受音信号にエコー成分が多く含まれる周波数帯域成分を抑圧し、エコーを抑圧することができる。また、周波数帯域ごとで抑圧するか通過させるかの判定を行っているので、従来のエコー抑圧装置よりも受話音声と近端話者音声が同時に存在するダブルトーク時の近端話者の音声の劣化が小さい。
図6A、図6B、図6Cに示すダブルトーク時のマイク受音信号と送話音声の周波数スペクトル図から、本発明の効果を説明する。図6Aはエコー抑圧前のマイク受音信号の周波数スペクトルであり、図6Bは、従来のエコー抑圧装置通過後の送話音声の周波数スペクトルである。従来のエコー抑圧装置では、フルバンドでロスを挿入するため、図6Bに示すように、近端話者の音声成分とエコー成分を両方同じだけ抑圧してしまう。このため、ダブルトーク時にエコー抑圧すると送話信号に含まれる近端話者の音声が小さくなり聞き取りづらいレベルになってしまう。これに対し、図6Cに示す本発明のエコー抑圧装置通過後の送話音声の周波数スペクトルでは、エコー成分のレベルが高い周波数成分のみ抑圧され、近端話者音声成分のレベルが高い周波数成分はそのまま出力される。これにより、近端話者音声レベルの減少は、従来のエコー抑圧装置に比べ小さくなる。
The
The inverse frequency
Through the above processing, the echo suppression apparatus of the present embodiment can suppress the frequency band component in which many echo components are included in the microphone received signal, and suppress the echo. In addition, since it is determined whether to suppress or pass for each frequency band, the voice of the near-end speaker at the time of double talk where the received voice and the near-end talker voice exist simultaneously than the conventional echo suppression device. Deterioration is small.
The effects of the present invention will be described with reference to the frequency spectrum diagrams of the microphone reception signal and the transmitted voice during double talk shown in FIGS. 6A, 6B, and 6C. 6A is a frequency spectrum of a microphone sound reception signal before echo suppression, and FIG. 6B is a frequency spectrum of a transmitted voice after passing through a conventional echo suppression device. Since the conventional echo suppression device inserts a loss in the full band, as shown in FIG. 6B, both the speech component and the echo component of the near-end speaker are suppressed by the same amount. For this reason, if echo suppression is performed at the time of double talk, the near-end speaker's voice included in the transmission signal becomes small and it becomes difficult to hear. On the other hand, in the frequency spectrum of the transmitted voice after passing through the echo suppressor of the present invention shown in FIG. 6C, only the frequency component having a high echo component level is suppressed, and the frequency component having a high near-end speaker speech component level is suppressed. Output as is. Thereby, the decrease in the near-end speaker voice level is smaller than that of the conventional echo suppression device.
また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに帯域一括でゲイン制御することもできる。この場合、式(9)で示したように複数段のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定するのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
以上示したように、本発明の第1の実施例によれば、受話音声と近端話者音声が両方存在するダブルトークの場合でも、エコーを抑圧し、かつ音声の切断感の少ない高品質な双方向通信を実現できる。
Further, in this embodiment, the first frequency
As described above, according to the first embodiment of the present invention, even in the case of double talk in which both the received voice and the near-end talker voice exist, the high quality that suppresses the echo and has a low voice cut feeling. Bi-directional communication can be realized.
図2は、本発明の第2の実施例であるエコー抑圧装置200のブロック図である。本実施例のエコー抑圧装置200は、本発明の第1の実施例に、マイク雑音レベル推定部2011〜201Nと、受話雑音レベル2021〜202Nを追加した構成である。本実施例は、雑音レベルを推定することで、エコー抑圧に加えて雑音の抑圧を行うことができる。
周波数帯域ごとに設けられたマイク雑音レベル推定部2011〜201Nは、マイク受音信号の第1周波数領域変換部101の出力信号から、マイク受音信号に含まれる雑音レベルNS(Ω)を推定する。ここで推定する雑音は、空調やファンの音など時間的なレベル変動が少ない定常雑音である。雑音レベルの推定は、信号レベルの時間変化の谷を保持するディップホールド処理により行われる。このディップホールドは、推定の雑音レベルよりも信号レベルが大きい場合には長い時間の時定数での平滑化を行い、推定の雑音レベルよりも信号レベルが小さい場合には短い時間の時定数での平滑化を行うことにより実現される。例えば、式(10)によりマイク受音信号の推定雑音レベルNS(Ω)が計算される。
NS(Ω)=p・NS'(Ω)+(l-p)・S(Ω) for NS'(Ω)≧S(Ω)
NS(Ω)=q・NS'(Ω)+(l-q)・S(Ω) for NS'(Ω)<S(Ω) 式(10)
ただし、N'S(Ω)は1フレーム前のマイク受音信号の推定雑音レベルであり、pは推定雑音レベル減少時の平滑化係数であり、qは推定雑音レベル増加時の平滑化係数であり、それぞれ例えば0≦p<1、0≦q<1の値をあらかじめ固定値として設定する。またp<<qとなるように設定し、推定雑音レベル増加時に非常に緩やかな値の上昇とすることで信号をディップホールドして雑音レベルを推定する。
FIG. 2 is a block diagram of an echo suppression apparatus 200 according to the second embodiment of the present invention. The echo suppression apparatus 200 of this embodiment has a configuration in which microphone noise
Mic noise
N S (Ω) = p ・ N S '(Ω) + (lp) ・ S (Ω) for N S ' (Ω) ≧ S (Ω)
N S (Ω) = q · N S '(Ω) + (lq) · S (Ω) for N S ' (Ω) <S (Ω) Equation (10)
Where N ′ S (Ω) is the estimated noise level of the microphone received signal one frame before, p is the smoothing coefficient when the estimated noise level is decreased, and q is the smoothing coefficient when the estimated noise level is increased. Yes, for example, values of 0 ≦ p <1 and 0 ≦ q <1 are set as fixed values in advance. Further, p << q is set, and the noise level is estimated by dip-holding the signal by increasing the value very slowly when the estimated noise level increases.
周波数帯域ごとに設けられた受話雑音レベル推定部2021〜202Nは、マイク雑音レベル推定部2011〜202Nと同様の処理により、スピーカ出力信号の第2周波数領域変換部103の出力信号から、スピーカ出力信号に含まれる雑音である受話雑音レベルNRを推定する。
周波数帯域ごとに設けられたエコーレーベル推定部1061〜106Nは、音響結合量推定部1051〜105Nで求められた音響結合量A(Ω)と、スピーカ出力信号の第2周波数領域変換部103の出力X(Ω)と、受話雑音レベル推定部2021〜202Nで推定された受話雑音レベルNR(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。ただし、本実施例で推定するエコーレベルは定常雑音成分を除いたエコーレベルである。
The reception noise level estimation units 202 1 to 202 N provided for each frequency band are processed from the output signal of the second frequency
The echo
受話信号の周波数スペクトル|X(Ω)|から雑音レベルNR(Ω)を減算してから、音響結合量A(Ω)を乗じてエコーレベルR(Ω)を推定する。式(11)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=u・P'(Ω) for {|X(Ω)|-r・NR(Ω)}<0
P(Ω)=|X(Ω)| for P'(Ω)≦ {|X(Ω)|-r・NR(Ω)}≧0
P(Ω)=u・P'(Ω)+(l-u)・{|X(Ω)|-r・NR(Ω)} for P'(Ω)> {|X(Ω)|-r・NR(Ω)}≧0
式(11)
ただし、rは雑音レベルの減算係数であり、あらかじめ固定的に与えられる。標準的には例えばr=1と設定し、より雑音レベルを減算したい場合は1以上の値に設定し、雑音レベルの減算を少なめにしたい場合には1以下に設定する。この他の記号は、本発明の第1の実施例と同様であり、以下のように定義される。P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(反響時間)の想定値を調整するための係数であり、あらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
周波数帯域ごとに設けられたゲイン制御部1081〜108Nは、エコーレベル推定部1061〜106Nで推定されたエコーレベルR(Ω)と、マイクレベル推定部1071〜107Nで推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部2011〜201Nで推定されたマイク雑音レベルNS(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、雑音が主に含まれる場合は雑音を抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
After the noise level N R (Ω) is subtracted from the frequency spectrum | X (Ω) | of the received signal, the echo level R (Ω) is estimated by multiplying by the acoustic coupling amount A (Ω). The echo level R (Ω) is estimated by the equation (11).
R (Ω) = A (Ω) ・ P (Ω)
P (Ω) = u ・ P '(Ω) for {| X (Ω) | -r ・ N R (Ω)} <0
P (Ω) = | X (Ω) | for P '(Ω) ≦ {| X (Ω) | -r ・ N R (Ω)} ≧ 0
P (Ω) = u ・ P '(Ω) + (lu) ・ {| X (Ω) | -r ・ N R (Ω)} for P'(Ω)> {| X (Ω) | -r ・N R (Ω)} ≧ 0
Formula (11)
Here, r is a noise level subtraction coefficient, which is given fixedly in advance. For example, r = 1 is set as a standard value. If more noise level is desired to be subtracted, the value is set to 1 or more. If less noise level subtraction is desired, the value is set to 1 or less. Other symbols are the same as those in the first embodiment of the present invention, and are defined as follows. P (Ω) is a speaker output signal after time smoothing corresponding to reverberation, P ′ (Ω) is P (Ω) one frame before, and u is the length of reverberation (resonance time). A coefficient for adjusting the assumed value, and a fixed value is set in advance. For example, u has a value of 0 ≦ u <1, and the closer to 1, the longer the reverberation time is simulated, and the closer to 0, the shorter the reverberation time is simulated.
The
まず、マイク受音信号にエコー成分が多く含まれる場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め定めた固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(12)で表される。
S(Ω)≦C・R(Ω) 式(12)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時エコー抑圧ゲインgE(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D≦1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時エコー抑圧利得係数gE(Ω)を例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(13)となる。
gE(Ω)=D for S(Ω)≦C・R(Ω)
gE(Ω)=1 for S(Ω)>C・R(Ω) 式(13)
First, when the microphone received signal contains many echo components, the estimated echo level R (Ω) and the estimated microphone level S (Ω) are close to each other. For example, when the estimated microphone level S (Ω) is smaller than a value obtained by multiplying a fixed coefficient C of 1 or more, the period is detected as a period in which many echo components are included. This condition is expressed by equation (12).
S (Ω) ≦ C ・ R (Ω) Formula (12)
If it is detected as a period in which many echo components are included, the instantaneous echo suppression gain g E (Ω) in that band is set to an echo suppression amount D set in advance as a fixed value. However, the echo suppression amount D takes a value of 0 ≦ D ≦ 1, for example, and the smaller the value, the more the echo suppression amount increases, but the deterioration of the near-end speaker voice during double talk increases. Next, when it is not detected as a period in which many echo components are included, since the echo components are small, the instantaneous echo suppression gain coefficient g E (Ω) is set to 1, for example, and the microphone sound reception signal is passed as it is. If this gain control is expressed by an equation, equation (13) is obtained.
g E (Ω) = D for S (Ω) ≦ C ・ R (Ω)
g E (Ω) = 1 for S (Ω)> C ・ R (Ω) Equation (13)
次に、マイク受音信号に雑音成分が多く含まれる場合、推定雑音レベルNS(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定雑音レベルNS(Ω)に予め定めた固定値、例えば1以上の固定係数CNを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(14)で表される。
S(Ω)≦CN・NS(Ω) 式(14)
雑音成分が多く含まれる期間として検出されたら、その帯域の瞬時雑音抑圧利得係数gE(Ω)を、あらかじめ固定値として設定した雑音抑圧量DNに設定する。ただし、雑音抑圧量DNは0≦D≦1の値をとり、小さい値にするほど雑音抑圧量が増加するが、近端話者音声の劣化が増大する。次に、雑音成分が多く含まれている期間として検出されなかった場合は、雑音成分が小さいので、瞬時雑音抑圧利得係数gN(Ω)を予め定めた固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(15)となる。
gN(Ω)=DN for S(Ω)≦CN・NS(Ω)
gN(Ω)=1 for S(Ω)>CN・NS(Ω) 式(15)
以上により求められた瞬時エコー抑圧利得係数gE(Ω)と瞬時雑音抑圧利得係数gN(Ω)のうち小さい方を瞬時雑音利得係数g(Ω)に設定する。これは式(16)により表される。
g(Ω)=MIN{gE(Ω),gN(Ω)} 式(16)
ただし、MIN{A,B}はAの値とBの値のうち小さい方を選択するということを意味する。
Then, if it contains many noise components in microphone received sound signals, the estimated noise level N S (Ω) and the estimated microphone level S (Omega) takes a value close, predetermined on the estimated noise level N S (Ω) fixed value, for example, than a value obtained by multiplying one or more fixed coefficients C N, when the estimated microphone level S (Omega) is small is detected as a period that includes many echo component. This condition is expressed by equation (14).
S (Ω) ≦ C N · N S (Ω) Equation (14)
When it is detected as a period that includes many noise components, the bandwidth of the instantaneous noise suppression gain factor g E a (Omega), it sets the noise suppression quantity D N set in advance as a fixed value. However, the noise suppression quantity D N takes a value of 0 ≦ D ≦ 1, although the noise suppression amount is increased enough to lower the value, increases the deterioration of the near-end speaker's speech. Next, when it is not detected as a period in which many noise components are included, the noise components are small, so the instantaneous noise suppression gain coefficient g N (Ω) is set to a predetermined fixed value, for example, 1, and the microphone The received sound signal is passed as it is. If this gain control is expressed by an equation, equation (15) is obtained.
g N (Ω) = D N for S (Ω) ≦ C N・ N S (Ω)
g N (Ω) = 1 for S (Ω)> C N · N S (Ω) Equation (15)
The smaller one of the instantaneous echo suppression gain coefficient g E (Ω) and the instantaneous noise suppression gain coefficient g N (Ω) obtained as described above is set as the instantaneous noise gain coefficient g (Ω). This is represented by equation (16).
g (Ω) = MIN {g E (Ω), g N (Ω)} Equation (16)
However, MIN {A, B} means that the smaller one of A and B is selected.
次に、本発明の実施例1と同様にして、瞬時利得係数g(Ω)を時間平滑化して、ゲインG(Ω)を求める。
また、本発明の実施例1と同様にして、複数のエコー抑圧量と雑音抑圧量を設定することもできる。エコー成分が多く含まれる期間を検出するための固定係数CをK個のC1〜CKとし、推定エコーレベルR(Ω)にこれらの係数C1〜CKを乗じた値と、マイクレベルS(Ω)の値を比較して、エコー抑圧量D1〜DKを、瞬時エコー抑圧利得係数gE(Ω)に設定する。これを式で表せば式(17)となる。
gE(Ω)=DK for S(Ω)≦CK・R(Ω)
gE(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
gE(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
gE(Ω)=1 1 for S(Ω)>C1・R(Ω) 式(17)
瞬時雑音抑圧利得係数gN(Ω)も同様に、雑音成分が多く含まれる期間を検出するための固定係数CNをJ個の係数DN,1〜DN,Jを、瞬時エコー抑圧利得係数gN(Ω)に設定する。これを式で表せば式(18)となる。
gN(Ω)=DN,J for S(Ω)≦CN,J・NS(Ω)
gN(Ω)=DN,J-1 for CN,J・NS(Ω)<S(Ω)≦CN,J-1・NS(Ω)
: :
gN(Ω)=DN,1 for CN,2・NS(Ω)<S(Ω)≦CN,1・NS(Ω)
gN(Ω)=1 for S(Ω)>CN,1・NS(Ω) 式(18)
だたし、固定係数C1〜CKおよびCN,1〜CN,Jは、それぞれ1以上の値をとり、係数の大小関係はC1>C2>…>CKまたはCN,1>CN,2>…>CN,Jとなるように、あらかじめ固定値を設定する。エコー抑圧量D1〜DKと雑音抑圧量DN,1〜DN,Jは、それぞれ0≦DK≦1、0≦DN,J≦1の値をとり、その大小関係はD1>D2>…>DKまたはDN,1>DN,2>…>DN,Jとなるようにあらかじめ固定値を設定する。次に、瞬時エコー抑圧利得係数gE(Ω)のうち小さい方を選択し瞬時利得係数g(Ω)とし、この瞬時利得係数g(Ω)を時間平均化してゲインG(Ω)を求める。時間平滑化は、第1の実施例と同様にして行われる。このように、複数のエコー抑圧量と雑音抑圧量を設定することで、マイク受音信号に含まれるエコー成分や雑音成分の割合により、エコーまたは雑音抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコーや雑音抑圧量を上げても、通話品質を保つことが可能となる。
これら以外の部分については、本発明の実施例1と同様であるので説明を省略する。
以上示したように、本実施例2によれば、本発明の第1実施例の効果に加えて、空調やファンの音などの定常的な雑音を抑圧することができる。
Next, as in the first embodiment of the present invention, the instantaneous gain coefficient g (Ω) is time-smoothed to obtain the gain G (Ω).
Also, a plurality of echo suppression amounts and noise suppression amounts can be set in the same manner as in the first embodiment of the present invention. A fixed coefficient C for detecting a period in which a lot of echo components are included is set to K C 1 to C K, and a value obtained by multiplying the estimated echo level R (Ω) by these coefficients C 1 to C K and a microphone level By comparing the values of S (Ω), the echo suppression amounts D 1 to D K are set to the instantaneous echo suppression gain coefficient g E (Ω). If this is expressed by an equation, equation (17) is obtained.
g E (Ω) = D K for S (Ω) ≦ C K・ R (Ω)
g E (Ω) = D K-1 for C K・ R (Ω) <S (Ω) ≦ C K-1・ R (Ω)
::
g E (Ω) = D 1 for C 2・ R (Ω) <S (Ω) ≦ C 1・ R (Ω)
g E (Ω) = 1 1 for S (Ω)> C 1 · R (Ω) Equation (17)
Likewise instantaneous noise suppression gain factor g N (Ω), the coefficient fixed coefficients C N for detecting the period that includes many noise components of the J D N, 1 ~D N, the J, instantaneous echo suppression gain Coefficient g N (Ω) is set. If this is expressed by a formula, formula (18) is obtained.
g N (Ω) = D N, J for S (Ω) ≦ C N, J・ N S (Ω)
g N (Ω) = D N, J-1 for C N, J・ N S (Ω) <S (Ω) ≦ C N, J-1・ N S (Ω)
::
g N (Ω) = D N, 1 for C N, 2・ N S (Ω) <S (Ω) ≦ C N, 1・ N S (Ω)
g N (Ω) = 1 for S (Ω)> C N, 1 · N S (Ω) Equation (18)
However, each of the fixed coefficients C 1 to C K and C N, 1 to C N, J takes a value of 1 or more, and the magnitude relationship between the coefficients is C 1 > C 2 >...> C K or C N, A fixed value is set in advance so that 1 > C N, 2 >...> C N, J. The echo suppression amounts D 1 to D K and the noise suppression amounts D N, 1 to D N, J take values of 0 ≦ D K ≦ 1, 0 ≦ D N and J ≦ 1, respectively, and the magnitude relationship is D 1. > D 2>...> D K or D N, 1> D N, 2>...> D N, sets a previously fixed value such that J. Next, the smaller one of the instantaneous echo suppression gain coefficients g E (Ω) is selected as the instantaneous gain coefficient g (Ω), and the instantaneous gain coefficient g (Ω) is time-averaged to obtain the gain G (Ω). Time smoothing is performed in the same manner as in the first embodiment. In this way, by setting multiple echo suppression amounts and noise suppression amounts, the echo or noise suppression amount can be changed according to the ratio of the echo component and noise component contained in the microphone received signal, and the suppression amount can Even if the echo or noise suppression amount is increased rather than setting in one step as in the technology, the call quality can be maintained.
Since other parts are the same as those of the first embodiment of the present invention, description thereof is omitted.
As described above, according to the second embodiment, in addition to the effects of the first embodiment of the present invention, it is possible to suppress stationary noise such as air conditioning and fan noise.
図3は、本発明の第3の実施例であるエコー抑圧装置300のブロック図である。
本実施例のエコー抑圧装置300は、本発明の第1または第2の実施例に、周波数特性平滑部301を追加した構成である。本実施例は、ゲインの周波数特性を周波数軸で平滑化することで、不連続な周波数特性を軽減し、より自然な音質を実現する。
周波数特性平滑部は、ゲイン制御部1081〜108Nで設定されたゲインG(Ω)を周波数軸で平滑化する。平滑化は例えば式(19)により行われる。
G'(ωi)=α・G'(ωj-1)+(1-α)・G(ωj) 式(19)
ただし、G'(ωj)は、平滑化後のゲインであり、αは平滑係数で、あらかじめ固定値が設定される。αは例えば0≦α<1の値をとり、1に近いほど、より強い平滑化となる。
この周波数特性の平滑化により、音質の不自然さの原因となるゲインの不連続な周波数特性を軽減し、音質を向上させることができる。
これ以外の部分に関しては本発明の第1または第2の実施例と同様であるので説明を省略する。
以上、示したように本実施例3によれば、本発明の第1または第2の実施例の効果に加えて、不連続な周波数特性を軽減し、より自然な音質を実現することができる。
FIG. 3 is a block diagram of an echo suppression apparatus 300 according to the third embodiment of the present invention.
The echo suppression apparatus 300 of the present embodiment has a configuration in which a frequency
The frequency characteristic smoothing unit smoothes the gain G (Ω) set by the
G ′ (ω i ) = α · G ′ (ω j−1 ) + (1-α) · G (ω j ) (19)
However, G ′ (ω j ) is a gain after smoothing, α is a smoothing coefficient, and a fixed value is set in advance. α takes a value of 0 ≦ α <1, for example, and the closer to 1, the stronger the smoothing.
By smoothing the frequency characteristics, it is possible to reduce the discontinuous frequency characteristics of the gain that cause unnatural sound quality, and to improve the sound quality.
Since other parts are the same as those of the first or second embodiment of the present invention, description thereof will be omitted.
As described above, according to the third embodiment, in addition to the effects of the first or second embodiment of the present invention, discontinuous frequency characteristics can be reduced, and more natural sound quality can be realized. .
図4は、本発明の第4の実施例であるエコー抑圧装置400のブロック図である。本発明の第4の実施例は、本発明の第1〜3の実施例にマイク受音信号の第1帯域分割変換部401と、スピーカ出力信号の帯域分割変換部402と、ゲインの帯域数変換部403が新たに設けられ、音響結合量推定部1051〜105N’と、エコーレベル推定部1061〜106N’と、マイクレベル推定部1071〜107N’と、ゲイン制御部1081〜108N’と、マイク雑音レベル推定部2011〜201N’と、受話雑音レベル推定部2021〜202N’の個数が、変換後の帯域分割数N’となった構成である。
マイク受音信号の帯域分割変換部401は、マイク受音信号の第1周波数領域変換部101の出力信号である周波数領域変換後のマイク受音信号Y(Ω)の帯域分割数をNからN’に変換する。ただし、N’はN未満の整数であり、変換後のY(Ω)をY’(Ω’)とする。
変換は、変換前の複数の帯域を1つの帯域にまとめることにより行われ、例えばΩ=ωn,…,ωmの範囲のI個の帯域を、1つの帯域Ω’に変換するときには、変換前の複数の帯域の振幅の平均値を、変換後の振幅とする。平均値は、式(20)または式(21)により計算される。
音響結合量推定部1051〜105N’と、エコーレベル推定部1061〜106N’と、マイクレベル推定部1071〜107N’と、ゲイン制御部1081〜108N’と、マイク雑音レベル推定部2011〜201N’と、受話雑音レベル推定部2021〜202N’は、変換後の帯域分割数N’と同数あり、それぞれ帯域分割数変換後の信号を入力として、本発明の第1〜3の実施例と同様の処理を行う。
FIG. 4 is a block diagram of an echo suppression apparatus 400 according to the fourth embodiment of the present invention. The fourth embodiment of the present invention is similar to the first to third embodiments of the present invention in that the first band division conversion unit 401 for the microphone sound reception signal, the band
The microphone reception signal band division conversion unit 401 changes the frequency division number of the microphone reception signal Y (Ω) after the frequency domain conversion, which is the output signal of the first frequency
The conversion is performed by combining a plurality of bands before conversion into one band. For example, when converting I bands in a range of Ω = ωn,..., Ωm into one band Ω ′, The average value of the amplitudes of a plurality of bands is set as the converted amplitude. The average value is calculated by equation (20) or equation (21).
Acoustic coupling
ゲインの帯域分割数変換部403は、ゲイン制御部1081〜108N’の出力であるN’帯域のゲインを周波数領域変換部の帯域分割数Nのゲインに変換する。変換は変換前の1つの帯域を複数の帯域に分割するようにして行われる。例えば帯域Ω’を、Ω=ωn,…,ωmのI個の帯域に分割する場合、変換前の帯域Ω’のゲイン値を、変換後のI個の帯域Ω=ωn,…,ωmのゲイン値とする。
周波数特性平滑化部301を有さない実施例に適用する場合には、ゲイン乗算部1041〜104Nとは、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
周波数特性平滑化部301を有する実施例に適用する場合には、周波数特性平滑化部301は、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
これら以外の部分については、本発明の第1〜3の実施例と同様であるので、説明を省略する。
以上示したように、本実施例によれば、本発明の第1〜3の実施例の効果に加えて、帯域分割数を一部の処理で少なくすることで、演算量の削減を行うことができる。
The gain band division
When applied to an embodiment that does not have the frequency
When applied to the embodiment having the frequency
Since other parts are the same as those in the first to third embodiments of the present invention, description thereof is omitted.
As described above, according to the present embodiment, in addition to the effects of the first to third embodiments of the present invention, the amount of calculation can be reduced by reducing the number of band divisions in some processes. Can do.
図5は、本発明の第5の実施例であるエコー抑圧装置のエコーレベル推定部を示す図である。
本実施例のエコー抑圧装置は、本発明の第1〜第4の実施例に含まれるエコーレベル推定部106i(i=1,…,N)が、図5に示すような複数個の残響時間に対応したエコーレベル計算部106i,1〜106i,Mから構成されることを特徴とする。複数個の残響時間を想定して、複数のエコーレベルR1(Ω)〜RM(Ω)を推定することで、残響時間に応じたエコー抑圧量を設定することができる。
エコーレベル推定部106i(i=1,…,N)は本発明の第1〜第4の実施例のエコーレベル推定部1061〜106Nと同様にしてエコーレベルを推定する。ただし、反響の長さ(残響時間)の想定値を調整するための係数uの値をM個(ul〜uM)設定し、各エコーレベル計算部106i,1〜106i,Mで、各残響時間を想定した場合のエコーレベルR1(Ω)〜RM(Ω)を計算する。
周波数帯域ごとに設けられたゲイン制御部108i〜108Nは、エコーレベル推定部106i〜106Nで推定されたエコーレベルR1(Ω)〜RM(Ω)と、マイクレベル推定部107i〜107Nで推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部で201i〜201Nで推定されたマイク雑音レベルNS(Ω)から、マイクレベル受音信号に与える帯域ごとのゲインを制御する。瞬時雑音抑圧利得係数gN(Ω)は、本発明の第1〜第4の実施例と同様にして求められる。瞬時エコー抑圧利得係数も本発明の第1〜第4の実施例と同様にして求められるが、複数の残響時間を想定した複数の推定エコーレベルR1(Ω)〜RM(Ω)の、各々に対して瞬時エコー抑圧利得係数gE,1(Ω)〜gE,M(Ω)が求められる。これらの瞬時エコー抑圧利得係数と瞬時雑音抑圧利得係数のうち最も利得値が小さいものを最小利得選択部108−1で選択し、選択した利得係数を瞬時抑圧利得係数g(Ω)とし、この瞬時抑圧利得係数g(Ω)を(実施例1〜4と同様に)時間平滑部108−2で時間平滑し、ゲイン乗算部1041〜104Nに出力する。
FIG. 5 is a diagram showing an echo level estimator of an echo suppressor that is the fifth embodiment of the present invention.
In the echo suppression apparatus of this embodiment, the echo level estimation unit 106 i (i = 1,..., N) included in the first to fourth embodiments of the present invention has a plurality of reverberations as shown in FIG. It is characterized by comprising echo
The echo level estimation unit 106 i (i = 1,..., N) estimates the echo level in the same manner as the echo
The
ここで、エコー抑圧量の設定値D,D1〜DKは、想定残響時間ごとに設定される。一般にエコーの大きさは、部屋の残響特性により時間とともに指数関数的に減衰する。このことから、想定残響時間が短いものほど、高いエコー抑圧量を設定し、残響時間がながいほどエコー抑圧量を減らすことで、残響に対して一定の残響エコーレベルとすることができる。これにより、エコーの過度な消去をなくし、近端話者の音声の劣化を最小限とすることができる。
また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに全帯域一括してゲイン制御することもできる。この場合も実施例1と同様に、式(9)で示したように複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定でするのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
Here, the set values D and D 1 to D K of the echo suppression amount are set for each assumed reverberation time. In general, the magnitude of echo attenuates exponentially with time due to the reverberation characteristics of the room. Therefore, a higher echo suppression amount is set as the expected reverberation time is shorter, and the echo suppression amount is decreased as the reverberation time is shorter, so that a constant reverberation echo level can be obtained with respect to reverberation. This eliminates excessive cancellation of echoes and minimizes near-end speaker speech degradation.
Further, in this embodiment, the first frequency
これら以外の部分については、本発明の第1〜第4の実施例と同様であるので説明を省略する。
以上示したように、本実施例5によれば、本発明の第1〜第4の実施例の効果に加えて、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
以上各実施例で説明した本発明によるエコー抑圧装置はコンピュータが解読可能なプログラム言語によって記述されたエコー抑圧プログラムをコンピュータにインストールし、コンピュータに備えられたCPUに解読させることにより上述したエコー抑圧装置として機能し、本発明によるエコー抑圧方法が実行される。
本発明によるエコー抑圧プログラムはコンピュータが読み取り可能な例えば磁気ディスク或いはCD−ROM、半導体メモリ等の記録媒体に記録される。コンピュータにはこれらの記録媒体からインストールするか、又は通信回線を通じてインストールすることができる。
Since other parts are the same as those in the first to fourth embodiments of the present invention, description thereof will be omitted.
As described above, according to the fifth embodiment, in addition to the effects of the first to fourth embodiments of the present invention, the near-end talk is performed while suppressing the echo sufficiently even in an environment with a long reverberation time. The voice degradation of the person can be minimized.
The echo suppressor according to the present invention described in each of the above embodiments is an echo suppressor described above by installing an echo suppression program described in a computer-readable program language in a computer and causing a CPU provided in the computer to decode the program. And the echo suppression method according to the present invention is executed.
The echo suppression program according to the present invention is recorded in a computer-readable recording medium such as a magnetic disk, CD-ROM, or semiconductor memory. The computer can be installed from these recording media or can be installed through a communication line.
本発明によるエコー抑圧方法、装置はテレビ会議システム或いは音声会議システムのようなハンズフリー通信の分野で活用される。 The echo suppression method and apparatus according to the present invention is utilized in the field of hands-free communication such as a video conference system or an audio conference system.
101 第1周波数領域変換部
102 逆周波数領域変換部
103 第2周波数領域変換部
1041〜104N ゲイン乗算部
1051〜105N 音響結合量推定部
1061〜106N エコーレベル推定部
1071〜107N マイクレベル推定部
1081〜108N ゲイン制御部
2011〜201N マイク雑音レベル推定部
2021〜202N 受話雑音レベル推定部
301 周波数特性平滑化部
401〜403 帯域分割数変換部
101 1st frequency
107 1 to 107 N microphone
Claims (16)
スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、
前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、
前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、
前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、
前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、
前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、
前記ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理と、
を含むことを特徴とするエコー抑圧方法。 A first frequency domain conversion process for converting a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components;
A second frequency domain conversion process for converting the speaker output signal into a frequency domain signal composed of N frequency domain components;
From the ratio of the microphone sound signal converted to the frequency domain signal and the speaker output signal converted to the frequency domain signal, the acoustic coupling amount, which is the amplitude value of the transfer function between the speaker and the microphone, is determined for each frequency domain. Acoustic coupling amount estimation processing to be estimated;
The speaker output signal converted into the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain a time smoothing level, and this time smoothing level is multiplied by the acoustic coupling amount and included in the microphone sound reception signal. Echo level estimation processing for estimating the level of echo components to be generated for each frequency band,
A microphone level estimation process for calculating a time smoothing level of the microphone reception signal converted into the frequency domain signal and estimating a microphone level for each frequency band;
The estimated echo level is compared with the estimated microphone level, and a gain value with a large suppression amount is set as the estimated echo level increases. When the estimated echo level is sufficiently small, a preset fixed gain value is set for each frequency band. Gain control processing to be set to
Gain multiplication processing for multiplying the microphone sound signal converted into the frequency domain signal by the gain value set in the gain control processing for each frequency band;
An inverse frequency domain transform process for performing an inverse frequency domain transform on the output signal multiplied by the gain multiplication process, and outputting as a transmission signal;
Including an echo suppression method.
前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、
前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、
前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。 The echo suppression method according to any one of claims 1 to 3, wherein a microphone noise is estimated for each frequency domain from a microphone reception signal converted into the frequency domain signal. Level estimation process,
From the speaker output signal converted into the frequency domain signal, a reception noise level estimation process for estimating the level of stationary noise included in the speaker output signal for each frequency band;
Estimating an echo component included in the microphone sound reception signal by multiplying the time smoothing level of the signal obtained by subtracting the stationary noise level included in the speaker output signal from the speaker output signal converted into the frequency domain signal by the acoustic coupling amount Echo level estimation processing for estimating the echo level for each frequency band;
A value obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level are compared. If the estimated echo level is large, a preset echo suppression gain is set as an instantaneous echo suppression gain coefficient value. In this case, a preset fixed value is used as an instantaneous echo suppression gain coefficient value, and a value obtained by multiplying a stationary noise level included in the microphone received signal by a preset fixed coefficient is compared with the estimated microphone level. If the level is high, the noise suppression gain is set to a preset instantaneous noise suppression gain coefficient value. Otherwise, the preset fixed value is set to the instantaneous noise suppression gain coefficient value, and the instantaneous echo suppression gain coefficient value and the instantaneous noise are set. The smallest value among the suppression gain coefficient values is used as the instantaneous gain coefficient value, and the gain obtained by using the time-smoothed value of the instantaneous gain coefficient value in the gain multiplication process. Echo suppressing method and setting for each frequency band as.
前記マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、
前記ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、
前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧方法。 5. The echo suppression method according to claim 1, wherein a speaker signal having N frequency components converted into a frequency domain signal by frequency domain conversion processing of the speaker output signal is equal to or greater than 2 and less than N. 'Band division number conversion processing of speaker output signal to convert into speaker output signal of frequency components,
Band division of microphone sound reception signal for converting microphone sound reception signal of N frequency components converted to frequency domain signal by frequency domain conversion processing of the microphone sound reception signal into microphone sound reception signal of N ′ frequency components Number conversion processing,
A gain band division number conversion process for converting the gain values of N ′ frequency bands, which are the outputs of the gain control process, into gain values of N frequency bands;
An echo suppression method characterized in that the processing performed for each of the N frequency bands is performed for each of N ′ frequency bands after the band division number conversion.
前記周波数帯域ごとに設けられたゲイン制御処理は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧方法。 The echo suppression method according to any one of claims 1 to 6, wherein the echo level estimation processing is performed by performing time smoothing with a time constant corresponding to preset M reverberation times to calculate an echo level. Echo level calculation processing unit,
The gain control processing provided for each frequency band compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to the M reverberation times by a preset fixed coefficient, and the estimated echo level is If it is large, the echo suppression gain set in advance for each reverberation time is used as the instantaneous echo suppression gain coefficient value. Otherwise, a preset fixed value is used as the instantaneous echo suppression gain coefficient value, and M instantaneous echo suppression gain coefficients are used. And comparing the estimated microphone level with a value obtained by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient, and if the noise level is large, the preset noise suppression gain is set to the instantaneous noise level. In other cases, a fixed value set in advance is used as an instantaneous noise suppression gain coefficient value, and the M instantaneous echo suppression gains are set. The smallest value of the coefficient value and the instantaneous noise suppression gain coefficient value is set as an instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set as a gain value used in the gain multiplication processing for each frequency band. An echo suppression method characterized by the above.
スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、
前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、
前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、
前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、
前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、
前記ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部と、
によって構成することを特徴とするエコー抑圧装置。 A first frequency domain converter that converts a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components;
A second frequency domain converter that converts the speaker output signal into a frequency domain signal composed of N frequency domain components;
From the ratio of the microphone sound signal converted to the frequency domain signal and the speaker output signal converted to the frequency domain signal, the acoustic coupling amount, which is the amplitude value of the transfer function between the speaker and the microphone, is determined for each frequency domain. An acoustic coupling amount estimation unit to be estimated;
The speaker output signal converted into the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain a time smoothing level, and this time smoothing level is multiplied by the acoustic coupling amount and included in the microphone sound reception signal. An echo level estimator for estimating the level of echo components to be generated for each frequency band;
A microphone level estimation unit that calculates a time smoothing level of the microphone reception signal converted into the frequency domain signal and estimates a microphone level for each frequency band;
The estimated echo level is compared with the estimated microphone level, and a gain value with a large suppression amount is set as the estimated echo level increases. When the estimated echo level is sufficiently small, a preset fixed gain value is set for each frequency band. A gain control unit to be set to
A gain multiplier that multiplies the microphone sound signal converted into the frequency domain signal by a gain value set by the gain controller for each frequency band;
An inverse frequency domain transform unit that performs an inverse frequency domain transform on the output signal multiplied by the gain multiplier, and outputs the signal as a transmission signal;
An echo suppressor comprising:
前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定部と、
前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。 11. The echo suppression apparatus according to claim 8, wherein a microphone noise for estimating a stationary noise level included in a microphone sound reception signal for each frequency domain from the microphone sound reception signal converted into the frequency domain signal. A level estimator;
From the speaker output signal converted into the frequency domain signal, a reception noise level estimation unit that estimates the level of stationary noise included in the speaker output signal for each frequency band;
Estimating an echo component included in the microphone sound reception signal by multiplying the time smoothing level of the signal obtained by subtracting the stationary noise level included in the speaker output signal from the speaker output signal converted into the frequency domain signal by the acoustic coupling amount An echo level estimator for estimating the echo level for each frequency band;
A value obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level are compared. If the estimated echo level is large, a preset echo suppression gain is set as an instantaneous echo suppression gain coefficient value. In this case, a preset fixed value is used as an instantaneous echo suppression gain coefficient value, and a value obtained by multiplying a stationary noise level included in the microphone received signal by a preset fixed coefficient is compared with the estimated microphone level. If the level is large, it is set as a preset noise suppression gain instantaneous noise suppression gain coefficient; otherwise, a preset fixed value is set as an instantaneous noise suppression gain coefficient value, and the instantaneous echo suppression gain coefficient value and the instantaneous noise suppression The smallest value among the gain coefficient values is used as the instantaneous gain coefficient value, and a value obtained by smoothing the instantaneous gain coefficient value with time is used in the gain multiplication process. Echo suppressing apparatus characterized by setting for each frequency band by.
前記マイク受音信号の周波数領域変換部で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換部と、
前記ゲイン制御部の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換部を付加し、
前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧装置。 13. The echo suppression device according to claim 8, wherein N speaker components having N frequency components converted into a frequency domain signal by a frequency domain converter of the speaker output signal are equal to or greater than 2 and less than N. 'Speaker output signal band division number conversion unit for converting into speaker output signal of frequency components,
Band division of a microphone sound reception signal for converting a microphone sound reception signal of N frequency components converted into a frequency domain signal by a frequency domain conversion unit of the microphone sound reception signal into a microphone sound reception signal of N ′ frequency components A number converter,
A gain band division number conversion unit for converting the gain values of N ′ frequency bands, which are the outputs of the gain control unit, into gain values of N frequency bands;
An echo suppressor characterized in that the processing performed for each of the N frequency bands is performed for each N ′ frequency band after the band division number conversion.
前記周波数帯域ごとに設けられたゲイン制御部は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算部で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧装置。 14. The echo suppression device according to claim 8, wherein the echo level estimation unit calculates the echo level by performing time smoothing with a time constant corresponding to preset M reverberation times. Have echo level calculators,
The gain controller provided for each frequency band compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to the M reverberation times by a preset fixed coefficient, and the estimated echo level is If it is large, the echo suppression gain set in advance for each reverberation time is used as the instantaneous echo suppression gain coefficient value. Otherwise, a preset fixed value is used as the instantaneous echo suppression gain coefficient value, and M instantaneous echo suppression gain coefficients are used. And comparing the estimated microphone level with a value obtained by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient, and if the noise level is large, the preset noise suppression gain is set to the instantaneous noise level. In other cases, a fixed value set in advance is used as an instantaneous noise suppression gain coefficient value, and the M instantaneous echo suppression gains are set. The smallest value among the numerical value and the instantaneous noise suppression gain coefficient value is set as an instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set as a gain value used in the gain multiplier for each frequency band. Echo suppression device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006171045A JP4413205B2 (en) | 2006-06-21 | 2006-06-21 | Echo suppression method, apparatus, echo suppression program, recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006171045A JP4413205B2 (en) | 2006-06-21 | 2006-06-21 | Echo suppression method, apparatus, echo suppression program, recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008005094A true JP2008005094A (en) | 2008-01-10 |
JP4413205B2 JP4413205B2 (en) | 2010-02-10 |
Family
ID=39009147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006171045A Active JP4413205B2 (en) | 2006-06-21 | 2006-06-21 | Echo suppression method, apparatus, echo suppression program, recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4413205B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011024163A (en) * | 2009-07-21 | 2011-02-03 | Yamaha Corp | Echo suppression method and apparatus therefor |
JP2011166239A (en) * | 2010-02-04 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Echo canceling method, echo canceler, program thereof and recording medium |
JP2016025425A (en) * | 2014-07-17 | 2016-02-08 | 沖電気工業株式会社 | Echo suppression device, echo suppression program, echo suppression method, and communication terminal |
JP2017191992A (en) * | 2016-04-12 | 2017-10-19 | 日本電信電話株式会社 | Echo suppressor, method therefor, program, and recording medium |
JP2019146129A (en) * | 2018-02-23 | 2019-08-29 | リオン株式会社 | Reverberation suppression device and hearing aid |
-
2006
- 2006-06-21 JP JP2006171045A patent/JP4413205B2/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011024163A (en) * | 2009-07-21 | 2011-02-03 | Yamaha Corp | Echo suppression method and apparatus therefor |
JP2011166239A (en) * | 2010-02-04 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Echo canceling method, echo canceler, program thereof and recording medium |
JP2016025425A (en) * | 2014-07-17 | 2016-02-08 | 沖電気工業株式会社 | Echo suppression device, echo suppression program, echo suppression method, and communication terminal |
JP2017191992A (en) * | 2016-04-12 | 2017-10-19 | 日本電信電話株式会社 | Echo suppressor, method therefor, program, and recording medium |
JP2019146129A (en) * | 2018-02-23 | 2019-08-29 | リオン株式会社 | Reverberation suppression device and hearing aid |
JP7264594B2 (en) | 2018-02-23 | 2023-04-25 | リオン株式会社 | Reverberation suppression device and hearing aid |
Also Published As
Publication number | Publication date |
---|---|
JP4413205B2 (en) | 2010-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4954334B2 (en) | Apparatus and method for calculating filter coefficients for echo suppression | |
JP5671147B2 (en) | Echo suppression including modeling of late reverberation components | |
US8594320B2 (en) | Hybrid echo and noise suppression method and device in a multi-channel audio signal | |
JP3727258B2 (en) | Echo suppression processing system | |
US7742592B2 (en) | Method and device for removing echo in an audio signal | |
JP3568922B2 (en) | Echo processing device | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
JPWO2010035308A1 (en) | Echo canceller | |
JP2012501152A (en) | Method for determining updated filter coefficients of an adaptive filter adapted by an LMS algorithm with pre-whitening | |
JPWO2006046293A1 (en) | Noise suppressor | |
EP2987314B1 (en) | Echo suppression | |
JP2023133472A (en) | Background noise estimation using gap confidence | |
JP3607625B2 (en) | Multi-channel echo suppression method, apparatus thereof, program thereof and recording medium thereof | |
KR101182017B1 (en) | Method and Apparatus for removing noise from signals inputted to a plurality of microphones in a portable terminal | |
JP4413205B2 (en) | Echo suppression method, apparatus, echo suppression program, recording medium | |
JP5662232B2 (en) | Echo canceling apparatus, method and program | |
JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
US8804981B2 (en) | Processing audio signals | |
US8406430B2 (en) | Simulated background noise enabled echo canceller | |
JP4700673B2 (en) | Echo cancellation method, apparatus, program, and recording medium | |
JP2003250193A (en) | Echo elimination method, device for executing the method, program and recording medium therefor | |
JP4383416B2 (en) | Howling prevention method, apparatus, program, and recording medium recording this program | |
JP6143702B2 (en) | Echo canceling apparatus, method and program | |
JP6356087B2 (en) | Echo canceling apparatus, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090730 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091104 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4413205 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131127 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |