[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2008005094A - Echo suppressing method and device, echo suppressing program, and recording medium - Google Patents

Echo suppressing method and device, echo suppressing program, and recording medium Download PDF

Info

Publication number
JP2008005094A
JP2008005094A JP2006171045A JP2006171045A JP2008005094A JP 2008005094 A JP2008005094 A JP 2008005094A JP 2006171045 A JP2006171045 A JP 2006171045A JP 2006171045 A JP2006171045 A JP 2006171045A JP 2008005094 A JP2008005094 A JP 2008005094A
Authority
JP
Japan
Prior art keywords
level
gain
echo
value
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006171045A
Other languages
Japanese (ja)
Other versions
JP4413205B2 (en
Inventor
Kazunori Kobayashi
和則 小林
Kenichi Furuya
賢一 古家
Yoichi Haneda
陽一 羽田
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006171045A priority Critical patent/JP4413205B2/en
Publication of JP2008005094A publication Critical patent/JP2008005094A/en
Application granted granted Critical
Publication of JP4413205B2 publication Critical patent/JP4413205B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an echo suppressing method and a device with less deterioration of sound quality even during double talk. <P>SOLUTION: A microphone reception signal performs frequency domain transformation, gains for suppressing echoes are obtained for each frequency band, and gain is controlled for each frequency band. A transmission signal passes as it is in a frequency band wherein the level of a transmission speech is large and an echo is suppressed in a frequency band where the level of the echo is large. Even in the double talk wherein the reception speech and a speech of a near-end speaker are both present, the echo suppressing device is provided which gives a little feeling of interruption of a speech and has high two-way communication performance. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明はテレビ会議や音声会議などハンズフリー通信のエコー抑圧方法および装置に関する。   The present invention relates to an echo suppression method and apparatus for hands-free communication such as a video conference and an audio conference.

従来技術のエコー抑圧装置について説明する。
図8は特許文献1で開示された従来技術のエコー抑圧装置800の構成図である。従来技術のエコー抑圧装置800は、ゲイン乗算部801と、音響結合量推定部802と、送話判定部803と、受話判定部804と、ゲイン制御部805により構成される。
本エコー抑圧装置800は、スピーカとマイクロホンを用いた拡声通話においてマイク受音信号に混入するスピーカ音であるエコーを抑圧する。入力信号は、通話相手からの受信信号である受話信号と、自地点のマイクロホンで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。本装置は、マイク受音信号にエコーが主に含まれる場合は1よりも小さいゲインをマイク受音信号に乗算し、送話信号とすることで、マイク受音信号に含まれるエコーを抑圧する。
以下に、本装置の詳細について述べる。
音響結合量推定部802は、スピーカとマイクロホン間の伝達特性の振幅値である音響結合量A(t)を求める。ここではtは離散化された時刻を表す。スピーカ出力信号とマイク受音信号の時間平均レベルを観測し、その比をとって、音響結合量を求める。スピーカ出力信号をX(t)、マイク受音信号をY(t)とした場合、音響結合量A(t)は式(1)により求められる。
A(t)=E{|Y(t)|/|X(t)|} 式(1)
ただし、E{・}は平均時間をとること、|・|は絶対値を取ることを表す。
A conventional echo suppressor will be described.
FIG. 8 is a configuration diagram of a conventional echo suppression apparatus 800 disclosed in Patent Document 1. In FIG. A conventional echo suppression apparatus 800 includes a gain multiplication unit 801, an acoustic coupling amount estimation unit 802, a transmission determination unit 803, a reception determination unit 804, and a gain control unit 805.
The echo suppression apparatus 800 suppresses an echo which is a speaker sound mixed in a microphone reception signal in a loudspeaking call using a speaker and a microphone. The input signal is a reception signal that is a reception signal from the other party, and a microphone reception signal that is received by a microphone at the local location, and the output signal is a speaker output that is a signal output from the local speaker. A signal and a transmission signal which is a transmission signal to the other party. This apparatus suppresses the echo contained in the microphone sound reception signal by multiplying the microphone sound reception signal by a gain smaller than 1 when the microphone sound reception signal mainly includes an echo to obtain a transmission signal. .
Details of this apparatus will be described below.
The acoustic coupling amount estimation unit 802 obtains an acoustic coupling amount A (t) that is an amplitude value of a transfer characteristic between the speaker and the microphone. Here, t represents a discretized time. The time average level of the speaker output signal and the microphone sound reception signal is observed, and the ratio is calculated to obtain the acoustic coupling amount. When the speaker output signal is X (t) and the microphone sound reception signal is Y (t), the acoustic coupling amount A (t) is obtained by the equation (1).
A (t) = E {| Y (t) | / | X (t) |} Equation (1)
However, E {·} represents an average time, and | · | represents an absolute value.

送話判定部803は、受話信号X(t)と音響結合量A(t)とマイク受音信号Y(t)より、送話の判定をする。マイク受音信号Y(t)の時間平滑レベルを観測し、その時間平滑レベルがあらかじめ与えられた固定閾値を越え、さらに、音響結合量A(t)に受話信号X(t)の時間平滑レベルを乗じた推定音響エコーレベルを定数倍した閾値を越えた場合に送話と判定する。
受話判定部804は、受話信号から、受話の判定をする。受話信号X(t)の時間平滑レベルを観測し、そのレベルがあらかじめ与えた固定閾値を越えた場合に受話と判定する。
The transmission determination unit 803 determines transmission based on the reception signal X (t), the acoustic coupling amount A (t), and the microphone reception signal Y (t). The time smoothing level of the microphone reception signal Y (t) is observed, the time smoothing level exceeds a predetermined fixed threshold, and the time smoothing level of the reception signal X (t) is further added to the acoustic coupling amount A (t). When the estimated acoustic echo level multiplied by is over a threshold value that is a constant multiple, the transmission is determined.
The reception determination unit 804 determines reception from the reception signal. The time smoothing level of the received signal X (t) is observed, and when the level exceeds a predetermined fixed threshold value, it is determined that the received signal is received.

ゲイン制御部805は、送話判定部803と受話判定部804の判定結果より、ゲイン値を制御する。受話が検出され、送話が検出されない場合は、マイク受音信号にエコーのみが含まれるので、あらかじめ設定したエコー抑圧ゲインをゲイン値とし、これ以外の場合には、ゲイン値を1とする。また、ゲイン値の不連続な変化による音声の劣化を防ぐため、ゲイン値が滑らかに変化するように、時間平滑化が行われる。
ゲイン乗算部801は、ゲイン制御部805で設定されたゲイン値を、マイク受音信号に乗じ、送話信号とする。
以上の処理により、マイク受音信号にエコーのみが含まれる期間のみ、1未満のゲイン値がマイク受音信号に乗じられ、エコーが抑圧された送話信号となる。マイク受音信号にエコーが含まれないか、近端話者の音声が含まれる場合は、マイク受音信号がそのまま送話信号となり、通話相手に送話音声を伝えることができる。
特許第3082898号明細書
The gain control unit 805 controls the gain value based on the determination results of the transmission determination unit 803 and the reception determination unit 804. When the incoming call is detected and the outgoing call is not detected, only the echo is included in the microphone sound reception signal. Therefore, the preset echo suppression gain is set as the gain value. In other cases, the gain value is set to 1. In addition, time smoothing is performed so that the gain value changes smoothly in order to prevent audio deterioration due to discontinuous changes in the gain value.
The gain multiplication unit 801 multiplies the microphone sound reception signal by the gain value set by the gain control unit 805 to obtain a transmission signal.
By the above processing, the microphone sound reception signal is multiplied by a gain value less than 1 only during a period in which only the echo is included in the microphone sound reception signal, and a transmission signal in which the echo is suppressed is obtained. When the microphone sound reception signal does not include an echo or includes the voice of the near-end speaker, the microphone sound reception signal becomes a transmission signal as it is, and the transmission voice can be transmitted to the other party.
Japanese Patent No. 3082898

しかし、従来技術のエコー抑圧方法では、受話音声と近端話者の音声が同時に存在するダブルトーク時において問題が生じる。ダブルトーク時に送話が検出された場合には、エコーが抑圧されずに、そのまま送話信号となってしまい、相手側に伝わってしまうために、会話がしづらくなる。もし、送話が検出されなかった場合には、近端話者の音声が抑圧され、小さいレベルの音声となってしまうため、相手側で、音声が聞き取りづらくなる。このように、従来のエコー抑圧技術では双方向通話性能が充分ではない。
本発明の目的は、受話音声と近端話者の音声が同時に存在するダブルトーク時の双方向通話性能を向上するエコー抑圧方法を提供することにある。
However, the conventional echo suppression method has a problem in double talk in which the received voice and the voice of the near-end speaker exist simultaneously. When transmission is detected during double talk, the echo is not suppressed, but is directly transmitted and transmitted to the other party, making it difficult to communicate. If the transmission is not detected, the near-end speaker's voice is suppressed and becomes a low level voice, making it difficult for the other party to hear the voice. Thus, the conventional echo suppression technology does not have sufficient two-way call performance.
An object of the present invention is to provide an echo suppression method for improving the bidirectional communication performance during double talk in which the received voice and the near-end talker voice are present simultaneously.

本発明によるエコー抑圧方法は、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換処理と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、周波数領域信号に変換されたマイク受音信号にゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理とを含むことを特徴とする。   An echo suppression method according to the present invention includes a first frequency domain conversion process for converting a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components, and a speaker output signal having a frequency composed of N frequency domain components. The amplitude of the transfer function between the speaker and the microphone from the ratio of the second frequency domain conversion processing to convert the signal into the domain signal, the microphone sound reception signal converted into the frequency domain signal, and the speaker output signal converted into the frequency domain signal. The amount of acoustic coupling, which is the value, is estimated for each frequency domain, and the speaker output signal converted to the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain the time smoothing level. An echo level estimation process for multiplying the time smoothing level by an acoustic coupling amount to estimate the level of the echo component included in the microphone received signal for each frequency band; The microphone level estimation processing that calculates the time smoothing level of the microphone sound reception signal converted to the frequency domain signal and estimates the microphone level for each frequency band, and compares the estimated echo level with the estimated microphone level, and the estimated echo level When the estimated echo level is sufficiently low, a gain control process that sets a preset fixed gain value for each frequency band and microphone sound reception converted to a frequency domain signal are set. Gain multiplication processing that multiplies the signal with the gain value set by gain control processing for each frequency band, and inverse frequency domain transformation processing that performs inverse frequency domain transformation of the output signal multiplied by gain multiplication processing and outputs it as a transmission signal It is characterized by including.

本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施される前記ゲイン制御処理は、推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、推定マイクレベルとを比較し、推定マイクレベルが閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、推定エコーレベルに予め設定した固定係数を乗じて求めた複数の閾値と、推定マイクレベルとをそれぞれ比較し、推定マイクレベルが何れかの閾値よりも小さい場合は、推定マイクレベル以上の値を持つ閾値のうち最も推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数値と定め、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これら瞬時利得係数値を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
The echo suppression method according to the present invention is further characterized in that, in the echo suppression method, the gain control processing performed for each frequency band includes a threshold obtained by multiplying an estimated echo level by a preset fixed coefficient, and an estimated microphone level. In comparison, when the estimated microphone level is smaller than the threshold value, the preset echo suppression gain is set as the instantaneous gain coefficient value. In other cases, the preset fixed value is set as the instantaneous gain coefficient value. The time-smoothed value is set for each frequency band as a gain value used in the gain multiplication process.
The echo suppression method according to the present invention further compares the estimated microphone level with a plurality of threshold values obtained by multiplying the estimated echo level by a preset fixed coefficient in the echo suppression method. If the value is smaller than the threshold value, the preset echo suppression gain corresponding to the threshold value having the value closest to the estimated microphone level among the threshold values having a value equal to or higher than the estimated microphone level is determined as the instantaneous gain coefficient value. Is characterized in that a fixed value set in advance is used as an instantaneous gain coefficient value, and a value obtained by time-smoothing these instantaneous gain coefficient values is set as a gain value used in the gain multiplication processing for each frequency band.

本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号からスピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、推定エコーレベルに予め設定した固定係数を乗じた値と、推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値をゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。   The echo suppression method according to the present invention further includes microphone noise level estimation for estimating the level of stationary noise included in the microphone reception signal for each frequency domain from the microphone reception signal converted into the frequency domain signal in the echo suppression method. From the speaker output signal converted into the frequency domain signal, the received noise level estimation process for estimating the level of stationary noise included in the speaker output signal for each frequency band from the speaker output signal converted into the frequency domain signal, and the speaker output signal converted into the frequency domain signal An echo level estimation process for estimating the estimated echo level of the echo component included in the microphone received signal for each frequency band by multiplying the time smoothing level of the signal obtained by reducing the stationary noise level included in the speaker output signal by the acoustic coupling amount. Is compared with the estimated microphone level and the value obtained by multiplying the estimated echo level by a preset fixed coefficient. -When the level is high, the preset echo suppression gain is the instantaneous echo suppression gain coefficient value.In other cases, the preset fixed value is the instantaneous echo suppression gain coefficient value. The estimated microphone level is compared with a value obtained by multiplying the level by a preset fixed coefficient. If the noise level is high, the noise suppression gain instantaneous noise suppression gain coefficient value is set in advance. Otherwise, the fixed value is set in advance. Is the instantaneous noise suppression gain coefficient value, and the instantaneous echo coefficient value is the smallest value of the instantaneous echo suppression coefficient value and the instantaneous noise suppression gain coefficient value. The gain value used in the processing is set for each frequency band.

本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施されるゲイン制御処理の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化処理を付加し、周波数帯域毎に施されるゲイン乗算処理は、周波数領域に変換されたマイク受音信号に周波数特性平滑化処理において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、スピーカ出力信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換処理と、マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とする。
The echo suppression method according to the present invention further includes a frequency characteristic smoothing process for smoothing a gain value as an output of a gain control process performed for each frequency band on the frequency axis in the echo suppression method. The gain multiplication processing applied to the above is characterized in that the microphone sound signal converted into the frequency domain is multiplied for each frequency band by the gain value after smoothing in the frequency characteristic smoothing processing.
The echo suppression method according to the present invention further includes N ′ speaker signals having N frequency components converted into frequency domain signals by frequency domain conversion processing of the speaker output signal in the echo suppression method. The microphone sound reception signals of N frequency components converted into frequency domain signals by the frequency division conversion processing of the speaker output signal and the frequency domain conversion processing of the microphone sound reception signal are converted into N. 'None frequency band gain value of N' frequency bands, which is the output of the microphone sound reception signal to be converted into the microphone sound reception signal of the frequency component and the gain control process, and the gain value of the N frequency bands The frequency division number conversion process of the gain to be converted into is added, and the process performed for each of the N frequency bands is performed for each N ′ frequency band after the band division number conversion.

本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、エコーレベル推定処理は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算処理部を有し、周波数帯域ごとに設けられたゲイン制御処理は、M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、M個の瞬時エコー抑圧利得係数値と瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とする。   The echo suppression method according to the present invention is further characterized in that, in the echo suppression method, the echo level estimation processing is performed by performing time smoothing with a time constant corresponding to preset M reverberation times to calculate echo levels of two or more M The gain control processing provided for each frequency band, which has an echo level calculation processing unit, compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to M reverberation times by a preset fixed coefficient. If the estimated echo level is high, the echo suppression gain set for each reverberation time in advance is used as the instantaneous echo suppression gain coefficient value. In other cases, the preset fixed value is set to M as the instantaneous echo suppression gain coefficient value. The instantaneous echo suppression gain coefficient is calculated by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient and the estimated microphone level. If the noise level is high, the preset noise suppression gain is the instantaneous noise suppression gain coefficient value. Otherwise, the preset fixed value is the instantaneous noise suppression gain coefficient value, and M instantaneous echoes are used. The smallest value of the suppression gain coefficient value and the instantaneous noise suppression gain coefficient value is set as the instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set for each frequency band as a gain value used in the gain multiplication processing. It is characterized by that.

本発明の以上で説明する第1〜5の実施例によれば、マイク受音信号に対し、帯域別にエコー抑圧のためのゲインを与えることで、受話音声と近端話者音声の両方が存在するダブルトーク区間においても、エコーを抑圧しながら、近端話者音声のレベル変動を抑え、高品質な双方向通信を行うことが可能である。
更に本発明の第2の実施例によれば、空調やファンなどの定常雑音を抑圧することができる。本発明の第3の実施例によれば、不連続な周波数特性を軽減し、より自然な音質を実現することができる。本発明の第4の実施例によれば、演算する帯域数を軽減し、演算量を削減することができる。本発明の第5の実施例によれば、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
According to the first to fifth embodiments of the present invention described above, both the received voice and the near-end talker voice exist by giving the microphone received signal a gain for echo suppression for each band. Even in the double talk section, high-quality bidirectional communication can be performed while suppressing echo and suppressing level fluctuation of the near-end talker voice.
Furthermore, according to the second embodiment of the present invention, stationary noise such as air conditioning and a fan can be suppressed. According to the third embodiment of the present invention, discontinuous frequency characteristics can be reduced, and more natural sound quality can be realized. According to the fourth embodiment of the present invention, it is possible to reduce the number of bands to be calculated and reduce the amount of calculation. According to the fifth embodiment of the present invention, voice degradation of a near-end speaker can be minimized while sufficiently suppressing echoes even in an environment with a long reverberation time.

本発明によるエコー抑圧装置はハードウェアによって構成し、ハードウェアによって構成したエコー抑圧装置により本発明によるエコー抑圧方法を実行させる実施形態も可能であるが、最も簡素に実現するには本発明によるエコー抑圧プログラムをコンピュータにインストールし、コンピュータにエコー抑圧装置として機能させ、本発明によるエコー抑圧方法を実行させる実施形態が最良の実施形態である。
コンピュータにより本発明によるエコー抑圧装置を構成するには、コンピュータにインストールしたエコー抑圧プログラムによりコンピュータには少なくとも、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換部と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達係数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、周波数領域信号に変換されたマイク受音信号にゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部とを構築し、エコー抑圧装置として機能させる。
The echo suppressor according to the present invention is configured by hardware, and an embodiment in which the echo suppression method according to the present invention is executed by the hardware configured echo suppressor is also possible. An embodiment in which a suppression program is installed in a computer, causes the computer to function as an echo suppression device, and executes the echo suppression method according to the present invention is the best embodiment.
In order to configure the echo suppressor according to the present invention by a computer, the computer converts at least the microphone sound reception signal into a frequency domain signal composed of two or more N frequency components by an echo suppression program installed in the computer. A frequency domain converter, a second frequency domain converter for converting the speaker output signal into a frequency domain signal composed of N frequency domain components, a microphone sound signal converted into the frequency domain signal, and a frequency domain signal An acoustic coupling amount estimation unit that estimates an acoustic coupling amount, which is an amplitude value of a transfer coefficient between the speaker and the microphone, for each frequency domain based on a ratio with the speaker output signal thus obtained, and a speaker output signal converted into the frequency domain signal. The time smoothing level is obtained by smoothing with a time constant corresponding to the preset reverberation time. Echo level estimator that multiplies the acoustic coupling amount to estimate the level of the echo component contained in the microphone sound reception signal for each frequency band, and calculates the time smoothing level of the microphone sound reception signal converted to the frequency domain signal to calculate the frequency When the microphone level estimator that estimates the microphone level for each band, the estimated echo level and the estimated microphone level are compared, and the larger the estimated echo level, the larger the suppression value is set, and the estimated echo level is sufficiently low Includes a gain control unit that sets a preset fixed gain value for each frequency band, and a gain multiplication unit that multiplies the microphone sound signal converted into the frequency domain signal by the gain value set by the gain control unit for each frequency band. And an inverse frequency domain transform unit that performs inverse frequency domain transform on the output signal multiplied by the gain multiplication unit and outputs it as a transmission signal, To function as a pressure device.

本発明の実施例を説明する前に、本発明によるエコー抑圧装置の利用状況の概要を図7を用いて説明する。図7に示す700は本発明の各実施例で説明するエコー抑圧装置を示す。本発明によるエコー抑圧装置700の入力信号は通話相手からの受信信号である受話信号と、自地点のマイクロホンMで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカSPから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。
図7に示すように、マイク受音信号は、近端話者の音声に加えて、スピーカ出力音がマイクロホンMに回り込んだ信号(エコー)が含まれる。エコー抑圧装置700はこのエコーを抑圧し、会話をしやすくする。また、エコー抑圧装置700の各入力信号は、AD変換により、アナログ信号から離散時間の信号に変換され、各出力信号は、離散時間信号からDA変換によりアナログ信号に変換されている。
本発明では、マイク受音信号をN個の周波数帯域信号に分割し、周波数帯域ごとでエコーを抑圧するためのゲインを信号に乗じ、エコーを抑圧する。ただし、Nは2以上の整数である。エコー成分の多く含まれる帯域はゲインを小さくして抑圧し、近端話者の音声が多く含まれる帯域はゲインを予め定めた固定値、例えば1として通過させるようにゲイン値を制御する。このようにすることで、エコーと近端話者の音声が同時に存在するダブルトーク期間であっても、近端話者の音声のレベルの減衰を抑えながら、エコーを抑圧することが可能となり、双方向通話性能を向上させることができる。
Before explaining the embodiment of the present invention, an outline of the use situation of the echo suppressor according to the present invention will be described with reference to FIG. Reference numeral 700 shown in FIG. 7 denotes an echo suppressor described in each embodiment of the present invention. The input signals of the echo suppression apparatus 700 according to the present invention are a reception signal that is a reception signal from the other party and a microphone reception signal that is a signal received by the microphone M at the local point, and an output signal is a speaker at the local point. A speaker output signal that is a signal output from the SP and a transmission signal that is a transmission signal to the other party.
As shown in FIG. 7, the microphone sound reception signal includes a signal (echo) in which the speaker output sound circulates into the microphone M in addition to the near-end speaker's voice. The echo suppressor 700 suppresses this echo and facilitates conversation. Each input signal of the echo suppression apparatus 700 is converted from an analog signal to a discrete time signal by AD conversion, and each output signal is converted from a discrete time signal to an analog signal by DA conversion.
In the present invention, the microphone sound reception signal is divided into N frequency band signals, and the signal is multiplied by a gain for suppressing the echo for each frequency band to suppress the echo. However, N is an integer of 2 or more. The gain value is controlled so that the band containing a lot of echo components is suppressed by reducing the gain, and the band containing a lot of near-end speaker's voice is passed as a predetermined fixed value, for example, 1. This makes it possible to suppress the echo while suppressing the attenuation of the level of the near-end speaker's voice even in the double talk period in which the echo and the near-end speaker's voice exist simultaneously. Two-way call performance can be improved.

図1に、本発明の第1実施例であるエコー抑圧装置100のブロック図を示す。本発明の第1実施例で提案するエコー抑圧装置100は、マイク受音信号を周波数領域信号に変換する第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103と、ゲイン乗算部104〜104と、音響結合量推定部105〜105と、エコーレベル推定部106〜106と、マイクレベル推定部107〜107と、ゲイン制御部108〜108とにより構成される。
第1周波数領域変換部101は、マイク受音信号をN個の周波数成分を持つ周波数領域信号に変換する。周波数領域への変換はフーリエ変換や帯域分割フィルタバンクにより行うことができる。変換後のマイク受話信号をY(Ω)で表す。ただし、Ωは周波数領域変換でのN個の周波数帯域の中心周波数ω〜ωN−1に対応した離散的な周波数である。この周波数領域変換は、1サンプル以上の複数サンプルごとに行われる。この周波数領域変換が行われる間隔を1フレームと表す。このような処理により、1フレームごとに、周波数領域に変換された受話信号Y(Ω)が得られる。
FIG. 1 shows a block diagram of an echo suppression apparatus 100 according to the first embodiment of the present invention. The echo suppression apparatus 100 proposed in the first embodiment of the present invention includes a first frequency domain conversion unit 101 that converts a microphone reception signal into a frequency domain signal, an inverse frequency domain conversion unit 102, and a speaker output signal that is converted into a frequency domain. a second frequency domain transform section 103 into a signal, and a gain multiplication unit 104 1 -104 N, and the acoustic coupling amount estimating unit 105 1 to 105 N, and the echo level estimating unit 106 1 - 106 N, microphone level estimation unit 107 1 to 107 N and gain control units 108 1 to 108 N.
The first frequency domain converter 101 converts the microphone sound reception signal into a frequency domain signal having N frequency components. The conversion to the frequency domain can be performed by Fourier transform or a band division filter bank. The converted microphone reception signal is represented by Y (Ω). Here, Ω is a discrete frequency corresponding to the center frequencies ω 0 to ω N−1 of the N frequency bands in the frequency domain conversion. This frequency domain transformation is performed for each of a plurality of samples of one sample or more. An interval at which this frequency domain transformation is performed is represented as one frame. By such processing, the reception signal Y (Ω) converted into the frequency domain is obtained for each frame.

スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103は、マイク受音信号の第1周波数領域変換部101と同様の処理によりスピーカ出力信号をN個の周波数成分に変換する。変換後のスピーカ出力信号をX(Ω)で表す。
周波数帯域ごとに設けられた音響結合量推定部105〜105は、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)とスピーカ出力信号の第2周波数領域変換部103の出力X(Ω)から、周波数帯域ごとの音響結合量A(Ω)を求める。音響結合量とは、スピーカとマイク間の伝達関数の振幅値であり、周波数領域変換後のスピーカ出力信号とマイク受音信号の絶対値の比で求められる。また、音響結合量の精度を向上するために時間平滑化が行われる。スピーカ出力信号の周波数領域変換信号をX(Ω)、マイク受音信号の周波数領域変換信号をY(Ω)とした場合、音響結合量A(Ω)は式(2)により求められる。
A(Ω)=E{|Y(Ω)|/|X(Ω)|} 式(2)
ただし、E{・}は平均値を取ることを表し、|・|は絶対値をとることを表す。
周波数帯域ごとに設けられたエコーレベル推定部106〜106は、音響結合量推定部105〜105で求められた音響結合量A(Ω)と、スピーカ出力信号の周波数領域変換部103の出力X(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。部屋の反響を無視した場合、エコーレベルは、受話信号の周波数ベクトル|X(Ω)|に音響結合量A(Ω)を乗じることで推定可能できる。しかし、実際には部屋の音響が存在するため、反響成分も含めてエコーを推定する必要がある。通常、部屋の音響成分は時間とともに指数減衰するので、以下の式(3)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=|X(Ω)| for P'(Ω)≦|X(Ω)|
P(Ω)=u・P'(Ω)+(l-u)・|X(Ω)| for P'(Ω)>|X(Ω)| 式(3)
ただし、P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
The second frequency domain conversion unit 103 that converts the speaker output signal into the frequency domain signal converts the speaker output signal into N frequency components by the same processing as the first frequency domain conversion unit 101 of the microphone reception signal. The converted speaker output signal is represented by X (Ω).
The acoustic coupling amount estimators 105 1 to 105 N provided for each frequency band are the outputs Y (Ω) of the first frequency domain conversion unit 101 for the microphone sound reception signal and the second frequency domain conversion unit 103 for the speaker output signal. An acoustic coupling amount A (Ω) for each frequency band is obtained from the output X (Ω). The acoustic coupling amount is an amplitude value of a transfer function between the speaker and the microphone, and is obtained by a ratio of an absolute value of the speaker output signal after the frequency domain conversion and the microphone sound reception signal. In addition, time smoothing is performed to improve the accuracy of the acoustic coupling amount. When the frequency domain conversion signal of the speaker output signal is X (Ω) and the frequency domain conversion signal of the microphone sound reception signal is Y (Ω), the acoustic coupling amount A (Ω) can be obtained by Expression (2).
A (Ω) = E {| Y (Ω) | / | X (Ω) |} Equation (2)
However, E {·} represents taking an average value, and | · | represents taking an absolute value.
The echo level estimation units 106 1 to 106 N provided for each frequency band include the acoustic coupling amount A (Ω) obtained by the acoustic coupling amount estimation units 105 1 to 105 N and the frequency domain conversion unit 103 of the speaker output signal. The level of the echo contained in the microphone sound reception signal is estimated from the output X (Ω) of. When the echo of the room is ignored, the echo level can be estimated by multiplying the frequency vector | X (Ω) | of the received signal by the acoustic coupling amount A (Ω). However, since the sound of the room actually exists, it is necessary to estimate the echo including the echo component. Usually, since the acoustic component of the room exponentially decays with time, the echo level R (Ω) is estimated by the following equation (3).
R (Ω) = A (Ω) ・ P (Ω)
P (Ω) = | X (Ω) | for P '(Ω) ≦ | X (Ω) |
P (Ω) = u ・ P '(Ω) + (lu) ・ | X (Ω) | for P'(Ω)> | X (Ω) | Equation (3)
However, P (Ω) is a speaker output signal after performing time smoothing corresponding to reverberation, P ′ (Ω) is P (Ω) one frame before, and u is the length of reverberation (reverberation time). ) Is a coefficient for adjusting the assumed value, and a fixed value is set in advance. For example, u has a value of 0 ≦ u <1, and the closer to 1, the longer the reverberation time is simulated, and the closer to 0, the shorter the reverberation time is simulated.

周波数帯域ごとに設けられたマイクレベル推定部107〜107は、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)からマイク受音信号のレベル(マイクレベル)S(Ω)を推定する。マイクレベルS(Ω)はY(Ω)の絶対値で求められる。これは、式(4)で表される。
S(Ω)=|Y(Ω)| 式(4)
もしくは、Y(Ω)の絶対値を時間平滑化して求めても良い。これは例えば式(5)で表される。
S(Ω)=w・S'(Ω)+(l-w)・|Y(Ω)| 式(5)
ただし、S'(Ω)は1フレーム前のマイクレベルであり、wは時間平滑化の係数であり、例えば0≦w<1の値をとる。wが1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
周波数帯域ごとに設けられたゲイン制御108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
Microphone level estimation units 107 1 to 107 N provided for each frequency band are configured to output a microphone sound reception signal level (microphone level) S (Ω) from an output Y (Ω) of the first frequency domain conversion unit 101 of the microphone sound reception signal. ). The microphone level S (Ω) is obtained as an absolute value of Y (Ω). This is expressed by equation (4).
S (Ω) = | Y (Ω) | Formula (4)
Alternatively, the absolute value of Y (Ω) may be obtained by time smoothing. This is expressed, for example, by equation (5).
S (Ω) = w ・ S '(Ω) + (lw) ・ | Y (Ω) | Formula (5)
However, S ′ (Ω) is a microphone level one frame before, w is a coefficient of time smoothing, and takes a value of 0 ≦ w <1, for example. As w is closer to 1, smoothing is performed in a longer time, and as w is closer to 0, time smoothing is performed in a shorter time.
The gain controls 108 1 to 108 N provided for each frequency band were estimated by the echo level R (Ω) estimated by the echo level estimation units 106 1 to 106 N and the microphone level estimation units 107 1 to 107 N. From the microphone level S (Ω), the gain for each band given to the microphone reception signal is controlled. The gain control is performed so as to suppress the echo when the microphone reception signal contains a lot of echo components and to pass the near-end speaker voice in other cases.

まず、マイク受音信号にエコー成分が多く含まれている場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め設定した固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(6)で表される。
S(Ω)≦C・R(Ω) 式(6)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時利得係数g(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D<1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時利得係数g(Ω)を予め設定した固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(7)となる。
g(Ω)=D for S(Ω)≦C・R(Ω)
g(Ω)=1 for S(Ω)>C・R(Ω)
次に、瞬時利得係数g(Ω)を時間平滑化して、ゲイン乗算部104〜104
出力するゲインG(Ω)を求める。時間平滑化することでゲインの急激な変化による音質劣化を抑えることができる。時間平滑化は、例えば式(8)のように行われる。
G(Ω)=a・G'(Ω)+(l-a)・g(Ω) for g(Ω)≦G'(Ω)
G(Ω)=b・G'(Ω)+(l-b)・g(Ω) for g(Ω)>G'(Ω) 式(8)
ただし、G'(Ω)は1フレーム前のゲインG(Ω)である。aはゲイン下降時の平滑化係数、bはゲイン上昇時の平滑化係数であり、あらかじめ固定値で設定される。aとbは0から1の間の値をとり、1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
First, when the echo signal contains a lot of echo components, the estimated echo level R (Ω) and the estimated microphone level S (Ω) are close to each other. When the estimated microphone level S (Ω) is smaller than a fixed value, for example, a value obtained by multiplying a fixed coefficient C of 1 or more, it is detected as a period in which many echo components are included. This condition is expressed by equation (6).
S (Ω) ≦ C ・ R (Ω) Formula (6)
If it is detected as a period in which many echo components are included, the instantaneous gain coefficient g (Ω) of that band is set to an echo suppression amount D set in advance as a fixed value. However, the echo suppression amount D takes a value of 0 ≦ D <1, for example, and the smaller the value, the more the echo suppression amount increases, but the deterioration of the near-end speaker voice during double talk increases. Next, when it is not detected as a period in which many echo components are included, the echo component is small, so the instantaneous gain coefficient g (Ω) is set to a preset fixed value, for example, 1, and the microphone sound reception signal is left as it is. Let it pass. If this gain control is expressed by an equation, equation (7) is obtained.
g (Ω) = D for S (Ω) ≦ C ・ R (Ω)
g (Ω) = 1 for S (Ω)> C ・ R (Ω)
Next, the instantaneous gain coefficient g (Ω) is time-smoothed to obtain the gain G (Ω) output to the gain multipliers 104 1 to 104 N. By performing time smoothing, it is possible to suppress deterioration in sound quality due to a rapid change in gain. Time smoothing is performed, for example, as shown in Equation (8).
G (Ω) = a ・ G '(Ω) + (la) ・ g (Ω) for g (Ω) ≦ G' (Ω)
G (Ω) = b · G '(Ω) + (lb) · g (Ω) for g (Ω)>G' (Ω) Equation (8)
However, G ′ (Ω) is the gain G (Ω) one frame before. a is a smoothing coefficient when the gain is lowered, b is a smoothing coefficient when the gain is raised, and is set in advance as a fixed value. a and b take values between 0 and 1, and the closer to 1, the longer the smoothing, and the closer to 0, the shorter the time.

更に、ゲイン制御部108〜108で、複数のエコー抑圧量を設定することもできる。この場合のゲイン制御は、マイク受音信号にエコー成分が多く含まれるほど、エコー抑圧量を増加させるように行われ、エコー成分が含まれない場合は近端話者音声を通過させるように行われる。具体的な例としては、エコー成分が多く含まれる期間を検出するために固定係数CをK個のC〜Cとし、推定エコーレベルR(Ω)にこれらの係数C〜Cを乗じた値と、推定マイクレベルS(Ω)の値を比較して、エコー抑圧量D〜Dを設定する。すなわち、式(9)により、瞬時利得係数g(Ω)を設定する。
g(Ω)=DK for S(Ω)≦CK・R(Ω)
g(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
g(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
g(Ω)=1 for S(Ω)>C1・R(Ω) 式(9)
ただし、固定係数C〜Cは、それぞれ予め定めた固定値、例えば1以上の値をとり、係数の大小関係はC>C>…>Cとなるように、あらかじめ固定値を設定する。エコー抑圧量D〜Dは、それぞれ0≦D≦1の値をとり、その大小関係はD>D>…>Dとなるようにあらかじめ固定値を設定する。次に、瞬時利得係数g(Ω)を時間平滑化してゲイン乗算部104〜104で用いるゲインG(Ω)を求める。時間平滑化は、前述と同様に例えば式(8)により行われる。このように、複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコー抑圧量を上げても、ダブルトーク時の通話品質を保つことが可能となる。
Further, a plurality of echo suppression amounts can be set by the gain control units 108 1 to 108 N. In this case, the gain control is performed so as to increase the echo suppression amount as the microphone reception signal contains more echo components. When the echo component is not included, the near-end speaker voice is passed. Is called. As a specific example, in order to detect a period in which many echo components are included, the fixed coefficient C is set to K C 1 to C K, and these coefficients C 1 to C K are set to the estimated echo level R (Ω). By comparing the multiplied value with the value of the estimated microphone level S (Ω), the echo suppression amounts D 1 to D K are set. That is, the instantaneous gain coefficient g (Ω) is set by the equation (9).
g (Ω) = D K for S (Ω) ≦ C K・ R (Ω)
g (Ω) = D K-1 for C K・ R (Ω) <S (Ω) ≦ C K-1・ R (Ω)
::
g (Ω) = D 1 for C 2・ R (Ω) <S (Ω) ≦ C 1・ R (Ω)
g (Ω) = 1 for S (Ω)> C 1・ R (Ω) Equation (9)
However, the fixed coefficient C 1 -C K is a fixed value determined in advance, respectively, for example, take the value of 1 or greater, as the magnitude relationship coefficient is C 1> C 2>...> C K, previously fixed value Set. Echo suppression amount D 1 to D K are each a value of 0 ≦ D K ≦ 1, the magnitude relationship sets a previously fixed value such that D 1> D 2>...> D K. Next, the gain G (Ω) used in the gain multipliers 104 1 to 104 N is obtained by smoothing the instantaneous gain coefficient g (Ω) over time. The time smoothing is performed by, for example, Expression (8) as described above. In this way, by setting a plurality of echo suppression amounts, the echo suppression amount can be changed according to the ratio of the echo components included in the microphone received signal, and the suppression amount is set in one step as in the prior art. Even if the echo suppression amount is increased more, it is possible to maintain the call quality during double talk.

周波数帯域ごとに設けられたゲイン乗算部104〜104は、ゲイン制御部108〜108で計算された周波数帯域ごとの時間平滑化後のゲインG(Ω)を、周波数領域後のマイク受音信号Y(Ω)に、周波数帯域ごとで乗算する。
逆周波数領域変換部102は、ゲイン乗算部104〜104の出力信号を逆周波数領域変換して、送話信号として出力する。
以上の処理により、本実施例のエコー抑圧装置はマイク受音信号にエコー成分が多く含まれる周波数帯域成分を抑圧し、エコーを抑圧することができる。また、周波数帯域ごとで抑圧するか通過させるかの判定を行っているので、従来のエコー抑圧装置よりも受話音声と近端話者音声が同時に存在するダブルトーク時の近端話者の音声の劣化が小さい。
図6A、図6B、図6Cに示すダブルトーク時のマイク受音信号と送話音声の周波数スペクトル図から、本発明の効果を説明する。図6Aはエコー抑圧前のマイク受音信号の周波数スペクトルであり、図6Bは、従来のエコー抑圧装置通過後の送話音声の周波数スペクトルである。従来のエコー抑圧装置では、フルバンドでロスを挿入するため、図6Bに示すように、近端話者の音声成分とエコー成分を両方同じだけ抑圧してしまう。このため、ダブルトーク時にエコー抑圧すると送話信号に含まれる近端話者の音声が小さくなり聞き取りづらいレベルになってしまう。これに対し、図6Cに示す本発明のエコー抑圧装置通過後の送話音声の周波数スペクトルでは、エコー成分のレベルが高い周波数成分のみ抑圧され、近端話者音声成分のレベルが高い周波数成分はそのまま出力される。これにより、近端話者音声レベルの減少は、従来のエコー抑圧装置に比べ小さくなる。
The gain multipliers 104 1 to 104 N provided for each frequency band use the gain G (Ω) after time smoothing for each frequency band calculated by the gain control units 108 1 to 108 N as the microphone after the frequency domain. The received sound signal Y (Ω) is multiplied for each frequency band.
The inverse frequency domain transform unit 102 performs inverse frequency domain transform on the output signals of the gain multipliers 104 1 to 104 N and outputs the result as a transmission signal.
Through the above processing, the echo suppression apparatus of the present embodiment can suppress the frequency band component in which many echo components are included in the microphone received signal, and suppress the echo. In addition, since it is determined whether to suppress or pass for each frequency band, the voice of the near-end speaker at the time of double talk where the received voice and the near-end talker voice exist simultaneously than the conventional echo suppression device. Deterioration is small.
The effects of the present invention will be described with reference to the frequency spectrum diagrams of the microphone reception signal and the transmitted voice during double talk shown in FIGS. 6A, 6B, and 6C. 6A is a frequency spectrum of a microphone sound reception signal before echo suppression, and FIG. 6B is a frequency spectrum of a transmitted voice after passing through a conventional echo suppression device. Since the conventional echo suppression device inserts a loss in the full band, as shown in FIG. 6B, both the speech component and the echo component of the near-end speaker are suppressed by the same amount. For this reason, if echo suppression is performed at the time of double talk, the near-end speaker's voice included in the transmission signal becomes small and it becomes difficult to hear. On the other hand, in the frequency spectrum of the transmitted voice after passing through the echo suppressor of the present invention shown in FIG. 6C, only the frequency component having a high echo component level is suppressed, and the frequency component having a high near-end speaker speech component level is suppressed. Output as is. Thereby, the decrease in the near-end speaker voice level is smaller than that of the conventional echo suppression device.

また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに帯域一括でゲイン制御することもできる。この場合、式(9)で示したように複数段のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定するのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
以上示したように、本発明の第1の実施例によれば、受話音声と近端話者音声が両方存在するダブルトークの場合でも、エコーを抑圧し、かつ音声の切断感の少ない高品質な双方向通信を実現できる。
Further, in this embodiment, the first frequency domain conversion unit 101, the reverse frequency domain conversion unit 102, and the second frequency domain conversion unit 103 of the speaker output signal are deleted without performing the frequency domain conversion. It is also possible to perform gain control in a single band. In this case, by setting a plurality of stages of echo suppression amounts as shown in Equation (9), the echo suppression amount can be changed according to the ratio of the echo components included in the microphone sound reception signal. Compared with the case where the suppression amount is set in one step as in the apparatus, the call quality during double talk can be maintained even if the echo suppression amount is increased.
As described above, according to the first embodiment of the present invention, even in the case of double talk in which both the received voice and the near-end talker voice exist, the high quality that suppresses the echo and has a low voice cut feeling. Bi-directional communication can be realized.

図2は、本発明の第2の実施例であるエコー抑圧装置200のブロック図である。本実施例のエコー抑圧装置200は、本発明の第1の実施例に、マイク雑音レベル推定部201〜201と、受話雑音レベル202〜202を追加した構成である。本実施例は、雑音レベルを推定することで、エコー抑圧に加えて雑音の抑圧を行うことができる。
周波数帯域ごとに設けられたマイク雑音レベル推定部201〜201は、マイク受音信号の第1周波数領域変換部101の出力信号から、マイク受音信号に含まれる雑音レベルN(Ω)を推定する。ここで推定する雑音は、空調やファンの音など時間的なレベル変動が少ない定常雑音である。雑音レベルの推定は、信号レベルの時間変化の谷を保持するディップホールド処理により行われる。このディップホールドは、推定の雑音レベルよりも信号レベルが大きい場合には長い時間の時定数での平滑化を行い、推定の雑音レベルよりも信号レベルが小さい場合には短い時間の時定数での平滑化を行うことにより実現される。例えば、式(10)によりマイク受音信号の推定雑音レベルN(Ω)が計算される。
NS(Ω)=p・NS'(Ω)+(l-p)・S(Ω) for NS'(Ω)≧S(Ω)
NS(Ω)=q・NS'(Ω)+(l-q)・S(Ω) for NS'(Ω)<S(Ω) 式(10)
ただし、N'S(Ω)は1フレーム前のマイク受音信号の推定雑音レベルであり、pは推定雑音レベル減少時の平滑化係数であり、qは推定雑音レベル増加時の平滑化係数であり、それぞれ例えば0≦p<1、0≦q<1の値をあらかじめ固定値として設定する。またp<<qとなるように設定し、推定雑音レベル増加時に非常に緩やかな値の上昇とすることで信号をディップホールドして雑音レベルを推定する。
FIG. 2 is a block diagram of an echo suppression apparatus 200 according to the second embodiment of the present invention. The echo suppression apparatus 200 of this embodiment has a configuration in which microphone noise level estimation sections 201 1 to 201 N and reception noise levels 202 1 to 202 N are added to the first embodiment of the present invention. In this embodiment, noise can be suppressed in addition to echo suppression by estimating the noise level.
Mic noise level estimation unit 201 1 ~201 N which is provided for each frequency band, from the output signal of the first frequency domain transform section 101 of the microphone received sound signals, the noise level N S contained in the microphone received sound signals (Omega) Is estimated. The noise estimated here is stationary noise with little temporal level fluctuation such as air conditioning or fan sound. The estimation of the noise level is performed by a dip hold process that holds the valley of the signal level with time. This dip hold is smoothed with a long time constant when the signal level is larger than the estimated noise level, and with a short time constant when the signal level is smaller than the estimated noise level. This is realized by performing smoothing. For example, the estimated noise level N S (Ω) of the microphone sound reception signal is calculated by Expression (10).
N S (Ω) = p ・ N S '(Ω) + (lp) ・ S (Ω) for N S ' (Ω) ≧ S (Ω)
N S (Ω) = q · N S '(Ω) + (lq) · S (Ω) for N S ' (Ω) <S (Ω) Equation (10)
Where N ′ S (Ω) is the estimated noise level of the microphone received signal one frame before, p is the smoothing coefficient when the estimated noise level is decreased, and q is the smoothing coefficient when the estimated noise level is increased. Yes, for example, values of 0 ≦ p <1 and 0 ≦ q <1 are set as fixed values in advance. Further, p << q is set, and the noise level is estimated by dip-holding the signal by increasing the value very slowly when the estimated noise level increases.

周波数帯域ごとに設けられた受話雑音レベル推定部202〜202は、マイク雑音レベル推定部201〜202と同様の処理により、スピーカ出力信号の第2周波数領域変換部103の出力信号から、スピーカ出力信号に含まれる雑音である受話雑音レベルNを推定する。
周波数帯域ごとに設けられたエコーレーベル推定部106〜106は、音響結合量推定部105〜105で求められた音響結合量A(Ω)と、スピーカ出力信号の第2周波数領域変換部103の出力X(Ω)と、受話雑音レベル推定部202〜202で推定された受話雑音レベルN(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。ただし、本実施例で推定するエコーレベルは定常雑音成分を除いたエコーレベルである。
The reception noise level estimation units 202 1 to 202 N provided for each frequency band are processed from the output signal of the second frequency domain conversion unit 103 of the speaker output signal by the same processing as the microphone noise level estimation units 201 1 to 202 N. The reception noise level N R that is noise included in the speaker output signal is estimated.
The echo label estimation units 106 1 to 106 N provided for each frequency band are the acoustic coupling amount A (Ω) obtained by the acoustic coupling amount estimation units 105 1 to 105 N and the second frequency domain conversion of the speaker output signal. The level of echo contained in the microphone received signal is estimated from the output X (Ω) of the unit 103 and the reception noise level N R (Ω) estimated by the reception noise level estimation units 202 1 to 202 N. However, the echo level estimated in this embodiment is an echo level excluding the stationary noise component.

受話信号の周波数スペクトル|X(Ω)|から雑音レベルN(Ω)を減算してから、音響結合量A(Ω)を乗じてエコーレベルR(Ω)を推定する。式(11)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=u・P'(Ω) for {|X(Ω)|-r・NR(Ω)}<0
P(Ω)=|X(Ω)| for P'(Ω)≦ {|X(Ω)|-r・NR(Ω)}≧0
P(Ω)=u・P'(Ω)+(l-u)・{|X(Ω)|-r・NR(Ω)} for P'(Ω)> {|X(Ω)|-r・NR(Ω)}≧0
式(11)
ただし、rは雑音レベルの減算係数であり、あらかじめ固定的に与えられる。標準的には例えばr=1と設定し、より雑音レベルを減算したい場合は1以上の値に設定し、雑音レベルの減算を少なめにしたい場合には1以下に設定する。この他の記号は、本発明の第1の実施例と同様であり、以下のように定義される。P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(反響時間)の想定値を調整するための係数であり、あらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
周波数帯域ごとに設けられたゲイン制御部108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部201〜201で推定されたマイク雑音レベルN(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、雑音が主に含まれる場合は雑音を抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
After the noise level N R (Ω) is subtracted from the frequency spectrum | X (Ω) | of the received signal, the echo level R (Ω) is estimated by multiplying by the acoustic coupling amount A (Ω). The echo level R (Ω) is estimated by the equation (11).
R (Ω) = A (Ω) ・ P (Ω)
P (Ω) = u ・ P '(Ω) for {| X (Ω) | -r ・ N R (Ω)} <0
P (Ω) = | X (Ω) | for P '(Ω) ≦ {| X (Ω) | -r ・ N R (Ω)} ≧ 0
P (Ω) = u ・ P '(Ω) + (lu) ・ {| X (Ω) | -r ・ N R (Ω)} for P'(Ω)> {| X (Ω) | -r ・N R (Ω)} ≧ 0
Formula (11)
Here, r is a noise level subtraction coefficient, which is given fixedly in advance. For example, r = 1 is set as a standard value. If more noise level is desired to be subtracted, the value is set to 1 or more. If less noise level subtraction is desired, the value is set to 1 or less. Other symbols are the same as those in the first embodiment of the present invention, and are defined as follows. P (Ω) is a speaker output signal after time smoothing corresponding to reverberation, P ′ (Ω) is P (Ω) one frame before, and u is the length of reverberation (resonance time). A coefficient for adjusting the assumed value, and a fixed value is set in advance. For example, u has a value of 0 ≦ u <1, and the closer to 1, the longer the reverberation time is simulated, and the closer to 0, the shorter the reverberation time is simulated.
The gain controllers 108 1 to 108 N provided for each frequency band are estimated by the echo level R (Ω) estimated by the echo level estimators 106 1 to 106 N and the microphone level estimators 107 1 to 107 N. From the microphone level S (Ω) and the microphone noise level N S (Ω) estimated by the microphone noise level estimation units 201 1 to 201 N , the gain for each band given to the microphone reception signal is controlled. The gain control suppresses echo when the microphone reception signal contains a lot of echo components, suppresses noise when noise is mainly included, and passes near-end speaker speech otherwise. To be done.

まず、マイク受音信号にエコー成分が多く含まれる場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め定めた固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(12)で表される。
S(Ω)≦C・R(Ω) 式(12)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時エコー抑圧ゲインg(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D≦1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時エコー抑圧利得係数g(Ω)を例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(13)となる。
gE(Ω)=D for S(Ω)≦C・R(Ω)
gE(Ω)=1 for S(Ω)>C・R(Ω) 式(13)
First, when the microphone received signal contains many echo components, the estimated echo level R (Ω) and the estimated microphone level S (Ω) are close to each other. For example, when the estimated microphone level S (Ω) is smaller than a value obtained by multiplying a fixed coefficient C of 1 or more, the period is detected as a period in which many echo components are included. This condition is expressed by equation (12).
S (Ω) ≦ C ・ R (Ω) Formula (12)
If it is detected as a period in which many echo components are included, the instantaneous echo suppression gain g E (Ω) in that band is set to an echo suppression amount D set in advance as a fixed value. However, the echo suppression amount D takes a value of 0 ≦ D ≦ 1, for example, and the smaller the value, the more the echo suppression amount increases, but the deterioration of the near-end speaker voice during double talk increases. Next, when it is not detected as a period in which many echo components are included, since the echo components are small, the instantaneous echo suppression gain coefficient g E (Ω) is set to 1, for example, and the microphone sound reception signal is passed as it is. If this gain control is expressed by an equation, equation (13) is obtained.
g E (Ω) = D for S (Ω) ≦ C ・ R (Ω)
g E (Ω) = 1 for S (Ω)> C ・ R (Ω) Equation (13)

次に、マイク受音信号に雑音成分が多く含まれる場合、推定雑音レベルN(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定雑音レベルN(Ω)に予め定めた固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(14)で表される。
S(Ω)≦CN・NS(Ω) 式(14)
雑音成分が多く含まれる期間として検出されたら、その帯域の瞬時雑音抑圧利得係数g(Ω)を、あらかじめ固定値として設定した雑音抑圧量Dに設定する。ただし、雑音抑圧量Dは0≦D≦1の値をとり、小さい値にするほど雑音抑圧量が増加するが、近端話者音声の劣化が増大する。次に、雑音成分が多く含まれている期間として検出されなかった場合は、雑音成分が小さいので、瞬時雑音抑圧利得係数g(Ω)を予め定めた固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(15)となる。
gN(Ω)=DN for S(Ω)≦CN・NS(Ω)
gN(Ω)=1 for S(Ω)>CN・NS(Ω) 式(15)
以上により求められた瞬時エコー抑圧利得係数g(Ω)と瞬時雑音抑圧利得係数g(Ω)のうち小さい方を瞬時雑音利得係数g(Ω)に設定する。これは式(16)により表される。
g(Ω)=MIN{gE(Ω),gN(Ω)} 式(16)
ただし、MIN{A,B}はAの値とBの値のうち小さい方を選択するということを意味する。
Then, if it contains many noise components in microphone received sound signals, the estimated noise level N S (Ω) and the estimated microphone level S (Omega) takes a value close, predetermined on the estimated noise level N S (Ω) fixed value, for example, than a value obtained by multiplying one or more fixed coefficients C N, when the estimated microphone level S (Omega) is small is detected as a period that includes many echo component. This condition is expressed by equation (14).
S (Ω) ≦ C N · N S (Ω) Equation (14)
When it is detected as a period that includes many noise components, the bandwidth of the instantaneous noise suppression gain factor g E a (Omega), it sets the noise suppression quantity D N set in advance as a fixed value. However, the noise suppression quantity D N takes a value of 0 ≦ D ≦ 1, although the noise suppression amount is increased enough to lower the value, increases the deterioration of the near-end speaker's speech. Next, when it is not detected as a period in which many noise components are included, the noise components are small, so the instantaneous noise suppression gain coefficient g N (Ω) is set to a predetermined fixed value, for example, 1, and the microphone The received sound signal is passed as it is. If this gain control is expressed by an equation, equation (15) is obtained.
g N (Ω) = D N for S (Ω) ≦ C N・ N S (Ω)
g N (Ω) = 1 for S (Ω)> C N · N S (Ω) Equation (15)
The smaller one of the instantaneous echo suppression gain coefficient g E (Ω) and the instantaneous noise suppression gain coefficient g N (Ω) obtained as described above is set as the instantaneous noise gain coefficient g (Ω). This is represented by equation (16).
g (Ω) = MIN {g E (Ω), g N (Ω)} Equation (16)
However, MIN {A, B} means that the smaller one of A and B is selected.

次に、本発明の実施例1と同様にして、瞬時利得係数g(Ω)を時間平滑化して、ゲインG(Ω)を求める。
また、本発明の実施例1と同様にして、複数のエコー抑圧量と雑音抑圧量を設定することもできる。エコー成分が多く含まれる期間を検出するための固定係数CをK個のC〜Cとし、推定エコーレベルR(Ω)にこれらの係数C〜Cを乗じた値と、マイクレベルS(Ω)の値を比較して、エコー抑圧量D〜Dを、瞬時エコー抑圧利得係数g(Ω)に設定する。これを式で表せば式(17)となる。
gE(Ω)=DK for S(Ω)≦CK・R(Ω)
gE(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
gE(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
gE(Ω)=1 1 for S(Ω)>C1・R(Ω) 式(17)
瞬時雑音抑圧利得係数gN(Ω)も同様に、雑音成分が多く含まれる期間を検出するための固定係数CをJ個の係数DN,1〜DN,Jを、瞬時エコー抑圧利得係数g(Ω)に設定する。これを式で表せば式(18)となる。
gN(Ω)=DN,J for S(Ω)≦CN,J・NS(Ω)
gN(Ω)=DN,J-1 for CN,J・NS(Ω)<S(Ω)≦CN,J-1・NS(Ω)
: :
gN(Ω)=DN,1 for CN,2・NS(Ω)<S(Ω)≦CN,1・NS(Ω)
gN(Ω)=1 for S(Ω)>CN,1・NS(Ω) 式(18)
だたし、固定係数C1〜CKおよびCN,1〜CN,Jは、それぞれ1以上の値をとり、係数の大小関係はC1>C>…>CまたはCN,1>CN,2>…>CN,Jとなるように、あらかじめ固定値を設定する。エコー抑圧量D1〜DKと雑音抑圧量DN,1〜DN,Jは、それぞれ0≦D≦1、0≦DN,J≦1の値をとり、その大小関係はD1>D>…>DまたはDN,1>DN,2>…>DN,Jとなるようにあらかじめ固定値を設定する。次に、瞬時エコー抑圧利得係数g(Ω)のうち小さい方を選択し瞬時利得係数g(Ω)とし、この瞬時利得係数g(Ω)を時間平均化してゲインG(Ω)を求める。時間平滑化は、第1の実施例と同様にして行われる。このように、複数のエコー抑圧量と雑音抑圧量を設定することで、マイク受音信号に含まれるエコー成分や雑音成分の割合により、エコーまたは雑音抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコーや雑音抑圧量を上げても、通話品質を保つことが可能となる。
これら以外の部分については、本発明の実施例1と同様であるので説明を省略する。
以上示したように、本実施例2によれば、本発明の第1実施例の効果に加えて、空調やファンの音などの定常的な雑音を抑圧することができる。
Next, as in the first embodiment of the present invention, the instantaneous gain coefficient g (Ω) is time-smoothed to obtain the gain G (Ω).
Also, a plurality of echo suppression amounts and noise suppression amounts can be set in the same manner as in the first embodiment of the present invention. A fixed coefficient C for detecting a period in which a lot of echo components are included is set to K C 1 to C K, and a value obtained by multiplying the estimated echo level R (Ω) by these coefficients C 1 to C K and a microphone level By comparing the values of S (Ω), the echo suppression amounts D 1 to D K are set to the instantaneous echo suppression gain coefficient g E (Ω). If this is expressed by an equation, equation (17) is obtained.
g E (Ω) = D K for S (Ω) ≦ C K・ R (Ω)
g E (Ω) = D K-1 for C K・ R (Ω) <S (Ω) ≦ C K-1・ R (Ω)
::
g E (Ω) = D 1 for C 2・ R (Ω) <S (Ω) ≦ C 1・ R (Ω)
g E (Ω) = 1 1 for S (Ω)> C 1 · R (Ω) Equation (17)
Likewise instantaneous noise suppression gain factor g N (Ω), the coefficient fixed coefficients C N for detecting the period that includes many noise components of the J D N, 1 ~D N, the J, instantaneous echo suppression gain Coefficient g N (Ω) is set. If this is expressed by a formula, formula (18) is obtained.
g N (Ω) = D N, J for S (Ω) ≦ C N, J・ N S (Ω)
g N (Ω) = D N, J-1 for C N, J・ N S (Ω) <S (Ω) ≦ C N, J-1・ N S (Ω)
::
g N (Ω) = D N, 1 for C N, 2・ N S (Ω) <S (Ω) ≦ C N, 1・ N S (Ω)
g N (Ω) = 1 for S (Ω)> C N, 1 · N S (Ω) Equation (18)
However, each of the fixed coefficients C 1 to C K and C N, 1 to C N, J takes a value of 1 or more, and the magnitude relationship between the coefficients is C 1 > C 2 >...> C K or C N, A fixed value is set in advance so that 1 > C N, 2 >...> C N, J. The echo suppression amounts D 1 to D K and the noise suppression amounts D N, 1 to D N, J take values of 0 ≦ D K ≦ 1, 0 ≦ D N and J ≦ 1, respectively, and the magnitude relationship is D 1. > D 2>...> D K or D N, 1> D N, 2>...> D N, sets a previously fixed value such that J. Next, the smaller one of the instantaneous echo suppression gain coefficients g E (Ω) is selected as the instantaneous gain coefficient g (Ω), and the instantaneous gain coefficient g (Ω) is time-averaged to obtain the gain G (Ω). Time smoothing is performed in the same manner as in the first embodiment. In this way, by setting multiple echo suppression amounts and noise suppression amounts, the echo or noise suppression amount can be changed according to the ratio of the echo component and noise component contained in the microphone received signal, and the suppression amount can Even if the echo or noise suppression amount is increased rather than setting in one step as in the technology, the call quality can be maintained.
Since other parts are the same as those of the first embodiment of the present invention, description thereof is omitted.
As described above, according to the second embodiment, in addition to the effects of the first embodiment of the present invention, it is possible to suppress stationary noise such as air conditioning and fan noise.

図3は、本発明の第3の実施例であるエコー抑圧装置300のブロック図である。
本実施例のエコー抑圧装置300は、本発明の第1または第2の実施例に、周波数特性平滑部301を追加した構成である。本実施例は、ゲインの周波数特性を周波数軸で平滑化することで、不連続な周波数特性を軽減し、より自然な音質を実現する。
周波数特性平滑部は、ゲイン制御部1081〜108で設定されたゲインG(Ω)を周波数軸で平滑化する。平滑化は例えば式(19)により行われる。
G'(ωi)=α・G'(ωj-1)+(1-α)・G(ωj) 式(19)
ただし、G'(ωj)は、平滑化後のゲインであり、αは平滑係数で、あらかじめ固定値が設定される。αは例えば0≦α<1の値をとり、1に近いほど、より強い平滑化となる。
この周波数特性の平滑化により、音質の不自然さの原因となるゲインの不連続な周波数特性を軽減し、音質を向上させることができる。
これ以外の部分に関しては本発明の第1または第2の実施例と同様であるので説明を省略する。
以上、示したように本実施例3によれば、本発明の第1または第2の実施例の効果に加えて、不連続な周波数特性を軽減し、より自然な音質を実現することができる。
FIG. 3 is a block diagram of an echo suppression apparatus 300 according to the third embodiment of the present invention.
The echo suppression apparatus 300 of the present embodiment has a configuration in which a frequency characteristic smoothing unit 301 is added to the first or second embodiment of the present invention. In this embodiment, the frequency characteristics of the gain are smoothed on the frequency axis, thereby reducing the discontinuous frequency characteristics and realizing a more natural sound quality.
The frequency characteristic smoothing unit smoothes the gain G (Ω) set by the gain control units 108 1 to 108 N on the frequency axis. Smoothing is performed by, for example, equation (19).
G ′ (ω i ) = α · G ′ (ω j−1 ) + (1-α) · G (ω j ) (19)
However, G ′ (ω j ) is a gain after smoothing, α is a smoothing coefficient, and a fixed value is set in advance. α takes a value of 0 ≦ α <1, for example, and the closer to 1, the stronger the smoothing.
By smoothing the frequency characteristics, it is possible to reduce the discontinuous frequency characteristics of the gain that cause unnatural sound quality, and to improve the sound quality.
Since other parts are the same as those of the first or second embodiment of the present invention, description thereof will be omitted.
As described above, according to the third embodiment, in addition to the effects of the first or second embodiment of the present invention, discontinuous frequency characteristics can be reduced, and more natural sound quality can be realized. .

図4は、本発明の第4の実施例であるエコー抑圧装置400のブロック図である。本発明の第4の実施例は、本発明の第1〜3の実施例にマイク受音信号の第1帯域分割変換部401と、スピーカ出力信号の帯域分割変換部402と、ゲインの帯域数変換部403が新たに設けられ、音響結合量推定部105〜105N’と、エコーレベル推定部106〜106N’と、マイクレベル推定部107〜107N’と、ゲイン制御部108〜108N’と、マイク雑音レベル推定部201〜201N’と、受話雑音レベル推定部202〜202N’の個数が、変換後の帯域分割数N’となった構成である。
マイク受音信号の帯域分割変換部401は、マイク受音信号の第1周波数領域変換部101の出力信号である周波数領域変換後のマイク受音信号Y(Ω)の帯域分割数をNからN’に変換する。ただし、N’はN未満の整数であり、変換後のY(Ω)をY’(Ω’)とする。
変換は、変換前の複数の帯域を1つの帯域にまとめることにより行われ、例えばΩ=ωn,…,ωmの範囲のI個の帯域を、1つの帯域Ω’に変換するときには、変換前の複数の帯域の振幅の平均値を、変換後の振幅とする。平均値は、式(20)または式(21)により計算される。

Figure 2008005094
スピーカ出力信号の帯域分割数変換部402は、マイク受音信号の帯域分割数変換部401と同様の処理により、スピーカ出力信号の第2周波数領域変換部103の出力信号である周波数領域変換後のスピーカ出力信号X(Ω)の帯域分割数をNからN’に変換する。
音響結合量推定部105〜105N’と、エコーレベル推定部106〜106N’と、マイクレベル推定部107〜107N’と、ゲイン制御部108〜108N’と、マイク雑音レベル推定部201〜201N’と、受話雑音レベル推定部202〜202N’は、変換後の帯域分割数N’と同数あり、それぞれ帯域分割数変換後の信号を入力として、本発明の第1〜3の実施例と同様の処理を行う。 FIG. 4 is a block diagram of an echo suppression apparatus 400 according to the fourth embodiment of the present invention. The fourth embodiment of the present invention is similar to the first to third embodiments of the present invention in that the first band division conversion unit 401 for the microphone sound reception signal, the band division conversion unit 402 for the speaker output signal, and the number of gain bands A conversion unit 403 is newly provided, acoustic coupling amount estimation units 105 1 to 105 N ′ , echo level estimation units 106 1 to 106 N ′ , microphone level estimation units 107 1 to 107 N ′ , and gain control unit 108. 1 to 108 N ′ , microphone noise level estimators 201 1 to 201 N ′ , and reception noise level estimators 202 1 to 202 N ′ are the number of band division numbers N ′ after conversion.
The microphone reception signal band division conversion unit 401 changes the frequency division number of the microphone reception signal Y (Ω) after the frequency domain conversion, which is the output signal of the first frequency domain conversion unit 101 of the microphone reception signal, from N to N. Convert to '. However, N ′ is an integer less than N, and Y (Ω) after conversion is Y ′ (Ω ′).
The conversion is performed by combining a plurality of bands before conversion into one band. For example, when converting I bands in a range of Ω = ωn,..., Ωm into one band Ω ′, The average value of the amplitudes of a plurality of bands is set as the converted amplitude. The average value is calculated by equation (20) or equation (21).
Figure 2008005094
The speaker output signal band division number conversion unit 402 performs processing similar to that performed by the microphone sound reception signal band division number conversion unit 401 after frequency domain conversion, which is the output signal of the second frequency domain conversion unit 103 of the speaker output signal. The number of band divisions of the speaker output signal X (Ω) is converted from N to N ′.
Acoustic coupling amount estimation units 105 1 to 105 N ′ , echo level estimation units 106 1 to 106 N ′ , microphone level estimation units 107 1 to 107 N ′ , gain control units 108 1 to 108 N ′ , and microphone noise level estimating unit 'and, receiving the noise level estimator 202 1 ~202 N' 201 1 ~201 N is located the same number as the number of subbands N 'after the conversion, as an input signal after band-dividing number conversion respectively, the present invention The same processing as in the first to third embodiments is performed.

ゲインの帯域分割数変換部403は、ゲイン制御部108〜108N’の出力であるN’帯域のゲインを周波数領域変換部の帯域分割数Nのゲインに変換する。変換は変換前の1つの帯域を複数の帯域に分割するようにして行われる。例えば帯域Ω’を、Ω=ωn,…,ωmのI個の帯域に分割する場合、変換前の帯域Ω’のゲイン値を、変換後のI個の帯域Ω=ωn,…,ωmのゲイン値とする。
周波数特性平滑化部301を有さない実施例に適用する場合には、ゲイン乗算部104〜104とは、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
周波数特性平滑化部301を有する実施例に適用する場合には、周波数特性平滑化部301は、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
これら以外の部分については、本発明の第1〜3の実施例と同様であるので、説明を省略する。
以上示したように、本実施例によれば、本発明の第1〜3の実施例の効果に加えて、帯域分割数を一部の処理で少なくすることで、演算量の削減を行うことができる。
The gain band division number conversion unit 403 converts the gain of the N ′ band, which is the output of the gain control units 108 1 to 108 N ′ , into the gain of the band division number N of the frequency domain conversion unit. The conversion is performed by dividing one band before conversion into a plurality of bands. For example, when the band Ω ′ is divided into I bands of Ω = ωn,..., Ωm, the gain value of the band Ω ′ before conversion is set to the gain of the I bands Ω = ωn,. Value.
When applied to an embodiment that does not have the frequency characteristic smoothing unit 301, the gain multiplication units 104 1 to 104 N receive the gain values obtained by converting the band division number by the gain band division number conversion unit 403. And the same processing as in the first to third embodiments of the present invention is performed.
When applied to the embodiment having the frequency characteristic smoothing unit 301, the frequency characteristic smoothing unit 301 receives the gain value obtained by converting the band division number by the gain band division number conversion unit 403 as an input, and The same processing as in the first to third embodiments is performed.
Since other parts are the same as those in the first to third embodiments of the present invention, description thereof is omitted.
As described above, according to the present embodiment, in addition to the effects of the first to third embodiments of the present invention, the amount of calculation can be reduced by reducing the number of band divisions in some processes. Can do.

図5は、本発明の第5の実施例であるエコー抑圧装置のエコーレベル推定部を示す図である。
本実施例のエコー抑圧装置は、本発明の第1〜第4の実施例に含まれるエコーレベル推定部106(i=1,…,N)が、図5に示すような複数個の残響時間に対応したエコーレベル計算部106i,1〜106i,Mから構成されることを特徴とする。複数個の残響時間を想定して、複数のエコーレベルR(Ω)〜R(Ω)を推定することで、残響時間に応じたエコー抑圧量を設定することができる。
エコーレベル推定部106(i=1,…,N)は本発明の第1〜第4の実施例のエコーレベル推定部106〜106と同様にしてエコーレベルを推定する。ただし、反響の長さ(残響時間)の想定値を調整するための係数uの値をM個(u〜u)設定し、各エコーレベル計算部106i,1〜106i,Mで、各残響時間を想定した場合のエコーレベルR(Ω)〜R(Ω)を計算する。
周波数帯域ごとに設けられたゲイン制御部108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)〜R(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部で201〜201で推定されたマイク雑音レベルN(Ω)から、マイクレベル受音信号に与える帯域ごとのゲインを制御する。瞬時雑音抑圧利得係数g(Ω)は、本発明の第1〜第4の実施例と同様にして求められる。瞬時エコー抑圧利得係数も本発明の第1〜第4の実施例と同様にして求められるが、複数の残響時間を想定した複数の推定エコーレベルR(Ω)〜R(Ω)の、各々に対して瞬時エコー抑圧利得係数gE,1(Ω)〜gE,M(Ω)が求められる。これらの瞬時エコー抑圧利得係数と瞬時雑音抑圧利得係数のうち最も利得値が小さいものを最小利得選択部108−1で選択し、選択した利得係数を瞬時抑圧利得係数g(Ω)とし、この瞬時抑圧利得係数g(Ω)を(実施例1〜4と同様に)時間平滑部108−2で時間平滑し、ゲイン乗算部104〜104に出力する。
FIG. 5 is a diagram showing an echo level estimator of an echo suppressor that is the fifth embodiment of the present invention.
In the echo suppression apparatus of this embodiment, the echo level estimation unit 106 i (i = 1,..., N) included in the first to fourth embodiments of the present invention has a plurality of reverberations as shown in FIG. It is characterized by comprising echo level calculation units 106 i, 1 to 106 i, M corresponding to time. By assuming a plurality of reverberation times and estimating a plurality of echo levels R 1 (Ω) to R M (Ω), an echo suppression amount corresponding to the reverberation time can be set.
The echo level estimation unit 106 i (i = 1,..., N) estimates the echo level in the same manner as the echo level estimation units 106 1 to 106 N according to the first to fourth embodiments of the present invention. However, M values (u 1 to u M ) are set as coefficients u for adjusting the expected value of reverberation length (reverberation time), and each echo level calculation unit 106 i, 1 to 106 i, M The echo levels R 1 (Ω) to R M (Ω) are calculated when each reverberation time is assumed.
The gain control units 108 i to 108 N provided for each frequency band include echo levels R 1 (Ω) to R M (Ω) estimated by the echo level estimation units 106 i to 106 N and a microphone level estimation unit 107. and i to 107 N in the estimated microphone level S (Omega), the microphone noise level estimation unit 201 i ~201 microphone noise level estimated by the N N S (Ω), each band providing the microphone level received sound signal To control the gain. The instantaneous noise suppression gain coefficient g N (Ω) is obtained in the same manner as in the first to fourth embodiments of the present invention. Instantaneous echo suppression gain coefficients are also obtained in the same manner as in the first to fourth embodiments of the present invention, but a plurality of estimated echo levels R 1 (Ω) to R M (Ω) assuming a plurality of reverberation times, For each, an instantaneous echo suppression gain coefficient g E, 1 (Ω) to g E, M (Ω) is obtained. Among these instantaneous echo suppression gain coefficients and instantaneous noise suppression gain coefficients, the smallest gain value is selected by the minimum gain selection section 108-1, and the selected gain coefficient is set as the instantaneous suppression gain coefficient g (Ω). suppression gain factor g of (Omega) (as in examples 1 to 4) time smoothing unit time smoothing with 108-2, and outputs the gain multiplication unit 104 1 -104 N.

ここで、エコー抑圧量の設定値D,D〜Dは、想定残響時間ごとに設定される。一般にエコーの大きさは、部屋の残響特性により時間とともに指数関数的に減衰する。このことから、想定残響時間が短いものほど、高いエコー抑圧量を設定し、残響時間がながいほどエコー抑圧量を減らすことで、残響に対して一定の残響エコーレベルとすることができる。これにより、エコーの過度な消去をなくし、近端話者の音声の劣化を最小限とすることができる。
また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに全帯域一括してゲイン制御することもできる。この場合も実施例1と同様に、式(9)で示したように複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定でするのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
Here, the set values D and D 1 to D K of the echo suppression amount are set for each assumed reverberation time. In general, the magnitude of echo attenuates exponentially with time due to the reverberation characteristics of the room. Therefore, a higher echo suppression amount is set as the expected reverberation time is shorter, and the echo suppression amount is decreased as the reverberation time is shorter, so that a constant reverberation echo level can be obtained with respect to reverberation. This eliminates excessive cancellation of echoes and minimizes near-end speaker speech degradation.
Further, in this embodiment, the first frequency domain conversion unit 101, the reverse frequency domain conversion unit 102, and the second frequency domain conversion unit 103 of the speaker output signal are deleted without performing the frequency domain conversion. It is also possible to perform gain control for all bands at once. Also in this case, as in the first embodiment, by setting a plurality of echo suppression amounts as shown in the equation (9), the echo suppression amount can be changed depending on the ratio of the echo component included in the microphone received signal. As compared with the case where the suppression amount is set in one step as in the conventional echo suppression device, the call quality during double talk can be maintained even if the echo suppression amount is increased.

これら以外の部分については、本発明の第1〜第4の実施例と同様であるので説明を省略する。
以上示したように、本実施例5によれば、本発明の第1〜第4の実施例の効果に加えて、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
以上各実施例で説明した本発明によるエコー抑圧装置はコンピュータが解読可能なプログラム言語によって記述されたエコー抑圧プログラムをコンピュータにインストールし、コンピュータに備えられたCPUに解読させることにより上述したエコー抑圧装置として機能し、本発明によるエコー抑圧方法が実行される。
本発明によるエコー抑圧プログラムはコンピュータが読み取り可能な例えば磁気ディスク或いはCD−ROM、半導体メモリ等の記録媒体に記録される。コンピュータにはこれらの記録媒体からインストールするか、又は通信回線を通じてインストールすることができる。
Since other parts are the same as those in the first to fourth embodiments of the present invention, description thereof will be omitted.
As described above, according to the fifth embodiment, in addition to the effects of the first to fourth embodiments of the present invention, the near-end talk is performed while suppressing the echo sufficiently even in an environment with a long reverberation time. The voice degradation of the person can be minimized.
The echo suppressor according to the present invention described in each of the above embodiments is an echo suppressor described above by installing an echo suppression program described in a computer-readable program language in a computer and causing a CPU provided in the computer to decode the program. And the echo suppression method according to the present invention is executed.
The echo suppression program according to the present invention is recorded in a computer-readable recording medium such as a magnetic disk, CD-ROM, or semiconductor memory. The computer can be installed from these recording media or can be installed through a communication line.

本発明によるエコー抑圧方法、装置はテレビ会議システム或いは音声会議システムのようなハンズフリー通信の分野で活用される。   The echo suppression method and apparatus according to the present invention is utilized in the field of hands-free communication such as a video conference system or an audio conference system.

本発明の第1の実施例であるエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the echo suppression apparatus which is the 1st Example of this invention. 本発明の第2の実施例であるエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the echo suppression apparatus which is the 2nd Example of this invention. 本発明の第3の実施例であるエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the echo suppression apparatus which is the 3rd Example of this invention. 本発明の第4の実施例であるエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the echo suppression apparatus which is the 4th Example of this invention. 本発明の第5の実施例であるエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the echo suppression apparatus which is the 5th Example of this invention. Aはエコー抑圧装置通過前の挿受話音声スペクトルを示す図、Bは従来のエコー抑圧装置通過後の送話音声スペクトルを示す図、Cは本発明のエコー抑圧装置通過後の送話音声スペクトルを示す図である。A is a diagram showing an inserted / received speech spectrum before passing through the echo suppressor, B is a diagram showing a transmitted speech spectrum after passing through the conventional echo suppressor, and C is a transmitted speech spectrum after passing through the echo suppressor of the present invention. FIG. 本発明によるエコー抑圧装置の使い方を説明するための図。The figure for demonstrating the usage of the echo suppression apparatus by this invention. 従来のエコー抑圧装置を説明するためのブロック図。The block diagram for demonstrating the conventional echo suppression apparatus.

符号の説明Explanation of symbols

101 第1周波数領域変換部
102 逆周波数領域変換部
103 第2周波数領域変換部
104〜104 ゲイン乗算部
105〜105 音響結合量推定部
106〜106 エコーレベル推定部
107〜107 マイクレベル推定部
108〜108 ゲイン制御部
201〜201 マイク雑音レベル推定部
202〜202 受話雑音レベル推定部
301 周波数特性平滑化部
401〜403 帯域分割数変換部
101 1st frequency domain transforming unit 102 Inverse frequency domain transforming unit 103 2nd frequency domain transforming unit 104 1 to 104 N gain multiplication unit 105 1 to 105 N acoustic coupling amount estimation unit 106 1 to 106 N echo level estimation unit
107 1 to 107 N microphone level estimation unit 108 1 to 108 N gain control unit 201 1 to 201 N microphone noise level estimation unit 202 1 to 202 N reception noise level estimation unit 301 frequency characteristic smoothing unit 401 to 403 Band division number conversion Part

Claims (16)

マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換処理と、
スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、
前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、
前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、
前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、
前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、
前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、
前記ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理と、
を含むことを特徴とするエコー抑圧方法。
A first frequency domain conversion process for converting a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components;
A second frequency domain conversion process for converting the speaker output signal into a frequency domain signal composed of N frequency domain components;
From the ratio of the microphone sound signal converted to the frequency domain signal and the speaker output signal converted to the frequency domain signal, the acoustic coupling amount, which is the amplitude value of the transfer function between the speaker and the microphone, is determined for each frequency domain. Acoustic coupling amount estimation processing to be estimated;
The speaker output signal converted into the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain a time smoothing level, and this time smoothing level is multiplied by the acoustic coupling amount and included in the microphone sound reception signal. Echo level estimation processing for estimating the level of echo components to be generated for each frequency band,
A microphone level estimation process for calculating a time smoothing level of the microphone reception signal converted into the frequency domain signal and estimating a microphone level for each frequency band;
The estimated echo level is compared with the estimated microphone level, and a gain value with a large suppression amount is set as the estimated echo level increases. When the estimated echo level is sufficiently small, a preset fixed gain value is set for each frequency band. Gain control processing to be set to
Gain multiplication processing for multiplying the microphone sound signal converted into the frequency domain signal by the gain value set in the gain control processing for each frequency band;
An inverse frequency domain transform process for performing an inverse frequency domain transform on the output signal multiplied by the gain multiplication process, and outputting as a transmission signal;
Including an echo suppression method.
請求項1記載のエコー抑圧方法において、前記周波数帯域毎に施される前記ゲイン制御処理は、前記推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、前記推定マイクレベルとを比較し、前記推定マイクレベルが前記閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。   2. The echo suppression method according to claim 1, wherein the gain control processing performed for each frequency band compares a threshold obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level. When the estimated microphone level is smaller than the threshold value, a preset echo suppression gain is used as an instantaneous gain coefficient value. In other cases, a preset fixed value is used as an instantaneous gain coefficient value. An echo suppression method, wherein a time-smoothed value is set for each frequency band as a gain value used in the gain multiplication process. 請求項1に記載のエコー抑圧方法において、前記推定エコーレベルに予め設定した固定係数を乗じて求めた複数の閾値と、前記推定マイクレベルとをそれぞれ比較し、前記推定マイクレベルが何れかの閾値よりも小さい場合は、前記推定マイクレベル以上の値を持つ閾値のうち最も前記推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数値と定め、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これら瞬時利得係数値を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。   The echo suppression method according to claim 1, wherein a plurality of threshold values obtained by multiplying the estimated echo level by a preset fixed coefficient are compared with the estimated microphone level, respectively, and the estimated microphone level is any threshold value. Is smaller than the estimated microphone level, a preset echo suppression gain corresponding to a threshold having a value closest to the estimated microphone level is determined as an instantaneous gain coefficient value, In this case, an echo suppression method characterized in that a fixed value set in advance is used as an instantaneous gain coefficient value, and a value obtained by time-smoothing these instantaneous gain coefficient values is set as a gain value used in the gain multiplication processing for each frequency band. 請求項1乃至3の何れかに記載のエコー抑圧方法において、前記周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定処理と、
前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、
前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、
前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。
The echo suppression method according to any one of claims 1 to 3, wherein a microphone noise is estimated for each frequency domain from a microphone reception signal converted into the frequency domain signal. Level estimation process,
From the speaker output signal converted into the frequency domain signal, a reception noise level estimation process for estimating the level of stationary noise included in the speaker output signal for each frequency band;
Estimating an echo component included in the microphone sound reception signal by multiplying the time smoothing level of the signal obtained by subtracting the stationary noise level included in the speaker output signal from the speaker output signal converted into the frequency domain signal by the acoustic coupling amount Echo level estimation processing for estimating the echo level for each frequency band;
A value obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level are compared. If the estimated echo level is large, a preset echo suppression gain is set as an instantaneous echo suppression gain coefficient value. In this case, a preset fixed value is used as an instantaneous echo suppression gain coefficient value, and a value obtained by multiplying a stationary noise level included in the microphone received signal by a preset fixed coefficient is compared with the estimated microphone level. If the level is high, the noise suppression gain is set to a preset instantaneous noise suppression gain coefficient value. Otherwise, the preset fixed value is set to the instantaneous noise suppression gain coefficient value, and the instantaneous echo suppression gain coefficient value and the instantaneous noise are set. The smallest value among the suppression gain coefficient values is used as the instantaneous gain coefficient value, and the gain obtained by using the time-smoothed value of the instantaneous gain coefficient value in the gain multiplication process. Echo suppressing method and setting for each frequency band as.
請求項1乃至5の何れかに記載のエコー抑圧方法において、前記周波数帯域毎に施されるゲイン制御処理の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化処理を付加し、前記周波数帯域毎に施されるゲイン乗算処理は、前記周波数領域に変換されたマイク受音信号に前記周波数特性平滑化処理において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とするエコー抑圧方法。   The echo suppression method according to any one of claims 1 to 5, further comprising: a frequency characteristic smoothing process for smoothing a gain value as an output of a gain control process performed for each frequency band on a frequency axis, The gain multiplication process performed for each frequency band is characterized in that the microphone sound signal converted into the frequency domain is multiplied for each frequency band by the gain value smoothed in the frequency characteristic smoothing process. Echo suppression method. 請求項1乃至4の何れかに記載のエコー抑圧方法において、前記スピーカ出力信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換処理と、
前記マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、
前記ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、
前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧方法。
5. The echo suppression method according to claim 1, wherein a speaker signal having N frequency components converted into a frequency domain signal by frequency domain conversion processing of the speaker output signal is equal to or greater than 2 and less than N. 'Band division number conversion processing of speaker output signal to convert into speaker output signal of frequency components,
Band division of microphone sound reception signal for converting microphone sound reception signal of N frequency components converted to frequency domain signal by frequency domain conversion processing of the microphone sound reception signal into microphone sound reception signal of N ′ frequency components Number conversion processing,
A gain band division number conversion process for converting the gain values of N ′ frequency bands, which are the outputs of the gain control process, into gain values of N frequency bands;
An echo suppression method characterized in that the processing performed for each of the N frequency bands is performed for each of N ′ frequency bands after the band division number conversion.
請求項1乃至6の何れかに記載のエコー抑圧方法において、前記エコーレベル推定処理は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算処理部を有し、
前記周波数帯域ごとに設けられたゲイン制御処理は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧方法。
The echo suppression method according to any one of claims 1 to 6, wherein the echo level estimation processing is performed by performing time smoothing with a time constant corresponding to preset M reverberation times to calculate an echo level. Echo level calculation processing unit,
The gain control processing provided for each frequency band compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to the M reverberation times by a preset fixed coefficient, and the estimated echo level is If it is large, the echo suppression gain set in advance for each reverberation time is used as the instantaneous echo suppression gain coefficient value. Otherwise, a preset fixed value is used as the instantaneous echo suppression gain coefficient value, and M instantaneous echo suppression gain coefficients are used. And comparing the estimated microphone level with a value obtained by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient, and if the noise level is large, the preset noise suppression gain is set to the instantaneous noise level. In other cases, a fixed value set in advance is used as an instantaneous noise suppression gain coefficient value, and the M instantaneous echo suppression gains are set. The smallest value of the coefficient value and the instantaneous noise suppression gain coefficient value is set as an instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set as a gain value used in the gain multiplication processing for each frequency band. An echo suppression method characterized by the above.
マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換部と、
スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、
前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、
前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、
前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、
前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、
前記ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部と、
によって構成することを特徴とするエコー抑圧装置。
A first frequency domain converter that converts a microphone sound reception signal into a frequency domain signal composed of two or more N frequency components;
A second frequency domain converter that converts the speaker output signal into a frequency domain signal composed of N frequency domain components;
From the ratio of the microphone sound signal converted to the frequency domain signal and the speaker output signal converted to the frequency domain signal, the acoustic coupling amount, which is the amplitude value of the transfer function between the speaker and the microphone, is determined for each frequency domain. An acoustic coupling amount estimation unit to be estimated;
The speaker output signal converted into the frequency domain signal is smoothed with a time constant corresponding to a preset reverberation time to obtain a time smoothing level, and this time smoothing level is multiplied by the acoustic coupling amount and included in the microphone sound reception signal. An echo level estimator for estimating the level of echo components to be generated for each frequency band;
A microphone level estimation unit that calculates a time smoothing level of the microphone reception signal converted into the frequency domain signal and estimates a microphone level for each frequency band;
The estimated echo level is compared with the estimated microphone level, and a gain value with a large suppression amount is set as the estimated echo level increases. When the estimated echo level is sufficiently small, a preset fixed gain value is set for each frequency band. A gain control unit to be set to
A gain multiplier that multiplies the microphone sound signal converted into the frequency domain signal by a gain value set by the gain controller for each frequency band;
An inverse frequency domain transform unit that performs an inverse frequency domain transform on the output signal multiplied by the gain multiplier, and outputs the signal as a transmission signal;
An echo suppressor comprising:
請求項8記載のエコー抑圧装置において、前記周波数帯域毎に設けられた前記ゲイン制御部は、前記推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、前記推定マイクレベルとを比較し、前記推定マイクレベルが前記閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算部で用いられるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。   9. The echo suppression apparatus according to claim 8, wherein the gain control unit provided for each frequency band compares a threshold obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level. When the estimated microphone level is smaller than the threshold value, a preset echo suppression gain is used as an instantaneous gain coefficient value. In other cases, a preset fixed value is used as an instantaneous gain coefficient value. An echo suppression apparatus, wherein a time-smoothed value is set for each frequency band as a gain value used in the gain multiplication unit. 請求項8に記載のエコー抑圧装置において、前記推定エコーレベルに予め設定した値が予め設定した固定値以上の複数個の係数を乗じて求めた複数の閾値と、前記推定マイクレベルとをそれぞれ比較し、前記推定マイクレベルが何れかの閾値よりも小さい場合は、前記推定マイクレベル以上の値を持つ閾値のうち最も前記推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数と定め、これ以外の場合には予め設定した固定値を瞬時利得係数とし、これら瞬時利得係数を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。   9. The echo suppression apparatus according to claim 8, wherein the estimated microphone level is compared with a plurality of threshold values obtained by multiplying the estimated echo level by a plurality of coefficients having a preset value equal to or greater than a preset fixed value. When the estimated microphone level is smaller than any threshold, a preset echo suppression gain corresponding to a threshold having a value closest to the estimated microphone level among thresholds having a value equal to or higher than the estimated microphone level Is set as an instantaneous gain coefficient, otherwise a preset fixed value is set as an instantaneous gain coefficient, and a value obtained by time-smoothing these instantaneous gain coefficients is set as a gain value used in the gain multiplication processing for each frequency band. An echo suppressor characterized by. 請求項8乃至10の何れかに記載のエコー抑圧装置において、前記周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定部と、
前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定部と、
前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。
11. The echo suppression apparatus according to claim 8, wherein a microphone noise for estimating a stationary noise level included in a microphone sound reception signal for each frequency domain from the microphone sound reception signal converted into the frequency domain signal. A level estimator;
From the speaker output signal converted into the frequency domain signal, a reception noise level estimation unit that estimates the level of stationary noise included in the speaker output signal for each frequency band;
Estimating an echo component included in the microphone sound reception signal by multiplying the time smoothing level of the signal obtained by subtracting the stationary noise level included in the speaker output signal from the speaker output signal converted into the frequency domain signal by the acoustic coupling amount An echo level estimator for estimating the echo level for each frequency band;
A value obtained by multiplying the estimated echo level by a preset fixed coefficient and the estimated microphone level are compared. If the estimated echo level is large, a preset echo suppression gain is set as an instantaneous echo suppression gain coefficient value. In this case, a preset fixed value is used as an instantaneous echo suppression gain coefficient value, and a value obtained by multiplying a stationary noise level included in the microphone received signal by a preset fixed coefficient is compared with the estimated microphone level. If the level is large, it is set as a preset noise suppression gain instantaneous noise suppression gain coefficient; otherwise, a preset fixed value is set as an instantaneous noise suppression gain coefficient value, and the instantaneous echo suppression gain coefficient value and the instantaneous noise suppression The smallest value among the gain coefficient values is used as the instantaneous gain coefficient value, and a value obtained by smoothing the instantaneous gain coefficient value with time is used in the gain multiplication process. Echo suppressing apparatus characterized by setting for each frequency band by.
請求項8乃至11の何れかに記載のエコー抑圧装置において、前記周波数帯域毎に設けられるゲイン制御部の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化部を付加し、前記周波数帯域毎に設けられたゲイン乗算部は、前記周波数領域信号に変換されたマイク受音信号に前記周波数特性平滑化部において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とするエコー抑圧装置。   12. The echo suppression device according to claim 8, further comprising: a frequency characteristic smoothing unit that smoothes a gain value serving as an output of a gain control unit provided for each frequency band on a frequency axis, and the frequency The gain multiplication unit provided for each band multiplies the microphone sound signal converted into the frequency domain signal by the gain value smoothed by the frequency characteristic smoothing unit for each frequency band. Echo suppression device. 請求項8乃至12の何れかに記載のエコー抑圧装置において、前記スピーカ出力信号の周波数領域変換部で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換部と、
前記マイク受音信号の周波数領域変換部で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換部と、
前記ゲイン制御部の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換部を付加し、
前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧装置。
13. The echo suppression device according to claim 8, wherein N speaker components having N frequency components converted into a frequency domain signal by a frequency domain converter of the speaker output signal are equal to or greater than 2 and less than N. 'Speaker output signal band division number conversion unit for converting into speaker output signal of frequency components,
Band division of a microphone sound reception signal for converting a microphone sound reception signal of N frequency components converted into a frequency domain signal by a frequency domain conversion unit of the microphone sound reception signal into a microphone sound reception signal of N ′ frequency components A number converter,
A gain band division number conversion unit for converting the gain values of N ′ frequency bands, which are the outputs of the gain control unit, into gain values of N frequency bands;
An echo suppressor characterized in that the processing performed for each of the N frequency bands is performed for each N ′ frequency band after the band division number conversion.
請求項8乃至13の何れかに記載のエコー抑圧装置において、前記エコーレベル推定部は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算部を有し、
前記周波数帯域ごとに設けられたゲイン制御部は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算部で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧装置。
14. The echo suppression device according to claim 8, wherein the echo level estimation unit calculates the echo level by performing time smoothing with a time constant corresponding to preset M reverberation times. Have echo level calculators,
The gain controller provided for each frequency band compares the estimated microphone level with a value obtained by multiplying the estimated echo level corresponding to the M reverberation times by a preset fixed coefficient, and the estimated echo level is If it is large, the echo suppression gain set in advance for each reverberation time is used as the instantaneous echo suppression gain coefficient value. Otherwise, a preset fixed value is used as the instantaneous echo suppression gain coefficient value, and M instantaneous echo suppression gain coefficients are used. And comparing the estimated microphone level with a value obtained by multiplying the stationary noise level included in the microphone received signal by a preset fixed coefficient, and if the noise level is large, the preset noise suppression gain is set to the instantaneous noise level. In other cases, a fixed value set in advance is used as an instantaneous noise suppression gain coefficient value, and the M instantaneous echo suppression gains are set. The smallest value among the numerical value and the instantaneous noise suppression gain coefficient value is set as an instantaneous gain coefficient value, and a value obtained by time-smoothing the instantaneous gain coefficient value is set as a gain value used in the gain multiplier for each frequency band. Echo suppression device.
コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項1乃至7記載のエコー抑圧方法を実行させるエコー抑圧プログラム。   An echo suppression program written in a computer-readable program language and causing the computer to execute the echo suppression method according to claim 1. コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項15記載のエコー抑圧プログラムを記録した記録媒体。   A recording medium comprising a computer-readable recording medium, wherein the echo suppression program according to claim 15 is recorded on the recording medium.
JP2006171045A 2006-06-21 2006-06-21 Echo suppression method, apparatus, echo suppression program, recording medium Active JP4413205B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006171045A JP4413205B2 (en) 2006-06-21 2006-06-21 Echo suppression method, apparatus, echo suppression program, recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006171045A JP4413205B2 (en) 2006-06-21 2006-06-21 Echo suppression method, apparatus, echo suppression program, recording medium

Publications (2)

Publication Number Publication Date
JP2008005094A true JP2008005094A (en) 2008-01-10
JP4413205B2 JP4413205B2 (en) 2010-02-10

Family

ID=39009147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006171045A Active JP4413205B2 (en) 2006-06-21 2006-06-21 Echo suppression method, apparatus, echo suppression program, recording medium

Country Status (1)

Country Link
JP (1) JP4413205B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011024163A (en) * 2009-07-21 2011-02-03 Yamaha Corp Echo suppression method and apparatus therefor
JP2011166239A (en) * 2010-02-04 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> Echo canceling method, echo canceler, program thereof and recording medium
JP2016025425A (en) * 2014-07-17 2016-02-08 沖電気工業株式会社 Echo suppression device, echo suppression program, echo suppression method, and communication terminal
JP2017191992A (en) * 2016-04-12 2017-10-19 日本電信電話株式会社 Echo suppressor, method therefor, program, and recording medium
JP2019146129A (en) * 2018-02-23 2019-08-29 リオン株式会社 Reverberation suppression device and hearing aid

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011024163A (en) * 2009-07-21 2011-02-03 Yamaha Corp Echo suppression method and apparatus therefor
JP2011166239A (en) * 2010-02-04 2011-08-25 Nippon Telegr & Teleph Corp <Ntt> Echo canceling method, echo canceler, program thereof and recording medium
JP2016025425A (en) * 2014-07-17 2016-02-08 沖電気工業株式会社 Echo suppression device, echo suppression program, echo suppression method, and communication terminal
JP2017191992A (en) * 2016-04-12 2017-10-19 日本電信電話株式会社 Echo suppressor, method therefor, program, and recording medium
JP2019146129A (en) * 2018-02-23 2019-08-29 リオン株式会社 Reverberation suppression device and hearing aid
JP7264594B2 (en) 2018-02-23 2023-04-25 リオン株式会社 Reverberation suppression device and hearing aid

Also Published As

Publication number Publication date
JP4413205B2 (en) 2010-02-10

Similar Documents

Publication Publication Date Title
JP4954334B2 (en) Apparatus and method for calculating filter coefficients for echo suppression
JP5671147B2 (en) Echo suppression including modeling of late reverberation components
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
JP3727258B2 (en) Echo suppression processing system
US7742592B2 (en) Method and device for removing echo in an audio signal
JP3568922B2 (en) Echo processing device
JP4957810B2 (en) Sound processing apparatus, sound processing method, and sound processing program
JP5391103B2 (en) Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor
JPWO2010035308A1 (en) Echo canceller
JP2012501152A (en) Method for determining updated filter coefficients of an adaptive filter adapted by an LMS algorithm with pre-whitening
JPWO2006046293A1 (en) Noise suppressor
EP2987314B1 (en) Echo suppression
JP2023133472A (en) Background noise estimation using gap confidence
JP3607625B2 (en) Multi-channel echo suppression method, apparatus thereof, program thereof and recording medium thereof
KR101182017B1 (en) Method and Apparatus for removing noise from signals inputted to a plurality of microphones in a portable terminal
JP4413205B2 (en) Echo suppression method, apparatus, echo suppression program, recording medium
JP5662232B2 (en) Echo canceling apparatus, method and program
JP5469564B2 (en) Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof
US8804981B2 (en) Processing audio signals
US8406430B2 (en) Simulated background noise enabled echo canceller
JP4700673B2 (en) Echo cancellation method, apparatus, program, and recording medium
JP2003250193A (en) Echo elimination method, device for executing the method, program and recording medium therefor
JP4383416B2 (en) Howling prevention method, apparatus, program, and recording medium recording this program
JP6143702B2 (en) Echo canceling apparatus, method and program
JP6356087B2 (en) Echo canceling apparatus, method and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4413205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350