JP2004061567A - Noise canceller - Google Patents
Noise canceller Download PDFInfo
- Publication number
- JP2004061567A JP2004061567A JP2002215931A JP2002215931A JP2004061567A JP 2004061567 A JP2004061567 A JP 2004061567A JP 2002215931 A JP2002215931 A JP 2002215931A JP 2002215931 A JP2002215931 A JP 2002215931A JP 2004061567 A JP2004061567 A JP 2004061567A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- attenuation
- frequency domain
- noise ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Noise Elimination (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明はノイズキャンセラに関し、特に据置型電話機、携帯型電話機、音声会議装置等のように音響信号を入力信号として取り扱う装置に用いて好適なノイズキャンセラに関する。
【0002】
【従来の技術】
雑音を含む信号から雑音成分を減衰させ、所望の音声などの信号を取り出す装置は、ノイズキャンセラと呼ばれている。一般的に、背景雑音は白色雑音であり、パワーとしてみた場合すべての周波数領域に対して時間的変動が少ない。これに対し、信号成分は当然時間的パワー変動を持っている。特に、信号成分が音声信号である場合は、瞬間、瞬間をとってみるとひとつの周波数の音とその高調波のみである。従って、比較的容易にノイズキャンセラを構成することができる。
【0003】
しかしながら、近年、据置型電話機や携帯型電話機等において、信号成分として音声信号ばかりでなく、音声信号以外の信号が多く含まれるようになってきており、このために、ノイズキャンセラの構成を根本的に見直す必要が生じてきている。その一つの方法として、雑音を含む信号に対し、周波数分析を行ってスペクトル(スペクトルパワー)を求め、周波数帯域別に時間変動を監視して帯域別信号対雑音比を求め、その信号対雑音(S/N)比に応じて減衰量を計算して、帯域別に減衰させることによって雑音成分を減衰させる方法がある。
【0004】
すなわち、本質的には入力信号のスペクトル成分を刻々と変化させて、入力信号の中に含まれている雑音成分を除去するノイズキャンセラが提案されている。また、特開2000−47697号公報には、減衰量が周波数帯域別に制御されており、時間領域において推定した入力信号の信号対雑音比を信号(音声)含有率と考えて、各周波数帯域の減衰量を計算する際に、帯域別信号対雑音比に加味して減衰量を計算するノイズキャンセラが提案されている。
【0005】
図5に、特開2000−47697号公報に開示されたノイズキャンセラのブロック図を示す。図5を参照すると、このノイズキャンセラは、入力信号aからデータを切り出す窓関数回路3と、この窓関数回路3の出力を周波数領域データに、変換するFFT(Fast Fourier Transform;高速フーリエ変換)回路4と、周波数領域毎に減衰を与える減衰器5と、周波数領域データを時系列データに変換するIFFT(Inverse Fast Fourier Transform;逆高速フーリエ変換)回路6と、IFFT回路6の出力を連続データにつなぎ合わす窓関数オーバラップ回路7とを含んでいる。
【0006】
また、このノイズキャンセラは、入力信号aの信号(音声)成分の含有率を計算する音声含有率計算部9と、減衰器5に与える周波数領域毎の減衰量を計算する減衰量計算部15とを含んで構成されている。
【0007】
以下、音声以外の非雑音信号も、代表して音声あるいは音声信号と表現する。入力データaは窓関数回路3に供給され、連続して入力される信号列の中からFFT4のポイント数個のデータが切り出される。FFT4の入力は時系列順序に並んでいる実時間領域データであり、FFT4にて時間周波数解析処理され、FFTポイント数個の帯域の周波数領域データに変換されて出力cされる。
【0008】
この周波数領域データに対して演算を行うために、減衰量計算部15及び減衰器5は帯域数個分設けられている。周波数領域データは、減衰器5によって、減衰量計算部15にて計算された減衰量に応じてその雑音成分が減衰され、音声成分は減衰されることなく、雑音成分だけが減衰された後、IFFT6において周波数領域データから実時間領域データに変換される。さらに、切り出されている状態のデータは、窓関数オーバラップ回路7によって、連続データにつなぎ合わされて出力bされる。
【0009】
音声含有率計算部9は、入力信号aの信号パワー(変動分)を監視する信号パワー監視器10と、入力信号aの定常パワー(定常分;一定時間以上の平均分)を監視する定常パワー監視器11と、信号パワー監視器10と定常パワー監視器11との出力から、信号対雑音比を計算する信号対雑音比計算器12と、聴覚特性に合わせて対数化する対数計算器13と、音声含有率dなる尺度に変換する音声含有率変換器14とを含んで構成されている。
【0010】
音声含有率計算部9は、時間周波数解析を行う前の入力信号aのパワー変動を常に監視し、入力信号aの信号対雑音比を実時間領域信号のパワー変動速度から推定して、音声含有率dなる尺度に変換する。このとき、音声含有率計算部9は推定した信号対雑音比を聴覚特性に合わせて対数化し、聴感上の信号対雑音比と線形的に対応させる。その後に、音声含有率計算部9は、この対数値から入力信号a中に音声成分が含まれている比率を確率計算し、音声含有率dなる尺度に変換して出力する。
【0011】
音声含有率計算部9の信号パワー監視器10は、入力信号aのパワー変動に対して高速に追従し、実時間領域信号の音声成分のパワーを推定する。定常パワー監視器11は、入力信号aのパワー変動に対して低速にて追従し、実時間領域信号の背景雑音成分のパワーを推定する。信号対雑音比計算器12は、それらのパワー変動から信号対雑音比を計算し、対数計算器13は、信号対雑音比計算器12にて計算された信号対雑音比を対数化する。音声含有率変換器14は、対数計算器13にて対数化された信号対雑音比を音声含有率dに換算し、その音声含有率dを減衰量計算部15の帯域別減衰量計算器20へ出力する。
【0012】
減衰量計算部15は、周波数領域の信号パワーを監視する信号パワー監視器16と、周波数領域の定常パワーを監視する定常パワー監視器17と、信号パワー監視器16と定常パワー監視器17との出力から、信号対雑音比を計算する信号対雑音比計算器18と、計算された信号対雑音比を対数化する対数計算器19と、周波数領域(帯域)別の減衰量を計算する帯域別減衰量計算20とを含んで構成されている。
【0013】
減衰量計算部15は、信号パワー監視器16と定常パワー監視器17とを用いて、すべての周波数領域データのパワー変動を監視する。減衰量計算部15は、周波数領域におけるパワー変動の監視のみでは判断しがたいある帯域の微弱なパワー変動に対して、音声含有率dを音声成分と見なすか、雑音成分と見なすかの判断の一助として、減衰量を計算する。これによって、例えば、音声成分に含まれる倍音成分を損なうことなく、雑音成分の減衰が可能となる。すなわち、減衰量計算部15は実時間信号の信号対雑音比が大きい場合に、音声成分が多く含まれている確率が高いため、微弱なパワー変動を倍音成分が含まれると判断する可能性が高い。
【0014】
また、減衰量計算部15は実時間信号の信号対雑音比が小さい場合に、音声成分が多く含まれている確率が低く、微弱なパワー変動を雑音成分であると判断する可能性が高い。信号パワー監視器16は、周波数領域データcのパワー変動に対して高速に追従し、周波数領域データcの音声成分のパワーを推定する。定常パワー監視器17は、周波数領域データcのパワー変動に対して低速にて追従し、周波数領域データcの背景雑音成分のパワーを推定する。
【0015】
信号対雑音比計算器18は、それらのパワー変動から信号対雑音比を計算し、対数計算器19は、信号対雑音比計算器18にて計算された信号対雑音比を対数化する。帯域別減衰量計算器20は、この対数化された信号対雑音比を基に帯域別に減衰量を計算する。このとき、帯域別減衰量計算器20は、音声含有率変換器14からの音声含有率dを参照パラメータとして用いる。信号対雑音比計算器12,18は、信号パワーを雑音パワーにて割る除算動作を行う。その実現方法は、実際に除算計算を行う方法でも良いし、簡略的に、逆数値が記憶されている変換テーブルを参照しても良い。
【0016】
また、対数計算器13,19の実現方法は、実際に対数計算を行う方法でも良いし、簡略的に、対数値が記憶されている変換テーブルを参照しても良い。帯域別減衰量計算器20が、対数化された信号対雑音比を基に帯域別に減衰量を計算する際、音声含有率dを参照パラメータとして用いることによって正確な帯域別減衰量を設定でき、良好なノイズキャンセラの特性を実現できる。
【0017】
【発明が解決しようとする課題】
特開2000−47697号公報記載のノイズキャンセラは、それなりに良好なノイズキャンセラの特性を実現しているが、より良いものを求める要求はますます強くなってきた。
【0018】
一般に、入力信号に音声成分が存在しない時間(非音声区間)には、入力信号に含まれているのは殆どが背景雑音であると見なせるが、特開2000−47697号公報記載のノイズキャンセラにおいては、この非音声区間においても減衰量を帯域別に計算し常に更新している。従って、非音声区間においても、入力信号のスペクトルを短時間にて変化させて、雑音成分を除去する動作をする。
【0019】
しかしながら、スペクトルを短時間にて刻々と変化させると、背景雑音の持つ音色が変化することになり、「ひゅるひゅる」、「しゅるしゅる」、「きゅるきゅる」といった人工的な音色を生じ、聴感上不自然になる場合がある問題がある。すなわち、音質の悪い携帯電話の様な感じの音色になってしまうことがある。従って、背景雑音を減衰させる処理においては、雑音パワーを減衰させる過程にて雑音の音色は変化させないことが聴感上望ましい。
【0020】
本発明の目的は、背景雑音の音色変化を抑えて、通話品質の優れたノイズキャンセラを提供することである。
【0021】
【課題を解決するための手段】
本発明によるノイズキャンセラは、入力時間領域信号の背景雑音を減衰させるノイズキャンセラであって、前記入力時間領域信号を複数の周波数領域データに変換する時間/周波数領域変換手段と、前記複数の周波数領域データに減衰制御信号にて減衰を与える減衰手段と、前記減衰手段の出力を時間領域信号に変換して出力する周波数/時間領域変換手段と、前記入力時間領域信号の音声含有率を算出する音声含有率算出手段と、前記複数の周波数領域データの信号対雑音比を算出する信号対雑音比算出手段と、前記音声含有率及び前記周波数領域データの信号対雑音比を基に前記減衰制御信号を導出する減衰制御信号導出手段と、前記減衰制御信号を平滑化する平滑手段と、前記音声含有率に応じて前記平滑手段をバイパス制御する制御手段とを含むことを特徴とする。
【0022】
本発明による他のノイズキャンセラは、入力時間領域信号の背景雑音を減衰させるノイズキャンセラであって、前記入力時間領域信号を複数の周波数領域データに変換する時間/周波数領域変換手段と、前記複数の周波数領域データに減衰制御信号にて減衰を与える減衰手段と、前記減衰手段の出力を時間領域信号に変換して出力する周波数/時間領域変換手段と、前記入力時間領域信号の音声含有率を算出する音声含有率算出手段と、前記複数の周波数領域データの信号対雑音比を算出する信号対雑音比算出手段と、前記音声含有率及び前記周波数領域データの信号対雑音比を基に前記減衰制御信号を導出する減衰制御信号導出手段と、前記減衰制御信号を平滑化する平滑手段と、前記複数の周波数領域データからピッチを検出するピッチ検出手段と、前記ピッチ検出結果と前記音声含有率とに応じて前記平滑制御手段を制御する手段とを含むことを特徴とする。
【0023】
本発明の作用は次の通りである。入力信号の時間領域の雑音を減衰させるためのノイズキャンセラにおいて、時間領域信号を周波数領域データに変換して、この周波数領域データにおいて、音声含有率に応じた減衰制御をなすことによりノイズキャンセルを行う場合、この音声含有率が所定値未満の場合には減衰制御信号を平滑化する。他の方法として、周波数領域データからピッチを検出して、このピッチと音声含有率とに応じて減衰制御信号の平滑制御をなすようにする。こうすることによって、背景雑音の音色変化を抑えるものである。
【0024】
【発明の実施の形態】
以下に、本発明の実施例について図面を参照して説明する。図1は本発明によるノイズキャンセラの実施例の構成を示すブロック図であり、図2〜5と同等部分は同一符号にて示している。図1を参照すると、本発明によるノイズキャンセラは、入力(時間領域)信号aからデータを切り出す窓関数回路3と、窓関数回路3の出力を周波数領域データに変換するFFT(Fast Fourier Transform;高速フーリエ変換)回路4と、周波数領域毎に減衰を与える減衰器5と、周波数領域データを時系列(時間領域)データに変換するIFFT(Inverse Fast Fourier Transform;逆高速フーリエ変換)回路6とを含む。
【0025】
さらに、IFFT回路6の出力を連続データにつなぎ合わす窓関数オーバラップ回路7と、入力信号aの信号(音声)成分の含有率を計算する音声含有率計算部9と、減衰器5に与える周波数領域毎の減衰量を計算する減衰量計算部15と、減衰器5に与える周波数領域毎の減衰量を平滑化する平滑器と1、音声含有率計算部9の出力dに、閾値(しきい値)を与えるしきい値回路2とを含んで構成される。
【0026】
本発明の実施例の動作を説明する。なお、以下、音声以外の非雑音信号も代表して音声あるいは音声信号と表現する。
【0027】
図1において、入力(時間領域)データaは窓関数回路3に供給され、連続して入力される信号列の中からFFT4のポイント数個のデータが切り出される。FFT4の入力は時系列順序に並んでいる実時間領域データであり、FFT4により、時間周波数解析処理されてFFTポイント数個の帯域の周波数領域データに変換されて出力cされる。
【0028】
この周波数領域データに対して演算を行うために、減衰量計算部15及び減衰器5は帯域数個分設けられている。周波数領域データは減衰器5によって、減衰量計算部15において計算された減衰量に応じてその雑音成分が減衰され、音声成分は減衰されることなく雑音成分だけが減衰された後、IFFT6にて周波数領域データから実時間領域データに変換される。さらに、切り出されている状態のデータは窓関数オーバラップ回路7によって、連続データにつなぎ合わされて出力bされる。
【0029】
音声含有率計算部9は、入力信号aの信号パワー(変動分)を監視する信号パワー監視器10と、入力信号aの定常パワー(定常分;一定時間以上の平均分)を監視する定常パワー監視器11と、信号パワー監視器10と定常パワー監視器11との出力から信号対雑音比を計算する信号対雑音比計算器12と、聴覚特性に合わせて対数化する対数計算器13と、音声含有率dなる尺度に変換する音声含有率変換器14とを含んで構成されている。
【0030】
音声含有率計算部9は、時間周波数解析を行う前の入力信号aのパワー変動を常に監視し、入力信号aの信号対雑音比を実時間領域信号のパワー変動速度から推定して、音声含有率dなる尺度に変換する。このとき、音声含有率計算部9は推定した信号対雑音比を聴覚特性に合わせて対数化し、聴感上の信号対雑音比と線形的に対応させる。その後に、音声含有率計算部9は、この対数値から入力信号a中に音声成分が含まれている比率を確率計算し、音声含有率dなる尺度に変換して出力する。
【0031】
音声含有率計算部9の信号パワー監視器10は、入力信号aのパワー変動に対して高速に追従し、実時間領域信号の音声成分のパワーを推定する。定常パワー監視器11は、入力信号aのパワー変動に対して低速にて追従し、実時間領域信号の背景雑音成分の(平均)パワーを推定する。信号対雑音比計算器12は、それらのパワー変動から信号対雑音比を計算し、対数計算器13は、信号対雑音比計算器12にて計算された信号対雑音比を対数化する。音声含有率変換器14は、対数計算器13にて対数化された信号対雑音比を音声含有率dに換算し、その音声含有率dを減衰量計算部15の帯域別減衰量計算器20へ出力する。
【0032】
減衰量計算部15は、周波数領域の信号パワーを監視する信号パワー監視器16と、周波数領域の定常パワーを監視する定常パワー監視器17と、信号パワー監視器16と定常パワー監視器17との出力から信号対雑音比を計算する信号対雑音比計算器18と、計算された信号対雑音比を対数化する対数計算器19と、周波数領域(帯域)別の減衰量を計算する帯域別減衰量計算20とを含んで構成されている。
【0033】
減衰量計算部15は、信号パワー監視器16と定常パワー監視器17とを用いて、すべての周波数領域データのパワー変動を監視する。減衰量計算部15は、周波数領域におけるパワー変動の監視のみでは判断しがたいある帯域の微弱なパワー変動に対して、音声含有率dを音声成分と見なすか、雑音成分と見なすかの判断の一助として、減衰量を計算する。これによって、例えば音声成分に含まれる倍音成分を損なうことなく、雑音成分の減衰が可能となる。すなわち、減衰量計算部15は実時間信号の信号対雑音比が大きい場合に、音声成分が多く含まれている確率が高いため、微弱なパワー変動を倍音成分が含まれると判断する可能性が高い。
【0034】
また、減衰量計算部15は実時間信号の信号対雑音比が小さい場合に、音声成分が多く含まれている確率が低く、微弱なパワー変動を雑音成分であると判断する可能性が高い。信号パワー監視器16は、周波数領域データcのパワー変動に対して高速に追従し、周波数領域データcの音声成分のパワーを推定する。定常パワー監視器17は、周波数領域データcのパワー変動に対して低速にて追従し、周波数領域データcの背景雑音成分の(平均)パワーを推定する。
【0035】
信号対雑音比計算器18は、それらのパワー変動から信号対雑音比を計算し、対数計算器19は、信号対雑音比計算器18にて計算された信号対雑音比を対数化する。帯域別減衰量計算器20は、この対数化された信号対雑音比を基に帯域別に減衰量を計算する。このとき、帯域別減衰量計算器20は、音声含有率変換器14からの音声含有率dを参照パラメータとして用いる。
【0036】
信号対雑音比計算器12,18は、信号パワーを雑音パワーにて割る除算動作を行う。その実現方法は、実際に除算計算を行う方法でも良いし、簡略的に、逆数値が記憶されている変換テーブルを参照しても良い。また、対数計算器13,19の実現方法は、実際に対数計算を行う方法でも良いし、簡略的に、対数値が記憶されている変換テーブルを参照しても良い。
【0037】
帯域別減衰量計算器20の出力と減衰器5との間に平滑器1を挿入する。これによって、非音声区間においては減衰量の時間変動を平滑化して、減衰量が急峻に変化しないようにする。また、音声含有率変換器14の出力dをしきい値回路2に供給し、その出力を平滑器1に供給する。しきい値回路2は、閾値(しきい値)以上の値が入力された時には平滑器1の平滑動作を停止(バイパス)させ、閾値未満の値が入力された時には、音声成分が存在しない(背景雑音のみ)として、平滑器1を平滑動作させる働きをする。平滑器1は、信号を滑らかにする働きをする一種のローパスフィルタ(積分器)であり、この様な動作をするものであればどんな回路でも良い。
【0038】
例えば、図3に示すリーク積分器と呼ばれるものが広く知られている。ここでは平滑器1としてリーク積分器を用いたものとして説明する。図3において、リーク積分器は、1サンプル遅延回路33、乗算(一種の増幅)器31,34、加算器32にて構成され、乗算器31,34の乗算係数を用途に合わせて適当に選ぶことにより、適当な積分特性を実現できる。また、この積分特性を利用して信号の平滑化を行い、平滑化回路あるいは簡略的なパワー計算回路として広く用いられる。
【0039】
本発明の他の実施例について図2を参照して説明する。図2において、本発明によるノイズキャンセラは、VAD(Voice Activate Detector: 有音検出器) 8を有し、音声区間と非音声区間とにて減衰量の変化速度を変化させる。音声を所望入力信号とする場合、音声は概ね周期的な信号であり、自己相関を用いて音声の基本周期(ピッチ)を検出することができる。このピッチという情報は、音声区間と非音声区間との判別に用いることができる。この判別機能(装置)をVADと呼ぶ。
【0040】
図2において、本発明によるノイズキャンセラは、図1に比べ、FFT4の出力cを新たに設けたVAD8に供給し、その出力を平滑器1に供給する。VAD8の詳細を図4に示す。図4を参照すると、VAD8は、FFT4の出力c(周波数領域信号)から自己相関を利用してピッチを検出するピッチ検出器21と、ピッチの変動を判定するピッチ変動判定器22とを有している。また、ピッチ変動判定器22は、図1に示されるのと同一(機能)のしきい値回路2と、ピッチの変動を判定するピッチ変動判定器23と、ピッチの範囲を判定するピッチ範囲判定器24と、論理積をとるAND回路25とを有している。
【0041】
一般に、VADの実現方法には様々なものが提案されているが、ここでは、例えば、しきい値回路2において、入力dの時間的パワー変動の緩急を監視する(急激な変化は音声、緩慢な変化は雑音)。さらに、ピッチ変動判定器23において、ピッチの連続性を検証する(音声のピッチの時間変動は連続である)。さらにはまた、ピッチ範囲判定器24において、ピッチの適正検証をする(音声のピッチは或る範囲内にしか存在しない)。
【0042】
これらしきい値回路2、ピッチ変動判定器23、ピッチ範囲判定器24の出力のすべてにおいて、「入力は音声である」と見なした場合に、(論理積25をとって)音声区間と判別するものとする。なお、入力の時間的パワー変動の緩急を監視する部分は音声含有率変換器14の出力dを利用する。また、VAD8が音声区間と判別した時に、平滑器1の平滑動作を停止(バイパス)させ、VAD8が非音声区間と判別した時に、平滑器1を平滑動作させる。
【0043】
【発明の効果】
以上説明したように本発明によれば、信号を減衰させるための制御信号に対する平滑器を設けることによって、雑音成分が多いと思われる区間、すなわち非音声区間では減衰量の変化が緩やかになるという効果がある。従って、非音声区間のノイズキャンセル後のスペクトルも緩やかに変化するため、会話の合間に発生する非音声区間においても、装置使用者に不自然な感じを与えない。
【0044】
また、VADを設けることによって、人間の音声特有の特性を利用して音声区間と非音声区間との判別基準に用い、判別精度を高めることができるという効果がある。すなわち、非音声区間にての減衰量の変化が緩やかになる様に制御して、ノイズキャンセル後のスペクトル変化の低減効果がさらに高められ、所期の目的を達成することができる。
【0045】
さらに、入力はFFTによって周波数領域に変換されており、VADの構成要素である自己相関処理を周波数領域にて実施することによって、FFT前の時間領域の信号に対して自己相関処理を行うよりも、はるかに処理量を軽減できるという効果もある。
【図面の簡単な説明】
【図1】本発明の実施例のブロック図である。
【図2】本発明の他の実施例のブロック図である。
【図3】リーク積分器のブロック図である。
【図4】VADのブロック図である。
【図5】従来のノイズキャンセラのブロック図である。
【符号の説明】
1 平滑器
2 しきい値回路
3 窓関数回路
4 FFT
5 減衰器
6 IFFT
7 窓関数オーバラップ回路
9 音声含有率計算部
10,16 信号パワー監視器
11,17 定常パワー監視器
12,18 信号対雑音比計算器
13,19 対数計算器
14 音声含有率変換器
15 減衰量計算部
20 帯域別減衰量計算器[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a noise canceller, and more particularly to a noise canceller suitable for use in a device that handles an audio signal as an input signal, such as a stationary telephone, a portable telephone, and a voice conference device.
[0002]
[Prior art]
A device that attenuates a noise component from a signal containing noise and extracts a signal such as a desired sound is called a noise canceller. Generally, background noise is white noise, and when viewed as power, there is little temporal variation in all frequency regions. On the other hand, the signal component naturally has a temporal power fluctuation. In particular, when the signal component is an audio signal, only momentary sound is a sound of one frequency and its harmonics. Therefore, the noise canceller can be configured relatively easily.
[0003]
However, in recent years, in a stationary telephone, a portable telephone, and the like, not only an audio signal but also a lot of signals other than an audio signal have been included as signal components, and therefore, the configuration of the noise canceller has been fundamentally changed. There is a need to review it. As one of the methods, a spectrum (spectral power) is obtained by performing frequency analysis on a signal containing noise, a time variation is monitored for each frequency band, and a signal-to-noise ratio is obtained for each band. / N) There is a method of calculating the amount of attenuation according to the ratio and attenuating the noise component by attenuating each band.
[0004]
That is, a noise canceller has been proposed that essentially changes the spectral component of the input signal momentarily to remove noise components contained in the input signal. In Japanese Patent Application Laid-Open No. 2000-47697, the amount of attenuation is controlled for each frequency band, and the signal-to-noise ratio of the input signal estimated in the time domain is considered as the signal (speech) content, and There has been proposed a noise canceller that calculates the amount of attenuation in consideration of the signal-to-noise ratio for each band when calculating the amount of attenuation.
[0005]
FIG. 5 shows a block diagram of a noise canceller disclosed in Japanese Patent Application Laid-Open No. 2000-47697. Referring to FIG. 5, the noise canceller includes a window function circuit 3 for extracting data from an input signal a, and an FFT (Fast Fourier Transform) circuit 4 for converting an output of the window function circuit 3 into frequency domain data. An
[0006]
The noise canceller includes a
[0007]
Hereinafter, non-noise signals other than voice are also represented as voice or voice signal. The input data a is supplied to the window function circuit 3, and data of several points of the FFT 4 is cut out from a signal sequence that is continuously input. The input of the FFT 4 is real-time domain data arranged in a time-series order, is subjected to time-frequency analysis processing in the FFT 4, is converted into frequency domain data of several FFT point bands, and is output c.
[0008]
In order to perform an operation on the frequency domain data, the
[0009]
The voice
[0010]
The voice
[0011]
The
[0012]
The
[0013]
The
[0014]
Further, when the signal-to-noise ratio of the real-time signal is small, the attenuation
[0015]
The signal-to-
[0016]
As a method of realizing the
[0017]
[Problems to be solved by the invention]
The noise canceller described in Japanese Patent Application Laid-Open No. 2000-47697 realizes a reasonably good noise canceller characteristic, but the demand for a better noise canceller has been increasingly strong.
[0018]
Generally, during a time when no audio component exists in the input signal (non-speech section), most of the input signal can be considered to be background noise. However, in the noise canceller described in JP-A-2000-47697, Also in this non-voice section, the attenuation is calculated for each band and constantly updated. Therefore, even in the non-voice section, the operation of changing the spectrum of the input signal in a short time to remove the noise component is performed.
[0019]
However, if the spectrum is changed every moment in a short period of time, the timbre of the background noise will change, and artificial sounds such as "hyperhyuru", "syurusyuru", and "kyarikyaru" will occur. There is a problem that an unnatural tone is generated and the sound may be unnatural. That is, the tone may be like a mobile phone having poor sound quality. Therefore, in the process of attenuating the background noise, it is desirable from the viewpoint of hearing that the timbre of the noise is not changed in the process of attenuating the noise power.
[0020]
SUMMARY OF THE INVENTION An object of the present invention is to provide a noise canceller which suppresses a change in timbre of background noise and has excellent speech quality.
[0021]
[Means for Solving the Problems]
A noise canceller according to the present invention is a noise canceller that attenuates background noise of an input time-domain signal, and includes a time / frequency domain conversion unit that converts the input time-domain signal into a plurality of frequency domain data; Attenuating means for attenuating with an attenuation control signal, frequency / time domain converting means for converting an output of the attenuating means into a time domain signal and outputting the same, and a voice content rate for calculating a voice content rate of the input time domain signal Calculating means, signal-to-noise ratio calculating means for calculating a signal-to-noise ratio of the plurality of frequency domain data, and deriving the attenuation control signal based on the voice content and the signal-to-noise ratio of the frequency domain data. Attenuation control signal deriving means, smoothing means for smoothing the attenuation control signal, and control for bypass-controlling the smoothing means according to the audio content. Characterized in that it comprises a stage.
[0022]
Another noise canceller according to the present invention is a noise canceller that attenuates background noise of an input time domain signal, wherein the time / frequency domain conversion means converts the input time domain signal into a plurality of frequency domain data; Attenuating means for attenuating data with an attenuation control signal, frequency / time domain converting means for converting the output of the attenuating means into a time domain signal and outputting the same, and voice for calculating the voice content of the input time domain signal Content ratio calculation means, signal-to-noise ratio calculation means for calculating a signal-to-noise ratio of the plurality of frequency domain data, and the attenuation control signal based on the voice content rate and the signal-to-noise ratio of the frequency domain data. Attenuation control signal deriving means for deriving, a smoothing means for smoothing the attenuation control signal, and a pitch for detecting a pitch from the plurality of frequency domain data Means out, characterized in that it comprises a means for controlling the smoothing control means in response to said pitch detection result and the speech content.
[0023]
The operation of the present invention is as follows. When noise is canceled by converting a time-domain signal into frequency-domain data in a noise canceller for attenuating time-domain noise of an input signal and performing attenuation control in accordance with a voice content rate in the frequency-domain data. If the voice content is less than a predetermined value, the attenuation control signal is smoothed. As another method, a pitch is detected from the frequency domain data, and smoothing control of the attenuation control signal is performed according to the pitch and the voice content. By doing so, the timbre change of the background noise is suppressed.
[0024]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an embodiment of a noise canceller according to the present invention, and portions equivalent to those in FIGS. Referring to FIG. 1, a noise canceller according to the present invention includes a window function circuit 3 for extracting data from an input (time domain) signal a, and an FFT (Fast Fourier Transform; fast Fourier transform) for converting an output of the window function circuit 3 into frequency domain data. A conversion circuit 4, an
[0025]
Further, a window
[0026]
The operation of the embodiment of the present invention will be described. Hereinafter, non-noise signals other than voice are also represented as voice or voice signal.
[0027]
In FIG. 1, input (time domain) data a is supplied to a window function circuit 3, and data of several points of the FFT 4 are cut out from a continuously input signal sequence. The input of the FFT 4 is real-time domain data arranged in a time series order. The FFT 4 performs time-frequency analysis processing, converts the data into frequency domain data of several FFT points, and outputs the data.
[0028]
In order to perform an operation on the frequency domain data, the
[0029]
The voice
[0030]
The voice
[0031]
The signal power monitor 10 of the voice
[0032]
The
[0033]
The
[0034]
Further, when the signal-to-noise ratio of the real-time signal is small, the attenuation
[0035]
The signal-to-
[0036]
The signal-to-
[0037]
The smoother 1 is inserted between the output of the band-
[0038]
For example, a leak integrator shown in FIG. 3 is widely known. Here, a description will be given assuming that a leak integrator is used as the smoother 1. In FIG. 3, the leak integrator includes a one-
[0039]
Another embodiment of the present invention will be described with reference to FIG. In FIG. 2, the noise canceller according to the present invention has a VAD (Voice Activate Detector: voiced detector) 8, and changes the rate of change of the amount of attenuation between a voice section and a non-voice section. When speech is used as a desired input signal, the speech is a substantially periodic signal, and the fundamental period (pitch) of the speech can be detected using autocorrelation. The information of the pitch can be used for discriminating between a voice section and a non-voice section. This determination function (apparatus) is called VAD.
[0040]
2, the noise canceller according to the present invention supplies the output c of the FFT 4 to the newly provided
[0041]
In general, various methods of realizing VAD have been proposed. In this case, for example, the
[0042]
In all of the outputs of the
[0043]
【The invention's effect】
As described above, according to the present invention, by providing a smoother for a control signal for attenuating a signal, a change in the amount of attenuation is gradual in a section where noise components are considered to be large, that is, in a non-voice section. effective. Therefore, the spectrum of the non-voice section after noise cancellation also changes gradually, so that the user of the apparatus does not feel unnatural even in the non-voice section generated between conversations.
[0044]
Further, by providing the VAD, there is an effect that it is possible to use the characteristic peculiar to human voice as a criterion for distinguishing between a voice section and a non-voice section, thereby improving the accuracy of the determination. That is, control is performed so that the change of the attenuation amount in the non-voice section becomes gentle, the effect of reducing the spectrum change after the noise cancellation is further enhanced, and the intended purpose can be achieved.
[0045]
Further, the input is converted into the frequency domain by the FFT, and by performing the autocorrelation processing which is a component of the VAD in the frequency domain, the autocorrelation processing is performed on the signal in the time domain before the FFT. Also, there is an effect that the processing amount can be greatly reduced.
[Brief description of the drawings]
FIG. 1 is a block diagram of an embodiment of the present invention.
FIG. 2 is a block diagram of another embodiment of the present invention.
FIG. 3 is a block diagram of a leak integrator.
FIG. 4 is a block diagram of a VAD.
FIG. 5 is a block diagram of a conventional noise canceller.
[Explanation of symbols]
1 smoother 2 threshold circuit 3 window function circuit 4 FFT
5
7 Window
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215931A JP2004061567A (en) | 2002-07-25 | 2002-07-25 | Noise canceller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215931A JP2004061567A (en) | 2002-07-25 | 2002-07-25 | Noise canceller |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004061567A true JP2004061567A (en) | 2004-02-26 |
Family
ID=31937819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002215931A Pending JP2004061567A (en) | 2002-07-25 | 2002-07-25 | Noise canceller |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004061567A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233267A (en) * | 2006-03-03 | 2007-09-13 | National Institute Of Advanced Industrial & Technology | Device and method for discriminating between speech signal and non-speech signal |
JP2008116686A (en) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | Noise suppression device |
US7908142B2 (en) | 2006-05-25 | 2011-03-15 | Sony Corporation | Apparatus and method for identifying prosody and apparatus and method for recognizing speech |
US8249270B2 (en) | 2006-09-25 | 2012-08-21 | Fujitsu Limited | Sound signal correcting method, sound signal correcting apparatus and computer program |
-
2002
- 2002-07-25 JP JP2002215931A patent/JP2004061567A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007233267A (en) * | 2006-03-03 | 2007-09-13 | National Institute Of Advanced Industrial & Technology | Device and method for discriminating between speech signal and non-speech signal |
JP4595124B2 (en) * | 2006-03-03 | 2010-12-08 | 独立行政法人産業技術総合研究所 | Discrimination apparatus and method for audio signal and non-audio signal |
US7908142B2 (en) | 2006-05-25 | 2011-03-15 | Sony Corporation | Apparatus and method for identifying prosody and apparatus and method for recognizing speech |
US8249270B2 (en) | 2006-09-25 | 2012-08-21 | Fujitsu Limited | Sound signal correcting method, sound signal correcting apparatus and computer program |
JP2008116686A (en) * | 2006-11-06 | 2008-05-22 | Nec Engineering Ltd | Noise suppression device |
JP4757775B2 (en) * | 2006-11-06 | 2011-08-24 | Necエンジニアリング株式会社 | Noise suppressor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9196258B2 (en) | Spectral shaping for speech intelligibility enhancement | |
JP4423300B2 (en) | Noise suppressor | |
US8560308B2 (en) | Speech sound enhancement device utilizing ratio of the ambient to background noise | |
EP0790599A1 (en) | A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station | |
US6360199B1 (en) | Speech coding rate selector and speech coding apparatus | |
JP3961290B2 (en) | Noise suppressor | |
JP2004507141A (en) | Voice enhancement system | |
JP2011509010A (en) | System for adjusting the perceived loudness of audio signals | |
JP2000047697A (en) | Noise canceler | |
EP2689419A1 (en) | Method and arrangement for damping dominant frequencies in an audio signal | |
JP2000330597A (en) | Noise suppressing device | |
JP2009296298A (en) | Sound signal processing device and method | |
TWI594232B (en) | Method and apparatus for processing of audio signals | |
WO2022068440A1 (en) | Howling suppression method and apparatus, computer device, and storage medium | |
JPH11265199A (en) | Voice transmitter | |
JP2004061567A (en) | Noise canceller | |
US11922933B2 (en) | Voice processing device and voice processing method | |
CN111477246A (en) | Voice processing method and device and intelligent terminal | |
JP3204892B2 (en) | Background noise canceller | |
JP2003223186A (en) | Speech recognition method and speech recognition device | |
WO2024202349A1 (en) | Automatic gain control device, echo removal device, automatic gain control method, and automatic gain control program | |
CN114333880A (en) | Signal processing method, device, equipment and storage medium | |
JP2008129108A (en) | Automatic gain control device, audio recording device, video/audio recording device and telephone call device | |
Hiruma et al. | Noise Suppression Algorithm Based on Loudness Management for Preserving Speech Components | |
PV et al. | Robust Acoustic Echo Suppression In Modulation Domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090127 |