[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6174856B2 - 雑音抑制装置、その制御方法、及びプログラム - Google Patents

雑音抑制装置、その制御方法、及びプログラム Download PDF

Info

Publication number
JP6174856B2
JP6174856B2 JP2012286163A JP2012286163A JP6174856B2 JP 6174856 B2 JP6174856 B2 JP 6174856B2 JP 2012286163 A JP2012286163 A JP 2012286163A JP 2012286163 A JP2012286163 A JP 2012286163A JP 6174856 B2 JP6174856 B2 JP 6174856B2
Authority
JP
Japan
Prior art keywords
frequency
noise
fundamental
subtraction
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012286163A
Other languages
English (en)
Other versions
JP2014126856A5 (ja
JP2014126856A (ja
Inventor
恭平 北澤
恭平 北澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012286163A priority Critical patent/JP6174856B2/ja
Priority to US14/139,560 priority patent/US9247347B2/en
Publication of JP2014126856A publication Critical patent/JP2014126856A/ja
Publication of JP2014126856A5 publication Critical patent/JP2014126856A5/ja
Application granted granted Critical
Publication of JP6174856B2 publication Critical patent/JP6174856B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/07Mechanical or electrical reduction of wind noise generated by wind passing a microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声信号に混入した雑音の抑圧を行う雑音抑圧装置及びその制御方法に関する。
ビデオカメラや最近ではデジタルカメラにおいても動画撮影ができるようになり、同時に音声が録音される機会が増えてきている。動画撮影では録音の際に混入する風雑音が大きな課題となっており、ビデオカメラの多くには風雑音を除去する機能が付けられている。
風雑音はマイクロホンに風が当たることにより発生する雑音で、低域の広い範囲にわたって強い成分を持っている。一方、人の声等の音声信号は基音と高調波(基音の整数倍の周波数を持つ成分)からなる調波構造を持っている。
従来の風雑音除去の方法としては、ハイパスフィルタ、スペクトルサブトラクション法、コムフィルタ法などがある。
ハイパスフィルタは風雑音が低域に強い成分を持っているためその成分を帯域制限によってカットしてしまう方法で、カットオフ周波数の決め方として、風雑音の量を推定してカットオフ周波数を切り替える方法が提案されている(例えば特許文献1参照)。
スペクトルサブトラクション法は音声中に含まれる風雑音を推定して、マイクロホンの信号のスペクトルから推定した雑音のスペクトルを減算することで雑音成分を除去する方法である(例えば特許文献2参照)。
コムフィルタ法は音声の調波構造に着目した手法で、基音検出を行い基音周波数と高調波を通過あるいは遮断する方法である。周波数特性でみると一定間隔で鋭いピークあるいはディップが現れるため櫛形フィルタとも呼ばれる。コムフィルタ法による雑音除去では、基音及び高調波を通過させることで雑音の帯域を抑制する方法と、基音及び高調波を遮断した信号を雑音信号として元の信号から減算する方法がある。
特開平06−269084号公報 特開2006−47639号公報
しかし、従来のハイパスフィルタを用いた風雑音除去方法では、風雑音を十分に除去しようとすると音声信号の基音や低次の高調波などの低域成分までもが抑圧されてしまい、音声の音色が変わってしまうという問題がある。
また、スペクトルサブトラクションを用いた方法では、雑音推定が必要であり、スペクトルサブトラクションの結果を良くするためには雑音の推定精度を良くする必要がある。しかし風雑音は非定常雑音であるため高精度な雑音推定が困難であり、雑音の推定精度が良くないために雑音成分の消し残りが発生するという問題がある。風雑音は特に低域成分が強いため低域において風雑音を十分に抑制できないという問題がある。
さらに、コムフィルタを用いた方法では、基音検出(ピッチ検出)が必要である。基音周波数に対してコムフィルタのくしの周波数は整数倍の関係になる。そのため、検出した基音に誤差があると高域において誤差が拡大してしまう。基音周波数と櫛の周波数の関係を以下に示す。fnはn番目の櫛の周波数、f0は基音周波数、δは誤差を表す。
fn=(f0+δ)×n
基音の誤差はnが小さい時はさほど問題にならないが、nが大きくなる高域の高調波ではその誤差がnに比例して拡大してしまう。そのため、本来の調波構造を除去してしまう可能性がある。基音の検出精度は雑音が大きいほど低下するため、正確なコムフィルタの設計はその実現性に問題がある。
本発明は、上述した問題を解決するためになされたものである。すなわち本発明は、基音検出の誤差にロバストで、音声信号を損なうことなく、低域の風雑音成分を抑圧することが可能な雑音抑圧装置及び方法を提供する。
本発明の一側面によれば、入力信号に含まれる雑音成分を抑する雑音抑装置であって、前記入力信号に含まれる音声成分の基音周波数を検出する基音検出手段と、前記入力信号に含まれる雑音成分を推定する雑音推定手段と、前記基音検出手段により検出された基音周波数に基づいて、雑音成分の抑制のための減算処理の強度に関わる減算係数を設定する係数設定手段と、前記係数設定手段により設定された減算係数と前記雑音推定手段により推定された雑音成分とを用いて前記入力信号に含まれる雑音成分を抑制する前記減算処理を実行する減算手段とを有し、前記係数設定手段は、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対する前記減算処理の強度が前記境界周波数以上の周波数に対する減算処理の強度より大きくなるように前記減算係数設定することを特徴とする雑音抑装置が提供される。
本発明によれば、音声信号を損なうことなく、音声信号と関係の無い基音周波数以下の風雑音成分を効果的に抑圧することができる。
実施形態1に係る雑音除去装置の構成を示すブロック図。 実施形態1に係るスペクトルサブトラクションを説明する図。 実施形態1に係る雑音除去処理を示すフローチャート。 基音が検出されなかったフレームでの基音検出部の出力例を示す図。 実施形態2に係る雑音除去装置の構成を示すブロック図。 実施形態2に係る雑音除去処理を示すフローチャート。 実施形態3に係る雑音除去装置の構成を示すブロック図。 実施形態3に係る雑音除去処理を示すフローチャート。 実施形態4に係る雑音除去装置の構成を示すブロック図。 ビームフォーマによって形成される指向性の例を示す図。 実施形態4に係る雑音除去処理を示すフローチャート。 8チャネルの基音周波数の例を示す図。 基音が検出されなかったフレームでの基音検出部の別の出力例を示す図。
以下、添付の図面を参照して、本発明の実施形態を詳しく説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<実施形態1>
本実施形態では、録音時に混入する風雑音信号を、スペクトルサブトラクション法を用いて除去する。図1は、本発明の実施形態1に係る雑音除去装置の構成を示すブロック図である。本実施形態の雑音除去装置は、音声信号入力部100、フレーム分割部200、信号処理部300、フレーム結合部400を備える。
音声信号入力部100は、マイクロホン、A/D変換器を含み、収音して得た音声信号とそれに混合した雑音信号(以下「混合信号」という。)をA/D変換してフレーム分割部200へ出力する。フレーム分割部200は、音声信号入力部100から入力された混合信号に対して所定時間長ずつ時間区間をずらしながら窓関数をかけ、特定の長さの時間ごとに切り出して出力する。
信号処理部300は雑音除去処理を行い、その結果得られた信号をフレーム結合部400へ出力する。信号処理部300の詳細は後述する。フレーム結合部400は、信号処理部300から出力されてくるフレームごとの信号を重複させながら結合し出力する。
次に信号処理部300について詳しく説明する。信号処理部300は、図示の如く、FFT部301、雑音推定部302、基音検出部303、係数設定部304、スペクトル減算部305、IFFT部306を含む。FFT部301は、フレーム分割部200から入力されるフレーム分割された混合信号にFFT(Fast Fourier Transform)を行い出力する。雑音推定部302は、FFT部301の出力に対して混合信号に含まれる風雑音を推定し推定雑音信号として出力する。例えば雑音推定部302は、特開2006−47639号公報に示されるように、風雑音モデルを用いて雑音を推定すればよい。つまり音声信号入力部100のマイクロホンに固有の風雑音モデルをデータベースとして持ち、フレームごとに風雑音モデルの中から類似するデータを選択して風雑音の周波数スペクトルを出力する。
基音検出部303は、FFT部301の出力に対して基音検出を行う。例えば基音検出はケプストラム法を用いて行う。ケプストラム法は入力信号の対数振幅スペクトルの逆フーリエ変換として求められる。この方法はもともとの定義とは異なるが一般的に使われているものである。ケプストラムの次元はケフレンシと呼ばれる時間に相当する物理量で、調波構造を持つ音声に対して基音に対応する位置にピークが現れる。例えば音声のサンプリング周波数を48kHz、基音周波数を100Hzとすると、480番目のサンプルに大きなピークが現れる。
そこで、音声信号の基音のとりうる範囲、例えば50Hzから1kHz、に対応する範囲でピークを検出することで基音を検出し、基音周波数を係数設定部304へ出力する。つまり信号のサンプリング周波数を48kHzとすると48番目から960番目のサンプルの中でピークを検出する。ここで音源が複数の場合には基音(ピーク)が複数検出されることがあるが、その場合、検出された基音のうち最も低い周波数のものを出力する。
係数設定部304は、基音検出部303から入力される基音周波数以下の周波数に境界周波数を設定する。そして、その境界周波数より低い周波数に対するスペクトルサブトラクションの減算係数を、それ以外の周波数に対する減算係数よりも大きい値に設定する。加えて、本実施形態では、境界周波数より低い周波数に対するスペクトルサブトラクションのフロアリング係数を、それ以外の周波数に対するフロアリング係数よりも小さい値に設定する。減算係数及びフロアリング係数については後述する。
スペクトル減算部305は、FFT部301及び雑音推定部302から入力された混合信号及び推定雑音信号の周波数スペクトルを用いてスペクトルサブトラクションを行い、結果をIFFT部306へ出力する。
混合信号の周波数スペクトルをX、推定雑音の周波数スペクトルをN、減算係数をβ、出力をYとすると、スペクトルサブトラクションは次式で表せる。
Figure 0006174856
ここで、fは周波数を表す。また、nには一般的に1(振幅)又は2(パワー)を用いるが、それ以外の数を用いてもかまわない。
スペクトルサブトラクション法では減算するノイズスペクトルに対して処理の強度を変更する減算係数βを乗算する。減算係数βは一般的に1以上に設定されることが多い。βが1以上に設定されるということは、式1のn乗根の中が負になってしまう可能性があるため、それを避けるためにフロアリングという処理が行われる。フロアリングは、次式で表される処理で、式1のn乗根の中が負になったとき、出力Yは混合信号Xをη倍した信号にするという処理である。このときηをフロアリング係数と呼ぶ。
Figure 0006174856
ここで、減算係数β及びフロアリング係数ηは一般的に周波数に関係なく一定の値が用いられるが、本実施形態では係数設定部304において以下のように設定される。
Figure 0006174856
このように設定することで境界周波数より低い周波数の雑音をより低減することができる。
図2は、本実施形態におけるスペクトルサブトラクションを模式的に表した図である。図2において、(a)は、あるフレームの混合信号のスペクトル示している。音声信号は調波構造(基音と高調波)を持ち、風雑音成分は低域に強い成分を持つ。(b)は、(a)の低域を拡大したものである。本実施形態では(b)に示すように基音周波数以下の周波数に境界周波数を設定する。そして、境界周波数より低い周波数においては、減算係数βを大きく設定する。更に、境界周波数より低い周波数においては、フロアリング係数ηを小さく設定するとよい。こうすることで、(c)に示すように基音周波数以下の風雑音成分を大きく低減させることができる。
IFFT部306は、スペクトル減算部305の出力にIFFT(Inverse Fast Fourier Transform)を行い、フレーム結合部400へ出力する。
本実施形態における雑音除去処理のフローを図3を用いて説明する。
録音が開始されると、音声信号入力部100で混合信号が収音される(S101)。収音された混合信号はフレーム分割部200へ随時出力される。次に、フレーム分割部200においてフレーム分割処理が行われる(S102)。このステップでは、入力される混合信号に対して所定時間長ずつずらしながら窓関数を乗算し特定の時間幅ごとに切り出された信号がFFT部301に出力される。続いて、FFT部301においてフレーム分割部200からの出力に対しFFT処理が行われる(S103)。FFT処理された信号は雑音推定部302、基音検出部303、スペクトル減算部305へそれぞれ出力される。
次に、雑音推定部302において雑音推定が行われる(S104)。ここでは、入力されたスペクトルと風雑音モデルの類似性の比較を行い、推定雑音スペクトルを決定する。推定雑音スペクトルはスペクトル減算部305へ出力される。続いて、基音検出部303において基音検出が行われる(S105)。このステップでは、FFT部301の出力をもとに、ケプストラム法によって該当フレーム内に含まれる音声信号の基音を検出し、基音の周波数を係数設定部304へ出力する。基音が検出されなかった場合、基音検出部303は基音周波数として0Hzを出力する。
次に、係数設定部304においてスペクトルサブトラクションの係数の設定が行われる(S106)。このステップではまず、基音検出部303で検出された基音周波数以下に境界周波数を設定する。ここで基音周波数を境界周波数として設定してもよいが、雑音による基音検出の誤差を考慮して基音周波数より低く設定してもよい。次にスペクトルサブトラクションのパラメータの設定を行う。境界周波数より低い周波数においてスペクトルサブトラクションの減算係数を大きく設定し、フロアリング係数を小さく設定する。その後、スペクトル減算部305においてスペクトルサブトラクションが行われる(S107)。このステップでは、FFT部301から出力された周波数スペクトルと、雑音推定部302から出力された周波数スペクトルと、係数設定部304で設定された減算係数及びフロアリング係数を用いてスペクトルサブトラクションを行う。スペクトルサブトラクションの結果はIFFT部306へ出力される。
IFFT部306においては、スペクトル減算部305の出力にIFFT処理が行われる(S108)。IFFT処理された信号はフレーム結合部400へ出力される。フレーム結合部400において、フレーム処理された信号を結合する処理が行われる(S109)。このステップではフレーム分割部200でフレームごとに分割されて処理を行われたフレームごとの信号を分割時と同様に所定時間長ずつずらしながら重ね合わせて結合する。そして、録音終了か否かが判断され(S110)、ここで録音終了と判断されるまで、S101〜S109の処理を繰り返す。
以上のように本実施形態によれば、音声信号の基音をもとに境界周波数を制御する。具体的には、境界周波数より低い周波数で減算係数を大きく、フロアリング係数を小さく設定する。これにより、音声信号の低域を不必要に抑制することなく雑音を除去できる。
本実施形態において、雑音推定部302では風雑音モデルを用いたが、他の手法を用いてもよい。例えば、非音声区間を風雑音のみの信号として抽出してもよく、音声区間か非音声区間かを判別する手段を別途設け、非音声区間の雑音のスペクトルを平均した信号を推定雑音としてもよい。
また、データベースが音声信号のモデルであってもよく、その場合、音声モデルを用いて音声のみを抽出し、残った信号を推定雑音とする。
また、雑音推定部302の入力は周波数スペクトルであったが、信号の時間波形を用いて風雑音の推定を行う場合にはフレーム分割部200から直接時間波形を入力できるようになっていてもよい。その場合、雑音推定部302の出力が時間波形の場合には雑音推定部302とスペクトル減算部305の間でFFT処理を行う。
また、基音検出部303ではケプストラム法を用いるとしたが、基音検出(ピッチ検出)には他の方法を用いてもよい。例えば自己相関関数を用いた方法を用いてもよい。(例えば、"対数スペクトルの自己相関関数を利用したピッチ抽出法",電子情報通信学会論文誌A,Vol.J80−A,No.3,pp.435−443を参照。)また、その他上記論文に紹介されている時間波形に対するゼロ交差数やピークを利用する方法や、フィルタバンクを用いる方法などの手法を用いることもできる。
また、基音検出部303において基音が検出されなかった場合0Hzを出力するとした。しかし、基音周波数は急激に変化することが少ないと考えられるため、現フレームで基音が検出されなかった場合は、前フレームと同じ値を出力するようにしてもよい。図4に基音が検出されなかった場合の例を示す。例えばフレーム2では基音が検出されなかったが、基音検出部303はフレーム1で出力した150Hzを出力する。またフレーム5から8のように連続して基音が検出されなかった場合にも順番に前フレームで出力された基音周波数を出力する。
また、基音検出されなかった区間は音声区間でないと判断し、全帯域において雑音抑制を強くする。つまり基音検出部303において設定できる最大周波数を出力するようにしてもよい。ここで最大周波数はフレーム分割部200に入力される信号のサンプリング周波数の半分の周波数(ナイキスト周波数)を指す。例えばサンプリング周波数が48kHzの場合、最大周波数は24kHzとなる。
また、境界周波数が急激に変わると聴感上目立つため、前のフレームで出力した周波数から時定数を用いて徐々に0Hzへ近づくようにしてもよい。
係数設定部304は減算係数及びフロアリング係数の双方を設定するのが好ましいが、減算係数及びフロアリング係数の一方だけを設定するようにしてもよい。
また、信号処理部300はスペクトルサブトラクションを用いて雑音除去を行ったが、別の雑音除去手段を用いてもよい。例えば雑音推定部302で推定した雑音を抑制する逆フィルタを設計し適応するようにしてもよい。その際に境界周波数以上と境界周波数より低い周波数でフィルタリングパラメータ(フィルタの重み係数など)を変えるようにしてもよい。
<実施形態2>
実施形態2では、録音時に混入する風雑音信号をハイパスフィルタ(以下「HPF」という。)とスペクトルサブトラクションを用いて除去する。図5は、本実施形態に係る雑音除去装置の構成を示すブロック図である。本実施形態の雑音除去装置は、音声信号入力部100、フレーム分割部200、信号処理部300、フレーム結合部400を備える。音声信号入力部100、フレーム分割部200、フレーム結合部400はそれぞれ、実施形態1と同じ構成であるため、それらの詳細な説明は省略する。
信号処理部300は、FFT部301、雑音推定部302、基音検出部303、スペクトル減算部305、IFFT部306、HPF307、FFT部308を含む。FFT部301、雑音推定部302、基音検出部303、スペクトル減算部305、IFFT部306は実施形態1とほぼ同様のため説明は省略する。
HPF307は、スペクトル減算部305よりも前段に設けられる。HPF307は、カットオフ周波数可変のHPFである。HPF307は、基音検出部303からの出力である基音の周波数から境界周波数を決定し、カットオフ周波数をその境界周波数に変更する。そして、フレーム分割部200からの出力に対してハイパスフィルタ処理を施す。このとき境界周波数は基音周波数と同じに設定してもよいし、HPFの振幅特性を考慮して基音周波数より高めに設定してもよい。さらに境界周波数を基音周波数より高く設定した場合は、HPFの振幅特性を考慮してスペクトル減算部305において基音周波数の成分を引きすぎないように減算係数を調整するようにしてもよい。ここで、基音検出部303が基音を検出できなかった場合0Hzが出力されるため、0Hzが入力された場合にはHPF処理を行わないように処理を切り替えるようにしてもよい。FFT部308は、HPF307からの出力に対しFFTを行い、スペクトル減算部305及び雑音推定部302へ出力する。
本実施形態における雑音除去処理のフローを図6を用いて説明する。
S201〜S203は、実施形態1のS101〜S103と同様である。すなわち、録音が開始されると、音声信号入力部100で混合信号が収音される(S201)。収音された混合信号はフレーム分割部200へ随時出力される。次に、フレーム分割部200においてフレーム分割処理が行われる(S202)。続いて、FFT部301においてフレーム分割部200からの出力に対しFFT処理が行われる(S203)。FFT処理された信号は基音検出部303へ出力される。
次に、基音検出部303において基音検出が行われる(S204)。このステップでは、FFT部301の出力をもとに、ケプストラム法によって該当フレーム内に含まれる音声信号の基音を検出し、基音の周波数をHPF307へ出力する。基音検出がされなかった場合、基音検出部303は基音周波数として0Hzを出力する。 次に、HPF307においてフレーム分割部200の出力に対してHPF処理が行われる(S205)。このステップではまず、基音検出部303の出力である基音周波数から境界周波数を設定する。次にHPFのカットオフ周波数を境界周波数に設定し、フレーム分割部200の出力に対してHPFをかけ、FFT部308へ出力する。
続いて、FFT部308においてHPF307の出力にFFT処理が行われる(S206)。FFT処理された信号はスペクトル減算部305及び雑音推定部302へ出力される。
次に、雑音推定部302において雑音推定が行われる(S207)。これは実施形態1におけるS104と同様の処理である。すなわち、入力されたスペクトルと風雑音モデルの類似性の比較を行い、推定雑音スペクトルを決定する。推定雑音スペクトルはスペクトル減算部305へ出力される。
その後、スペクトル減算部305においてスペクトルサブトラクションが行われる(S208)。このステップでは、FFT部308から出力された周波数スペクトルと、雑音推定部302から出力された周波数スペクトルと、所定の減算係数及びフロアリング係数を用いてスペクトルサブトラクションを行う。スペクトルサブトラクションの結果はIFFT部306へ出力される。
IFFT部306においては、スペクトル減算部305の出力にIFFT処理が行われる(S209)。IFFT処理された信号はフレーム結合部400へ出力される。フレーム結合部400において、フレーム処理された信号を結合する処理が行われる(S210)。そして、録音終了か否かが判断され(S211)、ここで録音終了と判断されるまで、S201〜S210の処理を繰り返す。
以上のように本実施形態によれば、音声信号の基音をもとに境界周波数を設定し、その境界周波数をカットオフ周波数とするHPFで低域成分を除去する。音声成分には雑音成分が重畳されているため、更にスペクトルサブトラクションを行うことで、雑音を除去できる。
本実施形態ではHPFを用いたが、低域成分をカットするのではなく、例えばハイシェルフフィルタを用いて風雑音を抑制するようにしてもよい。また、ハイシェルフフィルタのかわりに、境界周波数をカットオフ周波数とするHPFとローパスフィルタを用いて信号を帯域分割し、ローパスフィルタの出力に対してレベルを下げる処理を施してもよい。
<実施形態3>
次に、音声区間検出処理を含む実施形態を説明する。図7は本実施形態に係る雑音除去装置の構成を示すブロック図である。本実施形態の雑音除去装置は、音声信号入力部100、フレーム分割部200、信号処理部300、フレーム結合部400を備える。音声信号入力部100、フレーム分割部200、フレーム結合部400はそれぞれ、実施形態1と同じ構成であるため、それらの詳細な説明は省略する。
図7の信号処理部300は、図1の構成に対して、FFT部301と基音検出部303の間に音声区間検出部309を追加した構成である。FFT部301、雑音推定部302、基音検出部303、係数設定部304、スペクトル減算部305、IFFT部306は実施形態1とほぼ同様のため説明は省略する。
音声区間検出部309は、FFT部301の出力が音声区間を含むか否かを検出し、検出結果を出力する。音声区間の検出法としては例えば、ガウス混合分布モデルを用いる方法がある。(例えば、“Speech Non-Speech Separation with Gmms.”,日本音響学会研究発表会講演論文集2001(2)、pp141−142参照。)これは、音声と非音声のガウス混合分布モデルを定義して、フレームごとにガウス混合分布モデルの尤度計算を行い音声区間か否かを判断する方法である。
本実施形態における雑音除去処理のフローを図8を用いて説明する。
S301〜S304は、実施形態1のS101〜S104と同様である。すなわち、録音が開始されると、音声信号入力部100で音声が収音される(S301)。収音された混合信号はフレーム分割部200へ随時出力される。次に、フレーム分割部200においてフレーム分割処理が行われる(S302)。続いて、FFT部301においてフレーム分割部200からの出力にFFT処理が行われる(S303)。FFT処理された信号は雑音推定部302、スペクトル減算部305、基音検出部303へ出力される。次に、雑音推定部302において雑音推定が行われる(S304)。ここでは、入力されたスペクトルと風雑音モデルの類似性の比較を行い、推定雑音スペクトルを決定する。推定雑音スペクトルはスペクトル減算部305へ出力される。
次に、音声区間検出部309において音声区間の検出が行われる(S305)。このステップではFFT部301から出力された信号内の音声区間を検出する。音声区間が検出された場合は、基音検出部303において基音検出が行われる(S306)。一方、音声区間が検出されなかった場合には係数設定部304へ非音声区間であることを示す信号を出力する。
係数設定部304において、スペクトル減算部305で使用する係数の設定が行われる(S307)。このステップでは係数設定部304に基音検出部303から基音周波数が入力された場合、その基音周波数以下に境界周波数を設定する。次に、スペクトルサブトラクションのパラメータの設定が行われる。具体的には、境界周波数より低い周波数においてスペクトルサブトラクションの減算係数を大きく設定し、フロアリング係数を小さく設定する。一方、音声区間検出部309から非音声区間であることを示す信号が入力された場合は、境界周波数は、音声信号に対して想定される所定の最大周波数に設定される。つまり全帯域においてスペクトルサブトラクションの減算係数は大きく設定され、フロアリング係数は小さく設定される。スペクトルサブトラクションの結果はIFFT部306へ出力される。
IFFT部306においては、スペクトル減算部305の出力にIFFT処理が行われる(S309)。IFFT処理された信号はフレーム結合部400へ出力される。フレーム結合部400において、フレーム処理された信号を結合する処理が行われる(S310)。そして、録音終了か否かが判断され(S311)、ここで録音終了と判断されるまで、S301〜S310の処理を繰り返す。
音声区間と判定されたものの基音が検出されなかった区間は調波構造の無い子音である可能性がある。そこで本実施形態では、このような区間に対しては、境界周波数が0Hzに設定され、全帯域に通常の処理が行われる。一方、非音声区間では、音声区間ではあるが基音が検出されなかった区間と区別して、境界周波数が最大周波数に設定され、全帯域において雑音除去が行われる。
本実施形態において、音声区間検出部309はフレーム分割部200より後段において音声区間検出を行った。しかし、フレーム分割される前の信号に対して音声区間検出を行い、各フレームが音声区間か否かを出力するようにしてもよい。
また、音声区間検出部309では他の方法で音声区間検出を行ってもよい。例えば、振幅とゼロ交差数に基づく方法を用いてもよい。(“複数特徴の重み付き統合による雑音に頑健な発話区間検出”,情報処理学会研究報告. SLP, 音声言語情報処理 2005(69), pp49-54を参照。)振幅とゼロ交差数に基づく方法では、一定のレベルを超える振幅(パワー)の区間において零交差数が一定数を超えた信号を音声と判断する。例えば、振幅とゼロ交差数に基づく方法を用いる場合、フレーム分割部200の出力をFFT部301を介さずに音声区間検出部309へ入力する。そこでフレームの半分以上が音声区間であるとされた場合に、そのフレームを音声区間である判定とする。
上述の実施形態では、係数設定部304は、音声区間検出部309において音声区間でないと判断された場合に境界周波数を最大周波数に設定した。しかし、基音検出ができなかったときと同様に境界周波数を0Hzと設定してもよいし、以前のフレームの基音周波数をそのまま用いてもよい。
また、フレーム単位での処理が急激に変わると聴感上目立ってしまうため、係数設定部304では非音声区間と音声区間の境目において急激に減算係数あるいはフロアリング係数が変化しないように時定数を設けて係数を変化させるようにしてもよい。
<実施形態4>
次に、入力が複数チャネル、例えば2チャネルの場合の実施形態を説明する。図9は、本実施形態に係る雑音除去装置の構成を示すブロック図である。本実施形態の雑音除去装置は、音声信号入力部1100、フレーム分割部1200、信号処理部1300、フレーム結合部1400を有する。フレーム分割部1200、信号処理部1300、フレーム結合部1400はそれぞれ、実施形態1における音声信号入力部100、フレーム分割部200、フレーム結合部400を2チャネルに拡張したものである。すなわちこれらの各部は各チャネルの音声信号に対してそれぞれ動作する。音声信号入力部1100は、所定の間隔を空けて設置された2つのマイクロホンを有する。
信号処理部1300は、FFT部1301、雑音推定部1302、基音検出部1303、係数設定部1304、スペクトル減算部1305、IFFT部1306、基音周波数調整部1310を含む。FFT部1301、基音検出部1303、スペクトル減算部1305、IFFT部1306はそれぞれ、実施形態1のFFT部301、基音検出部303、スペクトル減算部305、IFFT部306を2チャネルに拡張したものである。雑音推定部1302は、FFT部1301から入力される信号を用いて風雑音を分離抽出する音源分離処理を行う。音源分離処理には例えばビームフォーマを用いる。音声はマイクロホンに対して音源方向が明確に決まるが、風雑音は無指向性の音源である。そのため、指向性を音声方向にヌルが向くようにすると風雑音のみを抽出することができる。例えば最小ノルム法を用いると、音声のエネルギーが高い場合、図10に示すように、音声方向に自動的にヌルを向くように指向性を形成することができ、音声を除いた風雑音のみを抽出できる。抽出された風雑音の周波数スペクトルはスペクトル減算部1305へ出力される。
雑音推定部1302においてビームフォーマを用いると出力は1つしか得られない。しかし、音声信号入力部1100の2つのマイクロホンが十分に近接している場合には、チャネルごとの風雑音の相関度が高いため、1つの出力を推定雑音として2チャネルから個別に減算しても問題はない。
基音周波数調整部1310には基音検出部1303で検出された2チャネルの基音の周波数が入力される。2つのマイクロホンが近接して設置されている場合には、2チャネルで検出される基音は同じになる。しかし、2チャネルに重畳される風雑音はそれぞれ異なるため、基音検出に誤差が生じ、2チャネルで異なる値が入力されることがある。そこで、基音周波数調整部1310では基音を抑制しないために入力された2つの基音周波数のうち、より低い周波数を基音周波数として係数設定部1304へ出力する。
本実施形態における雑音除去処理のフローを図11を用いて説明する。
録音が開始されると、音声信号入力部100で2chの音声が収音される(S1001)。収音された混合信号はフレーム分割部200へ随時出力される。次に、フレーム分割部200においてフレーム分割処理が行われる(S1002)。続いて、FFT部301においてフレーム分割部200からの出力に対しFFT処理が行われる(S1003)。FFT処理された信号は基音検出部303へ出力される。
次に、雑音推定部1302において音源分離による雑音推定が行われる(S1004)。このステップではFFT部1301に対して最小ノルム法によるビームフォーマが行われる。この結果、音声方向にヌルが形成され、音声以外の音つまり風雑音のみが抽出される。抽出された風雑音はスペクトル減算部1305へ出力される。 次に、基音検出部1303において検出された2チャネルの基音周波数は基音周波数調整部1310に入力され、係数設定部1304に出力する基音周波数の調整が行われる(S1006)。このステップでは音声信号に対する抑制を避けるため、各チャネルで検出された基音周波数のうち最低の周波数を選択し、係数設定部1304へ出力する。
それ以降のS1007〜S1011は、実施形態1のS106〜S110と同様である。すなわち、係数設定部1304においてスペクトルサブトラクションの係数の設定が行われる(S1007)。このステップではまず、基音検出部1303で検出された基音周波数以下に境界周波数を設定する。ここで基音周波数を境界周波数として設定してもよいが、雑音による基音検出の誤差を考慮して基音周波数より低く設定してもよい。次にスペクトルサブトラクションのパラメータの設定を行う。境界周波数より低い周波数においてスペクトルサブトラクションの減算係数を大きく設定し、フロアリング係数を小さく設定する。その後、スペクトル減算部1305においてスペクトルサブトラクションが行われる(S1008)。このステップでは、FFT部1301から出力された周波数スペクトルと、雑音推定部1302から出力された周波数スペクトルと、係数設定部1304で設定された減算係数及びフロアリング係数を用いてスペクトルサブトラクションを行う。スペクトルサブトラクションの結果はIFFT部1306へ出力される。
IFFT部1306においては、スペクトル減算部1305の出力に対してIFFT処理が行われる(S1009)。IFFT処理された信号はフレーム結合部1400へ出力される。フレーム結合部400において、フレーム処理された信号を結合する処理が行われる(S1010)。このステップではフレーム分割部1200でフレームごとに分割されて処理を行われたフレームごとの信号を分割時と同様に所定時間長ずつずらしながら重ね合わせて結合する。そして、録音終了か否かが判断され(S1011)、ここで録音終了と判断されるまで、S1001〜S1010の処理を繰り返す。
以上のように、2チャネルの場合では、音源分離技術を用いて雑音を推定することができる。さらに基音周波数の調整によって基音検出の誤差によって基音を低減してしまう可能性を低減できる。このため、音声信号の低域を不要に抑制することなく風雑音を除去することができる。
本実施形態において、雑音推定部1302はビームフォーマを用いて雑音推定を行ったが、別の手法を用いてもよい。例えば、特開2006−154314号公報に開示されているような独立成分分析と逆射影を用いた方法やSIMO−ICAを用いてもよい。また、例えば特開2012−22120号公報で開示されているような非負値行列因子分解を用いた方法でもよい。これらの方法を用いることで、ビームフォーマでは1つしか得られなかった推定雑音をチャネルごとに得ることができる。
また、雑音推定部1302のビームフォーマは最小ノルム法を用いて音源方向にヌルが向くようにしたが、これに限定されない。例えば、音源方向推定などによって、音声方向が分かるような場合には、その方向にヌルを向けるようにしてもよい。
基音周波数調整部1310では、2つの基音周波数のうち、より低い周波数を基音周波数として係数設定部1304へ出力したが、2つのチャネルの平均値を基音周波数として出力してもよい。また、基音周波数調整部1310は入力される2つのチャネルの基音が大きく異なる場合、各チャネルの基音の信頼性をもとに出力する基音を選択するようにしてもよい。例えば過去のフレームの基音を保持するようにして、過去の基音からの連続性を考慮して2つの基音のうち変化量の少ないものを信頼性の高い基音周波数として出力するようにしてもよい。あるいは、基音検出部1303は基音検出時の信頼性を合わせて出力するようにしてもよく、ケプストラムによる基音検出を行う場合、ケプストラムのピークの高さやピークの幅などの特徴量を出力するようにしてもよい。基音周波数調整部1310では基音検出時のケプストラムのピークが高く、幅の狭いものを信頼性が高い基音として選択する。また、信頼性に応じて重み付き平均を行ってもよい。
本実施形態では2チャネルの混合信号を扱ったが、本発明は3チャネル以上の混合信号にも適用可能である。音声信号入力部1100が3チャネル以上の場合、基音周波数調整部1310では入力される各チャネルの基音周波数を比較し、外れ値か否かを判定するようにしてもよい。外れ値が見つかった場合には外れ値以外のチャネルの平均値を出力する。例えば、外れ値か否かは以下のような式を用いて行う。
n・σ=fm−μ
ただし、mはチャネル、fmは第mチャネルの基音周波数、μは全チャネルの基音周波数の平均値、σは標準偏差を表す。ここで2σ以上を外れ値とすると、第mチャネルの基音周波数fmが外れ値かどうかを判定できる。例えば8チャネルの入力があった場合に、それぞれの基音周波数が、図12のようであった場合、平均値は144.6Hz、標準偏差は18.6Hzとなる。したがって、2σ以上を外れ値とすると、外れ値の上限は181.8Hz、下限は107.4Hzとなり、第6チャネルが外れ値となる。外れ値を除く平均は151Hzであるので、151Hzが出力される。
また、音声信号入力部1100の入力数が複数の場合には、混入する風雑音の程度が異なる場合が考えられる。そこで、雑音推定部1302においてチャネルごとに雑音を推定し、推定雑音量の一番小さいチャネルの基音周波数を出力するようにしてもよい。
また、上述の実施形態では、音声信号入力部はマイクロホンあるいはマイクロホンアレイとしたが、例えばあらかじめ録音された混合信号のファイルを読み込む手段であってもよい。その場合、基音検出や雑音推定はあらかじめ全信号区間でそれぞれの処理を行ってから各フレームに対応する信号を出力するようにしてもよい。
さらにファイルを読み込む場合、基音検出をまず全フレームに対して行う。その後、基音が検出されなかった1つ以上の一連のフレームについては、その前のフレーム又は後のフレームあるいはその両方のフレームにおいて検出された基音周波数を用いて外挿又は内挿するようにしてもよい。図13に、基音検出ができなかった場合に基音周波数を前のフレーム又は後のフレームあるいはその両方のフレームにおいて検出された基音周波数を用いて補間した例を示す。特に先頭フレームで基音が検出されなかった場合と連続する複数のフレームで基音が検出されなかった場合、そして最終フレームで基音が検出されなかった場合について説明する。基音が検出されなかったフレーム1はフレーム2とフレーム3の値と同じ150Hzを出力する。フレーム5から8のように連続して基音が検出されなかった場合はフレーム4とフレーム9の値を用いて線形補間を行い出力する。補間方法は線形補間に限らずスプライン補間などを用いてもよい。フレーム11はフレーム10の値と同じ100Hzを出力する。
また、フレームの基音検出できなかった区間の長さを検出する手段を設け、その区間が所定より長ければ音声が無い区間として境界周波数を最大周波数として、区間所定より短かった場合、境界周波数を0Hzとしてもよい。
<他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶した記憶媒体は本発明を構成することになる。

Claims (20)

  1. 入力信号に含まれる雑音成分を抑する雑音抑装置であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出手段と、
    前記入力信号に含まれる雑音成分を推定する雑音推定手段と、
    前記基音検出手段により検出された基音周波数に基づいて、雑音成分の抑制のための減算処理の強度に関わる減算係数を設定する係数設定手段と、
    前記係数設定手段により設定された減算係数と前記雑音推定手段により推定された雑音成分とを用いて前記入力信号に含まれる雑音成分を抑制する前記減算処理を実行する減算手段と、
    を有し、
    前記係数設定手段は、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対する前記減算処理の強度が前記境界周波数以上の周波数に対する減算処理の強度より大きくなるように前記減算係数設定する
    ことを特徴とする雑音抑装置。
  2. 前記減算手段により実行される前記減算処理は、スペクトルサブトラクションであることを特徴とする請求項1に記載の雑音抑制装置。
  3. スペクトルサブトラクションによって入力信号に含まれる雑音を抑する雑音抑装置であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出手段と、
    前記入力信号に含まれる雑音成分を推定する雑音推定手段と、
    前記基音検出手段により検出された基音周波数に基づいて前記スペクトルサブトラクションにおけるフロアリング係数を設定する係数設定手段と、
    前記係数設定手段により設定されたフロアリング係数と前記雑音推定手段により推定された雑音成分とを用いて前記入力信号に対し前記スペクトルサブトラクションを実行する減算手段と、
    を有し、
    前記係数設定手段は、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対するフロアリング係数を前記境界周波数以上の周波数に対するフロアリング係数よりも小さい値に設定する
    ことを特徴とする雑音抑装置。
  4. スペクトルサブトラクションによって入力信号に含まれる雑音を抑する雑音抑装置であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出手段と、
    前記入力信号に含まれる雑音成分を推定する雑音推定手段と、
    前記基音検出手段により検出された基音周波数に基づいて前記スペクトルサブトラクションにおける減算係数及びフロアリング係数を設定する係数設定手段と、
    前記係数設定手段により設定された減算係数及びフロアリング係数と前記雑音推定手段により推定された雑音成分とを用いて前記入力信号に対し前記スペクトルサブトラクションを実行する減算手段と、
    を有し、
    前記係数設定手段は、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対する減算係数を前記境界周波数以上の周波数に対する減算係数よりも大きい値に設定するとともに、前記境界周波数より低い周波数に対するフロアリング係数を前記境界周波数以上の周波数に対するフロアリング係数よりも小さい値に設定する
    ことを特徴とする雑音抑装置。
  5. 記減算手段より前段において、前記入力信号に対してハイパスフィルタ処理を行う、カットオフ周波数可変のハイパスフィルタを更に有し、
    前記ハイパスフィルタは、カットオフ周波数を前記境界周波数に設定する
    ことを特徴とする請求項乃至のいずれか1項に記載の雑音抑装置。
  6. 音声区間を検出する音声区間検出手段を更に有し、
    前記基音検出手段は、前記音声区間検出手段により音声区間が検出された場合に基音周波数の検出を実行する
    ことを特徴とする請求項乃至のいずれか1項に記載の雑音抑装置。
  7. 前記音声区間検出手段により音声区間が検出されなかった場合、前記係数設定手段は、前記境界周波数を、前記入力信号に対して想定される所定の最大周波数に設定することを特徴とする請求項に記載の雑音抑装置。
  8. 前記音声区間検出手段により音声区間が検出されなかった場合、前記係数設定手段は、前記境界周波数を0Hzに設定することを特徴とする請求項に記載の雑音抑装置。
  9. 前記音声区間検出手段により音声区間が検出されなかった場合、前記係数設定手段は、前記境界周波数を、前のフレームの基音周波数に基づいて設定することを特徴とする請求項に記載の雑音抑装置。
  10. 前記入力信号は複数チャネルの入力信号であり、
    各手段は、各チャネルの入力信号に対してそれぞれ動作し、
    前記基音検出手段により検出された各チャネルの基音周波数のうち最低の周波数を選択して前記係数設定手段に出力する基音周波数調整手段を更に有する
    ことを特徴とする請求項乃至のいずれか1項に記載の雑音抑装置。
  11. 前記雑音推定手段は、ビームフォーマ、独立成分分析、非負値行列因子分解のうちのいずれか1つによる音源分離技術を用いることを特徴とする請求項2乃至10のいずれか1項に記載の雑音抑装置。
  12. 前記基音検出手段は、現フレームにおいて基音が検出されなかった場合は、前のフレームで出力された基音周波数を出力することを特徴とする請求項乃至11のいずれか1項に記載の雑音抑装置。
  13. 前記基音検出手段は、基音が検出されなかった1つ以上の一連のフレームについては、該一連のフレームの前のフレーム又は後のフレームあるいはその両方のフレームにおいて検出された基音周波数を用いて補間することを特徴とする請求項乃至11のいずれか1項に記載の雑音抑装置。
  14. 前記基音検出手段は、基音が検出されなかった場合、基音周波数を0Hzとして出力することを特徴とする請求項乃至11のいずれか1項に記載の雑音抑装置。
  15. 前記基音検出手段は、基音が検出されなかった場合、基音周波数を前記入力信号に対して想定される所定の最大周波数として出力することを特徴とする請求項乃至11のいずれか1項に記載の雑音抑装置。
  16. 入力信号に含まれる雑音を抑する雑音抑装置の制御方法であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出ステップと、
    前記入力信号に含まれる雑音成分を推定する雑音推定ステップと、
    前記検出された基音周波数に基づいて、雑音成分の抑制のための減算処理の強度に関わる減算係数を設定する係数設定ステップと、
    前記設定された減算係数と前記推定された雑音成分とを用いて前記入力信号に含まれる雑音成分を抑制する前記減算処理を実行する減算ステップと、
    を有し、
    前記係数設定ステップでは、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対する前記減算処理の強度が前記境界周波数以上の周波数に対する減算処理の強度より大きくなるように前記減算係数設定する
    ことを特徴とする雑音抑装置の制御方法。
  17. 前記減算処理はスペクトルサブトラクションであることを特徴とする請求項16に記載の雑音抑制装置の制御方法。
  18. スペクトルサブトラクションによって入力信号に含まれる雑音を抑する雑音抑装置の制御方法であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出ステップと、
    前記入力信号に含まれる雑音成分を推定する雑音推定ステップと、
    前記検出された基音周波数に基づいて前記スペクトルサブトラクションにおけるフロアリング係数を設定する係数設定ステップと、
    前記設定されたフロアリング係数と前記推定された雑音成分とを用いて前記入力信号に対し前記スペクトルサブトラクションを実行する減算ステップと、
    を有し、
    前記係数設定ステップでは、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対するフロアリング係数を前記境界周波数以上の周波数に対するフロアリング係数よりも小さい値に設定する
    ことを特徴とする雑音抑装置の制御方法。
  19. スペクトルサブトラクションによって入力信号に含まれる雑音を抑する雑音抑装置の制御方法であって、
    前記入力信号に含まれる音声成分の基音周波数を検出する基音検出ステップと、
    前記入力信号に含まれる雑音成分を推定する雑音推定ステップと、
    前記検出された基音周波数に基づいて前記スペクトルサブトラクションにおける減算係数及びフロアリング係数を設定する係数設定ステップと、
    前記設定された減算係数及びフロアリング係数と前記推定された雑音成分とを用いて前記入力信号に対し前記スペクトルサブトラクションを実行する減算ステップと、
    を有し、
    前記係数設定ステップでは、前記基音周波数以下の周波数に境界周波数を設定し、前記境界周波数より低い周波数に対する減算係数を前記境界周波数以上の周波数に対する減算係数よりも大きい値に設定するとともに、前記境界周波数より低い周波数に対するフロアリング係数を前記境界周波数以上の周波数に対するフロアリング係数よりも小さい値に設定する
    ことを特徴とする雑音抑装置の制御方法。
  20. コンピュータを、請求項1乃至15のいずれか1項に記載の雑音抑装置が有する各手段として機能させるためのプログラム。
JP2012286163A 2012-12-27 2012-12-27 雑音抑制装置、その制御方法、及びプログラム Active JP6174856B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012286163A JP6174856B2 (ja) 2012-12-27 2012-12-27 雑音抑制装置、その制御方法、及びプログラム
US14/139,560 US9247347B2 (en) 2012-12-27 2013-12-23 Noise suppression apparatus and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012286163A JP6174856B2 (ja) 2012-12-27 2012-12-27 雑音抑制装置、その制御方法、及びプログラム

Publications (3)

Publication Number Publication Date
JP2014126856A JP2014126856A (ja) 2014-07-07
JP2014126856A5 JP2014126856A5 (ja) 2016-02-12
JP6174856B2 true JP6174856B2 (ja) 2017-08-02

Family

ID=51017237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012286163A Active JP6174856B2 (ja) 2012-12-27 2012-12-27 雑音抑制装置、その制御方法、及びプログラム

Country Status (2)

Country Link
US (1) US9247347B2 (ja)
JP (1) JP6174856B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015118361A (ja) 2013-11-15 2015-06-25 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
WO2017065092A1 (ja) * 2015-10-13 2017-04-20 ソニー株式会社 情報処理装置
RU2727883C2 (ru) 2015-10-13 2020-07-24 Сони Корпорейшн Устройство обработки информации
US10157627B1 (en) * 2017-06-02 2018-12-18 Bose Corporation Dynamic spectral filtering
CN110047470A (zh) * 2019-04-11 2019-07-23 深圳市壹鸽科技有限公司 一种语音端点检测方法
CN110797041B (zh) * 2019-10-21 2023-05-12 珠海市杰理科技股份有限公司 语音降噪处理方法、装置、计算机设备及存储介质
EP3840402B1 (en) * 2019-12-20 2022-03-02 GN Audio A/S Wearable electronic device with low frequency noise reduction
US11217269B2 (en) * 2020-01-24 2022-01-04 Continental Automotive Systems, Inc. Method and apparatus for wind noise attenuation
CN118380007B (zh) * 2024-06-20 2024-09-10 深圳爱图仕创新科技股份有限公司 语音增强方法、模型训练方法、装置及相关设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186892B2 (ja) 1993-03-16 2001-07-11 ソニー株式会社 風雑音低減装置
JP3693022B2 (ja) * 2002-01-29 2005-09-07 株式会社豊田中央研究所 音声認識方法及び音声認識装置
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
JP4505597B2 (ja) * 2004-08-04 2010-07-21 株式会社国際電気通信基礎技術研究所 雑音除去装置
JP4462617B2 (ja) 2004-11-29 2010-05-12 株式会社神戸製鋼所 音源分離装置,音源分離プログラム及び音源分離方法
ATE528748T1 (de) * 2006-01-31 2011-10-15 Nuance Communications Inc Verfahren und entsprechendes system zur erweiterung der spektralen bandbreite eines sprachsignals
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
JP5294085B2 (ja) * 2009-11-06 2013-09-18 日本電気株式会社 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム
JP5516169B2 (ja) 2010-07-14 2014-06-11 ヤマハ株式会社 音響処理装置およびプログラム

Also Published As

Publication number Publication date
US20140185827A1 (en) 2014-07-03
JP2014126856A (ja) 2014-07-07
US9247347B2 (en) 2016-01-26

Similar Documents

Publication Publication Date Title
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
US9064498B2 (en) Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
EP2546831B1 (en) Noise suppression device
JP6019969B2 (ja) 音響処理装置
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
US20140177853A1 (en) Sound processing device, sound processing method, and program
US9715884B2 (en) Information processing apparatus, information processing method, and computer-readable storage medium
JP5605574B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
JP6439682B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2011033717A (ja) 雑音抑圧装置
KR20150032390A (ko) 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
JP5614261B2 (ja) 雑音抑制装置、雑音抑制方法、及びプログラム
JP4740609B2 (ja) 有声音および無声音の検出装置、並びにその方法
JP2000081900A (ja) 収音方法、その装置及びプログラム記録媒体
CN113593604A (zh) 检测音频质量方法、装置及存储介质
JP4533126B2 (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP4249697B2 (ja) 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体
JP5316127B2 (ja) 音処理装置およびプログラム
JP2009210712A (ja) 音処理装置およびプログラム
JP4537821B2 (ja) オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体
JP4413175B2 (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
CN115206345B (zh) 基于时频结合的音乐人声分离方法、装置、设备及介质
JP2015031913A (ja) 音声処理装置、音声処理方法、及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170707

R151 Written notification of patent or utility model registration

Ref document number: 6174856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151