JP5903921B2

JP5903921B2 - ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム

Info

Publication number: JP5903921B2
Application number: JP2012031710A
Authority: JP
Inventors: 孝朗山邊
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2012-02-16
Filing date: 2012-02-16
Publication date: 2016-04-13
Anticipated expiration: 2032-02-16
Also published as: JP2013168856A

Description

本発明はノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムに関する。

音声信号に含まれるノイズ成分を低減して音声を聞き取りやすくするノイズ低減処理技術がある。ノイズ低減処理技術では、例えば、音声（例えば、通話者が発する音声などの希望音声）を主に収音するマイクロフォンによって収音された音声信号から、ノイズ（例えば希望音声以外の不要音）を主に収音するマイクロフォンによって収音されたノイズ信号（参照信号）を差し引くことで、音声信号に含まれるノイズ成分を除去することができる。

特許文献１には、希望音声の低減を防止して、低減対象の不要音のみを低減するための技術が開示されている。特許文献２には、雑音除去のための適応フィルタによって下がる音声等の明瞭度を改善する技術が開示されている。特許文献３には、騒音の状況に応じて適時最適なノイズ低減効果を得ることのできるノイズキャンセラに関する技術が開示されている。

特開平６−６７６９２号公報特開平８−１０２６４４号公報特開平９−３６７６３号公報

主として音声成分を含む音声信号と主としてノイズ成分を含む参照信号とを用いてノイズ低減処理を実施する場合、ノイズ低減装置の使用状況によっては、参照信号に音声成分も混入する場合がある。このように、参照信号に音声成分が混入すると、ノイズ低減処理を実施した際に音声信号に含まれる音声成分もキャンセルされてしまい、ノイズ低減処理後の信号の音圧レベルが低下するという問題があった。

上記課題に鑑み本発明の目的は、音圧レベルの低下を抑制することができるノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムを提供することである。

本発明にかかるノイズ低減装置は、第１の収音信号に基づき音声区間を判定する音声区間判定部と、第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減するノイズ低減処理部と、前記音声区間において、前記第１の収音信号と前記ノイズ低減処理部から出力されたノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出する音圧レベル変化量算出部と、前記音圧レベル変化量算出部で算出された変化量に応じて前記ノイズ低減処理後の信号の音圧レベルを補償する音圧レベル補償部と、を備える。

前記音圧レベル補償部は、前記第１の収音信号の音圧レベルと前記ノイズ低減処理後の信号の音圧レベルとの差である音圧レベル差の絶対値が所定の閾値以上となった場合に、前記ノイズ低減処理後の信号の音圧レベルを補償してもよい。

前記音圧レベル補償部は、前記音圧レベル差に対応した増幅率で前記ノイズ低減処理後の信号を増幅してもよい。

前記音圧レベル補償部は、前記音圧レベル差に対応した増幅率で前記ノイズ低減処理後の信号を増幅した後、前記増幅率を徐々に低減させてもよい。

前記音圧レベル補償部は、前記音圧レベル差が所定の上限値を超えた場合、当該上限値に対応した増幅率で前記ノイズ低減処理後の信号を増幅してもよい。

前記音声区間判定部は、前記第１の収音信号に音声成分が含まれる確率が所定の値以上となった場合に音声区間であると判定してもよい。

前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の母音周波数成分のピークと帯域毎に設定されたノイズレベルとの比が所定の値以上であり、且つ、当該所定の値以上のピークの数が所定数以上である場合に音声区間であると判定してもよい。

前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の子音スペクトルパターンを所定の周波数帯域毎に測定し、前記周波数帯域の増加に従い前記子音スペクトルパターンが増加する場合に音声区間であると判定してもよい。

前記ノイズ低減処理部は、前記第１の収音信号に含まれているノイズ成分に対応した疑似ノイズ信号を前記第２の収音信号を用いて生成する適応フィルタを備えていてもよい。

本発明にかかる音声入力装置は、上記ノイズ低減装置を備えている。当該音声入力装置において、第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。

本発明にかかる無線通信装置は、上記ノイズ低減装置を備えている。当該無線通信装置において、第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられていてもよい。

本発明にかかるノイズ低減方法は、第１の収音信号に基づき音声区間を判定し、第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減し、前記音声区間において、前記第１の収音信号とノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出し、前記算出された変化量に応じて前記ノイズ低減処理後の信号の音圧レベルを補償する。

本発明にかかるノイズ低減プログラムは、コンピュータに、第１の収音信号に基づき音声区間を判定させ、第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減させ、前記音声区間において、前記第１の収音信号とノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出させ、前記算出された変化量に応じて前記ノイズ低減処理後の信号の音圧レベルを補償させる、ノイズ低減プログラムである。

本発明により、音圧レベルの低下を抑制することができるノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラムを提供することができる。

実施の形態にかかるノイズ低減装置を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声区間判定部の一例を示すブロック図である。実施の形態にかかるノイズ低減装置が備える音声区間判定部の他の例を示すブロック図である。実施の形態にかかるノイズ低減装置が備えるノイズ低減処理部の一例を示すブロック図である。図４に示したノイズ低減処理部を詳細に説明するための図である。実施の形態にかかるノイズ低減装置が備える音圧レベル変化量算出部の一例を示すブロック図である。実施の形態にかかるノイズ低減装置の動作の一例を説明するための図である。実施の形態にかかるノイズ低減装置の他の例を示すブロック図である。実施の形態にかかるノイズ低減装置を用いた音声入力装置の一例を示す図である。実施の形態にかかるノイズ低減装置を用いた無線通信装置の一例を示す図である。

以下、図面を参照して本発明の実施の形態について説明する。
図１は、実施の形態にかかるノイズ低減装置を示すブロック図である。図１に示すように、本実施の形態にかかるノイズ低減装置１は、音声区間判定部１１、ノイズ低減処理部１２、音圧レベル変化量算出部１３、および音圧レベル補償部１４を有する。

本実施の形態にかかるノイズ低減装置１は、主として音声成分を含む第１の収音信号（音声信号）２１および主としてノイズ成分を含む第２の収音信号（参照信号）２２を入力し、収音信号２１および収音信号２２を用いてノイズ低減処理を実施し、ノイズ低減処理後の信号を出力信号２７として出力する。例えば、収音信号２１および収音信号２２は、図８に示すノイズ低減装置１'のように、音声用マイクロフォン１６および参照音用マイクロフォン１７を用いてそれぞれ収音することができる。

図８に示す音声用マイクロフォン１６は、主に音声成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１８に出力する。参照音用マイクロフォン１７は、主にノイズ成分を含む音を収音してアナログ信号に変換し、変換後のアナログ信号をＡＤコンバータ１９に出力する。参照音用マイクロフォン１７で収音された音に含まれるノイズ成分は、音声用マイクロフォン１６で収音された音に含まれるノイズ成分を低減するために用いられる。

なお、図８に示すノイズ低減装置１'では、２つのマイクロフォンを備える構成を示しているが、例えば参照音用マイクロフォンを更に追加してマイクロフォンを３つ以上設けてもよい。つまり、図１に示すノイズ低減装置１に３つ以上の収音信号を入力するように構成してもよい。

ＡＤコンバータ１８は、音声用マイクロフォン１６から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２１を生成する。ＡＤコンバータ１９は、参照音用マイクロフォン１７から出力されたアナログ信号を所定のサンプリングレートでサンプリングしてデジタル信号に変換し、収音信号２２を生成する。

例えば、音声用マイクロフォン１６および参照音用マイクロフォン１７に入力される音声の周波数帯域は、おおよそ１００Ｈｚから４０００Ｈｚ程度である。よって、ＡＤコンバータ１８、１９におけるサンプリング周波数を８ｋＨｚ〜１２ｋＨｚ程度とすることで、音声成分を含むアナログ信号をデジタル信号として取り扱うことができる。

図１に示すように、収音信号２１は、音声区間判定部１１、ノイズ低減処理部１２、および音圧レベル変化量算出部１３に供給される。また、収音信号２２はノイズ低減処理部１２に供給される。なお、本明細書では、主に音声成分を含む収音信号２１を音声信号とも記載し、主にノイズ成分を含む収音信号２２を参照信号（ノイズ信号）とも記載する。

音声区間判定部１１は、供給された収音信号２１に基づき音声区間を判定する。そして、音声区間判定部１１は、音声区間を示す音声区間情報２３、２４を、ノイズ低減処理部１２および音圧レベル変化量算出部１３にそれぞれ出力する。

音声区間判定部１１における音声区間判定処理には任意の技術を用いることができる。なお、ノイズレベルが高い環境下でノイズ低減装置が使用される場合は、高い精度で音声区間とノイズ区間を判定することが好ましく、例えば、後述する音声ノイズ区間検出技術Ａや音声ノイズ区間検出技術Ｂを用いることで、音声区間およびノイズ区間を高い精度で検出することができる。音声には人の声以外の音も含まれるが、これらの例では、主に人の声を検出する。なお、音声ノイズ区間検出技術Ａは、一例として、特願２０１０−２６０７９８に基づく優先権を主張する出願である特願２０１１−２５４５７８にも記載されている。また、音声ノイズ区間検出技術Ｂは、一例として、特願２０１１−０２０４５９にも記載されている。

最初に、音声区間判定技術Ａについて説明する。音声区間判定技術Ａでは、音声の主要部分である母音成分の持つ周波数スペクトルに着目し、音声区間を判定している。音声区間判定技術Ａでは、適切なノイズレベルを帯域毎に設定し、母音周波数成分のピークとの信号対ノイズレベル比を求め、信号対ノイズレベル比が所定のレベル比かつ所定のピーク数であるか否かを観察することで、音声区間を判定している。

図２は、音声区間判定技術Ａを用いた音声区間判定部１１'の一例を示すブロック図である。図２に示す音声区間判定部１１'は、フレーム化部３１、スペクトル生成部３２、帯域分割部３３、周波数平均部３４、保持部３５、時間平均部３６、ピーク検出部３７、および音声判定部３８を備える。

フレーム化部３１は、収音信号２１を予め定められた時間幅を有するフレーム単位（所定サンプル数長）で順次切り出し、フレーム単位の入力信号（以下、フレーム化入力信号と称す）を生成する。

スペクトル生成部３２は、フレーム化部３１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴ（Fast Fourier Transform）やＤＣＴ（Discrete Cosine Transform）等の直交変換法を用いるとよい。本実施の形態において、スペクトル生成部３２は、少なくとも２００Ｈｚから７００Ｈｚのスペクトルパターンを生成する。

後述する音声判定部３８が音声区間を判定する際に検出する対象である、音声の特徴を示すスペクトル（以下、フォルマントと称す）には、通常、基音に相当する第１フォルマントから、その倍音部分である第ｎフォルマント（ｎは自然数）まで複数ある。このうち、第１フォルマントや第２フォルマントは２００Ｈｚ未満の周波数帯域に存在することが多い。しかし、この帯域には、低域ノイズ成分が比較的高いエネルギーで含まれているため、フォルマントが埋没し易い。また７００Ｈｚ以上のフォルマントは、フォルマント自体のエネルギーが低いため、やはりノイズ成分に埋没し易い。そのため、ノイズ成分に埋没し難い２００Ｈｚから７００Ｈｚのスペクトルパターンを音声区間の判定に用いることで、判定対象を絞り、効率的に音声区間の判定を行うことができる。

帯域分割部３３は、適切な周波数帯域単位で音声に特徴的なスペクトルを検出するため、スペクトルパターンの各スペクトルを、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域に分割する。本実施の形態において、予め定められた帯域幅は、１００Ｈｚから１５０Ｈｚ程度の帯域幅とする。

周波数平均部３４は、分割周波数帯域毎の平均エネルギーを求める。本実施の形態では、周波数平均部３４は、分割周波数帯域毎に、分割周波数帯域におけるすべてのスペクトルのエネルギーを平均するが、演算負荷軽減のためスペクトルのエネルギーの代わりにスペクトルの最大または平均振幅値（絶対値）を代用してもよい。

保持部３５は、ＲＡＭ（Random Access Memory）、ＥＥＰＲＯＭ（Electrically Erasable and Programmable Read Only Memory）、フラッシュメモリ等の記憶媒体で構成され、帯域毎の平均エネルギーを過去の予め定められた数（本実施の形態においてはＮとする）のフレーム分保持する。

時間平均部３６は、分割周波数帯域毎に、周波数平均部３４で導出された平均エネルギーの時間方向の複数のフレームに渡る平均である帯域別エネルギーを導出する。すなわち、帯域別エネルギーは、分割周波数帯域毎の平均エネルギーの時間方向の複数のフレームに渡る平均値である。また、時間平均部３６は、直前のフレームの分割周波数帯域毎の平均エネルギーに、重み付け係数と時定数を用いて平均化に準じる処理をして、帯域別エネルギーの代用値を求めてもよい。

ピーク検出部３７は、スペクトルパターンの各スペクトルと、そのスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比（ＳＮＲ：Signal to Noise ratio）を導出する。そして、ピーク検出部３７は、スペクトル毎のＳＮＲと、予め定められた第１閾値とを比較し、第１閾値を超えるか否かを判定する。ＳＮＲが第１閾値を超えるスペクトルがあると、このスペクトルをフォルマントとみなし、フォルマントが検出された旨を示す情報を、音声判定部３８に出力する。

音声判定部３８は、フォルマントが検出されたという情報をピーク検出部３７から受け付けると、ピーク検出部３７の判定結果に基づいて、該当フレームのフレーム化入力信号が音声であるか否か判定する。音声判定部３８は、フレーム化入力信号が音声であると判定した場合、ノイズ低減処理部１２および音圧レベル変化量算出部１３に音声区間情報２３、２４をそれぞれ出力する。

図２に示す音声区間判定部１１'は、分割周波数帯域毎に、その分割周波数帯域の帯域別エネルギーを設定している。そのため、音声判定部３８は、他の分割周波数帯域のノイズ成分の影響を受けずに、それぞれの分割周波数帯域毎にフォルマントの有無を精度よく判定することができる。

上述したように、フォルマントには、第１フォルマントから、その倍音部分である第ｎフォルマントまで複数ある。したがって、任意の分割周波数帯域の帯域別エネルギー（ノイズレベル）が上昇し、フォルマントの一部がノイズに埋没しても、他の複数のフォルマントを検出できる場合がある。特に、周囲ノイズは低域に集中するため、基音に相当する第１フォルマントや２倍音に相当する第２フォルマントが低域のノイズに埋没していても、３倍音以上のフォルマントを検出できる可能性がある。よって、音声判定部３８は、ＳＮＲが第１閾値を超えるスペクトルが所定数以上である場合、フレーム化入力信号が音声であると判定することで、よりノイズに強い音声区間の判定を行うことができる。

以上で説明したように、音声区間判定技術Ａを用いた音声区間判定部１１'は、入力信号を予め定められた時間幅を有するフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部３１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部３２と、スペクトルパターンの各スペクトルと、予め定められた帯域幅で分割された周波数帯域である複数の分割周波数帯域のうちスペクトルが含まれる分割周波数帯域における帯域別エネルギーとのエネルギー比が、予め定められた第１閾値を超えるか否かを判定するピーク検出部３７と、ピーク検出部の判定結果に基づいて、フレーム化入力信号が音声であるか否か判定する音声判定部３８と、スペクトルパターンの各分割周波数帯域におけるスペクトルの周波数方向の平均エネルギーを導出する周波数平均部３４と、分割周波数帯域毎に、平均エネルギーの時間方向の平均である前記帯域別エネルギーを導出する時間平均部３６と、を備える。

例えば、音声判定部３８は、エネルギー比が第１閾値を超えるスペクトルが予め定められた数以上であると、フレーム化入力信号が音声であると判定することができる。

次に、音声区間判定技術Ｂについて説明する。音声区間判定技術Ｂでは、子音の特徴であるスペクトルパターンが右上がりになる傾向があるという性質に着目して、音声区間を判定している。音声区間判定技術Ｂでは、子音のスペクトルパターンを中高域の周波数帯において測定し、更に部分的にノイズ成分によって埋没してしまった子音の周波数分布の特徴を、ノイズの影響があまり無かった帯域に特化して抽出することで、音声区間を高精度で判定することを可能にしている。

図３は、音声区間判定技術Ｂを用いた音声区間判定部１１''の一例を示すブロック図である。音声区間判定部１１''は、フレーム化部４１、スペクトル生成部４２、帯域分割部４３、平均導出部４４、ノイズレベル導出部４５、判定選択部４６、および子音判定部４７を備える。

フレーム化部４１は、収音信号２１を予め定められた時間幅を有するフレーム単位で順次切り出し、フレーム単位の入力信号であるフレーム化入力信号を生成する。

スペクトル生成部４２は、フレーム化部４１から出力されたフレーム化入力信号の周波数分析を行い、時間領域のフレーム化入力信号を周波数領域のフレーム化入力信号に変換して、スペクトルを集めたスペクトルパターンを生成する。スペクトルパターンは、所定の周波数帯域に渡って、周波数とその周波数におけるエネルギーとが対応付けられた、周波数毎のスペクトルを集めたものである。ここで用いられる周波数変換法は、特定の手段に限定しないが、音声のスペクトルを認識するために必要な周波数分解能が必要であるため、比較的分解能が高いＦＦＴやＤＣＴ等の直交変換法を用いるとよい。

帯域分割部４３は、スペクトル生成部４２が生成したスペクトルパターンの各スペクトルを、予め定められた帯域幅毎に分割し、複数の分割周波数帯域を生成する。本実施の形態において、帯域分割部４３は、例えば、８００Ｈｚ〜３．５ｋＨｚの周波数範囲について、例えば、１００Ｈｚ〜３００Ｈｚ程度の帯域幅毎に分割する。

平均導出部４４は、スペクトルパターンにおける、連接する、帯域分割部４３が分割した分割周波数帯域（バンド）毎の平均エネルギーである帯域別平均エネルギーを導出する。

子音判定部４７は、平均導出部４４が導出した帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、そのフレーム化入力信号に子音が含まれると判定する。

一般的に、子音はスペクトルパターンが右上がりになる傾向がある。そこで、音声区間判定技術Ｂを用いた音声区間判定部１１''は、スペクトルパターンにおける帯域別平均エネルギーを導出し、その帯域別エネルギー同士を比較することで子音に特徴的な、スペクトルパターンにおける右上がりの傾向を検出する。そのため、音声区間判定部１１''は、入力信号に子音が含まれる子音区間を精度よく検出することができる。

子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた第１閾値以上であると、子音が含まれると判定する第１判定手段を備える。また、子音判定部４７は、隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計測し、更にこの組み合わせが帯域を跨いで連続する場合に重み付けをして計数し、計数した計数値が、予め定められた第２閾値以上であると、子音が含まれると判定する第２判定手段を備える。子音判定部４７は、第１判定手段と第２判定手段をそれぞれノイズレベルに応じて使い分ける。

ここで、第１判定手段と第２判定手段とを適宜選択すべく、ノイズレベル導出部４５は、フレーム化入力信号のノイズレベルを導出する。例えば、ノイズレベルは、フレーム化入力信号のすべての周波数帯域の帯域別平均エネルギーの平均値とすることができる。また、ノイズレベル導出部４５は、フレーム化入力信号毎にノイズレベルを導出してもよいし、所定時間分のフレーム化入力信号のノイズレベルの平均値を用いてもよい。判定選択部４６は、導出されたノイズレベルが所定の閾値未満の場合、第１判定手段を選択し、所定の閾値以上の場合、第２判定手段を選択する。

以上で説明したように、音声区間判定技術Ｂを用いた音声区間判定部１１''は、入力信号を予め定められたフレーム単位で切り出し、フレーム化入力信号を生成するフレーム化部４１と、フレーム化入力信号を、時間領域から周波数領域に変換して、周波数毎のスペクトルを集めたスペクトルパターンを生成するスペクトル生成部４２と、スペクトルパターンにおける、連接する予め定められた帯域幅毎の平均エネルギーである帯域別平均エネルギーを導出する平均導出部４４と、導出された帯域別平均エネルギー同士を比較し、より高周波数帯域の帯域別平均エネルギー程、高いエネルギーとなっていると、フレーム化入力信号に子音が含まれると判定する子音判定部４７と、を備える。

例えば、子音判定部４７は、スペクトルパターンの隣接する帯域間の帯域別平均エネルギーが、高い周波数の帯域の方が隣接する低い周波数の帯域より大きい組み合わせを計数し、計数した計数値が、予め定められた閾値以上であると、子音が含まれると判定することができる。

なお、本実施の形態にかかるノイズ低減装置に上記の音声区間判定技術Ａ、Ｂを適用する場合、製品毎にパラメータを設定することができる。すなわち、より確実な音声区間の判定が要求される製品に音声区間判定技術Ａ、Ｂを適用する場合、音声区間判定のパラメータとしてより厳しい閾値を設定することができる。

図１に示すノイズ低減装置１が備えるノイズ低減処理部１２は、少なくとも２つの収音信号２１、２２を用いてノイズ低減処理を実施する。つまり、ノイズ低減処理部１２は、主としてノイズ成分を含む収音信号２２を用いて、主として音声成分を含む収音信号２１に含まれるノイズ成分を低減する。このように、収音信号２１に含まれるノイズ成分を低減することで、音声の聞き取りやすさを改善することができる。

図４は、本実施の形態にかかるノイズ低減装置１が備えるノイズ低減処理部１２の一例を示すブロック図である。図４に示すノイズ低減処理部１２は、適応フィルタ５１、適応係数調整部５２、および加算器５３を有する。

適応フィルタ５１は、主としてノイズ成分を含む収音信号２２を入力し、この収音信号２２を用いて、収音信号２１に含まれている可能性があるノイズ成分を擬似的に生成し、疑似ノイズ信号５５として出力する。ここで、疑似ノイズ信号５５は、収音信号２１に対して位相反転された信号である。

加算器５３は、収音信号２１と位相反転された疑似ノイズ信号５５とを加算することで、ノイズ低減処理後の信号２５を生成する。また、加算器５３は、収音信号２１と位相反転された疑似ノイズ信号５５とを加算することでフィードバック信号５６を生成し、適応係数調整部５２に出力する。

適応係数調整部５２は、音声区間情報２３に応じて、適応フィルタ５１の係数を調整する。つまり、適応係数調整部５２は、音声区間情報２３が音声区間を示さない場合（ノイズ区間の場合）、適応誤差が少なくなるように係数を調整する。一方、音声区間情報２３が音声区間を示している場合、適応フィルタ５１の係数を維持するか、または係数を微調整するのみとする。

図５は、図４に示したノイズ低減処理部１２を詳細に説明するための図である。図５では、適応フィルタ５１をＦＩＲ（Finite Impulse Response）フィルタで構成した例を示している。図５に示す適応フィルタ５１は、遅延素子６１_１〜６１_ｎ、乗算器６２_１〜６２_ｎ＋１、および加算器６３_１〜６３_ｎを備える。遅延素子６１_１〜６１_ｎ、乗算器６２_１〜６２_ｎ＋１、および加算器６３_１〜６３_ｎを用いて収音信号２２を処理することで、擬似ノイズ信号５５が生成される。

適応係数調整部５２は、乗算器６２_１〜６２_ｎ＋１の係数を調整する。つまり、適応係数調整部５２は、音声区間情報２３が音声区間を示さない場合（ノイズ区間の場合）、疑似ノイズ信号５５と収音信号２１との差分（フィードバック信号５６）が最小化されるように適応フィルタ５１の係数を調整する。これにより、適応フィルタ５１から出力される疑似ノイズ信号５５を、音声用マイクロフォンで収音された収音信号２１に含まれるノイズ成分に近づけることができる。

一方、音声区間情報２３が音声区間を示している場合は、収音信号２１に音声成分が含まれている。この場合は、音声成分の影響により適応フィルタ５１の係数がノイズ成分に適応せず収束しないおそれもある。よって、安定的に適応フィルタ５１の係数を更新するためには、音声区間情報２３が音声区間を示している場合は、適応フィルタ５１の係数を維持するか、または係数を微調整するのみとすることが望ましい。

図１に示すノイズ低減装置１が備える音圧レベル変化量算出部１３は、音声区間判定部１１から出力された音声区間情報２４が音声区間を示している場合、収音信号２１とノイズ低減処理部１２から出力されたノイズ低減処理後の信号２５とを用いて、収音信号２１に対するノイズ低減処理後の信号２５の音圧レベルの変化量を算出する。音圧レベル変化量算出部１３で算出された音圧レベル変化量２６は、音圧レベル補償部１４に出力される。

すなわち、音圧レベル変化量算出部１３は、ノイズ低減処理部１２から出力されたノイズ低減処理後の信号２５の品質が適正であるかを判定するために、収音信号２１の音圧レベルとノイズ低減処理後の信号２５の音圧レベルとを比較する。そして、音圧レベル変化量算出部１３は、収音信号２１の音圧レベルとノイズ低減処理後の信号２５の音圧レベルとの差である音圧レベル差を算出し、この音圧レベル差を音圧レベル変化量２６として出力することができる。

ノイズ低減処理部１２で用いられる適応フィルタは、参照音用マイクロフォンからみた、音声用マイクロフォンに混入するノイズ成分の音響的な空間特性フィルタを導出する。適応フィルタは、主なノイズ源が存在する方向から到来する信号成分を減衰する働きを持つ。ノイズの到来方向は、音声用マイクロフォンの位置を中心とする３次元的な方向全てに渡っており、適応フィルタの作用も全ての方向において同様となる。よって、音声用マイクロフォンに向かって話者が話している際に、話者の後方からノイズ成分が到来した場合は、ノイズの到来方向の信号成分（音声成分とノイズ成分とを含む）がキャンセルされるために、音声成分もキャンセルされることになる。また、ノイズの到来方向が異なる場合であっても、話者の音声の音声用マイクロフォンに対する進入角度とノイズ成分の音声用マイクロフォンに対する進入角度とが近似する場合は、ノイズ低減処理部１２がノイズ成分をキャンセルする際に音声成分もキャンセルしてしまうため、ノイズ低減処理後の信号２５の音圧レベルが低下してしまう。

図４や図５に示したノイズ低減処理部１２では、収音信号２１に対して位相反転された疑似ノイズ信号５５を収音信号２１と加算することでノイズ低減処理を実施している。ここで、疑似ノイズ信号５５は適応フィルタ５１の係数の精度等に依存するため、ノイズ低減処理後の信号２５の音圧レベルは、本来の音声信号である収音信号２１の音圧レベルとは一致しない。しかし、音声成分に対するキャンセル作用が僅かな場合は、ノイズ低減処理後の信号２５において大きな音圧レベルの低下は発生しない。つまり、収音信号２１とノイズ低減処理後の信号２５との音圧レベル差は発生しないか、発生したとしても極わずかとなる。本実施の形態にかかるノイズ低減装置では、音声レベル変化量算出部１３においてノイズ低減処理前の収音信号２１とノイズ低減処理後の信号２５との音圧レベル差を算出し、この音圧レベル差を所定の閾値と比較することで、ノイズ低減処理部１２において音声成分がキャンセルされている状況をモニタすることができる。

このとき、音声レベル変化量算出部１３において正確に音圧レベル変化量（音圧レベル差）を算出するには、音声が発せられている区間においてのみ、音圧レベル差を算出する必要がある。よって、音声区間判定部１１において非常に高い確率で音声と判定されている区間を音声区間とし、音声区間判定部１１から音声区間であることを示す音声区間情報２４が出力された場合に、音声レベル変化量算出部１３において音圧レベル差を算出する。ここで、音声レベル変化量算出部１３において算出される音圧レベル差は、音圧レベル補償部１４においてノイズ低減処理後の信号２５の音圧レベルを補償（調整）する際の基準値（音圧補償レベル基準値）となる。

通常、話者が音声を発話する場合は、単語の切れ目や息継ぎをするタイミングなどがあるため断続的になる。このような場合、音声区間判定部１１において音声区間であると判定されるタイミングも断続的となり、音声区間を示す音声区間情報２３、２４も離散的になる。音声の場合、局所的（単音単位）に見れば音圧レベルの強弱は大きくなる。しかし、大局的（文節単位以上）に見ると、一定の音圧レベルが保たれていると考える方が自然である。この状況は、環境ノイズについても同様である。よって、ノイズ低減処理部（適応フィルタ）１２の特性も緩やかな変化であるとみなすことができるため、離散的に取得した音圧補償レベル基準値（音圧レベル差に対応する）は、次に音声区間判定部１１において音声区間であると判定されるまで保持しておく（更新しない）ことが好ましい。

また、音声区間判定部１１における音声区間判定はある時間幅を有する信号を用いて音声であるか否かを検出するものである。よって、音圧レベル差に関する情報も、音声区間判定の場合と同様の時間幅を単位として算出することができる。例えば、収音信号２１とノイズ低減処理後の信号２５との音圧レベル差は、単位時間幅におけるパワー量を用いて算出することができる。

図６は、本実施の形態にかかるノイズ低減装置が備える音圧レベル変化量算出部１３の一例を示すブロック図である。図６に示す音圧レベル変化量算出部１３は、信号バッファ７１、信号パワー算出部７２、信号バッファ７３、信号パワー算出部７４、および音圧レベル差算出部７５を備える。図６に示す音圧レベル変化量算出部１３は、ある一定の単位時間における収音信号２１およびノイズ低減処理後の信号２５の音圧レベル差を算出することができる。また、音圧レベル変化量算出部１３は、音声区間判定部１１から出力された音声区間情報２４が音声区間を示しているタイミングで音圧レベル差を算出する。

信号バッファ７１は、単位時間分の収音信号２１を蓄積するために、供給された収音信号２１を一時的に蓄積する。信号バッファ７３は、単位時間分の信号２５を蓄積するために、供給された信号２５を一時的に蓄積する。

信号パワー算出部７２は、信号バッファ７１に蓄積された単位時間分の収音信号を用いて、単位時間当たりのパワー値を算出する。また、信号パワー算出部７４は、信号バッファ７３に蓄積された単位時間分の信号を用いて、単位時間当たりのパワー値を算出する。

ここで、単位時間当たりのパワー値とは、単位時間における収音信号２１および信号２５の大きさであり、例えば、単位時間における収音信号２１および信号２５の振幅（絶対値）の最大値や平均値、単位時間における収音信号２１および信号２５の振幅（絶対値）の積分値等を用いることができる。なお、本実施の形態では、収音信号２１および信号２５の大きさを示す値であれば、パワー値として上記の最大値や積分値以外の値を用いてもよい。

音圧レベル差算出部７５は、信号パワー算出部７２で求めた収音信号２１のパワー値と、信号パワー算出部７４で求めた信号２５のパワー値との差である音圧レベル差を算出し、算出された音圧レベル差を音圧レベル変化量２６として音圧レベル補償部１４に出力する。

音圧レベル補償部１４は、音圧レベル変化量算出部１３で算出された音圧レベル変化量２６に応じて、ノイズ低減処理後の信号２５の音圧レベルを補償（調整）する。例えば、音圧レベル補償部１４は、収音信号２１の音圧レベルとノイズ低減処理後の信号２５の音圧レベルとの差である音圧レベル差の絶対値が所定の閾値以上となった場合に、ノイズ低減処理後の信号２５の音圧レベルを補償する。このとき、例えば、音圧レベル補償部１４は、音圧レベル差に対応した増幅率でノイズ低減処理後の信号２５を増幅してもよい。また、音圧レベル補償部１４は、急なゲイン調整を抑制するために、音圧レベル差が所定の上限値を超えた場合は、当該上限値に対応した増幅率でノイズ低減処理後の信号２５を増幅するようにしてもよい。

また、音圧レベル変化量算出部１３から音圧レベル変化量２６として出力される音圧レベル差は、時間方向において階段状に変化する。よって、音圧レベル補償部１４においてノイズ低減処理後の信号２５の音圧レベルを補償（調整）する際に、音圧レベル差を基準値（音圧補償レベル基準値）としてそのまま用いると、調整後の出力信号２７の変動が大きくなる。また、ノイズ成分の急激な変動は聞く側に聴感的に耳障りな印象を与えてしまうため、音圧レベルの変動を滑らかにする緩和処理を実施することが好ましい。つまり、音圧レベル補償部１４は、音圧レベル差に対応した増幅率でノイズ低減処理後の信号を増幅した後、この増幅率を徐々に低減させる緩和処理（スムージング処理）を実施してもよい。この緩和処理は、図７に示すような音圧補償レベル基準値９２による階段状の波形に対して、例えばローパスフィルタ処理を施すことや、後述する音圧レベル調整値９３を徐々に低減させる処理を行うことで実現できる。

次に、本実施の形態にかかるノイズ低減装置１の動作について説明する。図７は、本実施の形態にかかるノイズ低減装置１の動作の一例を説明するための図である。図７では、ノイズ低減処理部１２の適応フィルタにおいて好ましくない疑似ノイズ信号５５が生成されたために、ノイズ低減処理後の信号２５の音圧レベルが低下した際の、音声区間と判定されたタイミング（各々、矢印９１で示す）、音圧補償レベル基準値（各々、黒丸９２で示す）、および実際に用いる音圧レベル調整値９３を時間軸方向に示している。

ここで、音声区間と判定されたタイミング（各々、矢印９１で示す）は、音声区間判定部１１において音声区間と判定されたタイミングであり、より好ましくは、高確率で音声と判定されたタイミングである。例えば、音声区間であるか否かを判定するための閾値を調整し、収音信号２１に音声成分が含まれると判定されにくくすれば、より音声らしい区間（音声である確率が高い区間）を検出できる。また、音圧補償レベル基準値（各々、黒丸９２で示す）は、音圧レベル変化量算出部１３から音圧レベル変化量２６として出力された音圧レベル差である。つまり、音圧補償レベル基準値は、音圧レベル補償部１４において音圧レベルの補償を実施する際の増幅率を決定する際の基準値となる。また、音圧レベル調整値９３は、音圧レベル補償部１４において音圧レベルを補償する際の増幅率、つまり、ノイズ低減処理後の信号２５を増幅する際の増幅率に対応している。

また、図７では、音圧レベル補償部１４において音圧レベルの変動を滑らかにする緩和処理を実施している場合を示している。つまり、音圧レベル調整値９３の変動を滑らかにするために、音圧レベル調整値９３を音圧レベル差（音圧補償レベル基準値）に対応した値に設定した後、この設定された音圧レベル調整値９３が徐々に低減するようにしている。なお、本実施形態においては、音圧レベル調整値９３を音圧レベル差に対応した値に設定する際も、緩やかに変動させている。

更に、図７では、音圧レベルを補償する際の音圧レベル差の閾値を＋６ｄＢとしている。つまり、音圧レベル差が＋６ｄＢよりも小さい場合（０ｄＢも含む）は、音圧レベルの補償を実施しない。ただし、音圧レベル差の絶対値が＋６ｄＢよりも小さい場合であっても、図７に示すタイミングＧ、Ｈなどのように、音圧レベル調整値９３を徐々に低減させている途中の場合は、低減中の音圧レベル調整値９３を用いて音圧レベルを補償する。

また、図７では、音圧レベル調整値９３の上限値を＋１２ｄＢとしている。つまり、＋１２ｄＢを超える音圧レベル差を検出しても、実際に用いる音圧レベル調整値は＋１２ｄＢに抑えている。このように、音圧レベル調整値に上限値を設けたのは、音圧レベル補償部１４において、ノイズ低減処理後の信号２５が過度な増幅率で増幅されることを抑制するためである。なお、上記で説明した音圧レベル差の閾値および音圧レベル調整値９３の上限値は一例であり、これらの値は任意に設定することができる。

次に、図７に示す動作について具体的に説明する。音声区間と判定されたタイミングＡでは、音圧補償レベル基準値（音圧レベル差）が閾値である＋６ｄＢよりも小さいため、音圧レベルの補償は実施されない。

音声区間と判定されたタイミングＢでは、音圧補償レベル基準値が閾値である＋６ｄＢ以上であるため、音圧レベル補償部１４において音圧レベルが補償される。このとき、音圧レベル調整値９３が０ｄＢから音圧補償レベル基準値と同一の値となるように調整される。タイミングＢは音声区間であるため、ノイズ低減処理後の信号２５は多くの音声成分を含む信号である。よって、音圧レベル調整値９３を比較的急峻に立ち上げても、音質的な違和感を与えることは少ない。また、ノイズ低減処理後の信号２５に含まれるノイズ成分は少ないため、音圧レベル調整値９３を急峻に立ち上げても、ノイズ成分に起因する不連続感等の違和感を与える可能性は低い。

また、タイミングＢでは、音圧レベル調整値９３を音圧補償レベル基準値と同一の値へと調整した後、一定期間、調整後の音圧レベル調整値９３を保持し、その後、徐々に音圧レベル調整値９３を低減させている。このように、徐々に音圧レベル調整値９３を低減させることで、出力信号２７の音圧レベルの変動を滑らかにすることができる。よって、ノイズ成分の変動による違和感の軽減とノイズ低減処理の効果の両立を図ることができる。

音声区間と判定されたタイミングＣ、Ｄ、Ｅでは、音圧補償レベル基準値（音圧レベル差）が閾値である＋６ｄＢ以上であるため、音圧レベル補償部１４において音圧レベルが補償される。この場合も、音圧レベル調整値９３が各々の音圧補償レベル基準値と同一の値となるように調整される。また、タイミングＣ、Ｄ、Ｅでは、音圧レベル調整値９３を各々の音圧補償レベル基準値と同一の値へと調整した後、一定期間、調整後の音圧レベル調整値９３を保持し、その後、徐々に音圧レベル調整値９３を低減させている。

音声区間と判定されたタイミングＦでは、音圧補償レベル基準値（音圧レベル差）が閾値である＋６ｄＢ以上であり、更に音圧レベル調整値９３の上限値である＋１２ｄＢを超えている。この場合は、音圧レベル調整値９３が上限値である＋１２ｄＢに抑えられる。ノイズ低減処理部１２を用いても所望のノイズ低減効果が得られない状況下では、適応フィルタ５１で生成される疑似ノイズ信号５５の影響により、ノイズ低減処理後の信号２５に含まれる音声信号の音圧レベルが不安定となる可能性が高い。よって、音圧レベル調整値９３に上限値を設けることで、ノイズ低減処理後の信号２５が音圧レベル補償部１４において過度な増幅率で増幅されることを抑制することができる。

また、タイミングＦでは、音圧レベル調整値９３を＋１２ｄＢへと調整した後、一定期間、調整後の音圧レベル調整値９３を保持し、その後、徐々に音圧レベル調整値９３を低減させている。

音声区間と判定されたタイミングＧでは、音圧補償レベル基準値（音圧レベル差）は閾値である＋６ｄＢよりも小さい。タイミングＧは、音圧レベル調整値９３を徐々に低減させている途中であるので、音圧レベル調整値９３が音圧補償レベル基準値を超えている。このとき、音圧レベル調整値９３を音圧補償レベル基準値と同一とすると、必要以上に音圧レベル調整値９３を下げることになり、音圧レベルの変動が急激となる。よって、この場合、音圧レベル補償部１４は、低減途中の音圧レベル調整値９３を用いて音圧レベルを補償する。

音声区間と判定されたタイミングＨでは、音圧補償レベル基準値（音圧レベル差）は閾値である＋６ｄＢよりも小さい。しかし、タイミングＨは、音圧レベル調整値９３を徐々に低減させている途中であるので、低減中の音圧レベル調整値９３を用いて音圧レベルを補償する。

音声区間と判定されたタイミングＩ、Ｊ、Ｋでは、音圧補償レベル基準値（音圧レベル差）は閾値である＋６ｄＢよりも小さい。また、音圧レベル調整値９３も０ｄＢとなっているので、音圧レベル補償部１４は、音圧レベルの補償を実施しない。

高確率で音声と判定される音声区間は、文節において強い母音などの音声を検出できる区間であることが望ましい。このような音声区間では、他の部分よりもノイズの影響を受けにくく、音圧レベル差を取得するにはよい時間帯であるといえる。また、図７に示した音圧レベル補償処理は、文節全体にわたる数秒から数十秒間の変化の軌跡である。このとき、音声区間（強い音声部分）では本来の音圧レベルに引き上げられ、他の部分では増幅率を徐々に低減させる緩和処理により音圧レベルの急激な変動を抑えることができる。よって、音圧レベル補償部１４において音圧レベル補償処理が施された後の出力信号２７は、良好な音声信号となる。

背景技術で説明したように、ノイズ低減処理技術では、例えば、音声を主に収音するマイクロフォンによって収音された音声信号から、ノイズを主に収音するマイクロフォンによって収音されたノイズ信号（参照信号）を差し引くことで、音声信号に含まれるノイズ成分を除去している。

しかしながら、主として音声成分を含む音声信号と主としてノイズ成分を含む参照信号とを用いてノイズ低減処理を実施する場合、ノイズ低減装置の使用状況によっては、参照信号に音声成分も混入する場合があった。このように、参照信号に音声成分が混入すると、ノイズ低減処理を実施した際に音声信号に含まれる音声成分もキャンセルされてしまい、ノイズ低減処理後の信号の音圧レベルが低下するという問題があった。

すなわち、例えば、作業用機械の動作音などのかなり大きな騒音が発生している工場内や雑踏や交差点などで用いられることが多い、トランシーバーのような携帯型の無線通信装置（図１０参照）では、マイクロフォンに混入するノイズ成分の低減が必要となる。携帯電話と違い、本体側のスピーカーから送信される音声を耳元から離した状態で聞くといった使われ方をする無線通信装置は、一般的に身体から離れた状態で所持する。また、無線通信装置の持ち方にも様々なスタイルがある。

更に、無線通信装置本体から収音部と再生部を分離し携帯性を高めたスピーカーマイクロフォン装置（図９に示す音声入力装置を参照）は、利便性のある使用形態を提供可能である。例えば、音声入力装置を首からぶら下げたり肩に置いたりなど、話者がマイクロフォンに向かうこと意識することなく会話を行うような使用形態や、音声入力装置の表側よりむしろ音声入力装置の背面に近い方向からしゃべるような使用形態もある。このような場合は、音声の到来方向は理想的な到来方向（例えば、音声用マイクロフォンの正面方向）とはならない。

したがって、トランシーバー（音声入力装置や無線通信装置）のような装置に対して適応フィルタを用いたノイズ低減処理を実施する場合は、参照信号にも音声成分が含まれることを前提としなければならず、音声信号の音圧レベルの低下を抑制する技術が必要となる。

前述の特許文献１には、適応フィルタにおけるフィルタ係数を観察し、音声成分が打ち消される状態を検出することで、音声の明瞭性を維持する方法が開示されている。この方法によれば、主として音声を収音する音声用マイクロフォンと、音声の到来方向に対し感度が低い主としてノイズを収音する参照音用マイクロフォンを配置している。そして、適応フィルタにて処理をする際に、音声の到来方向に近い成分をノイズキャンセル信号として生成する状況になった場合、適応フィルタ係数全体にかかる利得因子を調整して適応フィルタ処理に制限をかけることで、音声成分の音圧レベルの低下を防止している。

しかしながら、特許文献１にかかる技術では、音声用マイクロフォン側に音源が存在することを前提としている。また、参照音用マイクロフォンに指向性を持たせているため、参照音用マイクロフォンに音声成分が混入する可能性があるトランシーバーで使用することは困難である。

また、前述の特許文献２にかかる技術では、誤差信号の音圧レベルまたは入力信号の音圧レベルを調整することで音声信号の音圧レベルの低下を防止している。しかしながら、音声の音圧レベルを維持するために雑音信号である誤差信号の音圧レベルを制御するか、又は雑音信号が混入した入力信号（遅延信号を含む）の音圧レベルを制御するかの何れかを実施するため、音声信号の音圧レベルを維持する一方、ノイズ低減効果が得られないという問題がある。

更に、特許文献２に開示されている適応フィルタを用いたノイズ低減処理では、自らの信号を用いてフィルタリング処理によるノイズキャンセル処理を実施している。このため、混入する音声信号の影響を強く受け、音声信号区間中のノイズ成分を減ずることができない。また、システムの構成上、適応フィルタ出力信号に誤差信号を加算してシステム出力信号としている。しかし、音声信号区間中の適応フィルタ出力信号若しくは入力信号と誤差信号をそのまま加算してもノイズ低減効果は得られず、音圧レベル制御を付加したからといって音声の明瞭度は向上しない。

このように、特許文献１や特許文献２に開示されている技術を用いたとしても、音声の音圧レベルを十分に維持することができないという問題があった。

そこで本実施の形態にかかるノイズ低減装置では、高い確率で音声と判定されている音声区間において、収音信号２１に対するノイズ低減処理後の信号２５の音圧レベルの変化量（音圧レベル差）を音圧レベル変化量算出部１３で算出し、音圧レベル補償部１４において、音圧レベル変化量算出部１３で算出された変化量（音圧レベル差）に応じてノイズ低減処理後の信号２５の音圧レベルを補償している。

よって、本実施の形態にかかるノイズ低減装置では、ノイズ低減処理後の信号２５の音圧レベルが低下した場合に、音圧レベル変化量算出部１３で算出された変化量（音圧レベル差）に対応した増幅率でノイズ低減処理後の信号２５を増幅することができるので、出力信号２７の音圧レベルの低下を抑制することができる。

また、本実施の形態にかかるノイズ低減装置では、音圧レベルの変動を滑らかにする緩和処理を実施してもよい。つまり、音圧レベル補償部１４は、音圧レベル差に対応した増幅率でノイズ低減処理後の信号２５を増幅した後、この増幅率を徐々に低減させる緩和処理を実施してもよい。このような処理を実施することで、音圧レベル変化量算出部１３から出力された音圧レベル差が時間方向において階段状に変化した場合であっても、出力信号２７が大きく変動することを抑制することができる。これにより、ノイズ成分の急激な変動を抑制することができ、聴感上の違和感を抑制することができる。よって、様々な環境下においても十分なノイズ低減効果を発揮しつつ、音声の明瞭度を向上させることができるノイズ低減装置を提供することができる。

次に、本実施の形態にかかるノイズ低減装置を用いた音声入力装置について説明する。図９は、本実施の形態にかかるノイズ低減装置を用いた音声入力装置５００の一例を示す図である。図９（ａ）は、音声入力装置５００の前面図であり、図９（ｂ）は、音声入力装置５００の背面図である。図９に示すように、音声入力装置５００はコネクタ５０３を介して無線通信装置５１０に接続可能に構成されている。無線通信装置５１０は一般的な無線機であり、所定の周波数において他の無線通信装置と通信可能に構成されている。無線通信装置５１０には音声入力装置５００を介して話者の音声が入力される。

音声入力装置５００は、本体５０１、コード５０２、及びコネクタ５０３を有する。本体５０１は、話者の手で把持されるのに適するサイズ及び形状に構成されており、マイクロフォン、スピーカー、電子回路、ノイズ低減装置を内蔵する。図９（ａ）に示すように、本体５０１の前面にはスピーカー５０６および音声用マイクロフォン５０５が設けられている。図９（ｂ）に示すように、本体５０１の背面には参照音用マイクロフォン５０８およびベルトクリップ５０７が設けられている。本体５０１の頂面には、ＬＥＤ５０９が設けられている。本体５０１の側面にはＰＴＴ（Push To Talk）５０４が設けられている。ＬＥＤ５０９は、音声入力装置５００による話者の音声の検出状態を話者に対して報知する。ＰＴＴ５０４は、無線通信装置５１０を音声送信状態とするためのスイッチであり、突起状部分が筐体内に押し込まれることを検出する。

本実施の形態にかかるノイズ低減装置１'（図８参照）は音声入力装置５００に内蔵されており、ノイズ低減装置１'が備える音声用マイクロフォン１６が音声入力装置５００の音声用マイクロフォン５０５に対応し、ノイズ低減装置１'が備える参照音用マイクロフォン１７が音声入力装置５００の参照音用マイクロフォン５０８に対応している。また、ノイズ低減装置１'から出力される出力信号２７は、音声入力装置５００のコード５０２を経由して無線通信装置５１０に供給される。すなわち、音声入力装置５００は、ノイズ低減装置１'でノイズ低減処理された後の出力信号２７を、無線通信装置５１０に供給する。よって、無線通信装置５１０から他の無線通信装置に送信される音声はノイズ低減処理された音声となる。なお、図８のような実施形態において、無線通信装置５１０にノイズ低減装置１を内蔵するような構成にしてもよい。

次に、本実施の形態にかかるノイズ低減装置を用いた無線通信装置（トランシーバー）６００について説明する。図１０は、本実施の形態にかかるノイズ低減装置を用いた無線通信装置６００の一例を示す図である。図１０（ａ）は、無線通信装置６００の前面図であり、図１０（ｂ）は、無線通信装置６００の背面図である。図１０に示すように、無線通信装置６００は、入力ボタン６０１、表示部６０２、スピーカー６０３、音声用マイクロフォン６０４、ＰＴＴ（Push To Talk）６０５、スイッチ６０６、アンテナ６０７、参照音用マイクロフォン６０８、および蓋６０９を備える。

本実施の形態にかかるノイズ低減装置１'（図８参照）は無線通信装置６００に内蔵されており、ノイズ低減装置１'が備える音声用マイクロフォン１６が無線通信装置６００の音声用マイクロフォン６０４に対応し、ノイズ低減装置１'が備える参照音用マイクロフォン１７が無線通信装置６００の参照音用マイクロフォン６０８に対応している。また、ノイズ低減装置１'から出力される出力信号２７は、無線通信装置６００の内部回路において高周波処理されて、アンテナ６０７から他の無線通信装置に無線送信される。ここで、ノイズ低減装置１'から出力される出力信号２７はノイズ低減処理が実施された信号であるので、他の無線通信装置に送信される音声はノイズ低減処理された音声となる。ユーザによるＰＴＴ６０５の押下により音の送信が開始されたときに、ノイズ低減処理を開始し、ユーザがＰＴＴ６０８の押下を中止して、音の送信が終了したときに、ノイズ低減処理を終了しても良い。

以上、本発明を上記実施形態に即して説明したが、上記実施形態の構成にのみ限定されるものではなく、本願特許請求の範囲の請求項の発明の範囲内で当業者であればなし得る各種変形、修正、組み合わせを含むことは勿論である。例えば、音声用マイクロフォン１１と参照音用マイクロフォン１２とを機器上部（又は下部）のほぼ同じ位置に設けて、指向性が異なるようにこれらのマイクロフォンを配置してもよい。例えば、音声用マイクロフォン１１と参照音用マイクロフォン１２の指向性が１８０°異なるように配置することが好ましい。

１ノイズ低減装置
１１音声区間判定部
１２ノイズ低減処理部
１３音圧レベル変化量算出部
１４音圧レベル補償部
１６音声用マイクロフォン
１７参照音用マイクロフォン
２１収音信号（音声信号）
２２収音信号（参照信号）
２３、２４音声区間情報
２５ノイズ低減処理後の信号
２６音圧レベル変化量（音圧レベル差）
２７出力信号

Claims

第１の収音信号に基づき音声区間を判定する音声区間判定部と、
第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減するノイズ低減処理部と、
前記音声区間において、前記第１の収音信号と前記ノイズ低減処理部から出力されたノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出する音圧レベル変化量算出部と、
前記音声区間判定部において音声区間と判定された場合、前記音圧レベル変化量算出部で算出された変化量に基づいた増幅率で前記ノイズ低減処理後の信号の音圧レベルを所定時間継続して増幅した後、前記増幅率を徐々に低減させる音圧レベル補償部と、を備える、
ノイズ低減装置。
前記音圧レベル補償部は、前記第１の収音信号の音圧レベルと前記ノイズ低減処理後の信号の音圧レベルとの差である音圧レベル差の絶対値が所定の閾値以上の場合に、前記ノイズ低減処理後の信号の音圧レベルを増幅する、請求項１に記載のノイズ低減装置。
前記音圧レベル補償部は、前記音圧レベル差が所定の上限値を超えた場合、当該上限値に対応した増幅率で前記ノイズ低減処理後の信号を増幅する、請求項２に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に音声成分が含まれる確率が所定の値以上となった場合に音声区間であると判定する、請求項１乃至３のいずれか一項に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の母音周波数成分のピークと帯域毎に設定されたノイズレベルとの比が所定の値以上であり、且つ、当該所定の値以上のピークの数が所定数以上である場合に音声区間であると判定する、請求項１乃至３のいずれか一項に記載のノイズ低減装置。
前記音声区間判定部は、前記第１の収音信号に含まれる音声成分の子音スペクトルパターンを所定の周波数帯域毎に測定し、前記周波数帯域の増加に従い前記子音スペクトルパターンが増加する場合に音声区間であると判定する、請求項１乃至３のいずれか一項に記載のノイズ低減装置。
前記ノイズ低減処理部は、前記第１の収音信号に含まれているノイズ成分に対応した疑似ノイズ信号を前記第２の収音信号を用いて生成する適応フィルタを備える、請求項１乃至６のいずれか一項に記載のノイズ低減装置。
請求項１乃至７のいずれか一項に記載のノイズ低減装置を備えた音声入力装置。
第１のマイクロフォンは前記音声入力装置の第１の面に設けられ、
第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、請求項８に記載の音声入力装置。
請求項１乃至７のいずれか一項に記載のノイズ低減装置を備えた無線通信装置。
第１のマイクロフォンは前記無線通信装置の第１の面に設けられ、
第２のマイクロフォンは、前記第１の面と所定の距離を隔てて対向している第２の面に設けられている、請求項１０に記載の無線通信装置。
第１の収音信号に基づき音声区間を判定し、
第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減し、
前記音声区間において、前記第１の収音信号とノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出し、
前記音声区間と判定された場合、前記算出された変化量に基づいた増幅率で前記ノイズ低減処理後の信号の音圧レベルを所定時間継続して増幅した後、前記増幅率を徐々に低減させる、
ノイズ低減方法。
コンピュータに、
第１の収音信号に基づき音声区間を判定させ、
第２の収音信号を用いて前記第１の収音信号に含まれるノイズ成分を低減させ、
前記音声区間において、前記第１の収音信号とノイズ低減処理後の信号とを用いて、前記第１の収音信号に対する前記ノイズ低減処理後の信号の音圧レベルの変化量を算出させ、
前記音声区間と判定された場合、前記算出された変化量に基づいた増幅率で前記ノイズ低減処理後の信号の音圧レベルを所定時間継続して増幅させた後、前記増幅率を徐々に低減させる、
ノイズ低減プログラム。