[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5493850B2 - 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム - Google Patents

信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム Download PDF

Info

Publication number
JP5493850B2
JP5493850B2 JP2009298951A JP2009298951A JP5493850B2 JP 5493850 B2 JP5493850 B2 JP 5493850B2 JP 2009298951 A JP2009298951 A JP 2009298951A JP 2009298951 A JP2009298951 A JP 2009298951A JP 5493850 B2 JP5493850 B2 JP 5493850B2
Authority
JP
Japan
Prior art keywords
range
sound
phase difference
frequency
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009298951A
Other languages
English (en)
Other versions
JP2011139378A (ja
Inventor
直司 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009298951A priority Critical patent/JP5493850B2/ja
Priority to DE102010055476.6A priority patent/DE102010055476B4/de
Priority to US12/977,341 priority patent/US20110158426A1/en
Publication of JP2011139378A publication Critical patent/JP2011139378A/ja
Application granted granted Critical
Publication of JP5493850B2 publication Critical patent/JP5493850B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、音信号の雑音抑圧処理に関し、特に、周波数領域における音信号の雑音抑圧処理に関する。
マイクロホン・アレイは、少なくとも2つのマイクロホンを含むアレイを用い、受音して変換された音信号を処理することによって、所望の目的音の音源方向に受音範囲を設定しまたは指向性を制御し、雑音抑圧または目的音強調を行うことができる。
既知のマイクロホン・アレイ装置においてS/N(信号対ノイズ)比を向上させるために、複数のマイクロホンからの受音信号の間の時間差に基づいて、指向性を制御し、減算処理または加算処理を行う。それによって、目的音の受音方向と異なる方向または抑圧方向から到来する音波中の不要な雑音が抑圧され、目的音の受音方向と同じ方向または強調方向から到来する音波中の目的音を強調できる。
例えば、自動車に搭載されるカーナビゲーション・システムにおいて使用される音声認識装置に設けられるマイクロホンの指向特性を制御する既知の或る装置において、平面音波を入力する複数のマイクロホンが直線的に等間隔に配置される。また、話者の音声がマイクロホンに到達する時には、球面波である音声がほぼ平面波になる位置にマイクロホンを設置し、音声が平面波であると仮定する。マイクロホン回路が、複数のマイクロホンの出力信号を処理して各マイクロホンに入力する平面音波の位相の相違に基づいて話者の方向に対して感度がピークとなり且つ騒音の到来する方向に対して感度が低くなるようにマイクロホンの指向特性を制御する。
既知の或る複数物体位置検出装置は、所定間隔に配置された2つのマイクロホンとプリアンプにより得られた2チャンネルの音響信号による位相差スペクトルを求める音響計測装置を含んでいる。その検出装置は、さらに、音響計測装置で求めた位相差スペクトルから推定可能な全ての音源方向の計算を行い、音源推定方向の周波数特性を求め、その求めた音源推定方向の周波数特性から周波数軸に平行な直線成分を抽出する演算処理装置を含んでいる。それによって、複数の音源の方向は、予め空間内の伝達特性を計測する必要がなく、反響のある実環境で音源とマイクとの距離に依存せずに確実に特定できる。
既知の或る音響信号処理装置において、音響信号入力部に入力されたマイクロホンの2つの振幅データは周波数分解部により解析され、2次元データ化部により両者の位相差が周波数毎に求められる。周波数毎の位相差は2次元の座標値を与えられて2次元データ化される。図形検出部は、生成されたXY平面上の2次元データを解析して図形を検出する。音源情報生成部は、検出された図形の情報を処理し、音響信号の発生源たる音源の数、各音源の空間的な存在範囲、各音源が発した音の時間的な存在期間、各音源音の成分構成、各音源の分離音声、各音源音声の記号的内容を含む音源情報を生成する。それによって、音源への制約を緩和しつつ、マイクロホン数以上の音源を扱うことができる。
特開平11−298988号公報 特開2003−337164号公報 特開2006−254226号公報
複数の音入力部を有する音信号処理では、目的音の受音方向とは逆の方向に抑圧方向が形成できるように、各音信号を時間領域で処理して、各音信号のサンプルの遅延および減算を行う。この処理では、その抑圧方向からの雑音は充分に抑圧することができる。しかし、例えば車内の走行雑音および雑踏の雑音などの背景雑音の到来方向が複数ある場合には抑圧方向からの背景雑音の到来方向が複数あり、その方向も時間的に変化し、音入力部の間の特性の差によっても音源方向が変化する。そのような場合は、その雑音を充分に抑圧することができない。
本発明の実施形態の目的は、背景雑音の到来方向が複数あってもまたは音源方向が変化しても、目的音が存在する限定された受音範囲の、雑音が抑圧された音信号を生成することである。
本発明の実施形態の一観点によれば、信号処理装置は、少なくとも2つの音入力部と、その少なくとも2つの音入力部から入力された時間領域の音信号のうちの2つの音信号を用いて、それぞれ、周波数領域のスペクトル信号に変換する直交変換部と、その変換された周波数領域の2つのスペクトル信号間の位相差を求める計算部と、係数を有する周波数の関数として表されるその求められた位相差の前記係数に応じて、周波数毎の位相差に対して雑音抑圧範囲を決定する抑圧範囲決定部と、各周波数におけるその求められた位相差がその抑圧範囲にある場合に、周波数毎にその2つのスペクトル信号のうちの第1のスペクトル信号の各成分を移相して、移相されたスペクトル信号を生成し、その移相されたスペクトル信号とその2つのスペクトル信号のうちの第2のスペクトル信号とを合成して、濾波済みのスペクトル信号を生成するフィルタ部と、を含んでいる。
本発明の実施形態によれば、目的音が存在する限定された受音範囲の、雑音が抑圧された音信号を生成することができる。
図1は、実施形態において用いられる、それぞれ音入力部または音信号入力部としての少なくとも2つのマイクロホンのアレイの配置の例を示している。 図2は、実施形態による、図1の実際のマイクロホンを含むマイクロホン・アレイ装置の概略的構成の例を示している。 図3Aは、図1のマイクロホンのアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置の概略的構成の例の第1の部分を示している。 図3Bは、図1のマイクロホンのアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置の概略的構成の例の第2の部分を示している。 図3Cは、目的音源の音信号区間の電力スペクトルと雑音区間の電力スペクトルの例を示している。 図4は、図1のマイクロホン・アレイの配置による、位相差計算部によって計算された周波数毎の位相スペクトル成分の位相差と、初期設定状態における受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図5Aは、受音範囲限定状態における、位相差の統計的な平均の傾きD(f)に対する、限定された受音範囲、移行範囲および抑圧範囲の設定状態の例を示している。 図5Bは、受音範囲限定状態における、別の傾きに対する、限定された受音範囲、移行範囲および抑圧範囲の設定状態の例を示している。 図5Cは、受音範囲限定状態における、さらに別の傾きに対する、限定された受音範囲、移行範囲および抑圧範囲の設定状態の例を示している。 図5Dは、受音範囲限定状態における、さらに別の傾きに対する、受音範囲、抑圧範囲および移行範囲の設定状態の例を示している。 図5Eは、受音範囲限定状態における、さらに別の傾きに対する、限定された受音範囲、移行範囲および抑圧範囲の設定状態の例が示を示している。 図6Aは、受音範囲限定状態における、位相差の或る傾きにおける、周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図6Bは、受音範囲限定状態における、位相差の別の傾きにおける、周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図6Cは、受音範囲限定状態における、位相差のさらに別の傾きにおける、周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図6Dは、受音範囲限定状態における、位相差のさらに別の傾きにおける、周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図6Eは、受音範囲限定状態における、位相差のさらに別の傾きにおける、周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係の例を示している。 図7は、メモリに格納されたプログラムに従って図3Aおよび3Bのディジタル信号プロセッサ(DSP)によって実行される複素スペクトルの生成のためのフローチャートの例を示している。 図8Aは、図1のマイクロホンのアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置の別の概略的構成の例の第1の部分を示している。 図8Bは、図1のマイクロホンのアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置の別の概略的構成の例の第2の部分を示している。 図9は、メモリに格納されたプログラムに従って図8Aおよび8Bのディジタル信号プロセッサによって実行される複素スペクトルの生成のための別のフローチャートの例を示している。 図10Aおよび10Bは、センサのデータまたはキー入力データに基づいて設定された最大受音範囲の設定状態の例を示している。
発明の目的および利点は、請求の範囲に具体的に記載された構成要素および組み合わせによって実現され達成される。
前述の一般的な説明および以下の詳細な説明は、典型例および説明のためのものであって、本発明を限定するためのものではない。
本発明の非限定的な実施形態を、図面を参照して説明する。図面において、同様の構成要素には同じ参照番号が付されている。
図1は、実施形態において用いられる、それぞれ音入力部または音信号入力部としての少なくとも2つのマイクロホンMIC1、MIC2、...のアレイの配置の例を示している。
一般的には、複数のマイクロホンMIC1、MIC2、...のアレイが、直線上に互いに既知の距離dだけ離して配置される。ここでは、例として、隣接する少なくとも2つのマイクロホンMIC1およびMIC2が直線上に互いに距離dだけ離して配置されているものとする。複数のマイクロホンの隣接間の距離は、等しい必要はなく、以下で説明するようにサンプリング定理を満たせば、既知の異なる距離であってもよい。
実施形態では、複数のマイクロホンの内のマイクロホンMIC1およびMIC2の2つのマイクロホンを用いた例について説明する。
図1において、角度方向の中心は2つのマイクロホンを結ぶ線分の中点に位置すると仮定する。図1において、主要な目的音源SSは、マイクロホンMIC1とMIC2を結ぶ直線上にあり、マイクロホンMIC1の左側にあり、目的音源SSの方向(−π/2)をマイクロホン・アレイMIC1およびMIC2の主要な受音方向または目的方向とする。例えば、その受音目的の音源SSは話者の口であり、受音方向は話者の口の方向である。受音角度方向付近の角度範囲を受音角度範囲Rs=Rsmaxとしてもよい。ここで、Rsmaxは、初期設定状態における最大の受音角度範囲Rsを表す。
また、受音方向とは逆の方向(+π/2)を雑音の主要な抑圧方向とし、主要抑圧角度方向付近の角度範囲を雑音の抑圧角度範囲Rn=Rnminとしてもよい。ここで、Rnminは、初期設定状態における最小の抑圧角度範囲Rnを表す。
初期設定状態における受音角度範囲Rs=Rsmaxの隣接部分には、雑音抑圧量を抑圧角度範囲Rnに近づくに従って徐々に増強するための移行(切換)角度範囲Rt=Riが設けられる。ここで、Rtiは、初期設定状態における移行角度範囲Rtを表す。移行角度範囲Rtiに隣接して残りの角度範囲に最小の抑圧角度範囲Rn=Rnminが設けられる。移行角度範囲Rtと抑圧角度範囲Rnの間の角度境界はθaで表され、受音角度範囲Rsと移行角度範囲Rtの間の角度境界はθbで表されている。受音角度範囲Rs(以下、単に受音範囲という)、移行角度範囲Rt(以下、単に移行範囲という)および雑音の抑圧角度範囲Rn(以下、単に抑圧範囲という)は周波数f毎に決定することもできる。
マイクロホンMIC1とMIC2の間の距離dは、サンプリング定理またはナイキスト定理を満たすように、距離d<音速c/サンプリング周波数fsの条件を満たすように設定されることが好ましい。図1において、マイクロホン・アレイMIC1およびMIC2の指向特性または指向性パターン(例えば、カーディオイド形である単一指向性)が閉じた破線の曲線で示されている。マイクロホン・アレイMIC1、MIC2によって受音され変換された入力音信号は、マイクロホン・アレイMIC1、MIC2を通る直線に対する音波の入射角度θ(=−π/2〜+π/2)に依存し、その直線に垂直な平面上の半径方向の入射方向(0〜2π)には依存しない。即ち、図1において、受音範囲Rs、移行範囲Rtおよび抑圧範囲Rnを含む単位球体は、マイクロホンMIC1およびMIC2を通る直線について、回転対称である。
目的音源SSの音または音声は、右側のマイクロホンMIC2において、その左側のマイクロホンMIC1よりも遅延時間τ=d/cだけ遅延して検出される。一方、主要抑圧方向の雑音N1は、左側のマイクロホンMIC1において、その右側のマイクロホンMIC2よりも遅延時間τ=d/cだけ遅延して検出される。その主要抑圧方向の抑圧角度範囲Rn内のずれた抑圧方向の雑音N2は、左側のマイクロホンMIC1において、その右側のマイクロホンMIC2よりも遅延時間τ=d・sinθ/cだけ遅延して検出される。角度θは、想定される抑圧方向の雑音N2の到来方向である。図1において、一点鎖線は雑音N2の波面を示している。θ=+π/2の場合の雑音N1の到来方向が入力信号の主要な抑圧方向である。
或るマイクロホン・アレイでは、主要抑圧方向の雑音N1(θ=+π/2)は、左側のマイクロホンMIC1の入力信号IN1(t)から、時間τ=d/cだけ遅延した右側のマイクロホンMIC2の入力信号IN2(t)を減算することによって、抑圧することができる。しかし、そのようなマイクロホン・アレイでは、主要抑圧方向からずれた角度方向(0<θ<+π/2)から到来する雑音N2を充分に抑圧することはできない。
発明者は、2つのマイクロホンの入力音信号のスペクトルの一方を周波数毎にその2つの入力音信号の位相差に応じてその他方のスペクトルに位相を同期化し、双方のスペクトルの差をとることによって、音信号における抑圧範囲Rnの方向の雑音N2を充分抑圧できる、と認識した。
一方、目的音源SSとは異なる所望の目的音源SS’が、異なる角度方向の位置、例えばマイクロホンMIC1とMIC2を通る直線と垂直な方向(θ=0)の位置に出現することがある。これは、例えば、話者の口がその位置に出現または移動したことを表す。この場合、限定された受音角度範囲Rs=Rspを、目的音源SS’の方向を中心とする角度範囲に設定または変更することが望ましい。ここで、Rspは、限定された受音範囲を表す。
一般的に、受音範囲と雑音抑圧の度合いはトレードオフの関係にある。従って、雑音が低減された音信号を得るためには、適切な角度範囲の限定された受音範囲Rs=Rspを決定することが望ましい。発明者は、音源が特定の方向に出現したとき、その特定の方向の限定された受音範囲Rs=Rspを決定すれば、対応する抑圧範囲Rnにおける雑音が充分に抑圧できる、と認識した。
図2は、実施形態による、図1のマイクロホンMIC1およびMIC2を含むマイクロホン・アレイ装置100の概略的構成(configuration)の例を示している。
マイクロホン・アレイ装置100は、マイクロホンMIC1およびMIC2、増幅器(AMP)122、124、低域通過フィルタ(LPF)142および144、ディジタル信号プロセッサ(DSP)200、および、例えばRAM等を含むメモリ202を具えている。マイクロホン・アレイ装置100は、例えば音声認識機能を有する車載装置またはカー・ナビゲーション装置、ハンズフリー電話機、または携帯電話機のような情報機器であってもよい。
さらに、マイクロホン・アレイ装置100は、話者方向検出用センサ192および方向決定部194に結合されていても、またはそれらの要素を含んでいてもよい。プロセッサ10およびメモリ12は、利用アプリケーション400を含む1つの装置に含まれていても、または別の情報処理装置に含まれていてもよい。
話者方向検出用センサ192は、例えば、ディジタル・カメラ、超音波センサまたは赤外線センサであってもよい。代替形態として、方向決定部194は、メモリ12に格納された方向決定用のプログラムに従って動作するプロセッサ10上で実装されてもよい。
マイクロホンMIC1およびMIC2によって音波から変換されたアナログ入力信号ina1およびina2は、増幅器122および124にそれぞれ供給されて、増幅器122および124によって増幅される。増幅器122および124の出力の増幅されたアナログ音信号INa1およびINa2は、例えば遮断周波数fc(例えば、3.9kHz)の低域通過フィルタ142および144の入力にそれぞれ結合されて、後段のサンプリングのために低域通過濾波される。ここでは、低域通過フィルタのみを用いているが、その代わりに帯域通過フィルタを用いても、またはそれに高域通過フィルタを併用してもよい。
低域通過フィルタ142、144の出力の濾波済みのアナログ信号INp1およびINp2は、サンプリング周波数fs(例えば、8kHz)(fs>2fc)のアナログ−ディジタル変換器162、164の入力にそれぞれ結合されて、ディジタル入力信号に変換される。アナログ−ディジタル変換器162および164からの時間領域のディジタル入力信号IN1(t)およびIN2(t)は、ディジタル信号プロセッサ(DSP)200の音信号入力端子または音信号入力部it1およびit2にそれぞれ結合される。
ディジタル信号プロセッサ200は、メモリ202を用いて、時間領域のディジタル入力信号IN1(t)およびIN2(t)を、例えばフーリエ変換などによって周波数領域のディジタル入力信号または複素スペクトルIN1(f)およびIN2(f)に変換する。ディジタル信号プロセッサ200は、さらに、雑音の抑圧角度範囲(以下、単に抑圧範囲という)Rnの方向の雑音N1、N2を抑圧するようディジタル入力信号IN1(f)、IN2(f)を処理する。ディジタル信号プロセッサ200は、さらに、処理済みの周波数領域のディジタル入力信号INd(f)を、例えば逆フーリエ変換などによって時間領域のディジタル音信号INd(t)に逆変換して、雑音抑圧済みのディジタル音信号INd(t)を生成する。
ディジタル信号プロセッサ200は、初期設定状態において、最大受音範囲Rs=Rsmax、移行範囲Rt=Riおよび最小抑圧範囲Rn=Rnminを設定する。次いで、ディジタル信号プロセッサ200は、全てのまたは特定帯域の周波数fについて複素スペクトルIN1(f)およびIN2(f)を処理して、受音範囲Rsmaxにおける目的音源SSまたはSS’の方向θssまたはその方向を表す位相差DIFF(f)を求める。次いで、ディジタル信号プロセッサ200は、周波数の一次関数としての位相差DIFF(f)(=D(f)×f)における周波数fの係数D(f)を判定または推定する。特定帯域の周波数fは、一般的に最大電力の周波数またはS/N比が相対的に高い周波数を含む周波数帯域、例えばf=1kHz付近のf=0.5乃至1.5kHzの範囲であってもよい。
次いで、ディジタル信号プロセッサ200は、その判定された方向θssまたは係数D(f)に基づいて、限定された受音範囲Rs=Rspを決定し、その隣接の移行範囲Rt、および残りの抑圧範囲Rnを設定する。次いで、ディジタル信号プロセッサ200は、各周波数f毎に複素スペクトルIN1(f)およびIN2(f)を処理して、その抑圧範囲Rnおよび移行範囲Rtにおける雑音N1、N2を抑圧して、処理済みのディジタル入力信号INd(f)を生成する。それによって、目的音源に対するマイクロホン装置10の指向性が相対的に高くなる。
マイクロホン・アレイ装置100は、例えば音声認識機能を有するカー・ナビゲーション装置のような情報機器へ適用することも可能である。従って、マイクロホン・アレイ装置100に対する、主要な目的音源SSの到来方向θssおよび角度範囲Rsとして、ドライバの音声の到来方向およびその最大受音範囲Rsmaxを予め設定することもできる。
前述のように、ディジタル信号プロセッサ200は、方向決定部194またはプロセッサ10に結合されていてもよい。この場合、ディジタル信号プロセッサ200は、方向決定部194またはプロセッサ10から話者の方向θdまたは最大の受音範囲Rsmaxを表す情報を受け取る。ディジタル信号プロセッサ200は、その話者の方向θdまたは最大の受音範囲Rsmaxを表す情報に基づいて、初期設定状態における最大受音範囲Rs=Rsmax、移行範囲Rt=Rtiおよび最小抑圧範囲Rn=Rnminを設定する。
方向決定部194またはプロセッサ10は、ユーザによるキー入力によって入力された設定信号を処理して最大受音範囲Rsmaxを表す情報を生成してもよい。また、方向決定部194またはプロセッサ10は、センサ192によって捕捉された検出データまたは画像データに基づいて、話者の存在を検出しまたは認識して、話者の存在する方向θdを決定し、最大受音範囲Rsmaxを表す情報を生成してもよい。
ディジタル信号プロセッサ200からのディジタル音信号INd(t)の出力は、例えば、音声認識または携帯電話機の通話に用いられる。ディジタル音信号INd(t)は、例えば、後続の利用アプリケーション400に供給され、そこで、例えばディジタル−アナログ変換器404でアナログ信号に変換され低域通過フィルタ406で濾波されて濾波済みのアナログ信号が生成されてもよい。或いは、その利用アプリケーション400において、ディジタル音信号INd(t)は、メモリ414に格納されて音声認識部416で音声認識に使用されてもよい。音声認識部416は、ハードウェアとして実装されたプロセッサであっても、またはソフトウェアとして実装された例えばROMおよびRAMを含むメモリ414に格納されたプログラムに従って動作するプロセッサであってもよい。
ディジタル信号プロセッサ200は、ハードウェアとして実装された信号処理回路であっても、またはソフトウェアとして実装された例えばROMおよびRAMを含むメモリ202に格納されたプログラムに従って動作する信号処理回路であってもよい。
図1において、マイクロホン・アレイ装置100は、目的音源SSの方向θss(=−π/2)を中心とする限定された角度範囲を受音範囲または非抑圧範囲Rs=Rspとしてもよい。また、マイクロホン・アレイ装置100は、主要抑圧方向θ=+π/2を中心とする角度範囲を抑圧範囲Rnとすることができる。代替形態として、図1における目的音源SSの方向θssと主要抑圧方向θは、左右が逆の位置にあってもよい。この場合、マイクロホンMIC1とMIC2の識別を左右逆に設定すればよい。
同期化係数生成部220は、初期設定状態において、最大の受音範囲Rsとして例えば−π/2≦θ≦±0の最大角度範囲(Rsmax)、移行範囲Rtとして例えば±0<θ≦+π/6の角度範囲(Rti)、最小の抑圧範囲Rnとして例えば+π/6<θ≦+π/2の最小角度範囲(Rnmin)を設定する。
一方、目的音源SSの角度方向θssが周波数fに関する統計的平均でまたは平滑値で角度θ=−π/2の付近に出現した場合、受音範囲Rsを、例えば−π/2≦θ≦−π/4のような限定された角度範囲Rspに決定すれば、雑音N1、N2を充分に抑圧することができる。また、目的音源SS’の角度方向θssが周波数fに関する統計的平均でθ=±0の付近に出現した場合、受音範囲Rsを、例えば−π/9≦θ≦+π/9のような限定された角度範囲Rspに決定すれば、雑音N1、N2を充分に抑圧することができる。
図3Aおよび3Bは、図1のマイクロホンMIC1およびMIC2のアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置100の概略的構成(configuration)の例を示している。
ディジタル信号プロセッサ200は、アナログ−ディジタル変換器162、164の出力に入力が結合された高速フーリエ変換器212および214、目的音源方向判定部または周波数係数決定部218、同期化係数生成部220、およびフィルタ部300を含んでいる。目的音源方向判定部218は、別の観点では、受音範囲決定部または抑圧範囲決定部として機能する。この実施形態では、周波数変換または直交変換に、高速フーリエ変換を用いるが、他の周波数変換可能な関数(例えば、離散コサイン変換またはウェーブレット変換、等)を用いてもよい。
同期化係数生成部220は、例えば可聴周波数帯域のような或る周波数帯域の各周波数f(0<f<fs/2)の複素スペクトル間の位相差DIFF(f)を計算する位相差計算部222を含んでいる。同期化係数生成部220は、さらに、同期化係数計算部224を含んでいる。フィルタ部300は、同期化部332および減算部334を含み、任意要素として増幅器336を含んでいてもよい。減算器334の代わりに、等価回路として、入力値を反転する符号反転器とその符号反転器に結合された加算器とを用いてもよい。代替形態として、目的音源方向判定部218は、同期化係数生成部220または同期化係数計算部224に含まれていてもよい。
目的音源方向判定部218は、2つの高速フーリエ変換器212および214の出力および位相差計算部222の出力に結合された入力を有する。位相差DIFF(f)は、周波数fの一次関数DIFF(f)=D(f)×fで表すことができる。ここで、D(f)は、周波数の一次関数の周波数変数fの係数であり、傾きまたは比例定数を表す。位相差計算部220は、初期設定状態の受音範囲Rsmax(図4)の位相差DIFF(f)を生成して目的音源方向判定部218に供給する。目的音源方向判定部218は、入力の複素スペクトルIN1(f)およびIN2(f)に対して、位相差計算部220からの位相差DIFF(f)における、例えば次の式で表される周波数fに関する統計的な平均または平滑化された傾きD(f)を生成する。
D(f)=Σf×DIFF(f)/Σf
周波数fの帯域は、例えば、0.3〜3.9kHzであってもよい。目的音源方向判定部218は、その傾きD(f)に対応する受音範囲Rs、抑圧範囲Rnおよび移行範囲Rtを決定してもよい。
目的音源方向判定部218は、各周波数fにおいて、推定雑音Nの電力(パワー)スペクトル成分Nより大きい電力スペクトル成分を有する複素スペクトルIN1(f)およびIN2(f)の部分についてだけ、その周波数におけるその位相差DIFF(f)とその傾きD(f)を求めてもよい。ここで、電力スペクトルとは、異なる周波数に対する複素スペクトルの振幅の絶対値の2乗または電力を表す。そのために、目的音源方向判定部218は、入力の複素スペクトルIN1(f)およびIN2(f)における、非音声時のパターンを示す電力スペクトルにおいて各周波数f毎の雑音電力を求めて、それを定常雑音電力Nとして推定してもよい。
図3Cは、目的音源の音信号区間の電力スペクトルと雑音区間の電力スペクトルの例を示している。目的音源の音信号または音声信号の電力スペクトルは、分布が不均一であり、相対的に規則性が高い。一方、定常的な雑音区間の電力スペクトルは、周波数全体に対して分布が概ね均一であり、相対的に規則性が低い。このような分布差を利用して目的音源SS、SS’の音信号と定常雑音Nを識別してもよい。さらに、例えば、音声特有のピッチ(ハーモニクス)特性またはフォルマンの分布特性を求めて識別してもよい。
また、最大の受音範囲Rsmaxにある位相差DIFF(f)について、複素スペクトルIN1(f)の電力P1と複素スペクトルIN2(f)の電力P2とは、一般的にP1≧P2+ΔP(ここで、ΔPは設計者によって決定される許容誤差を表す)の関係を満たす。それは、目的音源SSまたはSS’は、マイクロホンMIC2よりもマイクロホンMIC1に近いかまたはマイクロホンMIC1とMIC2と実質的に同じ距離にあるからである。従って、上述の推定雑音電力Nによる判定に加えてまたはそれと代替的に、P1≧P2+ΔPを満たさない位相差DIFF(f)を判定して除外してもよい。
上述の推定雑音電力Nによる判定および/または複素スペクトルIN1(f)およびIN2(f)の電力の比較によって、受音範囲Rsmax内の目的音源SS、SS’の音信号の適切な位相差DIFF(f)とその傾きD(f)を求めることができ、雑音N1、N2に由来する位相差をできるだけ除外することができる。
位相差計算部222は、後で詳しく説明するように、高速フーリエ変換器212および214からの全周波数fまたは特定帯域の周波数fについて複素スペクトルIN1(f)とIN2(f)の間の位相差DIFF(f)を求める。代替形態として、目的音源方向判定部218は、位相差計算部220と同様に動作して、高速フーリエ変換器212および214からの複素スペクトルIN1(f)とIN2(f)の間の位相差DIFF(f)を全周波数fまたは特定帯域の周波数fについて求めてもよい。
傾きD(f)は、例えば目的音源SSまたはSS’のような支配的なまたは重心的な音源の角度方向θ(=θss)に対応する。傾きD(f)と角度方向θの関係は、D(f)=(4/fs)×θまたはθ=(fs/4)×D(f)で表すことができる。
目的音源方向判定部218は、その傾きD(f)を表すデータ、またはその傾きD(f)に対応する限定された受音範囲Rs=Rspを表す位相差データ(図6A〜6E、境界の係数a、a’、b、b’)を、同期化係数計算部224に供給する。同期化係数計算部224は、その傾きD(f)に従って、対応する受音範囲Rs=Rsp、抑圧範囲Rnおよび移行範囲Rtを決定してもよい。
図4は、図1のマイクロホン・アレイMIC1、MIC2の配置による、位相差計算部222によって計算された周波数f毎の位相スペクトル成分の位相差DIFF(f)と、初期設定状態における最大受音範囲Rs=Rsmax、移行範囲Rt=Rti、および抑圧範囲Rn=Rnminとの関係の例を示している。
位相差DIFF(f)は、例えば、−2π/fs<DIFF(f)<+2π/fsの範囲の値であり、周波数fに関して−(2π/fs)f≦DIFF(f)≦+(2π/fs)fの範囲の関数である。初期設定状態の最大受音範囲Rsmaxが例えば−π/2≦θ≦±0である場合、傾きD(f)は、−(2π/fs)≦D(f)≦±0の範囲の値である。目的音源SSの角度方向θssが全ての周波数fについて例えばθss=−π/2の場合、傾きはD(f)=−π/(fs/2)=−2π/fsである。また、目的音源SS’の角度方向が全ての周波数fについて例えばθss=0の場合、傾きはD(f)=0である。
図5Aは、受音範囲限定状態における、位相差DIFF(f)の統計的な平均のまたは平滑化された傾きD(f)=−2π/fsに対する、限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnの設定状態の例を示している。
図5Bは、受音範囲限定状態における、別の傾きD(f)=0に対する、限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnの設定状態の例を示している。
図5Cは、受音範囲限定状態における、(4θt+2θs−2π)/fs<D(f)<0の範囲のようなさらに別の傾きD(f)に対する、限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnの設定状態の例を示している。
図5Dは、受音範囲限定状態における、2(θs−π)/fs<D(f)<(4θt+2θs−2π)/fsの範囲ようなさらに別の傾きD(f)に対する、限定された受音範囲Rs=Rsp、抑圧範囲Rnおよび移行範囲Rtの設定状態の例を示している。
図5Eは、受音範囲限定状態における、−2π/fs<D(f)<2(θs−π)/fsの範囲のようなさらに別の傾きD(f)に対する、限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnの設定状態の例が示を示している。図5A〜5Eにおいて、θs、θs’は受音範囲の角度範囲を表し、θt、θt’は移行範囲の角度範囲を表し、θn、θn’は抑圧範囲の角度範囲を表している。
図5Aに示されているように、初期設定状態で傾きD(f)=−2π/fsの場合、同期化係数計算部224は、限定された受音範囲Rs(θ)=Rspを最小の−π/2≦θ≦θb=θs/2−π/2と設定する。次いで、同期化係数計算部224は、移行範囲Rt(θ)をθb=θs/2−π/2<θ≦θa=θs/2+θt−π/2と設定する。同期化係数計算部224は、さらに抑圧範囲Rn(θ)(=Rnmax)を、残りのθa=θs/2+θt−π/2<θ≦+π/2に設定する。受音範囲Rsの角度θsは、例えばθs=π/3〜π/6の範囲の或る値であってもよい。移行範囲Rtの角度θtは、例えばθt=π/6〜π/12の範囲の或る値であってもよい。
図5Bに示されているように、初期設定状態で傾きD(f)=0の場合、同期化係数計算部224は、限定された受音範囲Rs(θ)=Rspをθb’=−θs/2≦θ≦θb=+θs/2と設定する。次いで、同期化係数計算部224は、移行範囲Rt(θ)をθb=θs/2<θ≦θa=θs/2+θtおよびθa’=−θs/2−θt<θ≦θb’=−θs/2と設定する。同期化係数計算部224は、さらに抑圧範囲Rn(θ)を、残りのθa=θs/2+θt<θ≦+π/2および−π/2≦θ<θa’=−θs/2−θtと設定する。
図5Cに示されているように、初期設定状態で(4θt+2θs−2π)/fs≦D(f)<0の範囲の傾きD(f)の場合、同期化係数計算部224は、限定された受音範囲Rs=Rspをθb’≦θ≦θbに設定し、移行範囲Rtをθb<θ≦θaおよびθa’<θ≦θb’に設定する。同期化係数計算部224は、さらに抑圧範囲Rnを、残りのθa<θ≦+π/2および−π/2≦θ<θa’に設定する。
図5Dに示されているように、初期設定状態で2(θs−π)/fs≦D(f)<(4θt+2θs−2π)/fsの範囲の傾きD(f)の場合、同期化係数計算部224は、限定された受音範囲Rs=Rspをθb’≦θ≦θbに設定し、移行範囲Rtをθb<θ≦θaおよび−π/2≦θ<θb’に設定する。同期化係数計算部224は、さらに抑圧範囲Rnを、残りのθa<θ≦+π/2および−π/2≦θ<θa’に設定する。
図5Eに示されているように、初期設定状態で−2π/fs<D(f)<2(θs−π)/fsの範囲の傾きD(f)の場合、同期化係数計算部224は、限定された受音範囲Rsを−π/2≦θ≦θbに設定し、移行範囲Rtをθb<θ≦θaに設定する。同期化係数計算部224は、さらに抑圧範囲Rnを、残りのθa<θ≦+π/2に設定する。
図5A〜5Eにおいて、目的音源の音量に対する雑音抑圧量が、目的音源の角度方向θssに関係なく、概ねまたは実質的に一定になるように、受音範囲Rs、抑圧範囲Rnおよび移行範囲Rtを制御することが好ましい。
そのために、限定された受音範囲Rsの角度θsは、図5A〜5Eにおける、任意の中心角度方向θssに対して、限定された受音範囲Rs=Rspの立体角(単位球における占有表面積)の総和が概ねまたは実質的に一定になるように可変に決定してもよい。同様に、抑圧範囲Rnの角度θnは、任意の境界角度方向θa、θa’に対して、抑圧範囲Rnの立体角の総和が概ねまたは実質的に一定になるように可変に決定してもよい。同様に、移行範囲Rtの角度θtは、任意の境界角度方向θa、θa’、θb、θb’に対して、その雑音電力成分の総和がそれぞれ概ねまたは実質的に一定になるように可変に決定してもよい。概略的には、移行範囲Rtの角度θtは、任意の境界角度方向θa、θa’θb、θb’に対して、移行範囲Rtの立体角の総和が実質的に概ねまたは実質的に一定になるように可変に決定してもよい。即ち、角度方向θssが−π/2から0に増大するに従って受音範囲Rsの角度θsの大きさ(幅)が徐々に小さくなるように、角度θsを可変に決定してもよい。また、角度方向θssが−π/2から0に増大するに従って抑圧範囲Rnの角度θnの大きさ(幅)が徐々に小さくなるように、角度θnを可変に決定してもよい。また、角度θs、θnおよびθtは、各角度方向θssに対して、雑音量の実測値に基づいて決定してもよい。
上述のように、限定された受音範囲Rsの角度θsは、任意の中心角度方向θssに対して、限定された受音範囲Rsの立体角の総和が一定になるように可変に決定する場合、図5Eは、図5Aに含まれる。従って、図5Aは、目的音源SSの角度方向θssは、−π/2≦θss≦(θs−π)/2の範囲に対して適用される。
同期化係数計算部224の代わりに、目的音源方向判定部218が、図5A〜5Eの受音範囲Rs、移行範囲Rtおよび抑圧範囲Rnを同期化係数計算部224に設定してもよい。
次に、ディジタル信号プロセッサ200の動作をより具体的に説明する。
アナログ−ディジタル変換器162、164からの時間領域のディジタル入力信号IN1(t)およびIN2(t)は、それぞれ高速フーリエ変換器(FFT)212および214の入力に供給される。高速フーリエ変換器212、214は、既知の形態で、ディジタル入力信号IN1(t)、IN2(t)の各信号区間に、オーバラップ窓関数を乗算してその積をフーリエ変換または直交変換して、周波数領域の複素スペクトルIN1(f)、IN2(f)を生成する。ここで、IN1(f)=Aj(2πft+φ1(f))、IN2(f)=Aj(2πft+φ2(f))、fは周波数、AおよびAは振幅、jは単位虚数、φ1(f)およびφ2(f)は周波数fの関数である遅延位相である。オーバラップ窓関数として、例えば、ハミング窓関数、ハニング窓関数、ブラックマン窓関数、3シグマガウス窓関数、または三角窓関数を用いることができる。
位相差計算部222は、距離dだけ離れた隣接の2つのマイクロホンMIC1とMIC2の間での周波数f(0<f<fs/2)毎の音源方向を示す位相スペクトル成分の位相差DIFF(f)(ラジアン、rad)を次の式で求める。
DIFF(f)
=tan−1(J{IN2(f)/IN1(f)}/R{IN2(f)/IN1(f)})
ここで、各1つの周波数fに対応する音源は1つの音源しかないものと近似する。J{x}は複素数xの虚数成分を表し、R{x}は複素数xの実数成分を表す。
この位相差DIFF(f)をディジタル入力信号IN1(t)、IN2(t)の遅延位相(φ1(f)、φ2(f))で表現すると、次のようになる。
DIFF(f)=tan−1(J{(Aj(2πft+φ2(f))/Aj(2πft+φ1(f))}/R{(Aj(2πft+φ2(f))/Aj(2πft+φ1(f))})
=tan−1(J{(A/A)ej(φ2(f)−φ1(f))}/R{(A/A)ej(φ2(f)−φ1(f))})
=tan−1(J{ej(φ2(f)−φ1(f))}/R{ej(φ2(f)−φ1(f))})
=tan−1(sin(φ2(f)−φ1(f))/cos(φ2(f)−φ1(f)))
=tan−1(tan(φ2(f)−φ1(f))
=φ2(f)−φ1(f)
ここで、入力信号IN1(t)およびIN2(t)のうち、マイクロホンMIC1に由来する入力信号IN1(t)が比較の基準となっている。マイクロホンMIC2に由来する入力信号IN2(t)が比較の基準である場合は、入力信号IN1(t)とIN2(t)を入れ替えればよい。
位相差計算部222は、隣接する2つの入力信号IN1(f)、IN2(f)の間の周波数f毎の位相スペクトル成分の位相差DIFF(f)の値を同期化係数計算部224に供給し、さらに位相差DIFF(f)の値を音源方向判定部218に供給してもよい。
図6A〜6Eは、受音範囲限定状態における、位相差DIFF(f)の異なる傾きD(f)に対する、周波数fに対する位相スペクトル成分の位相差DIFF(f)と、限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnとの関係の例を示している。図6A〜6Cの位相差DIFF(f)は、それぞれ図5A〜5Eの角度方向θに対応する。
図6A〜6Eにおいて、一次関数afおよびa’fは、それぞれ抑圧範囲Rnと移行範囲Rtの間の角度境界線θaおよびθa’に対応する位相差DIFF(f)の境界線を表す。ここで、周波数fは0<f<fs/2の範囲の値である。aおよびa’は周波数fの係数である。一次関数bfおよびb’fは、それぞれ受音範囲Rs=Rspと移行範囲Rtの間の角度境界線θbおよびθb’に対応する位相差DIFF(f)の境界線を表す。ここで、bおよびb’は周波数fの係数である。係数a、a’、bおよびb’は、a>b、b’<a’の関係を満たす。
図6Aにおいて、D(f)=−2π/fsの場合、受音範囲Rs(DIFF(f))=Rspは、−2πf/fs≦DIFF(f)≦bf=2(θs−π)f/fsと設定される。移行範囲Rt(DIFF(f))は、bf=2(θs−π)f/fs<θ≦af=(2θs+4θt−2π)f/fsと設定される。抑圧範囲Rn(DIFF(f))は、af=(2θs+4θt−2π)f/fs<DIFF(f)≦+2πf/fsと設定される。
図6Bにおいて、D(f)=0場合、受音範囲Rs(DIFF(f))=Rspは、b’f=−2θsf/fs≦DIFF(f)≦bf=+2θsf/fsと設定される。移行範囲Rt(DIFF(f))は、bf=2θsf/fs<DIFF(f)≦af=(2θs+4θt)f/fsおよびa’f=(−2θs−4θt)f/fs<DIFF(f)≦b’f=−2θsf/fsと設定される。抑圧範囲Rn(DIFF(f))は、af=(2θs+4θt)f/fs<DIFF(f)≦+2πf/fsおよび−2πf/fs≦DIFF(f)<a’f=(−2θs−4θt)f/fsと設定される。
図6Cにおいて、(4θt+2θs−2π)/fs≦D(f)<0の範囲の傾きD(f)の場合、受音範囲Rs(DIFF(f))=Rspは、b’f=(D(f)−2θs/fs)f≦DIFF(f)≦bf=(D(f)+2θs/fs)fと設定される。移行範囲Rt(DIFF(f))は、bf<DIFF(f)≦af=(D(f)+(2θs+4θt)/fs)fおよびa’f=(D(f)−(2θs+4θt)/fs)f<DIFF(f)≦b’fと設定される。抑圧範囲Rn(DIFF(f))は、af<DIFF(f)≦+2πf/fsおよび−2πf/fs≦DIFF(f)<a’f=(−2θs−4θt)f/fsと設定される。
図6Dにおいて、2(θs−π)/fs≦D(f)<(4θt+2θs−2π)/fsの範囲の傾きD(f)の場合、受音範囲Rs(DIFF(f))=Rspは、b’f≦DIFF(f)≦bfと設定される。移行範囲Rt(DIFF(f))は、bf<DIFF(f)≦afおよび−2πf/fs≦DIFF(f)≦b’fと設定される。抑圧範囲Rn(DIFF(f))は、af<DIFF(f)≦+2πf/fsと設定される。
図6Eにおいて、−2π/fs<D(f)<2(θs−π)/fsの範囲の傾きD(f)の場合、受音範囲Rs(DIFF(f))=Rspは、−2πf/fs≦DIFF(f)≦bfと設定される。移行範囲Rt(DIFF(f))は、bf<DIFF(f)≦afと設定される。抑圧範囲Rn(DIFF(f))は、af<DIFF(f)≦+2πf/fsと設定される。但し、上述のように、限定された受音範囲Rspの角度θsが任意の中心角度方向θssに対して限定された受音範囲Rspの立体角の総和が一定になるように可変に決定する場合、図6Eは、図6Aに含まれる。即ち、図6Aは、−2π/fs≦D(f)<2(θs−π)/fsの範囲の傾きD(f)に適用される。
図6A〜6Eの各々において、位相差DIFF(f)が抑圧範囲Rnに対応する範囲に位置する場合には、同期化係数計算部224は、ディジタル入力信号IN1(f)およびIN2(f)に対して雑音抑圧のための処理を行う。位相差DIFF(f)が移行範囲Rtに対応する範囲に位置する場合には、同期化係数計算部224は、ディジタル入力信号IN1(f)およびIN2(f)に対して周波数fおよび位相差DIFF(f)に応じて低減された雑音抑圧のための処理を行う。位相差DIFF(f)が受音範囲Rs=Rspに対応する範囲に位置する場合には、同期化係数計算部224は、ディジタル入力信号IN1(f)およびIN2(f)に対して雑音抑圧のための処理を行わない。
同期化係数計算部224は、各周波数fについて、マイクロホンMIC1の位置における入力信号中の抑圧範囲Rn内の角度θの雑音は、マイクロホンMIC2の入力信号中の同じ雑音が位相差DIFF(f)だけ遅れて到達したものである、と推定する。抑圧範囲Rn内の角度θは、例えば、−π/12<θ≦+π/2、+π/9<θ≦+π/2、または+2π/9<θ≦+π/2および−π/2≦θ<−2π/9である。但し、抑圧範囲Rn内の角度θが負の範囲、例えば−π/2≦θ<−2π/9にある場合は、位相差DIFF(f)は負の符号の値となり、進相を表す。また、同期化係数計算部224は、マイクロホンMIC1の位置における移行範囲Rt内の角度θでは、受音範囲Rsにおける処理と抑圧範囲Rnにおける雑音抑圧処理のレベルを徐々に変化させまたは切り換える。
同期化係数計算部224は、初期設定状態において、1組の位相差の範囲(Rs=Rsmax、Rt、Rn)に従って、周波数f毎の位相スペクトル成分の位相差DIFF(f)に基づいて、次の式に従って同期化係数C(f)を計算する。また、同期化係数計算部224は、受音範囲限定状態で傾きD(f)に応じて決定された図6A〜6E中の1組の位相差範囲(Rs=Rsp、Rt、Rn)に従って、周波数f毎の位相スペクトル成分の位相差DIFF(f)に基づいて次の式に従って同期化係数C(f)を計算する。
(a) 同期化係数計算部224は、高速フーリエ変換における時間的分析フレーム(窓)i毎の同期化係数C(f)を順次計算する。iは分析フレームの時間的順序番号(0、1、2、...)を表す。位相差DIFF(f)が抑圧範囲Rn内の角度θ(例えば、−π/12<θ≦+π/2、+π/9<θ≦+π/2、または+2π/9<θ≦+π/2)に対応する位相差の値である場合の同期化係数C(f,i)=Cn(f,i):
初期順序番号i=0に対して、
C(f,0)=Cn(f,0)
=IN1(f,0)/IN2(f,0)
順序番号i>0に対して、
C(f,i)=Cn(f,i)
=αC(f,i−1)+(1−α)IN1(f,i)/IN2(f,i)
ここで、IN1(f,i)/IN2(f,i)は、マイクロホンMIC2の入力信号の複素スペクトルに対するマイクロホンMIC1の入力信号の複素スペクトルの比、即ち振幅比と位相差を表している。また、IN1(f,i)/IN2(f,i)は、マイクロホンMIC1の入力信号の複素スペクトルに対するマイクロホンMIC2の入力信号の複素スペクトルの比の逆数を表しているともいえる。αは、同期化のための前の分析フレームの遅延移相量の加算割合または合成割合を示し、0≦α<1の範囲の定数である。1−αは、同期化のための加算される現在の分析フレームの遅延移相量の合成割合を示す。現在の同期化係数C(f,i)は、前の分析フレームの同期化係数と現在の分析フレームのマイクロホンMIC2に対するマイクロホンMIC1の入力信号の複素スペクトルの比を、比率α:(1−α)で加算したものである。
(b) 位相差DIFF(f)が受音範囲Rs内の角度θ(例えば、−π/2≦θ≦±0、−π/2≦θ≦−π/4、または−π/9≦θ≦+π/9)に対応する位相差の値である場合、同期化係数C(f)=Cs(f)は:
C(f)=Cs(f)=exp(−j2πf/fs)または
C(f)=Cs(f)=0 (同期化減算しない場合)
(c) 位相差DIFF(f)が移行範囲Rt内の角度θ(例えば、0<θ≦+π/6、−π/4<θ≦−π/12、または−π/18<θ≦+π/9および−π/2≦θ<−π/6)に対応する位相差の値である場合、同期化係数C(f)=Ct(f)は:
角度θに応じて上記(a)のCs(f)とCn(f)の加重平均として、
C(f)=Ct(f)
=Cs(f)×(θ−θb)/(θa−θb)
+Cn(f)×(θa−θ)/(θa−θb)
ここで、θaは移行範囲Rtと抑圧範囲Rnの間の境界の角度を表し、θbは移行範囲Rtと受音範囲Rsの間の境界の角度を表す。
このようにして、位相差計算部222は、複素スペクトルIN1(f)およびIN2(f)に応じて同期化係数C(f)を生成して、複素スペクトルIN1(f)およびIN2(f)、および同期化係数C(f)をフィルタ部300に供給する。
図3Bを参照すると、フィルタ部300において、同期化部332は、次の式の乗算を行って複素スペクトルIN2(f)を複素スペクトルIN1(f)に同期化して、同期化された複素スペクトルINs2(f)を生成する。
INs2(f)=C(f)×IN2(f)
減算部334は、次の式に従って複素スペクトルIN1(f)から、係数γ(f)を乗じた複素スペクトルINs2(f)を減算して、雑音が抑圧されたディジタル複素スペクトル信号または複素スペクトルINd(f)を生成する。
INd(f)=IN1(f)−γ(f)×INs2(f)
ここで、係数γ(f)は0≦γ(f)≦1の範囲の予め設定される値である。係数γ(f)は、周波数fの関数であり、同期化係数に依存するスペクトルINs2(f)の減算の度合いを調整するための係数である。例えば、受音範囲Rsから到来した音を表す音信号の歪みの発生を抑えつつ、抑圧範囲Rnから到来した音を表す雑音を大きく抑圧するために、位相差DIFF(f)によって表される音の到来方向が抑圧範囲Rnにある場合の方が受音範囲Rsにある場合よりも大きくなるように係数γ(f)を設定してもよい。
ディジタル音信号INd(t)は、減算部334の後段の増幅器336において、音声区間におけるディジタル音信号INd(t)の電力レベルが概ねまたは実質的に一定になるように、利得制御されてもよい。
ディジタル信号プロセッサ200は、さらに逆高速フーリエ変換器(IFFT)382を含んでいる。逆高速フーリエ変換器382は、同期化係数計算部224から複素スペクトルINd(f)を受け取って逆フーリエ変換して、オーバラップ加算し、マイクロホンMIC1の位置における時間領域のディジタル音信号INd(t)を生成する。
逆高速フーリエ変換器382の出力は、後段に位置する利用アプリケーション400の入力に結合される。
ディジタル音信号INd(t)の出力は、例えば、音声認識または携帯電話機の通話に用いられる。ディジタル音信号INd(t)は、後続の利用アプリケーション400に供給され、そこで、例えば、ディジタル−アナログ変換器404でディジタル−アナログ変換され低域通過フィルタ406で低域通過濾波されてアナログ信号が生成され、またはメモリ414に格納されて音声認識部416で音声認識に使用される。
図3Aおよび3Bの要素212、214、218、220〜224、300〜334および382は、集積回路として実装されたまたはプログラムで実装されたディジタル信号プロセッサ(DSP)200によって実行されるフロー図と見ることもできる。
図7は、メモリ202に格納されたプログラムに従って図3Aおよび3Bのディジタル信号プロセッサ(DSP)200によって実行される複素スペクトルの生成のためのフローチャートの例を示している。従って、このフローチャートは、図3Aおよび3Bの要素212、214、218、220、300および382によって実現される機能に対応する。
図3A、3Bおよび7を参照すると、ステップ502において、ディジタル信号プロセッサ200(高速フーリエ変換部212、214)は、アナログ−ディジタル変換器162、164から供給された時間領域の2つのディジタル入力信号IN1(t)およびIN2(t)をそれぞれ入力し捕捉する。
ステップ504において、ディジタル信号プロセッサ200(高速フーリエ変換部212、214)は、2つのディジタル入力信号IN1(t)およびIN2(t)の各々にオーバラップ窓関数を乗算する。
ステップ506において、ディジタル信号プロセッサ200(高速フーリエ変換部212、214)は、ディジタル入力信号IN1(t)およびIN2(t)をフーリエ変換して周波数領域の複素スペクトルIN1(f)およびIN2(f)を生成する。
ステップ508において、ディジタル信号プロセッサ200(同期化係数生成部220の位相差計算部222)は、スペクトルIN1(f)とIN2(f)の間の位相差:
DIFF(f)
=tan−1(J{IN2(f)/IN1(f)}/R{IN2(f)/IN1(f)})
を計算する。
ステップ510において、ディジタル信号プロセッサ200(目的音源方向判定部218)は、位相差DIFF(f)に応じて、全周波数fまたは特定帯域の周波数fについて傾きD(f)=Σf×DIFF(f)/Σfの値を生成する。ディジタル信号プロセッサ200(同期化係数計算部224)は、その傾きD(f)を表すデータまたはそれに対応する受音範囲Rs=Rspの位相差データ(a、a’、b、b’))に従って、周波数f毎に、限定された受音範囲Rs=Rsp、抑圧範囲Rnおよび移行範囲Rtを設定する(図6A〜6E)。
ステップ514において、ディジタル信号プロセッサ200(同期化係数計算部224)は、位相差DIFF(f)に基づいて、マイクロホンMIC2の入力信号に対するマイクロホンMIC1の入力信号の複素スペクトルの比C(f)を前述のように次の式に従って計算する。
(a) 位相差DIFF(f)が抑圧角度範囲Rn内の角度θに対応する値である場合、同期化係数C(f,i)=Cn(f,i)=αC(f,i−1)+(1−α)IN1(f,i)/IN2(f,i)。
(b) 位相差DIFF(f)が受音角度範囲Rs内の角度θに対応する値である場合、同期化係数C(f)=Cs(f)=exp(−j2πf/fs)またはC(f)=Cs(f)=0。
(c) 位相差DIFF(f)が移行角度範囲Rt内の角度θに対応する値である場合、同期化係数C(f)=Ct(f)、Cs(f)とCn(f)の加重平均。
ステップ516において、ディジタル信号プロセッサ200(同期化部332)は、式:INs2(f)=C(f)IN2(f)を計算して複素スペクトルIN2(f)を複素スペクトルIN1(f)に同期化して、同期化されたスペクトルINs2(f)を生成する。
ステップ518において、ディジタル信号プロセッサ200(減算部334)は、複素スペクトルIN1(f)から、係数γ(f)を乗じた複素スペクトルINs2(f)を減算する(INd(f)=IN1(f)−γ(f)×INs2(f))。それによって、雑音が抑圧された複素スペクトルINd(f)が生成される。
ステップ522において、ディジタル信号プロセッサ200(逆高速フーリエ変換部382)は、同期化係数計算部224から複素スペクトルINd(f)を受け取って逆フーリエ変換して、オーバラップ加算し、マイクロホンMIC1の位置における時間領域の音信号INd(t)を生成する。
その後、手順はステップ502に戻る。ステップ502〜522は、所要の期間の入力を処理するために所要の時間期間だけ繰り返される。
このようにして、所望の目的音源SSまたはSS’が特的の方向θssに出現した場合に、受音範囲Rsを限定された受音範囲Rspに設定し、それによって雑音を充分抑圧することができる。上述の2つのマイクロホンからの入力信号の処理は、複数のマイクロホン(図1)の中の任意の2つマイクロホンの組み合わせに適用できる。
上述のように目的音源の角度方向応じて限定された受音範囲Rspを設定して雑音を抑圧することによって、目的音源SS、SS’の角度方向と関係なく最大受音範囲Rsmaxを小さくして雑音を抑圧する場合と比較して、雑音がより大きく抑圧できるであろう。例えば、最大受音範囲Rsmaxの立体角を、任意の目的音源の方向θssを中心とするその半分の立体角の限定された受音範囲Rspに減じることによって、約2〜3dBの抑圧ゲインが得られるであろう。
図8Aおよび8Bは、図1のマイクロホンMIC1、MIC2のアレイの配置を用いた雑音の抑圧によって雑音を低減することができるマイクロホン・アレイ装置100の別の概略的構成(configuration)の例を示している。
ディジタル信号プロセッサ200は、高速フーリエ変換器212、214、受音範囲決定部または周波数係数決定部219、同期化係数生成部220、およびフィルタ部302を含んでいる。受音範囲決定部219は、別の観点では、抑圧範囲決定部または目的音源方向決定部として機能する。図8Aおよび8Bにおいて、図3Aおよび3Bにおける目的音源方向判定部218およびフィルタ部300は、それぞれ受音範囲決定部319およびフィルタ部302に置き換えられている。
同期化係数生成部220は、図3Aおよび3Bのものと同様の要素を含んでいる。代替形態として、受音範囲決定部219は、同期化係数生成部220に含まれていてもよい。フィルタ部302は、同期化部332、および減算部334を含み、任意要素としてメモリ338および増幅器336を含んでいてもよい。メモリ338は、減算部334および逆高速フーリエ変換器382、および受音範囲決定部219に結合されていてもよい。増幅器336は、減算部334および逆高速フーリエ変換器382に結合され、任意にメモリ338に結合されていてもよい。メモリ338は、受音範囲決定部219からの要求に従って、減算部334からの複素スペクトルINd(f)のデータを一時的に格納し、複素スペクトルINd(f)を受音範囲決定部219および逆高速フーリエ変換器382に供給してもよい。
受音範囲決定部219は、少なくとも1つの高速フーリエ変換器212、214の出力に結合された入力を有する。受音範囲決定部219は、2つの高速フーリエ変換器212、214の出力および位相差計算部222の出力に結合された入力を有していてもよい。
受音範囲決定部219は、位相差計算部222からの位相差DIFF(f)に関係なく、異なる複数の仮の傾きD(f)、例えば、D(f)=−2π/fs、D(f)=0、−2π/fs<D(f)<0の範囲のD(f)を決定する。−2π/fs<D(f)<0の範囲のD(f)は、例えば、D(f)=−π/4fs、−π/2fs、−3π/4fsおよび−π/fsであってもよい。受音範囲決定部219は、その仮の傾きD(f)を表すデータまたはその傾きD(f)に対応する受音範囲Rsを表す位相差データ(a、a’、b、b’)を、同期化係数計算部224に供給する。受音範囲決定部219または同期化係数計算部224は、その仮の傾きD(f)またはそれに対応する仮の受音範囲Rsに従って、全周波数fまたは特定帯域の周波数fについて、複数組qの仮の限定された受音範囲Rs=Rsp、移行範囲Rtおよび抑圧範囲Rnを設定する。
同期化係数計算部224は、仮の制限された受音範囲Rsp、各組の仮の抑圧範囲Rnおよび移行範囲Rtについて、全周波数fまたは特定帯域の周波数fについて位相スペクトル成分の位相差DIFF(f)に基づいて、対応する同期化係数C(f)を計算する。
フィルタ部302は、各同期化係数C(f)に基づいて、仮の受音範囲Rspを含むそれぞれの仮の組q(Rsp、Rt、Rn)について、全周波数fまたは特定帯域の周波数fについて雑音が抑圧された複素スペクトルINd(f)qのデータをそれぞれ生成して、受音範囲決定部219に供給する。複素スペクトルINd(f)qのデータは一時的にメモリ338に格納される。
受音範囲決定部219は、仮の限定された受音範囲Rspを含む各組q(Rs、Rt、Rn)について、全周波数fまたは特定帯域の周波数fにおける複素スペクトルINd(f)qの電力の総和を求める。受音方向決定部219は、最も大きい総和電力を示す複素スペクトルINd(f)qの識別情報を選択してフィルタ部302のメモリ338に供給する。メモリ338は、対応する複素スペクトルINd(f)qを逆高速フーリエ変換部382に供給する。代替形態として、電力の総和の代わりにS/N比の総和を用いてもよい。
さらに、受音範囲決定部219は、各周波数fにおいて、推定雑音Nの電力スペクトル成分Nより大きい電力スペクトル成分を有する複素スペクトルINd(f)qの部分についてだけ、その電力の総和を求めてもよい。そのために、受音範囲決定部219は、複素スペクトルINd(f)qにおける、非音声時のパターンを示す電力スペクトルにおいて各周波数f毎の雑音電力を前述のように求めて、それを定常雑音電力Nとして推定してもよい。
また、この推定雑音電力Nによる判定に加えてまたはそれと代替的に、前述の複素スペクトルIN1(f)の電力P1と複素スペクトルIN2(f)の電力P2との一般的な関係P1≧P2+ΔP(ここで、ΔPは設計者によって決定される許容誤差を表す)を満たすかどうかを判定してもよい。この場合、P1≧P2+ΔPを満たさない位相差DIFF(f)は電力総和から除外される。
上述の推定雑音電力Nによる判定および/または複素スペクトルIN1(f)およびIN2(f)の電力の比較によって、主として目的音源SSの音信号の電力の総和またはS/N比の総和を求めることができ、雑音N1、N2由来の電力をできるだけ除外することができる。
受音範囲決定部219は、最も大きい電力の総和を示す1つの複素スペクトルINd(f)qに対応する位相差の限定された受音範囲Rspq(図6A〜6E)または傾きD(f)qを選択または決定してもよい。
同期化係数生成部220は、その傾きD(f)qまたは限定された受音範囲Rspqの位相差データ(a、a’、b、b’)に従って、全ての周波数fの各周波数f毎に同期化係数C(f)を求めまたは選択する。フィルタ部302は、同期化係数C(f)に基づいて、限定された受音範囲Rspqを含む組q(Rs、Rt、Rn)について、全ての周波数fの各周波数f毎に雑音が抑圧された複素スペクトルINd(f)をそれぞれ生成しまたは決定して、逆高速フーリエ変換部382に供給する。
代替形態として、受音範囲決定部219は、最も大きい電力の総和を示す複素スペクトルINd(f)qの識別情報をフィルタ部302に供給し、メモリ338は、対応する全ての周波数fの複素スペクトルINd(f)qを逆高速フーリエ変換部382に供給してもよい。
図9は、メモリ202に格納されたプログラムに従って図8Aおよび8Bのディジタル信号プロセッサ(DSP)200によって実行される複素スペクトルの生成のための別のフローチャートの例を示している。従って、このフローチャートは、図8Aおよび8Bの要素212、214、219、220、302および382によって実現される機能に対応する。
図9を参照すると、ステップ502〜508は、図7のものと同様である。但し、図3Aおよび3Bの音源方向決定部218およびフィルタ部300は、それぞれ図8Aおよび8Bの受音範囲決定部219およびフィルタ部302に置換される。
ステップ512において、ディジタル信号プロセッサ200(受音範囲決定部219)は、位相差DIFF(f)に関係なく、異なる複数の仮の傾きD(f)を決定する。ディジタル信号プロセッサ200(同期化係数計算部224)は、その仮の傾きその傾きD(f)を表すデータまたはその傾きD(f)に対応する受音範囲Rsを表す位相差データに従って、全周波数fまたは特定帯域の周波数fについて、仮の限定された受音範囲Rs=Rsp、抑圧範囲Rnおよび移行範囲Rtを設定する(図6A〜6E)。
ステップ514〜518は、図7のものと同様である。ステップ514〜518は、全周波数fまたは特定帯域の周波数fについて、仮の限定された受音範囲Rs=Rspを含む複数の組q(Rs=Rsp、Rt、Rn)の全てについて実行される。
ステップ518において、ディジタル信号プロセッサ200(フィルタ部302の減算部334)は、さらに、雑音が抑圧された複素スペクトルINd(f)を生成してそのデータをメモリ338に格納する。
ステップ520において、ディジタル信号プロセッサ200(受音範囲決定部219)は、最も大きい電力の総和を示す複素スペクトルINd(f)qまたは対応する傾きD(f)qまたは限定された受音範囲Rspqを表す位相差データを選択する。ディジタル信号プロセッサ200(同期化係数計算部224、フィルタ部302)は、全ての周波数fについて新たにその複素スペクトルINd(f)qを、破線矢印で示したようにステップ514〜520を再度実行することによって生成する。その新たに生成されたその複素スペクトルINd(f)qは、逆高速フーリエ変換部382に供給される。代替形態として、ディジタル信号プロセッサ200(フィルタ部302のメモリ338)は、対応する全ての周波数fの複素スペクトルINd(f)qを逆高速フーリエ変換部382に供給してもよい。
ステップ522は、図7のものと同様である。
このようにして、複数の仮の限定された受音範囲Rspについて、複素スペクトルINd(f)を求めることによって、図3Aおよび3Bにおける目的音源SS、SS’の方向θssを表す位相差DIFF(f)の係数D(f)を求める処理が不要になる。
図8Aおよび8Bにおいて傾きD(f)qを選択または決定した後、受音範囲決定部219は、傾きD(f)qを、選択された位相差の受音範囲Rspqに従って、複素スペクトルINd(f)qに対応する位相差DIFF(f)から前述の式D(f)=Σf×DIFF(f)/Σfにより再度求めてもよい。この場合、受音範囲決定部219は、その選択された傾きD(f)qのデータまたは対応する限定された受音範囲Rspqの位相差データを同期化係数生成部220またはフィルタ部302に供給する。
図10Aおよび10Bは、センサ192のデータまたはキー入力データに基づいて設定された最大受音範囲Rsmaxの設定状態の例を示している。センサ192は話者の身体の位置または角度方向θdを検出する。方向決定部194はその検出位置または角度方向θdに応じて話者の身体をカバーするように最大受音範囲Rsmaxを決定する。その最大受音範囲Rsmaxを表す位相差データは、同期化係数生成部220の同期化係数計算部224に供給される。同期化係数計算部224は、最大受音範囲Rsmaxに基づいて、前述のように、最大受音範囲Rsmax、抑圧範囲Rnおよび移行範囲Rtを設定する。
図10Aにおいて、話者の顔はセンサ192の左側に位置し、センサ192は、例えば最大受音範囲Rsmaxにおける角度位置として角度θd=θ1=−π/4に話者の顔領域Aの中心位置θdを検出する。この場合、方向決定部194は、その検出データθd=θ1に基づいて、顔領域A全体を含むように最大受音範囲Rsmaxの角度範囲を例えば角度−π/2≦θ≦±0に設定する。
図10Bにおいて、話者の顔はセンサ192の下側または正面側に位置し、センサ192は、例えば最大受音範囲Rsmaxにおける角度位置として角度θd=θ2=±0に話者の顔領域Aの中心位置θdを検出する。この場合、方向決定部194は、その検出データθd=θ2に基づいて、顔領域A全体を含むように最大受音範囲Rsmaxの角度範囲を例えば角度−π/2≦θd≦+π/12に設定する。顔の位置の代わりに、話者の身体の位置が検出されてもよい。
センサ192がディジタル・カメラの場合、方向決定部194は、そのディジタル・カメラから取り込んだ画像データを画像認識して、顔領域Aとその中心位置θdを判定する。方向決定部194は、顔領域Aとその中心位置θdに基づいて最大受音範囲Rsmaxを決定する。
このようにして、方向決定部194は、センサ192によって検出された話者の顔または身体の検出位置に従って最大受音範囲Rsmaxを可変設定することができる。代替形態として、方向決定部194は、キー入力に従って最大受音範囲Rsmaxを可変設定してもよい。そのように最大受音範囲Rsmaxを可変設定することによって、最大受音範囲Rsmaxをできるだけ狭くして、できるだけ広い抑圧範囲Rnにおける各周波数の不要な雑音を抑圧することができる。
以上、主として図1のマイクロホンMIC1とMIC2の配置について説明した。一方、図1に示されたものとは逆に主要な目的音源SSが右側にある場合は、図1においてマイクロホンMIC1とMIC2を左右逆に配置して、図3Aおよび3Bまたは8Aおよび8Bのディジタル信号プロセッサ200によって同様に処理すればよい。或いは、マイクロホンMIC1とMIC2に由来する2つの音信号IN1(t)およびIN2(t)の処理を、図3Aおよび3Bまたは8Aおよび8Bのディジタル信号プロセッサ200において逆に設定すればよい。
代替形態として、雑音抑圧を行う同期減算の代わりに、音信号強調を行う同期加算を用いてもよい。その同期加算の処理において、受音方向が受音範囲の場合には同期加算を行い、受音方向が抑圧範囲の場合には同期加算を行わずまたは加算信号の加算比率を小さくすればよい。
ここで挙げた全ての例および条件的表現は、発明者が技術促進に貢献した発明および概念を読者が理解するのを助けるためのものであり、ここで具体的に挙げたそのような例および条件に限定することなく解釈できる。また、明細書におけるそのような例の編成は本発明の優劣を示すこととは関係ない。本発明の実施形態を詳細に説明したが、本発明の精神および範囲から逸脱することなく、それに対して種々の変更、置換および変形を施すことができる。
100 マイクロホン・アレイ装置
MIC1、MIC2 マイクロホン
122、124 増幅器
142、144 低域通過フィルタ
162、164 アナログ−ディジタル変換器
212、214 高速フーリエ変換器
218 目的音源方向判定部
200 ディジタル信号プロセッサ
220 同期化係数生成部
222 位相差計算部
224 同期化係数計算部
300 フィルタ部
332 同期化部
334 減算部
382 逆高速フーリエ変換器

Claims (9)

  1. 少なくとも2つの音入力部と、
    前記少なくとも2つの音入力部から入力された時間領域の音信号のうちの2つの音信号を用いて、それぞれ、周波数領域のスペクトル信号に変換する直交変換部と、
    前記変換された周波数領域の2つのスペクトル信号間の位相差を求める計算部と、
    係数を有する周波数の関数として表される前記求められた位相差の前記係数に応じて、周波数毎の位相差に対して雑音抑圧範囲を決定する抑圧範囲決定部と、
    各周波数における前記求められた位相差が前記雑音抑圧範囲にある場合に、周波数毎に前記2つのスペクトル信号のうちの第1のスペクトル信号の各成分を移相して、移相されたスペクトル信号を生成し、前記移相されたスペクトル信号と前記2つのスペクトル信号のうちの第2のスペクトル信号とを合成して、濾波済みのスペクトル信号を生成するフィルタ部と、
    含む信号処理装置。
  2. 前記抑圧範囲決定部は、初期の受音範囲における前記求められた位相差の前記係数に基づいて、雑音抑圧量が一定になるように前記雑音抑圧範囲を決定するものであることを特徴とする、請求項1に記載の信号処理装置。
  3. 前記抑圧範囲決定部は、初期の受音範囲における前記求められた位相差の前記係数に基づいて、前記係数に対応しかつ前記初期の受音範囲よりも限定され受音範囲を決定し、その際、雑音抑圧量が一定になるように前記限定された受音範囲および前記雑音抑圧範囲を決定するものであることを特徴とする、請求項1に記載の信号処理装置。
  4. 前記抑圧範囲決定部は、前記2つのスペクトル信号の雑音のスペクトルを推定し、前記推定された雑音のスペクトルの電力より大きい電力を有する前記2つのスペクトル信号の周波数について、前記求められた位相差前記係数を求めるものであることを特徴とする、請求項1に記載の信号処理装置。
  5. 前記抑圧範囲決定部は、前記求められた位相差前記係数を、異なる周波数に対する複数の前記求められた位相差を統計的に処理することによって統計的な平均値として求めるものであることを特徴とする、請求項1に記載の信号処理装置。
  6. 前記抑圧範囲決定部は第1と第2の係数にそれぞれ対応する前記雑音抑圧範囲として第1と第2の抑圧範囲を仮に決定し、
    前記抑圧範囲決定部は前記第1の抑圧範囲を設定した場合に前記フィルタ部によって生成される前記濾波済みのスペクトル信号第1の電力と前記第2の抑圧範囲を設定した場合に前記フィルタ部によって生成される前記濾波済みのスペクトル信号第2の電力とを求めて、前記第1と第2の電力を比較し、前記第1と第2の電力のうちの大きい一方の電力に対応する前記第1および第2の抑圧範囲の一方の抑圧範囲を選択し、
    前記フィルタ部は前記一方の抑圧範囲を設定した場合における前記濾波済みのスペクトル信号を生成するものであることを特徴とする、請求項1に記載の信号処理装置。
  7. 少なくとも2つのマイクロホンと、
    前記少なくとも2つのマイクロホンからの時間領域の音信号のうちの2つの音信号を用いて、それぞれ、周波数領域のスペクトル信号に変換する直交変換部と、
    前記変換された周波数領域の2つのスペクトル信号間の位相差を求める計算部と、
    係数を有する周波数の関数として表される前記求められた位相差の前記係数に応じて、周波数毎の位相差に対して雑音抑圧範囲を決定する抑圧範囲決定部と、
    各周波数における前記求められた位相差が前記雑音抑圧範囲にある場合に、周波数毎に前記2つのスペクトル信号のうちの第1のスペクトル信号の各成分を移相して、移相されたスペクトル信号を生成し、前記移相されたスペクトル信号と前記2つのスペクトル信号のうちの第2のスペクトル信号とを合成して、濾波済みのスペクトル信号を生成するフィルタ部と、
    周波数領域の前記濾波済みのスペクトル信号を時間領域の雑音抑圧済みの音信号に逆変換する逆直交変換部と、
    含むマイクロホン・アレイ装置。
  8. 少なくとも2つの音入力部を有する信号処理装置における信号処理方法であって、
    前記少なくとも2つの音入力部から入力された時間領域の音信号のうちの2つの音信号を用いて、それぞれ、周波数領域のスペクトル信号に変換する工程と、
    前記変換された周波数領域の2つのスペクトル信号間の位相差を求める工程と、
    係数を有する周波数の関数として表される前記求められた位相差の前記係数に応じて、周波数毎の位相差に対して雑音抑圧範囲を決定する工程と、
    各周波数における前記求められた位相差が前記雑音抑圧範囲にある場合に、周波数毎に前記2つのスペクトル信号のうちの第1のスペクトル信号の各成分を移相して、移相されたスペクトル信号を生成し、前記移相されたスペクトル信号と前記2つのスペクトル信号のうちの第2のスペクトル信号とを合成して、濾波済みのスペクトル信号を生成する工程と、
    を含む信号処理方法。
  9. 少なくとも2つの音入力部を有する信号処理装置用の信号処理プログラムであって、
    前記少なくとも2つの音入力部から入力された時間領域の音信号のうちの2つの音信号を用いて、それぞれ、周波数領域のスペクトル信号に変換するステップと、
    前記変換された周波数領域の2つのスペクトル信号間の位相差を求めるステップと、
    係数を有する周波数の関数として表される前記求められた位相差の前記係数に応じて、周波数毎の位相差に対して雑音抑圧範囲を決定するステップと、
    各周波数における前記求められた位相差が前記雑音抑圧範囲にある場合に、周波数毎に前記2つのスペクトル信号のうちの第1のスペクトル信号の各成分を移相して、移相されたスペクトル信号を生成し、前記移相されたスペクトル信号と前記2つのスペクトル信号のうちの第2のスペクトル信号とを合成して、濾波済みのスペクトル信号を生成するステップと、
    を前記信号処理装置に実行させるための信号処理プログラム。
JP2009298951A 2009-12-28 2009-12-28 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム Active JP5493850B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009298951A JP5493850B2 (ja) 2009-12-28 2009-12-28 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
DE102010055476.6A DE102010055476B4 (de) 2009-12-28 2010-12-22 Signalverarbeitungsgerät, Mikrofonarrayvorrichtung und Speichermedium, das ein Signalverarbeitungsprogramm speichert
US12/977,341 US20110158426A1 (en) 2009-12-28 2010-12-23 Signal processing apparatus, microphone array device, and storage medium storing signal processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009298951A JP5493850B2 (ja) 2009-12-28 2009-12-28 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム

Publications (2)

Publication Number Publication Date
JP2011139378A JP2011139378A (ja) 2011-07-14
JP5493850B2 true JP5493850B2 (ja) 2014-05-14

Family

ID=44187605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009298951A Active JP5493850B2 (ja) 2009-12-28 2009-12-28 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム

Country Status (3)

Country Link
US (1) US20110158426A1 (ja)
JP (1) JP5493850B2 (ja)
DE (1) DE102010055476B4 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4873913B2 (ja) * 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置
JP5672770B2 (ja) * 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
EP2551849A1 (en) * 2011-07-29 2013-01-30 QNX Software Systems Limited Off-axis audio suppression in an automobile cabin
US8818800B2 (en) 2011-07-29 2014-08-26 2236008 Ontario Inc. Off-axis audio suppressions in an automobile cabin
EP2565667A1 (en) 2011-08-31 2013-03-06 Friedrich-Alexander-Universität Erlangen-Nürnberg Direction of arrival estimation using watermarked audio signals and microphone arrays
JP5733414B2 (ja) 2011-10-14 2015-06-10 富士通株式会社 音処理装置、音処理方法及びプログラム
JP5903921B2 (ja) * 2012-02-16 2016-04-13 株式会社Jvcケンウッド ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
US8966328B2 (en) * 2012-12-17 2015-02-24 Hewlett-Packard Development Company, L.P. Detecting a memory device defect
JP5762478B2 (ja) * 2013-07-10 2015-08-12 日本電信電話株式会社 ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム
EP3047483B1 (en) * 2013-09-17 2018-12-05 Intel Corporation Adaptive phase difference based noise reduction for automatic speech recognition (asr)
JP6156012B2 (ja) * 2013-09-20 2017-07-05 富士通株式会社 音声処理装置及び音声処理用コンピュータプログラム
JP6432597B2 (ja) * 2014-03-17 2018-12-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP6520276B2 (ja) * 2015-03-24 2019-05-29 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び、プログラム
JP2016182298A (ja) * 2015-03-26 2016-10-20 株式会社東芝 騒音低減システム
JP6794887B2 (ja) 2017-03-21 2020-12-02 富士通株式会社 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法
JP7010136B2 (ja) * 2018-05-11 2022-01-26 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
CN110132405B (zh) * 2019-05-29 2021-12-21 中国第一汽车股份有限公司 一种摘挂挡的噪音识别系统及方法
JP7226107B2 (ja) * 2019-05-31 2023-02-21 富士通株式会社 話者方向判定プログラム、話者方向判定方法、及び、話者方向判定装置
US12119004B2 (en) * 2020-09-17 2024-10-15 Zhejiang Tonghuashun Intelligent Technology Co., Ltd. Systems and methods for voice audio data processing
US12104955B2 (en) * 2021-03-01 2024-10-01 The Boeing Company Device to process sample using a time-windowed transform function to generate spectral data and to use combined magnitude and phase spectrograms

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
FR2687496B1 (fr) * 1992-02-18 1994-04-01 Alcatel Radiotelephone Procede de reduction de bruit acoustique dans un signal de parole.
US6978159B2 (en) * 1996-06-19 2005-12-20 Board Of Trustees Of The University Of Illinois Binaural signal processing using multiple acoustic sensors and digital filtering
JP3795610B2 (ja) * 1997-01-22 2006-07-12 株式会社東芝 信号処理装置
EP0802699A3 (en) * 1997-07-16 1998-02-25 Phonak Ag Method for electronically enlarging the distance between two acoustical/electrical transducers and hearing aid apparatus
US6766029B1 (en) * 1997-07-16 2004-07-20 Phonak Ag Method for electronically selecting the dependency of an output signal from the spatial angle of acoustic signal impingement and hearing aid apparatus
JP3344647B2 (ja) * 1998-02-18 2002-11-11 富士通株式会社 マイクロホンアレイ装置
JP3630553B2 (ja) 1998-04-14 2005-03-16 富士通テン株式会社 マイクロフォンの指向特性を制御する装置
JP4163294B2 (ja) * 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法
EP1035752A1 (en) * 1999-03-05 2000-09-13 Phonak Ag Method for shaping the spatial reception amplification characteristic of a converter arrangement and converter arrangement
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
US6963649B2 (en) * 2000-10-24 2005-11-08 Adaptive Technologies, Inc. Noise cancelling microphone
EP1232670B1 (en) * 2001-04-18 2010-10-27 Phonak Ag A method for analyzing an acoustical environment and a system to do so
US7502479B2 (en) * 2001-04-18 2009-03-10 Phonak Ag Method for analyzing an acoustical environment and a system to do so
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
JP2003337164A (ja) 2002-03-13 2003-11-28 Univ Nihon 音到来方向検出方法及びその装置、音による空間監視方法及びその装置、並びに、音による複数物体位置検出方法及びその装置
JP4462063B2 (ja) * 2005-02-18 2010-05-12 株式会社日立製作所 音声処理装置
JP3906230B2 (ja) 2005-03-11 2007-04-18 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4664116B2 (ja) * 2005-04-27 2011-04-06 アサヒビール株式会社 能動騒音抑制装置
EP1923866B1 (en) * 2005-08-11 2014-01-01 Asahi Kasei Kabushiki Kaisha Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
JP4854533B2 (ja) * 2007-01-30 2012-01-18 富士通株式会社 音響判定方法、音響判定装置及びコンピュータプログラム
JP5034735B2 (ja) * 2007-07-13 2012-09-26 ヤマハ株式会社 音処理装置およびプログラム
JP5195061B2 (ja) 2008-06-16 2013-05-08 株式会社デンソー 導電性接着剤およびそれを用いた部材の接続方法
JP5338259B2 (ja) * 2008-10-31 2013-11-13 富士通株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
JP5272920B2 (ja) * 2009-06-23 2013-08-28 富士通株式会社 信号処理装置、信号処理方法、および信号処理プログラム

Also Published As

Publication number Publication date
DE102010055476A1 (de) 2011-07-07
US20110158426A1 (en) 2011-06-30
JP2011139378A (ja) 2011-07-14
DE102010055476B4 (de) 2014-01-02

Similar Documents

Publication Publication Date Title
JP5493850B2 (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5338259B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
US8654990B2 (en) Multiple microphone based directional sound filter
US9485574B2 (en) Spatial interference suppression using dual-microphone arrays
KR101555416B1 (ko) 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5446745B2 (ja) 音信号処理方法および音信号処理装置
JP2011244232A (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
US11205437B1 (en) Acoustic echo cancellation control
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
Tachioka et al. Direction of arrival estimation by cross-power spectrum phase analysis using prior distributions and voice activity detection information
JP2012049715A (ja) 音源分離装置、音源分離方法、及び、プログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
Stolbov et al. Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise
JP2015025913A (ja) 音声信号処理装置及びプログラム
Lai et al. A novel coherence-function-based noise suppression algorithm by applying sound-source localization and awareness-computation strategy for dual microphones
JP2012109799A (ja) 雑音抑圧型マイクロホン

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5493850

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150