JP5305743B2

JP5305743B2 - 音響処理装置及びその方法

Info

Publication number: JP5305743B2
Application number: JP2008144215A
Authority: JP
Inventors: 皇天田
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2008-06-02
Filing date: 2008-06-02
Publication date: 2013-10-02
Anticipated expiration: 2028-06-02
Also published as: US20090296526A1; JP2009288215A; US8120993B2

Description

本発明は、ハンズフリー通話や音声認識等で用いられるアレー技術において、複数の受音装置の感度のバランスの変化に頑健な方向推定や音源分離を行うための音響処理装置及びその方法に関する。

近年、複数のマイクロホンを用いて、（１）特定の方向から到来する信号の強調、（２）到来方向が未知な場合にその方向を推定、（３）異なる方向から到来する複数の音源の分離を行うマイクロホンアレー技術の研究が盛んである。

この技術の第１の方法は、最も簡単なマイクロホンアレーの方法であって、遅延和アレーが挙げられる（非特許文献１参照）。この方法は、各マイクロホンの信号に所定の遅延を挿入し、加算処理を行うことで、事前に設定された方向から到来した信号のみが同位相で足し合わされ強調されるのに対し、その他の方向から到来した信号は位相が揃わず弱め合うという原理に基づき、特定の方向からの信号を強調、すなわち、その方向に指向性を形成している。

第２の方法としては、２つのマイクロホンから成るアレーに対して、左右いずれの方向に音源が存在するかを判定する場合や、左右の音が混合した信号からそれぞれの音を分離する場合に、２つのマイクロホンで受音した信号強度の比を指標として利用する方法がある。この方法は、音源の存在する側のマイクロホンの方が反対側のマイクロホンよりも大きな音を受音するという現象に基づいている。非特許文献２ではこの原理を利用した音源分離方法が紹介されている。
J.L. Flanagan, J.D.Johnston, R.Zahn and G.W.Elko,「Computer-steered microphone arrays for sound transduction in large rooms,」J.Acoust. Soc. Am., vol.78, no.5, pp.1508-1518, 1985 N.Roman, D.Wang, and G.Brown, 「Speech segregation based on sound localization,」 J.Acoust. Soc. Am., vol.114, no.4, pp.2236-2252, 2003

上記のような信号強度比に基づく方法は、左右のマイクロホン感度が同一であることが前提となっている。

しかし、実際にはマイクロホンの感度にはバラつきがあり、また経時変化も小さくはなく、常に同一感度を維持することは困難である。

そのため、パワー比の変動により音源方向推定や音源分離の性能が低下する問題点があった。

そこで、本発明では、マイクロホンなどの受音装置の感度にはバラつきがあり、また、経時変化があっても方向推定を行うことができる音響処理装置及びその方法を提供する。

本発明は、音源からの音を受音する複数の受音装置と、前記各受信装置の受音信号について、第１の方向に指向性を形成するフィルタ処理を行って第１の出力信号を求める第１ビームフォーマ部と、前記各受信装置の受音信号について、前記第１の方向とは異なる第２の方向に指向性を形成するフィルタ処理を行って第２の出力信号を求める第２ビームフォーマ部と、前記第１の出力信号の強度と前記第２の出力信号の強度とから強度比較情報を求める強度比較部と、前記強度比較情報に基づいて、前記音源の音源方向情報を推定する方向推定部と、前記各受信装置の受音信号のそれぞれについて、任意の周波数成分毎に分離する分離部と、を有し、前記第１ビームフォーマ部は、前記各受信装置の前記周波数成分毎の前記受音信号について前記第１の出力信号のそれぞれを求め、前記第２ビームフォーマ部は、前記各受信装置の前記周波数成分毎の受音信号について前記第２の出力信号のそれぞれを求め、前記強度比較部は、前記周波数成分毎の前記第１の出力信号の強度と前記周波数成分毎の前記第２の出力信号の強度とから、前記周波数成分毎の強度比較情報を求め、前記方向推定部は、前記周波数成分毎の前記強度比較情報に基づいて、前記周波数成分毎の前記音源方向情報を推定し、前記音源方向情報が、事前に設定された目的音源が存在する方向に近いほど値が大きくなる重み係数であり、前記重み係数に基づいて、前記周波数成分毎の前記受音信号を重み付け加算して、第３の出力信号を求める加算部をさらに有する、音響処理装置である。

本発明によれば、受音装置の感度にはバラつきがあり、また、経時変化があっても音源方向を推定できる。

以下、本発明の一実施形態の音響処理装置について図面に基づいて説明する。

（第１の実施形態）
第１の実施形態の音響処理装置について図１〜図３に基づいて説明する。

（１）音響処理装置の構成
図１は、本実施形態に係わる音響処理装置のブロック図を示す。

音響処理装置は、Ｎ個の受音装置１０１−１〜Ｎ、受音信号をフィルタ処理することで特定の方向から到来する信号をフィルタ処理によって強調出力する第１ビームフォーマ１０２−１及び第２ビームフォーマ１０２−２、その出力信号の強度であるパワーを算出する第１パワー算出部１０３−１及び第２パワー算出部１０３−２、その比を求めるパワー比算出部１０４で構成される。

第１ビームフォーマ１０２−１、第２ビームフォーマ１０２−２、第１パワー算出部１０３−１、第２パワー算出部１０３−２、パワー比算出部１０４は、コンピュータに記憶または伝送されたコンピュータ読み取り可能なプログラムによっても実施することが可能である。

（２）音響処理装置の動作原理
次に、音響処理装置の動作原理について順番に説明する。

受音装置１０１−１〜Ｎに入力された信号ｘ１〜ｘＮは、第１ビームフォーマ１０２−１と第２ビームフォーマ１０２−２に入力される。

ビームフォーマ１０２−１，１０２−２としては、遅延和アレー、または、Griffith-Jim 型アレーなど直接指向性を制御する方法がある。また、これ以外にもＩＣＡ（Independent Component Analysis ）のように信号の性質に基づき間接的に指向性を制御する方法などが利用可能である。

２つのビームフォーマ１０２−１，１０２−２は、事前に異なる方向に指向性を形成するように設計されている。すなわち、異なる方向を目的音方向（指向性を向ける方向）とするように事前に設計されている。図２に指向性の設定例を示す。

図２では、受音装置であるマイクロホンの数は２であり、２つのマイクロホン１０１−１，２を結ぶ直線上の合い反する方向をそれぞれ第１ビームフォーマ１０２−１の目的音方向と第２ビームフォーマ１０２−２の目的音方向を設定している。目的音方向はこれ以外でも互いに異なる方向であればいずれの方向でも構わない。

第１パワー算出部１０３−１、第２パワー算出部１０３−２では、２つのビームフォーマ１０２−１，１０２−２の出力のパワーをそれぞれ計算し、パワー比算出部１０４では２つのパワー比を算出し出力する。

従来は、信号の到来方向により生じるパワー比は音源方向推定や音源分離に用いられてきた。図２では音源Ｓから第１マイクロホン１０１−１までの距離ｒ１の方が、第２マイクロホン１０１−１までの距離ｒ２より短く、その結果、第１マイクロホン１０１−１の方に大きな音が受音される。したがって第１マイクロホン１０１−１と第２マイクロホン１０１−２でパワー比を観測することで、音源位置を知る手がかりを得ることができる。

しかしながら、実際のマイクロホンの感度にはバラつきがあり、また経時変化も小さくはなく、常に同一感度を維持することは困難である。そのためパワー比が音源位置の違いばかりではなくマイクロホン感度のアンバランスでも変化することになり、音源位置の推定制度を低下させる問題点があった。

本実施形態では、マイクロホン出力の比を直接とるのではなく、２つのビームフォーマ１０２−１，１０２−２の出力の比をとることで、マイクロホン感度のアンバランスに頑健なパワー比（ビームフォーマ出力パワー比）を得ることができ、音源方向や音源分離の性能をマイクロホン感度がアンバランスな状態でも維持することができる。

（３）実験
図３に、図２の状態で従来方法と本実施形態の音響処理装置を比較した実験結果を示す。

実験条件としては、第１マイクロホン１０１−１と第２マイクロホン１０１−２を用い、マイクロホン間隔をｄ＝５ｃｍに設定し、第１ビームフォーマ１０２−１を−９０度方向（図２の上方向）、第２ビームフォーマ１０２−２を９０度方向（図２の下方向）に目的音方向を設定し、１ｋＨｚの正弦波を発生する音源Ｓを第１マイクロホン１０１−１、第２マイクロホン１０１−２の中心から５０ｃｍの距離を保ちながら−９０度から９０度まで移動させた場合である。

（３−１）従来方法
まず、従来方法としては、第１マイクロホン１０１−１と第２マイクロホン１０１−２の出力パワーを用いる場合について図３（ａ）（ｂ）に基づいて説明する。

第１マイクロホン１０１−１の出力パワー｜Ｘ１｜と第２マイクロホン１０１−２の出力パワー｜Ｘ２｜の比Ｒｐｏｗは、下記の式のようになる。

但し、ｒ１は第１マイクロホン１０１−１から音源Ｓまでの距離、ｒ２は第２マイクロホン１０１−１から音源Ｓまでの距離、Ａ１は第１マイクロホン１０１−１の感度、Ａ２は第１マイクロホン１０１−１の感度である。

これにより、音源Ｓに近い側の第１マイクロホン１０１−１の出力の方が反対側よりも大きなパワーを持つことがわかる。なお、第１マイクロホン１０１−１の感度が正常な状態の出力パワーを実線、半分になった場合の出力パワーをの点線に示す。

一般的にマイクロホンの感度はばらつきや変動が大きく、１／２程度の感度の変化は珍しいことではない。

図３（ｂ）はマイクロホン出力のパワー比を表している。実線が第１マイクロホン１０１−１の感度が正常な状態、点線は第１マイクロホン１０１−１の感度が半分になった場合である。

図３（ａ）（ｂ）に示すように、マイクロホンの感度変化に対してパワー比の変動が大きく、パワー比から音源位置（方向）を推定することは難しい。

（３−２）本実施形態
次に、本実施形態の音響処理装置を用いた場合を図３（ｃ）（ｄ）に基づいて説明する。なお、ビームフォーマは遅延和方法を用いた。

図３（ｃ）では２つのビームフォーマ（略して「ＢＦ」ともいう）の出力のパワーを示す。ＢＦ_Ａが−９０度方向、ＢＦ_Ｂが９０度方向を目的音方向としている。

ＢＦ_ＡとＢＦ_Ｂの比Ｒ_ＢＦは、次のようになる。

但し、ΔＳは、音源位置による到達時間差、ΔＡは、遅延和アレーによる遅延時間である。

図３（ｃ）における実線は第１マイクロホン１０１−１の感度が正常な場合、点線は第１マイクロホン１０１−１の感度が半分になった場合を示す。

ここで注目すべきことは第１マイクロホン１０１−１の感度変化の影響が両方のビームフォーマに生じている点である。

その結果、図３（ｄ）に示すビームフォーマ出力パワー比では、マイクロホン感度の変化が生じてもこれが相殺され、値がほぼ変らないパワー比（ビームフォーマ出力パワー比）が得られている。

（４）変更例１
上記の方法は、目的方向の異なる２つのビームフォーマの出力の強さが音源の位置により異なり、その違いがマイクロホン感度のアンバランスに頑健であることを利用している。したがって、強さの尺度としてビームフォーマの出力パワーの代りに、振幅を用いても同様の効果が得られる。

（５）変更例２
また、パワーや振幅はデシベルで表現など非線型なスケールを用いてもよい。

（６）変更例３
さらに、比ではなく差を用いても強度の違いを得ることができる。

（７）変更例４
本実施形態では２つのビームフォーマはそれぞれ９０度、−９０度方向を目的音方向としたが、必ずしもこの方向でなくても良い。

想定される音源位置が事前にある程度既知である場合、例えば自動車内など座席位置により話者の位置が制限されている場合、テレビ会議システムなどで、事前に別の方法で音源位置が測定されている場合などは、１つのビームフォーマがその方向に対して最大感度を、もう１つが最低感度を持つようにそれぞれ目的音方向を設定することで、話者の発話に対してビームフォーマ出力パワー比が最大値を持つように設計する方法なども考えられる。

また、実装上の理由、例えば時間領域での整数サンプル遅延に対応する角度が綺麗な角度に対応しない場合でも、その角度を用いても問題はない。

（８）変更例５
ビームフォーマ出力パワー比の計算のタイミングとしては次の方法がある。

第１は時間方向に離散化された信号のサンプル単位に行う方法、第２はこれを時間方向に平滑化して行う方法、第３は所定のサンプル数からなるフレーム内の平均値、中央値などの代表値を用いる方法である。

また、周波数領域で行う場合も、所定の分析窓を時々刻々ずらしながら得られる信号系列に対して、前記時間領域の場合と同様な方法が適用できる。

（第２の実施形態）
第２の実施形態の音響処理装置について図４に基づいて説明する。

（１）音響処理装置の構成
図４は、本実施形態に係わる音響処理装置のブロック図を示す。

本実施形態は、第１の実施形態の音響処理装置に加え、音源方向推定部１０５と方向情報辞書１０６を有している。

（２）音響処理装置の動作原理
次に、本実施形態の音響処理装置の動作原理について説明する。

パワー比算出部１０４の出力を得るまでは、第１の実施形態と同様のため説明を省略する。

音源方向推定部１０５では、パワー比算出部１０４で得られたビームフォーマ出力比と方向情報辞書１０６の情報に基づいて音源方向の推定を行う。

具体的には。方向情報辞書１０６には、例えば図３（ｄ）の実線のような音源方向とビームフォーマ出力パワー比の対応表が格納されている。そして、音源方向推定部１０５では入力されたビームフォーマ出力パワー比を（図３（ｄ）の縦軸に対応）を角度（同じく横軸）に変換し、これを音源方向として出力する。

（３）変更例
実際には厳密な角度情報まで必要ではなく、音源が右方向か左方向か程度の情報が必要な場合もある。その場合はビームフォーマ出力パワー比の正負を音源方向の左右に変換する情報を音源方向辞書１０６に格納しておけばよい。

このように、方向情報辞書１０６には、ビームフォーマ出力パワー比を音源方向に変換する情報を用途や必要な角度分解能に応じて格納しておいてもよい。

対応が解析的に表せる場合は対応表の代わりに数式を用いてもよい。

（４）効果
音源方向の推定方法の古典的な方法としてビームフォーマを−９０度から９０度まで目的方向を少しずつ変えながら出力を求め、その最大値を音源方向とする方法（ビームフォーマ法）がある。ビームフォーマ法の欠点は多数の目的方向に対してビームフォーマを適用するため計算量が多い点である。また、マイクロホン感度変化に対しては出力値が変化するため、事前に出力値を覚えておき計算を簡略化することも難しく、常に全方向に対する最大値探索が必要となる。

これに対し、本実施形態では、２方向のビームフォーマを適用するだけでよく計算量が少ない。また、ビームフォーマ出力の比（または差）を用いることでマイクロホン感度変化に対する出力値の変化を打ち消し、マイクロホン感度変化に頑健となりため、事前に求めた比のグラフを参照することで、音源位置をほぼ特定できる。

（第３の実施形態）
第３の実施形態の音響処理装置について図４に基づいて説明する。

（１）音響処理装置の構成
図５は、本実施形態に係わる音響処理装置のブロック図を示す。

本実施形態の音響処理装置は、受音装置１０１−１〜Ｎ、時間周波数変換部２０８、周波数選択部２０９、受音信号を周波数成分毎にフィルタ処理することで特定の方向から到来する信号を強調出力する第１ビームフォーマ２０２−１及び第２ビームフォーマ２０２−２、その出力信号のパワーを周波数成分毎に算出する第１パワー算出部２０３−１及び第２パワー算出部２０３−２、その比を周波数成分毎に求めるパワー比算出部２０４、方向情報辞書２０６を用いて音源方向を周波数成分毎に推定する音源方向推定部２０５、周波数成分毎の音源方向を１つの方向に統合する方向統合部２０７で構成される。

動作の概要は第２の実施形態と同様であるが、本実施形態では信号を周波数単位に分割して処理している点が異なる。

（２−１）時間周波数変換部２０８
まず、時間周波数変換部２０８では、受音装置１０１−１〜Ｎで得た時間信号を離散フーリエ変換を用いて、それぞれ周波数領域の信号に変換する。窓長を２（Ｌ１−１）とすると通常Ｌ１個の周波数成分が得られる。

（２−２）周波数選択部２０９
次に、周波数選択部２０９では、以降の処理を適用する周波数成分を選択する。選択の基準としては音声信号のパワーの大きい周波数（例えば１００Ｈｚ〜３ｋＨｚ）を選ぶことで雑音の多い環境下で推定精度を上げることができる。

また、雑音の影響を受けやすい低域（例えば、１００Ｈｚ以下）を削除することも推定精度向上に役立つ。

周波数成分の選択基準は目的とする信号から有効な成分を選ぶことであり、これ以外の選択方法も可能である。また、計算量削減等の理由で隣接する周波数成分を１つにまとめ、サブバンドとして処理することも可能である。

なお、全周波数成分を扱う場合は周波数成分選択部２０９は不要である。

（２−３）第１パワー算出部２０３−１、第２パワー算出部２０３−２
このようにして選ばれた各チャネルＬ２個ずつの周波数成分は、異なる方向に指向性を向けた第１ビームフォーマと第２ビームフォーマで周波数成分毎に処理され、各ビームフォーマから１チャネルの出力が周波数成分毎に出力され、第１パワー算出部２０３−１と第２パワー算出部２０３−２でそれぞれの周波数成分に関してパワーが算出され、パワー比算出部２０４に渡される。

ここでは、これまでの実施形態同様にパワー比が算出されるが、このときに隣接する周波数成分をまとめて平均値を求めてもよい。平均化を行うことでパワー比がより安定する。

（２−４）パワー比算出部２０４
パワー比算出部２０４からは、Ｌ３個の周波数成分のパワー比が出力される。平均化等の処理を行わない場合はＬ２＝Ｌ３である。

（２−５）音源方向推定部２０５
音源方向推定部２０５では、それぞれの周波数成分に対して方向情報辞書に格納されているパワー比と音源方向の関係を用いて周波数成分毎に推定音源方向を出力する。

（２−６）方向統合部２０７
方向統合部２０７では、Ｌ３個の推定音源方向から所定数の音源方向を生成する。

その生成方法は、平均値や中央値や最頻値を用いるなどである。所定数が２以上の場合は得られた方向に対してクラスタリングを行い、方向を決定する場合もある。

また、周波数成分毎の方向で十分な場合は方向統合部２０７は不要である。例えば、周波数成分毎の推定音源方向にしたがって周波数成分を振り分けて複数話者の音声を分離する方法がその例である。

（第４の実施形態）
第４の実施形態の音響処理装置について図６に基づいて説明する。

（１）音響処理装置の構成
図６は、本実施形態に係わる音響処理装置のブロック図を示す。

本実施形態の音響処理装置は、受音装置１０１−１〜Ｎ、時間周波数変換部２０８、受音信号を周波数成分毎にフィルタ処理することで特定の方向から到来する信号を強調出力する第１ビームフォーマ０２−１及び第２ビームフォーマ２０２−２、その出力信号のパワーを周波数成分毎に算出する第１パワー算出部２０３−１及び第２パワー算出部２０３−２、その比を周波数成分毎に求めるパワー比算出部２０４、パワー比に対応する重み係数を重み係数辞書３０３から選択する選択部３０４、各チャネルの周波数成分を重み付ける重み付け部３０５、加算部３０６、加算した出力を時間信号に戻す時間周波数逆変換部３０７とで構成される。

（２）音響処理装置の動作原理
次に、本実施形態の音響処理装置の動作原理について説明する。本実施形態は、ビームフォーマ出力パワー比を用いて特定方向の入力信号のみを強調出力するアレー処理を実現したものである。

時間周波数変換部２０８から出力される周波数成分からパワー比算出部２０４でビームフォーマ出力パワー比を求めるまでの手順は、第３の実施形態と同様である。

本実施形態では、ビームフォーマ出力パワー比を特徴量として選択部３０４で重み係数辞書３０３から重み係数を選択する。すなわち、重み係数辞書３０３は、前記特徴量と前記重み係数が対応して記憶されており、選択部３０４は特徴量に対応した重み係数を重み係数辞書３０３から選択する。そして、この重み係数は、音源が存在する方向に近いほど値が大きくなるような係数が設定されている。但し、この場合の音源が存在する方向とは、事前に設定された目的音源の方向を意味する。これにより、あらゆる音源を強調するのでなく、目的の音源のみを強調して、その方向を重みとして出力することができる。

重み係数は、重み付け部３０５でチャネル毎の周波数成分に乗じられ加算部３０６で足し合わされる。パワー比算出部３０４の出力は、周波数成分毎であるため、以降の処理も周波数成分単位で行われる。すなわち、ｋ番目の周波数成分のパワー比がｐ（ｋ）のとき、ｎ番目の受音装置（チャネル番号ｎ）のｋ番目の周波数成分に乗じる重み係数Ｗ（ｎ，ｋ）は、（１）式のようになる。

Ｗ（ｎ，ｋ）＝Ｆ（ｎ，ｋ，ｐ（ｋ））・・・（１）

但し、Ｆ（ｎ，ｋ，ｐ）はチャネル番号ｎ、周波数成分ｋの重み係数辞書３０３から、特徴量（ここではビームフォーマ出力パワー比）がｐ（ｋ）に対応する重み係数を選択する関数である。Ｗ（ｎ，ｋ）はチャネル番号ｎの重み付け部３０５−ｎにおいて入力信号X（ｎ，ｋ）に乗じられ、加算部３０６で加算され出力信号Ｙ（ｋ）を得る。これを下記の（２）式で表すと、

となる。Ｗ（ｎ，ｋ）は、一般的には複素数である。Ｙ（ｋ）は時間周波数逆変換部３０７で時間信号に戻される。

重み係数辞書３０３は、特開２００７−１０８９７公報記載の方法で事前に求めておく。この特開２００７−１０８９７公報にも記載されているように特徴量はビームフォーマ出力パワー比以外のものとも組み合わせて多次元としてもよい。

また、第３の実施形態のように一部の周波数成分のみにビームフォーマ出力パワー比を用いてもよい。

また、重み付け加算は重みだけをフーリエ逆変換し時間信号と畳み込む表現も可能である。これは周波数領域での積が時間領域での畳み込みで表現されるという基本原理に基づくものである。

（変更例）
本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。

本発明の第１の実施形態に係わるブロック図である。音源とマイクロホンの関係を示す図である。ビームフォーマ出力パワー比の実験例である。本発明の第２の実施形態に係わるブロック図である。本発明の第３の実施形態に係わるブロック図である。本発明の第４の実施形態に係わるブロック図である。

符号の説明

１０１−１〜Ｎ受音装置
１０２−１第１ビームフォーマ
１０２−２第２ビームフォーマ
１０３−１第１パワー算出部
１０３−２第２パワー算出部
１０４パワー比算出部

Claims

音源からの音を受音する複数の受音装置と、
前記各受信装置の受音信号について、第１の方向に指向性を形成するフィルタ処理を行って第１の出力信号を求める第１ビームフォーマ部と、
前記各受信装置の受音信号について、前記第１の方向とは異なる第２の方向に指向性を形成するフィルタ処理を行って第２の出力信号を求める第２ビームフォーマ部と、
前記第１の出力信号の強度と前記第２の出力信号の強度とから強度比較情報を求める強度比較部と、
前記強度比較情報に基づいて、前記音源の音源方向情報を推定する方向推定部と、
前記各受信装置の受音信号のそれぞれについて、任意の周波数成分毎に分離する分離部と、
を有し、
前記第１ビームフォーマ部は、前記各受信装置の前記周波数成分毎の前記受音信号について前記第１の出力信号のそれぞれを求め、
前記第２ビームフォーマ部は、前記各受信装置の前記周波数成分毎の受音信号について前記第２の出力信号のそれぞれを求め、
前記強度比較部は、前記周波数成分毎の前記第１の出力信号の強度と前記周波数成分毎の前記第２の出力信号の強度とから、前記周波数成分毎の強度比較情報を求め、
前記方向推定部は、前記周波数成分毎の前記強度比較情報に基づいて、前記周波数成分毎の前記音源方向情報を推定し、
前記音源方向情報が、事前に設定された目的音源が存在する方向に近いほど値が大きくなる重み係数であり、
前記重み係数に基づいて、前記周波数成分毎の前記受音信号を重み付け加算して、第３の出力信号を求める加算部をさらに有する、
音響処理装置。
前記強度比較情報は、前記第１の出力信号と前記第２の出力信号の強度の比、または、差である、
請求項１記載の音響処理装置。
前記方向推定部は、
前記音源方向情報と前記強度比較情報との対応関係を予め記憶した記憶部を有し、
前記求めた強度比較情報について前記記憶部に記憶した対応関係に基づいて前記音源方向情報を推定する、
請求項１記載の音響処理装置。
前記方向推定部は、
前記第１の出力信号の強度が、前記第２の出力信号の強度と比べて大きい場合は、前記第１の方向を前記音源方向を示す角度と推定し、
前記第２の出力信号の強度が、前記第１の出力信号の強度と比べて大きい場合は、前記第２の方向を前記音源方向を示す角度と推定する、
請求項２記載の音響処理装置。
前記分離した全ての周波数成分毎に、または、前記分離した周波数成分中の一部の周波数成分について、前記音源方向情報を推定する、
請求項６記載の音響処理装置。
前記一部の周波数成分が、閾値より低域の周波数成分である、
請求項７記載の音響処理装置。
音源からの音を受音する複数の受音装置の受音信号について、第１の方向に指向性を形成するフィルタ処理を行って第１の出力信号を求める第１ビームフォーマステップと、
前記各受信装置の受音信号について、前記第１の方向とは異なる第２の方向に指向性を形成するフィルタ処理を行って第２の出力信号を求める第２ビームフォーマステップと、
前記第１の出力信号の強度と前記第２の出力信号の強度とから強度比較情報を求める強度比較ステップと、
前記強度比較情報に基づいて、前記音源の音源方向情報を推定する方向推定ステップと、
前記各受信装置の受音信号のそれぞれについて、任意の周波数成分毎に分離する分離ステップと、
を有し、
前記第１ビームフォーマステップは、前記各受信装置の前記周波数成分毎の前記受音信号について前記第１の出力信号のそれぞれを求め、
前記第２ビームフォーマステップは、前記各受信装置の前記周波数成分毎の受音信号について前記第２の出力信号のそれぞれを求め、
前記強度比較ステップは、前記周波数成分毎の前記第１の出力信号の強度と前記周波数成分毎の前記第２の出力信号の強度とから、前記周波数成分毎の強度比較情報を求め、
前記方向推定ステップは、前記周波数成分毎の前記強度比較情報に基づいて、前記周波数成分毎の前記音源方向情報を推定し、
前記音源方向情報が、事前に設定された目的音源が存在する方向に近いほど値が大きくなる重み係数であり、
前記重み係数に基づいて、前記周波数成分毎の前記受音信号を重み付け加算して、第３の出力信号を求める加算ステップをさらに有する、
音響処理方法。
音源からの音を受音する複数の受音装置の受音信号について、第１の方向に指向性を形成するフィルタ処理を行って第１の出力信号を求める第１ビームフォーマ機能と、
前記各受信装置の受音信号について、前記第１の方向とは異なる第２の方向に指向性を形成するフィルタ処理を行って第２の出力信号を求める第２ビームフォーマ機能と、
前記第１の出力信号の強度と前記第２の出力信号の強度とから強度比較情報を求める強度比較機能と、
前記強度比較情報に基づいて、前記音源の音源方向情報を推定する方向推定機能と、
前記各受信装置の受音信号のそれぞれについて、任意の周波数成分毎に分離する分離機能と、
を実現させ、
前記第１ビームフォーマ機能は、前記各受信装置の前記周波数成分毎の前記受音信号について前記第１の出力信号のそれぞれを求め、
前記第２ビームフォーマ機能は、前記各受信装置の前記周波数成分毎の受音信号について前記第２の出力信号のそれぞれを求め、
前記強度比較機能は、前記周波数成分毎の前記第１の出力信号の強度と前記周波数成分毎の前記第２の出力信号の強度とから、前記周波数成分毎の強度比較情報を求め、
前記方向推定機能は、前記周波数成分毎の前記強度比較情報に基づいて、前記周波数成分毎の前記音源方向情報を推定し、
前記音源方向情報が、事前に設定された目的音源が存在する方向に近いほど値が大きくなる重み係数であり、
前記重み係数に基づいて、前記周波数成分毎の前記受音信号を重み付け加算して、第３の出力信号を求める加算機能をさらに有する、
をコンピュータに実現させるための音響処理プログラム。