JP5337189B2 - フィルタ設計における反射物の配置決定方法、装置、プログラム - Google Patents
フィルタ設計における反射物の配置決定方法、装置、プログラム Download PDFInfo
- Publication number
- JP5337189B2 JP5337189B2 JP2011084728A JP2011084728A JP5337189B2 JP 5337189 B2 JP5337189 B2 JP 5337189B2 JP 2011084728 A JP2011084728 A JP 2011084728A JP 2011084728 A JP2011084728 A JP 2011084728A JP 5337189 B2 JP5337189 B2 JP 5337189B2
- Authority
- JP
- Japan
- Prior art keywords
- arrangement
- reflector
- sound
- evaluation function
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
(参考文献1)大賀寿郎、山崎芳男、金田豊 著、「音響システムとディジタル処理」、社団法人電子情報通信学会、1995、pp.203-209
(参考文献2)菊間信良著、「アダプティブアンテナ技術」、第1版、株式会社オーム社、2003年、pp.35-90
ただし、反射物配置決定装置100が、単体独立のエンティティとして存在すること、音声処理装置1,2,3,4とは容易に分離可能に音声処理装置1,2,3,4を構成するエンティティであることを排除する趣旨ではない。例えば反射物の配置決定それ自体を目的とするならば、反射物配置決定装置100を単体独立のエンティティとして実現することに何らの妨げは無い。
ここで音声処理装置1,2,3,4は、例えば専用のハードウェアで構成された専用機やパーソナルコンピュータのような汎用機といったコンピュータで実現されるとし、単体独立のエンティティとして反射物配置決定装置100を実現する場合も同様である。
説明に先立ち、改めて記号を定義する。離散周波数のインデックスをω(周波数fと角周波数ωとの間にはω=2πfの関係があるから、離散周波数のインデックスωをこの角周波数ωと同一視してもかまわない。ωに関して「離散周波数のインデックス」を単に「周波数」ともいう)、フレーム番号のインデックスをkとする。M個のマイクロホンで受音したアナログ信号の第kフレームの周波数領域表現をX→(ω,k)=[X1(ω,k),…,XM(ω,k)]T、マイクロホンアレーの中心から見て目的方向θsの音声の周波数領域表現を周波数ωで強調するフィルタをW→(ω,θs)とする。Mは2以上の整数とする。Tは転置を表す。このとき、目的方向θsの音声の周波数領域表現が周波数ωで強調された周波数領域信号(以下、出力信号と呼ぶ)Y(ω,k,θs)は式(4)で与えられる。Hはエルミート転置を表す。
SN比最大化規準によるフィルタ設計法では、目的方向θsでのSN比(SNR)を最大化する規準でフィルタW→(ω,θs)を決定する。目的方向θsの音声の空間相関行列をRss(ω)、目的方向θs以外の方向の音声の空間相関行列をRnn(ω)とする。このとき、評価関数であるSNRは式(14)で表される。なお、Rss(ω)は式(15)、Rnn(ω)は式(16)で表される。伝達特性a→(ω,θs)=[a1(ω,θs),…,aM(ω,θs)]Tは式(9a)で表される(正確には、式(9a)のθをθsとしたものである)。
パワーインバージョンに基づくフィルタ設計法では、一つのマイクロホンに対するフィルタ係数を一定値に固定した状態で出力のパワーを最小化する基準でフィルタW→(ω,θs)を決定する。ここでは、一例として、M個のマイクロホンのうち1番目のマイクロホンに対するフィルタ係数を固定するとして説明する。この設計法では、フィルタW→(ω,θs)は、式(23)の拘束条件の下、空間相関行列Rxx(ω)を用いて全方向(音声の到来方向として想定される全ての方向)の音声のパワーが最小となるように設計される(式(22)参照)。伝達特性a→(ω,θs)=[a1(ω,θs),…,aM(ω,θs)]Tは式(9a)で表される(正確には、式(9a)のθをθsとしたものである)。なお、Rxx(ω)=Q(ω)である。
上述の説明では、いずれの設計法においても、目的方向のみを考慮していたが、音源までの距離(後述するようにスピーカアレーによる音声再生の場合では、スポット再生までの距離)も考慮してフィルタを設計することも可能である。この場合、各設計法において、マイクロホンアレーの中心からの距離をDと表す(特に目的方向への距離をDhと表す)と、上記各式は下記のように修正される。
適用形態1:
マイクロホンアレーで収音した音声について所望の方向についての音声を狭指向で強調する。
適用形態2:
マイクロホンアレーで収音した音声について所望の方向および距離の音声を狭指向で強調する。
適用形態3:
スピーカアレーで所望の方向に音声を狭指向で再生する。
適用形態4:
スピーカアレーで所望の方向と距離の場所に音声を狭指向でスポット再生する。
適用形態1の機能構成および処理フローを図2と図3に示す。この適用形態1の音声処理装置1は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
予め、フィルタ設計部260が音声強調の対象となりえる離散的な方向ごとに、周波数ごとのフィルタW→(ω,θi)を計算しておく。音声強調の対象となりえる離散的な方向の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)とすると、W→(ω,θ1),…,W→(ω,θi),…,W→(ω,θI)(1≦i≦I, ω∈Ω; iは整数、Ωは周波数ωの集合)を事前に計算しておくのである。このためには、伝達特性a→(ω,θi)=[a1(ω,θi),…,aM(ω,θi)]T(1≦i≦I, ω∈Ω)を求める必要があるが、これは、マイクロホンアレーにおけるマイクロホンの配置、反射物である例えば反射板のマイクロホンアレーに対する位置関係(これは既に決定されている)、直接音とξ番目(1≦ξ≦Ξ)の反射音との到来時間差、反射物の音の反射率などの環境情報を基に式(9a)によって具体的に計算できる(正確には、式(9a)のθをθiとしたものである)。反射音の数Ξは1≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ=1であり、一つの反射板300をマイクロホンアレーの近傍に設置するので、伝達特性a→(ω,θi)は式(9b)によって具体的に計算できる(正確には、式(9b)のθをθiとしたものである)。ステアリングベクトルの計算には、例えば式(10a)、式(10b)、式(11a)、式(11b)、式(11c)、式(11d)を用いることができる。なお、式(9a)や式(9b)に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a→(ω,θi)を用いて、例えば式(7)、式(18)、式(19)、式(24)のいずれかによってW→(ω,θi)(1≦i≦I)を求める。なお、式(7)または式(19)または式(24)を用いる場合には空間相関行列Q(ω)(あるいはRxx(ω))は式(8b)で計算できる。式(18)を用いる場合には空間相関行列Rnn(ω)は式(16)で計算できる。I×|Ω|個のフィルタW→(ω,θi)(1≦i≦I,ω∈Ω)は記憶部290に記憶される。|Ω|は集合Ωの要素数を表す。
マイクロホンアレーを構成するM個のマイクロホン200−1,…,200−Mを用いて収音する。Mは2以上の整数である。
AD変換部210が、M個のマイクロホン200−1,…,200−Mで収音されたアナログ信号(収音信号)をディジタル信号x→(t)=[x1(t),…,xM(t)]Tへ変換する。tは離散時間のインデックスを表す。
フレーム生成部220は、AD変換部210が出力したディジタル信号x→(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x→(k)=[x→ 1(k),…,x→ M(k)]Tを出力する。kはフレーム番号のインデックスである。x→ m(k)=[xm((k-1)N+1),…,xm(kN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号x→(k)を周波数領域の信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tに変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X→(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tに、強調したい目的方向θsに対応するフィルタW→(ω,θs)を適用して、出力信号Y(ω,k,θs)を出力する(式(27)参照)。目的方向θsのインデックスsは、s∈{1,…,I}であり、フィルタW→(ω,θs)は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、強調したい目的方向θsに対応するフィルタW→(ω,θs)を記憶部290から取得すればよい。目的方向θsのインデックスsが集合{1,…,I}に属さない場合、つまり、目的方向θsに対応するフィルタW→(ω,θs)がステップS1の処理で計算されていない場合、臨時に目的方向θsに対応するフィルタW→(ω,θs)をフィルタ設計部260に計算させてもよいし、あるいは目的方向θsに近い方向θs'に対応するフィルタW→(ω,θs')を用いてよい。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの出力信号Y(ω,k,θs)を時間領域に変換して第kフレームのフレーム単位時間領域信号y(k)を得て、さらに、得られたフレーム単位時間領域信号y(k)をフレーム番号のインデックスの順番に連結して目的方向θsの音声が強調された時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
適用形態2の機能構成および処理フローを図4と図5に示す。この適用形態2の音声処理装置2は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
予め、フィルタ設計部260が音声強調の対象となりえる離散的な位置(θi,Dg)ごとに、周波数ごとのフィルタW→(ω,θi,Dg)を計算しておく。音声強調の対象となりえる離散的な方向の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)、離散的な距離の総数をG(Gは1以上の予め定められた整数であり、G≦Zを満たす)とすると、W→(ω,θ1,D1),…,W→(ω,θi,D1),…,W→(ω,θI,D1),W→(ω,θ1,D2),…,W→(ω,θi,D2),…,W→(ω,θI,D2),…,W→(ω,θ1,Dg),…,W→(ω,θi,Dg),…,W→(ω,θI,Dg),…,W→(ω,θ1,DG),…,W→(ω,θi,DG),…,W→(ω,θI,DG)(1≦i≦I, 1≦g≦G, ω∈Ω; iは整数、Ωは周波数ωの集合)を事前に計算しておくのである。このためには、伝達特性a→(ω,θi,Dg)=[a1(ω,θi,Dg),…,aM(ω,θi,Dg)]T(1≦i≦I, 1≦g≦G, ω∈Ω)を求める必要があるが、これは、マイクロホンアレーにおけるマイクロホンの配置、反射物である例えば反射板のマイクロホンアレーに対する位置関係(これは既に決定されている)、直接音とξ番目(1≦ξ≦Ξ)の反射音との到来時間差、反射物の音の反射率などの環境情報を基に式(9a)によって具体的に計算できる(正確には、式(9a)のθをθi、DをDgとしたものである)。反射音の数Ξは1≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ=1であり、一つの反射板300をマイクロホンアレーの近傍に設置するので、伝達特性a→(ω,θi)は式(9b)によって具体的に計算できる(正確には、式(9b)のθをθiとしたものである)。ステアリングベクトルの計算には、例えば式(10a)、式(10b)、式(11a)、式(11b)、式(11c)、式(11d)を用いることができる。なお、式(9a)に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a→(ω,θi,Dg)を用いて、例えば式(7)、式(18)、式(19)、式(24)のいずれかによってW→(ω,θi,Dg)(1≦i≦I, 1≦g≦G)を求める。なお、式(7)または式(19)または式(24)を用いる場合には空間相関行列Q(ω,Dg)(あるいはRxx(ω,Dg))は式(8b)で計算できる(正確には、式(8b)のDをDgとしたものである)。式(18)を用いる場合には空間相関行列Rnn(ω,Dg)は式(16)で計算できる(正確には、式(16)のDをDgとしたものである)。I×G×|Ω|個のフィルタW→(ω,θi,Dg)(1≦i≦I, 1≦g≦G, ω∈Ω)は記憶部290に記憶される。|Ω|は集合Ωの要素数を表す。
マイクロホンアレーを構成するM個のマイクロホン200−1,…,200−Mを用いて収音する。Mは2以上の整数である。
AD変換部210が、M個のマイクロホン200−1,…,200−Mで収音されたアナログ信号(収音信号)をディジタル信号x→(t)=[x1(t),…,xM(t)]Tへ変換する。tは離散時間のインデックスを表す。
フレーム生成部220は、AD変換部210が出力したディジタル信号x→(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにNサンプルをバッファに貯めてフレーム単位のディジタル信号x→(k)=[x→ 1(k),…,x→ M(k)]Tを出力する。kはフレーム番号のインデックスである。x→ m(k)=[xm((k-1)N+1),…,xm(kN)](1≦m≦M)である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号x→(k)を周波数領域の信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tに変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号X→(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tに、強調したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を適用して、出力信号Y(ω,k,θs,Dh)を出力する(式(28)参照)。位置(θs,Dh)のインデックスs, hは、s∈{1,…,I}, h∈{1,…,G}であり、フィルタW→(ω,θs,Dh)は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、強調したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を記憶部290から取得すればよい。方向θsのインデックスsが集合{1,…,I}に属さない場合あるいは距離Dhのインデックスhが集合{1,…,G}に属さない場合、つまり、位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)がステップS1の処理で計算されていない場合、臨時に位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)をフィルタ設計部260に計算させてもよいし、あるいは方向θsに近い方向θs'や距離Dhに近い距離Dh'に対応するフィルタW→(ω,θs',Dh)やW→(ω,θs,Dh')やW→(ω,θs',Dh')を用いてよい。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの出力信号Y(ω,k,θs,Dh)を時間領域に変換して第kフレームのフレーム単位時間領域信号y(k)を得て、さらに、得られたフレーム単位時間領域信号y(k)をフレーム番号のインデックスの順番に連結して位置(θs,Dh)からの音声が強調された時間領域信号y(t)を出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
適用形態3の機能構成および処理フローを図6と図7に示す。この適用形態3の音声処理装置3は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
予め、フィルタ設計部260が音声再生の対象となりえる離散的な方向ごとに、周波数ごとのフィルタW→(ω,θi)を計算しておく。音声再生の対象となりえる離散的な方向の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)とすると、W→(ω,θ1),…,W→(ω,θi),…,W→(ω,θI)(1≦i≦I, ω∈Ω; iは整数、Ωは周波数ωの集合)を事前に計算しておくのである。このためには、伝達特性a→(ω,θi)=[a1(ω,θi),…,aM(ω,θi)]T(1≦i≦I, ω∈Ω)を求める必要があるが、これは、スピーカアレーにおけるスピーカの配置、反射物である例えば反射板のスピーカアレーに対する位置関係(これは既に決定されている)、直接音とξ番目(1≦ξ≦Ξ)の双対音との時間差、反射物の音の反射率などの環境情報を基に式(9a)によって具体的に計算できる(正確には、式(9a)のθをθiとしたものである)。双対音の数Ξは1≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ=1であり、一つの反射板300をマイクロホンアレーの近傍に設置するので、伝達特性a→(ω,θi)は式(9b)によって具体的に計算できる(正確には、式(9b)のθをθiとしたものである)。ステアリングベクトルの計算には、例えば式(10a)、式(10b)、式(11a)、式(11b)、式(11c)、式(11d)を用いることができる。なお、式(10a)や式(10b)に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a→(ω,θi)を用いて、例えば式(7)、式(18)、式(19)、式(24)のいずれかによってW→(ω,θi)(1≦i≦I)を求める。なお、式(7)または式(19)または式(24)を用いる場合には空間相関行列Q(ω)(あるいはRxx(ω))は式(8b)で計算できる。式(18)を用いる場合には空間相関行列Rnn(ω)は式(16)で計算できる。I×|Ω|個のフィルタW→(ω,θi)(1≦i≦I,ω∈Ω)は記憶部290に記憶される。|Ω|は集合Ωの要素数を表す。
音源200が音源信号ss(t)を出力する。この実施形態では、音源200からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
AD変換部210が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでtは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップS3の処理を行う必要がなく、音源信号をAD変換部210の出力信号であるs(t)と見なすことができる。
フレーム生成部220は、AD変換部210が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、再生したい目的方向θsに対応するフィルタW→(ω,θs)を適用して、再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tを出力する(式(29)参照)。目的方向θsのインデックスsは、s∈{1,…,I}であり、フィルタW→(ω,θs)は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、再生したい目的方向θsに対応するフィルタW→(ω,θs)を記憶部290から取得すればよい。目的方向θsのインデックスsが集合{1,…,I}に属さない場合、つまり、目的方向θsに対応するフィルタW→(ω,θs)がステップS1の処理で計算されていない場合、臨時に目的方向θsに対応するフィルタW→(ω,θs)をフィルタ設計部260に計算させてもよいし、あるいは目的方向θsに近い方向θs'に対応するフィルタW→(ω,θs')を用いてよい。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tを時間領域に変換して第kフレームのフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]Tを得て、さらに、得られたフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]Tをフレーム番号のインデックスの順番に連結して再生方向である目的方向θsに向けて音声が強調された時間領域信号x→(t)=[x1(t),…,xM(t)]Tを出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
Mチャネルの時間領域信号x1(t),…,xM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ280−1,…,280−Mのうち、チャネルに対応するスピーカで再生される。つまり、m番目(1≦m≦M)のチャネルの時間領域信号xm(t)はm番目のスピーカ280−mで再生される。
適用形態4の機能構成および処理フローを図8と図9に示す。この適用形態4の音声処理装置4は、AD変換部210、フレーム生成部220、周波数領域変換部230、フィルタ適用部240、時間領域変換部250、フィルタ設計部260、記憶部290を含む。
予め、フィルタ設計部260が音声スポット再生の対象となりえる離散的な位置(θi,Dg)ごとに、周波数ごとのフィルタW→(ω,θi,Dg)を計算しておく。音声スポット再生の対象となりえる離散的な方向の総数をI(Iは1以上の予め定められた整数であり、I≦Pを満たす)、離散的な距離の総数をG(Gは1以上の予め定められた整数であり、G≦Zを満たす)とすると、W→(ω,θ1,D1),…,W→(ω,θi,D1),…,W→(ω,θI,D1),W→(ω,θ1,D2),…,W→(ω,θi,D2),…,W→(ω,θI,D2),…,W→(ω,θ1,Dg),…,W→(ω,θi,Dg),…,W→(ω,θI,Dg),…,W→(ω,θ1,DG),…,W→(ω,θi,DG),…,W→(ω,θI,DG)(1≦i≦I, 1≦g≦G, ω∈Ω; iは整数、Ωは周波数ωの集合)を事前に計算しておくのである。このためには、伝達特性a→(ω,θi,Dg)=[a1(ω,θi,Dg),…,aM(ω,θi,Dg)]T(1≦i≦I, 1≦g≦G, ω∈Ω)を求める必要があるが、これは、スピーカアレーにおけるスピーカの配置、反射物である例えば反射板のスピーカアレーに対する位置関係(これは既に決定されている)、直接音とξ番目(1≦ξ≦Ξ)の双対音との時間差、反射物の音の反射率などの環境情報を基に式(9a)によって具体的に計算できる(正確には、式(9a)のθをθi、DをDgとしたものである)。双対音の数Ξは1≦Ξを満たす整数に設定されるが、上述の実施形態によるとΞ=1であり、一つの反射板300をマイクロホンアレーの近傍に設置するので、伝達特性a→(ω,θi)は式(9b)によって具体的に計算できる(正確には、式(9b)のθをθiとしたものである)。ステアリングベクトルの計算には、例えば式(10a)、式(10b)、式(11a)、式(11b)、式(11c)、式(11d)を用いることができる。なお、式(10a)、式(10b)に拠らず、例えば実環境下における実測で得られた伝達特性を用いてもよい。そして、伝達特性a→(ω,θi,Dg)を用いて、例えば式(7)、式(18)、式(19)、式(24)のいずれかによってW→(ω,θi,Dg)(1≦i≦I, 1≦g≦G)を求める。なお、式(7)または式(19)または式(24)を用いる場合には空間相関行列Q(ω,Dg)(あるいはRxx(ω,Dg))は式(8b)で計算できる(正確には、式(8b)のDをDgとしたものである)。式(18)を用いる場合には空間相関行列Rnn(ω,Dg)は式(16)で計算できる(正確には、式(16)のDをDgとしたものである)。I×G×|Ω|個のフィルタW→(ω,θi,Dg)(1≦i≦I, 1≦g≦G, ω∈Ω)は記憶部290に記憶される。|Ω|は集合Ωの要素数を表す。
音源200が音源信号ss(t)を出力する。この実施形態では、音源200からの音源信号ss(t)はアナログ信号であるとする。ただし、音源信号としてディジタル信号を用いることもできる。
AD変換部210が、音源信号ss(t)をディジタル信号s(t)へAD変換する。ここでtは離散時間のインデックスを表す。なお、ディジタル信号が音源信号である場合には、ステップS3の処理を行う必要がなく、音源信号をAD変換部210の出力信号であるs(t)と見なすことができる。
フレーム生成部220は、AD変換部210が出力したディジタル信号s(t)を入力とし、Nサンプルをバッファに貯めてフレーム単位のディジタル信号s(k)を出力する。kはフレーム番号のインデックスである。s(k)=[s((k-1)N+1),…,s(kN)]である。Nはサンプリング周波数にもよるが、16kHzサンプリングの場合には512点あたりが妥当である。
周波数領域変換部230は、各フレームのディジタル信号s(k)を周波数領域の信号S(ω,k)に変換して出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。周波数領域信号S(ω,k)は、各周波数ω、フレームkごとに出力される。
フィルタ適用部240は、フレームkごとに、各周波数ω∈Ωについて、周波数領域信号S(ω,k)に、スポット再生したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を適用して、再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tを出力する(式(30)参照)。位置(θs,Dh)のインデックスs, hは、s∈{1,…,I}, h∈{1,…,G}であり、フィルタW→(ω,θs,Dh)は記憶部290に記憶されているので、例えば、ステップS6の処理の都度、フィルタ適用部240は、スポット再生したい位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)を記憶部290から取得すればよい。方向θsのインデックスsが集合{1,…,I}に属さない場合あるいは距離Dhのインデックスhが集合{1,…,G}に属さない場合、つまり、位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)がステップS1の処理で計算されていない場合、臨時に位置(θs,Dh)に対応するフィルタW→(ω,θs,Dh)をフィルタ設計部260に計算させてもよいし、あるいは方向θsに近い方向θs'や距離Dhに近い距離Dh'に対応するフィルタW→(ω,θs',Dh)やW→(ω,θs,Dh')やW→(ω,θs',Dh')を用いてよい。
時間領域変換部250は、第kフレームの各周波数ω∈Ωの再生信号X→(ω,k)=[X1(ω,k),…,XM(ω,k)]Tを時間領域に変換して第kフレームのフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]Tを得て、さらに、得られたフレーム単位時間領域信号x→(k)=[x1(k),…,xM(k)]Tをフレーム番号のインデックスの順番に連結してスポット再生したい位置(θs,Dh)に向けて音声が強調された時間領域信号x→(t)=[x1(t),…,xM(t)]Tを出力する。周波数領域信号を時間領域信号に変換する方法は、ステップS5の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
ステップS8
Mチャネルの時間領域信号x1(t),…,xM(t)はそれぞれ、スピーカアレーを構成するM個のスピーカ280−1,…,280−Mのうち、チャネルに対応するスピーカで再生される。つまり、m番目(1≦m≦M)のチャネルの時間領域信号xm(t)はm番目のスピーカ280−mで再生される。
上述の実施形態に関わる反射物配置決定装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、反射物配置決定装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Claims (6)
- 音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、
各上記伝達特性は、直接音の伝達特性と反射物で反射する一つ以上の反射音の各伝達特性との和で表されており、
上記直接音の伝達特性及び上記反射音の伝達特性は、マイクロホンアレーまたはスピーカアレーに対する上記反射物の配置関係を表す情報(以下、配置情報という)に基づいて定まるものであり、
上記評価関数は上記複数の方向から選択された少なくとも一つの目的方向の音声が強調されるほど小さな値をとる関数であり、
記憶部には、上記配置情報が記憶されており、
配置決定部が、上記配置情報に基づく上記反射物の各候補について、当該候補に基づいて特定される上記伝達特性によって表される上記空間相関行列を用いて上記評価関数の値を求め、当該値のうち最小のものに対応する候補を上記反射物の配置として決定する配置決定ステップ
を有する反射物の配置決定方法。 - 請求項1に記載の配置決定方法において、
上記評価関数は最小分散無歪応答法に基づく評価関数である
ことを特徴とする反射物の配置決定方法。 - 請求項1に記載の配置決定方法において、
上記評価関数はSN比最大化規準に基づく評価関数である
ことを特徴とする反射物の配置決定方法。 - 請求項1に記載の配置決定方法において、
上記評価関数はパワーインバージョンに基づく評価関数である
ことを特徴とする反射物の配置決定方法。 - 音声に基づく情報に対して適用されるフィルタが、空間中における複数の方向の伝達特性によって表される空間相関行列を用いて所定の評価関数に基づいて設計される場合であって、
各上記伝達特性は、直接音の伝達特性と反射物で反射する一つ以上の反射音の各伝達特性との和で表されており、
上記直接音の伝達特性及び上記反射音の伝達特性は、マイクロホンアレーまたはスピーカアレーに対する上記反射物の配置関係を表す情報(以下、配置情報という)に基づいて定まるものであり、
上記評価関数は上記複数の方向から選択された少なくとも一つの目的方向の音声が強調されるほど小さな値をとる関数であり、
上記配置情報を記憶する記憶部と、
上記配置情報に基づく上記反射物の各候補について、当該候補に基づいて特定される上記伝達特性によって表される上記空間相関行列を用いて上記評価関数の値を求め、当該値のうち最小のものに対応する候補を上記反射物の配置として決定する配置決定部と
を含む反射物の配置決定装置。 - コンピュータに、請求項1から請求項4のいずれかに記載の反射物の配置決定方法の処理を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011084728A JP5337189B2 (ja) | 2011-04-06 | 2011-04-06 | フィルタ設計における反射物の配置決定方法、装置、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011084728A JP5337189B2 (ja) | 2011-04-06 | 2011-04-06 | フィルタ設計における反射物の配置決定方法、装置、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012222518A JP2012222518A (ja) | 2012-11-12 |
JP5337189B2 true JP5337189B2 (ja) | 2013-11-06 |
Family
ID=47273601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011084728A Active JP5337189B2 (ja) | 2011-04-06 | 2011-04-06 | フィルタ設計における反射物の配置決定方法、装置、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5337189B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6211890B2 (ja) * | 2013-01-24 | 2017-10-11 | 日本電信電話株式会社 | 収音装置 |
JP5791685B2 (ja) * | 2013-10-23 | 2015-10-07 | 日本電信電話株式会社 | マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム |
US20230083284A1 (en) * | 2020-02-28 | 2023-03-16 | Nippon Telegraph And Telephone Corporation | Filter coefficient optimization apparatus, latent variable optimization apparatus, filter coefficient optimization method, latent variable optimization method, and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3424761B2 (ja) * | 1993-07-09 | 2003-07-07 | ソニー株式会社 | 音源信号推定装置および方法 |
JP3572594B2 (ja) * | 1995-07-05 | 2004-10-06 | 晴夫 浜田 | 信号源探査方法及び装置 |
-
2011
- 2011-04-06 JP JP2011084728A patent/JP5337189B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012222518A (ja) | 2012-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5486694B2 (ja) | 音声強調方法、装置、プログラム、記録媒体 | |
Sun et al. | Localization of distinct reflections in rooms using spherical microphone array eigenbeam processing | |
Landschoot et al. | Model-based Bayesian direction of arrival analysis for sound sources using a spherical microphone array | |
Melon et al. | Evaluation of a method for the measurement of subwoofers in usual rooms | |
JP6117142B2 (ja) | 変換装置 | |
JP5337189B2 (ja) | フィルタ設計における反射物の配置決定方法、装置、プログラム | |
JP5986966B2 (ja) | 音場収音再生装置、方法及びプログラム | |
JP3862685B2 (ja) | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム | |
JP2018077139A (ja) | 音場推定装置、音場推定方法、プログラム | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
JP6063890B2 (ja) | 変換装置 | |
JP5486567B2 (ja) | 狭指向音声再生処理方法、装置、プログラム | |
JP6691494B2 (ja) | 収音装置、及び収音方法 | |
JP5698166B2 (ja) | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP6821836B2 (ja) | 収音装置 | |
JP6228945B2 (ja) | 音場再生装置、音場再生方法、プログラム | |
JP5486568B2 (ja) | 音声スポット再生処理方法、装置、プログラム | |
JP2013135373A (ja) | ズームマイク装置 | |
JP2017055156A (ja) | 音場測定装置、音場測定方法、プログラム | |
JP2016082414A (ja) | 収音装置 | |
JP6981559B2 (ja) | 収音装置 | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP2018093379A (ja) | 音場推定装置、音場推定方法、プログラム | |
JP2016100735A (ja) | フィルタ生成装置、収音装置、フィルタ生成方法及びプログラム | |
WO2021251182A1 (ja) | 信号処理装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5337189 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |