JP2016039493A - 頭部伝達関数のモデリング装置、その方法及びそのプログラム - Google Patents
頭部伝達関数のモデリング装置、その方法及びそのプログラム Download PDFInfo
- Publication number
- JP2016039493A JP2016039493A JP2014161681A JP2014161681A JP2016039493A JP 2016039493 A JP2016039493 A JP 2016039493A JP 2014161681 A JP2014161681 A JP 2014161681A JP 2014161681 A JP2014161681 A JP 2014161681A JP 2016039493 A JP2016039493 A JP 2016039493A
- Authority
- JP
- Japan
- Prior art keywords
- order
- model
- transfer function
- head
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
Description
頭部伝達関数のモデリングとは、頭部伝達関数を有理多項式又はその比として表すことである。頭部伝達関数およびそのモデルは、音響信号の音像を空間内に擬似的に配置させるような音像定位技術など応用は多岐に渡る。
非特許文献1には、頭部伝達関数のモデリング法として、極零(pole/zero)モデルにより有理多項式の比で頭部伝達関数をモデリングする方法が開示されている。非特許文献1には、極零モデルが次の式(3)で定義されることが記載されている。
同様に、非特許文献1,2及び特許文献1,2に記載されたいずれの方法による頭部伝達関数の模擬においても、雑音の影響が考慮されていない。
この高次モデル推定手段によって、頭部伝達関数の測定における雑音を考慮した、精度の良いモデルを求めることが可能となる。
そして、頭部伝達関数のモデリング装置は、低次元化手段によって、推定された高次モデルと、周波数領域における評価関数である対数尤度関数とを用いて最尤推定値を導出することで前記高次モデルを低次元化する。
ここで、低次元化手段では、周波数伝達関数算出手段によって、前記高次モデルの周波数伝達関数を求める。また、低次元化手段では、低次モデル推定手段によって、前記対数尤度関数を最小化することで前記高次のモデル次数よりも低い次数の低次モデルの推定値を求める。
そして、低次元化手段では、低次モデル探索手段によって、前記低次の次数を更新して前記対数尤度関数を最小化させることを繰り返すことでそれぞれ推定された各頭部伝達関数の低次モデルと、高次参照モデルと、の間の音像定位知覚に係る特徴量の誤差をそれぞれ求め、前記特徴量の誤差が予め定められた許容条件を満たし且つ最低次数となるときの低次モデルを探索する。
本発明は、コンピュータを、頭部伝達関数のモデリング装置の各手段として動作させる頭部伝達関数のモデリングプログラムで実現することもできる。
図1に示す入出力データを事前に測定する際には、図2に例示するように音響無響室において、所定方向に設置した例えば1台のスピーカSPに対して入力信号u(k)を印加する。ここで、kは、音声の連続時間信号のサンプリングを行うときの時間間隔(サンプリング周期)に対応付けられたサンプルを識別する変数である。kは離散値であり、その個数がデータ数である。そして、スピーカSPから発せられた音声を、ダミーヘッドDの耳に当たる位置に設置したマイクロフォンで測定する。このときに測定された信号を出力信号y(k)とする。
一例として、図3(a)にシフトレジスタ長が15(サンプル数=215−1)のM系列信号の波形を示す。なお、図3(a)には、M系列信号の途中の一部分(100サンプル分)の波形を示した。また、図3(b)には、ダミーヘッドDの正面から左30°方向に設置したスピーカSPに、そのM系列を印加したときに測定された出力信号y(k)の一部波形を示す。ただし、図3(a)及び図3(b)に示す波形はサンプリング周波数を48kHzとした場合に得られたものである。
漸近推定法(asymptotic method)は、例えばプラント制御のためのモデリング法として公知の手法である。漸近推定法では、まず、システム同定実験によって得られた入出力データに対して雑音モデルを考慮した高次(例えばn次とする)モデルのパラメータを推定し、その後に、漸近理論に基づき周波数特性を考慮して低次元化を行なう。
頭部伝達関数のモデリング装置1(以下、単にモデリング装置1という)は、一般的なコンピュータと同様に、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、入出力インタフェース等を備えている。ここでは、モデリング装置1は、図1に示すように、高次モデル推定手段10と、高次数設定手段11と、低次元化手段20と、を備えている。
ここでは、高次モデル推定手段10は、高次ARXモデルを用いてシステム同定理論に基づき最小二乗法でパラメータを推定することとする。
式(8)において、Lはむだ時間(dead time)を表す。
上記各式において、上添え字hはhighの省略形であって、モデルAh(q)、Bh(q)の次数nが十分に高いこと、すなわち高次モデルであることを意味しており、hは変数ではない。
この低次元化手段20は、図1に示すように、周波数伝達関数算出手段21と、低次モデル推定手段22と、低次モデル探索手段23と、を備えている。
なお、G^l(q)は、制御対象とする伝達関数G(q)についての低次モデルの推定値であり、H^l(q)は、雑音モデルH(q)についての低次雑音モデルの推定値である。
低次モデル探索手段23は、推定しようとする未知の低次モデルのモデル次数mを更新して対数尤度関数Vを最小化させることを繰り返すことでそれぞれ推定された各頭部伝達関数の低次モデルG^l(q)と、高次参照モデルと、の間の音像定位知覚に係る特徴量の誤差をそれぞれ求め、この特徴量の誤差が予め定められた許容条件を満たし且つ最低次数となるときの低次モデルを探索するものである。ここで探索された最低次数の低次モデルG^l(q)がモデリング装置1の出力である。
また、次数mを1ずつシフトしてもよいし、2以上の所定値ずつシフトしてもよい。必ずしも毎回同じシフト数にする必要もなく、例えば10ずつシフトした後で、その間を1ずつシフトしてもよい。
また、前記したようにモデリング装置1の最終出力とはならないことが明らかならば、モデル次数mの更新の際に、値を取り得る全てのm(0<m<n)を必ずしも選択しなくてもよい。
ここで説明する求解法には、下記のA−1,A−2,A−3の3つの手続きがある。
高次モデル推定手段10で推定された既知の高次雑音モデルH^h(q)を用いて、次の式(13)のように入力信号u(k)をフィルタリングする。この高次雑音モデルH^h(q)のフィルタを通過した信号uf(k)は、頭部伝達関数の高次モデルG^h(q)の入力信号として用いられる。
前記手続きA−1で得られた式(13)に示すフィルタ通過信号uf(k)を、頭部伝達関数の高次モデルG^h(q)への新たな入力信号として、高次モデルG^h(q)の出力信号y^f(k)を次の式(14)により計算する。
手続きA−1,A−2によって、頭部伝達関数の高次モデルG^h(q)の新しい入出力信号{uf(k),y^f(k);k=1,2,…,N}が得られたならば、この新しい入出力信号を用いて、高次モデルG^h(q)を低次元化した低次モデルのパラメータを出力誤差法により推定する。このとき、出力誤差法の損失関数VOEは、次の式(15)で表される。
ここでは、頭部伝達関数およびそのモデルの応用の一例として、音響信号の音像を空間内に擬似的に配置させるような音像定位技術を挙げて説明する。具体的には、モデリング装置1による頭部伝達関数のモデリング方法を含む音像定位制御の全体の流れについて図5を参照(適宜図1〜図3参照)して説明する。
まず、モデリング装置1の処理をする前に、システム同定を行うために必要な入出力データを測定する(ステップS100)。測定方法は、図2を参照して説明した方法を用いることができる。入出力データの具体例は図3(a)及び図3(b)に示されている。
漸近推定法による処理(ステップS200)を概説すると、まず、高次ARXモデルのパラメータを推定する処理を行い(ステップS210:高次モデル推定ステップ)、その後に、漸近理論に基づきARXモデルの低次元化処理を行う(ステップS220:低次元化ステップ)。
また、ステップS220では、モデリング装置1において、低次元化手段20が、推定された高次モデル(G^h(q),H^h(q))と、前記式(10)に示す対数尤度関数Vとを用いて最尤推定値を導出することで高次モデルを低次元化する。そして、モデリング装置1は頭部伝達関数の低次モデルを出力する。なお、ARXモデルの低次元化処理の詳細な流れについては後記する。
次に、モデリング装置1の低次元化手段20によるARXモデルの低次元化処理の詳細な流れについて図6を参照(適宜図1〜図3及び図5参照)して説明する。
ARXモデルの低次元化処理(ステップS220)では、まず、モデリング装置1の周波数伝達関数算出手段21が、図5のステップS210で得られた高次(n次)モデル{G^h(q),H^h(q)}の周波数伝達関数G^h(ejω),H^h(ejω)を求める(ステップS221)。
具体的には、音響特徴量算出手段26が、その時点で設定されているモデル次数mの低次モデルG^l(q)についての周波数伝達関数G^l(ejω)におけるスペクトラルキューの中心周波数と、高次参照モデル(512次FIRモデル)についての周波数伝達関数におけるスペクトラルキューの中心周波数との差分を音響特徴量の誤差として算出する。そして、音響特徴量判定手段27は、スペクトラルキューの中心周波数のずれが1サンプル(第2閾値)以下であるか否かを判定する。
本発明の効果を確かめるために、ダミーヘッドDの頭部中心の位置より1.3m離れた位置で、ダミーヘッドDの正面から左30°方向に設置した1つのスピーカSPから測定信号を印加する実験を行った。そして、ダミーヘッドDの左耳に内蔵されたマイクロフォンにより収音を行なって図3(b)に例示した出力信号を得た。このときの入出力データを用いて本実施形態に係るモデリング方法で頭部伝達関数をモデリングした。また、高次参照モデルとして512次FIRモデルを求めた。
ここでは、本実施形態で推定された頭部伝達関数の低次モデルを適用する音像定位制御の具体例について説明する。
頭部伝達関数を利用したシステムとして、トランスオーラルシステムと呼ばれる、三次元音響を実現するためのシステムが知られている。図9に、制御点(以下、その識別子をi、ただしi=1,…,mとする)及び2次音源(以下、その識別子をj、ただしj=1,…,nとする)を有するトランスオーラル再生システムのブロック図を示す。なお、mはnと等しくてもよい。
なお、前記した要素Xi(q)は、制御器Hji(q)によってクロストークを抑圧後に、i番目の各制御点においてリスナー90の右耳又は左耳にだけ聴かせたい音声信号の伝達関数を表す。
式(24)は、制御点数に対応してm個の要素(Xi(q))を有した列ベクトルで表される。なお、この列ベクトルは行ベクトルの転置Tにより表されている。
式(25)は、制御点数と2次音源数とに対応してm×n個の要素(Gij(q))を有したベクトル(行列)で表される。
式(26)は、2次音源数と制御点数とに対応してn×m個の要素(Hji(q))を有したベクトル(行列)で表される。
また、頭部伝達関数およびそのモデルの応用の一例として、音像定位技術を挙げて具体的に説明したが、本発明は、音像定位に限らず、例えば、ラウドネスメーターなど頭部伝達関数を利用した技術全般に適用することができる。
10 高次モデル推定手段
11 高次数設定手段
20 低次元化手段
21 周波数伝達関数算出手段
22 低次モデル推定手段
23 低次モデル探索手段
24 スペクトラル歪算出手段
25 スペクトラル歪判定手段
26 音響特徴量算出手段
27 音響特徴量判定手段
Claims (6)
- スピーカに印加された入力信号と前記スピーカから発せられた音声をマイクロフォンで測定して得られた出力信号とを入出力データとして用いて、漸近推定法により頭部伝達関数をモデリングする頭部伝達関数のモデリング装置であって、
前記入出力データを用いて、予め定められた高次のモデル次数を有した頭部伝達関数及び雑音モデルについての高次モデルを予測誤差法により推定する高次モデル推定手段と、
推定された高次モデルと、周波数領域における評価関数である対数尤度関数とを用いて最尤推定値を導出することで前記高次モデルを低次元化する低次元化手段とを備え、
前記低次元化手段は、
前記高次モデルの周波数伝達関数を求める周波数伝達関数算出手段と、
前記対数尤度関数を最小化することで前記高次のモデル次数よりも低い次数の低次モデルの推定値を求める低次モデル推定手段と、
前記低次の次数を更新して前記対数尤度関数を最小化させることを繰り返すことでそれぞれ推定された各頭部伝達関数の低次モデルと、高次参照モデルと、の間の音像定位知覚に係る特徴量の誤差をそれぞれ求め、前記特徴量の誤差が予め定められた許容条件を満たし且つ最低次数となるときの低次モデルを探索する低次モデル探索手段と、
を備えることを特徴とする頭部伝達関数のモデリング装置。 - 前記音像定位知覚に係る特徴量は、前記頭部伝達関数の周波数特性上のピーク及びノッチであるスペクトラルキューの位置であることを特徴とする請求項1に記載の頭部伝達関数のモデリング装置。
- 前記低次モデル探索手段は、
前記低次モデル推定手段でそれぞれ推定された各頭部伝達関数の低次モデルと、前記高次参照モデルと、の間のスペクトル歪をそれぞれ求め、前記スペクトル歪が予め定められた第1閾値以下、且つ前記スペクトラルキューの位置についての前記高次参照モデルとの間の誤差が予め定められた第2閾値以下の条件を満たし且つ最低次数となるときの低次モデルを探索することを特徴とする請求項2に記載の頭部伝達関数のモデリング装置。 - 前記低次モデル探索手段は、
前記低次の次数を前記高次のモデル次数側から降順に更新して前記スペクトル歪が前記第1閾値より大きくなった場合に前記対数尤度関数の最小化処理を停止し、
前記スペクトル歪が前記第1閾値以下であったときの次数を起点として前記低次の次数を昇順に更新して前記スペクトラルキューの位置についての前記高次参照モデルとの間の誤差が前記第2閾値以下になったときの次数を前記最低次数として決定する、ことを特徴とする請求項3に記載の頭部伝達関数のモデリング装置。 - スピーカに印加された入力信号と前記スピーカから発せられた音声をマイクロフォンで測定して得られた出力信号とを入出力データとして用いて、漸近推定法により頭部伝達関数をモデリングする頭部伝達関数のモデリング方法であって、
前記入出力データを用いて、予め定められた高次のモデル次数を有した頭部伝達関数及び雑音モデルについての高次モデルを予測誤差法により推定する高次モデル推定ステップと、
推定された高次モデルと、周波数領域における評価関数である対数尤度関数とを用いて最尤推定値を導出することで前記高次モデルを低次元化する低次元化ステップと、を有し、
前記低次元化ステップは、
前記高次モデルの周波数伝達関数を求める周波数伝達関数算出ステップと、
前記対数尤度関数を最小化することで前記高次のモデル次数よりも低い次数の低次モデルの推定値を求める低次モデル推定ステップと、
前記低次の次数を更新して前記対数尤度関数を最小化させることを繰り返すことでそれぞれ推定された各頭部伝達関数の低次モデルと、高次参照モデルと、の間の音像定位知覚に係る特徴量の誤差をそれぞれ求め、前記特徴量の誤差が予め定められた許容条件を満たし且つ最低次数となるときの低次モデルを探索する低次モデル探索ステップと、
を有することを特徴とする頭部伝達関数のモデリング方法。 - コンピュータを、請求項1に記載の頭部伝達関数のモデリング装置として機能させるための頭部伝達関数のモデリングプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014161681A JP6343771B2 (ja) | 2014-08-07 | 2014-08-07 | 頭部伝達関数のモデリング装置、その方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014161681A JP6343771B2 (ja) | 2014-08-07 | 2014-08-07 | 頭部伝達関数のモデリング装置、その方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016039493A true JP2016039493A (ja) | 2016-03-22 |
JP6343771B2 JP6343771B2 (ja) | 2018-06-20 |
Family
ID=55530255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014161681A Active JP6343771B2 (ja) | 2014-08-07 | 2014-08-07 | 頭部伝達関数のモデリング装置、その方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6343771B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016039492A (ja) * | 2014-08-07 | 2016-03-22 | 日本放送協会 | 伝達関数近似装置、そのプログラム及びその方法 |
JP2018092218A (ja) * | 2016-11-30 | 2018-06-14 | 富士通株式会社 | 係数決定プログラム、係数決定方法及び係数決定装置 |
JP2020170938A (ja) * | 2019-04-03 | 2020-10-15 | アルパイン株式会社 | 頭部伝達関数学習装置および頭部伝達関数推論装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002095096A (ja) * | 2000-09-14 | 2002-03-29 | Sony Corp | 車載用音響再生装置 |
US20060277034A1 (en) * | 2005-06-01 | 2006-12-07 | Ben Sferrazza | Method and system for processing HRTF data for 3-D sound positioning |
JP2007174224A (ja) * | 2005-12-21 | 2007-07-05 | Chiba Inst Of Technology | 近似フィルタ作成方法、近似フィルタ作成システム、フィルタ設計方法 |
JP2008211834A (ja) * | 2004-12-24 | 2008-09-11 | Matsushita Electric Ind Co Ltd | 音像定位装置 |
-
2014
- 2014-08-07 JP JP2014161681A patent/JP6343771B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002095096A (ja) * | 2000-09-14 | 2002-03-29 | Sony Corp | 車載用音響再生装置 |
JP2008211834A (ja) * | 2004-12-24 | 2008-09-11 | Matsushita Electric Ind Co Ltd | 音像定位装置 |
US20060277034A1 (en) * | 2005-06-01 | 2006-12-07 | Ben Sferrazza | Method and system for processing HRTF data for 3-D sound positioning |
JP2007174224A (ja) * | 2005-12-21 | 2007-07-05 | Chiba Inst Of Technology | 近似フィルタ作成方法、近似フィルタ作成システム、フィルタ設計方法 |
Non-Patent Citations (1)
Title |
---|
足立 修一: "次世代プラント操業に期待される制御技術", 計測と制御, vol. 第47巻, 第11号, JPN6018009528, 10 November 2008 (2008-11-10), JP, pages 915 - 920, ISSN: 0003760790 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016039492A (ja) * | 2014-08-07 | 2016-03-22 | 日本放送協会 | 伝達関数近似装置、そのプログラム及びその方法 |
JP2018092218A (ja) * | 2016-11-30 | 2018-06-14 | 富士通株式会社 | 係数決定プログラム、係数決定方法及び係数決定装置 |
JP2020170938A (ja) * | 2019-04-03 | 2020-10-15 | アルパイン株式会社 | 頭部伝達関数学習装置および頭部伝達関数推論装置 |
JP7206027B2 (ja) | 2019-04-03 | 2023-01-17 | アルパイン株式会社 | 頭部伝達関数学習装置および頭部伝達関数推論装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6343771B2 (ja) | 2018-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101807961B1 (ko) | Lstm 및 심화신경망 기반의 음성 신호 처리 방법 및 장치 | |
EP3050322B1 (en) | System and method for evaluating an acoustic transfer function | |
US20150131826A1 (en) | Audio precompensation controller design with pairwise loudspeaker channel similarity | |
JP6987075B2 (ja) | オーディオ源分離 | |
JP6343771B2 (ja) | 頭部伝達関数のモデリング装置、その方法及びそのプログラム | |
CN112584277B (zh) | 一种室内音频均衡的方法 | |
CN112562624B (zh) | 主动降噪滤波器设计方法、降噪方法、系统及电子设备 | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
Barumerli et al. | Round Robin Comparison of Inter-Laboratory HRTF Measurements–Assessment with an auditory model for elevation | |
JP6399864B2 (ja) | 制御器設計装置、制御器設計方法及びプログラム | |
CN114287137B (zh) | 基于高斯分布和k最近邻算法的房间校准 | |
JP2013113866A (ja) | 残響除去方法、残響除去装置、プログラム | |
Szwajcowski | Approximating head-related transfer functions in the domain of common basis functions | |
CN115696176A (zh) | 一种基于音频对象的声重放方法、装置、设备及存储介质 | |
JP4473709B2 (ja) | 信号推定方法、信号推定装置、信号推定プログラム及びその記録媒体 | |
JP2018142835A (ja) | 制御器設計装置、制御器及びプログラム | |
JP6889883B2 (ja) | 音響信号用の制御器設計装置及びプログラム | |
US10743126B2 (en) | Method and apparatus for controlling acoustic signals to be recorded and/or reproduced by an electro-acoustical sound system | |
JP2018191255A (ja) | 収音装置、その方法、及びプログラム | |
Kumar | Dominant pole based approximation for discrete time system | |
JP2012048134A (ja) | 残響除去方法とその装置とプログラム | |
JP6361874B2 (ja) | 伝達関数近似装置、そのプログラム及びその方法 | |
Dziechciński | A computer model for calculating the speech transmission index using the direct STIPA method | |
US11399252B2 (en) | Method and system for virtual acoustic rendering by time-varying recursive filter structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170630 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6343771 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |