[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP7020257B2 - オーディオ装置、音響効果係数算出方法、およびプログラム - Google Patents

オーディオ装置、音響効果係数算出方法、およびプログラム Download PDF

Info

Publication number
JP7020257B2
JP7020257B2 JP2018073642A JP2018073642A JP7020257B2 JP 7020257 B2 JP7020257 B2 JP 7020257B2 JP 2018073642 A JP2018073642 A JP 2018073642A JP 2018073642 A JP2018073642 A JP 2018073642A JP 7020257 B2 JP7020257 B2 JP 7020257B2
Authority
JP
Japan
Prior art keywords
volume
sound
frequency band
frequency
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018073642A
Other languages
English (en)
Other versions
JP2019186687A (ja
Inventor
毅彦 川▲原▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2018073642A priority Critical patent/JP7020257B2/ja
Publication of JP2019186687A publication Critical patent/JP2019186687A/ja
Application granted granted Critical
Publication of JP7020257B2 publication Critical patent/JP7020257B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、雑音の存在する環境での音の再生を支援する技術に関する。
走行中の車両の車室のように雑音の存在する環境で楽音などの音を再生する場合に再生音が雑音に埋もれないように音の再生を支援する技術が種々提案されており、その一例としては特許文献1に開示の技術が挙げられる。
特許文献1に開示の技術では、スピーカから再生音が放音される環境にマイクロフォンを設置し、当該マイクロフォンに再生音とその環境において聴取される雑音とを収音させる。そして、特許文献1に開示の技術では、雑音の振幅スペクトルの平均値と再生音の振幅スペクトルの平均値とが周波数帯域毎に算出され、雑音の振幅スペクトルに再生音の振幅スペクトルが埋もれないように、再生音の音量が周波数帯域毎に補正される。
特開平11-298990号公報
しかし、従来の技術では、ある周波数帯域において再生音の振幅スペクトルに急峻なピークが現れている場合、再生音の振幅スペクトルを平均することで当該周波数帯域の音量は小と判定され、当該周波数帯域全体に亘って再生音の音量が引き上げられる。したがって、ピークに対応する音を聞き分けることができれば十分であるにも拘らず、当該周波数帯域における再生音の音量が過大に引き上げられる、といった問題がある。
本発明に係るオーディオ装置の一態様は、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、を備える。
本発明に係る音響効果係数算出方法の一態様は、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定し、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定し、前記再生音について推定された音量と前記雑音について推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する。
本発明に係るプログラムは、プロセッサを、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、して機能させる。
本発明の一実施形態のオーディオ装置120を含むオーディオシステムの構成例を示す図である。 オーディオ装置120の構成例を示す図である。 補正テーブル301の格納内容の一例を示す図である。 オーディオ装置120の演算部220が再生支援プログラム303にしたがって実行する再生支援処理の流れを示すフローチャートである。 再生音推定部212が実行する再生音推定処理の流れを示す図である。 再生音推定部212が再生音推定処理のステップSB100にて生成する振幅スペクトルの一例を示す図である。 再生音推定部212が再生音推定処理のステップSB110にて生成するデータDA1の一例を示す図である。 再生音推定部212が再生音推定処理のステップSB120にて生成するデータDA2の一例を示す図である。 雑音推定部213が実行する雑音推定処理の流れを示す図である。 雑音推定部213が雑音推定処理のステップSB100にて生成する振幅スペクトルの一例を示す図である。 雑音推定部213が雑音推定処理のステップSB110にて生成するデータDB1の一例を示す図である。 雑音推定部213が雑音推定処理のステップSC120にて生成するデータDB2の一例を示す図である。 音響効果係数算出部214が実行する音響効果係数算出処理の流れを示す図である。 補正処理SD100を経たデータDC1の一例を示す図である。 比較処理SD110の処理結果を表すデータDC2の一例を示す図である。 再生音推定部212が音量推定処理のステップSB120にて生成するデータDA2の他の例を示す図である。 雑音推定部213が音量推定処理のステップSC120にて生成するデータDB2の他の例を示す図である。
以下、図面を参照しながら本発明に係る実施の形態を説明する。なお、図面において各部の寸法および縮尺は実際のものと適宜異なる。また、以下に記載する実施の形態は、本発明の好適な具体例である。このため、本実施形態には、技術的に好ましい種々の限定が付されている。しかしながら、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。
<1.実施形態>
図1は、本発明の一実施形態のオーディオ装置120を含むオーディオシステムの構成例を示す図である。このオーディオシステムは、車両に搭載され、当該車両の車室1において楽音等を再生するカーオーディオシステムである。図1に示すように、このオーディオシステムは、オーディオ装置120と、スピーカ130-1から130-4と、マイクロフォン140と、を有する。図1に示すように、スピーカ130-1から130-4とマイクロフォン140とは、オーディオケーブルなどの信号線を介してオーディオ装置120に接続されている。
図1に示すように、スピーカ130-1は、オーディオ装置120が搭載される車両の運転席111近傍に設けられており、スピーカ130-2は上記車両の助手席112近傍に設けられている。具体的には、スピーカ130-1は運転席側ドアの内側にその放音面を車室1内に向けた姿勢で設けられている。スピーカ130-2は助手席側ドアにその放音面を車室1内に向けた姿勢で設けられている。スピーカ130-3および130-4は、上記車両の後列席113を挟むように設けられている。具体的には、スピーカ130-3は上記車両の運転席側の後部ドアにその放音面を車室1内に向けた姿勢で設けられている。スピーカ130-4は上記車両の助手席側の後部ドアにその放音面を車室1内に向けた姿勢で設けられている。以下では、スピーカ130-1から130-4の各々を区別する必要がない場合には、「スピーカ130」と表記する。スピーカ130には、楽音等の再生音の音信号がオーディオ装置120から供給される。音信号とは、音の波形を表すアナログ信号のことをいう。スピーカ130は、オーディオ装置120から供給される音信号に応じた音を車室1内に放音する。
マイクロフォン140は、例えば、オーディオ装置120が搭載される車両のダッシュボードに設けられている。マイクロフォン140は、その設置位置において収音した音の波形を表す音信号をオーディオ装置120へ出力する。マイクロフォン140により収音される音には、スピーカ130から車室1内に放音された再生音と当該音以外の雑音とが含まれている。マイクロフォン140により収音される雑音の具体例としては、車両の走行に伴って発生するロードノイズが挙げられる。
図2は、オーディオ装置120の構成例を示す図である。図2に示すように、オーディオ装置120は、再生装置210と、演算部220と、記憶部230と、A/D変換器240と、D/A変換器250と、アンプ260と、を有する。
再生装置210は、スピーカ130から放射する再生音の音データD1を演算部220へ出力する。音データとは、音の波形をサンプリングして得られるサンプル列などのデジタルデータのことをいう。再生装置210の具体例としては、CDドライブなどの記録媒体読み取り装置或いはカーラジオなどの受信器が挙げられる。再生装置210が記録媒体読み取り装置である場合、再生装置210は、記録媒体から音データD1を読み出し、当該読み出した音データD1を演算部220へ出力する。
A/D変換器240には、信号線を介してマイクロフォン140が接続されている。A/D変換器240は、マイクロフォン140から与えられる音信号にアナログ/デジタル変換を施し、その変換結果である音データD2を演算部220に与える。
演算部220は、プロセッサであり、例えば単数または複数のチップで構成される。演算部220は、例えば、周辺装置とのインタフェース、演算装置およびレジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成される。なお、演算部220の機能の一部または全部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアで実現してもよい。演算部220は、各種の処理を並列的または逐次的に実行する。
演算部220は、記憶部230に記憶されている再生支援プログラム303を実行し、オーディオ装置120の制御中枢として機能する。再生支援プログラム303にしたがって作動している演算部220は、再生装置210から与えられた音データD1の表す再生音の音量を過大に引き上げることなく、その再生音がロードノイズ等の雑音に埋もれないようにする再生支援処理を実行し、その処理結果である音データDDをD/A変換器250へ出力する。この再生支援処理の詳細については後に明らかにする。
D/A変換器250は、演算部220から与えられる音データDDにデジタル/アナログ変換を施して音信号に変換し、この音信号をアンプ260へ出力する。アンプ260には、スピーカ130-1から130-4の各々がそれぞれ信号線を介して接続されている。アンプ260は、D/A変換器250から与えられた音信号の信号レベルをスピーカ130からの放音に適した信号レベルに増幅してスピーカ130へ出力する。
記憶部230は、図2では詳細な図示を省略したが揮発性記憶部と不揮発性記憶部とを含んでいる。揮発性記憶部は、例えばRAM(Random Access Memory)である。この揮発性記憶部は、再生支援プログラム303を実行する際のワークエリアとして演算部220によって利用される。また、この揮発性記憶部は、A/D変換器240から与えられた音データD2と、再生装置210から与えられた音データD1とを蓄積するバッファとしても利用される。不揮発性記憶部は、例えばハードディスクである。不揮発性記憶部には、補正テーブル301と、音響効果係数テーブル302と、再生支援プログラム303とが予め記憶されている。
補正テーブル301には、例えば20Hzから10000Hzの帯域を分割した複数の周波数帯域の各々において雑音の音量と再生音の音量とを比較する際の再生音の音量の補正量を表すデータが予め格納されている。本実施形態では、上記複数の周波数帯域として、各々の中心周波数が63Hz,125Hz、250Hz、500Hz、1000Hz、2000Hz、および4000Hzであり、各々1オクターブに相当するバンド幅を有するオクターブバンドが採用されている。以下では、上記複数の周波数帯域の各々を1から7のバンド番号で区別する。バンド番号=1の周波数帯域の中心周波数は63Hzであり、バンド番号=2の周波数帯域の中心周波数は125Hzである。バンド番号=3の周波数帯域の中心周波数は250Hzであり、バンド番号=4の周波数帯域の中心周波数は500Hzである。バンド番号=5の周波数帯域の中心周波数は1000Hzであり、バンド番号=6の周波数帯域の中心周波数は2000Hzであり、バンド番号=7の周波数帯域の中心周波数は4000Hzである。
補正テーブル301の格納内容は、オーディオ装置120を含むオーディオシステムの特性に応じて定められる。本実施形態では、図3に示すように、バンド番号=1のバンドについては音量を5dB引き下げ、バンド番号=2から7の各バンドについては音量を2から8dB引き上げることを表すデータを格納した補正テーブル301が記憶部230に予め格納されている。
音響効果係数テーブル302には、補正テーブル301の格納内容にしたがって補正された再生音の音量と雑音の音量との差に対応づけて、再生音が雑音に埋もれないように再生音の音量を補正する音響効果係数(例えば、音量の引き上げ量)を表すデータが格納されている。
演算部220は、オーディオ装置120の電源(図2では図示略)の投入を契機として再生支援プログラム303を不揮発性記憶部から揮発性記憶部へ読み出し、当該再生支援プログラム303の実行を開始する。再生支援プログラム303にしたがって作動している演算部220は、再生支援処理(図4参照)を実行し、図2に示す音響効果付与部211、再生音推定部212、雑音推定部213、音響効果係数算出部214、およびエコーキャンセル部215として機能する。つまり、図2における音響効果付与部211、再生音推定部212、雑音推定部213、音響効果係数算出部214、およびエコーキャンセル部215の各々はソフトウェアにしたがって実現されるソフトウェアモジュールである。
図2に示すように、音響効果付与部211、再生音推定部212、雑音推定部213、およびエコーキャンセル部215の各々には音データD1が与えられる。また、エコーキャンセル部215には音データD2も与えられる。
エコーキャンセル部215は、図4におけるエコーキャンセル処理SA100を実行する。エコーキャンセル部215は、スピーカ130、当該スピーカ130からの再生音が放音される空間(車室1)、マイクロフォン140といった音の伝播経路の特性を考慮して音データD1´を上記バッファから読み出した音データD1に基づいて生成する。音の伝播経路の特性には、たとえば周波数ごとの振幅特性及び反射によるエコーなどが含まれる。具体的には、エコーキャンセル部215は、伝播経路の特性を表すFIR(finite impulse response)フィルタの係数をリアルタイムで推定し、推定した係数が設定されたFIRフィルタに、音データD1を入力して音データD1´を得る。エコーキャンセル部215は、音データD2から当該音データD1´の表す信号成分を除外して新たな音データD3を生成し、雑音推定部213に出力する。
再生音推定部212は、図4における再生音推定処理SA110を実行する。図5は、再生音推定処理の流れを示す図である。図5に示すように、再生音推定部212は、まず、一定時間分の音データD1をバッファから読み出し、当該音データD1を上記一定時間よりも短い時間分の処理単位データに区切って短時間周波数解析を施して周波数領域のデータに変換する(ステップSB100)。なお、本実施形態において一定時間とは、上記複数の周波数帯域における最も低い周波数の対応する音の複数周期(例えば4周期)に相当する時間であり、上記処理単位データは当該1周期に相当する時間分の音データである。図5では、短時間周波数解析はSTFT(Short Time Fourier Transform)と略記されている。また、短時間周波数解析の具体的なアルゴリズムとしては、FFT(Fast Fourier Transform)が挙げられる。例えば、上記一定時間分の音データD1が4個の処理単位データに分割される場合、各処理単位データに短時間周波数解析を施すことで図6に示す振幅スペクトルSP1-1からSP1-4が得られる。以下では、振幅スペクトルSP1-1からSP1-4の各々を区別する必要がない場合には「振幅スペクトルSP1」と表記する。
ステップSB110では、再生音推定部212は、ステップSB100により得られた周波数領域のデータから、上記一定時間における振幅スペクトルのピーク(最大値)を周波数毎に特定し、上記一定時間における各周波数の振幅スペクトルのピークを表すデータDA1を生成する。例えば、ステップSB100にて振幅SP1-1からSP1-4を表すデータが得られた場合、再生音推定部212は図7に示すデータDA1を生成する。
ステップSB120では、再生音推定部212は、ステップSB110にて生成したデータを解析して上記一定時間における再生音の音量を周波数帯域毎に推定し、その推定結果を示すデータDA2(図8参照)を音響効果係数算出部214へ出力する。より詳細に説明すると、再生音推定部212は、データDA1を参照して周波数帯域毎にいずれの周波数の振幅スペクトルのピークが最大であるかを判定し、最大のピークを当該周波数帯域における再生音の音量とする。例えば、バンド番号=1の周波数帯域ではその中心周波数の振幅スペクトルのピークが最大であったとする。この場合、再生音推定部212は、当該中心周波数(63Hz)の振幅スペクトルのピークをバンド番号=1の周波数帯域における再生音の音量とする。本実施形態において、上記一定時間における再生音の音量を周波数帯域毎にその周波数帯域に属する各周波数の振幅スペクトルの平均値ではなく、各周波数の振幅スペクトルのピークの最大値に基づいて推定するのは、平均値を用いることに起因する弊害を避けるためである。
雑音推定部213は、図4における雑音推定処理A120を実行する。図9は、雑音推定処理の流れを示す図である。図9に示すように、雑音推定部213は、上記一定時間分の音データD3を処理対象として前述のステップSB100およびステップSB110の処理を実行する。音データD3を処理対象としてステップSB100の処理を実行することで、例えば、図10に示す振幅スペクトルSP2-1からSP2-4が生成される。以下では、振幅スペクトルSP2-1からSP2-4の各々を区別する必要がない場合には「振幅スペクトルSP2」と表記する。そして、雑音推定部213は、振幅スペクトルSP2-1からSP2-4(図10参照)を処理対象としてステップSB110を実行することで、上記一定時間における雑音の各周波数の振幅スペクトルのピークを表すデータDB1(図11参照)を生成する。
雑音推定処理においてステップSB110に後続して実行されるステップSC120では、雑音推定部213は、データDB1を解析して上記一定時間における雑音の音量を周波数帯域毎に推定し、その推定結果を示すデータDB2(図12参照)を音響効果係数算出部214へ出力する。より詳細に説明すると、このステップSC120では、雑音推定部213は、データDB1を参照して周波数帯域毎にいずれの周波数の振幅スペクトルのピークが最小であるかを判定し、最小のピークを当該周波数帯域における雑音の音量とする。例えば、バンド番号=1の周波数帯域ではその上限周波数の振幅スペクトルのピークが最小であったとする。この場合、雑音推定部213は、当該周波数の振幅スペクトルのピークを当該周波数帯域における雑音の音量とする。本実施形態において、上記一定時間における雑音の音量を周波数帯域毎にその周波数帯域に属する各周波数の振幅スペクトルの平均値ではなく、各周波数の振幅スペクトルのピークの最小値に基づいて推定するのは、突発的な雑音の影響により雑音の音量が過大となることを回避しつつ、平均値を用いることに起因する弊害を避けるためである。
本実施形態では、上記一定時間における雑音の音量を周波数帯域毎にその周波数帯域に属する各周波数の振幅スペクトルのピークの最小値に基づいて推定した。しかし、周波数帯域における各周波数の振幅スペクトルのピークの中央値、または各周波数の振幅スペクトルのピークの値をヒストグラム化することで得られた最頻出値に基づいて雑音の音量を推定してもよい。これらの態様によっても、突発的な雑音の影響により雑音の音量が過大となることを回避しつつ、平均値を用いることに起因する弊害を避けることができると考えられるからである。また、周波数帯域に属する各周波数の振幅スペクトルのピークから最大値および最小値を除外して振幅スペクトルのピークの平均値を算出し、その平均値を当該周波数帯域における雑音の音量としてもよい。このような態様によっても、最大値および最小値を除外せずに平均値を算出する態様に比較して急峻なピークを有する雑音の影響を受けないようにすることが可能になる。
音響効果係数算出部214は、図4における音響効果係数算出処理SA130を実行する。図13は、音響効果係数算出処理の流れを示す図である。図13における補正処理(SD100)では、音響効果係数算出部214は、データDA2の表す各周波数帯域の音量を補正テーブル301の格納内容(図3参照)に応じて補正し、補正後の音量を表すデータDC1(図14参照)を生成する。例えば、図3に示す補正テーブル301には、バンド番号=1の周波数帯域の音量を5dB引き下げることを示すデータが格納されている。このため、本実施形態の補正処理では、バンド番号=1の周波数帯域の音量は、データDA2の示す当該周波数帯域の音量から5dB引き下げられる。
補正処理に後続する比較処理(図13:SD110)では、音響効果係数算出部214は、複数の周波数帯域の各々における再生音の音量と雑音の音量とを周波数帯域毎に比較し、その比較結果を示すデータDC2を生成する。具体的には、音響効果係数算出部214は、周波数帯域毎にデータDC1の示す音量からデータDB2の示す音量を減算してデータDC2(図15参照)を生成する。このデータDC2において音量が負の値となっている周波数帯域は、再生音が雑音に埋もれていることを意味する。例えば、図15に示すデータDC2は、バンド番号=1および2の各周波数帯域で再生音が雑音に埋もれていることを示している。そして、係数算出処理(図13:SD120)では、音響効果係数算出部214は、周波数帯域毎に当該周波数帯域における再生音の音量と雑音の音量との差(データDC2の示す音量差)に応じた音響効果係数を音響効果係数テーブル302から読み出して音響効果付与部211に与える。例えば、比較処理にて図15に示すデータDC2が算出された場合、バンド番号=1および2の各周波数帯域の再生音の音量を、データDC2の示す音量差に応じて引き上げることを示す音響効果係数が音響効果係数算出部214から音響効果付与部211へ与えられる。
音響効果付与部211は、再生装置210から与えられる音データD1に対して、音響効果係数算出部214から与えられた音響効果係数に応じた音響効果の付与(本実施形態では音量の調整)を行い、当該音響効果を付与済みの音データをD/A変換器250に出力する。
このような構成としたため、本実施形態のオーディオ装置120からスピーカ130へ与えられる音データには、各周波数帯域における再生音が当該周波数帯域における雑音に埋もれないようにする音響効果が付与されているので、いずれの周波数帯域においても再生音が雑音に埋もれることはない。
また、本実施形態のオーディオ装置120によれば、再生音の振幅スペクトルに急峻なピークが現れている周波数帯域の再生音の音量は当該ピークに基づいて推定される。このため、当該周波数帯域の再生音の音量が過小に推定され、当該周波数帯域の再生音の音量が過大に引き上げられることはない。また、ある周波数帯域において雑音の振幅スペクトルに急峻なピークが現れていても、当該周波数帯域における雑音の音量が過大に推定されることはなく、当該周波数帯域における再生音の音量が過大に引き上げられることはない。
このように本実施形態によれば、雑音の存在する環境で音を再生する際に、再生音の音量を過大に引き上げることなく、再生音が雑音に埋もれないようにすることが可能になる。
<2.変形例>
以上の実施態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は相矛盾しない限り適宜に併合され得る。
<2-1:変形例1>
上記実施形態では、再生音の音量と雑音の音量とをオクターブバンド単位で推定し、オクターブバンド単位で再生音の音量を補正した。しかし、バンド幅が1/3の1/3オクターブバンド単位で、再生音および雑音の音量の推定と再生音の音量の補正をおこなってもよい。この場合、補正テーブル301には、1/3オクターブ単位の周波数帯域の各々において雑音の音量と再生音の音量とを比較する際の再生音の音量の補正量を表すデータを格納しておけばよい。また、再生音推定部212には、図8に示すデータD1に代えて、図16に示すように、各々1/3オクターブのバンド幅を有するバンド番号=1から21の周波数帯域における再生音の音量を表すデータD1を生成させるようにすればよい。同様に、雑音推定部213には、図12に示すデータD2に代えて、図17に示すようにバンド番号=1から21の各周波数帯域における雑音の音量を表すデータD2を生成させるようにすればよい。なお、図16および図17において、バンド番号=1の周波数帯域の中心周波数は63Hz、バンド番号=2の周波数帯域の中心周波数は80Hz、…バンド番号=20の周波数帯域の中心周波数は5000Hz、バンド番号=21の周波数帯域の中心周波数は6300Hzである。
<2-2:変形例2>
上記実施形態では、音響効果付与部211、再生音推定部212、雑音推定部213、音響効果係数算出部214、およびエコーキャンセル部215をソフトウェアで実現した。しかし、音響効果付与部211、再生音推定部212、雑音推定部213、音響効果係数算出部214、およびエコーキャンセル部215の各々を電子回路などのハードウェアで実現し、それらハードウェアを組み合わせてオーディオ装置120を構成してもよい。この場合、音響効果係数算出部214については、補正処理(図13:SD100)を実行する補正部と、比較処理(図13:SD110)を実行する比較部と、係数算出処理(図13;SD120)を実行する係数算出部の各部を電子回路で実現し、これら各部を組み合わせて構成すればよい。
<2-3:変形例3>
上記実施形態では、再生音が雑音に埋もれないように再生音の音量の補正量(音響効果係数)を決定した。しかし、補正後の再生音の音量を示すデータをバッファに蓄積しておき、当該バッファの格納内容の示す再生音の音量の時間変化から音のアタック部であるか否か、或いはリリース部であるか否かを判定し、その判定結果に応じて上記補正量を調整してもよい。例えば、アタック部である場合には、補正後の再生音の音量が前回の補正後の再生音の音量を上回るように上記補正量を調整することが好ましい。補正後の再生音の音量が前回の補正後の再生音の音量を下回っているとアタック感が薄れるからである。同様に、リリース部である場合には、補正後の再音の音量が前回の補正後の再生音の音量を下回るように補正量を調整することが好ましい。補正後の再生音の音量が前回の補正後の再生音の音量を上回っているとリリース感が薄れるからである。
<2-4:変形例4>
上記実施形態のオーディオ装置120は再生装置210を含んでいたが、信号線を介して再生装置210をオーディオ装置120に接続する態様であってもよい。つまり、再生装置210は本発明のオーディオ装置の必須構成要素ではなく、省略可能である。同様に、記憶部230も本発明のオーディオ装置の必須構成要素ではなく、省略可能である。記憶部230を省略する場合には、USBケーブル等を介してオーディオ装置120に接続されるハードディスクドライブ、或いはインターネットなどの電気通信回線経由で演算部220がアクセス可能なハードディスクドライブに記憶部230の役割を担わせればよい。
マイクロフォン140がA/D変換器を含んでいる場合には、A/D変換器240は不要であり、スピーカ130或いはアンプ260がD/A変換器を含んでいる場合にはD/A変換器250は不要である。また、信号線を介してオーディオ装置120に接続されるアンプにアンプ260の役割を担わせてもよく、この場合はアンプ260を省略可能である。
また、マイクロフォン140として鋭い指向性を有するマイクロフォンを用い、当該マイクロフォンを雑音の音源近傍に設置する等、スピーカ130から放射される差音がマイクロフォン140によって収音されないようにすることができる場合には、エコーキャンセル部215を省略してもよい。また、音響効果付与部211をオーディオ装置120とは別箇のDSPにより実現する場合には、音響効果付与部211も省略可能である。
つまり、本発明のオーディオ装置は、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部(上記実施形態における再生音推定部212)と、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部(上記実施形態における雑音推定部213)と、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて各周波数帯域において前記再生音の音量が前記雑音の音量を上回るように前記第1音信号に付与する音響効果係数を算出する算出部(上記実施形態における音響効果係数算出部214)と、を備えていればよい。
<2-5:変形例5>
上記実施形態では、再生支援プログラム303とは別箇に補正テーブル301と音響効果係数テーブル302とが記憶部230に記憶されていたが、補正テーブル301と音響効果係数テーブル302とを再生支援プログラム303に埋め込んで置いてもよい。また、上記実施形態では、オーディオ装置120の記憶部230に再生支援プログラム303を予め記憶させておいたが、補正テーブル301および音響効果係数テーブル302が埋め込まれているか否かを問わずに再生支援プログラム303を単体で提供してもよい。再生支援プログラム303の具体的な提供態様としては、CD-ROMなどのコンピュータ読み取り可能な記録媒体に書き込んで配布する態様、またはインターネットなどの電気通信回線経由のダウンロードにより配布する態様が考えられる。パーソナルコンピュータなどの一般的なコンピュータ装置に上記の要領で配布される再生支援プログラム303をインストールし、当該コンピュータ装置のプロセッサに当該再生支援プログラム303を実行させることで、当該コンピュータ装置を上記実施形態のオーディオ装置120として機能させることが可能になる。なお、補正テーブル301および音響効果係数テーブル302を再生支援プログラム303に埋め込んで置かない態様の場合、これらテーブルは当該再生支援プログラム303を実行するコンピュータ装置がアクセス可能な記憶装置に記憶されていればよい。
<2-6:変形例6>
上記実施形態では、カーオーディオシステムに含まれるオーディオ装置への本発明の適用例を説明したが、本発明の適用対象はカーオーディオシステムに含まれるオーディオ装置に限定される訳ではない。また、上記実施形態では、各周波数帯域において再生音が雑音に埋もれることがないように、各周波数帯域において再生音の音量が雑音の音量を上回るように第1音信号に付与する音響効果係数を算出した。しかし、再生音の音信号に付与する音響効果係数の算出(すなわち、再生音のチューニング)を、再生音について推定した音量と雑音について推定した音量との比較結果に応じて行う態様であればよい。要は、雑音の存在する環境で音の再生を行うオーディオ装置であれば、本発明を適用することで、再生音の音量が過小に推定されることを回避しつつ再生音のチューニングを行うことが可能になる。
<3.実施形態および各変形例の少なくとも1つから把握される態様>
上述した各実施形態および各変形例の少なくとも1つから以下の態様が把握される。
オーディオ装置の一態様は、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、を備える。
本態様によれば、各周波数帯域における再生音の音量は周波数帯域に属する各周波数の振幅スペクトルのピークに応じて推定される。このため、周波数帯域に属する各周波数の振幅スペクトルの平均値に応じて再生音の音量を推定する従来技術に比較して、再生音の振幅スペクトルに急峻なピークが現れている場合であっても、当該ピークに対応する周波数の属する周波数帯域における再生音の音量が過小に推定されることが回避される。本態様によれば、雑音の存在する環境で再生される再生音の振幅スペクトルに急峻なピークが現れている場合であっても、当該ピークに対応する周波数の属する周波数帯域における再生音の音量が過小に推定されることを回避しつつ、再生音をチューニングすることが可能になる。
上述したオーディオ装置の一態様において、前記第1推定部は、周波数帯域における前記再生音の音量をその周波数帯域に属する各周波数の振幅スペクトルのピークの最大値に基づいて推定することが好ましい。
再生音の振幅スペクトルに急峻なピークが現れている場合、当該ピークは上記最大値に対応する。このため、本態様によれば、周波数帯域における再生音の音量が過小に推定されることを確実に回避することができる。
上述したオーディオ装置の一態様において、前記第2推定部は、周波数帯域における前記雑音の音量をその周波数帯域に属する各周波数の振幅スペクトルのピークの最小値、中央値、最頻出値または各周波数に対応する振幅スペクトルのピークから最小値と最大値とを除外して算出される平均値のいずれかに基づいて推定することが好ましい。
本態様によれば、再生音の振幅スペクトルに急峻なピークが現れている場合、当該ピークは上記最大値に対応する。本態様によれば、各周波数帯域における雑音の音量の際に当該最大値は使用されないので、雑音の振幅スペクトルに急峻なピークが現れている周波数帯域における当該雑音の音量が過大に推定されることを確実に回避することができる。
上述したオーディオ装置の一態様において、前記算出部は、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて各周波数帯域において前記再生音の音量が前記雑音の音量を上回るように前記第1音信号に付与する音響効果係数を算出することを特徴とする。
本態様によれば、音の存在する環境で音を再生する際に、再生音の音量を過大に引き上げることなく、雑音に埋もれないように再生音をチューニングすることが可能になる。
上記オーディオ装置の一態様において、前記再生音と前記雑音とを収音するマイクロフォンから出力される第3音信号から前記第1音信号に対応する信号成分を除外して前記第2音信号を生成することが好ましい。
本態様によれば、マイクロフォンの出力信号を用いて雑音の音量を簡便かつ正確に推定することが可能になる。
上記オーディオ装置の一態様において、前記算出部は、前記第1推定部により推定された各周波数帯域における前記再生音の音量についての補正量を周波数帯域毎に規定して補正テーブルにしたがって、前記第1推定部により推定された前記再生音の音量を周波数帯域毎に補正する補正部と、前記補正部による補正後の音量と前記第2推定部により推定された前記雑音の音量とを周波数帯域毎に比較する比較部と、を有し、前記比較部における比較結果に応じて前記音響効果係数を周波数帯域毎に算出することを特徴とすることが好ましい。
本態様によれば、補正テーブルを切り替えることで多様なオーディオシステムに対応することが可能になる。
音響効果係数算出方法の一態様は、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定し、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定し、前記再生音について推定された音量と前記雑音について推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する。
本態様によっても、雑音の存在する環境で再生される再生音の振幅スペクトルに急峻なピークが現れている場合であっても、当該ピークに対応する周波数の属する周波数帯域における再生音の音量が過小に推定されることを回避しつつ、再生音をチューニングすることが可能になる。
プログラムの一態様は、プロセッサを、スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、して機能させる。
本態様によっても、雑音の存在する環境で再生される再生音の振幅スペクトルに急峻なピークが現れている場合であっても、当該ピークに対応する周波数の属する周波数帯域における再生音の音量が過小に推定されることを回避しつつ、再生音をチューニングすることが可能になる。
1…車室、111…運転席、112…助手席、113…後列席、120…オーディオ装置、130,130-1. 130-2. 130-3. 130-4…スピーカ、140…マイクロフォン、210…再生装置、220…演算部、230…記憶部、240…A/D変換器、250…D/A変換器、260…アンプ、211…音響効果付与部、212…再生音推定部、213…雑音推定部、214…音響効果係数算出部、215…エコーキャンセル部、301…補正テーブル、302…音響効果係数テーブル、303…再生支援プログラム。

Claims (8)

  1. スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、
    前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、
    前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、
    を備えるオーディオ装置。
  2. 前記第1推定部は、周波数帯域における前記再生音の音量をその周波数帯域に属する各周波数の振幅スペクトルのピークの最大値に基づいて推定することを特徴とする請求項1に記載のオーディオ装置。
  3. 前記第2推定部は、周波数帯域における前記雑音の音量をその周波数帯域に属する各周波数の振幅スペクトルのピークの最小値、中央値、最頻出値または各周波数に対応する振幅スペクトルのピークから最小値と最大値とを除外して算出される平均値のいずれかに基づいて推定することを特徴とする請求項1または請求項2に記載のオーディオ装置。
  4. 前記算出部は、前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて各周波数帯域において前記再生音の音量が前記雑音の音量を上回るように前記第1音信号に付与する音響効果係数を算出することを特徴とする請求項1から3までのいずれか1項に記載のオーディオ装置。
  5. 前記再生音と前記雑音とを収音するマイクロフォンから出力される第3音信号から前記第1音信号に対応する信号成分を除外して前記第2音信号を生成するエコーキャンセル部を有することを特徴とする請求項1から4までのいずれか1項に記載のオーディオ装置。
  6. 前記算出部は、
    前記第1推定部により推定された各周波数帯域における前記再生音の音量についての補正量を周波数帯域毎に規定して補正テーブルにしたがって、前記第1推定部により推定された前記再生音の音量を周波数帯域毎に補正する補正部と、
    前記補正部による補正後の音量と前記第2推定部により推定された前記雑音の音量とを周波数帯域毎に比較する比較部と、を有し、
    前記比較部における比較結果に応じて前記音響効果係数を周波数帯域毎に算出することを特徴とする請求項1から5までのいずれか1項に記載のオーディオ装置。
  7. スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定し、
    前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定し、
    前記再生音について推定された音量と前記雑音について推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する、
    音響効果係数算出方法。
  8. プロセッサを、
    スピーカから環境に放射される再生音を表す第1音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記再生音の音量を周波数帯域毎に推定する第1推定部と、
    前記環境において聴取される雑音を表す第2音信号を時間軸方向に複数に分割して得られる各信号に短時間周波数解析を施して前記一定時間における振幅スペクトルのピークを周波数毎に特定し、特定した振幅スペクトルのピークに基づいて前記雑音の音量を周波数帯域毎に推定する第2推定部と、
    前記第1推定部により推定された音量と前記第2推定部により推定された音量とを周波数帯域毎に比較し、比較結果に基づいて前記第1音信号に付与する音響効果係数を算出する算出部と、
    して機能させるプログラム。
JP2018073642A 2018-04-06 2018-04-06 オーディオ装置、音響効果係数算出方法、およびプログラム Active JP7020257B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018073642A JP7020257B2 (ja) 2018-04-06 2018-04-06 オーディオ装置、音響効果係数算出方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018073642A JP7020257B2 (ja) 2018-04-06 2018-04-06 オーディオ装置、音響効果係数算出方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2019186687A JP2019186687A (ja) 2019-10-24
JP7020257B2 true JP7020257B2 (ja) 2022-02-16

Family

ID=68341603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018073642A Active JP7020257B2 (ja) 2018-04-06 2018-04-06 オーディオ装置、音響効果係数算出方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7020257B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022471A (ja) 1998-06-30 2000-01-21 Matsushita Electric Ind Co Ltd 適応音質音量制御装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2586845B2 (ja) * 1993-12-07 1997-03-05 日本電気株式会社 電話機及びその周波数特性制御方法
JP3505085B2 (ja) * 1998-04-14 2004-03-08 アルパイン株式会社 オーディオ装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022471A (ja) 1998-06-30 2000-01-21 Matsushita Electric Ind Co Ltd 適応音質音量制御装置

Also Published As

Publication number Publication date
JP2019186687A (ja) 2019-10-24

Similar Documents

Publication Publication Date Title
CN104715750B (zh) 包括引擎声音合成器的声音系统
JP4513810B2 (ja) 能動騒音低減装置
JP6186470B2 (ja) 音響装置、音量制御方法、音量制御プログラム及び記録媒体
EP1482763A2 (en) Sound field measurement device
WO2010109708A1 (ja) 受音信号処理装置、方法およびプログラム
US20070036364A1 (en) Sound field compensating apparatus and sound field compensating method
JP2010120633A (ja) 音声信号補償を用いるアクティブノイズコントロールのためのシステム
KR101149591B1 (ko) 오디오 신호 반향 억제
EP2693635A1 (en) Automatic loudness control
US6386039B1 (en) Method and apparatus for determining the acoustic spatial characteristics particularly of a vehicle occupant compartment in a motor vehicle
JP5627440B2 (ja) 音響装置及びその制御方法、プログラム
JP7020257B2 (ja) オーディオ装置、音響効果係数算出方法、およびプログラム
WO2021106734A1 (ja) 能動騒音低減装置、移動体装置、及び、能動騒音低減方法
JP2010141468A (ja) 車載音響装置
JP5883580B2 (ja) フィルタ係数決定装置
JP2021005790A (ja) オーディオ装置、音響効果係数の算出方法、およびプログラム
JP4522509B2 (ja) オーディオ装置
JP2010181448A (ja) 音響調整装置及び音響調整方法
JP2020137040A (ja) 位相制御装置、音響装置及び位相制御方法
JP5998357B2 (ja) 車載用音響再生装置
JP7577775B2 (ja) 音響再生装置
CN113841198B (zh) 使用相干性的信号分量估计
CN105453594B (zh) 自动音色控制
US20240163601A1 (en) Method for equalizing an audio frequency signal broadcast in a broadcasting environment, computer program product and corresponding device
JP2011161965A (ja) 車載用音響装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220117

R151 Written notification of patent or utility model registration

Ref document number: 7020257

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350