JP2009211021A - 残響時間推定装置及び残響時間推定方法 - Google Patents
残響時間推定装置及び残響時間推定方法 Download PDFInfo
- Publication number
- JP2009211021A JP2009211021A JP2008095540A JP2008095540A JP2009211021A JP 2009211021 A JP2009211021 A JP 2009211021A JP 2008095540 A JP2008095540 A JP 2008095540A JP 2008095540 A JP2008095540 A JP 2008095540A JP 2009211021 A JP2009211021 A JP 2009211021A
- Authority
- JP
- Japan
- Prior art keywords
- reverberation time
- reverberation
- power envelope
- modulation
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000001228 spectrum Methods 0.000 claims abstract description 116
- 238000012546 transfer Methods 0.000 claims abstract description 24
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000005311 autocorrelation function Methods 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 description 27
- 238000012545 processing Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 238000011084 recovery Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000002238 attenuated effect Effects 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000000630 rising effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000010893 Bischofia javanica Nutrition 0.000 description 1
- 240000005220 Bischofia javanica Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【解決手段】 残響時間推定装置1は、残響が付加された時系列の音響信号に基づいて、前記音響信号に対応する時系列のパワーエンベロープを生成するパワーエンベロープ生成部41と、前記パワーエンベロープ生成部41によって生成されたパワーエンベロープに基づいて、周波数系列の変調スペクトルを生成する正規化変調スペクトル生成部44と、前記正規化変調スペクトル生成部44によって生成された変調スペクトルに基づいて、前記音響信号が観測された系の残響特性に関する伝達関数に対応する残響時間を推定する演算回路5とを備える。
【選択図】図1
Description
古川、鵜木、赤木、「MTFに基づいた残響音声パワーエンベロープの回復方法」、信学技報、社団法人電子情報通信学会、平成14年4月、EA2002−15、SP2002−15、p.49−54
実施の形態1は、ハードウェアのデジタル信号処理回路により主として構成された残響時間推定装置である。
図1は、本発明の実施の形態1に係る残響時間推定装置の構成を示すブロック図である。図1に示すように、本実施の形態に係る残響時間推定装置1は、室の音響を入力するためのマイクロフォン2と、マイクロフォン2で取り込んだアナログ音響信号に対してA/D変換を行うA/D変換器3と、A/D変換器3から出力されるデジタル音響信号に対して信号処理を行うデジタル信号処理回路4と、デジタル信号処理回路4の処理結果を受け付け、残響時間の推定処理を実行する演算回路5と、メモリ6と、演算回路5により推定された残響時間を表示する液晶表示部7とを備えている。
次に、残響時間推定装置の動作について説明する。作業者は、残響時間を測定する室内において、残響時間測定装置1のマイクロフォン2で音響をサンプリングする。マイクロフォン2から出力されたアナログ音響信号は、A/D変換器3によりデジタル音響信号へ変換され、このデジタル音響信号(残響信号)がデジタル信号処理回路4へと与えられる。デジタル信号処理回路4に与えられたデジタル音響信号は、パワーエンベロープ生成部41によってパワーエンベロープへと変換され、このパワーエンベロープ信号が、ローパスフィルタ42と正規化変調スペクトル生成部44とにそれぞれ与えられる。
評価用の音源信号として、式(6)の人工的なAM信号を利用した。また、パワーエンベロープを変調周波数5Hzの正弦波(変調度は1)とし、これに白色雑音キャリアを乗じた信号を用いた。このパワーエンベロープに対する変調スペクトルは、0Hzの変調スペクトルと5Hzの変調スペクトルが同一の値となった。次に、式(7)で定義される室内残響インパルス応答を利用した。ここでは、一つの残響時間TRにつき、100種類の白色雑音キャリアを用意した。また、本評価実験で利用した残響時間TRは、0.1秒、0.3秒、0.5秒、1.0秒、及び2.0秒の5種類とした。そのため、本評価実験では、合計500個のパルス応答が用意され、これらを人工的な信号に畳み込むことで、残響信号を作成した。
実施の形態2は、人の音声から残響時間を推定する場合に特に適した構成の残響時間推定装置である。
図6A〜図6Dは、10Hzの正弦波1周期分を2セット用いて作ったパワーエンベロープと、その変調スペクトルを示すグラフである。図6Aに示したパワーエンベロープの2つの正弦波のセット間の距離は0.1秒であり、同様に図6Bでは0.2秒、図6Cでは0.5秒、図6Dでは1.0秒である。このように、パワーエンベロープの2つの正弦波のセット間の平坦な区間を長くしていくと、変調スペクトル上で0Hzの近傍の変調周波数fmOHzに最初のピークが存在し、そのピークにおけるパワーの値Ex(fmO)(図6A〜Dにおいて○で示した箇所)と主要変調周波数でのパワーの値Ex(fmd)が近付いていく傾向があることがわかる。ここで、fmOは、0Hzを除いて最も0Hzに近い変調周波数である。このようなfmOにおけるパワーは、図2を参照すると残響により減衰しないことがわかる。そこで、このfmOを主要変調周波数fmdのパワー回復の「基準値」として、残響時間の推定を実施すれば、かかる形状のパワーエンベロープに対しても残響時間を正確に推定することが可能となると考えられる。
上記のような原理に基づいて、本実施の形態では、音響信号(音声信号)を帯域分割し、帯域分割された各チャンネルのパワーエンベロープに基づいて残響時間の推定値を求め、これとともに各チャンネルのパワーエンベロープに基づいて処理に適したチャンネルを選定し、選定されたチャンネルによる残響時間の推定値の平均値を最終的な残響時間の推定値として採用する構成としている。また、本実施の形態に係る残響時間推定装置は、0Hzを除いて0Hzに最も近い変調周波数における変調スペクトル値を基準値とし、この基準値で正規化した変調スペクトルを生成するように構成されている。
女性話者が発話した8文章を評価用音響信号として利用し、本実施の形態に係る残響時間推定装置が実施する残響時間推定と同一の残響時間推定方法(以下、本法という)の評価実験を実施した。評価用音響信号の発話内容は以下の通りである。
(1)「第一回通訳国際会議に参加のご登録をご希望される方は、所定の申込用紙に住所・氏名と発表・聴講の別を明記して、国際会議事務局までお申し込みください。」
(2)「はい。こちらは第一回通訳電話国際会議事務局です。」
(3)「もしもし。通訳国際会議への参加を申し込みたいのですけれども、どのような手続をすればよろしいでしょうか。」
(4)「通訳電話の国際会議に参加するためには、所定の申し込み用紙を用いて参加登録することが必要です。」
(5)「会議に発表するのではなくて聴講するだけだと、費用はいくらかかりますか。」
(6)「ご発表を希望される場合には、予稿集代・登録料を含めた参加費用は4万円です。」
(7)「聴講のみの場合は当日の受け付けも可能で、予稿集代を含めた費用は3万5千円かかります。」
(8)「参加登録の申し込み用紙はどのようにして手に入れればよろしいのでしょうか。」
利用した残響時間TRは、0.1、0.3、0.5、1.0、及び2.0秒の5種類とした。インパルス応答は、式(7)のものを残響時間毎に50種類用意した。なお、総刺激数は2000個(8個×5条件×50キャリア)である。本実験では、本法と従来法とのそれぞれについて、全ての発話に対して得られた残響時間の推定値の平均値を求め、この平均値について評価した。
実施の形態3は、残響時間を推定するために用いられるコンピュータプログラムをコンピュータが実行することにより実現された残響時間推定装置である。なお、本実施の形態に係る残響時間推定装置301は、実施の形態2に係る残響時間推定装置201と実質的に同一の処理を、ソフトウェアにより実現したものである。
図14は、本発明の実施の形態3に係る残響時間推定装置の構成を示すブロック図である。図14に示すように、コンピュータ301aは、本体311と、画像表示部312と、入力部313とを備えている。本体311は、CPU311aと、ROM311b、RAM311c、ハードディスク311d、読出装置311e、入出力インタフェース311f、及び画像出力インタフェース311gを備えており、CPU311a、ROM311b、RAM311c、ハードディスク311d、読出装置311e、入出力インタフェース311f、および画像出力インタフェース311gは、バス311iによって接続されている。
以下の説明においては、本実施の形態1に係る残響時間推定プログラム314aは当該オペレーティングシステム上で動作するものとしている。
次に、残響時間推定装置301の動作について説明する。図15は、本実施の形態に係る残響時間推定装置301の動作の流れを示すフローチャートである。まず、作業者は、残響時間を測定する室内において、入力部313のマイクロフォンで音響(音声)をサンプリングする。マイクロフォンから出力されたアナログ音響信号は、入出力インタフェース311fが備えるA/D変換器によりPCM等のデジタル音響データへ変換され、この音響データがCPU311aに与えられる。
上記の実施の形態1においては、変調スペクトルの大きさを、DC成分の変調スペクトル(変調周波数が0Hzにおける変調スペクトル)で正規化した変調スペクトル信号を生成するように正規化変調スペクトル生成部44が構成されている場合について説明したが、これに限定されるものではなく、例えば、0Hzを除いて0Hzに最も近い変調周波数におけるパワー値で、変調スペクトルの大きさを正規化する構成であってもよい。
Claims (9)
- 残響が付加された時系列の音響信号に基づいて、前記音響信号に対応する時系列のパワーエンベロープを生成するパワーエンベロープ生成手段と、
前記パワーエンベロープ生成手段によって生成されたパワーエンベロープに基づいて、周波数系列の変調スペクトルを生成する変調スペクトル生成手段と、
前記変調スペクトル生成手段によって生成された変調スペクトルに基づいて、前記音響信号が観測された系の残響特性に関する伝達関数に対応する残響時間を推定する残響時間推定手段と
を備える、残響時間推定装置。 - 前記周波数系列の変調スペクトルにおいて周辺の周波数領域よりも大きい変調スペクトルを示す主要変調周波数を特定する主要変調周波数特定手段を更に備え、
前記残響時間推定手段は、前記周波数系列の前記変調スペクトルに前記伝達関数の逆伝達関数を適用したときに、適用後の前記主要変調周波数における変調スペクトルが、残響が付加されていない原音を示す時系列の原音信号に対応する周波数系列の変調スペクトルの前記主要変調周波数における変調スペクトルと略一致するような前記伝達関数に対応する残響時間を推定するように構成されている、請求項1に記載の残響時間推定装置。 - 前記主要変調周波数特定手段は、前記パワーエンベロープに対する自己相関関数を求め、前記自己相関関数がピークを示す時間シフト量の逆数を前記主要変調周波数として特定するように構成されている請求項2に記載の残響時間推定装置。
- 前記パワーエンベロープ生成手段によって生成されたパワーエンベロープに対して適用されるローパスフィルタを更に備え、
前記主要変調周波数特定手段は、前記ローパスフィルタから出力されたパワーエンベロープに基づいて、前記主要変調周波数を特定するように構成されている請求項2又は3に記載の残響時間推定装置。 - 前記音響信号を複数チャンネルに帯域分割する帯域分割手段と、
前記帯域分割手段によって帯域分割された各チャンネルから、残響時間推定に用いるチャンネルを決定するチャンネル決定手段とを更に備える、請求項1乃至4の何れかに記載の残響時間推定装置。 - 前記パワーエンベロープ生成手段は、前記帯域分割手段によって帯域分割された各チャンネルについて、パワーエンベロープを生成するように構成されており、
前記パワーエンベロープ生成手段によって生成されたパワーエンベロープの中で、所定の基準値を越える高レベル部を検出する高レベル部検出手段を更に備え、
前記チャンネル決定手段は、前記高レベル部検出手段によって検出された高レベル部に基づいて、残響時間推定に用いるチャンネルを決定するように構成されている、請求項5に記載の残響時間推定装置。 - 前記チャンネル決定手段は、前記高レベル部検出手段によって検出された2つの高レベル部の間に、微小なピークが存在するか否かを判定し、微小なピークが存在する場合には、当該チャンネルを推定に用いるチャンネルから除外するように構成されている、請求項6に記載の残響時間推定装置。
- 前記チャンネル決定手段は、前記高レベル部検出手段によって検出された高レベル部の中に谷が存在するか否かを判定し、谷が存在する場合には、当該チャンネルを推定に用いるチャンネルから除外するように構成されている、請求項6又は7に記載の残響時間推定装置。
- 残響が付加された時系列の音響信号に基づいて、前記音響信号に対応する時系列のパワーエンベロープを生成するステップと、
生成されたパワーエンベロープに基づいて、周波数系列の変調スペクトルを生成するステップと、
生成された変調スペクトルに基づいて、前記音響信号が観測された系の残響特性に関する伝達関数に対応する残響時間を推定するステップと
を備える、残響時間推定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095540A JP5077847B2 (ja) | 2008-03-04 | 2008-03-04 | 残響時間推定装置及び残響時間推定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095540A JP5077847B2 (ja) | 2008-03-04 | 2008-03-04 | 残響時間推定装置及び残響時間推定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009211021A true JP2009211021A (ja) | 2009-09-17 |
JP5077847B2 JP5077847B2 (ja) | 2012-11-21 |
Family
ID=41184202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008095540A Expired - Fee Related JP5077847B2 (ja) | 2008-03-04 | 2008-03-04 | 残響時間推定装置及び残響時間推定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5077847B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161814A (ja) * | 2014-02-27 | 2015-09-07 | ヤマハ株式会社 | 音響処理装置 |
WO2018024058A1 (zh) * | 2016-08-02 | 2018-02-08 | 电信科学技术研究院 | 一种混响时间估计方法及装置 |
CN110211556A (zh) * | 2019-05-10 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 音乐文件的处理方法、装置、终端及存储介质 |
CN113077804A (zh) * | 2021-03-17 | 2021-07-06 | 维沃移动通信有限公司 | 回声消除方法、装置、设备及存储介质 |
JP2022500699A (ja) * | 2018-09-18 | 2022-01-04 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 仮想3dオーディオを現実の室内に適応させる装置及び方法 |
CN114586382A (zh) * | 2019-10-25 | 2022-06-03 | 奇跃公司 | 混响指纹估计 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03221819A (ja) * | 1990-01-26 | 1991-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 音場特性算出方法 |
JP2001100774A (ja) * | 1999-09-28 | 2001-04-13 | Takayuki Arai | 音声処理装置 |
-
2008
- 2008-03-04 JP JP2008095540A patent/JP5077847B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03221819A (ja) * | 1990-01-26 | 1991-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 音場特性算出方法 |
JP2001100774A (ja) * | 1999-09-28 | 2001-04-13 | Takayuki Arai | 音声処理装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161814A (ja) * | 2014-02-27 | 2015-09-07 | ヤマハ株式会社 | 音響処理装置 |
WO2018024058A1 (zh) * | 2016-08-02 | 2018-02-08 | 电信科学技术研究院 | 一种混响时间估计方法及装置 |
JP2022500699A (ja) * | 2018-09-18 | 2022-01-04 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 仮想3dオーディオを現実の室内に適応させる装置及び方法 |
JP7208365B2 (ja) | 2018-09-18 | 2023-01-18 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 仮想3dオーディオを現実の室内に適応させる装置及び方法 |
US11668600B2 (en) | 2018-09-18 | 2023-06-06 | Huawei Technologies Co., Ltd. | Device and method for adaptation of virtual 3D audio to a real room |
CN110211556A (zh) * | 2019-05-10 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 音乐文件的处理方法、装置、终端及存储介质 |
CN114586382A (zh) * | 2019-10-25 | 2022-06-03 | 奇跃公司 | 混响指纹估计 |
CN113077804A (zh) * | 2021-03-17 | 2021-07-06 | 维沃移动通信有限公司 | 回声消除方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5077847B2 (ja) | 2012-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101110141B1 (ko) | 주기 신호 처리 방법, 주기 신호 변환 방법, 주기 신호 처리 장치, 및 주기 신호의 분석 방법 | |
CN103067322B (zh) | 评估单通道音频信号中的音频帧的语音质量的方法 | |
JP5077847B2 (ja) | 残響時間推定装置及び残響時間推定方法 | |
JP5992427B2 (ja) | 信号におけるピッチおよび/または基本周波数に関するパターンを推定する方法および装置 | |
CN106768266B (zh) | 一种剔除背景噪声能量的厂房混响时间的测量方法 | |
US20210345991A1 (en) | Diagnosis of pathologies using infrasonic signatures | |
CN105371945B (zh) | 去除厅堂脉冲响应测量声信号中噪声的方法及装置 | |
JP6770463B2 (ja) | 気体漏出検出装置 | |
US20240412751A1 (en) | Noise removal device and method | |
JP5627440B2 (ja) | 音響装置及びその制御方法、プログラム | |
JP6886890B2 (ja) | 減衰時間分析方法、装置、及びプログラム | |
JP6467044B2 (ja) | シャント音解析装置、シャント音解析方法、コンピュータプログラム及び記録媒体 | |
CN114242085A (zh) | 旋转设备的故障诊断方法、装置 | |
WO2004032742A1 (en) | A method for arbitrary two-dimensional scaling of phonocardiographic signals | |
JP6307814B2 (ja) | 基音可視化装置、基音可視化方法およびプログラム | |
JP2021015137A (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2011188901A (ja) | 運動検出装置、運動検出方法、及びプログラム | |
US20150190091A1 (en) | Device, system and method for detection of fluid accumulation | |
JP6904198B2 (ja) | 音声処理プログラム、音声処理方法および音声処理装置 | |
US10636438B2 (en) | Method, information processing apparatus for processing speech, and non-transitory computer-readable storage medium | |
JP6298527B2 (ja) | 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 | |
WO2017130417A1 (ja) | 生体音解析装置及び生体音解析方法、並びにコンピュータプログラム及び記録媒体 | |
JP6183067B2 (ja) | データ解析装置及び方法、並びにプログラム及び記録媒体 | |
JP2019111347A (ja) | シャント音解析装置、シャント音解析方法、コンピュータプログラム及び記録媒体 | |
Englund | Failure prediction for mechanical doors using cheap sound analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120723 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120820 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5077847 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |