JP2005173055A - 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム - Google Patents
音響信号除去装置、音響信号除去方法及び音響信号除去プログラム Download PDFInfo
- Publication number
- JP2005173055A JP2005173055A JP2003410959A JP2003410959A JP2005173055A JP 2005173055 A JP2005173055 A JP 2005173055A JP 2003410959 A JP2003410959 A JP 2003410959A JP 2003410959 A JP2003410959 A JP 2003410959A JP 2005173055 A JP2005173055 A JP 2005173055A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- sound
- mixed
- acoustic
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 76
- 238000001228 spectrum Methods 0.000 claims abstract description 110
- 238000012545 processing Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 239000000284 extract Substances 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 43
- 230000005236 sound signal Effects 0.000 claims description 36
- 238000004088 simulation Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 abstract description 46
- 230000006870 function Effects 0.000 description 58
- 238000003860 storage Methods 0.000 description 23
- 239000000203 mixture Substances 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 14
- 238000009499 grossing Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 10
- 230000008602 contraction Effects 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 238000013075 data extraction Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 101100285899 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SSE2 gene Proteins 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
【解決手段】 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号中の、定常音を検出する定常音検出部18と、音響信号から音響振幅スペクトルを抽出する音響振幅抽出部200と、抽出された混合音響振幅スペクトルのうち、定常音の周波数と一致しない周波数の混合音響振幅スペクトルを選択し、選択された周波数の混合音響振幅スペクトルから既知音響振幅スペクトルを除去する除去処理部104とを備える。
【選択図】 図1
Description
本発明の実施形態について図面を参照しながら説明する。図1は、本実施形態に係る既知音響除去システムの全体構成を示すブロック図である。
「混合音響」=「消去後の音声出力」+「既知音響」
と表される。そして、上記の各音響は、それぞれ
混合音に対してFFT処理により各周波数チャンネルごとの振幅データを時刻に対応付けて取り出す。ここでは、例えば15.7KHzのチャンネルで、
時刻 0.00秒 0.01秒 0.02秒……1456.345秒
振幅 1.5 2.5 1.5 4.5
の値が検出されたものとする。
なお、上述した最小値法では、ノイズが「定常」ではない場合や、他の音声や合成された音楽の位相の関係で、振幅が小さくなることがあり、このために最小値が、本来の定常値より低くなる惧れがある。この順位付け法では、最小値ではなく次のような値を用いる。
振幅 0.34 0.035 0.36 0.40 0.40 …18.9 19.5
例えば3秒間なら10ミリ秒ごとなので300サンプルになります。これに、1番から300番までの数字を付与する。そして、ノイズ以外がない区間が少なくても10%あるとの予測に基づき、300の10%の値、すなわち30番目の値を定常音として採用する。
順位付け法では、ノイズだけの区間が多すぎたり少なすぎたりすることや、10%という閾値を定める必要があるため、閾値の設定により算出結果が影響を受ける可能性がある。そこで、順位付け法の改良法として、上記の振幅値のうち小さい方からn番目までのノイズについて、統計をとって標準偏差 σ(n)を求め、このσ(n)が一定値を超えないnの最大値を求め、このnの時の振幅値を定常音とする。この一定値は、経験的に定めることが好ましい。
以上説明した構成を有する既知音響除去システムは、以下のように動作する。図2は、既知音響除去システムの動作を示すフロー図である。なお、本実施形態では、映像と音声がステレオで記録された映像ファイル(DV)を混合音響(MIX音声)とし、オリジナル曲が記録された音声ファイルを既知音響とし、映像ファイル中にBGMとして包含されている当該オリジナル曲を除去する場合を例に説明する。本実施形態おける処理は、(1)前処理、(2)音楽消去処理、(3)後処理に大別される。以下、各処理について詳述する。
前処理では、DVから消去対象用のMIX音声を取り出すとともに、BGM用音声(オリジナル曲)を用意する。具体的には、DVキャプチャー2からDV用のビデオ編集ソフトを使用して動画をキャプチャーし(S101)、このキャプチャーしたファイルを、タイプ1のAVIファイル(出力ファイル名:MIX.AVI)として、記憶装置5に蓄積する。
音楽消去処理では、除去エンジンプログラム(GEQ)100により、MIX音声からBGM音声を消去する(S106)。この消去後出力される音声ファイルは、左右チャンネルともにモノラル48kHzのWAVファイル(出力ファイル名:左チャンネルがERASE-L.WAV、右チャンネルがERASE-R.WAV)として、メモリ7又は記憶装置5に蓄積される。
後処理では、除去エンジンプログラムで消去した音声を、DV用の音声に変換し、DV(AVIファイル)に復元する。先ず、音声変換部(PostWav)3により、周波数変換、及びモノラルからステレオへの変換を行う(S107)。すなわち、音響除去エンジンプログラム100から出力された左右2チャンネルのWAVファイルをステレオに合成し、必要ならば元のDVの音声と同じサンプリングレートに変換し、WAVファイル(ファイル名:ERASE.WAV)として、記憶装置5に蓄積する。次いで、音声データ抽出部(DVReMix)4において、キャプチャーしたAVIファイル(BGM.AVI)の音声を、消去後の音声(ERASE.WAV)と入れ替え、除去後音響ファイル(ファイル名:ERASE.AVI)として、記憶装置5に蓄積する。
次いで、上述した音響除去エンジンプログラム100について詳述する。先ず、この音響除去エンジンプログラム100による音響除去処理の理論について説明する。
所望の音声や物音等の音響信号s(t)(tは時間軸)に、BGM等の非定常音響信号b(t)が混合された、混合音響信号m(t)が観測されるものとする。
の減算に相当する処理では、b’(t)からb(t)に相当する成分を推定して、s(t)を求める必要がある。具体的には、既知の音響信号b’(t)は、混合音m(t)中では、以下のような変形に対する補正を行うことでb(t)に相当する成分を推定する。
混合音m(t)中で既知の音響信号b’(t)が鳴っている位置は先頭からとは限らない。そこで、既知の音響信号b’(t)を時間軸方向にずらし、両者の相対位置を合わせて、混合音から既知音響信号を減算する。
混合音m(t)中で既知の音響信号b’(t)が鳴る際には、グラフィックイコライザ等の影響で周波数特性が変化することが多い。例えば、低域や高域が強調・減衰されることがある。そこで、b’(t)の周波数特性を同様に変化させて補正し、混合音から既知音響信号を減算する。
混合音m(t)中で既知の音響信号b’(t)が鳴る際には、混合音作成時におけるミキサーのフェーダー等の操作で混合比率が変更され、音量が時間変化することが多い。そこで、b’(t)の音量を同様に時間変化させて補正し、混合音から既知音響信号を減算する。
上記の処理を実行する際に、上記数5及び数6の各種パラメータ関数a(t),g(ω,t)(gω(ω,t),gt(t),gr(t)),r(t) ,c(ω,t)の形状は、ユーザーが手作業で設定してもよいし、可能なものは自動推定してもよい。あるいは、自動推定後にユーザーが修正してもよい。本プログラムでは式(11)、式(12)、式(13)の各種パラメータ関数g(ω,t)(gω(ω,t),gt(t)),r(t)の一部の形状の自動推定にのみ対応しているため、実装されている具体的な自動推定方法を以下に述べる。
最後に、gt(t)を時間軸方向に平滑化する。なお、平滑化幅は任意に設定でき、平滑化をしなくてもよい。
本実施形態では、上記数5及び6の枠組みを拡張することにより、以下の変形に対応することができる。
1.(推定途中の) p(ω)とq(t)を仮に固定した上で、g(ω,t)とr(t)を推定
2.(推定途中の) g(ω,t)とr(t)を仮に固定した上で、p(ω)とq(t)を推定
の二つを反復的に繰り返して、適切なp(ω),q(t)を推定する。これは、音響信号の全区間に対して一度に実行せず、時間軸を分割して、区分的に行うとよい。初期値は前後の区間の連続性を考慮して定める。また、BGM区間ψの集合Ψを用いて、それらの複数の区間におけるM(ω,t)とB(ω,t)との対応関係の時間軸を合わせるように、p(ω),q(t)を推定するとよい。なお、既知の音響信号b’ (t)の一部区間が使われずに、飛び飛びで混ざっていたとき等には、その区間を飛ばすようにr(t)が不連続関数となるようにする。
本プログラムでは、混合音響信号m(t)の中に、既知音響信号b’ (t)が一種類含まれている場合に対応している。b’1 (t),b’2 (t)…b’N (t)のように複数含まれている場合には、それらの振幅スペクトルB’1(ω,t),B’2(ω,t)…B’N (ω,t) から、上記数5第2式で求めたB1(ω,t),B2(ω,t)…BN (ω,t)を用いて、
このような本実施形態に係る音響除去エンジンプログラムの実験結果を以下に示す。ここでは、音声や物音等の音響信号s(t)にBGM等の音響信号b(t)が加えられている混合において、音響信号m(t)が観測されたときに、b(t)の元となる音源の音響信号b’(t)が既知という条件下で、未知のs(t)を求めた。m(t)とb’(t)が収録されたオーディオファイルを与えると、s(t)のオーディオファイルを得ることができる。
以上説明した理論に基づく音響除去エンジンプログラム100の構成について説明する。図5は、音響除去エンジンプログラム100の機能を示すブロック図である。
上述した構成を有する音響除去エンジンプログラム100は、以下のように動作する。図6(a)は、かかる動作を示すフロー図である。
(エディタの構成)
次いで、既知音響除去システムのGUIであるエディタ400について説明する。図7は、エディタ400の画面構成を示す説明図である。
上述したGUIであるエディタ400は、以下のような形態とすることができる。図11は、エディタ400の変更例を示す構成図である。
gω(ω,t)を表示・操作するためのパネルで、カーソル位置の時刻tでのgω(ω,t)が描かれている(横軸が大きさ、縦軸が周波数軸)。設定操作結果は、g(ω,t)の表示パネルE7に即座に反映される。E7には、濃淡でg(ω,t)の値の大きさが描かれている(横軸が時間軸、縦軸が周波数軸)。
gt(t)を表示・操作するためのパネルで、設定操作結果は、g(ω,t)の表示パネルE7に即座に反映される。
gr(t)を表示・操作するためのパネルで、設定操作結果は、g(ω,t)の表示パネルE7に即座に反映される。
a(t)を表示・操作するためのパネルである。
p(ω)を表示・操作するためのパネルである。
q(t)を表示・操作するためのパネルである。
r(t)を表示・操作するためのパネルである。
c(ω,t)のω方向の形状を表示操作するためのパネルで、カーソル位置の時刻tでのc(ω,t)が描かれている(横軸が大きさ、縦軸が周波数軸)。設定操作結果は、c(ω,t)の表示パネルE8に即座に反映される。E8には、濃淡でc(ω,t)の値の大きさが描かれている(横軸が時間軸、縦軸が周波数軸)。
c(ω,t)のt方向の形状を表示・操作するためのパネルで、設定操作結果は、c(ω,t)の表示パネルE8に即座に反映される。
なお、上述した実施形態及びその変更例に係る既知音響除去プログラムでは、ユーザー端末やWebサーバ等のコンピュータやICチップにインストールすることにより、上述した各機能を有する装置やシステムを容易に構築することができる。このプログラムは、例えば、通信回線を通じて配布することが可能であり、またスタンドアローンの計算機上で動作するパッケージアプリケーションとして譲渡することができる。
以上説明した本実施形態によれば、振幅データは位相が変化してもかわらないので、位相に依存しない処理が可能となる。従って、例えば、音声と音楽が混じった番組の音声信号から、番組作成時に使用した音楽CD等の音のデータを使って、音楽だけを消去することができる。
なお、上述した実施形態に係るシステムには、例えば、以下のような機能を追加することができる。
民放の標準フォーマットでは、音声開始位置が決められているとともに、番組内での時刻と使用曲を記述したキューシート等の情報に基づいて、作業を進める必要があり、この情報とリンクするための機能が必要である。
上述した実施形態でも説明したように、放送番組では、左右の音声からなるステレオ方式のものがある。ところが、音声の除去処理は、モノラル的に左右それぞれに対して行わなければならないことから、ステレオ放送については、多数のパラメータの設定を要する除去処理の作業が2倍となるという問題がある。
既知の音源と、混合音内におけるBGMの時間的な位置ずれがあり、混合音とBGMの時刻を正確にあわせることが困難である。
既知音響の消去においては、混合音響中における既知音響の特性を検出するキャリブレーションを行う必要があるが、混合音響中における既知音響は、番組作成時において強調されたり減衰されたりしており、刻々とその特性が変化している。そのため、前記キャリブレーションの際に、一箇所のみのサンプルを取得しても、適正に除去処理を行うことができないおそれがある。また、既知音響が音楽などである場合には、レコード等の回転数の違いにより、部分的に、時間軸あるいは周波数軸方向に伸縮されることがあり、この場合にも、一箇所のみのキャリブレーションでは、適正なサンプルが取得できない。
放送番組の音声作成時には、製作意図にあわせて周波数特性や音量を調整する場合が多い。このため、音の位相が予測不能な変化を生じ、単に電子的な減算処理を行ったのみでは、適切に消去することはできない。
Claims (15)
- 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号中の、定常音を検出する定常音検出部と、
前記既知音響信号から既知音響振幅スペクトルを抽出する既知音響振幅抽出部と、
前記混合音響信号から周波数毎の混合音響振幅スペクトルを抽出する混合音響振幅抽出部と、
抽出された前記混合音響振幅スペクトルのうち、前記定常音の周波数と一致しない周波数の混合音響振幅スペクトルを選択する周波数選択部と、
選択された周波数の混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去する除去処理部と、
を備えることを特徴とする音響信号除去装置。 - 前記定常音検出部は、前記混合音響信号中における、最小の振幅となる周波数を定常音として検出することを特徴とする請求項1に記載の音響信号除去装置。
- 前記定常音検出部は、前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目の値となる周波数を定常音として検出することを特徴とする請求項1に記載の音響信号除去装置。
- 前記定常音検出部は、前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目までの標準偏差から一定値を超えないnの最大値を求め、このn番目の値となる周波数を定常音として検出することを特徴とする請求項1に記載の音響信号除去装置。
- 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号から既知音響信号を除去する音響信号除去装置であって、
前記混合音響としての一定振幅の音響信号に対し、前記既知音響信号を0として疑似減算処理を行い、前記一定振幅の音響信号と前記疑似減算処理後の音響信号との音量の差を計測するシミュレーション部と、
前記シミュレーション部による計測結果に基づいて、前記既知音響信号の時間毎の信号強度を設定する除去強度設定部と、
前記既知音響信号から既知音響振幅スペクトルを抽出する既知音響振幅抽出部と、
前記混合音響信号から混合音響振幅スペクトルを抽出する混合音響振幅抽出部と、
前記除去強度設定部による設定に基づいて、前記既知音響振幅スペクトルを変換し、前記混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去する除去処理部と、
を備えることを特徴とする音響信号除去装置。 - 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号中の、定常音を検出するステップと、
前記既知音響信号から既知音響振幅スペクトルを抽出するとともに、前記混合音響信号から周波数毎の混合音響振幅スペクトルを抽出するステップと、
抽出された前記混合音響振幅スペクトルのうち、前記定常音の周波数と一致しない周波数の混合音響振幅スペクトルを選択するステップと、
選択された周波数の混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去するステップと、
を備えることを特徴とする音響信号除去方法。 - 前記混合音響信号中における、最小の振幅となる周波数を定常音として検出することを特徴とする請求項6に記載の音響信号除去方法。
- 前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目の値となる周波数を定常音として検出することを特徴とする請求項6に記載の音響信号除去方法。
- 前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目までの標準偏差から一定値を超えないnの最大値を求め、このn番目の値となる周波数を定常音として検出することを特徴とする請求項6に記載の音響信号除去方法。
- 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号から既知音響信号を除去する音響信号除去方法であって、
前記混合音響としての一定振幅の音響信号に対し、前記既知音響信号を0として疑似減算処理を行い、前記一定振幅の音響信号と前記疑似減算処理後の音響信号との音量の差を計測するステップと、
前記計測結果に基づいて、前記既知音響信号の時間毎の信号強度を設定するステップと、
前記既知音響信号から既知音響振幅スペクトルを抽出するとともに、前記混合音響信号から混合音響振幅スペクトルを抽出するステップと、
前記設定に基づいて、前記既知音響振幅スペクトルを変換し、前記混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去するステップと、
を備えることを特徴とする音響信号除去方法。 - コンピュータに、
除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号中の、定常音を検出するステップと、
前記既知音響信号から既知音響振幅スペクトルを抽出するとともに、前記混合音響信号から周波数毎の混合音響振幅スペクトルを抽出するステップと、
抽出された前記混合音響振幅スペクトルのうち、前記定常音の周波数と一致しない周波数の混合音響振幅スペクトルを選択するステップと、
選択された周波数の混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去するステップと、
を有する処理を実行させることを特徴とする音響信号除去プログラム。 - 前記混合音響信号中における、最小の振幅となる周波数を定常音として検出することを特徴とする請求項11に記載の音響信号除去プログラム。
- 前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目の値となる周波数を定常音として検出することを特徴とする請求項11に記載の音響信号除去プログラム。
- 前記混合音響信号中における、時間毎の振幅を取得し、その値順にソートし、n番目までの標準偏差から一定値を超えないnの最大値を求め、このn番目の値となる周波数を定常音として検出することを特徴とする請求項11に記載の音響信号除去プログラム。
- 除去しようとする既知音響信号と他の音響信号とが混合してなる混合音響信号から既知音響信号を除去する音響信号除去プログラムであって、
コンピュータに、
前記混合音響としての一定振幅の音響信号に対し、前記既知音響信号を0として疑似減算処理を行い、前記一定振幅の音響信号と前記疑似減算処理後の音響信号との音量の差を計測するステップと、
前記計測結果に基づいて、前記既知音響信号の時間毎の信号強度を設定するステップと、
前記既知音響信号から既知音響振幅スペクトルを抽出するとともに、前記混合音響信号から混合音響振幅スペクトルを抽出するステップと、
前記設定に基づいて、前記既知音響振幅スペクトルを変換し、前記混合音響振幅スペクトルから前記既知音響振幅スペクトルを除去するステップと、
を備える処理を実行させることを特徴とする音響信号除去プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003410959A JP4274419B2 (ja) | 2003-12-09 | 2003-12-09 | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム |
PCT/JP2004/013165 WO2005057551A1 (ja) | 2003-12-09 | 2004-09-09 | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003410959A JP4274419B2 (ja) | 2003-12-09 | 2003-12-09 | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005173055A true JP2005173055A (ja) | 2005-06-30 |
JP4274419B2 JP4274419B2 (ja) | 2009-06-10 |
Family
ID=34674962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003410959A Expired - Lifetime JP4274419B2 (ja) | 2003-12-09 | 2003-12-09 | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4274419B2 (ja) |
WO (1) | WO2005057551A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008018146A1 (en) * | 2006-08-10 | 2008-02-14 | Bicera Co., Ltd. | Audibility adapting device and audibility adapting method |
JP2009017334A (ja) * | 2007-07-06 | 2009-01-22 | Yamaha Corp | 音響設定支援装置 |
JP2011097139A (ja) * | 2009-10-27 | 2011-05-12 | Nikon Corp | 撮像装置 |
JP2011253126A (ja) * | 2010-06-03 | 2011-12-15 | Canon Inc | 音声信号処理装置、及びその制御方法 |
JP2014068292A (ja) * | 2012-09-27 | 2014-04-17 | D & M Holdings Inc | ミキシング装置 |
US8908881B2 (en) | 2010-09-30 | 2014-12-09 | Roland Corporation | Sound signal processing device |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106601264B (zh) * | 2016-11-30 | 2020-08-07 | 广州广哈通信股份有限公司 | 一种语音会议混音系统及方法 |
CN110503975B (zh) * | 2019-08-02 | 2022-02-01 | 广州长嘉电子有限公司 | 基于多麦克风降噪的智能电视语音增强控制方法及系统 |
CN111883151B (zh) * | 2020-07-30 | 2024-08-30 | 云知声智能科技股份有限公司 | 音频信号的处理方法、装置、设备和存储介质 |
JP2022075147A (ja) * | 2020-11-06 | 2022-05-18 | ヤマハ株式会社 | 音響処理システム、音響処理方法およびプログラム |
CN116597829B (zh) * | 2023-07-18 | 2023-09-08 | 西兴(青岛)技术服务有限公司 | 一种提高语音识别精度的降噪处理方法及系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57161800A (en) * | 1981-03-30 | 1982-10-05 | Toshiyuki Sakai | Voice information filter |
US4415767A (en) * | 1981-10-19 | 1983-11-15 | Votan | Method and apparatus for speech recognition and reproduction |
JPS59165098A (ja) * | 1983-03-10 | 1984-09-18 | 三洋電機株式会社 | 音声スペクトルパラメ−タ抽出装置 |
JP3135937B2 (ja) * | 1991-05-16 | 2001-02-19 | 株式会社リコー | 雑音除去装置 |
JP3522954B2 (ja) * | 1996-03-15 | 2004-04-26 | 株式会社東芝 | マイクロホンアレイ入力型音声認識装置及び方法 |
JP3418855B2 (ja) * | 1996-10-30 | 2003-06-23 | 京セラ株式会社 | 雑音除去装置 |
JP4026198B2 (ja) * | 1997-06-25 | 2007-12-26 | 株式会社デンソー | 音声認識装置 |
JPH1138997A (ja) * | 1997-07-16 | 1999-02-12 | Olympus Optical Co Ltd | 雑音抑圧装置および音声の雑音除去の処理をするための処理プログラムを記録した記録媒体 |
JP4119112B2 (ja) * | 2001-11-05 | 2008-07-16 | 本田技研工業株式会社 | 混合音の分離装置 |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP3786038B2 (ja) * | 2002-03-14 | 2006-06-14 | 日産自動車株式会社 | 入力信号処理方法および入力信号処理装置 |
-
2003
- 2003-12-09 JP JP2003410959A patent/JP4274419B2/ja not_active Expired - Lifetime
-
2004
- 2004-09-09 WO PCT/JP2004/013165 patent/WO2005057551A1/ja active Application Filing
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008018146A1 (en) * | 2006-08-10 | 2008-02-14 | Bicera Co., Ltd. | Audibility adapting device and audibility adapting method |
US8879765B2 (en) | 2006-08-10 | 2014-11-04 | Bicera Co., Ltd. | Hearing optimization device and hearing optimization method |
JP2009017334A (ja) * | 2007-07-06 | 2009-01-22 | Yamaha Corp | 音響設定支援装置 |
JP2011097139A (ja) * | 2009-10-27 | 2011-05-12 | Nikon Corp | 撮像装置 |
JP2011253126A (ja) * | 2010-06-03 | 2011-12-15 | Canon Inc | 音声信号処理装置、及びその制御方法 |
US8908881B2 (en) | 2010-09-30 | 2014-12-09 | Roland Corporation | Sound signal processing device |
JP2014068292A (ja) * | 2012-09-27 | 2014-04-17 | D & M Holdings Inc | ミキシング装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2005057551A1 (ja) | 2005-06-23 |
JP4274419B2 (ja) | 2009-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11363314B2 (en) | Network-based processing and distribution of multimedia content of a live musical performance | |
US9530396B2 (en) | Visually-assisted mixing of audio using a spectral analyzer | |
US6405163B1 (en) | Process for removing voice from stereo recordings | |
KR20180050652A (ko) | 음향 신호를 사운드 객체들로 분해하는 방법 및 시스템, 사운드 객체 및 그 사용 | |
JP4274419B2 (ja) | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム | |
EP1741313B1 (en) | A method and system for sound source separation | |
JP2018513424A (ja) | ディジタルオーディオの補足 | |
KR101008250B1 (ko) | 기지 음향신호 제거방법 및 장치 | |
US7340397B2 (en) | Speech recognition optimization tool | |
US8660845B1 (en) | Automatic separation of audio data | |
JP5690082B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
US9071215B2 (en) | Audio signal processing device, method, program, and recording medium for processing audio signal to be reproduced by plurality of speakers | |
JP5736124B2 (ja) | 音声信号処理装置、方法、プログラム、及び記録媒体 | |
US20230186782A1 (en) | Electronic device, method and computer program | |
CN112927713B (zh) | 音频特征点的检测方法、装置和计算机存储介质 | |
JP4274418B2 (ja) | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム | |
CN114631142A (zh) | 电子设备、方法和计算机程序 | |
JP2004325127A (ja) | 音源検出方法、音源分離方法、およびこれらを実施する装置 | |
US20230057082A1 (en) | Electronic device, method and computer program | |
JP4272107B2 (ja) | 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム | |
JP2009282536A (ja) | 既知音響信号除去方法及び装置 | |
JP2006148608A (ja) | 音声信号判別装置、音質調整装置、放送受信機、プログラム、及び記録媒体 | |
Terrell et al. | Research Article Automatic Noise Gate Settings for Drum Recordings Containing Bleed from Secondary Sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050920 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20081127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090226 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4274419 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120313 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130313 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140313 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |