JP5277887B2 - 信号処理装置およびプログラム - Google Patents
信号処理装置およびプログラム Download PDFInfo
- Publication number
- JP5277887B2 JP5277887B2 JP2008292169A JP2008292169A JP5277887B2 JP 5277887 B2 JP5277887 B2 JP 5277887B2 JP 2008292169 A JP2008292169 A JP 2008292169A JP 2008292169 A JP2008292169 A JP 2008292169A JP 5277887 B2 JP5277887 B2 JP 5277887B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- frequencies
- unit
- selection
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims abstract description 110
- 239000011159 matrix material Substances 0.000 claims abstract description 236
- 238000000926 separation method Methods 0.000 claims abstract description 186
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000003860 storage Methods 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 49
- 238000009826 distribution Methods 0.000 claims description 17
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000009469 supplementation Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 25
- 238000012880 independent component analysis Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001502 supplementing effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
図1は、本発明の第1実施形態に係る信号処理装置のブロック図である。相互に間隔をあけて平面PL内に配置されたn個の収音機器Mが信号処理装置100に接続される(nは2以上の自然数)。第1実施形態においては、収音機器M1および収音機器M2の2個が信号処理装置100に接続された場合(n=2)を想定する。収音機器M1および収音機器M2の周囲の相異なる位置にはn個の音源S(S1,S2)が存在する。音源S1は、平面PLの法線Lnに対して角度θ1の方向に位置し、音源S2は、法線Lnに対して角度θ2(θ2≠θ1)の方向に位置する。
u1(t,fk)=w11(fk)・x1(t,fk)+w21(fk)・x2(t,fk) ……(1a)
u2(t,fk)=w12(fk)・x1(t,fk)+w22(fk)・x2(t,fk) ……(1b)
Rxx(fk)=E[X(t,fk)X(t,fk)H]
=Σ_{t}X(t,fk)X(t,fk) H ……(2)
E[X(t,fk)]=[E[x1(t,fk)] E[x2(t,fk)]]H=[0 0]H ……(3)
Rxx(fk)=FDFH ……(4)
z1(fk)=det(Rxx(fk))
=det(FDFH)
=det(D)
=d1・d2・……・dn ……(5)
次に、本発明の第2実施形態について説明する。第1実施形態においては2個の収音機器M(M1,M2)を利用したが、第2実施形態においては、3個以上の収音機器Mを利用して3個以上の音源からの音を分離する場合(n≧3)を想定する。なお、以下の各形態において作用や機能が第1実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
第1実施形態や第2実施形態における共分散行列Rxx(fk)の行列式z1(fk)に代えて、以下の第3実施形態から第6実施形態に例示する数値(統計量)も、観測データD(fk)を使用した学習の有意性の指標値として利用される。
観測データD(fk)を構成する各観測ベクトルX(t,fk)の共分散行列Rxx(fk)の条件数z2(fk)は以下の数式(6)で定義される。数式(6)の演算子‖A‖は、行列Aのノルム(行列の距離)を意味する。共分散行列Rxx(fk)に逆行列が存在する場合(正則である場合)に条件数z2(fk)は小さく、共分散行列Rxx(fk)に逆行列が存在しない場合に条件数z2(fk)は大きい数値となる。
z2(fk)=‖Rxx(fk)‖・‖Rxx(fk)−1‖ ……(6)
Rxx(fk)=UΣUH ……(7a)
Rxx(fk)−1=UΣ−1UH ……(7b)
学習処理部44は、観測データD(fk)を音源分離した分離信号U1と分離信号U2とが統計的に相互に独立となるように分離行列W(fk)を学習するから、観測信号V1の強度x1(t,fk)の時系列と観測信号V2の強度x2(t,fk)の時系列とで統計的な相関が低い周波数fkほど、観測データD(fk)を使用した分離行列W(fk)の学習の有意性が高いと言える。そこで、第4実施形態においては、観測信号V1および観測信号V2の相互間の独立性に応じた指標値(相互相関または相互情報量)を周波数fkの選択に利用する。
z3(fk)=E[{x1(t,fk)−E(x1(t,fk))}{x2(t,fk)−E(x2(t,fk))}]/σ1σ2 ……(8)
z4(fk)=(−1/2)log(1−z3(fk)2) ……(9)
共分散行列Rxx(fk)のトレース(パワー)z5(fk)は共分散行列Rxx(fk)の対角成分の総和として定義される。共分散行列Rxx(fk)の対角成分は、単位区間TUにおける観測信号V1の強度x1(t,fk)の分散σ12と単位区間TUにおける観測信号V2の強度x2(t,fk)の分散σ22とに相当するから、共分散行列Rxx(fk)のトレースz5(fk)は、強度x1(t,fk)の分散σ12と強度x2(t,fk)の分散σ22との加算値(z5(fk)=σ12+σ22)としても定義される。
観測信号V1の強度x1(t,fk)の度数分布(強度x1(t,fk)を確率変数とする分布関数)における尖度(カートシス)z6(fk)は、以下の数式(10)で定義される。
z6(fk)=μ4(fk)/{μ2(fk)}2 ……(10)
μ4(fk)=E{x1(t,fk)−m(fk)}4 ……(11a)
μ2(fk)=E{x1(t,fk)−m(fk)}2 ……(11b)
以上の各形態においては、周波数選択部54が選択しなかった各周波数(以下「非選択周波数」という)fkについて、初期値生成部42が特定した初期分離行列W0(fk)を分離行列W(fk)として信号処理部24に適用した。以下に説明する第7実施形態においては、学習処理部44による学習後の分離行列W(fk)を利用して非選択周波数fkの分離行列W(fk)を生成(補充)する。
第7実施形態においては、周波数選択部54が選択した総ての周波数fkの分離行列W(fk)を利用して方向推定部72が方向θ1(fk)および方向θ2(fk)を推定した。しかし、低域側の周波数fkや高域側の周波数fkの分離行列W(fk)からは方向θ1(fk)や方向θ2(fk)を高精度に推定できない場合がある。そこで、本発明の第8実施形態においては、周波数選択部54が選択した複数の周波数fkのうち低域側の周波数fkと高域側の周波数fkとを除外した各周波数fkの学習後の分離行列W(fk)のみを方向θ1(fk)および方向θ2(fk)の推定(ひいては方向θ1および方向θ2の推定)に利用する。
以上の各形態においては、1個の単位区間TUについて算定された指標値z(f1)〜z(fK)(例えば、行列式z1(fk),条件数z2(fk),相互相関z3(fk),相互情報量z4(fk),トレースz5(fk),尖度z6(fk))から所定個の周波数fkを選択した。以下に説明する第9実施形態においては、複数の単位区間TUにわたる指標値z(f1)〜z(fK)を1個の単位区間TUにおける周波数fkの選択に利用する。
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合せてもよい。
以上の各形態においては、所定の方向からの到来音を強調する遅延加算型ビームフォーマを処理部Pk(フィルタ32,フィルタ34)に適用したが、所定の方向からの到来音を抑圧する(すなわち収音上の死角を形成する)死角制御型(null)のビームフォーマも処理部Pkに適用される。例えば、処理部Pkのフィルタ32の加算部325およびフィルタ34の加算部345を減算部に変更することで死角制御型ビームフォーマが実現される。死角制御型ビームフォーマを採用した場合、分離行列生成部40は、方向θ1に死角が形成されるようにフィルタ32の各係数(w11(fk),w21(fk))を決定し、方向θ2に死角が形成されるようにフィルタ34の各係数(w12(fk),w22(fk))を決定する。したがって、分離信号U1においては音源S1の音SV1が抑制され(音SV2が強調され)、分離信号U2においては音源S2の音SV2が抑制される(音SV1が強調される)。
以上の各形態において、周波数分析部22と信号処理部24と信号合成部26とは信号処理装置100から省略され得る。例えば、観測データD(fk)を記憶する記憶装置14と観測データD(fk)から分離行列W(fk)を生成する分離行列生成部40とを具備する信号処理装置100としても本発明は実現される。分離行列生成部40が生成した分離行列W(fk)(W(f1)〜W(fK))を信号処理装置100とは別体の装置の信号処理部24に提供することで分離信号U1や分離信号U2が生成される。
以上の各形態においては初期値生成部42がK個の周波数f1〜fKの各々について初期分離行列W0(fk)(W0(f1)〜W0(fK))を生成したが、学習処理部44による分離行列W(f1)〜W(fK)の学習の初期値として所定の初期分離行列W0を共通に適用する構成も採用される。また、初期分離行列W0(fk)が観測データD(fk)から生成される構成は本発明において必須ではない。例えば、事前に用意されて記憶装置14に格納された初期分離行列W0(f1)〜W0(fK)を学習処理部44による分離行列W(f1)〜W(fK)の学習の初期値として使用する構成も採用される。また、非選択周波数fkの初期分離行列W0(fk)を使用しない構成(例えば第7実施形態や第8実施形態)においては、K個の周波数f1〜fKのうち周波数選択部54が選択した周波数fkのみについて初期値生成部42が初期分離行列W0(fk)を生成してもよい。
以上の各形態において周波数fkの選択の基準として利用した指標値(行列式z1(fk),条件数z2(fk),相互相関z3(fk),相互情報量z4(fk),トレースz5(fk),尖度z6(fk))は、周波数fkの観測データD(fk)を使用した分離行列W(fk)の学習の有意性の尺度(指標値)の例示に過ぎず、以上の例示以外の指標値を周波数fkの選択の基準として適用した構成も当然に本発明の範囲に包含される。また、以上の例示のなかから任意に選択された2以上の指標値の組合わせも周波数fkの選択の基準として好適である。例えば、行列式z1(fk)とトレースz5(f)との加重和が大きい周波数fkを選択する構成や、行列式z1(fk)の逆数と尖度z6(fk)との加重和が小さい周波数fkを選択する構成(何れの構成でも学習の有意性が高い周波数fkが選択される)が採用される。
z1(fk)=σ12σ22(1−z3(fk)2) ……(13)
第2実施形態を除く各形態においては音源S(S1,S2)が2個である場合(n=2)を例示したが、3個以上の音源Sからの音を分離する場合にも本発明は当然に適用される。音源分離の対象となる音源Sがn個である場合にはn個以上の収音機器Mが必要である。
Claims (10)
- 複数音の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段と、
前記各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから前記複数の周波数の各々について算定する指標算定手段と、
前記指標算定手段が算定した各周波数の指標値に応じて前記複数の周波数のうち少なくともひとつの周波数を選択する周波数選択手段と、
前記記憶手段に記憶された複数の観測データのうち前記周波数選択手段が選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理手段とを具備し、
前記指標算定手段は、前記複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数の指標値を算定し、
前記周波数選択手段は、前記指標値が示す基底の総数が多い周波数を選択する
信号処理装置。 - 前記指標算定手段は、前記観測ベクトルの共分散行列の行列式を前記指標値として算定し、
前記周波数選択手段は、前記行列式が大きい周波数を選択する
請求項1の信号処理装置。 - 前記指標算定手段は、前記観測ベクトルの共分散行列の特異値分解で特定される特異値行列の複数の対角成分のうち第1個数の対角成分を乗算した第1行列式と、前記複数の対角成分のうち前記第1個数よりも少ない第2個数の対角成分を乗算した第2行列式とを算定し、
前記周波数選択手段は、前記第1行列式を利用した周波数の選択と、前記第2行列式を利用した周波数の選択とを順次に実行する
請求項2の信号処理装置。 - 前記指標算定手段は、前記観測ベクトルの共分散行列の条件数を前記指標値として算定し、
前記周波数選択手段は、前記条件数が小さい周波数を選択する
請求項1の信号処理装置。 - 前記複数の周波数の各々について前記初期分離行列を生成する初期値生成手段を具備し、
前記学習処理手段は、前記周波数選択手段が選択した周波数の前記初期分離行列を初期値とした学習で当該周波数の分離行列を生成し、前記周波数選択手段が選択しなかった周波数の前記初期分離行列を当該周波数の分離行列とする
請求項1から請求項4の何れかの信号処理装置。 - 前記学習処理手段が生成した分離行列から前記複数音の各々の音源の方向を推定する方向推定手段と、
前記周波数選択手段が選択しなかった周波数の分離行列を、前記方向推定手段が推定した方向から生成する行列補充手段と
を具備する請求項1から請求項4の何れかの信号処理装置。 - 前記方向推定手段は、前記複数の周波数のうち低域側の周波数および高域側の周波数の少なくとも一方を除外した周波数について前記学習処理手段が生成した分離行列から前記複数音の各々の音源の方向を推定する
請求項6の信号処理装置。 - 前記指標算定手段は、前記複数の周波数の各々の指標値を単位区間毎に順次に算定し、
前記周波数選択手段は、
前記複数の周波数の各々の選択/非選択を各単位区間の指標値に応じて単位区間毎に順次に判別する第1選択手段と、
複数の単位区間にわたる前記第1選択手段の判別の結果から前記少なくともひとつの周波数を選択する第2選択手段とを含む
請求項1から請求項7の何れかの信号処理装置。 - 前記第1選択手段は、前記複数の周波数の各々について選択/非選択を示す数値列を単位区間毎に順次に生成し、
前記第2選択手段は、前記複数の単位区間の各々の数値列の加重和から前記少なくともひとつの周波数を選択する
請求項8の信号処理装置。 - 複数音の混合音を複数の収音機器で収音した複数の観測信号の各々における各周波数での強度の時系列を示す観測データを複数の周波数の各々について記憶する記憶手段を具備するコンピュータに、
前記各周波数の観測データを使用した分離行列の学習の有意性の指標値を当該観測データから前記複数の周波数の各々について算定する指標算定処理と、
前記指標算定処理で算定した各周波数の指標値に応じて前記複数の周波数のうち少なくともひとつの周波数を選択する周波数選択処理と、
前記記憶手段に記憶された複数の観測データのうち前記周波数選択処理で選択した周波数の観測データを使用した初期分離行列の学習で当該周波数の分離行列を決定する学習処理処理とを実行させ、
前記指標算定処理では、前記複数の観測信号の各々における各周波数での強度を要素とする観測ベクトルの分布における基底の総数の指標値を算定し、
前記周波数選択処理では、前記指標値が示す基底の総数が多い周波数を選択する
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008292169A JP5277887B2 (ja) | 2008-11-14 | 2008-11-14 | 信号処理装置およびプログラム |
US12/617,605 US9123348B2 (en) | 2008-11-14 | 2009-11-12 | Sound processing device |
EP09014232.4A EP2187389B1 (en) | 2008-11-14 | 2009-11-13 | Sound processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008292169A JP5277887B2 (ja) | 2008-11-14 | 2008-11-14 | 信号処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010117653A JP2010117653A (ja) | 2010-05-27 |
JP5277887B2 true JP5277887B2 (ja) | 2013-08-28 |
Family
ID=41622008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008292169A Expired - Fee Related JP5277887B2 (ja) | 2008-11-14 | 2008-11-14 | 信号処理装置およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9123348B2 (ja) |
EP (1) | EP2187389B1 (ja) |
JP (1) | JP5277887B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6303385B2 (ja) * | 2013-10-16 | 2018-04-04 | ヤマハ株式会社 | 収音解析装置および収音解析方法 |
EP3005362B1 (en) * | 2013-11-15 | 2021-09-22 | Huawei Technologies Co., Ltd. | Apparatus and method for improving a perception of a sound signal |
CN105898667A (zh) | 2014-12-22 | 2016-08-24 | 杜比实验室特许公司 | 从音频内容基于投影提取音频对象 |
CN105989852A (zh) | 2015-02-16 | 2016-10-05 | 杜比实验室特许公司 | 分离音频源 |
US10878832B2 (en) * | 2016-02-16 | 2020-12-29 | Nippon Telegraph And Telephone Corporation | Mask estimation apparatus, mask estimation method, and mask estimation program |
EP3324407A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3742185B1 (en) * | 2019-05-20 | 2023-08-09 | Nokia Technologies Oy | An apparatus and associated methods for capture of spatial audio |
CN115280413A (zh) * | 2020-02-28 | 2022-11-01 | 东京都公立大学法人 | 音源分离程序、音源分离方法以及音源分离装置 |
US20240163627A1 (en) * | 2021-06-30 | 2024-05-16 | Northwestern Polytechnical University | System and method to use deep neural network to generate high-intelligibility binaural speech signals from single input |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2901999A (en) * | 1998-03-10 | 1999-09-27 | Management Dynamics, Inc. | Statistical comparator interface |
US20010044719A1 (en) * | 1999-07-02 | 2001-11-22 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for recognizing, indexing, and searching acoustic signals |
JP3887192B2 (ja) * | 2001-09-14 | 2007-02-28 | 日本電信電話株式会社 | 独立成分分析方法及び装置並びに独立成分分析プログラム及びそのプログラムを記録した記録媒体 |
EP1473964A3 (en) * | 2003-05-02 | 2006-08-09 | Samsung Electronics Co., Ltd. | Microphone array, method to process signals from this microphone array and speech recognition method and system using the same |
DE602004027774D1 (de) * | 2003-09-02 | 2010-07-29 | Nippon Telegraph & Telephone | Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm |
JP2006084898A (ja) | 2004-09-17 | 2006-03-30 | Nissan Motor Co Ltd | 音声入力装置 |
US20060031067A1 (en) * | 2004-08-05 | 2006-02-09 | Nissan Motor Co., Ltd. | Sound input device |
JP4529611B2 (ja) * | 2004-09-17 | 2010-08-25 | 日産自動車株式会社 | 音声入力装置 |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
JP2007034184A (ja) | 2005-07-29 | 2007-02-08 | Kobe Steel Ltd | 音源分離装置,音源分離プログラム及び音源分離方法 |
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
JP2007156300A (ja) * | 2005-12-08 | 2007-06-21 | Kobe Steel Ltd | 音源分離装置、音源分離プログラム及び音源分離方法 |
US20070133819A1 (en) * | 2005-12-12 | 2007-06-14 | Laurent Benaroya | Method for establishing the separation signals relating to sources based on a signal from the mix of those signals |
JP4556875B2 (ja) * | 2006-01-18 | 2010-10-06 | ソニー株式会社 | 音声信号分離装置及び方法 |
JP4920270B2 (ja) * | 2006-03-06 | 2012-04-18 | Kddi株式会社 | 信号到来方向推定装置及び方法、並びに信号分離装置及び方法、コンピュータプログラム |
JP2007282177A (ja) * | 2006-03-17 | 2007-10-25 | Kobe Steel Ltd | 音源分離装置、音源分離プログラム及び音源分離方法 |
JP4672611B2 (ja) * | 2006-07-28 | 2011-04-20 | 株式会社神戸製鋼所 | 音源分離装置、音源分離方法及び音源分離プログラム |
US20080228470A1 (en) * | 2007-02-21 | 2008-09-18 | Atsuo Hiroe | Signal separating device, signal separating method, and computer program |
US20080212666A1 (en) * | 2007-03-01 | 2008-09-04 | Nokia Corporation | Interference rejection in radio receiver |
US8660841B2 (en) * | 2007-04-06 | 2014-02-25 | Technion Research & Development Foundation Limited | Method and apparatus for the use of cross modal association to isolate individual media sources |
US8126829B2 (en) * | 2007-06-28 | 2012-02-28 | Microsoft Corporation | Source segmentation using Q-clustering |
WO2009068084A1 (en) * | 2007-11-27 | 2009-06-04 | Nokia Corporation | An encoder |
US8144896B2 (en) * | 2008-02-22 | 2012-03-27 | Microsoft Corporation | Speech separation with microphone arrays |
JP5195652B2 (ja) * | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
-
2008
- 2008-11-14 JP JP2008292169A patent/JP5277887B2/ja not_active Expired - Fee Related
-
2009
- 2009-11-12 US US12/617,605 patent/US9123348B2/en not_active Expired - Fee Related
- 2009-11-13 EP EP09014232.4A patent/EP2187389B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
EP2187389A3 (en) | 2014-03-26 |
EP2187389A2 (en) | 2010-05-19 |
US9123348B2 (en) | 2015-09-01 |
JP2010117653A (ja) | 2010-05-27 |
US20100125352A1 (en) | 2010-05-20 |
EP2187389B1 (en) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5277887B2 (ja) | 信号処理装置およびプログラム | |
JP5207479B2 (ja) | 雑音抑圧装置およびプログラム | |
JP4469882B2 (ja) | 音響信号処理方法及び装置 | |
JP5641186B2 (ja) | 雑音抑圧装置およびプログラム | |
JP6636633B2 (ja) | 音響信号を向上させるための音響信号処理装置および方法 | |
JP2017503388A5 (ja) | ||
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5034735B2 (ja) | 音処理装置およびプログラム | |
JP5387442B2 (ja) | 信号処理装置 | |
JP5263020B2 (ja) | 信号処理装置 | |
JP5454330B2 (ja) | 音響処理装置 | |
JP5942388B2 (ja) | 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法 | |
JP5233772B2 (ja) | 信号処理装置およびプログラム | |
JP4422662B2 (ja) | 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 | |
JP5884473B2 (ja) | 音響処理装置および音響処理方法 | |
US11984132B2 (en) | Noise suppression device, noise suppression method, and storage medium storing noise suppression program | |
JP5826502B2 (ja) | 音響処理装置 | |
JP5376635B2 (ja) | 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム | |
EP3291228B1 (en) | Audio processing method, audio processing device, and audio processing program | |
JP5163435B2 (ja) | 信号処理装置およびプログラム | |
JP2015169901A (ja) | 音響処理装置 | |
JP2020010196A (ja) | 方向別収音装置及びプログラム | |
JP2005091560A (ja) | 信号分離方法および信号分離装置 | |
JP5338395B2 (ja) | 信号処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130506 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |