JP5666444B2 - 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 - Google Patents
特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 Download PDFInfo
- Publication number
- JP5666444B2 JP5666444B2 JP2011521470A JP2011521470A JP5666444B2 JP 5666444 B2 JP5666444 B2 JP 5666444B2 JP 2011521470 A JP2011521470 A JP 2011521470A JP 2011521470 A JP2011521470 A JP 2011521470A JP 5666444 B2 JP5666444 B2 JP 5666444B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- spectral
- control information
- audio signal
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 63
- 238000000034 method Methods 0.000 title claims description 56
- 238000012545 processing Methods 0.000 title claims description 37
- 238000000605 extraction Methods 0.000 title claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 183
- 230000008878 coupling Effects 0.000 claims description 36
- 238000010168 coupling process Methods 0.000 claims description 36
- 238000005859 coupling reaction Methods 0.000 claims description 36
- 238000001228 spectrum Methods 0.000 claims description 32
- 238000005457 optimization Methods 0.000 claims description 10
- 230000004907 flux Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 230000002238 attenuated effect Effects 0.000 claims description 2
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 claims 2
- 238000012805 post-processing Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 26
- 238000001914 filtration Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 210000002569 neuron Anatomy 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 210000004205 output neuron Anatomy 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 210000002364 input neuron Anatomy 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000011410 subtraction method Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000037303 wrinkles Effects 0.000 description 2
- 241001014642 Rasta Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Filters That Use Time-Delay Elements (AREA)
Description
を使用し、あるいは線形サブバンドSNR
を使用して、各スペクトル値についてブロック31において計算される。重み付けされたスペクトル値は、ブロック32において再び時間ドメインへと変換される。雑音抑制規則の有名な例は、スペクトルサブトラクション法(非特許文献1)及びウィーナーフィルタリングである。入力信号がスピーチ信号と雑音信号との加算混合物であり、スピーチ及び雑音が相関していないと仮定すると、スペクトルサブトラクション法のためのゲイン値は式(3)において与えられる。
・最小トラッキングアルゴリズム
・時間再帰平均アルゴリズム
・ヒストグラムベースのアルゴリズム
に分類することができる。
へと変換される。線形サブバンドSNRが、推定誤差からもたらされる可能性があるアーチファクトを少なくするために、IIR低域通過フィルタ処理を使用して時間及び周波数に沿って平滑化される。スペクトル重み付けのインパルス応答がDFTフレームの長さを超える場合に生じる周回畳み込み(circular convolution)の影響を軽減するために、周波数に沿った低域通過フィルタ処理がさらに必要とされる。上記フィルタ処理が2回実行される一方で、第2のフィルタ処理は、結果としてのフィルタがゼロの位相を有するように、(最後のサンプルから出発して)逆順で行われる。
スペクトルエネルギーは、各時間フレーム及び各周波数帯について計算され、そのフレームの総エネルギーによって正規化される。さらに、スペクトルエネルギーは、二次IIRフィルタを使用して時間に沿って低域通過フィルタ処理される。
スペクトル流束SFは、連続する20フレームのスペクトルの間の非類似度として定義され、距離関数によって実行されることが多い。この作業において、スペクトル流束は、式(6)によるユークリッド距離を使用し、スペクトル係数X(m,k)、時間フレームインデックスm、サブバンドインデックスr、ならびに周波数帯の下限lr及び上限urによって計算される。
ベクトルの平坦度又はスペクトルの調性(スペクトル平坦度に逆の相関関係を持つ)の計算のための種々の定義が存在する。ここで使用されるスペクトル平坦度SFMは、式(7)に示されるように、サブバンド信号のL個のスペクトル係数の幾何平均及び算術平均の比として計算される。
分布の歪度は、重心を中心とする非対称性の指標であり、ランダム変数の三次中央モーメントをその標準偏差の立方で除算したものとして定義される。
パワースペクトルが、各周波数帯について単位重みを有する三角重み付け関数を使用してメルスケールに従ってワープさせられる。MFCCは、対数をとり、離散余弦変換を計算することによって計算される。
RASTA−PLP係数(非特許文献17)は、以下の工程にてパワースペクトルから計算される。
1.スペクトル係数の大きさの圧縮
2.時間にわたるサブバンドエネルギーの帯域通過フィルタ処理
3.工程2の逆処理に関連する大きさの拡張
4.等ラウドネス曲線に対応する重みの乗算
5.係数を0.33の冪へと上げることによるラウドネスの知覚のシミュレーション
6.自己相関法による結果スペクトルの全極モデルの計算
PLP値は、RASTA−PLPと同様に、しかしながら工程1〜3を適用せずに計算される(非特許文献18)。
デルタ特徴は、過去において自動スピーチ認識及びオーディオコンテンツ分類に成功裏に適用されている。デルタ特徴の計算については、様々な方法が存在している。ここでは、9個のサンプル長を有する線形勾配で特徴の時間系列を畳み込むことによって計算される(特徴の時系列のサンプリングレートはSTFTのフレームレートに等しい)。デルタ−デルタ特徴は、デルタ特徴にデルタ演算を行うことによって得られる。
Claims (15)
- オーディオ信号を処理してスピーチ強調フィルタのための制御情報を得る装置であって、
前記オーディオ信号の短時間スペクトル表現の時間系列を取得し、複数の短時間スペクトル表現のために複数の周波数帯の各周波数帯における少なくとも1つの特徴を抽出する特徴抽出器であって、前記少なくとも1つの特徴が前記複数の周波数帯の1つの周波数帯における1つの短時間スペクトル表現のスペクトル形状を表す、特徴抽出器と、
各周波数帯の前記少なくとも1つの特徴を前記複数の周波数帯にわたって結合パラメータを使用して結合させ、前記オーディオ信号の1つの時間部分について前記スピーチ強調フィルタのための制御情報を得る特徴結合器と、
前記特徴結合器の結合パラメータを決定するために当該特徴結合器に学習させる最適化コントローラとを備え、
前記特徴抽出器は、スピーチ強調フィルタへの周波数帯ごとの制御情報が既知である学習オーディオ信号について、当該学習オーディオ信号の短時間スペクトル表現の時間系列を取得し、複数の短時間スペクトル表現のために複数の周波数帯の各周波数帯における少なくとも1つの特徴を抽出し、前記少なくとも1つの特徴が前記複数の周波数帯の1つの周波数帯における1つの短時間スペクトル表現のスペクトル形状を表すものであり、
前記特徴抽出器は、前記学習オーディオ信号から抽出された、各周波数帯の前記少なくとも1つの特徴を前記特徴結合器へ供給し、
前記特徴結合器は、中間結合パラメータを使用して前記制御情報を計算し、
前記最適化コントローラは、前記中間結合パラメータを変化させ、変化後の前記制御情報を前記既知の制御情報と比較し、前記変化後の中間結合パラメータが前記既知の制御情報により良く一致する制御情報をもたらす場合に、前記中間結合パラメータを更新して前記結合パラメータを決定することを特徴とする、装置。 - 前記特徴抽出器が、短時間スペクトル表現の特性を表す少なくとも1つの追加の特徴を抽出し、前記追加の特徴によって表される前記短時間スペクトル表現の特性は、前記短時間スペクトル表現のスペクトル形状とは異なる特性であり、
前記特徴結合器が、前記結合パラメータを使用して、各周波数帯について、前記少なくとも1つの追加の特徴と前記少なくとも1つの特徴とを結合させる、請求項1に記載の装置。 - 前記特徴抽出器が、周波数帯の中心周波数が高くなるにつれて帯域幅が大きくなる非一様な帯域幅の周波数帯を有するスペクトル表現の時間系列が得られる周波数変換操作を行う、請求項1に記載の装置。
- 前記特徴抽出器が、第1の特徴として、帯域内のエネルギー分布を表す帯域ごとのスペクトル平坦度を計算するか、又は第2の特徴として、スペクトル表現の導出元の信号フレームの総エネルギーに基づいて帯域ごとの正規化されたエネルギーを計算し、
前記特徴結合器が、前記帯域ごとのスペクトル平坦度又は前記帯域ごとの正規化されたエネルギーを使用する、請求項1に記載の装置。 - 前記特徴抽出器が、各帯域について、時間的に連続するスペクトル表現の間の類似度又は非類似度を表すスペクトル流束、又は重心を中心とする非対称性を表すスペクトル歪度をさらに抽出する、請求項1〜4のいずれかに記載の装置。
- 前記特徴抽出器が、LPC誤差信号、所定次数までの線形予測係数、又はLPC誤差信号と線形予測係数との組み合わせを含むLPC特徴をさらに抽出し、あるいは前記特徴抽出器が、PLP係数、RASTA−PLP係数、メル周波数ケプストラム係数、又はデルタ特徴をさらに抽出する、請求項1に記載の装置。
- 前記特徴抽出器は、時間ドメインのオーディオサンプルの一ブロックについて前記線形予測係数の特徴を計算し、前記ブロックは、各周波数帯のスペクトル形状を表す前記少なくとも1つの特徴を抽出するために使用されるオーディオサンプルを含む、請求項6に記載の装置。
- 前記特徴抽出器は、一周波数帯のスペクトルの形状を計算するために、直接隣接する1つ又は2つの周波数帯のスペクトル情報をも使用する場合と、当該周波数帯のスペクトル情報だけを使用する場合とを含む請求項1に記載の装置。
- 前記特徴抽出器が、オーディオサンプルのブロックごとに各特徴について個別の特徴情報を抽出し、一周波数帯の個別の特徴情報の系列を結合させて、当該周波数帯について前記少なくとも1つの特徴を得る、請求項1に記載の装置。
- 前記特徴抽出器が、各周波数帯についていくつかのスペクトル値を計算し、当該いくつかのスペクトル値を結合させてスペクトル形状を表す前記少なくとも1つの特徴を取得し、前記少なくとも1つの特徴が前記周波数帯内の前記スペクトル値の数よりも小さい次元を有している、請求項1に記載の装置。
- オーディオ信号を処理してスピーチ強調フィルタのための制御情報を得る方法であって、
前記スピーチ強調フィルタへの周波数帯ごとの制御情報が既知である学習オーディオ信号について、当該学習オーディオ信号の短時間スペクトル表現の時間系列を得るステップと、
前記学習オーディオ信号について、複数の短時間スペクトル表現のために複数の周波数帯の各周波数帯における少なくとも1つの特徴を抽出するステップであって、前記少なくとも1つの特徴が前記複数の周波数帯の1つの周波数帯における1つの短時間スペクトル表現のスペクトル形状を表す、ステップと、
前記学習オーディオ信号の各周波数帯における前記少なくとも1つの特徴から、中間結合パラメータを使用して前記制御情報を計算するステップと、
前記中間結合パラメータを変化させるステップと、
変化後の前記制御情報を前記既知の制御情報と比較するステップと、
前記変化後の中間結合パラメータが前記既知の制御情報により良く一致する制御情報をもたらす場合に、前記中間結合パラメータを更新して結合パラメータを決定するステップと、
前記オーディオ信号の短時間スペクトル表現の時間系列を得るステップと、
複数の短時間スペクトル表現のために複数の周波数帯の各周波数帯における少なくとも1つの特徴を抽出するステップであって、前記少なくとも1つの特徴が前記複数の周波数帯の1つの周波数帯における1つの短時間スペクトル表現のスペクトル形状を表す、ステップと、
各周波数帯の前記少なくとも1つの特徴を前記複数の周波数帯にわたって前記結合パラメータを使用して結合させ、前記オーディオ信号の1つの時間部分について前記スピーチ強調フィルタのための制御情報を得るステップと、
を含む方法。 - オーディオ信号におけるスピーチ強調のための装置であって、
前記オーディオ信号の一時間部分を表している複数の帯域についてフィルタ制御情報を得るために、前記オーディオ信号を処理する請求項1に記載の装置と、
前記オーディオ信号の或る帯域を他の帯域に比べて可変に減衰させるように前記制御情報に基づいて制御することができる制御可能フィルタと、
を備えた装置。 - 前記処理する装置が、前記制御情報が持つスペクトル分解能よりも高い分解能を有するスペクトル情報を提供する時間周波数変換器を備えており、
前記制御情報を高い分解能へと補間し、補間後の制御情報を平滑化して、後処理済み制御情報を得る制御情報の後処理プロセッサをさらに備えており、
前記後処理済み制御情報に基づいて、前記制御可能フィルタの制御可能なフィルタパラメータが設定される、請求項12に記載の装置。 - オーディオ信号のスピーチ強調の方法であって、
前記オーディオ信号を処理し、オーディオ信号の1つの時間部分を表している複数の帯域についてフィルタ制御情報を得る請求項11に記載の方法と、
前記制御情報に基づき、前記オーディオ信号の或る帯域が他の帯域に比べて可変に減衰させられるようにフィルタを制御するステップと、
を含む方法。 - コンピュータ上で実行されたときに請求項11又は14に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US8636108P | 2008-08-05 | 2008-08-05 | |
US61/086,361 | 2008-08-05 | ||
US10082608P | 2008-09-29 | 2008-09-29 | |
EP08017124.2 | 2008-09-29 | ||
EP08017124.2A EP2151822B8 (en) | 2008-08-05 | 2008-09-29 | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction |
US61/100,826 | 2008-09-29 | ||
PCT/EP2009/005607 WO2010015371A1 (en) | 2008-08-05 | 2009-08-03 | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011530091A JP2011530091A (ja) | 2011-12-15 |
JP5666444B2 true JP5666444B2 (ja) | 2015-02-12 |
Family
ID=49170422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011521470A Active JP5666444B2 (ja) | 2008-08-05 | 2009-08-03 | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US9064498B2 (ja) |
EP (1) | EP2151822B8 (ja) |
JP (1) | JP5666444B2 (ja) |
KR (1) | KR101266894B1 (ja) |
CN (1) | CN102124518B (ja) |
AU (1) | AU2009278263B2 (ja) |
CA (1) | CA2732723C (ja) |
ES (1) | ES2678415T3 (ja) |
HK (1) | HK1159300A1 (ja) |
MX (1) | MX2011001339A (ja) |
RU (1) | RU2507608C2 (ja) |
TR (1) | TR201810466T4 (ja) |
WO (1) | WO2010015371A1 (ja) |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8140331B2 (en) * | 2007-07-06 | 2012-03-20 | Xia Lou | Feature extraction for identification and classification of audio signals |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
DE102010009745A1 (de) * | 2010-03-01 | 2011-09-01 | Gunnar Eisenberg | Verfahren und Vorrichtung zur Verarbeitung von Audiodaten |
JP5738020B2 (ja) * | 2010-03-11 | 2015-06-17 | 本田技研工業株式会社 | 音声認識装置及び音声認識方法 |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
JP5566846B2 (ja) * | 2010-10-15 | 2014-08-06 | 本田技研工業株式会社 | ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法 |
JP2012163919A (ja) * | 2011-02-09 | 2012-08-30 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
US9589580B2 (en) | 2011-03-14 | 2017-03-07 | Cochlear Limited | Sound processing based on a confidence measure |
JP2012235310A (ja) * | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8949118B2 (en) * | 2012-03-19 | 2015-02-03 | Vocalzoom Systems Ltd. | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise |
WO2014018004A1 (en) * | 2012-07-24 | 2014-01-30 | Nuance Communications, Inc. | Feature normalization inputs to front end processing for automatic speech recognition |
JP6234060B2 (ja) * | 2013-05-09 | 2017-11-22 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | ターゲットドメインの学習用音声データの生成方法、生成装置、および生成プログラム |
US9443533B2 (en) * | 2013-07-15 | 2016-09-13 | Rajeev Conrad Nongpiur | Measuring and improving speech intelligibility in an enclosure |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
CN103474072B (zh) * | 2013-10-11 | 2016-06-01 | 福州大学 | 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法 |
US10360901B2 (en) * | 2013-12-06 | 2019-07-23 | Nuance Communications, Inc. | Learning front-end speech recognition parameters within neural network training |
RU2720357C2 (ru) | 2013-12-19 | 2020-04-29 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель |
CA2936331A1 (en) * | 2014-02-14 | 2015-08-20 | Donald James DERRICK | System for audio analysis and perception enhancement |
US10176824B2 (en) * | 2014-03-04 | 2019-01-08 | Indian Institute Of Technology Bombay | Method and system for consonant-vowel ratio modification for improving speech perception |
CA2946824C (en) * | 2014-04-25 | 2019-06-18 | Ntt Docomo, Inc. | Linear prediction coefficient conversion device and linear prediction coefficient conversion method |
CN107112025A (zh) * | 2014-09-12 | 2017-08-29 | 美商楼氏电子有限公司 | 用于恢复语音分量的系统和方法 |
US9881631B2 (en) | 2014-10-21 | 2018-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Method for enhancing audio signal using phase information |
US9659578B2 (en) * | 2014-11-27 | 2017-05-23 | Tata Consultancy Services Ltd. | Computer implemented system and method for identifying significant speech frames within speech signals |
MX363414B (es) | 2014-12-12 | 2019-03-22 | Huawei Tech Co Ltd | Aparato de procesamiento de señal para mejorar un componente de voz dentro de una señal de audio multi-canal. |
KR102387567B1 (ko) * | 2015-01-19 | 2022-04-18 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
CN104966517B (zh) * | 2015-06-02 | 2019-02-01 | 华为技术有限公司 | 一种音频信号增强方法和装置 |
DK3118851T3 (da) * | 2015-07-01 | 2021-02-22 | Oticon As | Forbedring af støjende tale baseret på statistiske tale- og støjmodeller |
KR101677137B1 (ko) * | 2015-07-17 | 2016-11-17 | 국방과학연구소 | 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치 |
KR102494139B1 (ko) * | 2015-11-06 | 2023-01-31 | 삼성전자주식회사 | 뉴럴 네트워크 학습 장치 및 방법과, 음성 인식 장치 및 방법 |
CN105611477B (zh) * | 2015-12-27 | 2018-06-01 | 北京工业大学 | 数字助听器中深度和广度神经网络相结合的语音增强算法 |
WO2017141317A1 (ja) * | 2016-02-15 | 2017-08-24 | 三菱電機株式会社 | 音響信号強調装置 |
EP3220367A1 (en) * | 2016-03-14 | 2017-09-20 | Tata Consultancy Services Limited | System and method for sound based surveillance |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
US11003987B2 (en) * | 2016-05-10 | 2021-05-11 | Google Llc | Audio processing with neural networks |
RU2620569C1 (ru) * | 2016-05-17 | 2017-05-26 | Николай Александрович Иванов | Способ измерения разборчивости речи |
JP6563874B2 (ja) * | 2016-08-16 | 2019-08-21 | 日本電信電話株式会社 | 音源強調学習装置、音源強調装置、音源強調学習方法、プログラム |
EP3301675B1 (en) | 2016-09-28 | 2019-08-21 | Panasonic Intellectual Property Corporation of America | Parameter prediction device and parameter prediction method for acoustic signal processing |
US10614827B1 (en) * | 2017-02-21 | 2020-04-07 | Oben, Inc. | System and method for speech enhancement using dynamic noise profile estimation |
US10504538B2 (en) | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
US10381020B2 (en) | 2017-06-16 | 2019-08-13 | Apple Inc. | Speech model-based neural network-assisted signal enhancement |
DE102017212431A1 (de) * | 2017-07-20 | 2019-01-24 | Robert Bosch Gmbh | Verfahren und Vorrichtung zur Verarbeitung eines Signals |
WO2019014890A1 (zh) * | 2017-07-20 | 2019-01-24 | 大象声科(深圳)科技有限公司 | 一种通用的单声道实时降噪方法 |
US11270198B2 (en) * | 2017-07-31 | 2022-03-08 | Syntiant | Microcontroller interface for audio signal processing |
US20190066657A1 (en) * | 2017-08-31 | 2019-02-28 | National Institute Of Information And Communications Technology | Audio data learning method, audio data inference method and recording medium |
EP3688754A1 (en) | 2017-09-26 | 2020-08-05 | Sony Europe B.V. | Method and electronic device for formant attenuation/amplification |
US10325588B2 (en) | 2017-09-28 | 2019-06-18 | International Business Machines Corporation | Acoustic feature extractor selected according to status flag of frame of acoustic signal |
JP7214726B2 (ja) * | 2017-10-27 | 2023-01-30 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム |
US10283140B1 (en) | 2018-01-12 | 2019-05-07 | Alibaba Group Holding Limited | Enhancing audio signals using sub-band deep neural networks |
CN110580910B (zh) * | 2018-06-08 | 2024-04-26 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
US11341983B2 (en) | 2018-09-17 | 2022-05-24 | Honeywell International Inc. | System and method for audio noise reduction |
EP4408022A3 (en) | 2018-10-24 | 2024-10-16 | Gracenote, Inc. | Methods and apparatus to adjust audio playback settings based on analysis of audio characteristics |
CN110008972B (zh) * | 2018-11-15 | 2023-06-06 | 创新先进技术有限公司 | 用于数据增强的方法和装置 |
US11043214B1 (en) * | 2018-11-29 | 2021-06-22 | Amazon Technologies, Inc. | Speech recognition using dialog history |
KR102093929B1 (ko) * | 2018-12-05 | 2020-03-26 | 중앙대학교 산학협력단 | Cim 기반의 시스템 건전성 진단을 위한 장치 및 방법 |
JP7095586B2 (ja) * | 2018-12-14 | 2022-07-05 | 富士通株式会社 | 音声補正装置および音声補正方法 |
CN109448749B (zh) * | 2018-12-19 | 2022-02-15 | 中国科学院自动化研究所 | 基于有监督学习听觉注意的语音提取方法、系统、装置 |
CN111369986A (zh) * | 2018-12-26 | 2020-07-03 | 成都启英泰伦科技有限公司 | 一种智能安全传输语音系统及方法 |
KR102096588B1 (ko) * | 2018-12-27 | 2020-04-02 | 인하대학교 산학협력단 | 음향 장치에서 맞춤 오디오 잡음을 이용해 사생활 보호를 구현하는 기술 |
KR20200080913A (ko) | 2018-12-27 | 2020-07-07 | 서울과학기술대학교 산학협력단 | 자기상관계수를 이용한 심층신경망 기반 신호처리 방법 및 장치 |
KR102188264B1 (ko) * | 2019-01-04 | 2020-12-08 | 순천향대학교 산학협력단 | 언어재활 기반 발성 음성 평가 장치 및 방법 |
EP3694229B1 (en) | 2019-02-08 | 2024-11-13 | Oticon A/s | A hearing device comprising a noise reduction system |
KR102198273B1 (ko) * | 2019-02-26 | 2021-01-04 | 한미란 | 머신러닝 기반의 음성데이터 분석 방법, 장치 및 프로그램 |
CN109767789A (zh) * | 2019-03-06 | 2019-05-17 | 慧言科技(天津)有限公司 | 一种用于语音情感识别的新特征提取方法 |
WO2020209840A1 (en) * | 2019-04-09 | 2020-10-15 | Hewlett-Packard Development Company, L.P. | Applying directionality to audio by encoding input data |
EP3726529A1 (en) * | 2019-04-16 | 2020-10-21 | Fraunhofer Gesellschaft zur Förderung der Angewand | Method and apparatus for determining a deep filter |
EP3970141B1 (en) | 2019-05-14 | 2024-02-28 | Dolby Laboratories Licensing Corporation | Method and apparatus for speech source separation based on a convolutional neural network |
KR20200137561A (ko) * | 2019-05-30 | 2020-12-09 | 국방과학연구소 | 잡음 환경 노이지 데이터를 생성하기 위한 데이터 생성장치, 데이터 생성방법 및 이를 이용한 잡음 제거장치 및 잡음 제거방법 |
CN110534123B (zh) * | 2019-07-22 | 2022-04-01 | 中国科学院自动化研究所 | 语音增强方法、装置、存储介质、电子设备 |
WO2021019643A1 (ja) * | 2019-07-29 | 2021-02-04 | 日本電信電話株式会社 | 印象推定装置、学習装置、それらの方法、およびプログラム |
CN110491407B (zh) * | 2019-08-15 | 2021-09-21 | 广州方硅信息技术有限公司 | 语音降噪的方法、装置、电子设备及存储介质 |
CN110473567B (zh) * | 2019-09-06 | 2021-09-14 | 上海又为智能科技有限公司 | 基于深度神经网络的音频处理方法、装置及存储介质 |
CN110556123B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
CN110556122B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
CN117975976A (zh) * | 2019-09-18 | 2024-05-03 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
US11587575B2 (en) * | 2019-10-11 | 2023-02-21 | Plantronics, Inc. | Hybrid noise suppression |
JP7348812B2 (ja) * | 2019-10-31 | 2023-09-21 | 東京都公立大学法人 | 雑音抑制装置、雑音抑制方法及び音声入力機器 |
CN111061909B (zh) * | 2019-11-22 | 2023-11-28 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种伴奏分类方法和装置 |
CN111223493B (zh) * | 2020-01-08 | 2022-08-02 | 北京声加科技有限公司 | 语音信号降噪处理方法、传声器和电子设备 |
CN111259776B (zh) * | 2020-01-13 | 2023-04-18 | 浙江大学 | 一种基于同步平均主成分时频分析的确定性信号提取方法 |
CN113140225B (zh) * | 2020-01-20 | 2024-07-02 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备及存储介质 |
US11562763B2 (en) * | 2020-02-10 | 2023-01-24 | Samsung Electronics Co., Ltd. | Method for improving sound quality and electronic device using same |
KR102329353B1 (ko) * | 2020-03-17 | 2021-11-22 | 성균관대학교산학협력단 | 심층 신경망을 이용한 음성 발생 방향 추론 방법 및 그 장치 |
US11521637B1 (en) * | 2020-08-19 | 2022-12-06 | Amazon Technologies, Inc. | Ratio mask post-filtering for audio enhancement |
CN111986660A (zh) * | 2020-08-26 | 2020-11-24 | 深圳信息职业技术学院 | 一种神经网络子带建模的单通道语音增强方法、系统及存储介质 |
US20220101872A1 (en) * | 2020-09-25 | 2022-03-31 | Descript, Inc. | Upsampling of audio using generative adversarial networks |
CN112349277B (zh) * | 2020-09-28 | 2023-07-04 | 紫光展锐(重庆)科技有限公司 | 结合ai模型的特征域语音增强方法及相关产品 |
US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
GB202018375D0 (en) * | 2020-11-23 | 2021-01-06 | Rossi Lisa | Audio signal processing systems and methods |
US11475869B2 (en) | 2021-02-12 | 2022-10-18 | Plantronics, Inc. | Hybrid noise suppression for communication systems |
CN115116469B (zh) * | 2022-05-25 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 特征表示的提取方法、装置、设备、介质及程序产品 |
CN115116446B (zh) * | 2022-06-21 | 2024-11-01 | 成都理工大学 | 一种噪声环境下说话人识别模型构建方法 |
US20240161765A1 (en) * | 2022-11-16 | 2024-05-16 | Cisco Technology, Inc. | Transforming speech signals to attenuate speech of competing individuals and other noise |
GB2625773A (en) * | 2022-12-23 | 2024-07-03 | Airbus Defence & Space Ltd | Determination of signal characteristics |
GB2625772A (en) * | 2022-12-23 | 2024-07-03 | Airbus Defence & Space Ltd | Determination of signal characteristics |
US20240304186A1 (en) * | 2023-03-08 | 2024-09-12 | Google Llc | Audio signal synthesis from a network of devices |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5822742A (en) | 1989-05-17 | 1998-10-13 | The United States Of America As Represented By The Secretary Of Health & Human Services | Dynamically stable associative learning neural network system |
JP3084721B2 (ja) * | 1990-02-23 | 2000-09-04 | ソニー株式会社 | 雑音除去回路 |
DE4227826C2 (de) * | 1991-08-23 | 1999-07-22 | Hitachi Ltd | Digitales Verarbeitungsgerät für akustische Signale |
JP3247011B2 (ja) | 1994-04-12 | 2002-01-15 | 富士通株式会社 | セル配置改善装置及び方法 |
SE505175C2 (sv) | 1994-12-01 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande och telekommunikationssystem för att åstadkomma ett abonnentstyrt uppkopplingsförlopp i ett telekommunikationsnät |
US5960391A (en) | 1995-12-13 | 1999-09-28 | Denso Corporation | Signal extraction system, system and method for speech restoration, learning method for neural network model, constructing method of neural network model, and signal processing system |
SE506034C2 (sv) * | 1996-02-01 | 1997-11-03 | Ericsson Telefon Ab L M | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
FR2786908B1 (fr) * | 1998-12-04 | 2001-06-08 | Thomson Csf | Procede et dispositif pour le traitement des sons pour correction auditive des malentendants |
DE19948308C2 (de) * | 1999-10-06 | 2002-05-08 | Cortologic Ag | Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
DE60104091T2 (de) * | 2001-04-27 | 2005-08-25 | CSEM Centre Suisse d`Electronique et de Microtechnique S.A. - Recherche et Développement | Verfahren und Vorrichtung zur Sprachverbesserung in verrauschte Umgebung |
JP3933909B2 (ja) * | 2001-10-29 | 2007-06-20 | 日本放送協会 | 音声/音楽混合比推定装置およびそれを用いたオーディオ装置 |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
JP2004341339A (ja) * | 2003-05-16 | 2004-12-02 | Mitsubishi Electric Corp | 雑音抑圧装置 |
AU2003904207A0 (en) | 2003-08-11 | 2003-08-21 | Vast Audio Pty Ltd | Enhancement of sound externalization and separation for hearing-impaired listeners: a spatial hearing-aid |
JP4150798B2 (ja) * | 2004-07-28 | 2008-09-17 | 国立大学法人徳島大学 | デジタルフィルタリング方法、デジタルフィルタ装置、デジタルフィルタプログラム及びコンピュータで読み取り可能な記録媒体 |
RU52536U1 (ru) * | 2005-12-08 | 2006-03-27 | Общество с ограниченной ответственностью "Филком" | Цифровой модуль преобразования речи |
EP1918910B1 (en) * | 2006-10-31 | 2009-03-11 | Harman Becker Automotive Systems GmbH | Model-based enhancement of speech signals |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
US8352257B2 (en) * | 2007-01-04 | 2013-01-08 | Qnx Software Systems Limited | Spectro-temporal varying approach for speech enhancement |
JP2010539792A (ja) * | 2007-09-12 | 2010-12-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | スピーチ増強 |
US8521530B1 (en) * | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
-
2008
- 2008-09-29 EP EP08017124.2A patent/EP2151822B8/en active Active
- 2008-09-29 ES ES08017124.2T patent/ES2678415T3/es active Active
- 2008-09-29 TR TR2018/10466T patent/TR201810466T4/tr unknown
-
2009
- 2009-08-03 KR KR1020117002693A patent/KR101266894B1/ko active IP Right Grant
- 2009-08-03 RU RU2011105976/08A patent/RU2507608C2/ru active
- 2009-08-03 WO PCT/EP2009/005607 patent/WO2010015371A1/en active Application Filing
- 2009-08-03 JP JP2011521470A patent/JP5666444B2/ja active Active
- 2009-08-03 AU AU2009278263A patent/AU2009278263B2/en active Active
- 2009-08-03 CA CA2732723A patent/CA2732723C/en active Active
- 2009-08-03 CN CN2009801310163A patent/CN102124518B/zh active Active
- 2009-08-03 MX MX2011001339A patent/MX2011001339A/es active IP Right Grant
-
2011
- 2011-02-02 US US13/019,835 patent/US9064498B2/en active Active
- 2011-12-13 HK HK11113430.8A patent/HK1159300A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
WO2010015371A1 (en) | 2010-02-11 |
EP2151822A1 (en) | 2010-02-10 |
AU2009278263B2 (en) | 2012-09-27 |
AU2009278263A1 (en) | 2010-02-11 |
CA2732723A1 (en) | 2010-02-11 |
EP2151822B8 (en) | 2018-10-24 |
CN102124518B (zh) | 2013-11-06 |
CA2732723C (en) | 2016-10-11 |
HK1159300A1 (en) | 2012-07-27 |
US20110191101A1 (en) | 2011-08-04 |
KR101266894B1 (ko) | 2013-05-24 |
TR201810466T4 (tr) | 2018-08-27 |
MX2011001339A (es) | 2011-05-10 |
EP2151822B1 (en) | 2018-04-25 |
CN102124518A (zh) | 2011-07-13 |
KR20110044990A (ko) | 2011-05-03 |
ES2678415T3 (es) | 2018-08-10 |
RU2507608C2 (ru) | 2014-02-20 |
RU2011105976A (ru) | 2012-08-27 |
US9064498B2 (en) | 2015-06-23 |
JP2011530091A (ja) | 2011-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
US10504539B2 (en) | Voice activity detection systems and methods | |
RU2329550C2 (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
JP6169849B2 (ja) | 音響処理装置 | |
KR101461774B1 (ko) | 대역폭 확장기 | |
CN104823236B (zh) | 语音处理系统 | |
JP5842056B2 (ja) | 雑音推定装置、雑音推定方法、雑音推定プログラム及び記録媒体 | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
WO2022068440A1 (zh) | 啸叫抑制方法、装置、计算机设备和存储介质 | |
KR100784456B1 (ko) | Gmm을 이용한 음질향상 시스템 | |
CN113593604A (zh) | 检测音频质量方法、装置及存储介质 | |
KR102718917B1 (ko) | 음성 신호에서의 마찰음의 검출 | |
Uhle et al. | Speech enhancement of movie sound | |
Thiagarajan et al. | Pitch-based voice activity detection for feedback cancellation and noise reduction in hearing aids | |
Surendran et al. | Variance normalized perceptual subspace speech enhancement | |
Tiwari et al. | Speech enhancement using noise estimation with dynamic quantile tracking | |
Maganti et al. | Sub-band spectral variance feature for noise robust ASR | |
Rao et al. | Implementation and evaluation of spectral subtraction with minimum statistics using WOLA and FFT modulated filter banks | |
BRPI0911932B1 (pt) | Equipamento e método para processamento de um sinal de áudio para intensificação de voz utilizando uma extração de característica | |
Farsi et al. | Robust speech recognition based on mixed histogram transform and asymmetric noise suppression | |
Kamaraju et al. | Speech Enhancement Technique Using Eigen Values | |
Brookes et al. | Enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130703 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131003 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140821 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140910 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5666444 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |