JP7455890B2 - 音響信号を処理する装置および方法 - Google Patents
音響信号を処理する装置および方法 Download PDFInfo
- Publication number
- JP7455890B2 JP7455890B2 JP2022066339A JP2022066339A JP7455890B2 JP 7455890 B2 JP7455890 B2 JP 7455890B2 JP 2022066339 A JP2022066339 A JP 2022066339A JP 2022066339 A JP2022066339 A JP 2022066339A JP 7455890 B2 JP7455890 B2 JP 7455890B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- acoustic signal
- bandwidth
- frequency
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 136
- 238000012545 processing Methods 0.000 title claims description 91
- 230000003595 spectral effect Effects 0.000 claims description 233
- 238000001228 spectrum Methods 0.000 claims description 220
- 239000004606 Fillers/Extenders Substances 0.000 claims description 66
- 230000009467 reduction Effects 0.000 claims description 52
- 238000001914 filtration Methods 0.000 claims description 40
- 230000001052 transient effect Effects 0.000 claims description 35
- 230000005236 sound signal Effects 0.000 claims description 33
- 230000004048 modification Effects 0.000 claims description 32
- 238000012986 modification Methods 0.000 claims description 32
- 230000000670 limiting effect Effects 0.000 claims description 30
- 230000010363 phase shift Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000007493 shaping process Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 239000002131 composite material Substances 0.000 claims description 7
- 230000002459 sustained effect Effects 0.000 claims description 7
- 230000002087 whitening effect Effects 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims 2
- 238000010168 coupling process Methods 0.000 claims 2
- 238000005859 coupling reaction Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 45
- 238000011156 evaluation Methods 0.000 description 39
- 238000010586 diagram Methods 0.000 description 38
- 230000008569 process Effects 0.000 description 37
- 238000005070 sampling Methods 0.000 description 22
- 238000012805 post-processing Methods 0.000 description 21
- 238000012952 Resampling Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 17
- 239000003623 enhancer Substances 0.000 description 16
- 238000012935 Averaging Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 10
- 230000002238 attenuated effect Effects 0.000 description 8
- 230000010076 replication Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 7
- 230000001629 suppression Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000010009 beating Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 239000012814 acoustic material Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 241000291281 Micropterus treculii Species 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Auxiliary Devices For Music (AREA)
- Stereophonic System (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Description
低ビットレートの変換符号化では、スペクトル線の符号化用の量子化器はしばしば、それらのダイナミックレンジが信号に適応するよう、非常に粗い精度に設定しなければならない。結果として、多くのスペクトル線が、最初の量子化器ステップに対応して、量子化器の不感帯によって0に、または値1に量子化される。時間が経つにつれて、スペクトル線または線のグループが0と1との間で切り替わることがあり、これによって望ましくない時間変調が導入される。このアーティファクトは、鳥のさえずりを連想して「バーディー」と呼ばれている。したがって、スペクトルホールとスペクトルアイランドのこの強力で時変的な存在は、好ましくない知覚的アーティファクトにつながる望ましくないコーデック挙動である。非特許文献2および非特許文献3参照。
他のよく知られた符号化アーティファクトは帯域幅制限である。低ビットレートの符号化条件で、使用可能なビットバジェットが透明性に必要な精度に対応するには不十分であれば、レガシーコーデックはしばしば、静的ローパスを導入して音響帯域幅を制限していた。これにより、音が鈍くくぐもった印象になることがある。非特許文献2および非特許文献3参照。
このアーティファクトは、トーン対ノイズ比が過大評価されているとき、スペクトル帯域複製(SBR)などの人為的帯域幅拡張方法に関連して現れる。非特許文献4参照。この場合、調性成分が、金属音につながる過度のエネルギーで再現される。非特許文献3参照。
トーンスパイクアーティファクトと同様に、ビーティングアーティファクトは、人為的帯域幅拡張とともに現れる。ビーティングは粗さの知覚を作成し、SBRにおいて用いられるようなコピーアップによって引き起こされる可能性のある周波数距離が近い2つのトーン成分から発生する。非特許文献3参照。
1.知覚音響符号化によって信号が圧縮されている(すなわち、損失が多い)。したがって、上記のアーティファクトタイプに対処する強調方法の適用が適切である。
2.SBRによって導入されたアーティファクトの可聴性を低減するための専用の方法によって信号の音質を潜在的に改善することができる。このような方法は、SBRが有効になる開始周波数についての知識から利益を得る。
y(k)=h(1)x_{k-1}+h(2)x_{k}+h(3)x_{k+1}
L(K、τ)=|Z(k)-Z(k+τ)|
L(K、τ)=bL(K、τ)+(1-b)B(K、τ)
ここで、B(k、τ)は、音響信号の前の時間ステップ(フレーム)からの再帰平均化の出力を保存するバッファを示し、0<b<1は時間平均化を制御する時定数である。したがって、周波数推定器36は、平均要素類似度を取得するように、第1のセグメントおよび第2のセグメントについての複数の要素の要素類似度を経時的に再帰平均化するため、および平均要素類似度を用いて開始周波数および/または終了周波数を決定するために構成することができる。時間平均化は、任意選択で、現フレームが無音でない、すなわち、そのエネルギーが非無音フレームから無音フレームを特徴付けている閾値27よりも大きいときにのみ適用することができる。
1)ロッシー圧縮または他の信号処理によって引き起こされる可能性が高いため、アーティファクトと見なされる入力信号における帯域幅削減(BR)の存在を検出すること。出力は、たとえば、ここではDと呼ぶバイナリ変数であり得、BLが検出されればD=1、そうでなければ0である。
2)帯域幅制限のカットオフ周波数を推定すること。推定量はfcと呼ぶ。
X(k)>閾値
が当てはまり、周波数kでのスペクトルの値が、ポイントkでスペクトル内に顕著なエネルギーがあることを示す閾値より大きいことを意味しているとき、否定的評価結果を得るために構成することができる。さらに決定規則
X(k)<X(k+1)-オフセットパラメータ
が当てはまることがあり、周波数k+1が増加すると、スペクトル、そのエネルギーがそれぞれ増加することを示している。この考察は、たとえば、0.1、0.2、0.3、0.5または1dBまたは異なる値のオフセットパラメータを減算することによって正規化することができ、すなわち、決定規則を満たすため、スペクトルはオフセットパラメータより増加しなければならない。これにより、ノイズなどによって引き起こされる影響を排除することが可能になる。したがって、振幅は、0.5dBを超える帯域幅制限を超える周波数ポイントkで、より高い周波数に向かって増加する。閾値は、上で説明したように、たとえば、-30dB、-40dB、-50dB、または-60dBとすることができる。これは、否定的決定について、急激な減衰がないか、またはそれぞれの周波数値を超えて振幅が増加するかのいずれかを意味している。
S(k)>閾値
が当てはまることがあり、スペクトル差関数は、急峻で強い減衰を示すことができ、したがってリサンプリングを示すことができる。したがって、図11における最大値72が予想リサンプリングレート/リサンプリング周波数またはその近くに配置されると、リサンプリングの存在を決定することができる。
S(k)=maxX1-maxX2
1).x(k)>閾値、および
2).X(k)<X(k+1)-オフセットパラメータAND x(k)大きい閾値、
すなわち、振幅が閾値、たとえば、-60dBより大きいとき、オフセットパラメータ、たとえば、0.5dBより大きなBLを超える高い周波数に向かって振幅が増加する、
これにより、陰性検出につながる可能性がある。
1).S(k)>閾値、および
2).リサンプリングが検出された
以上による条件は陽性検出につながる可能性がある。
Y[k、m]=G[k、m]・X[k、m]
X'=20log10(X)
Δf=Y'-20log10(X)
および
Δt=Z'-20log10(X)
によって計算することができ、Δfは周波数差値を指し、Δtは時間差値を指す。
Z=X+F
に従って加算することによって得られる信号Zに含まれるスペクトルアイランドは
Y=W・Z
に従うスペクトルの重み付けによって抑制することができる。
F=G・S
に従って決定されたXにおいてスペクトルギャップが識別されている。
Y[k、m]=G[k、m]・X[k、m]
ここで、周波数領域信号Y[k、m]の時間領域表現y[n]は、逆変換、たとえば、逆STFT、すなわち、ISTFTによって計算することができる。以下のセクションにおいて、時間領域の信号は小文字で、周波数領域の信号は大文字で示すことができる。インデックスkおよびmまたは周波数領域信号は、読みやすくするために省略する。スペクトル重み付けは、スペクトル重み付けG[k、m]についての詳細が説明されているスペクトル重み付けと呼ばれる態様に関連してより詳細に説明される。
si=(fi、pi)
音響信号を処理するための装置であって、
前記音響信号(91)のスペクトル(91')の第1の部分(91'a)を前記音響信号(91)の前記スペクトル(91')の第2の部分(91'b)から分離するためのセパレータ(92)であって、前記第1の部分(91'a)は第1の信号特性を有し、前記第2の部分(91'b)は第2の信号特性を有する、セパレータ(92)と、
第1の拡張部分(98a, 126a)を得るため、前記第1の信号特性に関連する第1のパラメータ(961)を用いて前記第1の部分(91'b)の帯域幅を拡張するための第1の帯域幅拡張器(941)と、
第2の拡張部分(98b, 126b)を得るため、前記第2の信号特性に関連する第2のパラメータ(962)を用いて前記第2の部分(91'b)の帯域幅を拡張するための第2の帯域幅拡張器(942)と、
拡張合成音響信号(104)を得るため、前記第1の拡張部分(98a)および前記第2の拡張部分(98b)を用いるために構成された合成器(102)と、
を含む、装置。
前記第1の帯域幅拡張器は、スペクトル成分を前記第1の部分(91'a)に追加することによって前記第1の部分(91'a)の前記帯域幅を拡張するために構成され、前記第2の帯域幅拡張器は、スペクトル成分を前記第2の部分に追加することによって前記第2の部分の前記帯域幅を拡張するために構成されている、付記1に記載の装置。
前記第1の帯域幅拡張器(941)は、前記第1の部分(91'a)の少なくとも一部(w, 128)を複製するため、および拡張部分(126a)を得るように前記第1の部分の複製部分(w, 117)の少なくとも1つのバージョン(w)を前記第1の部分(91'a)と結合するための第1の複製器(1141)を含み、
前記第2の帯域幅拡張器(942)は、前記第2の部分(91'b)の少なくとも一部(w, 129)を複製するため、および拡張部分(126b)を得るように前記第2の部分の複製部分(w, 128)の少なくとも1つのバージョンを前記第2の部分(91'b)と結合するための第2の複製器(942)を含む、付記1または2に記載の装置。
前記第1の部分の前記部分(w, 128)は、前記第1の部分の第1の中間周波数(fcopy)から前記第1の部分の最大周波数(fc)に及ぶ第1の周波数範囲(Δfw)を含み、
前記第2の部分の前記部分(w, 128)は、前記第2の部分(91'b)の第2の中間周波数(fcopy)から前記第2の部分の最大周波数(fc)に及ぶ第2の周波数範囲(Δfw)を含む、付記3に記載の装置。
前記第1の帯域幅拡張器(941)は、前記拡張された第1の部分の少なくとも前記複製部分(w, 128)を整形するための第1の包絡線整形器を含み、前記第2の帯域幅拡張器(942)は、前記拡張された第2の部分(126b)の少なくとも複製部分を整形するための第2の包絡線整形器(1162)を含む、付記4または5に記載の装置。
前記第1の帯域幅拡張器(941)は、前記拡張された第1の部分(126a)の少なくとも前記複製部分(w, 128)を等化するための第1の白色化器(1181)を含み、前記第2の帯域幅拡張器は、前記拡張された第2の部分(126b)の少なくとも複製部分(w, 128)を等化するための第2の白色化器(1182)を含む、付記1から5のいずれか一項に記載の装置。
前記第1の帯域幅拡張器(941)は、前記拡張された第1の部分(126a)の少なくとも一部を位相シフトするための第1の粗さ低減フィルタ(94, 1221)を含み、前記第2の帯域幅拡張器(942)は、前記拡張された第2の部分(126b)の少なくとも一部を位相シフトするための第2の粗さ低減フィルタ(1222)を含む、付記1から6のいずれか一項に記載の装置。
前記第1の粗さ低減フィルタ(1221)は、第1の位相シフト信号を得るように前記第1の拡張部分(w, 128)またはその派生信号を位相シフトするために構成され、
前記第2の粗さ低減フィルタ(1222)は、第2の位相シフト信号を得るように前記第2の拡張部分(w, 128)またはその派生信号を位相シフトするために構成されている、付記7に記載の装置。
前記第1の粗さ低減フィルタ(1221)は第1の位相シフトを適用するために構成され、前記第2の粗さ低減フィルタ(1222)は第2の位相シフトを適用するために構成されている、付記7または8に記載の装置。
前記第1の信号特性は
a)前記スペクトルの中周波数範囲
b)前記音響信号の直接信号特性
c)前記音響信号のトーン特性
d)前記音響信号の音声特性
のうちの1つであり、前記第2の信号特性は
a)前記スペクトルのサイド周波数範囲
b)前記音響信号の周囲信号特性
c)前記音響信号の持続信号特性、および
d)前記音響信号の非音声特性、
である、付記1から9のいずれか一項に記載の装置。
前記音響信号(91)は複数のフレームを含み、前記装置は、各フレームについて、前記音響信号(91)の人為的帯域幅制限に関連する特性について前記音響信号(91)の前記スペクトル(91')を分析するため、および前記音響信号におけるカットオフ周波数(fc)を決定するために構成された信号分析器(166)を含み、
前記装置は、前記人為的帯域幅制限に関する特性を有するフレームについて前記第1のパラメータおよび前記第2のパラメータ(961, 962)を用いるために構成され、
前記装置は、人為的帯域幅制限に関する前記特性とは異なる特性を有するフレームについて、前記第1の帯域幅拡張器(941)について第3のパラメータを、前記第2の帯域幅拡張器(942)について第4のパラメータを用いるために、または人為的帯域幅制限に関連する特性とは異なる特性を有する前記フレームについて前記第1の帯域幅拡張器および前記第2の帯域幅拡張器(941, 942)を停止状態にするよう構成されている、付記1から10のいずれか一項に記載の装置。
前記装置は、対応する複数の信号修正パラメータ(f1-f4, fc)に関連する複数の第1のパラメータ(p, 96)と、対応する複数の信号修正パラメータ(f1-f4, fc)に関連する複数の第2のパラメータ(p, 962)と、を含むルックアップテーブル(168)を含み、前記装置は、前記音響信号(91)に適用される修正について前記スペクトル(91')を分析するための信号分析器(166)を含み、前記装置は、前記修正に関連する修正パラメータ(f1-f4, fc)を導出するため、および前記ルックアップテーブル(168)を用いて、および前記修正パラメータ(f1-f4, fc)を用いて、前記第1のパラメータ(961)および前記第2のパラメータ(962)を導出するために構成されている、付記1から11のいずれか一項に記載の装置。
前記セパレータ(92)は、
前記音響信号(91')を受信するため、および第1の修正音響信号を得るように前記音響信号(91')における過渡部分を低減するために構成された過渡抑制器(108)であって、前記セパレータ(92)は、前記第1の修正音響信号に基づいて前記第1の部分(91'a)を得るために構成されている、過渡抑制器と、
第2の修正信号(91'b)を得るように前記音響信号(91')から前記第1の修正音響信号を減算するための減算器(112)であって、前記セパレータ(92)は、前記第2の修正音響信号に基づいて前記第2の部分(91'b)を得るために構成されている、減算器と、
を含む、付記1から12のいずれか一項に記載の装置。
前記合成器は第1の合成器(102)であり、前記装置は、
前記第1の拡張部分(98'a)および前記第2の拡張部分(98'b)をフィルタリングするため、またはフィルタリングされた合成音響信号(154)が得られるように前記合成音響信号(104)をフィルタリングするためのハイパスフィルタ(152)と、
フィルタリングされた音響信号を得るように前記音響信号(91)をフィルタリングするためのローパスフィルタ(158)と、
帯域幅拡張音響信号(164)を得るため、前記フィルタリングされた合成音響信号(154)と前記フィルタリングされた音響信号とを合成するために構成された第2の合成器(162)と、
を含む、付記1から13のいずれか一項に記載の装置。
音響信号(12)を処理するための装置(210)であって、
位相シフト信号(172)を得るように前記音響信号(12)の少なくとも一部を位相シフトするための粗さ低減フィルタ(122)と、
第1のフィルタリング信号(174)を得るように前記位相シフト信号(172)をフィルタリングするために構成されたハイパスフィルタ(152)と、
第2のフィルタリング信号(176)を得るように前記音響信号(12)をフィルタリングするために構成されたローパスフィルタ(158)と、
強調音響信号(178)を得るように前記第1のフィルタリング信号(174)と前記第2のフィルタリング信号(176)とを合成するために構成された合成器(162)と、
を含む、装置(210)。
音響信号を処理するための方法(3000)であって、
前記音響信号のスペクトルの第1の部分を前記音響信号の前記スペクトルの第2の部分から分離するステップであって、前記第1の部分は第1の信号特性を有し、前記第2の部分は第2の信号特性を有する、ステップ(3100)と、
第1の拡張部分を得るため、前記第1の信号特性に関連する第1のパラメータを用いて前記第1の部分の帯域幅を拡張するステップ(3200)と、
第2の拡張部分を得るため、前記第2の信号特性に関連する第2のパラメータを用いて前記第2の部分の帯域幅を拡張するステップ(3300)と、
拡張合成音響信号を得るため、前記第1の拡張部分および前記第2の拡張部分を用いるステップ(3400)と、
を含む、方法。
音響信号を処理するための方法(4000)であって、
位相シフト信号を得るように前記音響信号の少なくとも一部を位相シフトするステップ(4100)と、
第1のフィルタリング信号を得るようにハイパスフィルタを用いて前記位相シフト信号をフィルタリングするステップ(4200)と、
第2のフィルタリング信号を得るようにローパスフィルタを用いて前記音響信号をフィルタリングするステップ(4300)と、
強調音響信号を得るように前記第1のフィルタリング信号と前記第2のフィルタリング信号とを合成するステップ(4400)と、
を含む、方法。
コンピュータ上で動いているとき、付記16または17に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムを格納している非一時的記憶媒体。
12 音響信号
12'、12'1、12'2、12'3 スペクトル
12'a 第1の部分
12'b 第2の部分
14 導出器
16 スペクトル
181~187 極大値
22 信号
24 決定器
261、262、263 領域
27 振幅閾値、閾値、エネルギー閾値レベル
28 信号
32 プロセッサ
34 情報
36 周波数推定器
38 信号
381、382、383 水平線
42a、42b グラフ
44 スペクトル計算器
46 フィルタ
48 信号強調器
52 傾斜評価器
54 傾斜
56 傾斜評価結果
58 周波数評価器
62、62' 周波数評価結果
64 プロセッサ
66 情報
66' 結合結果
68 立ち下がりエッジ
72 最大値
74 フィルタ
76 フィルタ
78 決定器
82 信号
90 装置
91 音響信号
91' スペクトル
91'a 第1の部分
91'b 第2の部分
92 セパレータ
94、941、942 帯域幅拡張器
961 第1のパラメータ
962 第2のパラメータ
98a 第1の拡張部分
98b 第2の拡張部分
102 合成器
104 拡張合成音響信号
106a、106b 成分
108 過渡抑制器
112 減算器
114 複製器
1141 第1の複製器
1142 第2の複製器
116 整形器
1161 第1の包絡線整形器
1162 第2の包絡線整形器
118、1181、1182 白色化器
122、1221、1222 粗さ低減フィルタ
1241、1242 ISTFTブロック
125 装置
126a、126b 延長部分
1281、1282 複製部分
132a 振幅スペクトル
134 白色化器
138 計算器
140 装置
142 平滑化経路
144 周波数変換器
148、1481、1482 増幅器/減衰器
152 ハイパスフィルタ
154 フィルタリング信号
156 遅延
158 ローパスフィルタ
160 装置
162 合成器
166 信号分析器
168 ルックアップテーブル
172 位相シフトされた信号
174 第1のフィルタリングされた信号
176 第2のフィルタリングされた信号
178 強調音響信号、合成信号
200 信号強調器
202 スペクトルギャップ
204 スペクトルアイランド
2061、2062、2063、2064 エッジ
208 プロセッサ
210 装置
212 絶対値形成器
214 対数
216a 第1のローパスフィルタ
216b 第2のローパスフィルタ
218 スペクトル重み計算器
222a、222b ローパスフィルタ
224 結合器
226 結合器
228 スペクトルアイランド重み計算器
234 信号変換器
1000、1500、2000、2500、3000、4000 方法
Claims (19)
- 音響信号を処理するための装置であって、
前記音響信号のスペクトルの第1の部分を前記音響信号の前記スペクトルの第2の部分から分離するためのセパレータであって、前記第1の部分は第1の信号特性を有し、前記第2の部分は第2の信号特性を有する、セパレータと、
第1の拡張部分を得るため、前記第1の信号特性に関連する第1のパラメータを用いて前記第1の部分の帯域幅を拡張するための第1の帯域幅拡張器と、
第2の拡張部分を得るため、前記第2の信号特性に関連する第2のパラメータを用いて前記第2の部分の帯域幅を拡張するための第2の帯域幅拡張器と、
拡張合成音響信号を得るため、前記第1の拡張部分および前記第2の拡張部分を用いるために構成された合成器と、
を含み、
前記音響信号は複数のフレームを含み、前記装置は、各フレームについて、音響信号が前記音響信号の人為的帯域幅制限を受けたことを示す特性について前記音響信号の前記スペクトルを分析するため、および前記音響信号におけるカットオフ周波数を決定するために構成された信号分析器を含み、
前記装置は、前記音響信号が前記音響信号の前記人為的帯域幅制限を受けたことを示す特性を有するフレームである、と前記信号分析器が判定したフレームに対して、前記第1のパラメータおよび前記第2のパラメータを使用するように構成され、前記フレームは、前記人為的帯域幅制限に関する特性を有し、
前記装置は、人為的帯域幅制限に関する前記特性とは異なる特性を有するフレームについて、前記第1の帯域幅拡張器について第3のパラメータを、前記第2の帯域幅拡張器について第4のパラメータを用いるために構成されている、
装置。 - 音響信号を処理するための装置であって、
前記音響信号のスペクトルの第1の部分を前記音響信号の前記スペクトルの第2の部分から分離するためのセパレータであって、前記第1の部分は第1の信号特性を有し、前記第2の部分は第2の信号特性を有する、セパレータと、
第1の拡張部分を得るため、前記第1の信号特性に関連する第1のパラメータを用いて前記第1の部分の帯域幅を拡張するための第1の帯域幅拡張器と、
第2の拡張部分を得るため、前記第2の信号特性に関連する第2のパラメータを用いて前記第2の部分の帯域幅を拡張するための第2の帯域幅拡張器と、
拡張合成音響信号を得るため、前記第1の拡張部分および前記第2の拡張部分を用いるために構成された合成器と、
を含み、
前記装置は、対応する複数の信号修正パラメータに関連する複数の第1のパラメータと、対応する複数の信号修正パラメータに関連する複数の第2のパラメータと、を含むルックアップテーブルを含み、前記装置は、前記音響信号に適用される修正について前記スペクトルを分析するための信号分析器を含み、前記装置は、前記修正に関連する修正パラメータを導出するため、および前記ルックアップテーブルを用いて、および前記修正パラメータを用いて、前記第1のパラメータおよび前記第2のパラメータを導出するために構成されている、
装置。 - 前記第1の帯域幅拡張器は、スペクトル成分を前記第1の部分に追加することによって前記第1の部分の前記帯域幅を拡張するために構成され、前記第2の帯域幅拡張器は、スペクトル成分を前記第2の部分に追加することによって前記第2の部分の前記帯域幅を拡張するために構成されている、請求項1または2に記載の装置。
- 前記第1の帯域幅拡張器は、前記第1の部分の少なくとも一部を複製するため、および拡張部分を得るように前記第1の部分の複製部分の少なくとも1つのバージョンを前記第1の部分と結合するための第1の複製器を含み、
前記第2の帯域幅拡張器は、前記第2の部分の少なくとも一部を複製するため、および拡張部分を得るように前記第2の部分の複製部分の少なくとも1つのバージョンを前記第2の部分と結合するための第2の複製器を含む、請求項1から3のいずれか一項に記載の装置。 - 前記第1の部分の前記複製部分は、前記第1の部分の第1の中間周波数から前記第1の部分の最大周波数に及ぶ第1の周波数範囲を含み、
前記第2の部分の前記複製部分は、前記第2の部分の第2の中間周波数から前記第2の部分の最大周波数に及ぶ第2の周波数範囲を含む、請求項4に記載の装置。 - 前記第1の帯域幅拡張器は、前記拡張された第1の部分の少なくとも前記複製部分を整形するための第1の包絡線整形器を含み、前記第2の帯域幅拡張器は、前記拡張された第2の部分の少なくとも複製部分を整形するための第2の包絡線整形器を含む、請求項4または5に記載の装置。
- 前記第1の帯域幅拡張器は、前記拡張された第1の部分の少なくとも前記複製部分を等化するための第1の白色化器を含み、前記第2の帯域幅拡張器は、前記拡張された第2の部分の少なくとも複製部分を等化するための第2の白色化器を含む、請求項4から6のいずれか一項に記載の装置。
- 前記第1の帯域幅拡張器は、前記拡張された第1の部分の少なくとも一部を位相シフトするための第1の粗さ低減フィルタを含み、前記第2の帯域幅拡張器は、前記拡張された第2の部分の少なくとも一部を位相シフトするための第2の粗さ低減フィルタを含む、請求項1から7のいずれか一項に記載の装置。
- 前記第1の粗さ低減フィルタは、第1の位相シフト信号を得るように前記第1の拡張部分またはその派生信号を位相シフトするために構成され、
前記第2の粗さ低減フィルタは、第2の位相シフト信号を得るように前記第2の拡張部分またはその派生信号を位相シフトするために構成されている、請求項8に記載の装置。 - 前記第1の粗さ低減フィルタは第1の位相シフトを適用するために構成され、前記第2の粗さ低減フィルタは第2の位相シフトを適用するために構成されている、請求項8または9に記載の装置。
- 前記装置は、前記スペクトルを、分解された部分が組み合わされたとき前記スペクトルを形成するように分解するものであり、
前記第1の信号特性は
a)前記スペクトルの中周波数範囲
b)前記音響信号の直接信号特性
c)前記音響信号の過渡特性
d)前記音響信号の音声特性
e)前記音響信号のトーン特性
のうちの1つであり、前記第1の信号特性のa)からe)について、前記第2の信号特性は、それぞれ
a)前記スペクトルのサイド周波数範囲
b)前記音響信号の周囲信号特性
c)前記音響信号の持続信号特性、
d)前記音響信号の非音声特性、および
e)前記音響信号の非トーン信号特性
のうちの1つである、請求項1から10のいずれか一項に記載の装置。 - 前記第1の信号特性または前記第2の信号特性は
a)ミッドサイド信号分解に基づく
b)前記音響信号の直接信号特性
c)前記音響信号のトーン特性
d)前記音響信号の過渡特性
e)前記音響信号の音声特性
のうちの1つであり、前記第1の信号特性のa)からe)について、前記第2の信号特性を有する部分は、入力信号と、a)からe)までの前記第1の信号特性を有する部分との差からの残りの信号である、請求項1から10のいずれか一項に記載の装置。 - 前記装置は、対応する複数の信号修正パラメータに関連する複数の第1のパラメータと、対応する複数の信号修正パラメータに関連する複数の第2のパラメータと、を含むルックアップテーブルを含み、前記装置は、前記音響信号に適用される修正について前記スペクトルを分析するための信号分析器を含み、前記装置は、前記修正に関連する修正パラメータを導出するため、および前記ルックアップテーブルを用いて、および前記修正パラメータを用いて、前記第1のパラメータおよび前記第2のパラメータを導出するために構成されており、前記装置は、前記スペクトルの傾斜の峻度を修正パラメータとして導出するために構成されている、請求項1から12のいずれか一項に記載の装置。
- スペクトル差関数を用いて前記スペクトルを分析するために構成されている、請求項13に記載の装置。
- 前記セパレータは、
前記音響信号を受信するため、および第1の修正音響信号を得るように前記音響信号における過渡部分を低減するために構成された過渡抑制器であって、前記セパレータは、前記第1の修正音響信号に基づいて前記第1の部分を得るために構成されている、過渡抑制器と、
第2の修正音響信号を得るように前記音響信号から前記第1の修正音響信号を減算するための減算器であって、前記セパレータは、前記第2の修正音響信号に基づいて前記第2の部分を得るために構成されている、減算器と、
を含む、請求項1から14のいずれか一項に記載の装置。 - 前記合成器は第1の合成器であり、前記装置は、
前記第1の拡張部分および前記第2の拡張部分をフィルタリングするため、またはフィルタリングされた合成音響信号が得られるように前記合成音響信号をフィルタリングするためのハイパスフィルタと、
フィルタリングされた音響信号を得るように前記音響信号をフィルタリングするためのローパスフィルタと、
帯域幅拡張音響信号を得るため、前記フィルタリングされた合成音響信号と前記フィルタリングされた音響信号とを合成するために構成された第2の合成器と、
を含む、請求項1から15のいずれか一項に記載の装置。 - 音響信号を処理するための方法であって、
前記音響信号のスペクトルの第1の部分を前記音響信号の前記スペクトルの第2の部分から分離するステップであって、前記第1の部分は第1の信号特性を有し、前記第2の部分は第2の信号特性を有する、ステップと、
第1の拡張部分を得るため、前記第1の信号特性に関連する第1のパラメータを用いて前記第1の部分の帯域幅を拡張するステップと、
第2の拡張部分を得るため、前記第2の信号特性に関連する第2のパラメータを用いて前記第2の部分の帯域幅を拡張するステップと、
拡張合成音響信号を得るため、前記第1の拡張部分および前記第2の拡張部分を用いるステップと、
を含み、
前記音響信号は複数のフレームを含み、前記方法は、各フレームについて、音響信号が前記音響信号の人為的帯域幅制限を受けたことを示す特性について前記音響信号の前記スペクトルを分析し、前記音響信号におけるカットオフ周波数を決定し、前記音響信号が前記音響信号の前記人為的帯域幅制限を受けたことを示す特性を有するフレームである、と判定されたフレームに対して、前記第1のパラメータおよび前記第2のパラメータを用い、前記フレームは、前記音響信号が前記音響信号の人為的帯域制限を受けたことを示す特性を有し、人為的帯域幅制限に関する前記特性とは異なる特性を有するフレームについて、第1の帯域幅拡張器について第3のパラメータを、第2の帯域幅拡張器について第4のパラメータを用いる、
方法。 - 音響信号を処理するための方法であって、
前記音響信号のスペクトルの第1の部分を前記音響信号の前記スペクトルの第2の部分から分離するステップであって、前記第1の部分は第1の信号特性を有し、前記第2の部分は第2の信号特性を有する、ステップと、
第1の拡張部分を得るため、前記第1の信号特性に関連する第1のパラメータを用いて前記第1の部分の帯域幅を拡張するステップと、
第2の拡張部分を得るため、前記第2の信号特性に関連する第2のパラメータを用いて前記第2の部分の帯域幅を拡張するステップと、
拡張合成音響信号を得るため、前記第1の拡張部分および前記第2の拡張部分を用いるステップと、
を含み、
前記方法は、前記音響信号に適用される修正について前記スペクトルを分析し、前記修正に関連する修正パラメータを導出し、ルックアップテーブルを用いて、および前記修正パラメータを用いて、前記第1のパラメータおよび前記第2のパラメータを導出し、前記ルックアップテーブルは、対応する複数の信号修正パラメータに関連する複数の第1のパラメータと、対応する複数の信号修正パラメータに関連する複数の第2のパラメータと、を含む、
方法。 - コンピュータ上で動いているとき、請求項17または18に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムを格納している非一時的記憶媒体。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17164360.4 | 2017-03-31 | ||
EP17164360 | 2017-03-31 | ||
EP17189992.5A EP3382702A1 (en) | 2017-03-31 | 2017-09-07 | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
EP17189992.5 | 2017-09-07 | ||
JP2019553537A JP7059301B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
PCT/EP2018/025081 WO2018177610A1 (en) | 2017-03-31 | 2018-03-29 | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019553537A Division JP7059301B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022097514A JP2022097514A (ja) | 2022-06-30 |
JP7455890B2 true JP7455890B2 (ja) | 2024-03-26 |
Family
ID=58632740
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019553537A Active JP7059301B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
JP2019553539A Active JP6896881B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号のスペクトル強調処理に関する所定の特性を決定するための装置および方法 |
JP2019553448A Active JP6968191B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号を処理するための装置および方法 |
JP2022066339A Active JP7455890B2 (ja) | 2017-03-31 | 2022-04-13 | 音響信号を処理する装置および方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019553537A Active JP7059301B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号の人為的帯域幅制限処理に関する所定の特性を決定するための装置および方法 |
JP2019553539A Active JP6896881B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号のスペクトル強調処理に関する所定の特性を決定するための装置および方法 |
JP2019553448A Active JP6968191B2 (ja) | 2017-03-31 | 2018-03-29 | 音響信号を処理するための装置および方法 |
Country Status (13)
Country | Link |
---|---|
US (3) | US20200020347A1 (ja) |
EP (6) | EP3382704A1 (ja) |
JP (4) | JP7059301B2 (ja) |
KR (3) | KR102426636B1 (ja) |
CN (3) | CN110832582B (ja) |
AU (4) | AU2018246838A1 (ja) |
BR (3) | BR112019020523A2 (ja) |
CA (3) | CA3057897C (ja) |
ES (3) | ES2927808T3 (ja) |
MX (3) | MX2019011519A (ja) |
PL (3) | PL3602552T3 (ja) |
RU (3) | RU2733278C1 (ja) |
WO (3) | WO2018177611A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114467139A (zh) | 2019-09-24 | 2022-05-10 | 索尼集团公司 | 信号处理装置、信号处理方法和程序 |
CN112927710B (zh) * | 2021-01-21 | 2021-10-26 | 安徽南瑞继远电网技术有限公司 | 一种基于无监督方式的电力变压器工况噪声分离方法 |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN115472171A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
CN115512711A (zh) * | 2021-06-22 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 语音编码、语音解码方法、装置、计算机设备和存储介质 |
US20230110255A1 (en) * | 2021-10-12 | 2023-04-13 | Zoom Video Communications, Inc. | Audio super resolution |
CN114070679B (zh) * | 2021-10-25 | 2023-05-23 | 中国电子科技集团公司第二十九研究所 | 一种面向脉冲智能分类的频相特征分析方法 |
CN114677340B (zh) * | 2022-03-14 | 2024-05-24 | 上海第二工业大学 | 一种基于图像边缘的混凝土表面粗糙度的检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011075728A (ja) | 2009-09-29 | 2011-04-14 | Oki Electric Industry Co Ltd | 音声帯域拡張装置および音声帯域拡張プログラム |
JP2017507348A (ja) | 2014-01-07 | 2017-03-16 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | 圧縮済みオーディオ信号の信号品質ベース強調及び補償 |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5914986A (en) | 1994-11-30 | 1999-06-22 | Matsushita Electric Industrial Co., Ltd. | Receiving circuit |
JP4230414B2 (ja) * | 1997-12-08 | 2009-02-25 | 三菱電機株式会社 | 音信号加工方法及び音信号加工装置 |
US7272551B2 (en) * | 2003-02-24 | 2007-09-18 | International Business Machines Corporation | Computational effectiveness enhancement of frequency domain pitch estimators |
JP4679049B2 (ja) * | 2003-09-30 | 2011-04-27 | パナソニック株式会社 | スケーラブル復号化装置 |
KR100552693B1 (ko) * | 2003-10-25 | 2006-02-20 | 삼성전자주식회사 | 피치검출방법 및 장치 |
EP1638083B1 (en) * | 2004-09-17 | 2009-04-22 | Harman Becker Automotive Systems GmbH | Bandwidth extension of bandlimited audio signals |
CN102103860B (zh) * | 2004-09-17 | 2013-05-08 | 松下电器产业株式会社 | 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法 |
EP1926083A4 (en) * | 2005-09-30 | 2011-01-26 | Panasonic Corp | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
US8073704B2 (en) | 2006-01-24 | 2011-12-06 | Panasonic Corporation | Conversion device |
US8798172B2 (en) * | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
US7881459B2 (en) * | 2007-08-15 | 2011-02-01 | Motorola, Inc. | Acoustic echo canceller using multi-band nonlinear processing |
WO2009029037A1 (en) * | 2007-08-27 | 2009-03-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8005233B2 (en) * | 2007-12-10 | 2011-08-23 | Dts, Inc. | Bass enhancement for audio |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
MY150373A (en) * | 2008-07-11 | 2013-12-31 | Fraunhofer Ges Forschung | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
EP2410521B1 (en) | 2008-07-11 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, method for generating an audio signal and computer program |
RU2519069C2 (ru) | 2008-07-11 | 2014-06-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство аудио кодирования, устройство аудио декодирования, методы кодирования и декодирования аудио-сигнала, аудио поток и компьютерная программа |
EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
ES2951163T3 (es) * | 2008-12-15 | 2023-10-18 | Fraunhofer Ges Forschung | Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
US8447617B2 (en) * | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
TWI444989B (zh) * | 2010-01-22 | 2014-07-11 | Dolby Lab Licensing Corp | 針對改良多通道上混使用多通道解相關之技術 |
AU2016204672B2 (en) * | 2010-07-02 | 2016-08-18 | Dolby International Ab | Audio encoder and decoder with multiple coding modes |
JP5775582B2 (ja) * | 2010-08-25 | 2015-09-09 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 結合ユニットとミキサーとを用いて過渡を含む信号を復号化する装置 |
EP3182409B1 (en) | 2011-02-03 | 2018-03-14 | Telefonaktiebolaget LM Ericsson (publ) | Determining the inter-channel time difference of a multi-channel audio signal |
AR085362A1 (es) * | 2011-02-14 | 2013-09-25 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral |
WO2012119140A2 (en) | 2011-03-03 | 2012-09-07 | Edwards Tyson Lavar | System for autononous detection and separation of common elements within data, and methods and devices associated therewith |
WO2012158333A1 (en) * | 2011-05-19 | 2012-11-22 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
US9311923B2 (en) * | 2011-05-19 | 2016-04-12 | Dolby Laboratories Licensing Corporation | Adaptive audio processing based on forensic detection of media processing history |
EP2544465A1 (en) * | 2011-07-05 | 2013-01-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator |
WO2013108343A1 (ja) * | 2012-01-20 | 2013-07-25 | パナソニック株式会社 | 音声復号装置及び音声復号方法 |
US9685921B2 (en) | 2012-07-12 | 2017-06-20 | Dts, Inc. | Loudness control with noise detection and loudness drop detection |
ES2549953T3 (es) | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
EP3070713B1 (en) * | 2013-01-29 | 2018-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
US9601125B2 (en) | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US20160322066A1 (en) * | 2013-02-12 | 2016-11-03 | Google Inc. | Audio Data Classification |
CA2916121C (en) | 2013-06-21 | 2019-01-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Jitter buffer control, audio decoder, method and computer program |
FR3007563A1 (fr) | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
KR101779731B1 (ko) * | 2013-10-03 | 2017-09-18 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 업믹서에서의 적응적 확산 신호 생성 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
JP6668372B2 (ja) * | 2015-02-26 | 2020-03-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法 |
US9741360B1 (en) * | 2016-10-09 | 2017-08-22 | Spectimbre Inc. | Speech enhancement for target speakers |
US20190051286A1 (en) | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
-
2017
- 2017-09-07 EP EP17189988.3A patent/EP3382704A1/en not_active Withdrawn
- 2017-09-07 EP EP17189992.5A patent/EP3382702A1/en not_active Withdrawn
- 2017-09-07 EP EP17189999.0A patent/EP3382703A1/en not_active Withdrawn
-
2018
- 2018-03-29 CN CN201880036527.6A patent/CN110832582B/zh active Active
- 2018-03-29 RU RU2019134729A patent/RU2733278C1/ru active
- 2018-03-29 KR KR1020197032022A patent/KR102426636B1/ko active IP Right Grant
- 2018-03-29 CN CN201880036538.4A patent/CN110870007B/zh active Active
- 2018-03-29 MX MX2019011519A patent/MX2019011519A/es unknown
- 2018-03-29 WO PCT/EP2018/025082 patent/WO2018177611A1/en active Application Filing
- 2018-03-29 CA CA3057897A patent/CA3057897C/en active Active
- 2018-03-29 CN CN201880036584.4A patent/CN110914902B/zh active Active
- 2018-03-29 ES ES18714686T patent/ES2927808T3/es active Active
- 2018-03-29 BR BR112019020523A patent/BR112019020523A2/pt unknown
- 2018-03-29 CA CA3058353A patent/CA3058353C/en active Active
- 2018-03-29 RU RU2019134727A patent/RU2719543C1/ru active
- 2018-03-29 PL PL18714686.5T patent/PL3602552T3/pl unknown
- 2018-03-29 PL PL18714688.1T patent/PL3602555T3/pl unknown
- 2018-03-29 AU AU2018246838A patent/AU2018246838A1/en not_active Abandoned
- 2018-03-29 CA CA3057739A patent/CA3057739A1/en active Pending
- 2018-03-29 EP EP18714688.1A patent/EP3602555B8/en active Active
- 2018-03-29 MX MX2019011515A patent/MX2019011515A/es unknown
- 2018-03-29 JP JP2019553537A patent/JP7059301B2/ja active Active
- 2018-03-29 ES ES18714687T patent/ES2923098T3/es active Active
- 2018-03-29 AU AU2018241963A patent/AU2018241963B2/en active Active
- 2018-03-29 JP JP2019553539A patent/JP6896881B2/ja active Active
- 2018-03-29 WO PCT/EP2018/025081 patent/WO2018177610A1/en active Application Filing
- 2018-03-29 PL PL18714687.3T patent/PL3602553T3/pl unknown
- 2018-03-29 AU AU2018246837A patent/AU2018246837B2/en active Active
- 2018-03-29 KR KR1020197032020A patent/KR102517285B1/ko active IP Right Grant
- 2018-03-29 BR BR112019020578A patent/BR112019020578A2/pt unknown
- 2018-03-29 ES ES18714688T patent/ES2933500T3/es active Active
- 2018-03-29 KR KR1020197032021A patent/KR102563915B1/ko active IP Right Grant
- 2018-03-29 JP JP2019553448A patent/JP6968191B2/ja active Active
- 2018-03-29 RU RU2019134610A patent/RU2733533C1/ru active
- 2018-03-29 WO PCT/EP2018/025083 patent/WO2018177612A1/en active Application Filing
- 2018-03-29 EP EP18714687.3A patent/EP3602553B8/en active Active
- 2018-03-29 BR BR112019020357A patent/BR112019020357A2/pt active Search and Examination
- 2018-03-29 MX MX2019011522A patent/MX2019011522A/es unknown
- 2018-03-29 EP EP18714686.5A patent/EP3602552B1/en active Active
-
2019
- 2019-09-24 US US16/580,116 patent/US20200020347A1/en active Pending
- 2019-09-25 US US16/582,165 patent/US12067995B2/en active Active
- 2019-09-27 US US16/586,424 patent/US11170794B2/en active Active
-
2021
- 2021-06-04 AU AU2021203677A patent/AU2021203677B2/en active Active
-
2022
- 2022-04-13 JP JP2022066339A patent/JP7455890B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011075728A (ja) | 2009-09-29 | 2011-04-14 | Oki Electric Industry Co Ltd | 音声帯域拡張装置および音声帯域拡張プログラム |
JP2017507348A (ja) | 2014-01-07 | 2017-03-16 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | 圧縮済みオーディオ信号の信号品質ベース強調及び補償 |
Non-Patent Citations (1)
Title |
---|
LAITINEN, Mikko-Ville et al.,Phase Derivative Correction of Bandwidth-Extended Signals for Perceptual Audio Codecs,AES 140th Convention,2016年05月26日,pages 1-8 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7455890B2 (ja) | 音響信号を処理する装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230626 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7455890 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |