JP2013522658A - サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム - Google Patents
サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2013522658A JP2013522658A JP2012556505A JP2012556505A JP2013522658A JP 2013522658 A JP2013522658 A JP 2013522658A JP 2012556505 A JP2012556505 A JP 2012556505A JP 2012556505 A JP2012556505 A JP 2012556505A JP 2013522658 A JP2013522658 A JP 2013522658A
- Authority
- JP
- Japan
- Prior art keywords
- time warp
- audio signal
- warp
- encoded
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005070 sampling Methods 0.000 title claims abstract description 259
- 230000005236 sound signal Effects 0.000 title claims abstract description 240
- 238000000034 method Methods 0.000 title claims description 44
- 238000004590 computer program Methods 0.000 title claims description 13
- 230000001419 dependent effect Effects 0.000 title description 6
- 238000013507 mapping Methods 0.000 claims abstract description 142
- 238000004364 calculation method Methods 0.000 claims abstract description 52
- 230000003595 spectral effect Effects 0.000 claims abstract description 45
- 230000008859 change Effects 0.000 claims description 45
- 238000001228 spectrum Methods 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 2
- 239000004020 conductor Substances 0.000 claims 1
- 230000006870 function Effects 0.000 description 45
- 230000007704 transition Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 30
- 238000012952 Resampling Methods 0.000 description 27
- 230000003044 adaptive effect Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 11
- 230000006978 adaptation Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【選択図】図2
Description
図1は、本発明の一実施の形態によるタイムワープオーディオ信号符号化器100のブロック模式図を示す。
2. 図2によるタイムワープオーディオ信号復号器
図2は、本発明の一実施の形態によるタイムワープオーディオ信号復号器200のブロック模式図を示す。
3.図3aによるタイムワープオーディオ信号符号化器
図3aは、本発明の一実施の形態によるタイムワープオーディオ信号符号化器300のブロック模式図を示す。
4.図3bによるタイムワープオーディオ信号復号器
図3bは、本発明の一実施形態によるオーディオ信号復号器350のブロック模式図を示す。
5.タイムワープ符号化および復号の適合
5.1.概念の概要
以下に、符号化されるオーディオ信号または復号されるオーディオ信号のサンプリング周波数に応じたタイムワープ符号化および復号の適合に関する詳細について説明する。換言すれば、サンプリング周波数依存型ピッチ変動量子化について説明する。理解を容易にするため、いくつかの従来の概念についてまず説明する。
5.2.図4aによる実施例
図4aは、本発明による実施形態において使用され得る適合型マッピング400のブロック模式図を示す。
5.3.図4bによる実施例
図4bは、本発明による実施形態において使用され得る適合型マッピング450のブロック模式図を示す。例えば、適合型マッピング450は、オーディオ信号復号器200におけるマッピング234またはオーディオ信号復号器350におけるマッピング234の代わりとなり得る。適合型マッピング450は、符号化されたタイムワープ情報を受信するように構成されている(ここで、適合型マッピング400に関する上記の説明が適用される)。
6.タイムワープ制御情報の計算についての詳細な説明
以下に、タイムワープコンター変遷情報に基づいたタイムワープ制御情報の計算に関する詳細について説明する。
6.1.図5aおよび図5bによる装置
図5aおよび図5bは、タイムワープコンター変遷情報510に基づいてタイムワープ制御情報512を提供するための装置500のブロック模式図を示し、タイムワープコンター変遷情報510は、復号されたタイムワープ情報であってもよく、また、例えば、タイムワープ計算部230のマッピング234によって提供される復号されたタイムワープ値を含んでいてもよい。装置500は、復元されたタイムワープコンター情報522をタイムワープコンター変遷情報510に基づいて提供するための手段520と、復元されたタイムワープコンター情報522に基づいてタイムワープ制御情報512を提供するためのタイムワープ制御情報計算部530とを備える。
6.2.図6aおよび図6bによる機能説明
以下に、手段520およびタイムワープ制御情報計算部530を備えるオーディオ復号器の機能について図6aおよび図6bを参照して説明する。
7.アルゴリズムの詳細な説明
7.1.概要
以下に、本発明の一実施形態によるオーディオ復号器によって実行されるアルゴリズムのいくつかについて詳細に説明する。この目的で、図5a、図5b、図6a、図6b、図7a、図7b、図8、図9、図10a、図10b、図11、図12、図13、図14、図15および図16を参照されたい。
7.2.定義
データ要素、ヘルプ要素および定数の定義に関しては、図7aおよび図7bを参照されたい。
7.3.復号処理-ワープコンター
ワープコンターノードのコードブックインデックスは、個々のノードの値をワーピングするために以下のように復号される。
ワープコンター「warp_contour[]」から、線形時間スケールでのワープされたサンプルのサンプル位置のベクトルを計算する。このために、以下の式に従ってタイムワープコンターを生成する。
7.5.復号処理−逆修正離散コサイン変換(IMDCT)
以下に、逆修正離散コサイン変換について簡単に説明する。
7.6.復号処理−窓関数処理およびブロック切り替え
以下に、ワープ復号部240により、具体的には、その窓関数処理部240eにより実行され得る窓関数処理およびブロック切り替えについて説明する。
7.7. 復号処理−時変再サンプリング
以下に、ワープ復号部240により、具体的には、その再サンプリング部240gにより実行され得る時変再サンプリングについて説明する。
7.8.復号処理−以前の窓シーケンスによる重複加算
ワープ復号部240の重複器/加算器240jによって実行される重複加算は、全てのシーケンスについて同様であり、以下のように数学的に記述することができる。
以下に、メモリ更新について説明する。図3dでは特定の手段は示されていないが、メモリ更新はワープ復号部240によって実行され得るという点に留意されたい。
上記を要約すると、ワープ復号部240によって実行され得る復号処理について説明した。例えば、2048個の時間領域サンプルからなるオーディオフレームについての時間領域表現が提供され、連続するオーディオフレームは、例えば、約50%重複し得るため、連続するオーディオフレームの時間領域表現間の平滑な遷移が確実に実現されることが理解される。
8.図17a〜図17fによるオーディオストリーム
以下に、1つ以上のオーディオ信号チャネルおよび1つ以上のタイムワープコンターの符号化された表現を含むオーディオストリームについて説明する。以下に説明するオーディオストリームは、例えば、符号化されたオーディオ信号表現112または符号化されたオーディオ信号表現210を運ぶことができる。
また、チャネル対要素は、例えば、設定データストリーム要素または「USAC_raw_data_block」において送信することができ、また、タイムワープ情報をチャネル対要素に含めるか否かを決定するタイムワープ起動フラグ(「tw_MDCT」)といったタイムワープ情報を含み得る。例えば、「tw_MDCT」フラグがタイムワープがアクティブであることを示す場合、チャネル対要素は、チャネル対要素のオーディオチャネルについて共通のタイムワープが存在するか否かを示すフラグ(「common_tw」)を含み得る。当該フラグ(「common_tw」)が多数のオーディオチャネルについて共通のタイムワープが存在することを示す場合、共通のタイムワープ情報(「tw_data」)を、例えば、周波数領域チャネルストリームとは別に、チャネル対要素に含める。
図17dから理解されるように、周波数領域チャネルストリームは、例えば、グローバルゲイン情報を含む。また、周波数領域チャネルストリームは、タイムワーピングがアクティブであり(フラグ「tw_MDCT」がアクティブであり)、多数のオーディオ信号チャネルについて共通のタイムワープ情報が存在しない(フラグ「common_tw」が非アクティブである)場合、タイムワープデータを含む。
タイムワープデータは、例えば、タイムワープデータが存在しているか否かを示すフラグ(例えば、「tw_data_present」または「active_pitch_data」)を任意には含み得る。タイムワープデータが存在している(すなわち、タイムワープコンターが平坦でない)場合、タイムワープデータは、例えば、上述のようにサンプリングレート依存型コードブックテーブルに従って符号化され得る複数の符号化されたタイムワープ比の値(例えば、「tw_ratio[i]」または「pitch Idx[i]」)のシーケンスを含み得る。
9.結論
上記を要約すると、タイムワープ型修正離散コサイン変換(TW−MDCT)に関する改良について述べた。上述の本発明は、タイムワープ型MDCT変換コーダに関連するものであり、ワープ型MDCT変換コーダの性能を向上させるための方法を実現する。タイムワープ型修正離散コサイン変換に関する詳細について、読者は、参考文献[1]および[2]を注目されたい。
10.代替実施例
いくつかの態様を装置との関連で説明したが、これらの態様は対応する方法も示していることは明らかであり、方法においては、ブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップとの関連で説明した態様もまた、対応するブロックもしくは項目または対応する装置の特徴を示すものである。例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路といったハードウェア装置によって(またはこれを用いて)、方法ステップの一部またはすべてを実行してもよい。いくつかの実施形態では、最も重要な方法ステップのうち任意の1つ以上をこのような装置によって実行してもよい。
参考文献
[1] Bernd Edler et. al., “Time Warped MDCT”, US61/042,314, 仮特許出願。
[2] L. Villemoes, “Time Warped Transform Coding of Audio Signals”,
PCT/EP2006/010246, 国際特許出願(2005年11月)
[3] “WD6 of USAC”, ISO/IEC JTC1/SC29/WG11 N11213, 2010
[4] Bernd Edler et. al., “A Time-Warped MDCT Approach to Speech Transform Coding”, 126th AES Convention, Munich, May 2009, preprint 7710
[5] Nikolaus Meine, “Vektorquantisierung und kontextabhaengige arithmetische Codierung fuer MPEG-4 AAC”, VDI, Hannover, 2007
Claims (16)
- サンプリング周波数情報(218)と、符号化されたタイムワープ情報(216,tw_ratio[i])と、符号化されたスペクトル表現(214,ac_spectral_data())とを含む符号化されたオーディオ信号表現(112,210)に基づいて、 復号されたオーディオ信号表現(212)を提供するオーディオ信号復号器(200;350)であって、
前記符号化されたタイムワープ情報(216,tw_ratio[i])を復号されたタイムワープ情報(232,warp_value_tbl[tw_ratio],prel)にマッピングするタイムワープ計算部(230,604)であって、前記符号化されたタイムワープ情報(216)のコードワード(tw_ratio[i],インデックス)を前記復号されたタイムワープ情報(232)を示す復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)にマッピングするためのマッピング規則を前記サンプリング周波数情報(218)に応じて適合させるタイムワープ計算部(230,604)と、
前記符号化されたスペクトル表現(214,ac_spectral_data())に基づき、かつ、前記復号されたタイムワープ情報(232)に応じて、前記復号されたオーディオ信号表現(212)を提供するワープ復号部(240)と、
を備えるオーディオ信号復号器(200;350)。 - 前記符号化されたタイムワープ情報(216)の前記コードワード(tw_ratio[i],インデックス)は、タイムワープコンター(time_contour[])の時間的変化を示し、
前記タイムワープ計算部(230,604)は、前記符号化されたタイムワープ情報(216)の所定数(Num_tw_nodes)のコードワード(tw_ratio[i],インデックス)を、前記符号化されたオーディオ信号表現(214,ac_spectral_data())によって表される符号化されたオーディオ信号のオーディオフレームについて評価するように構成され、コードワードの前記所定数は、前記符号化されたオーディオ信号のサンプリング周波数に依存しない、
請求項1に記載のオーディオ信号復号器。 - 前記タイムワープ計算部(230)は、前記符号化されたタイムワープ情報(216)のコードワード(tw_ratio[i],インデックス)の所与の集合がマッピングされる復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)の範囲が、第2のサンプリング周波数についてよりも第1のサンプリング周波数について大きくなるように、前記マッピング規則を適合させるよう構成されており、
前記第1のサンプリング周波数は、前記第2のサンプリング周波数よりも小さい、
請求項1または2に記載のオーディオ信号復号器。 - 前記復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)は、タイムワープコンターの値を表すタイムワープコンター値、またはタイムワープコンター(time_contour[])の値の絶対的な変化もしくは相対的な変化を表すタイムワープコンター変動値である、
請求項3に記載のオーディオ信号復号器。 - 前記タイムワープ計算部(230)は、前記符号化されたタイムワープ情報(216)のコードワード(tw_ratio[i],インデックス)の所与の集合によって表現可能な、前記符号化されたオーディオ信号表現(112;210)によって表される符号化されたオーディオ信号の所与の数のサンプルにわたるピッチの最大変化が、第2のサンプリング周波数についてよりも第1のサンプリング周波数について大きくなるように、前記マッピング規則を適合させるよう構成されており、
前記第1のサンプリング周波数は前記第2のサンプリング周波数よりも小さい、
請求項1から4のいずれかに記載のオーディオ信号復号器。 - 前記タイムワープ計算部(230)は、第1のサンプリング周波数における前記符号化されたタイムワープ情報(216)のコードワード(tw_ratio[i],インデックス)の所与の集合によって表現可能な、所与の期間にわたるピッチの最大変化が、第2のサンプリング周波数における前記符号化されたタイムワープ情報のコードワードの前記所与の集合によって表現可能な、前記所与の期間にわたるピッチの最大変化と、第1のサンプリング周波数については10%未満しか異ならず、第2のサンプリング周波数については少なくとも30%異なるように、前記マッピング規則を適合させるよう構成されている、
請求項1から5のいずれかに記載のオーディオ信号復号器。 - 前記タイムワープ計算部(230)は、前記サンプリング周波数情報(218)に応じて、前記符号化されたタイムワープ情報(216)のコードワード(tw_ratio[i],インデックス)を復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)にマッピングするための異なるマッピングテーブル(480,484;480,486)を使用するように構成されている、
請求項1から6のいずれかに記載のオーディオ信号復号器。 - 前記タイムワープ計算部は、基準サンプリング周波数(fs,ref)について前記符号化されたタイムワープ情報(216)の異なるコードワード(tw_ratio[i],490,インデックス)に対応付けられた復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)を示す基準マッピング値(494)を、前記基準サンプリング周波数(fs)とは異なる実際のサンプリング周波数(fs)に適合させて、適合されたマッピング値(496)を取得するように構成されている、
請求項1から6のいずれかに記載のオーディオ信号復号器。 - 前記タイムワープ計算部は、タイムワープを示す前記基準マッピング値(494)の部分を、前記実際のサンプリング周波数(fs)と前記基準サンプリング周波数(fs,ref)との比に応じてスケーリングするように構成されている、
請求項8に記載のオーディオ信号復号器。 - 前記復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)は、前記符号化されたオーディオ信号表現(210)によって表される前記符号化されたオーディオ信号の所定数のサンプルにわたるタイムワープコンターの変動を示し、
前記オーディオ信号復号器は、サンプリング位置計算部を備え、該サンプリング位置計算部は、前記タイムワープコンターの変動を表す複数の復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)を組み合わせて、ワープコンターノード値(warp_node_values[])を導出し、該導出されたワープコンターノード値の基準ワープノード値からの偏差が、前記復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)のうちの1つによって表現可能な偏差よりも大きくなるようにするよう構成されている、
請求項1から9のいずれかに記載のオーディオ信号復号器。 - 前記復号されたタイムワープ値(warp_value_tbl[tw_ratio],prel)は、前記符号化されたオーディオ信号表現(210)によって表される前記符号化されたオーディオ信号の所定数のサンプルにわたるタイムワープコンターの相対的な変化を示し、
前記オーディオ信号復号器は、前記復号されたタイムワープ値からタイムワープコンター情報を導出するように構成されたサンプリング位置計算部を備える、
請求項1から10のいずれかに記載のオーディオ信号復号器。 - 前記オーディオ信号復号器は、前記復号されたタイムワープ値(warp_value_tbl[tw_ratio])に基づいてタイムワープコンターの支持点(サポーティング・ポイント)(warp_node_values[])を計算するように構成されたサンプリング位置計算部(240k)を備え、
前記サンプリング位置計算部は、前記支持点間を補間して、前記タイムワープコンター(time_contour[])を取得するように構成され、
1オーディオフレーム当たりの復号されたタイムワープ値の数は、前記サンプリング周波数に依存しない、
請求項1から11のいずれかに記載のオーディオ信号復号器。 - オーディオ信号(110)の符号化された表現(112)を提供するためのオーディオ信号符号化器(100;300)であって、
タイムワープコンターを示すタイムワープ値(prel)を符号化されたタイムワープ情報(132)にマッピングするように構成されたタイムワープコンター符号化部(130)であって、前記タイムワープコンターを示す前記タイムワープ値(prel)を前記符号化されたタイムワープ情報(132)のコードワード(tw_ratio[i],インデックス)にマッピングするためのマッピング規則(134)を前記オーディオ信号(110)のサンプリング周波数(fs)に応じて適合させるように構成されたタイムワープコンター符号化部(130)と、
前記オーディオ信号のスペクトルの符号化された表現(142)を、前記タイムワープコンター情報(122)によって示されるタイムワープを考慮して取得するように構成されたタイムワーピング信号符号化部(140)であって、前記オーディオ信号(110)の前記符号化された表現(112)が、前記符号化されたタイムワープ情報(132)の前記コードワード(tw_ratio[i],インデックス)、前記スペクトルの前記符号化された表現(142)、および前記サンプリング周波数を示すサンプリング周波数情報(152)を含むタイムワーピング信号符号化部(140)と、
を備えるオーディオ信号符号化器(100;300)。 - 復号されたオーディオ信号表現を、サンプリング周波数情報と、符号化されたタイムワープ情報と、符号化されたスペクトル表現とを含む符号化されたオーディオ信号表現に基づいて提供するための方法であって、
前記符号化されたタイムワープ情報を復号されたタイムワープ情報にマッピングするステップであって、前記符号化されたタイムワープ情報のコードワードを前記復号されたタイムワープ情報を示す復号されたタイムワープ値にマッピングするためのマッピング規則を前記サンプリング周波数情報に応じて適合させるステップと、
前記復号されたオーディオ信号表現を、前記符号化されたスペクトル表現に基づいてかつ前記復号されたタイムワープ情報に応じて提供するステップと
を含む方法。 - オーディオ信号の符号化された表現を提供するための方法であって、
タイムワープコンターを示すタイムワープ値を符号化されたタイムワープ情報にマッピングするステップであって、前記タイムワープコンターを示す前記タイムワープ値を前記符号化されたタイムワープ情報のコードワードにマッピングするためのマッピング規則を前記オーディオ信号のサンプリング周波数に応じて適合させるステップと、
前記オーディオ信号のスペクトルの符号化された表現を、前記タイムワープコンター情報によって示されるタイムワープを考慮して取得するステップであって、前記オーディオ信号の前記符号化された表現が、前記符号化されたタイムワープ情報の前記コードワード、前記スペクトルの前記符号化された表現、および前記サンプリング周波数を示すサンプリング周波数情報を含むステップと、
を含む方法。 - コンピュータ上で実行されたときに、請求項14または15に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31250310P | 2010-03-10 | 2010-03-10 | |
US61/312,503 | 2010-03-10 | ||
PCT/EP2011/053538 WO2011110591A1 (en) | 2010-03-10 | 2011-03-09 | Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013522658A true JP2013522658A (ja) | 2013-06-13 |
JP5456914B2 JP5456914B2 (ja) | 2014-04-02 |
Family
ID=43829343
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012556506A Active JP5625076B2 (ja) | 2010-03-10 | 2011-03-09 | コーディングコンテキストのピッチ依存適合を用いた、オーディオ信号復号器、オーディオ信号符号化器、オーディオ信号を復号するための方法、オーディオ信号を符号化するための方法、およびコンピュータプログラム |
JP2012556505A Active JP5456914B2 (ja) | 2010-03-10 | 2011-03-09 | サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012556506A Active JP5625076B2 (ja) | 2010-03-10 | 2011-03-09 | コーディングコンテキストのピッチ依存適合を用いた、オーディオ信号復号器、オーディオ信号符号化器、オーディオ信号を復号するための方法、オーディオ信号を符号化するための方法、およびコンピュータプログラム |
Country Status (16)
Country | Link |
---|---|
US (2) | US9129597B2 (ja) |
EP (2) | EP2539893B1 (ja) |
JP (2) | JP5625076B2 (ja) |
KR (2) | KR101445294B1 (ja) |
CN (2) | CN102884573B (ja) |
AR (2) | AR080396A1 (ja) |
AU (2) | AU2011226143B9 (ja) |
BR (2) | BR112012022744B1 (ja) |
CA (2) | CA2792500C (ja) |
ES (2) | ES2461183T3 (ja) |
HK (2) | HK1179743A1 (ja) |
MX (2) | MX2012010469A (ja) |
PL (2) | PL2532001T3 (ja) |
RU (2) | RU2607264C2 (ja) |
TW (2) | TWI455113B (ja) |
WO (2) | WO2011110594A1 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2083418A1 (en) * | 2008-01-24 | 2009-07-29 | Deutsche Thomson OHG | Method and Apparatus for determining and using the sampling frequency for decoding watermark information embedded in a received signal sampled with an original sampling frequency at encoder side |
US8831933B2 (en) | 2010-07-30 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN103035249B (zh) * | 2012-11-14 | 2015-04-08 | 北京理工大学 | 一种基于时频平面上下文的音频算术编码方法 |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9883312B2 (en) | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
CA2916121C (en) | 2013-06-21 | 2019-01-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Jitter buffer control, audio decoder, method and computer program |
EP3321934B1 (en) | 2013-06-21 | 2024-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time scaler, audio decoder, method and a computer program using a quality control |
KR101940464B1 (ko) | 2013-10-18 | 2019-01-18 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 스펙트럼의 피크 위치의 코딩 및 디코딩 |
EP3058566B1 (en) * | 2013-10-18 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding of spectral coefficients of a spectrum of an audio signal |
FR3015754A1 (fr) * | 2013-12-20 | 2015-06-26 | Orange | Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
EP3518237B1 (en) * | 2014-03-14 | 2022-09-07 | Telefonaktiebolaget LM Ericsson (publ) | Audio coding method and apparatus |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
CN105070292B (zh) * | 2015-07-10 | 2018-11-16 | 珠海市杰理科技股份有限公司 | 音频文件数据重排序的方法和系统 |
ES2965487T3 (es) * | 2016-01-22 | 2024-07-09 | Fraunhofer Ges Zur Foerderungder Angewandten Forschung E V | Aparato y procedimiento para la codificación o decodificación de una señal multicanal mediante el uso de repetición de muestreo de dominio espectral |
EP3306609A1 (en) | 2016-10-04 | 2018-04-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for determining a pitch information |
JP7123134B2 (ja) | 2017-10-27 | 2022-08-22 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | デコーダにおけるノイズ減衰 |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US11776562B2 (en) * | 2020-05-29 | 2023-10-03 | Qualcomm Incorporated | Context-aware hardware-based voice activity detection |
MX2023004247A (es) * | 2020-10-13 | 2023-06-07 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una pluralidad de objetos de audio o aparato y metodo para decodificacion usando dos o mas objetos de audio relevantes. |
CN114488105B (zh) * | 2022-04-15 | 2022-08-23 | 四川锐明智通科技有限公司 | 一种基于运动特征及方向模板滤波的雷达目标检测方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP4196235B2 (ja) * | 1999-01-19 | 2008-12-17 | ソニー株式会社 | オーディオデータ処理装置 |
CN1227646C (zh) * | 1999-05-26 | 2005-11-16 | 皇家菲利浦电子有限公司 | 音频信号传输系统 |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
JP4364544B2 (ja) * | 2003-04-09 | 2009-11-18 | 株式会社神戸製鋼所 | 音声信号処理装置及びその方法 |
CN101167125B (zh) * | 2005-03-11 | 2012-02-29 | 高通股份有限公司 | 用于对声码器内的帧进行相位匹配的方法及设备 |
US8364494B2 (en) * | 2005-04-01 | 2013-01-29 | Qualcomm Incorporated | Systems, methods, and apparatus for split-band filtering and encoding of a wideband signal |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
CN101366080B (zh) * | 2006-08-15 | 2011-10-19 | 美国博通公司 | 一种更新解码器的状态的方法和系统 |
WO2008022176A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CA2729925C (en) * | 2008-07-11 | 2016-03-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and audio decoder |
CA2836871C (en) | 2008-07-11 | 2017-07-18 | Stefan Bayer | Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
-
2011
- 2011-03-09 AU AU2011226143A patent/AU2011226143B9/en active Active
- 2011-03-09 KR KR1020127026461A patent/KR101445294B1/ko active IP Right Grant
- 2011-03-09 WO PCT/EP2011/053541 patent/WO2011110594A1/en active Application Filing
- 2011-03-09 CA CA2792500A patent/CA2792500C/en active Active
- 2011-03-09 TW TW100107904A patent/TWI455113B/zh active
- 2011-03-09 PL PL11707665T patent/PL2532001T3/pl unknown
- 2011-03-09 MX MX2012010469A patent/MX2012010469A/es active IP Right Grant
- 2011-03-09 WO PCT/EP2011/053538 patent/WO2011110591A1/en active Application Filing
- 2011-03-09 EP EP20110707415 patent/EP2539893B1/en active Active
- 2011-03-09 RU RU2012143323A patent/RU2607264C2/ru not_active Application Discontinuation
- 2011-03-09 BR BR112012022744-0A patent/BR112012022744B1/pt active IP Right Grant
- 2011-03-09 EP EP20110707665 patent/EP2532001B1/en active Active
- 2011-03-09 MX MX2012010439A patent/MX2012010439A/es active IP Right Grant
- 2011-03-09 ES ES11707415T patent/ES2461183T3/es active Active
- 2011-03-09 BR BR112012022741-6A patent/BR112012022741B1/pt active IP Right Grant
- 2011-03-09 RU RU2012143340/08A patent/RU2586848C2/ru active
- 2011-03-09 CN CN201180023298.2A patent/CN102884573B/zh active Active
- 2011-03-09 ES ES11707665T patent/ES2458354T3/es active Active
- 2011-03-09 AU AU2011226140A patent/AU2011226140B2/en active Active
- 2011-03-09 JP JP2012556506A patent/JP5625076B2/ja active Active
- 2011-03-09 KR KR1020127026462A patent/KR101445296B1/ko active IP Right Grant
- 2011-03-09 TW TW100107905A patent/TWI441170B/zh active
- 2011-03-09 CA CA2792504A patent/CA2792504C/en active Active
- 2011-03-09 PL PL11707415T patent/PL2539893T3/pl unknown
- 2011-03-09 CN CN201180021269.2A patent/CN102884572B/zh active Active
- 2011-03-09 JP JP2012556505A patent/JP5456914B2/ja active Active
- 2011-03-10 AR ARP110100746 patent/AR080396A1/es active IP Right Grant
- 2011-03-10 AR ARP110100748 patent/AR084465A1/es active IP Right Grant
-
2012
- 2012-09-06 US US13/604,869 patent/US9129597B2/en active Active
- 2012-09-10 US US13/608,980 patent/US9524726B2/en active Active
-
2013
- 2013-06-08 HK HK13106813.7A patent/HK1179743A1/xx unknown
- 2013-06-26 HK HK13107466.5A patent/HK1181540A1/xx unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5456914B2 (ja) | サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム | |
RU2486484C2 (ru) | Вычислитель контура временной деформации, кодера аудиосигнала, кодированное представление аудиосигнала, способы и программное обеспечение | |
JP5707410B2 (ja) | 前に復号されたスペクトル値のグループの検出を使用した、オーディオ符号器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および、コンピュータプログラム | |
JP5208901B2 (ja) | 音声信号および音楽信号を符号化する方法 | |
JP2020190751A (ja) | オーディオ信号のスペクトルのスペクトル係数のコード化 | |
KR102217709B1 (ko) | 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템 | |
JP6113278B2 (ja) | 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化 | |
JP6979048B2 (ja) | 低複雑度の調性適応音声信号量子化 | |
RU2752520C1 (ru) | Управление полосой частот в кодерах и/или декодерах | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5456914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |