JP3580777B2 - オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 - Google Patents
オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 Download PDFInfo
- Publication number
- JP3580777B2 JP3580777B2 JP2000591732A JP2000591732A JP3580777B2 JP 3580777 B2 JP3580777 B2 JP 3580777B2 JP 2000591732 A JP2000591732 A JP 2000591732A JP 2000591732 A JP2000591732 A JP 2000591732A JP 3580777 B2 JP3580777 B2 JP 3580777B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- code
- raster
- words
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 45
- 230000005236 sound signal Effects 0.000 title claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 217
- 238000001228 spectrum Methods 0.000 claims description 28
- 230000002123 temporal effect Effects 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 description 12
- 238000013144 data compression Methods 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/35—Unequal or adaptive error protection, e.g. by providing a different level of protection according to significance of source information or by adapting the coding according to the change of transmission channel characteristics
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/662—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a time/frequency relationship, e.g. time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は誤差許容エントロピー符号化又は復号化、特に誤差許容ハフマンコーディング又はデコーディングを実行することができる、オーディオ信号又はビットストリームを符号化あるいは復号化するための方法及び装置に関する。
【0002】
【従来の技術と課題】
最近のオーディオ符号化あるいは復号化の方法は、例えば、MPEG層3標準によるものであるが、信号の質の明らかな低下を生じることなく、例えば因数12によってオーディオ信号のデータレートを圧縮することが可能である。このような高いデータレートの圧縮を可能にするためには、オーディオ信号をサンプリングし、結果的に一連の離散時間型サンプルとなる。この種の技術において知られているように、ウィンドウされた時間的なサンプル群を得るために、この一連の離散時間型サンプルは、適当なウィンドウ機能を使用してウィンドウされる。ある一つのウィンドウされた時間的なサンプル群は、フィルタバンク、変形離散コサイン変換(MDCT)あるいは他の適当な方法によって周波数領域に変更され、それにより、周波数領域における、そのオーディオ信号、つまり、その離散時間型サンプル群からなるその時間的部分を表すスペクトル値を得る。通常、50%重なる時間群が生成され、MCDTによって周波数領域に変換される。MDCTの特性のために、例えば1024の離散時間型サンプルは、常に1024のスペクトル値になる。
【0003】
人間の耳の感受性はオーディオ信号そのものの時間的なスペクトルによることが知られている。これはいわゆる心理聴覚モデルに反映されている。このモデルを利用して、時間的スペクトルによるマスキング閾値を計算することが可能であった。マスキングとは、ある特定のトーン又はスペクトル部分が、例えば、その隣り合うスペクトル領域が比較的高いエネルギーを有する時、聞こえないものと判断されることである。このマスキング現象は、変換後のスペクトル値をできるだけ粗く量子化するために利用される。従って、目的は、できる限り少ないビットを符号化、あるいはここでは量子化し、復号化されたオーディオ信号には可聴範囲の妨害を避けることである。量子化により引き起こされる妨害、つまり、量子化ノイズはマスキング閾値以下であり、従って可聴域外であるべきである。周知の方法によれば、スペクトル値は従っていわゆる倍率帯域に予備分割され、これは、人間の聴覚の周波数群を反映している。ある倍率群のスペクトル値には、倍率帯域全体のスペクトル値を調整するために、ある倍率を掛ける。そして、倍率で調整された倍率帯域は量子化され、量子化されたスペクトル値を生成する。もちろん、倍率帯域にグルーピングすることは重要でない。しかし、この手順はMPEG層3標準及びMPEG−2 AAC (AACは上級オーディオ符号化)標準に使用されている。
【0004】
データ圧縮の非常に重要な要素は、量子化されたスペクトル値のエントロピー符号化である。普通、ハフマンコーディングがこれに利用される。ハフマンコーディングは長さが変動する符号化を伴う。つまり、符号化されるべき値のための暗語の長さは、この値が起こりうる可能性に基づいている。論理的には、最も起こり易い記号が最も短い符号、つまり、暗語を割り当てられ、その結果、ハフマンコーディングによって非常に良好な余分な部分の削減が達成できる。よく知られている長さ変動の符号化の一つの例は、モールス式符号である。
【0005】
オーディオ符号化の際、ハフマンコードは量子化されたスペクトル値を符号化するために用いられる。例えば、MPEG−2 AAC標準で作動する最近のオーディオコーダは、量子化されたスペクトル値を符号化するために、部分ごとに特定の標準に基づき、スペクトルに割り当てられる、複数の異なるハフマンコード表を使用する。ここでは、二つ又は四つのスペクトル値が常に一体的に一つの暗語に符号化される。
【0006】
MPEG−2 AACに基づく方法がMPEG層3の方法と異なる点の一つは、異なる倍率帯域、つまり、異なるスペクトル値が、任意の数のスペクトル部分にグループ分けされることである。AACにおいて、一つのスペクトル部分は少なくとも四つのスペクトル値、好ましくはそれ以上のスペクトル値を含んでいる。スペクトル値の全周波数領域は、このようにして隣接するいくつかの部分、それぞれの部分は周波数帯域を表すのだが、に分割され、結果的に、これら全ての部分が変換前のスペクトル値に渡る全ての周波数領域をカバーする。
【0007】
余分な部分の削減を最大にするために、MPEG層3による方法と同様に、いわゆるハフマン表、複数のこのようなハフマン表のうちの一つが各部分に割り当てられる。AAC方法のビットストリームでは、普通1024のスペクトル値を含み、これらのスペクトル値のためのハフマン暗語は周波数が高くなって行く順に並んでいる。各周波数部分で使用される表の情報はサイド情報として送られる。この状況を図2に示す。
【0008】
図2に一例として示すケースでは、ビットストリームは10のハフマン暗語を含んでいる。もし一つの暗語が常に一つのスペクトラル値から形成されるならば、10個のスペクトル値がここで符号化できる。しかし、通常、2個又は4個のスペクトル値が常に一体的に一つの暗語に符号化されるので、図2は20個又は40個のスペクトル値を含む符号化されたビットスリームの一部を示していることになる。各ハフマン暗語が2個のスペクトル値を含んでいる場合、番号1で示されている暗語は最初の2個のスペクトル値を表している。この暗語の長さは比較的短く、この最初の二つのスペクトル値、つまり、最も低い二つの周波数係数は比較的頻繁に起こることを意味している。他方、番号2で示されている暗語は比較的長く、この符号化されたオーディオ信号では3番目及び4番目のスペクトル係数の発生は比較的まれで、それ故にこれらのスペクトル係数は比較的大きなビット数で符号化される。図2に示すように、番号3,4,5で示される暗語はスペクトル係数5,6,7,8,9,10を表しているが、これらの各暗語は比較的短いので、これらの係数は比較的頻繁に発生する。番号6〜10で示されている暗語についても同様の考え方ができる。
【0009】
前述したように、図2からも明らかなように、符号化されたスペクトル値のためのハフマン暗語は、周知の符号化装置によって生成されるビットストリームの場合、そのビットストリーム中に周波数が高くなっていく順に一列に並んでいる。
【0010】
エラーが発生するチャンネルにおけるハフマンコーディングの最大の不利益は、そのエラーを伝達してしまうことである。例えば、図2中の番号2で示される暗語が伝えられる際に、この暗語2の長さが変更されるかもしれないという無意味とは言えない可能性がある。このようにして正しい長さとは異なる場合がある。図2の場合、もし暗語2の長さが妨害により変更されたなら、デコーダはもはや、暗語3−10がどこから始まるのかを判断できなくなり、つまり、そのオーディオ信号のほとんど全ての部分が影響を受けることになる。このように、妨害された暗語に続く他の全ての暗語さえも正確に復号化されなくなる。それは、これらの暗語がどこから始まるのかわからなくなり、この誤差のために、間違った開始点が選ばれてしまうからである。
【0011】
このようなエラー伝達の問題を解決するために、ヨーロッパ特許第0612156号は、一つの暗語の始まりが、完全な復号化をしなくても、あるいは誤った伝達の場合にでも、より簡単に確認できるように、長さの異なる暗語のいくつかをラスター配列させ、他の暗語を残りの隙間に配置させることを提案している。
【0012】
この周知の方法の効率を決定づけるパラメータは、そのラスターが実際どのように定義されるのか、つまり、いくつのラスターポイントが必要なのか、ラスターポイント間のラスター距離等である。しかし、ヨーロッパ特許第0612156号は、誤差の伝達を抑えるためにラスターが利用されるべきであるという一般的な提案を超えるものではなく、誤差許容と同時に効率的な符号化を達成するためにどのようにしてラスターを効率的に構築するのかについて、何の詳細な説明もない。
EP−A−0717503は、音楽信号の離散時間型サンプルを周波数領域に変換し、得られたスペクトル値を量子化及びエントロピー符号化するデジタル符号化及び復号化の方法を開示している。このエントロピー符号化は、長さの異なるある特定の数の暗語を生み出し、これらの暗語のいくつかはラスター配列され、他のものはラスターの残りの空間に挿入されている。
EP−A−0492537は、情報が小さなピクセル群に分けられ、各ピクセル群は直交変換手段によって直交する成分に変換される、ビデオ及びオーディオ情報の記録装置に関する。そして、直交する成分は、長さの異なる暗語を有するコードを用いて符号化される。符号化された暗語のいくつかは第1メモリに書き込まれる。もし暗語が、第1メモリに書込み可能なものよりも多くのビットを有している場合、その暗語の残りのビットは別のメモリに書き込まれる。
【0013】
本発明の目的は、誤差許容にもかかわらず効率的なオーディオ信号又はビットストリームの符号化及び復号化のための概念を提供することにある。
【0014】
【発明の構成、作用及び効果】
前記目的は、請求項1に係るオーディオ信号の符号化方法、請求項16に係るオーディオ信号の符号化装置、請求項17に係るビットストリームの復号化方法及び請求項18に係るビットストリームの復号化装置により達成される。
【0015】
本発明は、既に提案されているラスターは誤差許容符号化/復号化だけでなく、効率的な符号化/復号化を可能にするように形成または使用されなければならないという発見に基づくものである。ここで最も重要なことは、ハフマンコーディングという形でのエントロピー符号化によって得られる暗語は本質的に長さの異なるものである。最も大きな符号化の成果は、最も頻繁に起こる値に最も短い暗語を与える場合、現れる。他方、比較的まれに起こる値は、たとえ長い暗語を与えても、統計上、データ量としては最適値になる。ハフマンコーディングによって得られる暗語は、本質的に異なる長さを有するものである。
【0016】
本発明の第1の特徴点によると、いわゆる優先暗語がラスターポイントに配置され、これにより、たとえビットストリーム中にエラーがあっても、ラスターを通してデコーダが間違いなく各優先暗語の始まりを認知することができる。優先暗語は、心理音響的に重要な暗語である。このことは、いわゆる優先暗語によって符号化されたスペクトル値が、復号化されたオーディオ信号の聴感覚に実質的に貢献するということを意味している。オーディオ信号が高い割合でスピーチを含んでいる場合、優先暗語は低いスペクトル値を表す暗語である。なぜならば、この場合、重要なスペクトル情報はスペクトルの低い領域にあるからである。オーディオ信号がスペクトルの中領域にあるトーン群を持っている場合、優先暗語は周波数領域のこれに相当する中領域のスペクトル値に割り当てられた暗語である。なぜならば、これらが心理音響的に重要なスペクトル値であるからである。心理音響的に重要なスペクトル値は、また、その規模つまり信号エネルギーがスペクトル内の他のスペクトル値に比べて大きいものである。他方、心理音響的にさほど重要でない暗語、いわゆる非優先暗語がこのラスターを埋める。従って、これらの暗語はラスターポイントと共には位置しないが、優先暗語がラスターポイントに配置された後、残りの空間に「はめ込まれる」。
【0017】
従って、本発明の第1の特徴点によれば、優先暗語、つまり、心理音響的に重要なスペクトル値に与えられた暗語が、これらの優先暗語の開始点とラスターポイントが一致するようにラスター配列される。
【0018】
本発明の第2の特徴点によると、スペクトル値はスペクトル部分にグループ分けされ、異なるコード表が各スペクトル部分に与えられる。スペクトル部分へのコード表の割り当ては、信号の統計的な考慮に基づいて、例えば、あるスペクトル部分の符号化に最も適するコード表はどれかということに基づいてなされる。スペクトル部分へのコード表の割り当ては、すでにこの技術分野では周知である。
【0019】
等距離で配列されたラスターポイントのグループがいくつか集まったラスターが使用されることになる。一つのラスターポイントグループ内のラスターポイント間の距離は、一つのスペクトル部分の符号化に使用されるコード表に基づいている。他の別のスペクトル部分では、最適なデータ圧縮を行うために別のコード表が使用される。この別のコード表は、別のグループの等距離で配列されているラスターポイントに割り当てられ、このラスターポイントグループ内の二つのラスターポイントの距離はその関連するコード表に基づいている。互いに異なるラスターポイントグループの二つのラスターポイントの距離は、少なくとも三つの方法で決定することができる。
【0020】
最初に、一のコード表の暗語の最大長さを確定する。このコード表が与えられたラスターポイントグループ内の二つのラスターポイントの距離は、そのコード表の暗語の最大長さと同じか又は最大長さよりも大きいので、ラスターにはこのコード表の最長の暗語のための空間がある。別のコード表に関連する別のラスターポイントグループ内の二つのラスターポイントの距離は、この別のコード表の暗語の最大長さに基づき、同様の方法で決定される。
【0021】
以下に説明する2番目の方法は、ラスターポイントの数の増加にも貢献する。ハフマンコードの本質的な特性のために、あまり頻繁に発生しない暗語は、より頻繁に発生する暗語よりも長い。ラスターポイント間の距離を、ある表の暗語の最大長さと同じか又はそれよりも大きく設定する場合、そのラスターに挿入される暗語は通常そのラスターポイント間距離よりも短い。従って、ラスターポイント間距離は、ある表の暗語の最大長さよりも短く設定することも可能である。符号化の際にそのラスターに入りきらない暗語が現れた場合、ラスターに入らない残りの部分は、ビットストリームのラスター配列外の他の適当な場所に挿入される。結果として、この分断された暗語はもはやエラー伝達から有効に保護されない。これは非常にまれなことであり、ラスターポイントの数の増加という利益のために受け入れられるものである。
【0022】
異なるラスターポイント間距離を決定する第3の方法は、コード表の暗語の最大長さではなく、符号化されたスペクトル部分に実際に生じるビットストリーム中の暗語の最大長さを考慮することである。
【0023】
本発明の第3の特徴点によると、本質的に周波数に関して直線的に高くなる順番によるビットストリーム中の暗語の配列に代わり、暗語が周波数領域に渡り分散される配列が使用され、これはまた「スクランブリング」として知られている方法である。これはいわゆる「突発的なエラー」が、全周波数帯域の間違った複合化につながることはなく、単にいくつかの異なる周波数領域で小さな妨害が見られる程度であるという利点を有している。
【0024】
本発明の第4の特徴点によると、本質的に周波数に関して直線的に高くなる順番による暗語の配列に代わり、例えばn番目ごと(例えば、2番目ごと、3番目ごと、又は4番目ごと)の暗語だけがラスターに配列されるという配列方法が使用され得る。この方法では、可能なラスターポイントの数が優先暗語の数よりも小さい場合、優先暗語を使用するスペクトル領域を可能な限り大きくすること、つまり、エラー伝達を防止することが可能になる。
【0025】
さらに、効率的な作動を達成するような方法で優先暗語を決定することに優先権が与えられる。好ましくは、このことは心理音響的に重要な暗語、つまり優先暗語が低周波のスペクトル値を符号化するものであるという仮説を放棄することを意味する。このような場合はしばしばあるが、常にそうであるとは限らない。
【0026】
通常、優先暗語は心理音響的に重要なスペクトルラインを符号化するものであり、これらは通常高いエネルギーを有するスペクトル値である。高いエネルギーを有するスペクトルラインはエラーによっては生じない。
【0027】
本発明によると、すでに暗黙的に決定されたインディケータが使用される。このインディケータは使用されるコード表に基づくものである。AAC標準において、例えば、異なる絶対値域を有する11のコード表がある。コード表1は例えば−1〜+1の絶対値を持つスペクトル値を含み、コード表11は−8191〜+8191のスペクトル値を符号化する。コード表番号が大きくなればなるほど、それが符号化できる値域が大きくなる。このことは、小さい番号のコード表は比較的小さな値のみを表し、それ故に比較的小さなエラーを引き起こすだけであり、大きな番号のコード表は比較的大きな値域を表し、比較的大きなエラーを引き起こすことを意味している。
【0028】
小さな番号のコード表においてエラーが発生しても、それはよく聞こえないものであり、間違ったスペクトルラインの結果は、元々の正しいスペクトルラインとさほど違わないものとなる。しかし、最も大きな番号のコード表においてエラーが発生した場合、このエラーは原則としてこのコード表の絶対値のいくつかとなり得る。最も大きな番号のコード表で符号化されたスペクトルラインが小さい値を有し、例えば伝達の間に生じたエラーのために、デコーダ内で、このコード表によって最も高い絶対値を持つスペクトルラインとして複合化された場合、この間違ったスペクトルラインは確かに聞こえるものとなる。
【0029】
誤差許容に関して、最も重要なコード表は従って最も大きな番号のコード表(AAC標準ではコード表11)である。なぜならば、このコード表は、値を−213+1(−8191)〜+213−1(+8191)の間に逃してしまうからである。
【0030】
本発明のさらなる特徴点によると、短いウィンドウがAAC標準の伝達信号のために使用される。短いウィンドウにより、周波数分解能はより高い時間的分解能のために減じられる。優先暗語は、心理音響的に重要なスペクトル値、つまり低周波のスペクトル値又は番号の大きいコード表からのスペクトル値がラスターポイント上に確かに配置されるように、決定される。倍率帯域のインターリービングは、これはAAC標準の特徴であるが、この目的のために解除される。
【0031】
【発明の実施形態】
本発明の好ましい実施形態を添付図面を参照しながら説明する。
【0032】
本発明を説明するために、図2に優先暗語を斜線で示す。図2は、周知の異なる長さの暗語の配列を示しているが、これは周波数に関して直線的に高くなる順番によるものである。図2では、優先暗語が暗語1〜5である。前述したように、オーディオ信号が例えば高い割合でスピーチを含んでいる場合、または多くの低周波音を含んでいる場合、低周波のスペクトル値に与えられる暗語が優先暗語である。図2中、暗語6〜10は高周波のスペクトル値に関連するものであり、これらのスペクトル値は復号化された信号の全体的な印象に貢献するものの、聴感覚には大して影響せず、従って心理音響的にあまり重要ではない。
【0033】
図1は、ラスターポイント10〜18を有するビットストリームを示す。図1中、ラスターポイント10とラスターポイント12の間の距離をD1、ラスターポイント14とラスターポイント16の間の距離をD2とする。
【0034】
本発明の第1の特徴点の説明に関して、ラスターポイント10からラスターポイント14の間のビットストリームだけを考える。優先暗語1,2は、図2に示された例では低周波域に位置している重要なスペクトル部分であるが、これが復号化の際にエラー伝達の対象とならないように、ラスターに配列されている。非優先暗語、図1、図2において斜線を符していないものであるが、これらは優先暗語の後に、ラスターを埋めるように配置される。ハフマン暗語の長さは暗語そのものからわかるので、非優先暗語を一固まりでラスターに入れ込む必要はない。デコーダは、読み取ったものが暗語の単に一部だけであるのかどうかを判別できる。この場合、デコーダは自動的に、暗語の最初の部分に、次のラスターポイントの後の優先暗語に引き続き、ある特定のビット数を付加する。従って、非優先暗語7,8,9のそれぞれがビットストリーム中二つに分けられ、つまり、7a,7b、8a,8b、9a,9bに分けられるように、非優先暗語の最初の部分をラスターの最初の空き場所に挿入し、残りの部分を他の場所に挿入することが可能である。
【0035】
既に説明したように、図1のビットストリームの第2の部分は本発明の第2の特徴点を説明している。ラスター距離D1が小さなラスター距離D2に変更されなければ、優先暗語1〜5のどれでもが入る距離D1を有するラスターは、いわば、ラスターの残りの部分を埋めるだけの十分な非優先暗語がないというような長いビットストリームを作る結果となりうる。従って、ビットストリームに挿入されるべき多くの優先暗語だけをオーディオ信号から抜き出し、根本的に空き場所を残さないようにし、ビットストリームが不必要に延長されることがないようにする。
【0036】
本発明の第2の特徴点を、図1を参照しながら詳細に説明する。MPEG−2 AAC標準に基づく符号化方法の場合において、11の異なるハフマンコード表が符号化のために使用される。これらの表の大部分にとって、可能な限りの最大の暗語長さは10〜20ビットである。しかし、特別な表、いわゆる「逃し表」は49ビットの最大長さを含む。もし全ての表のうちで最長暗語の長さをラスター距離Dとして使用するならば、49ビットのラスター距離を設定することになる。この結果、非常に大きな幅のラスターとなり、全ての優先暗語がラスターポイントに配列された場合、ビットストリームはあまりにも長すぎるものとなるので、ほとんど全ての表にとって非効率的なものとなる。従って、本発明によると、ラスターの幅は使用されるコード表に基づき調整される。前述したように、スペクトル値はいくつかのスペクトル部分にグループ分けされ、各スペクトル部分には、信号の統計的要素を考慮して最適なコード表が与えられる。ひとつのコード表における最大の暗語長さは、普通、他のコード表における最大の暗語長さとは異なる。
【0037】
暗語1,2で表されるスペクトル値は第1のスペクトル部分に属し、暗語3〜10で表されるスペクトル値は第2のスペクトル部分に属すると仮定する。この場合、ビットストリームは二つのラスターポイントグループによってラスターされる。第1のラスターポイントグループはラスターポイント10,12,14からなり、第2のラスターポイントグループはラスターポイント14,16,18からなる。さらに、スペクトル部分0はハフマンコード表nを与えられ、スペクトル部分1はハフマンコード表mを与えられ、また、暗語2はスペクトル部分0に与えられた表nのうちの最長暗語である。第1のラスターポイントグループのラスター距離は表nの最大の暗語長さ、つまりこの例での暗語2の長さよりも大きいか、あるいは好ましくはそれと等しい。
【0038】
他方、ラスターポイント14と暗語10でのビットストリームの終点との間の部分からわかるように、この例ではコード表mにおける最長の暗語は現れない。従って、グループ2で示されるビットストリームのラスターには長さD2の暗語はない。
【0039】
本発明の第2の特徴点によれば、ラスターの幅は使用されるコード表に基づいて選択される。しかし、この場合、使用される表はデコーダで復号化される際に認識されなければならない。しかし、コード表番号が各スペクトル部分のサイド情報として常に送信されるならば、デコーダは、ある特定の異なる、この例では11の、ハフマン表のうちのどのコード表であるかを認識することができる。
【0040】
前述したように、ラスター距離が使用されるコード表により決定されても、49ビットの暗語を含む逃し表を考えるとわかるように、最適なデータ圧縮が達成されるわけではない。この逃し表の場合、ラスター距離は最大サイズのスペクトル値を符号化できるように49ビットに調節されることになるからである。逃し表は、短いコード表を持つために、逃し表と共に短いコード表を使用して比較的大きい値を符号化できるように、使用される。一つのコード表の値域を超える値の場合、このスペクトル値のための暗語はある特定の値になり、このことは、コーダ内で逃し表もまた使用されたということをデコーダに示すことになる。あるコード表が値0〜2を含んでいる場合、例えば、そのコード表の3の値がデコーダに逃し表が使用されたことを示すことになる。「基礎」のコード表の値3を有する暗語は同時に、その基礎コード表の最大値と共に、該当するスペクトル値を形成する逃し表の値を与える。
【0041】
本発明のさらなる実施形態によると、一つのグループ(例えばグループ1又はグループ2)内のラスターポイント間距離は、もはやあるコード表における最長暗語の長さと同じではなく、あるコード表に属するビットストリームに実際に発生する最長暗語の長さと同じである。本発明の第2の特徴点の第1実施形態においては、逃し表における符号化効率は未だ最適ではないので、この実施形態ではこれをさらに改良した。この表の暗語の最大長さ(スペクトル内で)は通常、技術的符号化の理由からかなり短いものである。逃し表の最長の暗語は例えば49ビットである。
【0042】
通常のオーディオ信号中に実際に発生する最も長い逃し表の暗語は、典型的には約20ビットの長さである。従って、ラスターポイントの数、及び一つのブロック内の最長暗語の長さを送信することによりラスターポイントに配列され得る優先暗語の数をさらに増すことができる。そしてラスターの長さは実際に発生する最長暗語の長さか又は現在使用されている表の論理的な最長暗語の長さのうちのどちらか最小値である方に等しい。最小値を決定するために、各コード表の実際に発生する暗語又は単に一つのオーディオフレームで使用される全てのコード表の最長暗語のどちらかを使用することができる。この選択は非逃し表、つまり「基礎」ハフマン表にも利用できるが、逃し表ほどには効率的ではない。
【0043】
あるスペクトル部分又はスペクトルブロック内の最長暗語の長さを送信することは別の有利な副作用を生み出す。デコーダは、既に発生した最大長さから、妨害されたかもしれないより長い暗語がそのビットストリームの中に存在するかどうかを検知することができる。長い暗語は普通、スペクトル値の高いエネルギーを表している。非常に長い暗語が伝達エラーのために発生した場合、これは非常に可聴な妨害となる。最大長さを送信することは、ほとんどの場合このようなエラーを感知し、それに対して策を講じる手段を与えることになる。エラーに対する対向策とは、長すぎる暗語を単に空白にしておくか又は何かもっと複雑な隠蔽工作であろう。
【0044】
誤差許容と同時に効率的な符号化のためにはできる限り多くのラスターポイントが望ましいということを銘記しておくことは重要である。しかし、ラスターポイントの数はビットストリームの全長によって制限される。これはもちろんラスタリングの結果として長くされるべきではなく、なぜならば、ビットストリーム中に使用されない場所ができてしまい、全体的なデータ圧縮の理論とは矛盾することになるからである。しかし、応用によっては、ビットストリームの延長は高い程度での誤差許容のためには受け入れられることもあるということも、また指摘しておかねばならない。考慮すべき別の点は、ラスターはできるだけ多くの暗語がラスターポイントから始まるように構築されることが好ましいということである。よって、本発明は、先行技術に比べてラスターポイント間距離の選択に関して有効な融通性がある。全く理想的な場合には、この融通性によって全ての暗語がラスターポイント上に配置されるが、このためには非常に大きな技術努力が必要である。前述のラスターポイントの配置方法、つまり各スペクトル部分でのラスターポイント間距離を関連するコード表に基づいて決定する方法は、この最適ケースに非常に近いものを可能とする。しかし、これは特に、全ての暗語が心理音響的に重要なものではなく、ビットストリーム中に使用されない場所を残さないために、心理音響的にさほど重要でない暗語は、ビットストリーム内に、ラスター配列された心理音響的に重要な暗語の間に挿入されるからである。
【0045】
本発明の第3の特徴点によれば、暗語は、ビットストリーム中に、もはや周波数に関して高くなる順に直線状に並べられてはいず、異なるスペクトル値の暗語が「スクランブル」されている。図1において、暗語の周波数に関わる交互的な直線的配列がある程度見られる。斜線で示された優先暗語は周波数が高くなる順に配列され、斜線を施されていない非優先暗語も、周波数が高くなる順にビットストリーム中に挿入されているからである。いわゆる「突発的」エラーが図1に示すビットストリーム中に発生した場合、すなわち、引き続くいくつかの暗語の崩壊につながるような妨害が発生した場合、例えば暗語6,7a,2,3,7bが同時に影響を受けることになる。
【0046】
これに相当する復号化されたオーディオ信号には、スペクトル的に比較的広く故にはっきりと聞こえる妨害が、優先暗語2,3によって示されるスペクトル帯域内に発生することになる。突発的なエラーの問題については、図1の非常に単純な例からはあまり明らかではない。しかし、実際、5個以上のラスターポイントがあり、突発的エラーがしばしば複数のラスターポイントに跨って発生することが考えられ、このような場合には、比較的広い周波数帯域でのデータの損失となり得る。この理由から、本発明の第3の特徴点によれば、スペクトル値の優先暗語は周波数の高くなる順に配列されないことが好ましく、周波数に関してランダムなあるいはランダムに見えるような配列になるように「スクランブル」にする方が好ましい。非優先暗語もまた同様に取り扱ってもよい。ランダムのような配列の場合、この分散状況はデコーダに前もってセットできるので、この分散についてはサイド情報として送信する必要はない。結果として、ビットストリーム中の連続する暗語の損失が完全な一つの周波数帯域の損失とはならず、単にいくつかの周波数帯域での非常に小さい損失となるだけである。この妨害が聞こえることはめったになく、一つの周波数帯域全体の損失よりも効果的に隠すことができる。
【0047】
本発明の第4の特徴点によれば、優先暗語及び非優先暗語の周波数に関して高くなる順の直線的な配列に代わり、例えばn番目ごとの暗語がラスター配列され、残りの暗語はそれらの間に挿入されるという配列が使用可能である。前述したように、一つのビットストリームのためのラスターポイントの数は全長及びラスターポイント間距離によって限定される。例えば、低い帯域幅でのサンプリングの場合を考えると、大多数の暗語が心理音響的に重要な暗語である。16kHzのサンプリングレートが使用された場合、信号全てが論理的に使用可能な8kHzの帯域幅を有しているからである。経験的には、暗語のうちの30%だけがラスターポイント上に配列され、残りの70%はラスターを完全に埋めるように配列されなければならない。しかし、このことは、重要な周波数領域、例えばスピーチ信号の場合は0〜4kHzであるが、これがラスターポイント上に配置された暗語によってカバーあるいは「保護」され得ないということを意味している。従って、重要な周波数領域でのエラー伝達を適切に阻止するために、全ての優先暗語をラスターポイント上に配置する代わりに、2番目ごと、3番目ごと、4番目ごと等の優先暗語のみをこのように配置し、他の優先暗語は一直線に並べられるのではなく、ラスターを埋めるように配置される。例えば、2番目ごと、3番目ごと等のスペクトル値が低周波領域にあることがわかり、点在する暗語が伝達の間に崩壊する場合、例えば予測等のエラー隠蔽技術を使用してデコーダ内でこれらの暗語を再構築することも可能である。
【0048】
ビットストリームを復号化するための方法及び装置は前述の符号化を反映するように働く。
【0049】
符号化されたビットストリームが一つのコード表に異なる長さの暗語と等距離のラスターポイント(10,12,14)を持つラスターを有し、これらの暗語は、他のスペクトル値と比べて心理音響的に重要なあるスペクトル値を表す優先暗語を含み、優先暗語はラスターポイントによって配列されているという符号化されたオーディオ信号で表されるビットストリームを復号化するための一般的な方法では、(a)二つのラスターポイント間の距離D1が決定される。二つのラスターポイント間の距離がわかれば、(b)ラスターポイントに配列されている符号化されたビットストリーム中の優先暗語が、周波数に関して直線的な順で、各優先暗語の始まりがラスターポイントと一致する配列となるように、再分類される。これにより優先暗語は図2に示す一般的な周波数に関する直線的な配列となり、(c)復号化されたスペクトル値を得るために、関連するコード表を用いてこれらの優先暗語を復号化することができる。(d)復号化されたスペクトル値を時間領域に戻すように変換して、復号化されたオーディオ信号が得られ、例えばラウドスピーカに送り込めるように何らかのよく知られた方法で加工することができる。
【0050】
ビットストリームがただ一つのコード表を使用して符号化された場合、ラスターポイント間距離は、どの表が符号化のために使用されたのかをビットストリームのサイド情報から見つけ出すことによって、極めて簡単に設定することができる。符号化によっては、この距離はこの表の最長暗語の長さであるかもしれず、それはそのコーダに永久的にセットされ得る。その距離が、コード表が与えられたビットストリームの一部に実際に発生する最長暗語の長さであれば、このことはビットストリームに伴うサイド情報等でデコーダに発信される。
【0051】
デコーダは、優先暗語及び非優先暗語の再分類を、例えば符号化されたビットストリームにポインタを当てることによって行う。デコーダがラスター距離を認識しており、優先暗語が周波数に関して直線的に配列されている場合、デコーダはラスターポイントに飛び越し、そこから始まる暗語を読むことができる。一つの暗語を読み終えると、ポインタは次のラスターポイントへ飛び、このようなプロセスを繰り返す。全ての優先暗語が読まれても、ビットストリームはまだ非優先暗語を含んでいる。ビットストリーム中の優先暗語と非優先暗語の直線的配列が選択された場合、非優先暗語はすでに周波数に関して直線的に配列されており、さらなる分類をすることなしに、復号化及び元の状態への変換がなされる。
【0052】
本発明の第3又は第4の特徴点に係る符号化が選択されると、スクランブル情報がサイド情報として送られるか、またはスクランブル状態の分布が前もって固定され、それにより最初からデコーダはこのことがわかる。同じ考慮が第4の特徴点にも当てはまる。一定の分布を規定するか、またはデコーダにサイド情報として連絡された可変の分布を選択することは常に可能である。
【0053】
ここで、優先暗語を決定し操作する有利な方法を説明する。ただ一つのコード表を使用する場合には一つのラスター距離を、あるいは多数のコード表を使用する場合には複数のラスター距離を設定することによって符号化されたビットストリームのためのラスターを決定した後、優先暗語は、それぞれがラスターポイントと一致するようにラスターに配置されなければならない。
【0054】
本発明の好ましい実施形態では、この配置は、暗語を一種のソート表から本来は空のラスターに順に挿入していくことによって達成される。表の最初の暗語から始められる。従って、優先暗語は表中の暗語の並びによって影響されるが、優先暗語は常にラスターの場所にある暗語、つまり、ラスターポイントが使用可能である暗語である。もはやラスターポイントがない表中の暗語に関しては、ビットストリーム中の残りの空間にそれらを挿入していく以外に選択の余地はない。これらの暗語は従って本発明の感覚からすると、優先暗語ではない。
【0055】
優先暗語の数は前もっては決定されない。符号化されたビットストリームのためのメモリが満たされるまでは、すなわち、もはや優先暗語が書き込めなくなるまでは、優先暗語が書き込まれる。このメモリの大きさは、そのスペクトルデータのために以前に使用されたビットの合計と同じである。つまり、それ以上のビットはラスタリングによって要求されない。メモリは、このように符号化の効率がラスター処理の結果として落ち込むのを阻止するために、暗語の数によって制限される。もちろん、誤差を許容することができるように、全ての暗語がラスターポイント上に配置されてもよい。しかし、この場合、ラスターポイント間に空のビットが使用されないままになるので、符号化効率の顕著な低下につながる。
【0056】
本発明の第1の特徴点は優先暗語、つまり、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語の決定に係わるものである。心理音響的に重要なスペクトルラインとは、例えば、他のスペクトルラインよりも大きなエネルギーを含んでいるスペクトルラインである。概略的に言えば、大きなエネルギーを有していればいるほど、そのスペクトルラインはより重要である。従って、高いエネルギーを有するスペクトルラインが妨害されないことと、それと同様に、高いエネルギーを有するスペクトルラインがエラーの結果として発生することはないということが重要である。
【0057】
これまでは、高いエネルギーを有するスペクトルラインが主にスペクトルの低い部分に位置しているという仮定で説明してきた。これは多くの場合事実であるが、全ての場合ではない。本発明は、一つの暗語に符号化されたスペクトルラインの、または複数のスペクトルラインが一つの暗語に符号化されている場合はこれら複数のスペクトルラインのエネルギーを概算するための含蓄されたインディケータを使用することによって、この仮説を無視するものである。
【0058】
このインディケータは、使用されるハフマンコード表のようなコードブック又はコード表である。例えばAAC標準では、11個の表が使用される。これらの表の値域はかなり違っている。表1〜11の最大絶対値は以下の通りである。
【0059】
1;1;2;2;4;4;7;7;12;12;8191.
【0060】
これらの異なる値域の結果として、最大エラーは表による。各表の表示を考えると、これは表の中から確認可能であるか、または表以外から送信されてくるが、最大エラーは前記絶対値の2倍になる。本発明によれば、優先暗語の決定は使用されるコード表に基づいてなされ、そのインディケータは最大絶対値と含蓄的にコード表番号である。まず、そのコード表が最大の値域を有している暗語を考える。次に、そのコード表が2番目に大きい値を有する暗語が続き、という手順である。従って、AAC標準の場合、表11が最初に考慮され、表9,10が続き、表1,2が優先順位の最後である。ラスターポイントに配置される優先暗語は、このように、ラスターポイントがそれのために使用され得るソート表の中にある暗語である。
【0061】
暗語を決定するこの方法の利点は、使用される表がサイド情報で送信され、この情報からデコーダは送信中に使用される暗語の並びを決めることができるので、他の付加的な情報をデコーダに送信する必要はない。
【0062】
本発明の第2の特徴点は、オーディオ信号を表すスペクトル値を得るためにその周波数領域内でのオーディオ信号の離散時間型サンプルを変換するために、長いウィンドウに対向するものとして、短い(サンプリング)ウィンドウを使用することに関する。短いウィンドウはAAC標準及び標準層3で定義される。短いウィンドウの場合、一つの長いMDCTの代わりに多数の短いMDCTが使用される。
【0063】
AAC標準では、それぞれが128の出力値を有する8個のMDCTからなるグループが、例えば1024の出力値を有する一つのMDCTの代わりに使用される。これはコーダの周波数分解能を犠牲にして時間的分解能を高めることになる。一般的に短いウィンドウは一時的な信号に使用される。例えば短いウィンドウがAACと共に使用される場合、8つの連続した完全なスペクトル、すなわちそれぞれのセットが全スペクトルを含む8セットのスペクトル値が得られるが、スペクトル値間の距離もまた8倍の大きさである。これは周波数分解能の低下を表し、そしてこれは時間的分解能の高まりを伴う。
【0064】
AAC標準ではグループ分けが行われる。すなわち、8つのスペクトルからグループが形成される。これらのグループのために1セットの倍率がある。最も単純な場合、各グループが一つのウィンドウを含んでいる。この場合、8セットの倍率が送信されなければならない。より強い圧縮を達成するためには、一般的に心理音響的な必要条件を考慮して、複数のウィンドウがAAC標準の一つのグループに集められる。これは送信されるべき倍率の数を減少させ、より良いデータ圧縮となる。スペクトルデータはグループ毎に順に符号化されたビットストリームに記載されて送信される。グループ内では倍率帯域の交互配置が行われる。
【0065】
このことは下記の例によって示される。ここでは三つのグループに分けられる。第1グループは二つのウィンドウを含み、第2グループは三つのウィンドウを含み、第3グループも三つのウィンドウを含んでいる。各スペクトルは12の倍率帯域を有する。グループ分けは下記の通りである。
【0066】
第1グループ、第1ウィンドウ、第1倍率帯域
第1グループ、第2ウィンドウ、第1倍率帯域
第1グループ、第1ウィンドウ、第2倍率帯域
第1グループ、第2ウィンドウ、第2倍率帯域
...
第1グループ、第2ウィンドウ、第12倍率帯域
第2グループ、第3ウィンドウ、第1倍率帯域
第2グループ、第4ウィンドウ、第1倍率帯域
第2グループ、第5ウィンドウ、第1倍率帯域
第2グループ、第3ウィンドウ、第2倍率帯域
...
【0067】
この配列は、プレソーティング(予備分類)、あるいはソート表から暗語をラスターに挿入するのには適さない。なぜならば、連続的な挿入がなされる場合、第1グループの全スペクトルは保護されるが最後のグループのスペクトルは保護されないからである。この理由で、本発明の第2の特徴点に係るプレソーティングは、短いウィンドウのために行われる。AAC標準の場合、グループ分けと倍率帯域によるアプローチは放棄される。新しいプレソーティングは、今度はスペクトルラインのユニットという形で行われる。
【0068】
本発明の好ましい実施形態において、各ユニットは四つのスペクトルラインを含む。AAC標準では従って各ウィンドウは、128のスペクトルラインに相当する32のユニットを含む。スペクトルデータは下記の通りである。
【0069】
第1ウィンドウ、第1ユニット
第2ウィンドウ、第1ユニット
...
第8ウィンドウ、第1ユニット
第1ウィンドウ、第2ユニット
第2ウィンドウ、第2ユニット
...
第8ウィンドウ、第2ユニット
第1ウィンドウ、第3ユニット
...
【0070】
このプレソーティングは全てのウィンドウの個々のスペクトル領域は互いに近くに位置する、つまり、低いスペクトル値は、周波数に基づき、より高い周波数を有するスペクトル値の前に、個々のセットのスペクトル値から短い表の前部分に書き込まれる。低いスペクトル領域のスペクトル値は心理音響的に特に重要であり、ソート表の前述のプレソーティングは、スペクトル値をソート表からラスターに挿入するための基礎を与える。この暗語のプレソーティング、つまり、優先暗語を決定することにより、いかなる付加的情報をも送る必要はない。なぜならば、デコーダはサイド情報からこのブロック又はフレームでは短いウィンドウが使用されたことを認識し、ユニットを生成するためのコーダの分類アルゴリズムが常に一定とされ、故にそれがデコーダに永久的にプログラムされるからである。
【0071】
暗語をソート表にプレソーティングすることは優先暗語を決定することに相当することを銘記しておくことは重要である。なぜなら、ラスターポイントに位置する暗語、つまり、優先暗語がソート表の最初、つまり前又は上の部分にある可能性が高いので、この表はそれ自体、高い可能性で、どの暗語がラスターポイントに書かれ得るのかを決定するからである。
【0072】
この好ましい実施形態以外では、このプレソーティングはソート表によっては行われず、個々の暗語を指し、指し示された暗語がビットストリーム中に書き入れられる順番を決定することで行われる。
【0073】
AAC標準から、いくつかのコード表は2次元又は4次元的であること、すなわち、一つの暗語が2個又は4個のスペクトル値を符号化することが知られている。従って、四つのスペクトルライン又はその倍数を一つのユニットにグループ化することが有利である。このようにすれば同じ周波数領域を符号化する暗語が直接互いに連続するように分類されるからである。一つのユニットのスペクトルラインの数はそのコード表の異なる次元によって割り切れることが好ましい。すなわち、ユニットごとのラインの数は暗語ごとのラインの数の公倍数であり、最小公倍数ならば最適である。
【0074】
本発明は第1、第2の特徴点が組み合わされたとき、特に効果的である。本発明に係るユニットへの再分類が短いウィンドウのために行われ、次にコード表のインディケータを用いて優先暗語の決定が行われ、その際、高い程度のエラー防止を達成するために高いコード表からの暗語が一定のラスターポイント上に配置されることを確実にするために、ユニットへの再分類の結果が再び再分類される。 この組み合わせは必ずしも必要ではないが、最良の結果を導くものである。
【図面の簡単な説明】
【図1】暗語を含む符号化されたビットストリームの、本発明の第2の特徴点に係るラスタリングの一例を示す。
【図2】従来技術による、周波数に関して直線的に高くなる順番による暗語の配列を示す。
Claims (18)
- 符号化されたビットストリームを得るために以下のステップによって得られる暗語を使用してオーディオ信号を符号化する方法であって、
オーディオ信号を表すスペクトル値群を得るために、オーディオ信号の離散時間型サンプル群を周波数領域に変換する、
スペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少なくとも一つのスペクトル値を有するように、グループ分けする、
予め与えられた数のコード表から、少なくとも二つのコード表を二つの異なるスペクトル部分に与える、この際、そのスペクトル部分のスペクトル値の符号化に適するコード表を与え、一つのコード表には、暗語で符号化されたスペクトル値が得られるように、限られた数の異なる長さを有する暗語が含まれており、一つのスペクトル値に与えられる暗語の長さは、そのスペクトル値の発生する可能性が高ければ高いほど短いものである、
対応するスペクトル部分に与えられたコード表でスペクトル値を符号化する、
前記方法は以下のステップを含むことを特徴とする、
符号化されたビットストリームのためにラスターを決定する、このラスターは少なくとも二つのラスターポイント(10,12,14及び14,16,18)を有し、各グループのラスターポイントは互いに等距離に配置されており、各グループのラスターポイント間距離(D1又はD2)は前記少なくとも二つの異なるコード表から選択された適当なコード表に基づくものである、
前記暗語のうちで、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語を優先暗語として定義する、この定義において、暗語が引き出されるコード表に基づくインディケータが優先を指し示す場合、その暗語は優先暗語として定義される、
前記スペクトル値群のうちの一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す優先暗語の始まりが別のラスターポイントに一致するように、優先暗語をラスターに配置する。 - 請求項1記載の方法であり、
複数のウィンドウが使用され、これにより、複数セットのスペクトル値が得られ、各スペクトル値セットは全スペクトルを含み、
優先暗語を定義するステップにおいて、それぞれのセットからの同じ周波数のスペクトル値を符号化する暗語が優先暗語として定義される。 - 請求項1又は請求項2記載の方法であり、コード表の暗語が複数のスペクトル値を符号化し、これらのスペクトル値はグループ又はユニットにまとめられ、その際、一つのグループ中のスペクトル値の数は一つの暗語が符号化するスペクトル値の数によって割り切れるようになされる。
- 請求項3記載の方法であり、異なる次元を有する多種のコード表、つまり、暗語ごとのスペクトル値が異なるコード表が使用され、一つのユニットはn個のスペクトル値(nは発生する全ての次元の公倍数である)を有している。
- 請求項1、請求項2又は請求項3記載の方法であり、優先暗語を定義するステップは以下のステップを含み、
暗語を、優先暗語がソート表の前の部分の暗語になるように、従ってソート表のそれより後に位置する暗語よりもラスターポイント上に位置され易くなるように、ソート表に順に置き、ソート表の暗語の順番が暗語の中での優先分布を設定し、これにより優先暗語を作成する、
優先暗語を配置するステップは以下のステップを含んでいる、
ラスターポイントが無くなるまで、暗語を前記ソート表からラスターポイント上へ順に配置していく、
残りの暗語を、ソート表から未だ空いているラスターの場所に配置する。 - 請求項1記載の方法であり、
各コード表は、符号化されるべきスペクトル値のために最大絶対値を有し、
前記インディケータは、それが基づくコード表が全てのコード表のうちの最も高い絶対値を有している場合、最高の優先権を示す。 - 請求項1又は請求項6記載の方法であり、
各コード表は、符号化されるべきスペクトル値のために最大絶対値を有し、
複数のコード表が使用され、各表にインディケータが存在し、そのインディケータはそれぞれの表の最も高い絶対値より決定され、より大きな最大絶対値を有する表のインディケータは、より小さい最大絶対値を有する表のインディケータがするよりも、その表からの暗語に対してより高い優先権を示す。 - 請求項1、請求項6又は請求項7記載の方法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2)は、相当するコード表の最長暗語の長さよりも、小さいか、それに等しいか又はそれよりも大きい。
- 請求項1、請求項6又は請求項7記載の方法であり、各ラスターポイントグループのラスターポイント間距離(D1,D2)は、相当するスペクトル部分のスペクトル値のための実際に発生する最長暗語の長さに等しく、
スペクトル部分の実際に発生する最長暗語の長さはビットストリームにサイド情報として送信される。 - 請求項1、請求項6又は請求項7記載の方法であり、各ラスターポイントグループのラスターポイント間距離は、グループ分けされた全てのスペクトル部分の実際に発生する最長暗語とこのグループのコード表の最長暗語のうちの最小値に等しく、実際に発生する最長暗語はデコーダにサイド情報として送信される。
- 請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9又は請求項10記載の方法であり、優先暗語及び非優先暗語の両方に関して、暗語の周波数に関して実質的に直線的な配列を保持して、ビットストリームのラスターへ配列する。
- 請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9又は請求項10記載の方法であり、符号化されたスペクトル値を表す暗語は、相当するスペクトル値の周波数とは関係なく、ビットストリームのラスターに配列される。
- 請求項12記載の方法であり、周波数とは無関係の分布が予め決定されていない場合、周波数と暗語の間の相応関係に関する情報がサイド情報としてビットストリーム中に挿入される。
- 請求項1記載の方法であり、優先暗語のうちのn番目ごとの暗語だけがビットストリームのラスターに配列され、残りの優先暗語及び非優先暗語はラスターポイントに配置されない。
- 請求項1、請求項2、請求項3、請求項4、請求項5、請求項6、請求項7、請求項8、請求項9、請求項10、請求項11、請求項12、請求項13又は請求項14記載の方法であり、スペクトル値は、符号化に先立ち、心理音響モデルを考慮して量子化される。
- 符号化されたビットストリームを得るために以下の如く得られる暗語を使用してオーディオ信号を符号化するための装置であって、
オーディオ信号を表すスペクトル値群を得るために、オーディオ信号の離散時間型サンプル群を周波数領域に変換する、
スペクトル値を隣り合うスペクトル部分に、各スペクトル部分が少なくとも一つのスペクトル値を有するように、グループ分けする、
予め与えられた数のコード表から、少なくとも二つのコード表を二つの異なるスペクトル部分に与える、この際、そのスペクトル部分のスペクトル値の符号化に適するコード表を与え、一つのコード表には、暗語で符号化されたスペクトル値が得られるように、限られた数の異なる長さを有する暗語が含まれており、一つのスペクトル値に与えられる暗語の長さは、そのスペクトル値の発生する可能性が高ければ高いほど短いものである、
対応するスペクトル部分に与えられたコード表でスペクトル値を符号化する、
前記装置は以下のものを含むことを特徴とする、
符号化されたビットストリームのためにラスターを決定するユニット、このラスターは少なくとも二つのラスターポイント(10,12,14及び14,16,18)を有し、各グループのラスターポイントは互いに等距離に配置されており、各グループのラスターポイント間距離(D1又はD2)は前記少なくとも二つの異なるコード表から選択された適当なコード表に基づくものである、
前記暗語のうちで、他のスペクトル値に比べて心理音響的に重要なスペクトル値を表す暗語を優先暗語として定義するユニット、このユニットにおいて、暗語が引き出されるコード表に基づくインディケータが優先を指し示す場合、その暗語は優先暗語として定義される、
前記スペクトル値群のうちの一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す優先暗語の始まりが別のラスターポイントに一致するように、優先暗語をラスターに配置するユニット。 - 符号化されたオーディオ信号を表すビットストリームを復号化する方法であり、この符号化されたビットストリームは少なくとも二つのコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14及び14,16,18)の少なくとも二つのグループを持つラスターを有しており、暗語は、他の暗語に比べて心理音響的に重要なスペクトル値群の特別なスペクトル値を表す優先暗語を含み、該スペクトル値群はオーディオ信号の時間的サンプル群のスペクトルを表し、該スペクトルはいくつかの隣り合うスペクトル部分を有し、一つのスペクトル部分は少なくとも一つのスペクトル値を有しており、優先暗語は、該スペクトル値群の一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す別の優先暗語の始まりが別のラスターポイントに一致するように、ラスターポイントによって配列されており、一つの部分(部分0)からの暗語はラスターポイント(10,12,14)が等距離で並ぶ一つのラスターポイントグループに配列され、別の部分(部分1)からの暗語はラスターポイント(14,16,18)が等距離で並ぶ別のラスターポイントグループに配列され、各部分のために、そのスペクトル部分内のスペクトル値を符号化するのに使用されるコード表を示すコード表番号(n,m)が該ビットストリーム内に含まれている、
前記方法は以下のステップを含むことを特徴とする、
各スペクトル部分において、その部分のためのコード表番号に基づき、そのスペクトル部分に関連するコード表が少なくとも二つの異なるコード表のうちのどれであるかを認知する、
各スペクトル部分において、認知されたコード表に基づき、そのスペクトル部分の暗語のために、二つの隣り合うラスターポイントの距離(D1,D2)を検知する、
ビットストリーム中の、スペクトル部分に属する優先暗語、それらは少なくとも二つの等距離で並ぶラスターポイント(10,12,14及び14,16,18)のグループのラスターポイントに配置されたものであり、それらを各スペクトル部分のためのコード表番号に基づき、それらのスペクトル部分に属する暗語が周波数に関して直線的な配列になるように、優先暗語の始まりがラスターポイントと一致するように、再分類する、その結果、各スペクトル部分において、そのスペクトル部分の優先暗語を認知されたコード表を用いて復号化し、周波数に関して直線的な配列の復号化されたスペクトル値が得られ、かつ、周波数に関して直線的な配列の復号化されたスペクトル値を時間領域に戻すように変換し、復号化されたオーディオ信号が得られる。 - 符号化されたオーディオ信号を表すビットストリームを復号化する装置であり、この符号化されたビットストリームは少なくとも二つのコード表から引き出された互いに長さの異なる暗語を含み、等距離で並ぶラスターポイント(10,12,14及び14,16,18)の少なくとも二つのグループを持つラスターを有しており、暗語は、他の暗語に比べて心理音響的に重要なスペクトル値群の特別なスペクトル値を表す優先暗語を含み、該スペクトル値群はオーディオ信号の時間的サンプル群のスペクトルを表し、該スペクトルはいくつかの隣り合うスペクトル部分を有し、一つのスペクトル部分は 少なくとも一つのスペクトル値を有しており、優先暗語は、該スペクトル値群の一つのスペクトル値を表す優先暗語の始まりが一つのラスターポイントに一致し、該スペクトル値群の別のスペクトル値を表す別の優先暗語の始まりが別のラスターポイントに一致するように、ラスターポイントによって配列されており、一つの部分(部分0)からの暗語はラスターポイント(10,12,14)が等距離で並ぶ一つのラスターポイントグループに配列され、別の部分(部分1)からの暗語はラスターポイント(14,16,18)が等距離で並ぶ別のラスターポイントグループに配列され、各部分のために、そのスペクトル部分内のスペクトル値を符号化するのに使用されるコード表を示すコード表番号(n,m)が該ビットストリーム内に含まれている、
前記装置は以下のものを含むことを特徴とする、
各スペクトル部分において、その部分のためのコード表番号に基づき、そのスペクトル部分に関連するコード表が少なくとも二つの異なるコード表のうちのどれであるかを認知するユニット、
各スペクトル部分において、認知されたコード表に基づき、そのスペクトル部分の暗語のために、二つの隣り合うラスターポイントの距離(D1,D2)を検知するユニット、
ビットストリーム中の、スペクトル部分に属する優先暗語、それらは少なくとも二つの等距離で並ぶラスターポイント(10,12,14及び14,16,18)のグループのラスターポイントに配置されたものであり、それらを各スペクトル部分のためのコード表番号に基づき、それらのスペクトル部分に属する暗語が周波数に関して直線的な配列になるように、優先暗語の始まりがラスターポイントと一致するように、再分類するユニット、この再分類の結果、各スペクトル部分において、そのスペクトル部分の優先暗語を認知されたコード表を用いて復号化し、周波数に関して直線的な配列の復号化されたスペクトル値が得られ、かつ、周波数に関して直線的な配列の復号化されたスペクトル値を時間領域に戻すように変換し、復号化されたオーディオ信号が得られる。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP1998/008475 WO2000039933A1 (de) | 1997-10-24 | 1998-12-28 | Verfahren und vorrichtungen zum codieren bzw. decodieren eines audiosignals bzw. eines bitstroms |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004099417A Division JP4168000B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
JP2004099418A Division JP3902642B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
JP2004099419A Division JP3978194B2 (ja) | 1997-10-24 | 2004-03-30 | オーディオ信号又はビットストリームの復号化のための装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002534702A JP2002534702A (ja) | 2002-10-15 |
JP3580777B2 true JP3580777B2 (ja) | 2004-10-27 |
Family
ID=8167173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000591732A Expired - Lifetime JP3580777B2 (ja) | 1998-12-28 | 1998-12-28 | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6975254B1 (ja) |
JP (1) | JP3580777B2 (ja) |
KR (1) | KR100391935B1 (ja) |
AU (1) | AU754877B2 (ja) |
CA (1) | CA2356869C (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19907728C2 (de) | 1999-02-23 | 2001-03-01 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms |
DE19907729C2 (de) | 1999-02-23 | 2001-02-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines Datenstroms aus Codeworten variabler Länge und Verfahren und Vorrichtung zum Lesen eines Datenstroms aus Codeworten variabler Länge |
JP3469567B2 (ja) * | 2001-09-03 | 2003-11-25 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法 |
US7428684B2 (en) * | 2002-04-29 | 2008-09-23 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Device and method for concealing an error |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US20060218459A1 (en) * | 2004-08-13 | 2006-09-28 | David Hedberg | Coding systems and methods |
US7698623B2 (en) * | 2004-08-13 | 2010-04-13 | David Hedberg | Systems and methods for decreasing latency in a digital transmission system |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7199735B1 (en) * | 2005-08-25 | 2007-04-03 | Mobilygen Corporation | Method and apparatus for entropy coding |
US8620644B2 (en) | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
CN101290771B (zh) * | 2007-04-20 | 2011-07-13 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的比特消耗控制方法 |
EP2153608B1 (en) | 2007-06-01 | 2013-09-18 | BlackBerry Limited | Determination of compression state information for use in interactive compression |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
GB2454190A (en) * | 2007-10-30 | 2009-05-06 | Cambridge Silicon Radio Ltd | Minimising a cost function in encoding data using spectral partitioning |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
RU2553084C2 (ru) * | 2010-10-07 | 2015-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока |
AU2014211520B2 (en) | 2013-01-29 | 2017-04-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-frequency emphasis for LPC-based coding in frequency domain |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109920440B (zh) | 2013-09-12 | 2024-01-09 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN107636756A (zh) * | 2015-04-10 | 2018-01-26 | 汤姆逊许可公司 | 用于编码多个音频信号的方法和设备以及用于利用改进的分离解码多个音频信号的混合的方法和设备 |
CN109313908B (zh) * | 2016-04-12 | 2023-09-22 | 弗劳恩霍夫应用研究促进协会 | 用于对音频信号进行编码的音频编码器以及方法 |
US10756755B2 (en) | 2016-05-10 | 2020-08-25 | Immersion Networks, Inc. | Adaptive audio codec system, method and article |
US10699725B2 (en) | 2016-05-10 | 2020-06-30 | Immersion Networks, Inc. | Adaptive audio encoder system, method and article |
WO2017196833A1 (en) * | 2016-05-10 | 2017-11-16 | Immersion Services LLC | Adaptive audio codec system, method, apparatus and medium |
US10770088B2 (en) | 2016-05-10 | 2020-09-08 | Immersion Networks, Inc. | Adaptive audio decoder system, method and article |
US10885921B2 (en) * | 2017-07-07 | 2021-01-05 | Qualcomm Incorporated | Multi-stream audio coding |
EP3738074A4 (en) | 2018-01-08 | 2021-10-13 | Immersion Networks, Inc. | PROCESSES AND APPARATUS FOR THE PRODUCTION OF REGULAR REPRESENTATIONS OF A MOVEMENT OF ENTRY IN TIME AND SPACE |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
WO2020165265A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
US11380343B2 (en) | 2019-09-12 | 2022-07-05 | Immersion Networks, Inc. | Systems and methods for processing high frequency audio signal |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3736898A (en) * | 1970-11-18 | 1973-06-05 | Mitsui Shipbuilding Eng | Device for controlling list and level of pontoon |
US4270025A (en) * | 1979-04-09 | 1981-05-26 | The United States Of America As Represented By The Secretary Of The Navy | Sampled speech compression system |
CA1211219A (en) * | 1982-06-30 | 1986-09-09 | Hideo Kuroda | Digital data code conversion circuit for variable- word-length data code |
EP0235566B1 (en) * | 1986-01-27 | 1993-09-08 | Fuji Photo Film Co., Ltd. | Method of image signal encoding by orthogonal transformation |
US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
US4813056A (en) * | 1987-12-08 | 1989-03-14 | General Electric Company | Modified statistical coding of digital signals |
US4942467A (en) * | 1988-12-05 | 1990-07-17 | General Electric Company | Predictor controlled encoder for digital transmission systems |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
JP2766302B2 (ja) * | 1989-04-06 | 1998-06-18 | 株式会社東芝 | 可変長符号並列解読方法および装置 |
US5146577A (en) * | 1989-04-10 | 1992-09-08 | Motorola, Inc. | Serial data circuit with randomly-accessed registers of different bit length |
DE3943880B4 (de) | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
JPH04221465A (ja) * | 1990-12-21 | 1992-08-11 | Matsushita Electric Ind Co Ltd | 記録装置 |
KR940010433B1 (ko) * | 1992-06-09 | 1994-10-22 | 대우전자 주식회사 | 가변길이 코드 디코딩장치 |
JPH06164409A (ja) * | 1992-11-17 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 帯域分割符号化方法 |
JP3446240B2 (ja) | 1993-03-31 | 2003-09-16 | ソニー株式会社 | 符号化方法および符号化装置 |
US5563593A (en) * | 1994-03-18 | 1996-10-08 | Lucent Technologies Inc. | Video coding with optimized low complexity variable length codes |
TW271524B (ja) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JP3274284B2 (ja) * | 1994-08-08 | 2002-04-15 | キヤノン株式会社 | 符号化装置およびその方法 |
KR960020018A (ko) * | 1994-11-17 | 1996-06-17 | 배순훈 | 가변길이복호화장치 |
KR100209877B1 (ko) * | 1994-11-26 | 1999-07-15 | 윤종용 | 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치 |
JP3732867B2 (ja) * | 1995-03-09 | 2006-01-11 | 株式会社ルネサステクノロジ | 画像伸張装置 |
KR100207385B1 (ko) * | 1995-08-31 | 1999-07-15 | 전주범 | 가변 길이 복호화 장치 |
US5663726A (en) * | 1995-12-01 | 1997-09-02 | U.S. Philips Corporation | High speed variable-length decoder arrangement with reduced memory requirements for tag stream buffering |
US5835035A (en) * | 1995-12-28 | 1998-11-10 | Philips Electronics North America Corporation | High performance variable length decoder with two-word bit stream segmentation and related method |
US5650905A (en) * | 1995-12-28 | 1997-07-22 | Philips Electronics North America Corporation | Variable length decoder with adaptive acceleration in processing of Huffman encoded bit streams |
DE69836785T2 (de) * | 1997-10-03 | 2007-04-26 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiosignalkompression, Sprachsignalkompression und Spracherkennung |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
US6006179A (en) * | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
US6690307B2 (en) * | 2002-01-22 | 2004-02-10 | Nokia Corporation | Adaptive variable length coding of digital video |
-
1998
- 1998-12-28 JP JP2000591732A patent/JP3580777B2/ja not_active Expired - Lifetime
- 1998-12-28 AU AU21636/99A patent/AU754877B2/en not_active Expired
- 1998-12-28 CA CA002356869A patent/CA2356869C/en not_active Expired - Lifetime
- 1998-12-28 US US09/869,401 patent/US6975254B1/en not_active Expired - Lifetime
- 1998-12-28 KR KR10-2001-7008203A patent/KR100391935B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
CA2356869C (en) | 2004-11-02 |
KR20010108051A (ko) | 2001-12-07 |
KR100391935B1 (ko) | 2003-07-16 |
US6975254B1 (en) | 2005-12-13 |
JP2002534702A (ja) | 2002-10-15 |
AU754877B2 (en) | 2002-11-28 |
CA2356869A1 (en) | 2000-07-06 |
AU2163699A (en) | 2000-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3580777B2 (ja) | オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置 | |
US6807528B1 (en) | Adding data to a compressed data frame | |
US7003448B1 (en) | Method and device for error concealment in an encoded audio-signal and method and device for decoding an encoded audio signal | |
KR100969731B1 (ko) | 데이터의 중요도에 따라 변형된 데이터 스트림을 생성하는장치 및 그 데이터 스트림을 해석하는 장치 | |
KR100871999B1 (ko) | 오디오 코딩 | |
US7526432B2 (en) | Apparatus and method for producing a data stream and apparatus and method for reading a data stream | |
EP1072036B1 (en) | Fast frame optimisation in an audio encoder | |
JP4242516B2 (ja) | サブバンド符号化方式 | |
WO2002065651A2 (en) | Method of inserting additional data into a compressed signal | |
EP1073209B1 (en) | Subband encoding apparatus | |
US8214222B2 (en) | Method and an apparatus for identifying frame type | |
JPH07311594A (ja) | ビット割当にチャネルのマスキング特性を用いる符号化及び復号化装置及び方法 | |
JP3978194B2 (ja) | オーディオ信号又はビットストリームの復号化のための装置及び方法 | |
US7657336B2 (en) | Reduction of memory requirements by de-interleaving audio samples with two buffers | |
AU754371B2 (en) | Method and device for generating a data flow from variable-length code words and a method and device for reading a data flow from variable-length code words | |
KR100685974B1 (ko) | 워터마크 삽입/검출을 위한 장치 및 방법 | |
ES2329466T3 (es) | Procedimientos y dispositivos para codificar o decodificar una señal de audio o un flujo de bits. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20031222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040713 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040720 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |