[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2003188733A - 符号化方法及び装置 - Google Patents

符号化方法及び装置

Info

Publication number
JP2003188733A
JP2003188733A JP2002315144A JP2002315144A JP2003188733A JP 2003188733 A JP2003188733 A JP 2003188733A JP 2002315144 A JP2002315144 A JP 2002315144A JP 2002315144 A JP2002315144 A JP 2002315144A JP 2003188733 A JP2003188733 A JP 2003188733A
Authority
JP
Japan
Prior art keywords
block
difference
codebook
cost
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002315144A
Other languages
English (en)
Inventor
Teemu Pohjola
ポヨラ テーム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oplayo Oy
Original Assignee
Oplayo Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oplayo Oy filed Critical Oplayo Oy
Publication of JP2003188733A publication Critical patent/JP2003188733A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 カスクード形ベクトル量子化(VQ)の符号
化データ量を低減する。 【解決手段】 本発明は、画像の符号化及び復号化に関
する。本発明は、DCT及びDWT方式から得られたい
くつかの改良点を有するカスケード形VQの変形であ
る。本発明の基本的な態様は、結果として生ずるコード
ベクトルの周波数分布を前もって決定するためにコード
ブックをトレーニングするとき、コードブックを前処理
すること、及びブロックの符号化に必要な差分符号化用
の可変数の段階を用いて、各ブロックを独立に符号化及
び復号化することである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像の符号化及び
復号化に関する。特に、本発明は、ストリーミングメデ
ィアのソリューションにおけるビデオの符号化及び復号
化に関する。ストリーミングメディアとは、ビデオが受
信側の端末で表示されているときに、ビデオをネットワ
ークを通して送信側から受信側にリアルタイムで送信す
ることを意味する。
【0002】
【従来の技術及び発明が解決しようとする課題】ディジ
タルビデオは、一連のフレーム−一般に秒当たり25フ
レーム−から構成する。各フレームは、M1×N1画素
から構成される。図1を参照されたい。各画素は、さら
に、RGBのようないくつかの標準的な色表現では、2
4ビットで表される。RGBでは、色は赤(R)、緑
(G)、及び青(B)の成分に分割され、これらの成分
は、さらに、0と255との間の範囲の数によって表現
される。秒当たりM1×N1×24×25ビット(bp
s)のストリームの容量が、この全ての情報を送信する
ために必要である。160×120画素の小さいフレー
ム寸法でさえ、11.5Mbpsになり、ほとんどの固
定式のまた特に全ての無線インターネット接続(9.6
kbps(GSM)からWLANの範囲内の数百kbp
s)の帯域幅を超える。しかしながら、全ての一連のビ
デオは若干の冗長性を含むため、圧縮することができ
る。
【0003】どのようなビデオ信号でも、いくつかのフ
レームを落とすことによって、すなわち、フレーム速度
を減らすことによって、及び/又はフレーム寸法を縮小
することによって圧縮することができる。カラービデオ
では、例えば、RGB表現からYCrCb表現への標準
の移り変わりのようなカラー表現の巧みな選択により、
視覚的に関連した情報を1/2以下にさらに減少するこ
とができる。YCrCbは、RGBから線形変換によっ
て得られた、別の24ビットのカラー表示である。Y成
分は、色の輝度すなわちグレースケール値に相当する、
0と255との間の値を取る。Cr及びCb成分は、−
128と+127との間の値を取り、クロミナンス又は
色平面を定義する。放射状座標では、原点の周りの角度
又は色相は実際の色を決定し、一方原点からの距離は色
の彩度に一致する。続いて、これらの種類のステップが
取られると仮定され、エンファシスは残りのフレーム内
に存在する詳細な情報の最適な符号化にある。
【0004】全てのビデオ圧縮技術は、一方ではフレー
ム間及びフレーム内に存在する相関関係を、他方では人
の視覚システムの限界の知識を使用する。一定の色合い
を有する固定した対象物及び領域などの相関関係は、損
失なしに圧縮することができるが、見えない細部の脱落
は明らかに損失である。さらに圧縮するには、再生され
た画像内の細部及び色の精度に対して妥協することが必
要である。
【0005】ビデオ内でカット(シーンの変化)がない
場合は、連続したフレームは、シーン内でカメラ及び/
又はいくつかの対象物が動いた場合のみ異なる。そのよ
うな一連のフレームを効率的に符号化して、これらの動
きの方向及び大きさを見つけ、結果として生じた動き情
報を受信側に送ることができる。この種の方法は動き補
償と呼ばれ、前のフレームを参照する一般概念は、IN
TER(フレーム)符号化(フレーム間)として周知で
ある。従って、INTERフレームは前のフレーム(又
はフレーム群)に酷似している。前のフレームの知識及
び必要な変更を表すある程度の追加の情報を用いて、そ
のようなフレームを再構成することができる。達成可能
な圧縮比率の構想を得るために、8×8ブロック2(図
2及び図3を参照のこと)を考えてみよう。このブロッ
ク2は、当初の形状では、8×8×24=1536ビッ
トに相当する。2つの連続したフレーム1間のブロック
の動きが、例えば、−7画素から7画素までの間に限定
される場合、二次元の動きベクトルを8ビットで表すこ
とができ、結果として192の圧縮比率が生じる。
【0006】この方法を動作させるために、それぞれカ
ット後の第1のフレームをそのように圧縮する必要があ
り、これはINTRA符号化と呼ばれる。このように、
INTRAフレームは、どのような他のフレームも参照
しない別個の画像として圧縮されるビデオフレームであ
る。INTRAフレームは、ビデオの最初のカットで必
要とされ、エラーから回復するためにビデオを定期的に
リフレッシュする。
【0007】圧縮されたビデオの良好な視覚品質を維持
することは、全ての実際的なビデオ圧縮技術に向けられ
た多くの要求事項の1つに過ぎない。商用の目的に対し
ては、多量のビデオ内容の符号化を容易にするために、
符号化処理はかなり高速である必要がある。コンピュー
タのメモリにおけるフレームの可能な初期のバッファリ
ングに加えて、リアルタイムでビデオを視聴することが
一般に起こり、このためビデオのリアルタイムの復号化
及び再生が要求される。意図されたプラットフォームの
範囲がPCからPDA(携帯情報端末)まで、あるいは
さらに第三世代の携帯電話までわたるため、メモリの使
用法及びコーデックに対する処理パワーの要求に対して
制約が加わる。
【0008】高速な復号化は、いわゆるストリーミング
ビデオに対してさらにより重要である。これらのストリ
ーミングビデオは、彼又は彼女がそれらを見ているた
め、受信機にリアルタイムで送信される。ストリーミン
グビデオに対して、データ送信能力が限定されているた
め、最小の圧縮比率がビデオの全長に対して決定され
る。これは、ビデオを送信するビットレートは常に利用
可能な帯域幅内に留まる必要があるためである。
【0009】大部分のビデオ圧縮技術は、2つの構成要
素を備えている、すなわち、ビデオの圧縮時に使用され
るエンコーダ、及びビデオの全ての視聴者となる人のコ
ンピュータの中にダウンロード及び設置されるデコーダ
又はプレーヤである。このダウンロードは各プレーヤバ
ージョンに対して1回だけ行う必要があるが、全てのイ
ンターネットのユーザに届くことができる、プレーヤ無
しのストリーミングビデオのソリューションに対する関
心が増大している。そのようなソリューションでは、小
さいプレーヤのアプリケーションが、ビデオストリーム
と一緒に受信側に送信される。このオーバーヘッド情報
による待機時間を最小にするために、アプリケーショ
ン、すなわち、デコーダを極めて単純に作る必要があ
る。
【0010】この明細書の目的に対して、グレースケー
ルのフレーム/画像(カラー画像及び様々なカラー表示
は以下の説明の直接的な一般化である)を考慮すること
は適当である。画素のグレースケール値は、輝度Yとし
て示される。これらはフレーム内で二次元のアレイを形
成し、符号化処理に対する課題は、画像内の視覚的に関
連した情報ができるだけ多くが残るような方法で、この
アレイの圧縮及び復元を行うことである。
【0011】INTRAモード(INTRAフレームを
符号化する場合に使用されるビデオ又は画像圧縮技術)
では、各フレームは単にグレースケールのビットマップ
画像である。実際に、画像は一般にN×N画素2のブロ
ックに分割され、各ブロックは他とは無関係に分析され
る。図3を参照のこと。
【0012】画像ブロックの情報を圧縮する最も簡単な
方法は、輝度値を示す精度を低減することである。当初
の256の可能な輝度値の代わりに、128(値0,
2,...,254)又は64の値(0,4,...,
252)が考えられ、これにより、輝度情報を示すため
に必要な画素当たりのビット数を、それぞれ、12.5
%及び25%に減らすことができる。同時に、そのよう
なスカラー量子化方法は、符号化誤差を引き起こす、す
なわち、前述の典型的な例では、平均誤差は、それぞ
れ、画素当たり0.5及び1輝度単位である。しかしな
がら、スカラー量子化は、全ての実像内に存在する隣接
する画素間及びブロック間の全ての相関を無視するた
め、極めて非効率的である。
【0013】画素間の相関を説明する1つの方法は、画
像すなわち画素の輝度値を二次元の面として考えること
である。多くの現在の画像圧縮アルゴリズムは、この面
の関数の形式がいくつかの基底関数の組によって分解さ
れる関数変換に基づいている。
【0014】最も広く使用される変換は、基底がそれぞ
れコサイン及びウェーブレットによって形成される離散
コサイン変換(DCT)及び離散ウェーブレット変換
(DWT)である。ブロックサイズが大きいほど、相関
をとれる画素間の距離を大きくすることができるが、こ
の場合同時に、基底関数の数はN2で増加する。例え
ば、JPEG及びMPEG規格では、DCTコーディン
グ用のブロック長は8×8である。DCTとDWTとの
間の主要な差は、前者は基底関数がブロック全体にわた
って広がるのに対し、後者では基底関数が空間的に局所
化されている点である。
【0015】INTERモード(INTERモードは、
INTERフレーム又はその中のブロックを圧縮する場
合に使用されるビデオ圧縮技術である。INTERモー
ドは前のフレームを参照し、それらを修正する。動き補
償技術は代表的なINTERモードである。)では、動
き補償されたブロックは、当初のブロックに完全に一致
はしない。多くの場合、結果として生ずる誤差は目に見
えるが、それでも全ブロックを新たに符号化するよりは
補正情報を受信側に送ることが容易であるほど小さい。
その理由は、誤差は一般に小さく、実際の画像ブロック
における輝度値よりも小さいビット数で表すことができ
るためである。この相違を除けば、差分ブロックを画像
ブロック自体と同様の方法で符号化することができる。
【0016】関数変換に対する代替え案として、ベクト
ル量子化(VQ)を使用することができる。VQ法で
は、N×Nの画像ブロック2、又はN2のベクトル3
(図3を参照のこと)は、事前にトレーニングされたコ
ードブックからの同じ長さのベクトルと一致する。各ブ
ロックに対して、最も一致するコードベクトルが選択さ
れて、元の画像ブロックを表す。全ての画像ブロック2
がこのように、有限数のコードベクトル4によって表さ
れる、すなわち、ベクトルが量子化される。最も一致す
るベクトルのインデックスがデコーダに送られ、同じコ
ードブックのデコーダのコピーからベクトルを見つける
ことによって、画像が再生される。
【0017】VQの符号化品質は、コードブックを作成
する場合に使用されるトレーニング画像の組及びコード
ブックの中のベクトル数に依存する。ベクトル空間の大
きさは、ブロックの大きさN(N2の画素値)に二次的
に依存し、一方、可能なベクトル数は256^(N^2)と
増大する−コードブック内のベクトルはこれら全てのベ
クトルを表す必要がある。このため、ブロックサイズを
増加させながら符号化された画像の品質を一定に維持す
るためには、必要なコードブックのサイズが指数関数的
に増加する。この事実のため、巨大なメモリが要求さ
れ、極めて重要なことだが、各ベクトルに対する検索時
間が極端に長くなる。小さいメモリ及び/又は短い検索
時間の要求で優れた品質を得るために、基本的なVQ方
式のいくつかの機能拡張が提案されている。
【0018】ツリー検索VQのようないくつかの拡張
は、コードブックサイズに比して検索時間を短くするこ
とだけを目的にしている。これらのアルゴリズムは、画
像品質を向上させず(むしろ、それを劣化させる)、こ
こではそれらアルゴリズムが他のVQベースのアルゴリ
ズムを高速化する可能性に対してのみ関心がある。
【0019】画像品質を向上させる目的のVQアルゴリ
ズムは、一般に、1つ以上の専門のコードブックを使用
する。アルゴリズムの細部に基づいて、これらのアルゴ
リズムを2つのカテゴリーに分類することができる。そ
れらアルゴリズムは、1つの段階の符号化誤差を別のコ
ードブックを用いて更に符号化することにより残余誤差
を低減すると言った具合に符号化された画像ブロックを
反復的に改善するもの(図4参照)か、又はまず各ブロ
ック内の画像材料を分類し、次に異なる種類の材料(エ
ッジ、テクスチャー、滑らかな表面)に対して別のコー
ドブック(411,412,413)を使用するもの
か、のいずれかである。多段階の変形例はカスケード形
VQ又は階層形VQと呼ばれることが多いのに対し、後
者は分類形VQとして周知である。これら全ての背後の
目的は、コードブックを専門化することによって、ベク
トル空間の有効次元を低減することである。全ての考え
られる画像ブロックを表示する代わりに、1つのコード
ブックは、例えば、各要素が所定の値以下に制限された
誤差ベクトルに特化したり(カスケード形)、1つのエ
ッジが通るブロック群に特化したり(分類形)すること
ができる。カスケード形VQの変形例では、段階間でブ
ロックサイズを減らすことによって、ベクトルの次元が
さらに低減されることが多い。
【0020】変換符号化技術における主要な利点は、そ
れらの分析的に予測可能な特性、及びその結果として得
られる、相対的重要度に基づき並べられた、相関が除去
された(decorrelated)係数である。これらの態様によ
り、利用可能な送信ラインの帯域幅に基づいて、効率的
なレート・歪み制御及びストリームのスケーラビリティ
が可能にされる。
【0021】全ての基底関数が同じブロック領域全体に
わたるDCTのような変換は、基底関数の空間的な位置
及び存在範囲が変化するDWTに似た方式よりも、アー
テファクトを阻止する傾向がある。この相違は、例え
ば、鋭いエッジ(暗い領域と明るい領域との間のはっき
りした変化)を含む画像ブロックを符号化する場合に明
白である。そのようなブロックのDCTは、原則とし
て、少なくとも1つ空間方向に全ての可能な周波数を生
成する。これとは対照的に、ブロックのDWTは、いく
つかのゼロ以外の係数をもたらすに過ぎない。他方で
は、DCTは、より大きな滑らかに変化する表面又はテ
クスチャーを符号化する場合により効率的であるが、そ
れらなめらかに変化する表面やテクスチャでは、多数の
ゼロ以外のウェーブレット係数を必要とする。
【0022】たいていの現実の画像ブロックでは、ゼロ
の変換係数の数は、少なくともゼロ以外の変換係数の数
に匹敵する。このため、変換技術の符号化の効率は、大
体において、それらゼロの1つ1つに対して数個のビッ
トを使用又は送信することなくそれらゼロを表現するこ
とによる効率によって決定される。DCTでは、係数は
最も重要で頻繁に発生するものから、最も重要でなく滅
多に発生しないものまで順にに並べられる。ゼロは連続
して発生することが多く、このため、効率的にランレン
グス符号化が可能である。DWTでは、係数は空間的に
別個の階層に並べられる。この場合、ゼロの係数は、階
層内のブランチ(枝)群全体で一度に発生することが多
い。そのようなブランチは、次に、1つのコードワード
によって集合的に無効にすることができる。
【0023】全ての変換符号化技術には、1つの重要な
欠点がある、すなわち、復号化側が計算量的に重いこと
である。この復号化は逆関数変換を含み、PCレベルの
プロセッサ上でしか高速に実行することができない。こ
れらの要求事項によって、PDA装置及び携帯電話が除
外される。一般に、変換符号化は、任意のビデオを視聴
できるようにする前に、ダウンロード及び設置する必要
がある特定のプレーヤのソリューションにも結合され
る。
【0024】変換コーデックの別の欠点は、差分符号化
との関連で発生する。当初の符号化されたフレームと個
々のブロックとの間の差分は、画像を最初に符号化する
ときに使用した方法に依存する。変換符号化方法につい
ては、残っている差分は誘導された量子化誤差によるも
のに過ぎないが、動き補償方式又はVQ形の方法につい
ては、差分は大きさは小さいが比較的ランダムであるこ
とが多い。この場合、関数変換は、圧縮することが実際
の画像の係数よりもさらに難しいゼロ以外の要素の任意
の組合わせを生成する。
【0025】ベクトル量子化技術の利点及び欠点は、変
換コーデックとは全く反対である。この圧縮技術は、常
に非対称的であり、復号化処理がきわめて軽いことが強
調される。その最も単純な方法では、復号化はコードベ
クトルに対するテーブルルックアップから構成されるに
過ぎない。プレーヤのアプリケーションは、極めて小さ
いサイズに作ることができ、ビデオストリームの最初に
送られる。
【0026】コードベクトルは、すべてのN×Nブロッ
ク群に対応するか、別の方法ではそのような1つのブロ
ックに対する全ての変換係数に対応する。1つのベクト
ルインデックスが各ブロックに送られる場合、圧縮率は
ブロックサイズが大きくなればそれだけ大きくなる。し
かしながら、大きなNに対して優れた品質を得るには、
大きなコードブックが必要とされる。このことは、符号
化−ベクトル検索−及びコードブックの受信側への送信
の両方に対して、時間が長くなることを意味する。
【0027】他方、ブロックが小さければそれだけ、符
号化の結果が正確になる。また、ブロック又はベクトル
が小さいと、それだけ小さいコードブックしか必要とし
ないため、小さいメモリしか必要とせず、受信側への送
信がそれだけ早くなる。さらに、コードベクトルの検索
動作が早いと、それだけ符号化処理全体が早くなる。ブ
ロックサイズが小さい場合の欠点は、送信すべきインデ
ックスの量が大きくなることである。
【0028】改良形VQの変形例では、ベクトル空間は
複数の部分に分割され、各部分に対してそれぞれ1つの
コードブックが用意される。カスケード形VQでは、特
に、連続した符号化の段階で得られる達成可能なベクト
ルVの数を効果的に増加することによって、画像品質が
改善される。別々の段階でベクトルが直交する理想的な
場合では、Viベクトルのコードブックを有する段階i
を加えることによって、VがV×Viに増加する。この
方法は、全体のコードブックの大きさ及び検索時間を妥
当なものにして、画像品質を著しく向上させることがで
きる。この向上は、各ブロックを符号化するために必要
なビット数の出費のもとで行われる、すなわち、これ
は、V=2nの場合、nだけ増加する。ブロックサイズ
が段階間で減少する場合、画像品質はさらに向上する。
【0029】しかしながら、カスケード形VQには2つ
の問題がある。第1は、コードブックは一般に、現実的
な差分ブロック群で訓練されるが、人の視覚系を基準に
しない。その結果、ベクトルは必ずしも目視的に最も満
足な補正をなさない。第2は、各ブロックを符号化する
ために必要なビット数は、使用される段階の数と共に増
加し、ブロックサイズが途中で減少される場合は、より
急速に増加する。
【0030】本発明の目的は、前述した欠点を多少とも
解決することである。このことは、特許請求の範囲の中
に記載した方法で実現される。
【0031】
【課題を解決するための手段】この説明を読む場合、次
の定義を考慮しなければならない。基本モード。画像又
はビデオフレームを符号化するために設計された画像又
はビデオ圧縮技術のこと。この用語は、差分モードから
区別する場合に使用される。コーディング。圧縮、符号
化のこと。圧縮はこれに関連してコーディングする場合
の基本動作であるため、コーディングは圧縮を行うため
の動作と理解することができる。デコーディング。伸長
のこと。差分モード。2つのフレーム間、一般的には元
のフレームと符号化されたフレームとの間の差分を符号
化するために使用される画像又はビデオ圧縮技術のこ
と。後者の場合、差分は符号化誤差として示される。歪
み。符号化誤差の尺度のこと。一般に、元の輝度値及び
復号化された輝度値における画素に関する差分のユーク
リッドノルム(Euclidian norm)。符号化。圧縮のこ
と。
【0032】本発明によるソリューションは、いくつか
の既存のソリューションの最良の特性を結合する。要す
るに、本発明は、DCT及びDWT方式から得られたい
くつかの改良点を有するカスケード形VQの変形であ
る。本発明の基本的な態様は、結果として生ずるコード
ベクトルの周波数分布を前もって決定するためにコード
ブックをトレーニングするとき、コードブックを前処理
すること、及び特定のブロックの符号化に必要な差分符
号化用の多数の段階を用いて、各ブロックを独立に符号
化及び復号化することである。本発明は入力として差分
ブロックを受け取り、残余誤差を更に低減するために、
必要なビットを追加するよりも効率的な方法でその差分
ブロックを符号化する。差分ブロックには、基本VQ符
号化、動き補償、DCT、及びDWTを含む任意の考え
られる基本的な符号化の結果を用いることができる。本
発明は、INTER及びINTRA符号化フレームの両
方に関係なく、使用する速度(bps)に比例して画像
品質を著しく向上させる。
【0033】上述した内容によれば、本発明はデータを
圧縮する符号化方法に関する。この方法では、データは
最初に符号化され、元のデータと符号化されたデータと
の間の差分データが形成される。この差分データは、1
つ以上の第1のブロックに分割され、これらの第1のブ
ロックは少なくとも1つの段階で符号化される。各段階
は、符号化の動作と、次の段階で必要な場合は更に現在
の差分ブロックと符号化された現在の差分ブロックとの
間の次の差分ブロックを計算する動作と、を含み、前の
段階で計算された差分ブロックが次の段階の入力になる
ような方法で連続した段階を実行する。各段階では、最
終段階まで、当該段階の符号化に特化したコードブック
を使用する。前の差分ブロックと符号化された前の差分
ブロックとの間の最終的な差分ブロックは、最後のコー
ドブックを用いて符号化される。この差分ブロック用の
コードブックは、トレーニング用差分材料を用いてトレ
ーニングされたコードベクトルを含む。そして、トレー
ニングの前に、重み付けするための各コードベクトルの
周波数分布をデータの特定の情報に個別に適合させるた
めに、また特定のブロックに対して必要な数の段階を用
いて、各ブロックを独立して符号化するために、このト
レーニング用差分材料が前処理される。
【0034】さらに、本発明は、創意に富んだ符号化方
法を使用するエンコーダに関する。この符号化方法で
は、差分をコーディングするために使用される少なくと
も1つのコードブックが特定の周波数分布に対して重み
付けされ、エンコーダは、特定のブロックに対して必要
な数の段階を割り当てるための評価手段を含む。
【0035】さらに、創意に富んだ符号化を考慮する
と、本発明はデータを復元する復号化方法に関する。こ
の方法は、符号化された差分データを復元するコードブ
ックを含む。この場合、少なくとも1つのコードブック
は、特定の周波数分布に重み付けされているコードベク
トルを含む。また、この方法はコードブックを一緒に使
用して、少なくとも最も重要な周波数を含む結果を復元
する。
【0036】またさらに、本発明は、符号化された差分
データを復元するためにコードブックを使用するデコー
ダに関する。この場合、少なくとも1つのコードブック
は、特定の周波数分布に重み付けされている。
【0037】
【発明の実施の形態】図4は、周知のベクトル量子化装
置の例を示す。本発明は装置の性能を著しく向上させ
て、装置を使用することができる範囲を拡張する。本明
細書でブロックが単数で言及される場合、たとえ実際に
は画像の全てのブロックが符号化/復号化される場合で
も、本明細書の理解に役立つように単数形が使用される
ことに注意されたい。
【0038】最初の8×8ブロックを考えてみよう。第
1の段階では、1つのコードブック45を用いて、また
別の方法ではいくつかのコードブック411を用いて、
このブロックがコーディングされる41。理解されるよ
うに、分類されたコードブックをカスケード形VQで使
用することができる。コーディングが最初のブロックに
関係するので、第1の段階は基本モードに属する。最初
のブロックとコーディングされたブロックとの間の差分
416が計算される48。この差分、すなわち、符号化
誤差は、例えば、歪みとして標準的な期間で計算するこ
とができる。
【数1】 ここで、dtotは、N×Nブロック全体の歪みを示し、
i,jはブロックのi番目の行及びj番目の列の画素の
歪みを、Yo i,j及びYe i,jは、それぞれ、最初のブロッ
ク及び符号化されたブロック内のその画素の輝度値を示
す。
【0039】歪みブロックは、4つの4×4のサブブロ
ック417に分割される414。これらのサブブロック
417は、1つのコードブックA46又はいくつかのコ
ードブック412を用いて、第2の段階(差分モード)
で符号化される42。コード化された4×4のブロック
の各差分は、元の4×4の差分ブロックから減算される
49。次に、残りの差分418は、4つの2×2のサブ
ブロックにさらに分割される415。それぞれの2×2
の差分ブロック419は、別の1つのコードブックE又
はいくつかのコードブック413を用いて符号化される
43。各コーディングされた2×2の差分ブロックは、
元の2×2の差分ブロックから減算されて、最終的な残
りの差分が得られる。またブロックサイズが各段階で余
ることがあり、この場合は、ブロックの分割は行われな
いことに注意されたい。
【0040】各コードブックは、実際的な「画像」材料
を用いて、すなわち、コードブックが使用される段階で
発生する実際の差分ブロックを用いる差分モードでトレ
ーニングされる。教示処理は、トレーニングの組をでき
るだけ最良に示す、所与の数のベクトルを見つけること
を含んでいる。これは、標準的なk−meansアルゴ
リズムを用いて行われる。良さ(goodness)の尺度は、各
トレーニング用ベクトルとそれらに最も近い各コードベ
クトルとの間のユークリッド距離の合計である。
【0041】ここまで説明された方法は通常のカスケー
ド形VQに相当し、単純な復号化と同じ長所を有してい
る。本発明は、主要な弱点を解決し、性能を強化するよ
うに設計された2つの改良処理を含んでいる。
【0042】第1に、図5に示すように、コードブック
群のトレーニングで使用されるトレーニング材料は、結
果として得られるコードベクトル群の周波数分布を事前
に決定するために、前処理される51。これは、全ての
トレーニングブロックをコサイン変換し、いくつかのモ
ードの選択をそれらの係数をゼロに設定することにより
取り除き、最後に新しいトレーニングブロックを逆変換
により得ることによって行われる。DCTはトレーニン
グ材料を前処理する唯一の方法ではなく、別の適当な関
数変換も使用することができることに注意されたい。
【0043】この方法の背後の考えは、2つの面を有す
る。1つには、限定された数のビットを低い周波数の誤
差の補正に集中させる方が、全ての周波数を含む全ブロ
ックを補正しようとするよりも視覚的により重要であ
る。周波数を示す係数は、観察者に対する重要性によっ
て評価することができる。目は高い空間周波数に対する
よりも、低い空間周波数に対して、より敏感である。こ
れは、必ずしも絶対的な意味での低い周波数を意味しな
い。なぜなら、ブロックサイズが小さく、関数基底の広
がりが小さいほど、全ての周波数が高くなるからであ
る。言い換えると、結果として生ずるコードベクトル又
はコードベクトル群は、所望の周波数分布に適合され
る。
【0044】第2に、別個の周波数領域(distinct fre
quency regime)でトレーニングされた2つ以上のコー
ドブックの中の全てのコードベクトルは、少なくともほ
ぼ直交しており、互いに補完するように一緒に効率よく
使用することができる。この考えは、基本的な符号化
と、2段階以上の差分符号化と、の組合わせにより得ら
れた可能なコードベクトルの数を増加する。コードベク
トル群を限定された数のDCT周波数に制限すること
で、ベクトルの次元が効果的に減少する。このため、所
与のサイズのコードブックは、周波数の選択が行われな
い場合よりも、トレーニング用ベクトルに良く適合す
る。この事実により、差分ブロック内の視覚的に重要な
要素のさらにより効果的な符号化がもたらされる。
【0045】実際的なアプリケーションによるいくつか
の可能な周波数選択には、最も低い周波数群のみのブロ
ック群、平均値がゼロのブロック群、及び中間的な周波
数のブロック群(第1の場合より高いが、最も高い周波
数ではない)が含まれる。前処理の後、実際のトレーニ
ングが実行され52、そこから最も適合するコードベク
トル群53が求められて、コードブックが形成される。
【0046】標準的なカスケード形VQに対する別の変
形は、差分符号化の空間的な適合性に関する。DWTの
精神では、さらに差分モードを使用することは、各ブロ
ックに対して別個に決定される、すなわち、あるブロッ
クの符号化は、差分符号化のいくつかの連続した段階を
含み、一方その隣接ブロックは、単なる基本モードでか
なりうまく符号化されると判定される。
【0047】図6及び図7は、各ブロックを、それぞ
れ、当該ブロックに応じた数のコーディング段階を用い
てコーディングするための、本発明の簡単な実施例を示
す。図6は、8×8ブロックORGを示す。このブロッ
クORGは、コーディングされ(図4の41と比較され
たい)、最初のブロックとコーディングされたブロック
との間の差分は、最初の段階で4×4のブロックD1A
からD1Dに分割される(図4の417)。この後、各
ブロックはさらにコーディングの段階が必要かどうかを
検討される。元の8×8のブロックが、一様な背景を横
切るライン61を示しているので、第1の段階のコーデ
ィングは、背景のみが存在するブロックD1Aに対して
は十分である。他のブロックD1BからD1Dは、検査
に基づいてさらにコーディングが必要である。
【0048】図7は、第2の段階で、コーディングされ
た4×4の差分ブロック(図4の415)を2×2のブ
ロックD22A〜D22D,D23A〜D23D,及び
D24A〜D24Dに分割することを示す図である。分
割の後、各ブロックはさらなるコーディング段階が必要
かどうかを検討される。ブロックD22A,D22B,
D22C,D23A,D23B,D23C,D24B,
D24C及びD24Dは、一様な背景を横切るライン6
1のうちの重要でない部分のみ、又は単に背景のみ、し
か示していないので、第2の段階のコーディングはこれ
らのブロックに対しては十分である。他のブロックD2
2D,D24A及びD23Dは、コーディングの第3の
段階をさらに必要とする。元の8×8のブロックをコー
ディングした結果として、1つの4×4のブロック、す
なわち、ブロックD1Aは1つの段階を用いてコーディ
ングされ、いくつかの2×2のブロック(ブロックD2
2A,D22B,D22C,D23A,D23B,D2
3C,D24B,D24C及びD24D)は2つの段階
を用いてコーディングされ、また3つの2×2のブロッ
ク(D22D,D24A及びD23D)は3つの段階を
用いてコーディングされる。
【0049】追加のコーディング段階を使用することに
ついての判断は、レート・歪み(rate-distortion)の検
討に基づく。この検討は、ブロックの歪みをいくらか減
少させるためにさらにビットを使用することについての
相対的コストを含む、ある種のコスト関数の形のものに
なる。換言すると、追加の段階を使用するコストが極め
て高い場合は、追加の段階は不要である。コスト関数は
所望の方法で重み付けすることができる。すなわち、歪
みに応じて、使用されるビットのコストを重み付けする
ことができる。さらに、大きな視点で理解する必要があ
るが、重み付けは歪み値(輝度要素又はクロミナンス要
素の歪み値など)当たりの重み付けされたビット使用量
を考慮に入れる。ビット使用量は、歪み値の範囲にわた
って直線的に又は非直線的に重み付けすることができ
る。
【0050】この方法の利点は、各フレームにわたるビ
ット割当ての柔軟性が増加することである。その結果、
簡単な領域を一度補正するか又はそのまま残して、連続
した複数の差分モード及びコードベクトルを用いて、難
しい領域を符号化することができる。この柔軟性によ
り、任意の与えられたビットレートで、差分段階群の使
用が増加する。
【0051】前述した事柄のため、本発明の装置は、追
加のコーディング段階を使用する必要性を検査する評価
手段を必要とする。図8に示すように、この評価手段1
02は、使用される分割モジュール101(図4の41
4,415及び410と比較されたい)の中に実装する
ことが好ましいが、評価手段は別個のモジュールとする
こともできる。
【0052】本発明の好ましい実現本発明の装置は、差
分ブロックを各差分モード段階での入力としてとらえ
る。そしてその差分ブロックを更に符合化し、必要な追
加のビットと比較して残りの誤差を効率的な方法で低減
させる。この差分ブロックは、基本的なVQ符号化、動
き補償、DCT、又はDWTなどの任意の従来の符号化
の結果として得られるものでよい。
【0053】本発明の解決策は2つの部分から構成され
る、すなわち、コードブックのトレーニング及びビデオ
符号化の中でコードブックを使用するアルゴリズムであ
る。例えば、グレースケールのビデオからのフレームを
考えてみよう。このフレームは、8×8のブロックサイ
ズを用いるVQ及び動き補償のある組合わせで符号化さ
れている。結果として生ずる差分画像は4×4のブロッ
クに分割され、これらのブロックは2つの段階で符号化
される。
【0054】第1の差分コードブック、すなわちコード
ブックA、のトレーニングは、現実的な差分材料(ただ
し、最低周波数、すなわち、定数成分が除かれている)
で行われる。標準的なk−meansアルゴリズムは、
低い周波数を強調する傾向があるが、結果として生ずる
ベクトル群に対して架空の有限平均値を生成することは
できない。256個のベクトルを有するコードブックに
ついては、周波数は周波数テーブルの下半分に集中す
る。
【0055】第2の段階のコードブック、すなわちコー
ドブックBは、例えば、最低い周波数群のうちの1/3
が除かれている差分ブロックでトレーニングされる。結
果として得られるコードベクトルは、トレーニングのア
ルゴリズムのためにこれらの周波数にある程度の重みを
有するが、強調はそれらより高い周波数に対しなされ
る。このため、コードブックA及びBからのコードベク
トルは、効果的に互いに補完することができる。コード
ブック間にいくらかの重なりが存在するという事実を利
用して、Aからの2つのベクトル、又はBからの2つの
ベクトル、又は各々から1つのベクトルを結合すること
ができる。重なりは、逆変換の前に変換係数でトレーニ
ングすることによって避けることができる。
【0056】実際の符号化は、先ず各4×4ブロックに
対する最も適合したベクトルをコードブックAから検索
することにより進行する。次に、ブロックごとの歪み削
減量が計算され、導かれるレート歪みコストが、それら
差分ベクトル群を使用しない場合のコストと比較され
る。典型的なコスト関数はC=d+λbである。ここ
で、dは歪み、λは重み係数、そしてbはそのブロック
に使用されるビット数である。重み係数をdに付けた
り、d及びbに別個に付けた重み係数により重み付けを
処理したりすることもできることに注意されたい。コー
ドベクトルは、コストを削減するブロックに対してのみ
選択される。次の段階では、コードブックB内で最も適
合するコードベクトルが、残りの4×4の差分ブロック
に対して検索される。コスト面で効率的である場合の
み、コードベクトルが再度選択される。コードベクトル
の位置は1つのビットで示すことができるため、元の8
×8のブロックのどのサブブロックがコードブックAか
らのベクトルで補正され、どれがコードブックBからの
ベクトルで補正されたかを判断するためには、1バイト
で十分である。
【0057】最後に、コードベクトルはゼロの周りに集
まり、大部分の値は極めて小さい。そのようなコードブ
ックは、受信側に送信する前に効率的に圧縮することが
でき、このため、ビデオ受信者の初期の待ち時間が減少
される。
【0058】図9は、本発明の方法を説明するフローチ
ャートの実施例を示す。第1のステップ81は、トレー
ニングされるコードベクトル群の周波数分布を前もって
決定するために、トレーニング材料を前処理する。前処
理は前もって行われるが、前処理は本発明に基づいて任
意の装置に所望の性能を実現するための本質的なステッ
プである。次のステップ82は、前処理されたトレーニ
ング材料を用いてコードベクトルをトレーニングする。
コードブックが形成される。最後に、コーディング又は
デコーディングについての必要な数の段階を最初の各ブ
ロックに対して別個に使用するというやり方で、情報が
カスケード形VQを用いてコーディング/デコーディン
グされる83。
【0059】図10は、本発明の装置の実施例を示す。
実際に使用する場合、本発明は完全なビデオ圧縮/復元
ソフトウェアの一部として埋め込まれる。圧縮、すなわ
ちコーディング、ソフトウェア91は、通常送信端末9
3の中に配置される。このソフトウェアは、普通は、ユ
ーザーインターフェース、ビデオ及びオーディオの情報
を読み込むメディアリーダ、基本的な符号化のいくつか
の形式、本発明が提案する差分符号化アルゴリズム及び
コードブック、ストリームを送信するいくつかのソリュ
ーション、及びビデオストリームの始めに受信端末94
に送信される小さい復号化ソフトウェアのパッケージ9
2、から構成される。しかしながら、別の方法では、復
号化ソフトウェアは、受信端末の中に永久に配置するこ
とができる。
【0060】本発明は、いくつかの現在のソリューショ
ンの最良の特性を結合する。要するに、本発明はDCT
及びDWTの方式から得られたいくつかの改良を備えた
カスケード形VQの変形である。最初の情報の符号化
は、VQ、動き補償、又はいくつかの関数変換など、任
意の符号化技術を用いて行うことができ、差分情報はV
Qを用いて処理することができることに注意されたい。
本発明の唯一の欠点は、コードブックの検索が遅い可能
性があることである。この検索は、各ブロック及び各コ
ードブックに対して一度行う必要がある。しかしなが
ら、この目的に対して開発されたトリー検索VQなどの
多数の高速検索アルゴリズムのいずれかを用いることに
よって、このことを解決することができる。
【0061】本発明の符号化の大部分をこの出願の中で
説明したが、本発明が復号化にも関係することは明白で
ある。復号化の場合、使用するコードブック群は、特定
の周波数分布に対して重み付けされたコードベクトルを
含む必要がある。これらのコードブック群を一緒に使用
することにより、復元結果は少なくとも最も重要な周波
数群を入手する。本発明に対する多くの別の形式及び適
応も存在する。例えば、いかなる形式のINTRA及び
INTERフレームの「基本」符号化(すなわちブロッ
ク符号化又は非ブロック符号化)、関数変換及びベクト
ル量子化も、本発明の装置に対する根底をなす技術とす
ることができる。その理由は、それらは全て、最初の画
像と符号化/復号化された画像との間に、残余すなわち
差分を残すためである。本発明は、各ステップでブロッ
クサイズが変化する可能性がある一連の差分符号化にお
ける1つのステップとして使用することもできる。換言
すると、各シーケンス(段階)において、差分ブロック
をコーディングする前に、例えばDCTを用いて、差分
ブロックを処理することができる。すなわち、実際のコ
ーディングの前の事前符号化である。どんなブロックサ
イズを有するブロックに関しても、差分を符号化するこ
とができる。差分ベクトル用のベクトルライブラリは、
どのような方法でも、すなわち画像ブロックとしてで
も、画像ブロックの関数変換としてでも、トレーニング
することができる。符号化処理の間に、コードブックを
適応的に修正することもできる。本願で示された符号化
処理及び発想は、RGB、YUV、YCrCb、Cie
LABなどのどのような色表現にも適用することができ
る。
【0062】前記の要求の観点から結論として、優れた
知覚による画像品質を維持し、復号化側では最小の処理
パワーしか必要としないで、高い圧縮比率を実現するビ
デオ圧縮技術に対する要望がある。本発明の発想の範囲
の中で、本発明は多くのソリューションの中で実行する
ことができることは明らかである。
【図面の簡単な説明】
【図1】 大きさがN1×M1画素のフレームの例を示
す図である。
【図2】 フレームを大きさがN×N画素のブロックに
分割した例を示す図である。
【図3】 大きさがN×N画素のブロック、このブロッ
クを示すベクトル、及びこのベクトルを量子化するコー
ドベクトルの例を示す図である。
【図4】 公知のベクトル量子化装置の例を示す図であ
る。
【図5】 本発明による差分材料のトレーニングの実施
例を示す図である。
【図6】 各ブロックに応じた数のコーディング段階で
各ブロックをコーディングするための、本発明の方法の
簡単な実施例を示す図である。
【図7】 各ブロックに応じた数のコーディング段階で
各ブロックをコーディングするための、本発明の方法の
簡単な実施例を示す図である。
【図8】 本発明に係る評価手段を含む装置の実施例を
示す図である。
【図9】 本発明の方法を説明するフローチャートであ
る。
【図10】 本発明の装置の実施例を示す図である。

Claims (44)

    【特許請求の範囲】
  1. 【請求項1】 データがまず符号化され、元のデータと
    符号化されたデータとの間の差分データが形成され、前
    記差分データが1つ以上の第1のブロックに分割され、
    前記第1のブロックは少なくとも1つの段階で符号化さ
    れ、これら各段階が、符号化の動作と、次の段階で必要
    な場合は現在の差分ブロックと符号化された現在の差分
    ブロックとの間の次の差分ブロックを計算する動作とを
    含み、前の段階で計算された差分ブロックが次の段階の
    入力になるような方法で連続した段階を実行し、前記各
    段階では、最終段階まで、当該段階の符号化に特化した
    コードブックを使用し、前の差分ブロックと符号化され
    た前の差分ブロックとの間の最終的な差分ブロックが、
    最後のコードブックを用いて符号化され、前記差分ブロ
    ック用のコードブックが、トレーニング用差分材料を用
    いてトレーニングされたコードベクトルを含む、データ
    を圧縮する符号化方法であって、トレーニングの前に、
    前記トレーニング用差分材料が、重み付けするための各
    コードベクトルの周波数分布を前記データの情報に個別
    に適合させるために、及び前記各ブロックを当該ブロッ
    クに対して必要な数の段階を用いて独立して符号化する
    ために、前処理されることを特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法であって、前記段
    階の少なくとも1つにおいて、前記差分ブロックが前記
    次の段階における差分ブロックとして使用されるために
    サブブロックに分割されることを特徴とする方法。
  3. 【請求項3】 請求項1に記載の方法であって、前記段
    階の少なくとも1つにおいて、2つ以上のコードブック
    が使用されることを特徴とする方法。
  4. 【請求項4】 請求項2に記載の方法であって、前記段
    階の少なくとも1つにおいて、2つ以上のコードブック
    が使用されることを特徴とする方法。
  5. 【請求項5】 請求項1に記載の方法であって、前記ト
    レーニング材料の前処理が離散コサイン変換を用いて行
    われることを特徴とする方法。
  6. 【請求項6】 請求項1に記載の方法であって、前記ト
    レーニング材料の前処理が任意の関数変換を用いて行わ
    れることを特徴とする方法。
  7. 【請求項7】 請求項1に記載の方法であって、前記必
    要な数の段階が、コスト関数を用いて、追加の段階を使
    用するコストが極めて高い場合には前記追加の段階を不
    要にするような方法で達成されることを特徴とする方
    法。
  8. 【請求項8】 請求項7に記載の方法であって、前記コ
    スト関数が、残りの差分と、前記段階群のコストを示す
    ビット数であって当該ブロックをコーディングするため
    に使用されるビット数と、を考慮することを特徴とする
    方法。
  9. 【請求項9】 請求項8に記載の方法であって、前記ビ
    ット数が重み付けられていることを特徴とする方法。
  10. 【請求項10】 請求項2に記載の方法であって、前記
    トレーニング材料の前処理が、離散コサイン変換を用い
    て行われることを特徴とする方法。
  11. 【請求項11】 請求項2に記載の方法であって、前記
    トレーニング材料の前処理が、任意の関数変換を用いて
    行われることを特徴とする方法。
  12. 【請求項12】 請求項2に記載の方法であって、前記
    必要な数の段階が、コスト関数を用いて、追加の段階を
    使用するコストが極めて高い場合には前記追加の段階を
    不要にするような方法で達成されることを特徴とする方
    法。
  13. 【請求項13】 請求項12に記載の方法であって、前
    記コスト関数が、残りの差分と、前記段階群のコストを
    示すビット数であって当該ブロックをコーディングする
    ために使用されるビット数と、を考慮することを特徴と
    する方法。
  14. 【請求項14】 請求項13に記載の方法であって、前
    記ビット数が重み付けられていることを特徴とする方
    法。
  15. 【請求項15】 請求項3に記載の方法であって、前記
    トレーニング材料の前処理が、離散コサイン変換を用い
    て行われることを特徴とする方法。
  16. 【請求項16】 請求項3に記載の方法であって、前記
    トレーニング材料の前処理が、任意の関数変換を用いて
    行われることを特徴とする方法。
  17. 【請求項17】 請求項3に記載の方法であって、前記
    必要な数の段階がコスト関数を用いて、追加の段階を使
    用するコストが極めて高い場合には前記追加の段階を不
    要にするような方法で、達成されることを特徴とする方
    法。
  18. 【請求項18】 請求項17に記載の方法であって、前
    記コスト関数が、残りの差分と、前記段階群のコストを
    示すビット数であって当該ブロックをコーディングする
    ために使用されるビット数と、を考慮することを特徴と
    する方法。
  19. 【請求項19】 請求項18に記載の方法であって、前
    記ビット数が重み付けられていることを特徴とする方
    法。
  20. 【請求項20】 請求項4に記載の方法であって、前記
    トレーニング材料の前処理が、離散コサイン変換を用い
    て行われることを特徴とする方法。
  21. 【請求項21】 請求項4に記載の方法であって、前記
    トレーニング材料の前処理が、任意の関数変換を用いて
    行われることを特徴とする方法。
  22. 【請求項22】 請求項4に記載の方法であって、前記
    必要な数の段階が、コスト関数を用いて、追加の段階を
    使用するコストが極めて高い場合には前記追加の段階を
    不要にするような方法で、達成されることを特徴とする
    方法。
  23. 【請求項23】 請求項22に記載の方法であって、残
    りの差分と、前記段階群のコストを示すビット数であっ
    て当該ブロックをコーディングするために使用されるビ
    ット数と、を考慮することを特徴とする方法。
  24. 【請求項24】 請求項23に記載の方法であって、前
    記ビット数が重み付けられていることを特徴とする方
    法。
  25. 【請求項25】 請求項1に記載の方法であって、前記
    段階の少なくとも1つにおいて、前記差分ブロックが符
    号化の前に前処理されることを特徴とする方法。
  26. 【請求項26】 請求項2に記載の方法であって、前記
    段階の少なくとも1つにおいて、前記差分ブロックが符
    号化の前に前処理されることを特徴とする方法。
  27. 【請求項27】 符号化された差分データを復元するた
    めのコードブック群を含む、データを復元する復号化方
    法であって、前記コードブックの中の少なくとも1つが
    コードベクトルを含み、該コードベクトルは特定の周波
    数分布に対して重み付けされ、前記コードブック群を一
    緒に使用して少なくとも最重要周波数を含むデータ復元
    結果を得ることを特徴とする復号化方法。
  28. 【請求項28】 データがまず符号化され、元のデータ
    と符号化されたデータとの間の差分データが形成され、
    前記差分データが1つ以上の第1のブロックに分割さ
    れ、前記第1のブロックは少なくとも1つの段階で符号
    化され、これら各段階が符号化の動作と、次の段階で必
    要な場合は現在の差分ブロックと符号化された現在の差
    分ブロックとの間の次の差分ブロックを計算する動作と
    を含み、前の段階で計算された差分ブロックが次の段階
    の入力になるような方法で連続した段階を実行し、前記
    各段階では、最終段階まで、当該段階の符号化に特定し
    たコードブックを使用し、前の差分ブロックと符号化さ
    れた前の差分ブロックとの間の最終的な差分ブロック
    が、最後のコードブックを用いて符号化され、前記差分
    ブロック用のコードブックが、トレーニング用差分材料
    を用いてトレーニングされたコードベクトルを含む、デ
    ータを圧縮するエンコーダであって、差分をコーディン
    グするために使用される前記少なくとも1つのコードブ
    ックが特定の周波数分布に対して重み付けされ、前記エ
    ンコーダが、ブロックに対して必要とされる段階の数を
    割り当てる評価手段を含むことを特徴とするエンコー
    ダ。
  29. 【請求項29】 請求項28に記載のエンコーダであっ
    て、前記段階の少なくとも1つにおいて、前記差分ブロ
    ックが前記次の段階における差分ブロックとして使用さ
    れるためにサブブロックに分割されることを特徴とする
    エンコーダ。
  30. 【請求項30】 請求項28に記載のエンコーダであっ
    て、前記段階の少なくとも1つにおいて、2つ以上のコ
    ードブックが使用されることを特徴とするエンコーダ。
  31. 【請求項31】 請求項29に記載のエンコーダであっ
    て、前記段階の少なくとも1つにおいて、2つ以上のコ
    ードブックが使用されることを特徴とするエンコーダ。
  32. 【請求項32】 請求項28に記載のエンコーダであっ
    て、前記評価手段が追加の段階を使用するコストを計算
    するコスト関数をさらに含むことを特徴とするエンコー
    ダ。
  33. 【請求項33】 請求項32に記載のエンコーダであっ
    て、前記コスト関数が、残りの差分と、前記段階群のコ
    ストを示すビット数であって当該ブロックをコーディン
    グするために使用されるビット数と、を考慮することを
    特徴とするエンコーダ。
  34. 【請求項34】 請求項33に記載のエンコーダであっ
    て、前記ビット数が重み付けられていることを特徴とす
    るエンコーダ。
  35. 【請求項35】 請求項29に記載のエンコーダであっ
    て、前記評価手段が追加の段階を使用するコストを計算
    するコスト関数をさらに含むことを特徴とするエンコー
    ダ。
  36. 【請求項36】 請求項35に記載のエンコーダであっ
    て、前記コスト関数が、残りの差分と、前記段階群のコ
    ストを示すビット数であって当該ブロックをコーディン
    グするために使用されるビット数と、を考慮することを
    特徴とするエンコーダ。
  37. 【請求項37】 請求項36に記載のエンコーダであっ
    て、前記ビット数が重み付けられていることを特徴とす
    るエンコーダ。
  38. 【請求項38】 請求項30に記載のエンコーダであっ
    て、前記評価手段が追加の段階を使用するコストを計算
    するコスト関数をさらに含むことを特徴とするエンコー
    ダ。
  39. 【請求項39】 請求項38に記載のエンコーダであっ
    て、前記コスト関数が、残りの差分と、前記段階群のコ
    ストを示すビット数であって当該ブロックをコーディン
    グするために使用されるビット数と、を考慮することを
    特徴とするエンコーダ。
  40. 【請求項40】 請求項39に記載のエンコーダであっ
    て、前記ビット数が重み付けられていることを特徴とす
    るエンコーダ。
  41. 【請求項41】 請求項31に記載のエンコーダであっ
    て、前記評価手段が追加の段階を使用するコストを計算
    するコスト関数をさらに含むことを特徴とするエンコー
    ダ。
  42. 【請求項42】 請求項41に記載のエンコーダであっ
    て、前記コスト関数が、残りの差分と、前記段階群のコ
    ストを示すビット数であって当該ブロックをコーディン
    グするために使用されるビット数と、を考慮することを
    特徴とするエンコーダ。
  43. 【請求項43】 請求項42に記載のエンコーダであっ
    て、前記ビット数が重み付けられていることを特徴とす
    るエンコーダ。
  44. 【請求項44】 符号化された差分データを復元するた
    めにコードブックを使用するデコーダであって、前記コ
    ードブックの少なくとも1つが特定の周波数分布に対し
    て重み付けされていることを特徴とするデコーダ。
JP2002315144A 2001-10-30 2002-10-30 符号化方法及び装置 Pending JP2003188733A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20012095A FI112424B (fi) 2001-10-30 2001-10-30 Koodausmenetelmä ja -järjestely
FI20012095 2001-10-30

Publications (1)

Publication Number Publication Date
JP2003188733A true JP2003188733A (ja) 2003-07-04

Family

ID=8562146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002315144A Pending JP2003188733A (ja) 2001-10-30 2002-10-30 符号化方法及び装置

Country Status (6)

Country Link
US (1) US20030081852A1 (ja)
EP (1) EP1324618A3 (ja)
JP (1) JP2003188733A (ja)
KR (1) KR20030036021A (ja)
CN (1) CN1418014A (ja)
FI (1) FI112424B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006295829A (ja) * 2005-04-14 2006-10-26 Nippon Hoso Kyokai <Nhk> 量子化装置、量子化プログラム、及び信号処理装置
JP2008524893A (ja) * 2004-12-15 2008-07-10 ティーディーエフ 伝送チャネルを解する可変ビットレート送信方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1387722A (zh) * 1999-08-27 2002-12-25 株式会社塞拉特姆技术 图像压缩方法
US7295702B2 (en) * 2002-03-28 2007-11-13 Color Savvy Systems Limited Method for segmenting an image
WO2003103288A1 (en) * 2002-05-29 2003-12-11 Diego Garrido Predictive interpolation of a video signal
US7129954B2 (en) * 2003-03-07 2006-10-31 Kabushiki Kaisha Toshiba Apparatus and method for synthesizing multi-dimensional texture
US8824553B2 (en) 2003-05-12 2014-09-02 Google Inc. Video compression method
JP4617644B2 (ja) * 2003-07-18 2011-01-26 ソニー株式会社 符号化装置及び方法
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
US20060080090A1 (en) * 2004-10-07 2006-04-13 Nokia Corporation Reusing codebooks in parameter quantization
AU2005239628B2 (en) * 2005-01-14 2010-08-05 Microsoft Technology Licensing, Llc Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
US7692647B2 (en) * 2006-09-14 2010-04-06 Microsoft Corporation Real-time rendering of realistic rain
US8819525B1 (en) * 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
USD759062S1 (en) 2012-10-24 2016-06-14 Square, Inc. Display screen with a graphical user interface for merchant transactions
GB2513110A (en) 2013-04-08 2014-10-22 Sony Corp Data encoding and decoding

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI92272C (fi) * 1992-05-20 1994-10-10 Valtion Teknillinen Kuvansiirtojärjestelmän tiivistyskoodausmenetelmä
US5398069A (en) * 1993-03-26 1995-03-14 Scientific Atlanta Adaptive multi-stage vector quantization
US5909513A (en) * 1995-11-09 1999-06-01 Utah State University Bit allocation for sequence image compression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008524893A (ja) * 2004-12-15 2008-07-10 ティーディーエフ 伝送チャネルを解する可変ビットレート送信方法
JP2006295829A (ja) * 2005-04-14 2006-10-26 Nippon Hoso Kyokai <Nhk> 量子化装置、量子化プログラム、及び信号処理装置

Also Published As

Publication number Publication date
FI20012095A0 (fi) 2001-10-30
FI20012095A (fi) 2003-05-01
EP1324618A2 (en) 2003-07-02
EP1324618A3 (en) 2004-06-09
FI112424B (fi) 2003-11-28
KR20030036021A (ko) 2003-05-09
US20030081852A1 (en) 2003-05-01
CN1418014A (zh) 2003-05-14

Similar Documents

Publication Publication Date Title
KR102287947B1 (ko) 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
EP3354030B1 (en) Methods and apparatuses for encoding and decoding digital images through superpixels
US6571016B1 (en) Intra compression of pixel blocks using predicted mean
US7162091B2 (en) Intra compression of pixel blocks using predicted mean
US7194128B1 (en) Data compression using principal components transformation
US20070053429A1 (en) Color video codec method and system
KR20040018400A (ko) Golomb-rice 코딩을 사용한 dct 압축
WO2001050768A2 (en) Method and apparatus for video compression using sequential frame cellular automata transforms
JP2003188733A (ja) 符号化方法及び装置
US7564382B2 (en) Apparatus and method for multiple description encoding
Sindhu et al. Images and its compression techniques-A Review
US20020191695A1 (en) Interframe encoding method and apparatus
JPH11177985A (ja) 高速の画像圧縮のための方法および装置
WO2001050769A1 (en) Method and apparatus for video compression using multi-state dynamical predictive systems
US20030223633A1 (en) Method and system for compressing digital images
Prantl Image compression overview
EP1367834A2 (en) Method and arrangement for forming HCVQ vector library
Koc et al. Technique for lossless compression of color images based on hierarchical prediction, inversion, and context adaptive coding
Sathappan et al. Block based prediction with Modified Hierarchical Prediction image coding scheme for Lossless color image compression
JPH01213067A (ja) 画像伝送方法
Akramullah et al. Digital Video Compression Techniques
JPH01213085A (ja) 画像符号化伝送方法
Bhagyashree Image compression using AMBTC technique
JPH01213084A (ja) 画像符号化方式
JP2003274400A (ja) 画像処理方法、画像処理装置、コンピュータプログラム及び記録媒体