[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2012526426A - スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム - Google Patents

スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム Download PDF

Info

Publication number
JP2012526426A
JP2012526426A JP2012508901A JP2012508901A JP2012526426A JP 2012526426 A JP2012526426 A JP 2012526426A JP 2012508901 A JP2012508901 A JP 2012508901A JP 2012508901 A JP2012508901 A JP 2012508901A JP 2012526426 A JP2012526426 A JP 2012526426A
Authority
JP
Japan
Prior art keywords
layer
prediction
representation
residual
layer representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012508901A
Other languages
English (en)
Other versions
JP5504336B2 (ja
Inventor
トマス ルザート,
ケネス アンデション,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2012526426A publication Critical patent/JP2012526426A/ja
Application granted granted Critical
Publication of JP5504336B2 publication Critical patent/JP5504336B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオシーケンス(10)を符号化するスケーラブルビデオ符号化方法の結果、ビデオシーケンス(10)の2つの層表現(20、2O)に分割可能なビットストリーム(20}が得られる。第2の層表現(2O)は、第1の層表現(2O)と比較して強化された分解能を有する。方法は、第2の層における既に再構成された画素(14)を使用して第2の層について予測符号化パラメータを生成すること(si)を備える。方法は、第1の層予測信号を生成するために予測符号化パラメータ及び第2の層における既に再構成された画素(14)を使用して第1の層について予測を実行すること(s2)を更に備える。方法は、元の画像と第1の層予測信号との差に基づいて第1の層残差を生成すること(s3)を更に備える。予測符号化パラメータ及び第1の層残差は、第1の層表現(2O)として符号化される(s4)。符号器(30)及びコンピュータプログラムが更に提供される。

Description

本発明は、ビデオシーケンスをビットストリームに符号化するスケーラブルビデオ符号化方法に関する。更に本発明は、符号器及び符号器上で実行される場合に符号器に上述の方法を実行させるように構成された命令を含むコンピュータプログラムに関する。
スケーラブルビデオ符号化(SVC)により、単一のビットストリーム内で同一のビデオシーケンスのいくつかの表現の符号化及び送信が可能になり、符号化後且つ送信前に必要に応じて又は要望に応じてビットストリームから1つ以上の表現の削除が可能になる。各表現は、ビデオシーケンスの特定の時間分解能、空間分解能又は忠実度分解能に対応する。
デジタルビデオ符号化のコンテキストのスケーラビリティは、使用可能な帯域幅リソースの減少等の送信条件の悪化又は輻輳の発生等のネットワーク状態の変化に応答して分解能を潔く低下させるか、あるいは受信機又は受信機側の復号器の機能(表示分解能、処理能力又はバッテリ電源等)、要求又は基本設定に適応するのに有用である。ビットストリームスケーラビリティとも呼ばれるスケーラビリティにより、必要に応じて又は要望に応じてビットストリームのある特定の部分の破棄が可能になるため、必要なビットレートは、符号化後に、すなわち符号化処理自体の変更を必要とせずに適応される。符号化がコンピュータを多用するタスクである可能性があるため、最も必要な分解能についてビットストリームを符号化し、その後再度符号化する必要なくビットストリームのいくつかの部分を除去できることは有用である。換言すると、SVCは、表現のうちのいくつかのみを送出することにより、ビットストリームを部分的に送信し且つ復号化できる。ビットストリーム(SVCビットストリームとも呼ばれる)に符号化された各表現を層と呼ぶ。
最も低い層は基本層と呼ばれ、連続した上位層は強化層又は強化された層と呼ばれる。スケーラビリティは、少なくとも基本層及び強化層の符号化を含む。複数の強化層が提供されてもよい。例えば、基本層は、低空間分解能(例えば、クォータVGA、すなわちクォータビデオグラフィックスアレイを表し且つ320×240分解能に対応するQVGA)でビデオシーケンスを示してもよく、強化層は、より高い空間分解能(例えば、ビデオグラフィックスアレイを表し且つ通常640×480分解能に対応するVGA)でビデオシーケンスを示してもよい。漠然と、元のビデオシーケンスの画像(符号化される場合に「アクセスユニット」と呼ばれる場合もある)毎に、強化層は、基本層により提供される表現と比較して改良された画像の表現を提供する。
ビデオ符号化のスケーラビリティは、サイマルキャスト符号化、すなわち各表現を個別に符号化することとは異なる。一般にSVCは、サイマルキャスト符号化よりも効率的であるべきである。SVCにおいて、層の符号化(例えば、個別に符号化されてもよい基本層を除く)は、別の層に割り当てられた帯域幅のうちのいくつか又はビットストリームのビットのうちのいくつかを再利用すべきである。
ビデオ符号化は予測符号化技術を含むことが多い。これらの技術は、特に、特定の順序で考慮された画像間又は画素間の差の符号化に基づく。符号化側でビデオシーケンスの画像又は画素が処理される際の順序、すなわち予測される際の順序は、それらが復号化側で再構成される際の順序とほぼ同一である。例えば、アンカ画像と呼ばれてもよいいくつかの画像の復号化は、先に復号化された画像を利用しなくてもよい。これに対して、他の画像又はピクチャを復号化するには、基準ピクチャと呼ばれてもよい少なくとも1つにおける既に復号化されたピクチャを利用する必要がある。ビデオ符号化規格は、通常、符号化に使用される特定の方法を特定しないが、受信機側で使用される復号化方法を特定する。予測符号化技術は、符号化側の以下のステップを示してもよい。
第1に、符号化モード及び動きベクトル等の予測符号化パラメータとも呼ばれてもよい符号化パラメータは、先に再構成された1つ以上の画像、画素又は画素ブロックから符号化される画像を最も効率的に再構成するために選択される。これらの符号化パラメータは、送信するためにビットストリームに符号化される。
第2に、選択された予測符号化パラメータは、符号化側でビデオシーケンスの画像に適用される。このステップの結果は、これらの予測符号化パラメータが画像を復号化するために使用される場合にのみ、いわゆる復号化側で先に再構成された画像、画素又は画素ブロックからの予測、すなわち所定の画像、画素又は画素ブロックが復号化側で予測される方法を構成する。換言すると、予測は、所定の画像又はその一部が復号化側で予測される方法の符号化側の予測である。例えば、パラメータが動きベクトルである場合、予測はいわゆる動き補償予測である。
第3に、残差(すなわち、予測誤差)は、元の画像(実際のピクチャ)と予測符号パラメータ(予測されたピクチャ)に基づく予測の結果との差を計算することにより算出される。残差は、送信するためにビットストリームに更に符号化される(上述したように、予測符号化パラメータと共に)。
復号化側で、ビデオシーケンスの画像、画素又は画素ブロックは、特定の順序で再構成される。予測符号化パラメータは、既に再構成されたビデオシーケンスの画像、画素又は画素ブロックから画像、画素又は画素ブロックを予測するために使用され、残差はこれらの予測を補正するために使用される。
予測符号化技術の種類には、イントラ符号化及びインタ符号化がある。イントラ符号化、すなわちイントラピクチャ符号化は、同一の画像の空間的隣接領域(すなわち、復号化側で最初に再構成される隣接画素又は隣接領域)からの空間予測を使用する。イントラピクチャ符号化は、1つの画像の画素領域間の空間的相関関係を利用する。逆に、インタ符号化、すなわちインタピクチャ符号化は、時間的隣接画像(すなわち、復号化側で最初に再構成される隣接画像)からの時間的予測を使用する。インタピクチャ符号化は、画像間の時間的相関関係を利用する。イントラ符号化及びインタ符号化を組み合わせてもよい。
これらの予測符号化技術に加え、インタ層予測はSVCに適している。インタ層予測において、ビデオシーケンスの下位表現からの可能な限り多くの情報は、ビデオシーケンスの上位表現を符号化するために使用される。換言すると、全体的な符号化効率を向上するために、上位層を予測するために符号化された下位階層からの情報を使用することにより、層間の冗長性を考慮する。
スケーラビリティを提供するビデオ符号化規格の一例は、非特許文献1)である。annex G「Scalable video coding」は、SVC技術の例を開示する。この付録上で開示された技術の概要は、非特許文献2で提供される。非特許文献2の第I章及び第II章は、ビデオ符号化のコンテキストで特にスケーラビリティについて説明する。
可能な限り符号器及び復号器を複雑にすることなく、スケーラブルビデオ符号化の効率を向上させるような方法、符号器及びコンピュータプログラムを提供するのが望ましい。
H.264/AVC規格, ITU-T、H.264(11/2007)、シリーズH:Audiovisual and Multimedia Systems, Infrastructure of audiovisual services-Coding of moving video, Advanced video coding for generic audiovisual services、(オーディオビジュアル及びマルチメディアシステム、オーディオビジュアルサービスのインフラストラクチャ−動画の符号化、汎用オーディオビジュアルサービスのためのAVC)ITU−T勧告H.264 Schwarz H., Marpe D. Wiegand T., Overview of the Scalable Video Coding Extension of the H.264/AVC standard, IEEE Trans. Circuits Syst. Video Technol. Vol. 17, no.9, 1103-1120, September, 2007 (シュワルツ H, マープ D、ウィーガンド T. H.264/AVC規格のスケーラブルビデオ符号化拡張の概説、IEEEトランザクション、回路システム、ビデオ技術、17巻、9号、1103-1120ページ、2007年9月)
上記目的を達成するかあるいは少なくとも部分的に達成するため、本発明に係るそのような方法、符号器及びコンピュータプログラムは独立請求項に規定される。特定の実施形態は従属請求項に規定される。
一実施形態において、スケーラブルビデオ符号化方法は、ビデオシーケンスをビットストリームに符号化するための方法である。結果として得られるビットストリームは、少なくともビデオシーケンスの第1の層表現及び第2の層表現に分割可能であり、第2の層表現は、第1の層表現と比較して強化された空間分解能又は品質(SNR)分解能を有する。方法は、再構成された第2の層表現における既に再構成された画素を使用してビデオシーケンスの画像の少なくとも1つの領域の第2の層表現について予測符号化パラメータを生成するステップを備える。方法は、第1の層予測信号と呼ぶところの予測信号を生成するために予測符号化パラメータ及び再構成された第2の層表現における既に再構成された画素を使用してビデオシーケンスの画像の少なくとも1つの領域の第1の層表現について予測を実行するステップを更に備える。方法は、ビデオシーケンスの画像の少なくとも1つの領域と第1の層予測信号との差に基づいて、第1の層残差と呼ぶところの残差を生成するステップを更に備える。方法は、第1の層表現の少なくとも一部として予測符号化パラメータ及び第1の層残差を符号化するステップを更に備える。
「スケーラブルビデオ符号化」という表現は、背景技術の節で説明された意味の範囲内で本明細書で使用される。すなわち、一般にサイマルキャストよりも効率的であり、要望に応じて符号化後且つ送信前にビットストリームから第2の層表現等の層表現の破棄が可能になるビデオ符号化技術である。更にこれは、背景技術の節で提供された説明に準拠して「分割可能」であることを意味する。ビットストリームを作成した後、それらのいくつかの部分を破棄することによりブットストリームを分割し、ビデオシーケンスの第1の層表現のみを送信することが可能である。
「スケーラブルビデオ符号化」という表現は、多視点符号化又はスケーラブル多視点符号化のコンテキストでの適用可能性を本明細書で更に範囲に含む。多視点符号化において、従来のビデオ符号化でのように単一のカメラビューを符号化するのではなく、多視点は1つのビットストリームに共に符号化される。効率的な多視点符号化のために、予測符号化方法が適用されてもよい。これらは、単一視点映像符号化におけるような同様の動き補償インタ予測方法及び動き補償イントラ予測方法を含んでもよい。また、種々の視点間の予測が適用されてもよく、不一致が補償されてもよい。本明細書において、ピクチャが異なる時点の同一の視点からのものではなく、同一の時点の異なる視点からのものであるという点を除いて、不一致補償はインタ予測に対する動き補償に類似する。多視点映像符号化の一例は、2009年4月の時点で開発中のH.264/AVC規格に追加された「多視点映像符号化」である。同様の従来のビデオ符号化、多視点映像符号化は、一実施形態において本発明が適用されるスケーラビリティ機能を含んでもよい。
ビットストリームは、無線通信チャネル等の通信チャネルで送信されてもよい。ビットストリームは、後でコンピュータ可読媒体のコンテンツを復号化するためにコンピュータ可読媒体上に更に格納されてもよい。ビットストリームは、1つ以上の符号化されたビデオシーケンスを形成する符号化されたピクチャ及び関連付けられたデータの表現を形成するビットのシーケンスである。
第1の層表現及び第2の層表現は、それぞれ、基本層及び強化層であってもよい。あるいは、第1の層表現及び第2の層表現は、それぞれ、第1の強化層及び第2の強化層であってもよく、第2の強化層は、第1の強化層と比較して強化された空間分解能又は品質(SNR)分解能を有する。
生成された予測符号化パラメータは、1つ以上における既に再構成された画像から符号化される画像を効率的に再構成するために使用されたパラメータである。「再構成する」及び「再構成された」という用語は、復号化側の再構成処理をより適切に反映するが、ビットストリームにおいて必要な情報の符号化側の符号化を反映するために本明細書で使用されることにより、復号化側の再構成を可能にする。例えば予測符号化パラメータは、空間的隣接がイントラ符号化で使用されるか(及びその場合に使用されるイントラ符号化モード、すなわち予測符号化パラメータは、この場合イントラ符号化モード判断パラメータである)、時間的隣接がインタ符号化で使用されるか(符号化ベクトルの選択等、すなわち予測符号化パラメータは、この場合モード推定パラメータである)又は双方が使用されるか(予測符号化パラメータは、この場合モード判断パラメータである)を表してもよい。
予測符号化パラメータは、第2の層表現について、すなわち第2の層表現の分解能の画像情報に基づいて生成される。換言すると、予測符号化パラメータは、第2の層上で選択されるかあるいは生成される。
次に、第1の層の予測信号を生成するために、第2の層で生成された予測符号化パラメータに基づいて且つ第2の層(すなわち、換言すると、再構成された第2の層表現と呼ばれてもよいもの)からの既に再構成された画素を使用して予測が実行される。第1の層の予測信号、すなわち第1の層予測信号は、第1の層表現の分解能における画像の少なくとも1つの領域の予測された画素である。
次に第1の層残差は、第1の層の分解能で元の無圧縮画像から第1の層予測信号を減算することにより生成される。次に、予測符号化パラメータ及び第1の層残差(場合によっては最初に量子化された)は、第1の層表現の一部としてビットストリームに、すなわち第1の層表現と関連付けられたビットストリームの部分又は第1の層表現に割り当てられたビットストリームの部分に符号化される。
本発明は、SVCモードで効率的な符号化、すなわち適切な圧縮効率を提供する。適切な圧縮効率は、本明細書である特定のビットレートに対して達成される低いビデオ雑音レベルを示す。同時に、計算量及びメモリ消費量は殆ど増加しない。
従来技術に対する本発明の技術的効果をより詳細に理解するために、本発明をいわゆるSVCボトムアップ符号化処理と比較するのが有用である。ボトムアップ符号化処理において、最初に基本層について符号化を実行し(後続の強化層符号化を考慮せずに)、次に後続の強化層について符号化を連続して実行する。この結果、基本層と強化層との間で符号化効率損失が不均一に分配される。これにより、強化層について部分最適圧縮効率が更に得られる。
ボトムアップ符号化のこれらの問題に対する解決方法は、Schwarz H.他、R-D optimized multi-layer encoder control for SVC(SVCのためのR-D最適化マルチレイヤエンコーダ制御)、ICIP2007, II-281-284ページに提案される。しかし、この文献に提案された結合BL−EL最適化により複雑さが増す可能性がある。本発明は、符号化の複雑さを可能な限り低く維持しつつ強化された層の圧縮効率を向上させる別の解決方法を提案する。
一実施形態において、方法は、第1の層予測信号を生成するために予測を実行するステップが動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行することを備えるような方法である。
これらの3つの予測技術のうちの2つ又は3つの組合せは、いくつかのピクチャの全てあるいはいくつかの領域又はマクロブロックについて使用されてもよい。
一実施形態において、方法は、復号化時に、第1の層表現と関連付けられた予測符号化パラメータが第2の層表現についても使用されるべきことを示す望遠指示と呼ぶところの指示を、第2の層表現の少なくとも一部として符号化するステップを更に備える。
本実施形態により、第2の層表現について予測符号化パラメータを再度符号化する必要はなく、効率的な第2の層表現の符号化が可能になる。
本実施形態のサブ実施形態において、第2の層表現の少なくとも一部として符号化するステップは、復号化時に、ビデオシーケンスの画像の少なくとも1つの領域と第2の層予測信号との差を近似する、第2の層残差と呼ぶところの残差を生成するために第1の層残差を使用すべきことを示すインタ層予測残差指示と呼ぶところの指示を符号化することを更に備える。
本サブ実施形態により、効率的な予測符号化パラメータの符号化及び第2の層表現に対する残差の双方が可能になる。
本実施形態の別のサブ実施形態又は上述のサブ実施形態との組合せにおいて、方法は、第2の層予測信号と呼ぶところの予測信号を生成するために予測符号化パラメータ及び再構成された第2の層表現における既に再構成された画素を使用して、ビデオシーケンスの画像の少なくとも1つの領域の第2の層表現について予測を実行するステップと、ビデオシーケンスの画像の少なくとも1つの領域と第2の層予測信号との差に基づいて第2の層残差と呼ぶところの残差を生成するステップとを更に備え、第2の層表現の少なくとも一部として符号化するステップは、第2の層残差を符号化することを更に備える。
2つの上記のサブ実施形態が組み合わされる一実施形態において、復号化する場合に第1の残差が第2の層残差を生成するために使用されることを示す中間層予測残差指示及び第2の層残差の双方は、ビデオシーケンスの画像の少なくとも1つの領域を再構成するために共に使用される。これにより、中間層の冗長性を最適に使用できるようになる。
一実施形態において、第2の層予測信号を生成するために予測を実行するステップは、動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行することを備える。
これらの3つの予測技術のうちの2つ又は3つの組合せは、第2の層予測信号を生成するために予測を実行する場合、いくつかのピクチャの全てあるいはいくつかの領域又はマクロブロックについて更に使用されてもよい。
一実施形態において、方法は、予測符号化パラメータを生成するステップがインタ符号化技術及びイントラ符号化技術のうちの少なくとも1つを選択することと、選択するステップに従って、インタ符号化技術が選択された場合はインタ符号化パラメータ及びイントラ符号化技術が選択された場合はイントラ符号化パラメータのうちの少なくとも1つを生成することとを備えるような方法である。
一実施形態において、方法は、予測符号化パラメータを生成するステップ及び第1の層残差を生成するステップが第2の層表現に関して最適化されるような方法である。これにより、第2の層表現について効率的な符号化が可能になる。
一実施形態において、方法は、第2の層表現が第1の層表現と比較して強化された空間分解能を有し、且つ第1の層予測信号を生成するために予測を実行するステップが、予測符号化パラメータ及び再構成された第2の層表現における既に再構成された画素をダウンサンプルした後、予測符号化パラメータ及び再構成された第2の層表現における既に再構成された画素を使用して実行されるような方法である。
本実施形態において、空間スケーラビリティは、第2の層表現について生成された予測符号化パラメータ及び第2の層表現における既に再構成された画素をダウンサンプルすることにより達成され、第1の層予測信号を生成するために予測を実行するステップは、第1の層表現の分解能に適応された予測符号化パラメータを使用して実行される。例えばこれは、動きベクトルの分解能を低下させることを含んでもよい。
一実施形態において、方法は、第2の層表現が第1の層表現と比較して強化された品質(SNR)分解能を有し、且つ第1の層予測信号を生成するために予測を実行するステップが、予測符号化パラメータを全く変更せずに使用して実行されるような方法である。
本実施形態において、品質(SNR)スケーラビリティが達成され、第1の層予測信号は、第2の層表現について生成された予測符号化パラメータを適応することを全く必要としない単純な方法で生成されてもよい。
一実施形態において、方法は、予測符号化パラメータを生成するステップが、少なくともインタ符号化技術を選択することと、ビデオシーケンスの画像の少なくとも1つの領域がBスライスとして予測的に符号化されるような方法で少なくともインタ符号化パラメータを生成することとを備えるような方法である。Bスライスは、各ブロックのサンプル値を予測するために多くて2つの動きベクトル及び基準を使用するイントラ層のイントラ予測又はインタ予測を使用して復号化されてもよいスライスである。
更にボトムアップ符号化は、いくつかのピクチャ領域又はピクチャについて本発明で使用されてもよいが、他のピクチャ領域又はピクチャについては使用されない。
更に本発明は、一実施形態において、ビデオシーケンスをブットストリームに符号化するように構成されたスケーラブルビデオ符号器に関する。結果として得られるビットストリームは、少なくともビデオシーケンスの第1の層表現及び第2の層表現に分割可能である。第2の層表現は、第1の層表現と比較して強化された空間分解能又は品質分解能を有する。符号器は、予測符号化パラメータ生成部と、第1の層予測実行部と、第1の層残差生成部と、第1の層表現符号化部とを備える。予測符号化パラメータ生成部は、再構成された第2の層表現における既に再構成された画素を使用してビデオシーケンスの画像の少なくとも1つの領域の第2の層表現について予測符号化パラメータを生成するように構成される。第1の層予測実行部は、第1の層予測信号と呼ぶところの予測信号を生成するために予測符号化パラメータ及び再構成された第2の層表現における既に再構成された画素を使用して、ビデオシーケンスの画像の少なくとも1つの領域の第1の層表現について予測を実行するように構成される。第1の層残差生成部は、ビデオシーケンスの画像の少なくとも1つの領域と第1の層予測信号との差に基づいて第1の層残差と呼ぶところの残差を生成するように構成される。第1の層表現符号化部は、第1の層表現の少なくとも一部として予測符号化パラメータ及び第1の層残差を符号化するように構成される。
更に本発明は、一実施形態において、符号器上で実行される場合に符号器に上述の方法を実行させるように構成された命令を含むコンピュータプログラムに関する。
次に、添付の図面と共に本発明の実施形態を説明する。
ピクチャの領域がインタピクチャ予測符号化技術を使用して符号化される本発明の一実施形態において方法のステップを示す概略図である。 ピクチャの領域がイントラピクチャ予測符号化技術を用いて符号化される本発明の一実施形態において方法のステップを示す概略図である。 ピクチャの領域が2つの隣接画像を使用するインタピクチャ予測符号化技術を用いて符号化される本発明の一実施形態において方法のステップを示す概略図である。 本発明の一実施形態において方法のステップを示すフローチャートである。 本発明の一実施形態において符号器を概略的に示す図である。 本発明により対処され且つ解決される問題をより理解するためのSVCボトムアップ符号化手法を概略的に示す図である。 ピクチャの領域が2つの隣接画像を使用するインタピクチャ予測符号化技術を使用して符号化される本発明の一実施形態において方法のステップを示す概略図である。 本発明により対処され且つ解決される問題をより理解するために、従来技術での望遠モードフラグの使用を概略的に示す図である。 本発明により対処され且つ解決される問題をより理解するために、図6を参照して説明した手法に類似するボトムアップ符号化手法を更に示す図である。 本発明の一実施形態において符号器で実行される方法のステップを示す概略図である。 本発明の一実施形態の方法で取得された実験データを示す図である。
次に、特定の実施形態と共に本発明を説明する。尚、これらの特定の実施形態は、当業者により適切な理解を提供するためのものであり、添付の請求の範囲により規定される本発明の範囲をなんら限定することを意図しない。
図1は、本発明の一実施形態において方法のステップを示す概略図である。4つの例示的なピクチャ又はフレームを含むビデオシーケンス10を図1の上部に示す。このビデオシーケンス10は、本実施形態において方法の入力を構成する。方法の出力は、図1の右下の隅に示されたビットストリーム20である。ビットストリーム20は、符号化された第1の層表現20に割り当てられたビット(ビットストリーム20の白色部分)及び符号化された第2の層表現20に割り当てられたビット(ビットストリーム20の黒色部分)を含む。第1の層表現20及び第2の層表現20にそれぞれ割り当てられたビットストリーム20のビット部分のサイズは同一であるのもとして示されるが、必ずしもそうでなくてもよい。
図示されたビデオシーケンス10の下の点線の下に、第2の層及び第1の層を概略的に示す。第1の層は基本層であってもよく、第2の層は強化された層(EL)であってもよい。あるいは、第1の層は第1の強化された層であってもよく、第2の層は、第1の強化された層よりも精細な分解能を与える第2の強化された層であってもよい。図1に示された処理は、ビデオシーケンス10の画像の領域16の符号化に関する。領域16の第1の層表現及び第2の層表現の双方は、ビットストリーム20に符号化される。図1において、領域16の画素は、インタピクチャ予測符号化技術を使用して符号化される。すなわち、図1に示された例において、先行ピクチャ14からの画素、すなわち先に再構成された画素14は、領域16の予測符号化のために使用される。
ピクチャ12は、イントラピクチャ予測符号化技術を使用して符号化されるアンカピクチャである。次にピクチャ14は、ピクチャ12における既に再構成された画素に基づいてインタピクチャ予測符号化技術を使用して符号化される。ステップs1において、第2の層分解能の領域16に対する予測符号化パラメータは、第2の層における既に再構成された画素14を使用して生成される。
例えば、ステップs1で生成された予測符号化パラメータは、インタ符号化又はイントラ符号化が使用されるか及び/あるいは動きベクトルであるか等を示す符号化モードであってもよい。更に、ビデオシーケンス10の1つのピクチャが符号化される場合、前記ピクチャ内で、種々の処理は、特にピクチャの場所及び/又はピクチャの内容に依存してピクチャの種々の部分に適用されてもよい。すなわち、種々の符号化技術は、符号化されるピクチャの種々の領域について使用されてもよい。更には、種々の符号化技術は、ビデオシーケンス10の種々のピクチャについて使用されてもよい。
ステップs2において、ステップs1で生成された予測符号化パラメータ及び第2の層における既に再構成された画素14を使用して領域16の第1の層表現20について予測が実行される。従って、第1の層予測信号と呼ぶところの予測信号が生成される。
一実施形態において、ステップs2は、空間スケーラビリティについてダウンサンプルすることを含む。一実施形態において、ダウンサンプルすることはSNRスケーラビリティに対して含まれず、ステップs1からの動き情報(予測符号化パラメータの一例である)は、変更せずに適用される。しかし、SNRスケーラビリティが達成される一実施形態において、例えば強化層(EL)で使用された規格により支持されるが基本層(BL)で前記規格により支持されない動き補償ブロックサイズの場合には、ある変換が実行される。一実施形態において、基本層と強化層との間で支持された動き補償ブロックサイズの差がない場合、SNRスケーラビリティに対して変換は実行されない。
その後、ステップs3において、元の無圧縮画像の領域16と第1の層予測信号との差が算出され、第1の層残差を生成する。
ステップs4において、ステップ1で生成された(場合によってはダウンサンプルされ且つ/あるいは変換された)予測符号化パラメータ及び第1の層残差は、少なくとも第1の層表現20の一部として符号化される。更なるパラメータ又は情報は、第1の層表現の20の一部として更に符号化されてもよい。これにより、ビットストリーム20に符号化された第1の層表現20を形成する。第2の層表現20は、インタ層予測符号化技術(図1には不図示)を使用してビットストリーム20に更に符号化される。
ステップs1において先に再構成された画素14が符号化される領域16の画素と同一のピクチャからのものであるという点で、図2の概略図は図1とは異なる。換言すると、領域16の第2の表現について予測符号化パラメータを生成するステップs1は、イントラ符号化パラメータを生成することを含む。これは、図2の上部のピクチャで「s1」とラベル付けされた矢印により示される。
図2に示すように、第2の層の領域16の画素分解能及び第1の層の領域16の画素分解能は、同一のものとして示される。しかし、空間スケーラビリティではそうではない。すなわち、第1の層の領域16の画素分解能は、第2の層の領域16の画素分解能よりも改良されない。
図3の概略図は、以下の通り図1とは異なる。ビデオシーケンス10において、ステップs1で使用された既に再構成された画素14は、領域16の画像に先行する第1の画像14及び領域16の画像に後続する第2の画像14の双方から発生する。再構成(予測)順序は、ビデオシーケンス10の画像の順序と同一でなくてもよい。
図4は、本発明の一実施形態における方法のフローチャートである。ステップs1において、予測符号化パラメータは、再構成された第2の層表現20における既に再構成された画素14を使用して、ビデオシーケンス10の画像の少なくとも1つの領域16の第2の層表現20について生成される。ステップs2において、ステップs1で生成された予測符号化パラメータ及び再構成された第2の層表現20における既に再構成された画素14を使用して、ビデオシーケンス10の画像の少なくとも1つの領域16の第1の層表現20について予測が実行される。ステップs2の出力は第1の層予測信号である。
ステップs3において、第1の層残差は、ビデオシーケンス10の画像の元の無圧縮領域16とステップs2で生成された第1の層予測信号との差から生成される。ステップs1で生成された予測符号化パラメータ及びステップs3で生成された第1の層残差は、ビットストリーム20の第1の層表現の少なくとも一部としてステップs4で符号化される。
図5は、本発明の一実施形態において符号器30を概略的に示す。符号器30は、図4を参照して説明されたようなステップs1〜s4を実行するようにそれぞれ構成される予測符号化パラメータ生成部31と、第1の層予測実行部32と、第1の層残差生成部33と、第1の層表現符号化部34とを備える。
予測符号化パラメータを生成するために、符号化最適化方法の1つの種類は、レート歪み(R−D)最適化として当技術分野で示される。R−D最適化動き推定及びモード判断において、符号器は、試験的に、いくつか(又は全て)の可能なモード/動き設定を符号化し、それらの各々に対するコスト基準に従ってコスト手段を生成する。種々のモードを検査した後、最もコストの低い手段が選択される。一般にR−D最適化方法は符号器により実行され、その動作を判定する一般的な構成パラメータは、量子化パラメータQP及びラグランジュの乗数法λである。
2つの層、すなわち基本層(BL)及び強化層(EL)を含むSVCに対して、場合によってはBL圧縮効率とEL圧縮効率との間に妥協点がある。
(i)BL符号化が単独で最適化される場合、BLで選択された符号化モードが後続のEL符号化に対して最適でない可能性がある(すなわち、BLで使用されたビットのうちのいくつかがELに対して無用な可能性がある)ため、部分最適EL圧縮効率が得られる。
(ii)EL圧縮効率が向上する場合、BL圧縮効率の多少の低下は許容可能であってもよい。
上記の例(i)は、最初にBLを符号化し且つ次にELを符号化すること(「ボトムアップ符号化」)により実行される。しかし、例(ii)、すなわちEL品質を最適化することがより望ましい場合が多い。これは、多くのアプリケーションにおいて、EL品質がBL品質よりも重要である、すなわち価値のある(例えばEL品質の消費者は、自身が加入しているサービスに対してより多くを期待する可能性がある)ためである。しかし、所望の挙動を実現するのは容易ではない。本発明は、例(ii)の目的により示唆された解決方法を提供する。しかし、本発明の利点を理解するために双方の例を説明するのが有用である。
図6は、SVCに対するボトムアップ符号化手法を概略的に示す。これは、本発明の一実施形態を形成しないが、本発明により対処され且つ解決される問題を理解するために本明細書で説明される。符号器動作をボトムアップ符号化(I−B−I予測構造)に対して示す。BLピクチャは図の下部にあり、ELピクチャは図の上部にある。縦矢印はインタ層予測を示す。BL符号化の場合、動き推定(ME)及びモード判断(MD)、並びに動き補償予測(MCP)は、BL基準ピクチャ及びBL最適化パラメータλBL、QPBLを使用して実行される。EL符号化の場合、ME/MD及びMCPは、EL基準ピクチャ及びEL最適化パラメータλEL、QPELを使用して実行される。
最初にBLピクチャは、その時点でEL態様を介入せずに(本発明とは対照的に)圧縮効率を最適化するように符号化される。次にELピクチャは、EL圧縮効率を最適化するように、既に符号化されたBLピクチャを考慮することにより、すなわちインタ層予測技術を使用することにより符号化される。
ME処理及びMD処理は、アクセスユニット(AU)の層ピクチャ毎に実行される。ボトムアップ符号化は、高度映像符号化(AVC、H.264/MPEG−4 AVC)(AU毎に1つのピクチャのみが存在する)よりも複雑である。しかし、ボトムアップ符号化手法はBL圧縮効率を最適化するが、一般にEL圧縮効率の点で最適とは言えない。
図6を更に参照すると、ボトムアップ符号化の特徴は以下のように換言して説明されてもよい。
−AU毎に、最初にBL符号化が実行され、次にEL符号化が実行される。BL符号化及びEL符号化の双方について、ME/MD処理が実行される。
−BLのME/MD及びMCPの場合、符号器は、再構成されたBLピクチャをインタ予測基準として使用する。BL専用の最適化設定(λBL、QPBL)が使用される。
−ELのME/MD及びMCPの場合、符号器は、再構成されたELピクチャをインタ予測基準として使用する。EL専用の最適化設定(λEL、QPEL)が使用される。
図7は、本発明の一実施形態において方法のステップを示す概略図である。ビットストリーム20の第2の層表現20の少なくとも一部を形成(すなわち、符号化)するためにステップs5、s6及びs7が使用される点で、図7は図3に示された実施形態とは異なる。
ステップs5において、第1の層の領域16から第2の層の領域16への縦矢印及び図7の右上の隅のボックス「s5望遠指示・・・を符号化する」により示されるように、望遠指示は、第2の層表現20の少なくとも一部として符号化される。望遠指示は、復号化時に、第1の層表現20と関連付けられた予測符号化パラメータが第2の層表現20についても使用されるべきことを示す。
オプションとして、符号化するステップs5は、第2の層表現20の少なくとも一部としてインタ層予測残差指示を符号化することを更に含んでもよい。インタ層予測残差指示は、復号化時に、元の無圧縮画像の少なくとも1つの領域16と第2の層予測信号との差を近似する第2の層残差を生成するために第1の層残差を使用すべきことを示す。換言すると、第1の層残差は、望遠指示に基づいて再構成された画素に適用される補正(第2の層残差)を生成するために使用される。
インタ層予測残差指示と組み合わせて又はインタ層予測残差指示を使用せずに、以下のステップs6及びs7が実行されてもよい。
ステップs6は、予測符号化パラメータ及び再構成された第2の層表現20における既に再構成された画素14を使用して、領域16の第2の層表現20について予測を実行することを含む。ステップs6の出力は第2の層予測信号である。
ステップs7は、領域16の元の無圧縮画素とステップs6で生成された第2の層予測信号との差を算出することにより、第2の層残差を生成することを含む。
符号化するステップs5は、第2の層表現20の少なくとも一部としてステップs7で生成された第2の層残差を符号化することを更に含む。従って、第2の層残差を更に符号化するために、ステップs5は、この場合はステップs6及びs7の後で完了する。
一実施形態において、第2の層表現符号化部、第2の層予測実行部及び第2の層残差生成部(不図示)は、図7を参照して説明したステップs5、s6及びs7をそれぞれ実行するように符号器30に更に提供される。
図8は、国際出願第WO2008/051995号での望遠モードフラグの使用を示すと考えられる図であり、本発明により対処され且つ解決されるいくつかの従来技術の問題をより理解するために本明細書で説明される。ELで別個のモード情報及び動き情報を送信するのではなく、ELでモード情報及び動き情報がBLのモード情報及び動き情報から継承されるかあるいは導出されることを示すフラグが送信される。図8は、望遠モードフラグ(I−B−I予測構造)を用いた符号化動作を示す。BLピクチャは図の下部にあり、ELピクチャは図の上部にある。縦矢印はインタ層予測を示す。BL符号化の場合、ME/MD及びMCPは、BL基準ピクチャ及びBL最適化パラメータλBL、QPBLを使用して実行される。EL符号化の場合、ME及びMDは実行されない。その代わり、動きパラメータ及びモードパラメータがBLから導出される。MCPは、EL基準ピクチャを使用して実行される。
符号器がいくつかのAUについてこの機構を使用する場合、ELに対するME/MD処理がこれらのAUについて省かれてもよく、ボトムアップ符号化と比較して符号器の複雑さは減る。一方、ME/MD情報がELについて特に最適化されないため、EL圧縮効率はその影響を受ける。
図8を更に参照して、望遠モードフラグの特徴を以下のように説明してもよい。
−AU毎に、最初にBL符号化が実行され、次にEL符号化が実行される。BLのみについてME/MD処理が実行される。
−BLのME/MD及びMCPの場合、符号器は、復号化されたBLピクチャをインタ予測基準として使用する。BL専用の最適化設定(λBL、QPBL)が使用される。
−ELにおいて、動きパラメータ及びモードパラメータは、BLのそれらから導出される。ELのMCPの場合、符号器は、復号化されたELピクチャをインタ予測基準として使用する。
図9は、SVCに対するボトムアップ符号化手法(図6を参照して示した手法に類似する)を更に示す。図9は、本発明の一実施形態を形成しないが、本発明により対処され且つ解決される問題をより理解するために本明細書で説明される。ボトムアップ符号器の要素の簡単な説明は、以下の通りである。
「ダウンサンプリング」動作は、元のビデオピクチャを入力として使用し、BL符号化のために場合によってはダウンサンプルされた元のピクチャを生成する。
ME/MD動作は、例えばR−D最適化を使用することによりME/MDを実行し且つモード情報及び動き情報を判定するために、元のピクチャ及び1つ以上の基準ピクチャを使用する。ME/MD動作は、EL圧縮効率(上部)又はBL圧縮効率(下部)のいずれかについて最適化される。
適応的モード/動き予測動作は、SVCのインタ層予測処理の一部である。適応的モード/動き予測動作は、ELモード/動き情報を予測するためにBLモード/動き情報を適応可能に使用する。
基準ピクチャ記憶装置は、予測に使用される既に符号化されたピクチャの再構成を格納する。
MCP+量子化動作は、次に量子化される予測残差信号を生成するために元のビデオピクチャ、モード/動き情報及び基準ピクチャを使用する。量子化は、EL量子化設定(上部)又はBL量子化設定(下部)のいずれかを使用して実行される。出力は、それぞれの(BL又はEL)品質で量子化された残差信号及び再構成されたピクチャである。このピクチャは、後続して符号化されたピクチャについて基準ピクチャとして使用される。
適応的残差予測動作は、SVCのインタ層予測処理の一部である。適応的残差予測動作は、EL残差信号を予測するためにBL残差情報を適応可能に使用する。BL及びELの双方について、それぞれ、モード/動き情報及び量子化された残差情報は、圧縮されたビットストリームに符号化される。
これに対して、本発明の一実施形態の方法及び符号器30を図10に概略的に示す。
元のビデオピクチャ及びEL基準ピクチャ(「EL基準ピクチャ記憶装置」とラベル付けされたユニットから発生する)を使用して、EL最適化を用いてME/MDが実行される(s1)(「EL最適化を使用するME/MD」とラベル付けされたユニット)。ステップs1は、インタ符号化ブロック及びイントラ符号化ブロックの双方(双方はMD処理に含まれる)について同様に適用されてもよい。結果として得られるモード/動き情報は、場合によってはダウンサンプルされ(s11)(「モード/動きダウンサンプリング」とラベル付けされたユニット)、BLモード/動き情報を構成する。EL基準ピクチャは、場合によっては更にダウンサンプルされる(s12)。
BLモード/動き情報、ダウンサンプルされたEL基準ピクチャ及び元のBLビデオは、BL残差を生成するために使用されたMCP+量子化段階(s2、s3)に入力される(「BL設定を使用するMCP+量子化」とラベル付けされたユニット)。出力は量子化された残差信号を含む。出力はBL再構成信号を更に含むが、その信号(第1の層予測信号)は、更に必要とされなくてもよい。
BLモード/動き情報は、圧縮されたビットストリーム20に符号化される(s4)(「BLモード/動き符号化」とラベル付けされたユニット)。
BLモード/動き情報は、望遠モード/動き予測動作に更に供給され(s61)、場合によってはアップサンプルされ、EL符号化のためにMCP+量子化段階(s6)についてELモード/動き情報を構成する。BL残差は、EL符号化のためにMCP+量子化段階(s6)の入力として適応可能に更に使用されてもよい(s62)(「適応的残差予測」とラベル付けされたユニット)。
詳細なELモード/動き情報を符号化するのではなく、望遠モード/動き予測の使用は、ビットストリーム20で信号伝送される(s5)(「望遠モード/動き予測の信号伝送」とラベル付けされたユニット及び「ELモード/動き符号化」とラベル付けされたユニットに至る矢印)。
EL符号化のためのMCP+量子化段階(s6)は、ボトムアップ符号化手法と同様に動作する。
EL符号化段階及びBL符号化段階は、ボトムアップ符号化手法と同様に動作する。
一実施形態において、方法は、ビデオシーケンス10の全てのピクチャに適用されてもよい。別の実施形態において、符号器30は、上述のボトムアップ符号化と図10を参照して説明したような符号化との間で切り替わる。例えば、いわゆる「階層Bピクチャ予測」構成を用いた実験は、Iピクチャ及びPピクチャを用いて従来の符号化を使用しつつ、圧縮効率の点からBピクチャを用いて提案された方法を使用するのが有用な場合があることを示している。
図11は、本発明の一実施形態の方法(本明細書及び図11で「新しい手法」として示される)で取得された実験データを示す。以下の実験設定、すなわちスケーラブル高プロファイル、1つのSNR強化層を含むSNRスケーラビリティ、Iピクチャとして符号化された第1のピクチャ、Pピクチャとして符号化された16個目毎のピクチャ、階層Bピクチャとして符号化された残りのピクチャが使用された。グラフは、ボトムアップ手法(対角×印「x」を含む線)の性能と新しい手法(丸「○」を含む線)とを比較する。示された例において、新しい手法はBピクチャに対してのみ適用され、Iピクチャ及びPピクチャはボトムアップ手法を使用して符号化された。一定の強化層品質が達成されるように(図11のタイトルに示されたPSNRELの値により示された)模擬実験が構成された。
上部の2つのグラフは、強化層と基本層との種々のビットレート比r(ピーク信号対雑音比(PSNR)品質を達成するのに必要なH.264/AVCビットレートに関して測定された)に対してグラフ化された非スケーラブルAVC符号化(同様の符号化構造を含むH.264/AVC高プロファイル)と対照して、それぞれ、基本層及び強化層に対して相対コストC及びCを表す。下部のグラフは、AVCサイマルキャスト符号化と対照して相対ゲインGを示す。
コストの図は、非スケーラブル符号化と比較してSVCの非効率を表す。最初のグラフから分かるように、基本層が単独で最適化されるため、ボトムアップ符号化の性能は、基本層に対する非スケーラブル符号化にほぼ等しい(コスト約0%)。一方、強化層のコストは約20%である。新しい手法を使用すると、強化層のコストは約10%に大幅に減少し、増加した基本層のコスト(約20%)のコストに到達する。
非常に所望される機能であるより高い強化層符号化効率を提供することに加え、新しい手法では、ボトムアップ手法よりも符号化の複雑さが低減される。
符号器30を含む本発明に係る物理エンティティは、物理エンティティ上で実行される場合に本発明の実施形態に係るステップ及び手順が実行されるように命令を含むコンピュータプログラムを備えてもよく又は格納してもよい。更に本発明は、本発明に係る方法を実行するそのようなコンピュータプログラム及び本発明に係る方法を実行するコンピュータプログラムを格納するあらゆるコンピュータ可読媒体に関する。
「予測符号化パラメータ生成部」、「第1の層予測実行部」、「第1の層残差生成部」、「第1の層表現符号化部」、「第2の層予測実行部」、「第2の層表現符号化部」及び「第2の層残差生成部」という用語が本明細書で使用される場合、これらの処理部が分散される方法及び統合される方法に関して制限はない。すなわち、処理部の構成要素は、所期の機能を誘発する種々のソフトウェア構成要素又はハードウェア構成要素、あるいはソフトウェアデバイス又はハードウェアデバイスに分散されてもよい。複数の別個の処理部は、所期の機能性を提供するために更に統合されてもよい。同じことが、図10に示された全ての処理部(すなわち、ラベルを有する全てのボックス)に当てはまる。
サーバの上記の処理部のうちのいずれか1つ又はネットワークノードは、ハードウェア、ソフトウェア、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)又はファームウェア等で実現されてもよい。
本発明の更なる実施形態において、上述の及び/又は請求される予測符号化パラメータ生成部、第1の層予測実行部、第1の層残差生成部、第1の層表現符号化部、第2の層予測実行部、第2の層表現符号化部及び第2の層残差生成部のうちのいずれか1つは、予測符号化パラメータ生成部、第1の層予測実行部、第1の層残差生成部、第1の層表現符号化部、第2の層予測実行部、第2の層表現符号化部及び第2の層残差生成部の機能を実行する予測符号化パラメータ生成手段、第1の層予測実行手段、第1の層残差生成手段、第1の層表現符号化手段、第2の層予測実行手段、第2の層表現符号化手段及び第2の層残差生成手段のそれぞれ又は予測符号化パラメータ生成器、第1の層予測実行器、第1の層残差生成器、第1の層表現符号器、第2の層予測実行器、第2の層表現符号器及び第2の層残差生成器のそれぞれにより置換される。
本発明の更なる実施形態において、上述のステップのうちのいずれか1つは、例えばコンピュータが理解できる手順又は方法等、あらゆる種類のコンピュータ言語、及び/あるいはファームウェア上の組込みソフトウェア又は集積回路等の形態のコンピュータ可読命令を使用して実現されてもよい。
詳細な例に基づいて本発明を説明したが、詳細な例は、当業者により適切な理解を提供するためだけのものであり、本発明の範囲を限定することを意図しない。本発明の範囲は、添付の請求の範囲により規定される。

Claims (23)

  1. ビデオシーケンス(10)をビットストリーム(20)に符号化するスケーラブルビデオ符号化方法であって、結果として得られる前記ビットストリーム(20)が少なくとも前記ビデオシーケンス(10)の第1の層表現(20)及び第2の層表現(20)に分割可能であり、前記第2の層表現(20)が前記第1の層表現(20)と比較して強化された空間分解能又は品質分解能を有し、前記方法は、
    再構成された前記第2の層表現(20)における既に再構成された画素(14)を使用して前記ビデオシーケンス(10)の画像の少なくとも1つの領域(16)の前記第2の層表現(20)について予測符号化パラメータを生成するステップ(s1)と、
    第1の層予測信号と呼ぶところの予測信号を生成するために、前記予測符号化パラメータ及び前記再構成された第2の層表現(20)における前記既に再構成された画素(14)を使用して前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)の前記第1の層表現(20)について予測を実行するステップ(s2)と、
    前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)と前記第1の層予測信号との差に基づいて、第1の層残差と呼ぶところの残差を生成するステップ(s3)と、
    前記第1の層表現(20)の少なくとも一部として前記予測符号化パラメータ及び前記第1の層残差を符号化するステップ(s4)と、
    を備えることを特徴とするスケーラブルビデオ符号化方法。
  2. 前記第1の層予測信号を生成するために予測を実行するステップ(s2)は、動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行するステップを含むことを特徴とする請求項1記載の方法。
  3. 望遠指示と呼ぶところの指示を前記第2の層表現(20)の少なくとも一部として符号化するステップ(s5)を更に備え、
    前記望遠指示は、復号化時に、前記第1の層表現(20)と関連付けられた前記予測符号化パラメータが前記第2の層表現(20)についても使用されるべきことを示すことを特徴とする請求項1又は2記載の方法。
  4. 前記第2の層表現(20)の少なくとも一部として符号化するステップ(s5)は、インタ層予測残差指示と呼ぶところの指示を符号化するステップを含み、
    前記インタ層予測残差指示は、復号化時に、前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)と第2の層予測信号との差を近似する、第2の層残差と呼ぶところの残差を生成するために前記第1の層残差を使用すべきことを示すことを特徴とする請求項3記載の方法。
  5. 第2の層予測信号と呼ぶところの予測信号を生成するために、前記予測符号化パラメータ及び前記再構成された第2の層表現(20)における既に再構成された画素(14)を使用して、前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)の前記第2の層表現(20)について予測を実行するステップ(s6)と、
    前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)と前記第2の層予測信号との差に基づいて第2の層残差と呼ぶところの残差を生成するステップ(s7)とを更に備え、
    前記第2の層表現(20)の少なくとも一部として符号化するステップ(s5)は、前記第2の層残差を符号化するステップを含むことを特徴とする請求項3又は4記載の方法。
  6. 前記第2の層予測信号を生成するために予測を実行するステップ(s6)は、動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行するステップを含むことを特徴とする請求項5記載の方法。
  7. 予測符号化パラメータを生成するステップ(s1)は、
    インタ符号化技術及びイントラ符号化技術のうちの少なくとも1つを選択するステップと、
    前記選択するステップに応じて、
    インタ符号化技術が選択された場合のインタ符号化パラメータ及びイントラ符号化技術が選択された場合のイントラ符号化パラメータのうちの少なくとも1つを生成するステップと、
    を含むことを特徴とする請求項1から6のいずれか1項に記載の方法。
  8. 予測符号化パラメータを生成するステップ(s1)及び前記第1の層残差を生成するステップ(s3)は、前記第2の層表現に関して最適化されることを特徴とする請求項1から7のいずれか1項に記載の方法。
  9. 前記第2の層表現(20)は前記第1の層表現(20)と比較して強化された空間分解能を有し、
    前記第1の層予測信号を生成するために予測を実行するステップ(s2)は、前記予測符号化パラメータ及び前記再構成された第2の層表現(20)における既に再構成された画素をダウンサンプルした後、前記予測符号化パラメータ及び前記再構成された第2の層表現(20)の前記既に再構成された画素を使用して実行されることを特徴とする請求項1から8のいずれか1項に記載の方法。
  10. 前記第2の層表現(20)は前記第1の層表現(20)と比較して強化された品質分解能を有し、
    前記第1の層予測信号を生成するために予測を実行するステップ(s2)は、前記予測符号化パラメータを全く変更せずに使用して実行されることを特徴とする請求項1から6のいずれか1項に記載の方法。
  11. 予測符号化パラメータを生成するステップ(s1)は、
    少なくともインタ符号化技術を選択するステップと、
    前記ビデオシーケンス(10)の画像の前記少なくとも1つの領域(16)がBスライスとして予測的に符号化されるような方法で少なくともインタ符号化パラメータを生成するステップと、
    を含むことを特徴とする請求項1から10のいずれか1項に記載の方法。
  12. ビデオシーケンス(10)をビットストリーム(20)に符号化するように構成されたスケーラブルビデオ符号器(30)であって、結果として得られる前記ビットストリーム(20)が少なくとも前記ビデオシーケンス(10)の第1の層表現(20)及び第2の層表現(20)に分割可能であり、前記第2の層表現(20)が前記第1の層表現(20)と比較して強化された空間分解能又は品質分解能を有する符号器(30)が、
    再構成された第2の層表現における既に再構成された画素を使用して前記ビデオシーケンスの画像の少なくとも1つの領域の前記第2の層表現について予測符号化パラメータを生成するように構成された予測符号化パラメータ生成部(31)と、
    第1の層予測信号と呼ぶところの予測信号を生成するために、前記予測符号化パラメータ及び前記再構成された第2の層表現における既に再構成された画素を使用して、前記ビデオシーケンスの画像の前記少なくとも1つの領域の前記第1の層表現について予測を実行するように構成された第1の層予測実行部(32)と、
    前記ビデオシーケンスの画像の前記少なくとも1つの領域と前記第1の層予測信号との差に基づいて第1の層残差と呼ぶところの残差を生成するように構成された第1の層残差生成部(33)と、
    前記第1の層表現の少なくとも一部として前記予測符号化パラメータ及び前記第1の層残差を符号化するように構成された第1の層表現符号化部(34)と、
    を備えることを特徴とするスケーラブルビデオ符号器(30)。
  13. 前記第1の層予測信号を生成するために予測を実行するように構成された前記第1の層予測実行部(32)は、動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行するように構成されることを特徴とする請求項12記載のスケーラブルビデオ符号器(30)。
  14. 望遠指示と呼ぶところの指示を前記第2の層表現の少なくとも一部として符号化するように構成された第2の層表現符号化部を更に備え、
    前記望遠指示は、復号化時に、前記第1の層表現と関連付けられた前記予測符号化パラメータが前記第2の層表現についても使用されるべきことを示すことを特徴とする請求項12又は13記載のスケーラブルビデオ符号器(30)。
  15. 前記第2の層表現符号化部は、インタ層予測残差指示と呼ぶところの指示を符号化するように更に構成され、
    前記インタ層予測残差指示は、復号化時に、前記ビデオシーケンスの画像の前記少なくとも1つの領域と第2の層予測信号との差を近似する、第2の層残差と呼ぶところの残差を生成するために前記第1の層残差を使用すべきことを示すことを特徴とする請求項14記載のスケーラブルビデオ符号器(30)。
  16. 第2の層予測信号と呼ぶところの予測信号を生成するために前記予測符号化パラメータ及び前記再構成された第2の層表現における既に再構成された画素を使用して、前記ビデオシーケンスの画像の前記少なくとも1つの領域の前記第2の層表現について予測を実行するように構成された第2の層予測実行部と、
    前記ビデオシーケンスの画像の前記少なくとも1つの領域と前記第2の層予測信号との差に基づいて第2の層残差と呼ぶところの残差を生成するように構成された第2の層残差生成部とを更に備え、
    前記第2の層表現符号化部は、前記第2の層残差を符号化するように更に構成されたことを特徴とする請求項14又は15記載のスケーラブルビデオ符号器(30)。
  17. 前記第2の層予測実行部は、動き補償予測、イントラ符号化予測及び不一致補償予測のうちの少なくとも1つを実行するように構成された前記第2の層予測信号を生成するために予測を実行するように構成されたことを特徴とする請求項14から16のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  18. 前記予測符号化パラメータ生成部(31)は、
    インタ符号化技術及びイントラ符号化技術のうちの少なくとも1つを選択し、
    前記選択に応じて、
    インタ符号化技術が選択された場合のインタ符号化パラメータ及びイントラ符号化技術が選択された場合のイントラ符号化パラメータのうちの少なくとも1つを生成する
    ように構成されたことを特徴とする請求項12から17のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  19. 前記予測符号化パラメータ生成部(31)及び前記第1の層残差生成部(33)は、前記第2の層表現に関して最適化されることを特徴とする請求項12から18のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  20. 前記第2の層表現は前記第1の層表現と比較して強化された空間分解能を有し、
    前記第1の層予測実行部(32)は、前記予測符号化パラメータ及び前記再構成された第2の層表現における既に再構成された画素をダウンサンプルした後、前記予測符号化パラメータ及び前記再構成された第2の層表現の前記既に再構成された画素を使用するように構成されたことを特徴とする請求項12から19のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  21. 前記第2の層表現は前記第1の層表現と比較して強化された品質分解能を有し、
    前記第1の層予測実行部(32)は、前記予測符号化パラメータを全く変更せずに使用するように構成されたことを特徴とする請求項12から17のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  22. 前記予測符号化パラメータ生成部(31)は、
    少なくともインタ符号化技術を選択し、
    前記ビデオシーケンスの画像の前記少なくとも1つの領域がBスライスとして予測的に符号化されるような方法で少なくとも1つのインタ符号化パラメータを生成するように構成されたことを特徴とする請求項12から21のいずれか1項に記載のスケーラブルビデオ符号器(30)。
  23. 符号器(30)上で実行される場合に前記符号器(30)に請求項1から11のいずれか1項に記載の方法を実行させるコンピュータプログラム。
JP2012508901A 2009-05-05 2009-05-05 スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム Active JP5504336B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2009/055389 WO2010127692A1 (en) 2009-05-05 2009-05-05 Scalable video coding method, encoder and computer program

Publications (2)

Publication Number Publication Date
JP2012526426A true JP2012526426A (ja) 2012-10-25
JP5504336B2 JP5504336B2 (ja) 2014-05-28

Family

ID=41057498

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012508901A Active JP5504336B2 (ja) 2009-05-05 2009-05-05 スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US9106920B2 (ja)
EP (1) EP2428042B1 (ja)
JP (1) JP5504336B2 (ja)
WO (1) WO2010127692A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2986001A1 (en) * 2014-08-14 2016-02-17 Alcatel Lucent Network-friendly scalable video coding

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102656885B (zh) * 2009-12-14 2016-01-27 汤姆森特许公司 合并编码比特流
US8553769B2 (en) 2011-01-19 2013-10-08 Blackberry Limited Method and device for improved multi-layer data compression
EP2479994B1 (en) * 2011-01-19 2017-03-15 BlackBerry Limited Method and device for improved multi-layer data compression
WO2012122421A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Joint rate distortion optimization for bitdepth color format scalable video coding
US10873772B2 (en) * 2011-07-21 2020-12-22 V-Nova International Limited Transmission of reconstruction data in a tiered signal quality hierarchy
EP2803190B1 (en) 2012-01-09 2017-10-25 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for multiple layered video coding systems
US9584805B2 (en) 2012-06-08 2017-02-28 Qualcomm Incorporated Prediction mode information downsampling in enhanced layer coding
EP2813079B1 (en) * 2012-06-20 2019-08-07 HFI Innovation Inc. Method and apparatus of inter-layer prediction for scalable video coding
WO2014009603A1 (en) * 2012-07-02 2014-01-16 Nokia Corporation Method and apparatus for video coding
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
US10116931B2 (en) 2013-01-03 2018-10-30 Texas Instruments Incorporated Hierarchical inter-layer prediction in multi-loop scalable video coding
US20140301436A1 (en) * 2013-04-05 2014-10-09 Qualcomm Incorporated Cross-layer alignment in multi-layer video coding
US9143797B2 (en) 2013-05-29 2015-09-22 Blackberry Limited Lossy data compression with conditional reconstruction refinement
EP2816805B1 (en) * 2013-05-29 2020-12-30 BlackBerry Limited Lossy data compression with conditional reconstruction reinfinement
US9560358B2 (en) * 2013-07-22 2017-01-31 Qualcomm Incorporated Device and method for scalable coding of video information
US10356405B2 (en) * 2013-11-04 2019-07-16 Integrated Device Technology, Inc. Methods and apparatuses for multi-pass adaptive quantization
WO2015100522A1 (en) 2013-12-30 2015-07-09 Mediatek Singapore Pte. Ltd. Methods for inter-component residual prediction
CN106954057B (zh) * 2017-02-27 2018-08-28 华侨大学 一种基于视点间相关性的3d-hevc帧间预测快速模式选择方法
DK3831065T3 (en) * 2018-08-03 2024-07-15 V Nova Int Ltd Entropy coding for signal enhancement coding
GB201817784D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media
US10764603B2 (en) 2018-12-31 2020-09-01 Alibaba Group Holding Limited Resolution-adaptive video coding
WO2020188237A1 (en) * 2019-03-20 2020-09-24 V-Nova International Ltd Residual filtering in signal enhancement coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507180A (ja) * 2004-07-13 2008-03-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的及びsnr画像圧縮の方法
WO2008051995A2 (en) * 2006-10-23 2008-05-02 Vidyo, Inc. System and method for scalable video coding using telescopic mode flags

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6510177B1 (en) * 2000-03-24 2003-01-21 Microsoft Corporation System and method for layered video coding enhancement
US6961383B1 (en) * 2000-11-22 2005-11-01 At&T Corp. Scalable video encoder/decoder with drift control
US20060133475A1 (en) * 2003-02-17 2006-06-22 Bruls Wilhelmus H A Video coding
WO2005099276A2 (en) * 2004-04-02 2005-10-20 Thomson Licensing Complexity scalable video encoding
DE102004059978B4 (de) * 2004-10-15 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium
KR100888963B1 (ko) * 2004-12-06 2009-03-17 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
WO2007081189A1 (en) 2006-01-16 2007-07-19 Electronics And Telecommunications Research Institute Method and apparatus for selective inter-layer prediction on macroblock basis
US8320450B2 (en) 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
KR101376666B1 (ko) * 2007-06-27 2014-03-21 톰슨 라이센싱 이미지 품질 강화
JP5295233B2 (ja) * 2007-06-29 2013-09-18 フラウンホファー・ゲゼルシャフト・ツール・フォルデルング・デル・アンゲバンテン・フォルシュング・アインゲトラーゲネル・フェライン ビデオエンコーダ、ビデオデコーダ、エンコードするための方法、デコードするための方法、コンピュータプログラム、およびスケーラブルなビットストリーム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008507180A (ja) * 2004-07-13 2008-03-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的及びsnr画像圧縮の方法
WO2008051995A2 (en) * 2006-10-23 2008-05-02 Vidyo, Inc. System and method for scalable video coding using telescopic mode flags

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2986001A1 (en) * 2014-08-14 2016-02-17 Alcatel Lucent Network-friendly scalable video coding

Also Published As

Publication number Publication date
EP2428042B1 (en) 2013-05-01
US20120183065A1 (en) 2012-07-19
WO2010127692A1 (en) 2010-11-11
JP5504336B2 (ja) 2014-05-28
EP2428042A1 (en) 2012-03-14
US9106920B2 (en) 2015-08-11

Similar Documents

Publication Publication Date Title
JP5504336B2 (ja) スケーラブルビデオ符号化方法、符号器及びコンピュータプログラム
US10334258B2 (en) Scalable video coding method and apparatus using inter prediction mode
US9762923B2 (en) Scalable video coding method and apparatus using intra prediction mode
RU2409005C2 (ru) Способ масштабируемого кодирования и декодирования видеосигнала
JP5612214B2 (ja) 階層的映像符号化及び復号化のための方法及び装置
KR102616143B1 (ko) 인트라 예측 모드 스케일러블 코딩 방법 및 장치
US11032559B2 (en) Video encoding and decoding method and apparatus using the same
JPWO2010004939A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR20130045785A (ko) 메모리 관리 방법 및 그를 이용한 복호화 장치
CN105103563A (zh) 在可伸缩视频编码中的量化矩阵信令和表示的方法和装置
KR101638875B1 (ko) 머지를 기반으로 한 복호화 방법 및 장치
KR101850152B1 (ko) 적응적 루프 필터 적용 방법 및 그를 이용한 스케일러블 비디오 부호화 장치
KR20210022598A (ko) 비디오 부호화 방법 및 비디오 복호화 방법과 이를 이용하는 장치
KR102271878B1 (ko) 영상의 부호화/복호화 방법 및 이를 이용하는 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140317

R150 Certificate of patent or registration of utility model

Ref document number: 5504336

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250