JP2010135864A - 画像符号化方法及び装置並びに画像復号化方法及び装置 - Google Patents
画像符号化方法及び装置並びに画像復号化方法及び装置 Download PDFInfo
- Publication number
- JP2010135864A JP2010135864A JP2007087202A JP2007087202A JP2010135864A JP 2010135864 A JP2010135864 A JP 2010135864A JP 2007087202 A JP2007087202 A JP 2007087202A JP 2007087202 A JP2007087202 A JP 2007087202A JP 2010135864 A JP2010135864 A JP 2010135864A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- mode
- encoding
- image
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】演算コストを削減し、符号化効率を向上させた動画像符号化装置を提供する。
【解決手段】選択予測モードに基づいて符号化対象画素ブロックに対する予測画像を生成し、入力画像と予測画像との予測誤差と予測モードの符号量に基づいて最適予測モードを決定し、決定予測モードにより、予測モードの選択頻度を示す予測モード選択頻度順序を並び替え、並び替えた頻度情報テーブルのインデックスを生成し、符号化対象画素ブロックに対して、インデックスから予測モード情報を抽出し、抽出予測モード情報に対応した予測画像信号を生成し、予測モードのコストを計算し、コストから1つの符号化モードを選択し、選択符号化モードに従って予測誤差信号と頻度情報テーブルのテーブル長と、選択符号化モードを示すインデックス番号を符号化する。
【選択図】 図1
【解決手段】選択予測モードに基づいて符号化対象画素ブロックに対する予測画像を生成し、入力画像と予測画像との予測誤差と予測モードの符号量に基づいて最適予測モードを決定し、決定予測モードにより、予測モードの選択頻度を示す予測モード選択頻度順序を並び替え、並び替えた頻度情報テーブルのインデックスを生成し、符号化対象画素ブロックに対して、インデックスから予測モード情報を抽出し、抽出予測モード情報に対応した予測画像信号を生成し、予測モードのコストを計算し、コストから1つの符号化モードを選択し、選択符号化モードに従って予測誤差信号と頻度情報テーブルのテーブル長と、選択符号化モードを示すインデックス番号を符号化する。
【選択図】 図1
Description
本発明は、動画像または静止画像のための予測モード推定、画像符号化、復号化方法及び装置に関する。
従来よりも大幅に符号化効率を向上させた動画像符号化方法が、ITU−TとISO/IECとの共同で、ITU−T Rec.H.264及びISO/IEC 14496−10として勧告されている。(以下、「H.264」という)。ISO/IEC MPEG−1,2,4、ITU−T H.261、H.263といった従来の画面内符号化方式は直交変換後の周波数領域(DCT係数)上でのフレーム内予測を行い,変換係数の符号量削減を図っているのに対して、H.264では空間領域(画素領域)での方向予測(非特許文献1)を取り入れることにより,従来(ISO/IEC MPEG−1,2,4)の動画像符号化方式のフレーム内予測と比較して高い予測効率を実現している。
H.264 ハイプロファイルなどでは、輝度信号に対して3種類のフレーム内予測方式が規定されており、そのうちの1つをマクロブロック(16x16画素ブロック)単位に選択できる方式となっている。3種類のフレーム内予測方式は夫々4x4画素予測、8x8画素予測、16x16画素予測と呼ばれている。
16x16画素予測では、4つの符号化モードが規定されており、垂直予測、水平予測、DC予測、平面予測と呼ばれている。復号処理を終えたデブロッキングフィルタ適用前の周囲のマクロブロックの画素値を参照画素値として用い、予測処理に使用する。16x16予測の予測モード情報はマクロブロックタイプに包含されており、他の予測と比較してモードを送信するための符号量が大幅に少なくなっている。
一方、4x4画素/8x8画素予測は、マクロブロック内の輝度信号を夫々16個/4個の4x4/8x8画素ブロックに分割し、夫々の画素ブロックに対して、9つのモードのいずれかをブロック単位に選択する。9つのモードは、利用可能な参照画素の平均値で予測するDC予測(モード2)を除いて、夫々22.5度づつの予測方向を持っており、参照画素を用いて予測方向に外挿補間を行って予測値を生成する。4x4/8x8画素予測は16x16画素予測と比較して予測処理の単位が小さいために、複雑なテクスチャを持つ画像に対しても比較的効率の高い予測が行えるが、予測方向に対して単純に補間値をコピーするだけの予測であり、参照画素からの距離が離れるほど、予測誤差が増大するという問題点がある。
このように近年の動画像符号化方式では、ハードウェアの高性能化に伴って選択可能な予測モードの数が増える傾向にあり、予測モードのモード情報の符号化による符号量の増加が大きな問題となっている。H.264ハイプロファイルにおいても16x16画素予測で4モード、4x4画素/8x8画素予測で各9モードと予測モード数が多く、低ビットレートでの符号化時に小画素ブロックの予測モードは選択されにくい傾向にある。一方、予測モード数の増加は演算コストの増大を招き、携帯機器や省電力機器での符号化時に、当該小画素ブロックの予測モードを利用できないなどの問題もある。
このような問題に対して非特許文献2では、予測モードとして選択率の高くない16x16画素予測に変わるダイレクト予測モードを導入している。特に16x16画素予測の平面予測は256個の全画素に対して予測画素値を生成するため、他の予測モードと比較しても演算コストが増えている。ダイレクト予測モードでは、4x4画素予測の予測をそのまま利用し、予測モード情報を復号化器に送信しない、という予測モードである。そのため、H.264に規定されているモード導出方法を利用して、符号化対象の画素ブロックに隣接する上下の画素ブロックの予測モードから当該予測モードを予測している。4x4画素予測を利用しているため、予測モードの予測が当たれば符号化効率を維持しつつ、予測モード情報を削減することが可能である。しかし、予測モードの予測が外れた場合、符号化効率が低下することが問題となっている。
Greg Conklin, "New Intra Prediction Modes", ITU-T Q.6/SG16 VCEG, VCEG-N54, Sep. 2001. Lu Yu, Feng Yi, "Low complexity intra prediction", ITU-T SG16/Q.6 VCEG-Z14, April 2005
Greg Conklin, "New Intra Prediction Modes", ITU-T Q.6/SG16 VCEG, VCEG-N54, Sep. 2001. Lu Yu, Feng Yi, "Low complexity intra prediction", ITU-T SG16/Q.6 VCEG-Z14, April 2005
以上説明したように、H.264 ハイプロファイルに規定されている方法で、符号化モードを送信する場合、低ビットレートではモード情報の符号量が無視できないため、予測性能の良い予測モードが選択されにくくなり符号化効率が低下する、また、ダイレクト予測モードでは、モードの予測が外れたときに符号化効率が低下する、という問題があった。
本発明の実施形態によると、予測モードに関する付帯情報の選択頻度を示す頻度情報テーブルを準備するステップと、入力画像を複数の画素ブロックに分割するステップと、前記画素ブロックの符号化対象画素ブロックに応じて予測モードに関する付帯情報を選択するステップと、選択した付帯情報に基づいて参照画像を用いて前記符号化対象画素ブロックに対する予測画像を生成するステップと、入力画像と予測画像との予測誤差と前記予測モードの符号量に基づいて最適予測モードを決定し、決定された予測モードにより前記頻度情報テーブルの予測モードの選択頻度順序を並び替えるステップと、並び替えた前記頻度情報テーブルのインデックスを生成するステップと、前記符号化対象画素ブロックに対して、前記インデックスから1つ以上の付帯情報を抽出するステップと、抽出された前記付帯情報に対応した予測信号を生成するステップと、前記予測モードのコストを計算し、前記コストから1つの符号化モードを選択するステップと、選択された前記符号化モードに従って前記予測誤差信号と前記頻度情報テーブルのテーブル長と、選択された符号化モードを示す、前記頻度情報テーブル中のインデックス番号を符号化するステップと、を具備することを特徴とする画像符号化方法を提供する。
本発明によれば、ハードウェアコストを削減しつつ、符号化効率を向上させた画像符号化・復号化方法及び装置を実現できる。
以下に添付図面を参照して、この発明に係る動画像符号化方法及び動画像符号化装置、動画像復号化方法及び動画像復号化装置の最良な実施形態を詳細に説明する。
図1を参照して、本発明の実施形態に係わる動画像符号化装置の構成を説明する。
動画像符号化装置の構成
(符号化:第1の実施の形態)
図1に示される動画像符号化装置によると、動画像信号は小画素ブロック毎に分割され、符号化部100に入力される。符号化部100では、内部予測及びモード判定部102が行う予測モードとして、ブロックサイズや予測画像信号の生成方法の異なる複数の予測モードが用意されている。本実施の形態では、図5(a)に示されているように左上から右下に向かって符号化処理がなされていくものとする。
(符号化:第1の実施の形態)
図1に示される動画像符号化装置によると、動画像信号は小画素ブロック毎に分割され、符号化部100に入力される。符号化部100では、内部予測及びモード判定部102が行う予測モードとして、ブロックサイズや予測画像信号の生成方法の異なる複数の予測モードが用意されている。本実施の形態では、図5(a)に示されているように左上から右下に向かって符号化処理がなされていくものとする。
符号化部100に入力される入力画像信号110は、画面分割部101によって、図5(b)にあるような16x16画素のブロックに分割される。入力画像信号110の画素ブロックが内部予測/モード判定部102へと入力される。内部予測/モード判定部102を介した画素ブロックは、後述するモード判定部103、変換量子化部104を介して、最終的に符号化処理部105によって符号化される。符号化された画素ブロックは出力バッファで蓄積された後に、符号化制御部108が管理する出力タイミングで符号化データ115として出力される。
16x16画素ブロックはマクロブロックと呼ばれ、以下の符号化処理の基本的な処理ブロックサイズとなっている。符号化部100では、このマクロブロック単位に入力画像信号110を読み込み、符号化処理を行う。尚、マクロブロックは32x32画素ブロック単位であっても8x8画素ブロック単位であっても良い。マクロブロックの一例を図5(b)にて示す。
内部予測/モード判定部102は、参照画像メモリ107に一時保存された、符号化済みの参照画素を用いて、マクロブロックで選択可能な全ての予測モードで予測画像信号111を生成する。即ち、内部予測/モード判定部102は、符号化対象画素ブロックで取り得る符号化モードの全ての予測画像信号を生成する。ただし、H.264のフレーム内予測(4x4画素予測(図5(c)参照)又は8x8画素予測(図5(d)参照))のようにマクロブロック内で局所復号画像を作成しないと次の予測が行えないような場合に関しては、内部予測/モード判定部102は内部で係数変換及び量子化、逆量子化及び逆変換を行っても良い。
内部予測/モード判定部102で生成された予測画像信号111は、入力画像信号110とともにモード判定部103へと入力される。モード判定部103は、予測画像信号111を逆量子化逆変換部106へ入力するとともに、入力画像信号110から予測画像信号111を差し引くことによって予測誤差信号112を生成し、変換量子化部104へ入力する。同時にモード判定部103は、内部予測/モード判定部102で予測されたモード情報と生成された予測誤差信号112を基にモード判定を行う。より具体的に説明すると本実施の形態では、モード判定部103は次式のようなコストを用いたモード判定を行う。
K=SAD+λ×OH (1)
但し、OHはモード情報、SADは予測誤差信号の絶対和とする。また、λは定数で与えられ、量子化幅や量子化パラメータの値に基づいて決められる。このようにして得られたコストを基にモードが決定される。この場合、コストKがもっとも小さい値を与えるモードが最適モードとして選択される。
但し、OHはモード情報、SADは予測誤差信号の絶対和とする。また、λは定数で与えられ、量子化幅や量子化パラメータの値に基づいて決められる。このようにして得られたコストを基にモードが決定される。この場合、コストKがもっとも小さい値を与えるモードが最適モードとして選択される。
本実施の形態では、モード情報と予測誤差信号の絶対和を用いたが、別の実施の形態として、モード情報のみ、予測誤差信号の絶対和のみを用いてモードを判定しても良いし、これらをアダマール変換したり、これらに近似した値を利用したりしても良い。また、入力画像信号のアクテビティを用いてコストを作成しても良いし、量子化幅、量子化パラメータを利用してコスト関数を作成しても良い。
コストを算出するための別の実施の形態として、仮符号化部を用意し、この仮符号化部の符号化モードで生成された予測誤差信号を実際に符号化した場合の符号量と、符号化データを局部復号して得た局部復号画像114と入力画像信号110との二乗誤差とを用いてモードを判定しても良い。この場合のモード判定式は以下のようになる。
J=D+λ×R (2)
ここで、Dは、入力画像信号110と局部復号画像114の二乗誤差を表す符号化歪みである。一方、Rは仮符号化によって見積もられた符号量を表している。本コストを用いた場合は、符号化モード毎に仮符号化と局部復号(逆量子化処理や逆変換処理)が必要となるため、回路規模は増大するが、正確な符号量と符号化歪みを用いることが可能となり、符号化効率を高く維持することが可能である。本コストも、符号量のみ、符号化歪みのみを用いてコストを算出しても良いし、これらに近似した値を用いてコスト関数を作成しても良い。
ここで、Dは、入力画像信号110と局部復号画像114の二乗誤差を表す符号化歪みである。一方、Rは仮符号化によって見積もられた符号量を表している。本コストを用いた場合は、符号化モード毎に仮符号化と局部復号(逆量子化処理や逆変換処理)が必要となるため、回路規模は増大するが、正確な符号量と符号化歪みを用いることが可能となり、符号化効率を高く維持することが可能である。本コストも、符号量のみ、符号化歪みのみを用いてコストを算出しても良いし、これらに近似した値を用いてコスト関数を作成しても良い。
モード判定部103は変換量子化部104及び逆量子化逆変換部106に接続されており、モード判定部103で選択されたモード情報と予測誤差信号112は、変換量子化部104へと入力される。変換量子化部104は、入力された予測誤差信号112を変換係数に変換し、変換係数データを生成する。ここでは予測誤差信号112は例えば離散コサイン変換などを用いて直交変換される。別の実施の形態として、ウェーブレット変換や独立成分解析などの手法を用いて変換係数を作成しても良い。変換係数データは、変換量子化部104において量子化され、量子化変換係数113が生成される。量子化に必要とされる量子化パラメータは、符号化制御部108に設定されている。
量子化変換係数113は、モード情報、量子化パラメータなどの予測方法に関する情報とともに符号化処理部105へと入力される。符号化処理部105は、入力されたモード情報等とともに、量子化変換係数113をエントロピー符号化(例えばハフマン符号化や算術符号化など)する。符号化処理部105でエントロピー符号化された符号化データ115は、符号化部100外へと出力され、多重化器等(図示せず)により多重化等が行われ、出力バッファ(図示せず)を通して送信される。この場合、符号化シーケンス毎、ピクチャ毎、又は符号化スライス毎に頻度テーブルのインデックス長を送ることができる。また、テーブル長をシーケンス単位、ピクチャ単位又はスライス単位で送り、インデックスをマクロブロック単位又はブロック単位で送ることができる。テーブル長をシーケンス単位又はスライス単位でヘッダデータに含めて送る、及び/又はインデックスをマクロブロック単位でヘッダデータに含めて送ることができる。
逆量子化逆変換部106は、変換量子化部104によって量子化された変換係数113を、符号化制御部108に設定されている量子化パラメータ、及び量子化マトリクスなどにしたがって逆量子化する。逆量子化された変換係数は、逆変換(例えば逆離散コサイン変換など)され、予測誤差信号(112)に復元される。逆変換により得られた復元予測誤差信号(112)は、モード判定部103から供給される、予測誤差信号の予測モードに対応する予測モードの予測画像信号111と加算される。加算結果信号は局部復号信号114となり、参照画像メモリ107へと入力される。参照画像メモリ107は再構成された画像を蓄積する。このように参照画像メモリ107に蓄積された再構成画像が、内部予測/モード判定部102による予測画像信号等の生成の際に参照される。
符号化ループ(図1における内部予測/モード判定部102→モード判定部103→変換量子化部104→逆量子化逆変換部106→参照画像メモリ107といった順序で流れる処理)は、符号化対象マクロブロックで選択可能な全てのモードに対して処理を行った場合に1回のループとなる。このマクロブロックに対して符号化ループが終了すると、次のマクロブロックの入力画像信号110が入力され、符号化が行われる。
符号化制御部108は発生符号量のフィードバック制御及び量子化特性制御、モード判定制御などを行い、発生符号量の制御を行うレート制御や、内部予測/モード判定部102の制御、外部入力パラメータの制御、符号化全体の制御を行う。同時に出力バッファ(図示せず)の制御を行い、適切なタイミングで符号化データを外部に出力する機能を有する。これら各部の機能は、コンピュータに記憶されたプログラムによって実現できる。
以上が本実施の形態にかかる動画像符号化装置の構成である。以下、本発明にかかる動画像符号化方法について、動画像符号化装置が実施する場合を例にあげ、図2、図3、図4を参照しながら説明する。
図2は、図1の符号化部100中の内部予測/モード判定部102の構成を示すブロック図である。図2おいては、図1と共通する構成要素には同一の符号を付けてその説明を省略する。
内部予測/モード判定部102は、符号化制御部108からインデックス長116を受ける予測制御部501と入力画像信号110及び参照画像メモリ107からの局部復号信号(参照画像)114を受けるモード制御部502を有する。予測制御部501とモード制御部502は図2に示されるように接続されている。即ち、予測制御部501から出力される予測画像信号111はモード制御部502へと入力されるとともに図1のモード判定部103を経て逆量子化逆変換部106へ入力される。モード制御部502から出力される復号信号504は予測制御部501へと入力される。更に入力画像信号110が減算器506へと入力され、予測制御部501から出力される予測画像信号111を減算されて予測誤差信号112が生成される。
予測制御部501について図3を参照して詳細を説明する。予測制御部501は図2に示される符号化制御部108からインデックス長情報を受ける頻度情報テーブル116を受ける頻度情報テーブル抽出部201及び頻度情報テーブル生成部202を有する。頻度情報テーブル生成部202は、現在までに符号化された画素ブロックの予測情報209の頻度をテーブル化している。画素ブロックを符号化する際、制御部210から与えられた予測情報209に従って頻度情報テーブル生成部202の頻度情報テーブルを更新する。更新した頻度情報テーブルは頻度情報テーブル抽出部201へと送られる。
具体的に頻度情報テーブルについて説明する。図7は頻度情報テーブルの更新を示している。図7に示される数字は予測モードの番号を示している。選択された予測モードの番号に従って、1つの画素ブロックのモード判定が完了するごとに、頻度情報テーブルが更新される。先ず、符号化対象画素ブロックの上と左に隣接する画素ブロックの予測モードに対して並び替え(ソーティング)が行われる。例えば図中の右端の画素ブロックについて説明する。この画素ブロックの上の予測モードは1、左の予測モードは7である。このとき、一つ前の頻度情報テーブルの中で、左隣に位置する予測モード7をテーブル中から探し、第1位(テーブルのインデックス0)へと移動する。次に上の予測モードである1をテーブル中から探し、第2位(テーブルのインデックス1)へと移動する。このように各画素ブロックに対して隣接する上左の予測モードを頻度情報テーブルの上位に並び替え(ソーティング)することで、予測モードの頻度情報を得ることが可能となる。
一般的に撮影される画像はカメラ内の光学的特長や変換/量子化の過程によって似た性質を持つことが多く、符号化の際に似た予測方法がまとまった領域に選択され易い傾向がある。この頻度情報テーブルを用いると、符号化対象画素ブロック以前に選択された予測モードがテーブル中の上位に存在することになり、使われていない予測モードはテーブルの下位に存在することとなる。
制御部210に設定されているインデックス長は、図7に示されるテーブルインデックスの長さを定義するものである。たとえば、インデックス長が0の場合は、頻度情報テーブルのインデックス0に設定されている予測モードのみを予測し、符号化することを意味する。同様にインデックス長が1の場合はテーブル中の0〜3までの予測モードを予測し、符号化する。同様にインデックス長が2の場合は、テーブル中の0〜7までの予測モードを予測し、符号化する。同様にインデックス長が3の場合はテーブル中の0〜15までの予測モードを予測し、符号化する。インデックス長がNの場合、以下の式に従って利用可能なテーブル中の予測モード数が決定される。
L=1<<N (3)
頻度情報テーブルで、符号化に使用された予測モードの中で、頻度の高い予測モードが、テーブル中の上位に存在するため、より予測モードの予測が当たりやすい予測モードのみの予測画像生成を行う。本方式を用いた予測を以下、フレキシブルモード予測と呼ぶ。
頻度情報テーブルで、符号化に使用された予測モードの中で、頻度の高い予測モードが、テーブル中の上位に存在するため、より予測モードの予測が当たりやすい予測モードのみの予測画像生成を行う。本方式を用いた予測を以下、フレキシブルモード予測と呼ぶ。
頻度情報テーブル生成部202で生成された頻度情報テーブルが、頻度情報テーブル抽出部201へと出力される。頻度情報テーブル抽出部201は、入力された頻度情報テーブルの中から、インデックス長情報116に対応するL個の予測モードを抽出する。頻度情報テーブル抽出部201は、符号化対象マクロブロックの量子化スケールの値が大きいか、或いは小さいか、に応じて、予測モードを抽出できる。また、頻度情報テーブル抽出部201は、入力画像信号の解像度が高いか、又は低いか、に応じて予測モードを抽出できる。抽出された予測モードが予測モード設定部203へと出力される。予測モード設定部203は、入力された抽出予測モードの中から1つを選択して、選択した予測モードに設定する。この情報はテーブル情報211として制御部210に設定されるとともに、選択予測モードに応じて予測切替スイッチ207を切り替える。切り替えられたスイッチ207の終端は対応する予測器(1,2,...N)204の1つへと接続される。
予測器(1,2,...N)204は、複数の予測方法を表している。予測モード設定部203で設定された予測モードと、これに対応する予測器204の番号1〜Nが対応しており、あらかじめ規定された予測方法で予測が行われる。ここでは例としてH.264で規定されている4x4画素(方向)予測が行われる。
H.264の予測モードは9通りあり、図8(a)に示されるように、モード2を除いて夫々22.5度づつ異なる予測方向を持っている。モード0からモード8までが規定されており、モード2は、DC予測となっている。4x4画素予測の予測ブロックと参照画素との関係が図8(b)に示されている。大文字AからMまでの画素が参照画素であり、小文字aからpまでの画素が対象予測画素である。
予測器204に関して、予測方法を説明する。予測器204では、モード2のDC予測が選択された場合、次式で予測画素が計算される。
H=(A+B+C+D)、V=(I+J+K+L) (4)
a〜p=(H+V+4)>>3
参照画素が利用できない時は、利用できる参照画素の平均値で予測される。利用できる参照画素が1つも存在しない場合は、符号化装置の最大輝度値の半分の値(8ビットなら128)で予測値が計算される。その他のモードが選択された場合、予測器204は、図8(a)で示される予測方向に対して、参照画素から補間された予測値をコピーする予測方法を用いる。具体的には、モード0(垂直予測)が選択された場合の予測値生成方法を次式で説明する。
a〜p=(H+V+4)>>3
参照画素が利用できない時は、利用できる参照画素の平均値で予測される。利用できる参照画素が1つも存在しない場合は、符号化装置の最大輝度値の半分の値(8ビットなら128)で予測値が計算される。その他のモードが選択された場合、予測器204は、図8(a)で示される予測方向に対して、参照画素から補間された予測値をコピーする予測方法を用いる。具体的には、モード0(垂直予測)が選択された場合の予測値生成方法を次式で説明する。
a,e,i,m=A
b,f,j,n=B
b,f,j,n=B
c,g,k,o=C
d,h,l,p=D (5)
このモードは、参照画素AからDまでが利用できるときだけ、選択することが可能である。予測方法の詳細を図8(C)に示す。参照画素A〜Dの輝度値がそのまま垂直方向にコピーされ、予測値として補填される。
d,h,l,p=D (5)
このモードは、参照画素AからDまでが利用できるときだけ、選択することが可能である。予測方法の詳細を図8(C)に示す。参照画素A〜Dの輝度値がそのまま垂直方向にコピーされ、予測値として補填される。
予測モード0,2以外の予測方法に関してもほぼ同様の枠組みが用いられており、予測方向に対して利用できる参照画素から補間値を生成し、その値を予測方向に応じてコピーするという予測を行う。画素ブロックと予測モードの対応は図9に示されている。図中のN/Aは対応する予測方法が定義されていないことを示している。
予測器204から出力される予測画像信号111は内部予測/モード判定部102のモード制御部502(図2)へと出力されるとともに符号化部100のモード判定部103に入力される。
ここで予測画像信号111は図4に示されるモード制御部502において局部復号化処理によって生成された予測モードの残差信号305と加算され、復号信号306となる。復号信号306は内部参照画像メモリ205へ入力される。内部参照画像メモリ205は、入力されてきた復号信号306を保存する。ここで保存された復号画像は以降の予測画像生成時に必要に応じて読み出され、予測器204へと出力され、参照画像として利用される。
以上が本実施の形態にかかる予測制御部501の構成である。次に、図4を参照してモード制御部502の構成を説明する。ここでは、図1及び図2と共通する構成要素には同一の符号を付けてその説明を省略する。
モード制御部502は、マクロブロックサイズよりも小さいブロックサイズの予測も行う。このモード制御部502は、内部モード判定部301、内部変換量子化部302、仮符号化処理部303、内部逆量子化逆変換部304、加算器305により構成される。
入力画像信号110と局部復号信号114とともにモード制御部501から出力された予測画像信号111がモード制御部502内の内部モード判定部301へと入力される。この内部モード判定部301は、予測モードの判定を行う機能を有する。式(1)、式(2)などを用いて予測モードの符号化コストを計算し、最適な予測モードを決定する。内部モード判定部301を通過した予測画像信号111は、内部変換量子化部302へ入力され、直交変換される。ここでは例えば離散コサイン変換などを用いて直交変換される。別の実施の形態として、ウェーブレット変換や独立成分解析などの手法を用いて変換係数を作成しても良い。変換係数308は、さらに量子化される。量子化に必要とされる量子化パラメータは、符号化制御部108に設定されている。変換係数308は仮符号化処理部303へと出力されるとともに、内部逆量子化逆変換部304へと併せて出力される。仮符号化処理部303では、得られた変換係数308を元に符号量309を算出するための一時的な符号化を行う。ここで得られた符号量309を内部モード判定部301へとフィードバックし、符号化コストを算出してもよい。仮符号化処理部303で符号化された変換係数308は、符号化部100の符号化データ115に相当する。
一方、内部逆量子化逆変換部304では、得られた変換係数308を逆量子化する。ここでは変換量子化部302で利用された量子化に関するパラメータを用いて処理が行われる。さらに逆量子化された変換係数は逆変換(例えば逆離散コサイン変換など)を行い、量子化された予測残差信号を生成する。この予測残差信号は加算器305へと入力され、内部モード判定部301から供給される予測画像信号111と加算される。予測残差信号と予測画像信号111の加算信号は復号信号306となる。モード制御部502は、復号信号306を予測制御部501へと出力する。前述した局部復号化処理とは、モード制御部502内の内部モード判定部301⇒内部変換量子化部302⇒内部逆量子化逆変換部304⇒加算器305に対応する処理のことを指している。
内部予測ループ(図3、図4における予測モード設定部203⇒予測切替スイッチ207⇒予測器204⇒内部モード判定部301⇒内部変換量子化部302⇒内部逆量子化逆変換部304⇒加算器305⇒内部参照画像メモリ205といった順序で流れる処理)は、そのマクロブロック内の小画素ブロックで選択可能な全ての予測モードに対して処理を行った場合に1回のループとなる。
例えば、4x4画素予測に対して、合計16回の内部予測ループを行うことになる。この場合、制御部210は、頻度情報テーブル抽出部201で選択された予測モードに対応する予測モードを予測モード設定部203によって設定され、予測切替スイッチ207を操作し、16回の内部予測ループを行い最適なモードの組み合わせを決定する。ここで得られた予測モードは予測画像信号111とともにモード制御部502の内部モード判定部301に順次入力され、符号化対象画素ブロックの最適モードが決定されることになる。
マクロブロックに対して内部予測ループが終了すると、次のマクロブロックの入力画像信号110が入力され、符号化が行われる。
以上が本実施の形態における、動画像符号化装置100の概要である。
本実施の形態においては、予測器204の予測方法として、H.264のフレーム内予測を利用する例を示した。しかし、予測方法に依存しないために、異なる予測方法を適用することも可能である。たとえば、フレーム間予測時に頻度情報テーブルを用いて、動き補償ブロックサイズの予測を行っても良いし、動きベクトルの予測を行っても良い。更に片方向予測や双方向予測の予測モードに対して頻度情報テーブルを作成しても良い。
また、本実施の形態においては、予測モードの頻度情報テーブルの更新時に利用画素ブロック位置として、左と上の画素ブロックの予測モードを参照しているが、符号化対象画素ブロックの隣接画素ブロックとして、さらに広い領域でテーブルを更新しても良い。具体的には、時間的に前後する同位置の画素ブロックの予測モードを用いても良いし、利用可能な右上の画素ブロック、左上の画素ブロック、上の画素ブロック更にその上の画素ブロック、左の画素ブロックの更にその左の画素ブロックなどで選択されている予測モードを用いて、頻度情報テーブルを更新しても良い。
また、本実施の形態においては、予測モードの頻度情報テーブルの更新ルールとして、左の画素ブロックの予測モードをインデックス0、上の画素ブロックの予測モードをインデックス1に挿入し、ソーティングを行っていたが、上の画素ブロックの予測モードをインデックス0、左の画素ブロックの予測モードをインデックス1に挿入し、ソーティングを行っても良いし、上述したように隣接画素ブロックを拡張して、頻度情報テーブルのソーティングを行っても良い。また、頻度情報テーブルを予測モード数に併せて複数所持しても良いし、テーブルごとに異なる更新ルールを適用しても良い。いずれにせよ、符号化器と復号化器で同じ頻度情報テーブルを持っている必要がある。
また、本実施の形態においては、処理対象フレームを16x16画素サイズなどの短形ブロックに分割し、画面左上のブロックから右下に向かって、順に符号化する場合について説明しているが、処理順は他の順序であっても良い。例えば、右下から左上に処理を行っても良いし、画面中央から渦巻状に処理を行っても良い。右上から左下に行っても良いし、画面の周辺部から中心部に向かって処理を行っても良い。
また、実施の形態においては、変換量子化ブロックサイズを16x16画素単位のマクロブロックとして分割し、さらにフレーム内予測の処理単位として、8x8画素ブロックや4x4画素ブロックの場合について説明しているが、処理対象ブロックは均一なブロック形状にする必要は無く、16x8画素、8x16画素、8x4画素、4x8画素、などのブロックサイズに関しても適用可能である。例えば、8x4画素ブロックや2x2画素ブロックに対しても、同様の枠組みで実現が可能である。更に、1つのマクロブロック中で、均一なブロックサイズを取る必要はなく、夫々異なるブロックの大きさを選択しても良い。例えば、マクロブロック内で8x8画素ブロックと4x4画素ブロックを混在させても良い。この場合、分割数が増えると、分割情報を符号化するための符号量が増加するが、より精度の高い予測が可能であり、予測誤差を削減することが可能である。よって、変換係数の符号量と局所復号画像とのバランスを考慮して、ブロックサイズを選択すればよい。即ち、符号化モード毎に対応する予測画素ブロックのサイズを特定の画素ブロックサイズ内で切り替えてもよい。
また、実施の形態においては、変換量子化部104、逆量子化逆変換部106及び内部変換量子化部302、内部逆量子化逆変換部304が設けられている。しかし、必ずしも全ての予測誤差信号に対して変換量子化及び逆量子化逆変換を行う必要は無く、予測誤差信号をそのまま符号化処理部105、仮符号化処理部303で符号化してもよいし、量子化及び逆量子化処理を省略しても良い。同様に、変換処理と逆変換処理を行わなくても良い。
以上が本実施の形態にかかる内部予測及びモード判定部102の構成である。以下、本発明にかかる動画像符号化方法について、動画像符号化装置が実施する場合を例にあげ、図6を参照しながら説明する。
符号化部100に1フレーム分の入力画像信号110が入力される(ステップS1)と画像分割部101は、入力画像信号110を複数のマクロブロックに分割し、更に複数の小画素ブロックへと分割する(ステップS2)。入力画像信号110がブロック単位で内部予測及びモード判定部102へと入力される。このとき、モード判定部103では、モードを示すインデックスやコストの初期化を行う(ステップS3)。
入力画像信号110を用いて、内部予測及びモード判定部102にて、符号化対象ブロックで選択可能な1つの予測モードにおける予測画像信号を生成する(ステップS4)。このとき使用された予測モードによって頻度テーブルが仮更新される(ステップS5)。
予測画像信号111と入力画像信号110の差分を取り、予測誤差信号112を生成する。予測モードの符号量OHと予測誤差信号112の絶対値和SADからコストcostを計算する。又は符号化歪Dと符号量Rから式(2)を用いて符号化costを計算する(ステップS6)。
モード判定部103は、計算されたコストcostが、最小コストmin_costより小さいか否かを判別し(ステップS7)、小さい場合(YES)にはそのコストで最小コストを更新するとともに、その際の符号化モードをbest_modeインデックスとして頻度情報テーブルに保持する(ステップS8)。同時に予測画像信号111を内部メモリに一時保持する(ステップS9)。計算されたコストcostが、最小コストmin_costより大きい場合、モード番号を示すindexをインクリメントし、インクリメント後のindexがモードの最後かどうかを判定する(ステップS10)。
indexがモードの最後の番号であるMAXよりも大きい場合(YES)、決定されたベストモードによって頻度情報テーブルが更新される(ステップS11)。best_modeの符号化モード情報及び予測誤差信号112が変換量子化部104へと渡され、変換及び量子化が行われる(ステップS12)。量子化された変換係数113が符号化処理部105へと入力され、予測情報109が符号化処理部105でエントロピー符号化される(ステップS13)。
一方、indexがモードの最後の番号であるMAXよりも小さい場合(NO)、頻度情報テーブルはリセットされ(ステップS14)され、処理はステップS4に戻り、次のindexで示される符号化モードの予測画像信号111が生成される。
best_modeでの符号化が行われると、量子化された変換係数113が逆量子化逆変換部106へと入力され、逆量子化及び逆変換が行われる(ステップS15)。復号された予測誤差信号112とモード判定部103から供給されるbest_modeの予測画像信号111が加算され、復号画像信号114として、参照画像メモリ107へと保存される(ステップS16)。
ここで、1フレームの符号化が終了しているかどうかの判定が行なわれる(ステップS17)。処理が完了している場合(YES)、処理はステップS1に戻り、次のフレームの入力画像信号が入力され、符号化処理が行われる。一方、1フレームの符号化処理が完了していない場合(NO)、処理はステップS2に戻り、次の小画素ブロックの入力信号が入力され、符号化処理が継続される。
本実施の形態において、フレーム単位のマルチパスで符号化する場合、頻度情報テーブルのインデックス長を変えて、毎回符号化する必要はなく、符号量の増加のみを別途テーブル化して累積しておき、符号化コストを計算し、最適なインデックス長を決定することが可能である。よって再符号化を利用せずとも予測誤差が変わらないため、処理を大幅に削減することが可能である。
以上が本実施の形態における、動画像符号化装置の概要である。次に本予測方式で用いるシンタクスの符号化方法について説明する。
図10に本実施の形態で用いられるシンタクスの構造の概略を示す。シンタクスは主に3つのパートからなり、ハイレベルシンタクス(401)はスライス以上の上位レイヤのシンタクス情報が詰め込まれている。スライスレベルシンタクス(402)では、スライス毎に必要な情報が明記されており、マクロブロックレベルシンタクス(403)では、マクロブロック毎に必要とされる量子化パラメータの変更値やモード情報などが明記されている。
図10に本実施の形態で用いられるシンタクスの構造の概略を示す。シンタクスは主に3つのパートからなり、ハイレベルシンタクス(401)はスライス以上の上位レイヤのシンタクス情報が詰め込まれている。スライスレベルシンタクス(402)では、スライス毎に必要な情報が明記されており、マクロブロックレベルシンタクス(403)では、マクロブロック毎に必要とされる量子化パラメータの変更値やモード情報などが明記されている。
夫々は、さらに詳細なシンタクスで構成されており、ハイレベルシンタクス(401)では、シーケンスパラメータセットシンタクス(404)とピクチャパラメータセットシンタクス(405)などのシーケンス、ピクチャレベルのシンタクスから構成されている。スライスレベルシンタクス(402)では、スライスヘッダーシンタクス(406)、スライスデータシンタクス(407)などから成る。さらに、マクロブロックレベルシンタクス(403)は、マクロブロックレイヤーシンタクス(408)、マクロブロックプレディクションシンタクス(409)などから構成されている。
本実施の形態で、必要となるシンタクス情報はシーケンスパラメータセットシンタクス(404)、ピクチャパラメータセットシンタクス(405)、スライスヘッダーシンタクス(406)、マクロブロックレイヤーシンタクス(408)であり、夫々のシンタクスを以下で説明する。
図11のシーケンスパラメータセットシンタクス内に示されるseq_flexble_mode_prediction_flagは、フレキシブルモード予測の利用可否をシーケンス毎に変更するかどうかを示すフラグであり、当該フラグがTRUEであるときは、フレキシブルモード予測を利用するかどうかを、シーケンス単位で切り替えることが可能である。一方、フラグがFALSEであるときは、シーケンス内ではフレキシブルモード予測を用いることが出来ない。
図12のピクチャーパラメータセットシンタクス内に示されるpic_flexble_mode_prediction_flagは、フレキシブルモード予測の利用可否をピクチャ毎に変更するかどうかを示すフラグであり、このフラグがTRUEであるときは、フレキシブルモード予測を利用するかどうかを、ピクチャ単位で切り替えることが可能である。一方、フラグがFALSEであるときは、ピクチャ内ではフレキシブルモード予測を用いることが出来ない。seq_flexble_mode_prediction_flagがTRUEの場合は必ず、pic_flexble_mode_prediction_flagが送信される。この時pic_flexble_mode_prediction_flagがFALSEの場合は、table_index_lengthが送信される。本シンタクスは、フレキシブルモード予測で利用可能な頻度情報テーブルのインデックス長を表している。
図13のスライスヘッダーシンタクス内に示されるslice_flexble_mode_prediction_flagは、フレキシブルモード予測の利用可否をスライス毎に変更するかどうかを示すフラグであり、このフラグがTRUEであるときは、フレキシブルモード予測を利用するかどうかを、スライス単位で切り替えることが可能である。一方、フラグがFALSEであるときは、スライス内ではフレキシブルモード予測を用いることが出来ない。pic_flexble_mode_prediction_flagがTRUEであるときは、必ずslice_flexble_mode_prediction_flagが送信される。この時slice_flexble_mode_prediction_flagがFALSEの場合は、table_index_lengthが送信される。本シンタクスは、フレキシブルモード予測で利用可能な頻度情報テーブルのインデックス長を表している。
図14のマクロブロックレイヤーシンタクス内に示されるmb_flexble_mode_prediction_flagは、フレキシブルモード予測の利用可否を符号化対象マクロブロックで利用するかどうかを示すフラグであり、このフラグがTRUEであるときは、フレキシブルモード予測を利用する。一方、フラグがFALSEであるときは、フレキシブルモード予測は利用されない。このフラグがTRUEのときには、必ず、mode_indexが送信される。これは符号化対象マクロブロックの予測モードインデックスを示しており、頻度情報テーブルの何番目の予測モードが選択されているかを示している。シンタクス中のBlkSizeは、符号化対象画素ブロックの数を表しており、4x4画素ブロックでは16、8x8画素ブロックでは4、16x16画素ブロックでは1が対応する。mode_indexの符号量は、二値化の過程で、上位シンタクスに記述されるtable_index_lengthによって変更される。たとえば、table_index_lengthが4の場合、[数3]式に従って0〜15までのテーブルインデックスが利用できることになる。mode_indexは、この16個のテーブルインデックスを表しており、等長符号を与えると4ビットのシンタクスとなる。二値化では、対応するシンタクス要素の頻度情報に従って最も符号量が少なくなるように設計されることが望ましい。二値化の例として図17を参照しながら説明する。
図17はインデックス長がL=16(N=4)であるときの二値化の例を示している。L=16の時、テーブルインデックスの選択可能な値は0〜15の16個である(表の一列目の番号に該当)。これらのテーブルインデックス番号の発生確率が分かっていない場合、等長符号を用いて二値化することがもっとも簡単である(表の二列目)。表中のビット列はmode_indexを表している。一方、事前にテーブルインデックス番号の発生確率が分かっている場合、発生確率に応じてハフマン符号を用いて二値化を行うことで、テーブルインデックスを表すmode_indexのビット数を削減することが可能である。図17の表の二列目にハフマン符号の一例を示す。頻度情報テーブルが予め発生頻度に従って更新されているため、テーブルインデックスの上位に表に示されるような短い符号を与えることによって、テーブルインデックスの符号量をより削減することが可能である。表中の四列目がハフマン符号を生成したときの発生確率を示している。
モード判定部103及び予測モード設定部203で選択された予測モードを表すテーブルインデックスの番号は図17で表されるような変換テーブルによって二値化され、この二値化ビット列が符号化処理部105及び仮符号化部303によってエントロピー符号化(たとえば算術符号化など)される。上記符号化以外にエントロピー符号やシャノン符号、算術符号などの方法を用いてインデックスを二値化しても良い。
本実施の別の形態としては、図14で示されるmacroblock_dataシンタクスを図15で表されるようなシンタクスに変えても良い。図14との違いはmode_index[iBlk]の値が、予め定められたESCAPE_CODEの場合、更にecs_mode_index[iBlk]が送られるという点である。
例えば、図17において符号列1111(もしくはハフマン符号の11111)がESCAPE_CODEの場合、現在のテーブル長table_index_lenghtで示される頻度情報テーブルの中に、該当する予測モードが含まれていないことを示す。ecs_mode_index[iBlk]は、更にtable_index_lengthで示されるテーブル長より後のインデックス番号を示している。例えば、頻度情報テーブルの長さ(全予測モード数を示す)M=15、インデックス長L=8の場合の例を図18に示す。選択された頻度情報テーブルのインデックスがインデックス長L=8内からはみ出した場合、mode_index[iBlk]にはESCAPE_CODEがセットされる。更にはみ出したインデックスに対応するecs_mode_index[iBlk]が送られる。例えば、図中で選択された頻度情報テーブルのインデックスが10のとき、mode_index[iBlk]にESCAPE_CODE=111がセットされ、同時にecs_mode_index[iBlk]に011がセットされる。このようにすることで、全ての予測モードをデコーダに送信することが可能となるため、予測モードの追加や削減などの拡張が容易となる。また、夫々の予測モードに対応するシンタクスの設計等が不要となる。
本実施の別の形態としては、図16で表されるようなシンタクスを用いても良い。この場合、上位シンタクスに付加されているseq_flexble_mode_prediction_flag、pic_flexble_mode_prediction_flag、slice_flexble_mode_prediction_flag、table_index_lengthは必要とされない。この場合、インデックス長が送信されないため、常にテーブルの全ての値が利用できる。頻度情報テーブルの更新によって、常に当該ブロックでは最頻の情報がテーブルの上位に来ているため、前述した図18の三列目で表現されるような二値化テーブルを用意することにより、少ない符号量でテーブルインデックス番号を送ることが可能である。
以上説明したように本実施の形態では、選択された予測モードの頻度情報テーブルを利用して、符号化対象ブロックに対して、テーブルから与えられる予測モードの中から、テーブルの上位に存在する出現頻度の高い予測モードのみを抽出して予測画像信号生成を行い、抽出した際のテーブルのインデックス長をシンタクスに多重化して復号化器に送信することで、従来の予測画像生成方法よりも高い符号化効率を維持しつつ、ハードウェアの演算コストを削減した予測画像が生成できる。つまり画素ブロックの内容等に応じて好適な符号化をなすことができる。
(符号化:第2の実施の形態)
図19は、第2の実施形態に係る動画像符号化装置の構成の中で、第1の実施の形態と異なるブロックである予測制御部600を示すブロック図である。本実施の形態では、第1の実施の形態で説明済みの予測制御部501と異なり、予測制御部600には2つの異なる予測部であるL0予測部604とL1予測部608とが設けられる。一方、予測部604,608にそれぞれ対応するL0,L1頻度情報テーブル抽出部601,605、L0、L1頻度情報生成部602、606,L0、L1予測モード設定部603、607が設けられている。また、これら異なるL0,L1予測部604,608から出力された予測画像に対してフィルタ処理を行う適応フィルタ部609が設けられている。尚、既に説明した機能と同様の機能を持つものに対しては同じ参照符号を与えて、その説明を省略する。
図19は、第2の実施形態に係る動画像符号化装置の構成の中で、第1の実施の形態と異なるブロックである予測制御部600を示すブロック図である。本実施の形態では、第1の実施の形態で説明済みの予測制御部501と異なり、予測制御部600には2つの異なる予測部であるL0予測部604とL1予測部608とが設けられる。一方、予測部604,608にそれぞれ対応するL0,L1頻度情報テーブル抽出部601,605、L0、L1頻度情報生成部602、606,L0、L1予測モード設定部603、607が設けられている。また、これら異なるL0,L1予測部604,608から出力された予測画像に対してフィルタ処理を行う適応フィルタ部609が設けられている。尚、既に説明した機能と同様の機能を持つものに対しては同じ参照符号を与えて、その説明を省略する。
内部予測及びモード判定部102では、図2に示される予測制御部501に対応する予測制御部600とモード制御部502が設けられる。予測制御部600は予測制御部501と同様にモード制御部502に接続されており、予測制御部600から出力される予測画像信号111がモード制御部502へと入力され、モード制御部502から出力される復号信号306が予測制御部600へと入力される。入力画像信号110は減算器506へと入力され、予測制御部600から出力される予測画像信号111を減算されて予測誤差信号112を生成する。モード制御部502は、マクロブロックサイズよりも小さいブロックサイズの予測も行うために、図4に示されるように内部モード判定部301、内部変換量子化部302、仮符号化処理部303、内部逆量子化逆変換部304、加算器305を有する。
L0予測部604は、既に符号化された時間的に過去を示す参照画像(局部復号画像)を用いて予測を行う。一方、L1予測部608は、既に符号化された時間的に未来を示す参照画像(局部復号画像)を用いて予測を行う。夫々の予測には対応する参照画像の番号(以下L0REF、L1REFで表す)と予測するブロックの形状、動きベクトル情報などの予測情報612が必要である。
L0頻度情報テーブル生成部602は、現在までに符号化された画素ブロックのL0予測に関する予測情報612の頻度をテーブル化している。符号化対象画素ブロックを符号化する際、制御部210から与えられた後述する予測情報612に従ってL0頻度情報テーブルを更新する。更新したL0頻度情報テーブルはL0頻度情報テーブル抽出部601へと送られる。L0頻度情報テーブル生成部602で生成されたL0頻度情報テーブルが、L0頻度情報テーブル抽出部601へと出力される。L0頻度情報テーブル抽出部601は、入力されたL0頻度情報テーブルの中から、制御部210に設定されているテーブルインデックス長の分のL個のL0予測情報を抽出する。抽出されたL0予測情報がL0予測モード設定部603へと出力される。L0予測モード設定部603は、入力された抽出L0予測情報の中から1つを選択する。この選択LO予測情報はL0テーブル情報613として制御部210に設定されるとともに、L0予測に必要な参照画像(L0REF)を内部参照画像メモリ610から呼び出す。呼び出された参照画像(L0REF)が、L0予測部604へと入力され、この参照画像(L0REF)を用いてL0予測が行われる。L0予測部604で生成されたL0予測画像信号614が適応フィルタ部609へと入力される。
一方、L1頻度情報テーブル生成部606は、現在までに符号化された画素ブロックのL1予測に関する予測情報612の頻度をテーブル化している。符号化対象画素ブロックを符号化する際、制御部210から与えられた後述する予測情報612に従ってL1頻度情報テーブルを更新する。更新したL1頻度情報テーブルはL1頻度情報テーブル抽出部605へと送られる。L1頻度情報テーブル生成部606で生成されたL1頻度情報テーブルが、L1頻度情報テーブル抽出部605へと出力される。L1頻度情報テーブル抽出部605は、入力されたL1頻度情報テーブルの中から、制御部210に設定されているテーブルインデックス長の分のL個のL1予測情報を抽出する。抽出されたL1予測情報がL1予測モード設定部607へと出力される。L1予測モード設定部607では、入力された抽出L1予測情報の中から1つを選択する。この選択L1予測情報はL1テーブル情報617として制御部210に設定されるとともに、L1予測に必要な参照画像(L1REF)を内部参照画像メモリ610から呼び出す。呼び出された参照画像(L1REF)が、L1予測部608へと入力され、L1予測が行われる。L1予測部608で生成されたL1予測画像信号615が適応フィルタ部609へと入力される。
適応フィルタ部609では、入力された2つの信号に対して以下の式を利用してフィルタリングを行う。
Pred=(L0Pred+L1Pred)>>1 (6)
ここで、Predはフィルタリング後に得られる予測画像信号を表している。L0Predは同位置の画素に対応するL0予測画像信号614を表しており、L1Predは同位置の画素に体操するL1予測画像信号615を表している。ここで式(6)に示されるような平均値フィルタ以外のフィルタを用いても良い。具体的には次式で示されるように、L0、L1方向に重み付けするようなフィルタを用いても良い。
ここで、Predはフィルタリング後に得られる予測画像信号を表している。L0Predは同位置の画素に対応するL0予測画像信号614を表しており、L1Predは同位置の画素に体操するL1予測画像信号615を表している。ここで式(6)に示されるような平均値フィルタ以外のフィルタを用いても良い。具体的には次式で示されるように、L0、L1方向に重み付けするようなフィルタを用いても良い。
Pred=(WL0×L0Pred+WL1×L1Pred)
>>(BIT_SHIFT) (7)
WL0、WL1は夫々L0予測画像信号614、L1予測画像信号615に対するフィルタの重み係数を表している。BIT_SHIFTは除算を避けるために導入されるシフト係数である。このとき重み係数とシフト係数には次の関係が成り立つ。
WL0+WL1=(1<<BIT_SHIFT) (8)
また、次のようなオフセットを用いたフィルタを用いてもよい。
Pred=(WL0×L0Pred+WL1×L1Pred)
>>(BIT_SHIFT)+OFFSET (9)
OFFSET値の変更によって時間的に連続する輝度値の変化を効果的に予測することが可能となる。
適応フィルタ部609で生成された予測画像信号111がモード制御部502へと出力される。
>>(BIT_SHIFT) (7)
WL0、WL1は夫々L0予測画像信号614、L1予測画像信号615に対するフィルタの重み係数を表している。BIT_SHIFTは除算を避けるために導入されるシフト係数である。このとき重み係数とシフト係数には次の関係が成り立つ。
WL0+WL1=(1<<BIT_SHIFT) (8)
また、次のようなオフセットを用いたフィルタを用いてもよい。
Pred=(WL0×L0Pred+WL1×L1Pred)
>>(BIT_SHIFT)+OFFSET (9)
OFFSET値の変更によって時間的に連続する輝度値の変化を効果的に予測することが可能となる。
適応フィルタ部609で生成された予測画像信号111がモード制御部502へと出力される。
次に、制御部210の予測情報612について説明する。インター符号化(フレーム間符号化)を行う際、どの予測方法を用いるかを示す予測モード情報と、どの参照画像を利用するかを指す参照画像インデックスと、予測対象画素ブロックが参照画像中のどの画素ブロックを指しているかを指す動きベクトルに関する情報と、予測対象画素ブロックがどのような形状をしているかを指す画素ブロック形状情報が必要となる。本実施の形態では、この内の予測モード情報と参照画像インデックスに関して頻度情報テーブルが生成される。図20にL0予測モードとL1予測モードの予測画素ブロックとモードの対応を示す。図20では、L0予測モード0〜3及びL1予測モード0〜3に対してそれぞれ16×16画素予測、8×8画素予測及び4×4画素予測が示されている。 具体的に頻度情報テーブルについて説明する。図7は頻度情報テーブルの更新を示している。図7に示される数字は予測モードの番号、又は対応する参照画像インデックスの番号を示している。選択された予測モード、又は参照画像インデックスの番号に従って、1つの画素ブロックのモード判定が完了するごとに、頻度情報テーブルが更新される。頻度情報テーブルの更新に関しては第1の実施の形態で既に説明済みなのでここでは説明を省略する。
次に、図21を用いてL0/L1予測部604/608について説明する。L0予測部604は、既に符号化された時間的に過去を示す参照画像(局部復号画像)を用いて予測を行う。具体的には予測対象画素ブロックと、参照画像L0REFに対して1/4画素精度の補間画像を作成し、ブロックマッチングを行う。図中L0予測参照画像で示される領域内に記述されている数字はL0REF番号を示している。ここでは主に、マッチングした画素ブロックと予測対象ブロックの位置ずれ量を動きベクトルとして計測する。その後、予測対象画素ブロックにマッチングした参照画像の画素ブロックで、予測対象画素ブロックを補填する。このようにして予測画像生成を行う。同様に、L1予測部607は、既に符号化された時間的に未来を示す参照画像(局部復号画像)を用いて予測を行う。具体的には符号化対象画素ブロックと、参照画像L1REFに対して1/4画素精度の補間画像を作成し、ブロックマッチングを行う。図中L1予測参照画像の領域内に記述された数字はL1REF番号を示している。ここでは主に、マッチングした画素ブロックと予測対象ブロックの位置ずれ量を動きベクトルとして計測する。その後、マッチングした参照画像の画素ブロックで、予測画素ブロックを補填する。補間画像の生成は、1/2画素精度、1/8画素精度であっても良い。
以上が本実施の形態にかかる予測制御部600の構成である。
以上が本実施の形態にかかる予測制御部600の構成である。
本発明の本実施の形態においては、図19では、L0予測部604、L1予測部608はインデックス長情報611の入力によって必ず予測画像が生成されるブロック図となっている。しかし、実際の符号化フレーム構造では、未来の参照画像が利用できない場合が存在する。このとき、制御部210から与えられる予測情報612では、参照画像のL1REF禁止情報が付加されてL1頻度情報テーブル生成部605へと入力され、利用可能なL1予測モードが制限される。これによってL1予測モード設定部607では、L1REF禁止情報をL1予測部608へ伝える。このとき制御部210はL1REF禁止情報を、適応フィルタ部609部へ伝える。適応フィルタ部609はL1REF禁止情報が入力されると、次式(10)によって予測画像信号を切り替える。
L1Pred=L0Pred (10)
又は、直接L0Predを予測画像信号として出力する。
又は、直接L0Predを予測画像信号として出力する。
また、L0予測部604で必要とされるL0REF、L1予測部608で必要とされるL1REFが共に利用可能な場合においても、片側の予測画像信号を出力する場合、前述したL1REF禁止情報、又はL0REF禁止情報が予測情報612に付加されて、各頻度情報テーブル生成部602,605に入力されることによって、L0予測画像信号614、L1予測画像信号615、フィルタリングした予測画像信号の3つを別々に出力することが可能である。
また、本実施の形態においては、予測モードの頻度情報テーブルの更新時に利用画素ブロック位置として、左と上の画素ブロックの予測モードを参照しているが、予測対象画素ブロックの隣接画素ブロックとして、さらに広い領域でテーブルを更新しても良い。具体的には、時間的に前後する同位置の画素ブロックの予測モードを用いても良いし、利用可能な右上の画素ブロック、左上の画素ブロック、上上の画素ブロック、左左の画素ブロックなどで選択されている予測モードを用いて、頻度情報テーブルを更新しても良い。
また、本実施の形態では、インター予測(フレーム間予測)に関する実施例について詳細に説明したが、イントラ予測(フレーム内予測)に関しても、同様の符号化器構造で実施が可能である。より具体的に説明すると、図8、図9で示されるH.264で規定されている1つの方向予測モード(例えば4x4画素予測内の垂直予測)をL0予測とし、もう1つの方向予測モード(例えば4x4画素予測内の垂直左予測)をL1予測とする。このとき、予測制御部600内で生成された、夫々のL0予測画像信号614とL1予測画像信号615が適応フィルタ部609へと入力され、新たに2つの予測画像信号をフィルタリングした予測画像信号が生成される。L0予測モードに対して、L0頻度情報テーブルが生成され、L1予測モードに対して、L1頻度情報テーブルが生成される。このようにして、予測画像信号を生成することで2つの予測画像信号から新たな予測画像信号を生成することが可能になる。
次に本予測方式で用いるシンタクスの符号化方法について説明する。
図10に本実施の形態で用いられるシンタクスの構造の概略を示す。シンタクスは主に3つのパートからなり、ハイレベルシンタクス(401)はスライス以上の上位レイヤのシンタクス情報が詰め込まれている。シーケンスパラメータセットシンタックス、ピクチャーパラメータセットシンタクス及びスライスヘッダーシンタクスの詳細な説明は上記に図11〜図13を参照してすでに説明しているので省略する。
図22のマクロブロックレイヤーシンタクス内に示されるmb_flexble_mode_prediction_flagは、フレキシブルモード予測の利用可否を予測対象マクロブロックで利用するかどうかを示すフラグであり、このフラグがTRUEであるときは、フレキシブルモード予測を利用する。一方、フラグがFALSEであるときは、フレキシブルモード予測は利用されない。このフラグがTRUEのときには、必ず、mode_index_l0が送信される。これはマクロブロックのL0予測モードインデックスを示しており、L0頻度情報テーブルの何番目の予測モードが選択されているかを示している。mode_index_l1はL1予測モードインデックスを示しており、L1頻度情報テーブルの何番目の予測モードが選択されているかを示している。
マクロブロックレイヤーシンタクス内のBlkSizeは、予測対象画素ブロックの数を表しており、4x4画素ブロックでは16、8x8画素ブロックでは4、16x16画素予測では1が対応する。また、L1PredAvailableFlagは予測対象画素ブロックでL1予測が選択できるかどうかを示すフラグであり、このフラグがTRUEであるときは、mode_index_l1が送信される。一方、FALSEであるときは、mode_index_l1は送信されない。
mode_index_l0及びmode_index_l1の符号量は、二値化の過程で、上位シンタクスに記述されるtable_index_lengthによって変更される。たとえば、table_index_lengthが4(L=16)の場合、式3に従って0〜15までのテーブルインデックスが利用できることになる。mode_index_l0及びmode_index_l1は、この16個のテーブルインデックスを表しており、等長符号を与えると4ビットのシンタクスとなる。二値化では、対応するシンタクス要素の頻度情報に従って最も符号量が少なくなるように設計されることが望ましい。二値化の例は図16で前述しているため説明を省略する。
本実施の形態の別の例としては、図22で示されるmacroblock_dataシンタクスを図23で表されるようなシンタクスに変えても良い。図22との違いはmode_index[iBlk]の値が、予め定められたESCAPE_CODEの場合、更にecs_mode_index_l0[iBlk]、ecs_mode_index_l1[iBlk]が送られる点である。
例えば、図17において符号列1111(又はハフマン符号の11111)がESCAPE_CODEの場合、現在のテーブル長table_index_lenghtで示される頻度情報テーブルの中に、予測対象画素ブロックに該当する予測モードが含まれていないことを示す。ecs_mode_index_l0[iBlk]及びecs_mode_index_l1[iBlk]は、table_index_lengthで示されるテーブル長より後のインデックス番号を示している。例えば、頻度情報テーブルの長さ(全予測モード数を示す)M=15、インデックス長L=8の場合の例を図18に示す。選択された頻度情報テーブルのインデックスがインデックス長L=8内からはみ出した場合、mode_index_l0[iBlk]、又はmode_index_l1[iBlk]にはESCAPE_CODE=111がセットされる。更にはみ出したインデックスに対応するecs_mode_index_l0[iBlk]、又はecs_mode_index_l1[iBlk]が送られる。このようにすることで、L0,L1全ての予測モードをデコーダに送信することが可能となるため、予測モードの追加や削減などの拡張が容易となる。また、夫々の予測モードに対応するシンタクスの設計等が不要となる。
本実施の形態の別の例としては、図24で表されるようなシンタクスを用いても良い。この場合、上位シンタクスに付加されているseq_flexble_mode_prediction_flag、pic_flexble_mode_prediction_flag、slice_flexble_mode_prediction_flag、table_index_lengthは必要とされない。この場合、インデックス長が送信されないため、常にテーブルの全ての値が利用できる。頻度情報テーブルの更新によって、常に予測対象ブロックでは最頻の情報がテーブルの上位に来ているため、前述した図16の三列目で表現されるような二値化テーブルを用意することにより、少ない符号量でmobe_index_l0、mode_index_l1に対応するテーブルインデックス番号を送ることが可能である。
このように、各モードすべてについて負担の大きい符号化処理を行う必要がなく、選択されたモードでの符号化のみ行うようにすればよいので、演算負担の増加も抑制することができる。すなわち、本実施の形態では、高速かつ好適なモード選択と、高速で圧縮効率の高い動画像符号化を実現することが可能となる。
なお、上述したように選択されたモードでの符号化の際、復号画像信号の生成は、選択されたモードについてのみ行えばよく、予測モード判定のためのループ内では、必ずしも実行しなくてもよい。
(2)動画像復号化装置の構成
(復号化:第1の実施の形態)
図25に、本実施形態に係る動画像符号化装置の復号化部400の構成を示す。符号化部100から送出され、伝送系又は蓄積系を経て送られてきた符号化データは、入力バッファ401に一度蓄えられ、多重化された符号化データが逆多重化部402によって逆多重化される。分離された符号化データが符号列復号部403に入力されて、1フレーム毎にシンタクスに基づいてパース処理が行われる。即ち、符号列復号部403では、図10に示されるシンタクス構造に従って、ハイレベルシンタクス、スライスレベルシンタクス、マクロブロックレベルシンタクスの夫々に対して、順次符号化データの各シンタクスの符号列が復号され、量子化された変換係数、量子化マトリクス、量子化パラメータ、予測モード情報、情報テーブルインデックス長などが復元される。ここで予測モード情報の中に、後述するインデックス番号も含まれている。
(復号化:第1の実施の形態)
図25に、本実施形態に係る動画像符号化装置の復号化部400の構成を示す。符号化部100から送出され、伝送系又は蓄積系を経て送られてきた符号化データは、入力バッファ401に一度蓄えられ、多重化された符号化データが逆多重化部402によって逆多重化される。分離された符号化データが符号列復号部403に入力されて、1フレーム毎にシンタクスに基づいてパース処理が行われる。即ち、符号列復号部403では、図10に示されるシンタクス構造に従って、ハイレベルシンタクス、スライスレベルシンタクス、マクロブロックレベルシンタクスの夫々に対して、順次符号化データの各シンタクスの符号列が復号され、量子化された変換係数、量子化マトリクス、量子化パラメータ、予測モード情報、情報テーブルインデックス長などが復元される。ここで予測モード情報の中に、後述するインデックス番号も含まれている。
符号列復号部403で復号されたデータのうち、復号された変換係数が逆量子化逆変換部404へと入力される。逆量子化逆変換部404では、入力された変換係数415が逆量子化される。ここで必要な量子化に関するパラメータは符号列復号部403から復号化制御部409へと設定され、逆量子化の際に読み込まれる。更に逆量子化された変換係数は、逆変換(例えば逆離散コサイン変換など)され、誤差信号413として出力される。ここでは、逆直交変換について説明したが、符号化器でウェーブレット変換や独立成分分析などが行われている場合、逆量子化逆変換部404は対応する逆ウェーブレット変換や逆独立成分分析などが実行されても良い。
誤差信号413は加算器405へと入力され、後述する予測部407から出力される予測画像信号411と加算される。誤差信号413と予測画像信号411が加算されると復号信号414となり、復号信号414が参照画像メモリ406へと出力される。復号信号414は更に参照画像メモリ406を介して動画像復号化部400外へと出力され、出力バッファ408等へ蓄積された後、復号化制御部309が管理するタイミングで出力される。参照画像メモリ406は、復号された信号が参照画像であれば復号信号414を出力バッファへ送出するとともに、内部メモリへと保存する。保存された復号信号414は参照信号412として予測に利用される。一方、復号された信号が非参照画像であれば復号信号414を内部メモリへ保存せず、出力バッファへ送出する。信号が参照画像であるかどうかを示す信号は、符号化データに多重化されている。
一方、符号列復号部403で復号された予測モード情報409、情報テーブルインデックス長410などが予測部407へと入力される。また、既に復号化されている参照信号412が参照画像メモリ406から予測部407へと供給される。予測部407は、入力されたモード情報等を基に、予測画像信号411を生成し、それを加算器405へ供給する。
復号化制御部409は、入力バッファ401、出力バッファ408に対する出力タイミングの制御や、復号化タイミングの制御などを行う。
以上が本実施の形態における動画像復号化装置の構成である。以下、本発明にかかる動画像復号化方法について、復号化部400が実施する例を説明する。この動画像復号化においては、予測制御部407は図1の符号化部100において使用される図3の予測制御部501と同じ構成であるので図3を参照して説明する。
頻度情報テーブル生成部206は、現在までに復号化された画素ブロックの予測モード情報の頻度をテーブル化している。復号化画素ブロックを復号化する際、制御部210から与えられた予測情報209に従って頻度情報テーブルを更新する。更新した頻度情報テーブルは頻度情報テーブル抽出部201へと送られる。
具体的に頻度情報テーブルについて説明する。図7は頻度情報テーブルの更新を示している。図7に示される数字は予測モードの番号を示している。選択された予測モードの番号に従って、1つの画素ブロックのモード判定が完了するごとに、頻度情報テーブルが更新される。先ず、復号化対象画素ブロックの上と左に隣接する画素ブロックの予測モードに対してソーティングが行われる。例えば図中の右端の画素ブロックについて説明する。この画素ブロックの上の予測モードは1、左の予測モードは7である。このとき、一つ前の頻度情報テーブルの中で、左隣に位置する予測モード7をテーブル中から探し、第1位(テーブルのインデックス0)へと移動する。次に上の予測モードである1をテーブル中から探し、第2位(テーブルのインデックス1)へと移動する。このように各画素ブロックに対して隣接する上左の予測モードを頻度情報テーブルの上位にソーティングすることで、予測モードの頻度情報を得ることが可能となる。この頻度情報テーブルを用いると、復号化対象画素ブロック以前に選択された予測モードがテーブル中の上位に存在することになり、使われていない予測モードはテーブルの下位に存在することとなる。
制御部210に設定されているインデックス長は、図7に示されるテーブルインデックスの長さを定義するものである。予測モードを復号化する際、テーブルインデックス長分のビットを復号すればよいので、冗長なビットを削減することが可能となる。
本方式を用いた予測を以下、フレキシブルモード予測と呼ぶ。
頻度情報テーブル生成部202で生成された頻度情報テーブルが、頻度情報テーブル抽出部201へと出力される。頻度情報テーブル抽出部201は、入力された頻度情報テーブルの中から、符号列復号部で復号されたインデックス番号に対応する予測モード番号を抽出する。抽出された予測モードが予測モード設定部203へと出力される。予測モード設定部203では、入力された抽出予測モードを制御部210に設定するとともに、予測切替スイッチ207を対応する予測モードに切り替える。予測モード設定部203で設定された予測モードと、これに対応する予測部の番号が対応しており、あらかじめ規定された予測方法で予測が行われる。ここでは例としてH.264で規定されている4x4画素(方向)予測が行われる。
頻度情報テーブル生成部202で生成された頻度情報テーブルが、頻度情報テーブル抽出部201へと出力される。頻度情報テーブル抽出部201は、入力された頻度情報テーブルの中から、符号列復号部で復号されたインデックス番号に対応する予測モード番号を抽出する。抽出された予測モードが予測モード設定部203へと出力される。予測モード設定部203では、入力された抽出予測モードを制御部210に設定するとともに、予測切替スイッチ207を対応する予測モードに切り替える。予測モード設定部203で設定された予測モードと、これに対応する予測部の番号が対応しており、あらかじめ規定された予測方法で予測が行われる。ここでは例としてH.264で規定されている4x4画素(方向)予測が行われる。
H.264の予測モードは9通りあり、図8(a)に示されるように、モード2を除いて夫々22.5度づつ異なる予測方向を持っている。モード0からモード8までが規定されており、モード2は、DC予測となっている。4x4画素予測の予測ブロックと参照画素との関係が図8(b)に示されている。大文字AからMまでの画素が参照画素であり、小文字aからpまでの画素が復号対象予測画素である。
予測器204に関して、予測方法を説明する。予測器204では、モード2のDC予測が選択された場合、式(3)を用いて予測画素が計算される。
参照画素が利用できない時は、利用できる参照画素の平均値で予測される。もし、利用できる参照画素が1つも存在しない場合は、復号化装置の最大輝度値の半分の値(8ビットなら128)で予測値が計算される。
その他のモードが選択された場合、予測器204は、図8(a)で示される予測方向に対して、参照画素から補間された予測値をコピーする予測方法を用いる。具体的には、モード0(垂直予測)が選択された場合の予測値生成方法を、式(4)を例にして説明する。
このモードは、参照画素AからDまでが利用できるときだけ、選択することが可能である。予測方法の詳細を図8(c)に示す。参照画素A〜Dの輝度値がそのまま垂直方向にコピーされ、予測値として補填される。
予測モード0,2以外の予測方法に関してもほぼ同様の枠組みが用いられており、予測方向に対して利用できる参照画素から補間値を生成し、その値を予測方向に応じてコピーするという予測を行う。本実施の形態にかかわる予測モードと予測画素ブロック形状の対応関係は図9に示されている。
予測器204にて出力される予測画像信号411は予測制御部407外へと出力され、上述した加算器405にて、逆量子化逆変換部404から出力された誤差信号と加算され、復号信号414が生成される。
以上が本発明の本実施の形態における復号化部400の構成である。以下、本発明にかかる動画像復号化方法について、動画像復号部400が実施する例を説明する。この動画像復号化に使用するシンタクスの構造及び夫々のシンタクス並びに二値化は動画像符号化に使用した図10のシンタックス構造及び図11〜14のシンタックスと同じであるので説明を省略する。また、二値化の例も図17を参照して符号化において説明した例と同じであるので説明を省略する。
モード判定部103及び内部モード設定部203で選択された予測モードを表すテーブルインデックスの番号は図17で表されるような変換テーブルによって二値化が行われており、二値化ビット列が符号列復号部403によってエントロピー復号化(たとえば算術復号化など)される。上記復号化以外にエントロピー符号やシャノン符号、算術符号などの方法を用いて二値化が行われていても良い。いずれにせよ、符号化部と復号化部で同様の二値化の方式が行われる必要がある。
本実施の形態の別の例としては、図14で示されるmacroblock_dataシンタクスを図15で表されるようなシンタクスに変えても良い。図14との違いはmode_index[iBlk]の値が、予め定められたESCAPE_CODEの場合、更にecs_mode_index[iBlk]が送られる点である。
例えば、図17において符号列1111(もしくはハフマン符号の11111)がESCAPE_CODEの場合、現在のテーブル長table_index_lenghtで示される頻度情報テーブルの中に、復号対象ブロックに該当する予測モードが含まれていないことを示す。ecs_mode_index[iBlk]は、更にtable_index_lengthで示されるテーブル長より後のインデックス番号を示している。例えば、頻度情報テーブルの長さ(全予測モード数を示す)M=15、インデックス長L=8の場合の例を図18に示す。選択された頻度情報テーブルのインデックスがインデックス長L=8内からはみ出した場合、mode_index[iBlk]にはESCAPE_CODEがセットされる。更にはみ出したインデックスに対応するecs_mode_index[iBlk]がセットされる。例えば、図中で選択された頻度情報テーブルのインデックスが10のとき、mode_index[iBlk]にESCAPE_CODE=111がセットされ、同時にecs_mode_index[iBlk]に011がセットされる。このようにすることで、全ての予測モードを受信することが可能となるため、予測モードの追加や削減などの拡張が容易となる。また、夫々の予測モードに対応するシンタクスの設計等が不要となる。
本実施の形態の別の例としては、図16で表されるようなシンタクスを用いても良い。この場合、上位シンタクスに付加されているseq_flexble_mode_prediction_flag、pic_flexble_mode_prediction_flag、slice_flexble_mode_prediction_flag、table_index_lengthは必要とされない。この場合、インデックス長が受信されないため、常にテーブルの全ての値が利用できる。頻度情報テーブルの更新によって、常に復号対象ブロックでは最頻の情報がテーブルの上位に来ているため、前述した図16の三列目で表現されるような二値化テーブルを用意することにより、テーブルインデックス番号を受信することが可能である。
(復号化:第2の実施の形態)
本実施の形態では、図25の復号化装置の復号部400に設けられ予測制御部407が第2の実施の形態の符号化装置に設けられた、図19に示す予測制御部501と同じように構成されている。即ち、第1の実施の形態と異なり、2つの異なる予測部であるL0予測器604とL1予測器608が設けられている。更に、L0予測器604とL1予測器608にそれぞれ対応する頻度情報テーブル抽出部601,605、L0頻度情報テーブル生成部602、L0頻度情報テーブル抽出部601、L0予測モード設定部603、L1頻度情報テーブル生成部602、L1頻度情報テーブル抽出部605、L1予測モード情報設定部607が設けられている。また、これら異なる予測部604,608から出力された予測画像に対してフィルタ処理を行う適応フィルタ部609が設けられている。この予測制御部407の動作は符号化装置の予測制御部501の動作と同じであるので詳細な説明は省略する。
本実施の形態では、図25の復号化装置の復号部400に設けられ予測制御部407が第2の実施の形態の符号化装置に設けられた、図19に示す予測制御部501と同じように構成されている。即ち、第1の実施の形態と異なり、2つの異なる予測部であるL0予測器604とL1予測器608が設けられている。更に、L0予測器604とL1予測器608にそれぞれ対応する頻度情報テーブル抽出部601,605、L0頻度情報テーブル生成部602、L0頻度情報テーブル抽出部601、L0予測モード設定部603、L1頻度情報テーブル生成部602、L1頻度情報テーブル抽出部605、L1予測モード情報設定部607が設けられている。また、これら異なる予測部604,608から出力された予測画像に対してフィルタ処理を行う適応フィルタ部609が設けられている。この予測制御部407の動作は符号化装置の予測制御部501の動作と同じであるので詳細な説明は省略する。
適応フィルタ部609で生成された予測画像信号が復号化部400の加算器405へと出力される。予測情報612及び頻度情報テーブルも符号化装置と構成及び機能が同じであるので説明を省略する。L0/L1予測部604/608も符号化装置と構成及び機能が同じであるので説明を省略する。
本実施の形態では、インター予測(フレーム間予測)に関する実施例について詳細に説明したが、イントラ予測(フレーム内予測)に関しても、同様の復号化器構造で実施が可能である。より具体的に説明すると、図8、図9で示されるH.264で規定されている1つの方向予測モード(例えば4x4画素予測内の垂直予測)をL0予測とし、もう1つの方向予測モード(例えば4x4画素予測内の垂直左予測)をL1予測とする。このとき、予測制御部600内で生成された、夫々のL0予測画像信号614とL1予測画像信号615が適応フィルタ部609へと入力され、新たにこの2つの予測画像信号をフィルタリングした予測画像信号が生成される。L0予測モードに対して、L0頻度情報テーブルが生成され、L1予測モードに対して、L1頻度情報テーブルが生成される。このようにして、予測画像信号を生成することで2つの予測画像信号から新たな予測画像信号を生成することが可能になる。
本予測方式で用いるシンタクスの復号化方法は復号化の第1の実施の形態と同じであるので説明は省略する。
このように本方式を用いると、予測を行う場合に使用する予測モードを、シーケンス、スライス毎或いはマクロブロック毎に変更できるため、ブロック毎に精度の高い予測画像生成が可能となる。また、本実施形態においては動画像符号化を例にとり説明したが、静止画像符号化にも本発明を適用することができる。
上述のように本発明によると、選択された予測モードの頻度情報テーブルを利用して、符号化対象ブロックに対して、テーブルから与えられる予測モードの中から、テーブルの上位に存在する出現頻度の高い予測モードのみを抽出して予測画像信号生成を行い、抽出した際のテーブルのインデックス長をシンタクスに多重化して復号化器に送信することで、従来の予測画像生成方法よりも高い符号化効率を維持しつつ、ハードウェアの演算コストを削減した予測画像が生成できる。
100…符号化部、101…画面分割部、102…内部予測/モード判定部、
103…モード判定部、104…変換量子化部、105…符号化処理部、106…逆量子化逆変換部、107…参照画像メモリ、108…符号化制御部、201…頻度情報テーブル抽出部、202…頻度情報テーブル生成部、203…予測モード設定部、204…予測器、205…内部参照画像メモリ、207…予測切替スイッチ、210…制御部、
301…内部モード判定部、302…内部変換量子化部、303…仮符号化処理部、
304…内部逆量子化逆変換部、401…入力バッファ、402…逆多重化部、
403…符号列復号部、404…逆量子化逆変換部、405…加算器、406…参照画像メモリ、407…予測制御部、408…出力バッファ、409…復号化制御部、
501…予測制御部、502…モード制御部、506…減算器、600…予測制御部、
601…L0頻度情報テーブル抽出部、602…L0頻度情報テーブル生成部、
603…L0予測モード設定部、604…L0予測部、605…L1頻度情報テーブル抽出部、606…L1頻度情報テーブル生成部、607…L1予測モード設定部、
608…L1予測部、609…適応フィルタ部、610…内部参照画像メモリ
103…モード判定部、104…変換量子化部、105…符号化処理部、106…逆量子化逆変換部、107…参照画像メモリ、108…符号化制御部、201…頻度情報テーブル抽出部、202…頻度情報テーブル生成部、203…予測モード設定部、204…予測器、205…内部参照画像メモリ、207…予測切替スイッチ、210…制御部、
301…内部モード判定部、302…内部変換量子化部、303…仮符号化処理部、
304…内部逆量子化逆変換部、401…入力バッファ、402…逆多重化部、
403…符号列復号部、404…逆量子化逆変換部、405…加算器、406…参照画像メモリ、407…予測制御部、408…出力バッファ、409…復号化制御部、
501…予測制御部、502…モード制御部、506…減算器、600…予測制御部、
601…L0頻度情報テーブル抽出部、602…L0頻度情報テーブル生成部、
603…L0予測モード設定部、604…L0予測部、605…L1頻度情報テーブル抽出部、606…L1頻度情報テーブル生成部、607…L1予測モード設定部、
608…L1予測部、609…適応フィルタ部、610…内部参照画像メモリ
Claims (27)
- 予測モードに関する付帯情報の選択頻度を示す頻度情報テーブルを準備するステップと、
入力画像を複数の画素ブロックに分割するステップと、
前記画素ブロックの符号化対象画素ブロックに応じて予測モードに関する付帯情報を選択するステップと、
選択した付帯情報に基づいて参照画像を用いて前記符号化対象画素ブロックに対する予測画像を生成するステップと、
入力画像と予測画像との予測誤差と前記予測モードの符号量に基づいて最適予測モードを決定し、決定された予測モードにより前記頻度情報テーブルの予測モードの選択頻度順序を並び替えるステップと、
並び替えた前記頻度情報テーブルのインデックスを生成するステップと、
前記符号化対象画素ブロックに対して、前記インデックスから1つ以上の付帯情報を抽出するステップと、
抽出された前記付帯情報に対応した予測信号を生成するステップと、
前記予測モードのコストを計算し、前記コストから1つの符号化モードを選択するステップと、
選択された前記符号化モードに従って前記予測誤差信号と前記頻度情報テーブルのテーブル長と、選択された符号化モードを示す、前記頻度情報テーブル中のインデックス番号を符号化するステップと、
を具備することを特徴とする画像符号化方法。 - 複数の予測モードの選択頻度を示す頻度情報テーブルを準備するステップと、
入力画像を複数の画素ブロックに分割するステップと、
前記画素ブロックの符号化対象画素ブロックに応じて予測モードを選択するステップと、
選択した予測モードに基づいて参照画像を用いて前記符号化対象画素ブロックに対する予測画像を生成するステップと、
入力画像と予測画像との予測誤差と前記予測モードの符号量に基づいて最適予測モードを決定し、決定された予測モードにより前記頻度情報テーブルの予測モードの選択頻度順序を並び替えるステップと、
並び替えた前記頻度情報テーブルのインデックスを生成するステップと、
前記符号化対象画素ブロックに対して、前記インデックスに対応する予測モードの中から1つ以上の予測モードを抽出するステップと、
抽出された前記予測モードに対応して予測信号と予測モード情報とを生成するステップと、
前記予測モードの符号化コストを計算し、この符号化コストから1つの符号化モードを選択するステップと、
選択された前記符号化モードで予測誤差信号と、前記頻度情報テーブルのテーブル長と、選択された符号化モードを示す、前記頻度情報テーブル中のインデックス番号を符号化するステップと、
を具備することを特徴とする画像符号化方法。 - 入力画像を複数の画素ブロックに分割するステップと、
前記画素ブロックの符号化対象画素ブロックに応じて予測モードを選択するステップと、
選択された第一種予測モードに対して予測モードの選択頻度をテーブル化して第1頻度情報テーブルを生成するステップと、
選択された第二種予測モードに対して予測モードの選択頻度をテーブル化して第2頻度情報テーブルを生成するステップと、
前記第一種及び第二種頻度情報テーブルのインデックスを生成するステップと、
前記画素ブロックの符号化対象画素ブロックに対して、前記第1及び第2頻度情報テーブルから与えられる予測モードの中から、夫々1つ以上の予測モードを抽出する予測モード抽出ステップと、
前記第1及び第2頻度情報テーブルから夫々抽出された前記予測モードに対応して第一種予測信号と第二種予測信号と予測モード情報とを生成するステップと、
前記第一種予測信号と第二種予測信号に対してフィルタ処理を行って1つの予測信号を生成するステップと、
前記予測モードの予測誤差信号を計算し、1つの符号化モードを選択するステップと、
選択された符号化モードで生成された予測誤差信号と、前記第1頻度情報テーブルのテーブル長と、前記第2情報テーブルのテーブル長と、選択された符号化モードを示す、前記第一種及び第二種に対応するインデックス番号を符号化する符号化ステップと、
を具備することを特徴とする画像符号化方法。 - 前記符号化ステップは、前記予測誤差信号に変換処理を行うステップと、変換された係数に対して量子化処理を行って、量子化された変換係数を生成するステップとを含む、ことを特徴とする請求項1又は2記載の画像符号化方法。
- 前記符号化モード毎に対応する予測画素ブロックのサイズを特定の画素ブロックサイズ内で切り替えることを可能とするステップをさらに含む、ことを特徴とする請求項1又は2記載の画像符号化方法。
- 前記予測モード抽出ステップは、符号化シーケンス毎、ピクチャ毎、又は符号化スライス毎に前記頻度テーブルのインデックス長を送るステップを含むことを特徴とする、請求項1又は2記載の画像符号化方法。
- 前記予測モード抽出ステップは、符号化対象マクロブロックの量子化スケールの値が大きいか、或いは小さいか、に応じて、前記予測モードの抽出を行うか、行わないかを切り替えるステップを含むことを特徴とする請求項1又は2記載の画像符号化方法。
- 前記予測モード情報抽出ステップは、前記入力画像信号の解像度が高いか、又は低いか、に応じて前記モード情報の抽出を行うか、行わないかを切り替えることを特徴とする、請求項1又は2記載の画像符号化方法。
- 前記符号化モード選択ステップは,選択された前記符号化モードで生成された信号を符号化したときの符号量を算出する符号量算出ステップと、
選択された前記符号化モードで生成された信号を局所復号して局所復号画像を生成するステップと,前記入力画像信号との差を表す符号化歪みを算出する符号化歪み算出ステップと、を具備することを特徴とする請求項1又は2記載の画像符号化方法。 - 前記テーブル長をシーケンス単位、ピクチャ単位又はスライス単位で送り、前記インデックスをマクロブロック単位又はブロック単位で送るステップを含むことを特徴とする請求項1又は請求項2の画像符号化方法。
- 前記テーブル長をシーケンス単位又はスライス単位でヘッダデータに含めて送る、及び/又は前記インデックスをマクロブロック単位でヘッダデータに含めて送るステップを含むことを特徴とする請求項1又は請求項2記載の画像符号化方法。
- 符号化信号の符号化モードに従って前記符号化信号を画素ブロック毎に復号化するステップと、
復号化画素ブロックの予測モードに関する付加情報の選択頻度をテーブル化するための頻度情報テーブルのテーブル長を復号するステップと、
前記復号化されたテーブル長を基に、前記頻度情報テーブルを生成するステップと、
前記頻度情報テーブルのインデックス番号を復号するステップと、
前記インデックスの中から、復号画素ブロックに対応する付加情報を抽出するステップと、
抽出された前記付加情報に対応した予測信号と予測モードとを生成するステップと、
復号信号を基に予測誤差信号を生成するステップと、
予測信号と予測誤差信号を加算して、復号画像を生成するステップと、
を具備することを特徴とする画像復号化方法。 - 符号化信号の符号化モードに従って前記符号化信号を画素ブロック毎に復号化するステップと、
復号化画素ブロックの予測モードの選択頻度をテーブル化するための頻度情報テーブルのテーブル長を復号するステップと、
前記復号化されたテーブル長を基に、前記頻度情報テーブルを生成するステップと、
前記頻度情報テーブルのインデックス番号を復号するステップと、
前記インデックスに対応する予測モードの中から、1つ以上の予測モードを抽出するステップと、
抽出された前記予測モードに対応して予測信号を生成するステップと、
復号化信号を基に予測誤差信号を生成するステップと、
予測信号と予測誤差信号を加算して、復号画像を生成するステップと、
を具備することを特徴とする画像復号化方法。 - 符号化信号の符号化モードに従って前記符号化信号を画素ブロック毎に復号化するステップと、
復号化画素ブロックの第一種の予測モード及び第二種の予測モードの選択頻度をそれぞれテーブル化するための頻度情報テーブルのテーブル長を復号するステップと、
第一種の予測モードに対して予測モードの選択頻度をテーブル化して第一種頻度情報テーブルを生成するステップと、
第二種の予測モードに対して予測モードの選択頻度をテーブル化して第二種頻度情報テーブルを生成するステップと、
前記第一種及び第二種頻度情報テーブルのインデックス番号をそれぞれ復号するステップと、
前記インデックスの中から、第一種及び第二種予測モードに夫々対応する予測モードを抽出するステップと、
抽出された前記第一種及び第二種予測モードに対応して第一種予測信号と第二種予測信号及び予測モード情報とを生成するステップと、
前記第一種予測信号と前記第二種予測信号に対してフィルタ処理を行って1つの予測信号を生成するステップと、
復号化信号を基に予測誤差信号を生成するステップと、
予測信号と予測誤差信号を加算して、復号画像を生成するステップと、
を具備することを特徴とする画像復号化方法。 - 前記予測誤差信号生成ステップは、復号化係数を逆量子化するステップと、逆量子化変換係数を逆変換して予測誤差信号を生成するステップを含むことを特徴とする請求項12又は13記載の画像復号化方法。
- 前記符号化モード毎に対応する予測画素ブロックのサイズを特定の画素ブロックサイズ内で切り替えることを可能とするステップをさらに含むことを特徴とする請求項12又は13記載の画像復号化方法。
- 前記予測モード抽出ステップは、前記予測モードの抽出を行う際、シーケンス毎、ピクチャ毎、又はスライス毎に頻度テーブルのインデックス長を送ることを特徴とする請求項12又は13記載の画像復号化方法。
- 前記予測モード抽出ステップは、復号対象マクロブロックの量子化スケールの値が大きいか、又は小さいか、に応じて、前記予測モードの抽出を行うことを特徴とする請求項12又は13記載の画像復号化方法。
- 前記予測モード抽出ステップは、復号化対象入力画像信号の解像度が高いか、又は低いか、に応じて前記モード情報の抽出を行うことを特徴とする、請求項10又は11記載の画像復号化方法。
- 予測モードに関する付帯情報の選択頻度を示す頻度情報テーブルを記憶するメモリと、
入力画像を複数の画素ブロックに分割する分割部と、
前記画素ブロックの符号化対象画素ブロックに応じて予測モードに関する付帯情報を選択する選択部と、
選択した付帯情報に基づいて参照画像を用いて前記符号化対象画素ブロックに対する予測画像を生成する予測部と、
入力画像と予測画像との予測誤差と前記予測モードの符号量に基づいて最適予測モードを決定し、決定された予測モードにより前記頻度情報テーブルの予測モードの選択頻度順序を並び替えるテーブル更新部と、
並び替えた前記頻度情報テーブルのインデックスを生成するインデックス生成部と、
前記符号化対象画素ブロックに対して、前記インデックスから1つ以上の付帯情報を抽出する抽出部と、
抽出された前記付帯情報に対応した予測信号を生成する予測信号生成部と、
前記予測モードのコストを計算し、前記コストから1つの符号化モードを選択する選択部と、
選択された前記符号化モードに従って前記予測誤差信号と前記頻度情報テーブルのテーブル長と、選択された符号化モードを示す、前記頻度情報テーブル中のインデックス番号を符号化する符号化部と、
を具備することを特徴とする画像符号化装置。 - 符号化信号の符号化モードに従って前記符号化信号を画素ブロック毎に復号化する復号部と、
復号化画素ブロックの予測モードに関する付加情報の選択頻度をテーブル化するための頻度情報テーブルのテーブル長を復号するテーブル復号化と、
前記復号化されたテーブル長を基に、前記頻度情報テーブルを生成する頻度情報テーブル生成部と、
前記頻度情報テーブルのインデックス番号を復号するインデックス復号部と、
前記インデックスの中から、復号画素ブロックに対応する付加情報を抽出する付加情報抽出部と、
抽出された前記付加情報に対応した予測信号と予測モードとを生成する予測信号生成部と、
復号信号を基に予測誤差信号を生成する予測誤差信号生成部と、
予測信号と予測誤差信号を加算して、復号画像を生成する復号画像生成部と、
を具備することを特徴とする画像復号化装置。 - 予測モードに関する付帯情報の選択頻度を示す頻度情報テーブルを準備する手順と、
入力画像を複数の画素ブロックに分割する手順と、
前記画素ブロックの符号化対象画素ブロックに応じて予測モードに関する付帯情報を選択する手順と、
選択した付帯情報に基づいて参照画像を用いて前記符号化対象画素ブロックに対する予測画像を生成する手順と、
入力画像と予測画像との予測誤差と前記予測モードの符号量に基づいて最適予測モードを決定し、決定された予測モードにより前記頻度情報テーブルの予測モードの選択頻度順序を並び替える手順と、
並び替えた前記頻度情報テーブルのインデックスを生成する手順と、
前記符号化対象画素ブロックに対して、前記インデックスから1つ以上の付帯情報を抽出する手順と、
抽出された前記付帯情報に対応した予測信号を生成する手順と、
前記予測モードのコストを計算し、前記コストから1つの符号化モードを選択する手順と、
選択された前記符号化モードに従って前記予測誤差信号と前記頻度情報テーブルのテーブル長と、選択された符号化モードを示す、前記頻度情報テーブル中のインデックス番号を符号化する手順と、
をコンピュータに実行させるための画像符号化プログラム。 - 符号化信号の符号化モードに従って前記符号化信号を画素ブロック毎に復号化する手順と、
復号化画素ブロックの予測モードに関する付加情報の選択頻度をテーブル化するための頻度情報テーブルのテーブル長を復号化する手順と、
前記復号化されたテーブル長を基に、前記頻度情報テーブルを生成する手順と、
前記頻度情報テーブルのインデックス番号を復号する手順と、
前記インデックスの中から、復号画素ブロックに対応する付加情報を抽出する手順と、
抽出された前記付加情報に対応した予測信号と予測モードとを生成する手順と、
復号信号を基に予測誤差信号を生成する手順と、
予測信号と予測誤差信号を加算して、復号画像を生成する手順と、
をコンピュータに実行させるための画像復号化プログラム。 - 入力画像を分割した複数のブロックの各々より前に符号化されたブロックでの予測モードに関する複数の情報の選択履歴に基づいて、予め定めた規則に従って前記各ブロックで選択される可能性の高い順に前記複数の情報を並べたテーブルを生成するテーブル生成ステップと、
前記複数の情報の中から前記各ブロックの予測に使用する選択情報を選択する選択ステップと、
前記選択情報に従った予測を行うことにより前記各ブロックの画像信号から前記各ブロックの予測残差信号を生成する予測ステップと、
前記各ブロックの前記予測残差信号、前記テーブルの長さを示す情報、および、前記選択テーブル内で前記選択情報に対応するインデックス番号を符号化して符号化データを生成する符号化ステップと、
を有する画像符号化方法。 - 前記テーブル生成ステップでは、前記複数の情報のうち選択される可能性が高い方から順に抽出された一部を用いて前記テーブルを生成する、ことを特徴とする請求項24の画像符号化方法。
- 入力画像を分割した複数のブロックの各々より前に符号化されたブロックでの予測モードに関する複数の情報の選択履歴に基づいて、予め定めた規則に従って前記各ブロックで選択される可能性の高い順に前記複数の情報を並べたテーブルを生成するテーブル生成部と、
前記複数の情報の中から前記各ブロックの予測に使用する選択情報を選択する選択部と、
前記選択情報に従った予測を行うことにより前記各ブロックの画像信号から前記各ブロックの予測残差信号を生成する予測部と、
前記各ブロックの前記予測残差信号、前記テーブルの長さを示す情報、および、前記選択テーブル内で前記選択情報に対応するインデックス番号を符号化して符号化データを生成する符号化部と、
を有する画像符号化装置。 - 前記テーブル生成部は、前記複数の情報のうち選択される可能性が高い方から順に抽出された一部を用いて前記テーブルを生成する、ことを特徴とする請求項26の画像符号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087202A JP2010135864A (ja) | 2007-03-29 | 2007-03-29 | 画像符号化方法及び装置並びに画像復号化方法及び装置 |
PCT/JP2008/055588 WO2008123254A1 (ja) | 2007-03-29 | 2008-03-25 | 画像符号化方法及び装置並びに画像復号化方法及び装置 |
TW97110810A TW200850012A (en) | 2007-03-29 | 2008-03-26 | Image encoding method, device, image decoding method, and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087202A JP2010135864A (ja) | 2007-03-29 | 2007-03-29 | 画像符号化方法及び装置並びに画像復号化方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010135864A true JP2010135864A (ja) | 2010-06-17 |
Family
ID=39830747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007087202A Pending JP2010135864A (ja) | 2007-03-29 | 2007-03-29 | 画像符号化方法及び装置並びに画像復号化方法及び装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2010135864A (ja) |
TW (1) | TW200850012A (ja) |
WO (1) | WO2008123254A1 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110083366A (ko) * | 2010-01-14 | 2011-07-20 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR20120011428A (ko) * | 2010-07-29 | 2012-02-08 | 에스케이 텔레콤주식회사 | 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치 |
WO2012096095A1 (ja) * | 2011-01-12 | 2012-07-19 | 株式会社エヌ・ティ・ティ・ドコモ | 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム |
WO2012121369A1 (ja) * | 2011-03-10 | 2012-09-13 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
WO2013105457A1 (ja) * | 2012-01-12 | 2013-07-18 | ソニー株式会社 | 画像処理装置および方法 |
KR101373670B1 (ko) | 2011-11-04 | 2014-03-14 | 연세대학교 산학협력단 | 인트라 예측 방법 및 장치 |
KR20150034707A (ko) * | 2015-03-11 | 2015-04-03 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
JP2016519898A (ja) * | 2013-04-08 | 2016-07-07 | ジーイー ビデオ コンプレッション エルエルシー | コンポーネント間予測 |
KR101768209B1 (ko) | 2016-11-03 | 2017-08-16 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101857800B1 (ko) | 2017-08-08 | 2018-05-14 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101917656B1 (ko) | 2018-05-03 | 2018-11-12 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
WO2019194440A1 (ko) * | 2018-04-02 | 2019-10-10 | 엘지전자 주식회사 | 인트라 예측 모드에 대한 룩업 테이블을 이용한 영상 코딩 방법 및 그 장치 |
JP2023500223A (ja) * | 2020-02-12 | 2023-01-05 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 画像処理方法、装置、端末及びコンピュータプログラム |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5801054B2 (ja) * | 2007-06-12 | 2015-10-28 | トムソン ライセンシングThomson Licensing | スライスデータ用のマルチパスビデオのシンタックス構造をサポートする方法及び装置 |
EP2106148A3 (en) * | 2008-03-28 | 2010-11-03 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding information about intra-prediction mode of video |
KR101690291B1 (ko) * | 2009-02-05 | 2016-12-27 | 톰슨 라이센싱 | 적응형 모드 비디오 인코딩 및 디코딩 방법 및 장치 |
TWI468020B (zh) * | 2009-02-19 | 2015-01-01 | Sony Corp | Image processing apparatus and method |
TWI440363B (zh) | 2009-02-19 | 2014-06-01 | Sony Corp | Image processing apparatus and method |
TWI463878B (zh) * | 2009-02-19 | 2014-12-01 | Sony Corp | Image processing apparatus and method |
US8594200B2 (en) * | 2009-11-11 | 2013-11-26 | Mediatek Inc. | Method of storing motion vector information and video decoding apparatus |
CN106998473B (zh) | 2010-04-09 | 2020-03-24 | 三菱电机株式会社 | 运动图像编码装置以及运动图像解码装置 |
JP2013131786A (ja) * | 2010-04-09 | 2013-07-04 | Mitsubishi Electric Corp | 動画像符号化装置および動画像復号装置 |
CN105847791B (zh) | 2010-07-15 | 2018-11-27 | 三菱电机株式会社 | 图像编码装置及其方法和图像解码装置及其方法 |
CN103636218B (zh) * | 2011-06-30 | 2017-07-28 | Jvc建伍株式会社 | 图像解码装置和图像解码方法 |
US10021409B2 (en) | 2012-05-09 | 2018-07-10 | Integrated Device Technology, Inc. | Apparatuses and methods for estimating bitstream bit counts |
KR20210087928A (ko) * | 2018-11-06 | 2021-07-13 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 인트라 예측을 위한 파라미터 유도의 복잡성 감소 |
CN113170122B (zh) | 2018-12-01 | 2023-06-27 | 北京字节跳动网络技术有限公司 | 帧内预测的参数推导 |
MX2021006254A (es) | 2018-12-07 | 2021-07-06 | Beijing Bytedance Network Tech Co Ltd | Intraprediccion basada en contexto. |
EP3903493A4 (en) | 2019-02-24 | 2022-07-06 | Beijing Bytedance Network Technology Co., Ltd. | PARAMETER DERIVATION FOR INTRA PREDICTION |
CN113767631B (zh) | 2019-03-24 | 2023-12-15 | 北京字节跳动网络技术有限公司 | 用于帧内预测的参数推导中的条件 |
CN114258679A (zh) * | 2019-08-19 | 2022-03-29 | 北京字节跳动网络技术有限公司 | 基于计数器的帧内预测模式 |
WO2021032112A1 (en) | 2019-08-19 | 2021-02-25 | Beijing Bytedance Network Technology Co., Ltd. | Initialization for counter-based intra prediction mode |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003198379A (ja) * | 2001-12-28 | 2003-07-11 | Ricoh Co Ltd | 信号符号化装置、信号符号化方法、プログラムおよび記録媒体 |
JP4490261B2 (ja) * | 2002-06-11 | 2010-06-23 | ノキア コーポレイション | イントラ符号化に基づく空間予測 |
JP3940657B2 (ja) * | 2002-09-30 | 2007-07-04 | 株式会社東芝 | 動画像符号化方法と装置及び動画像復号化方法と装置 |
-
2007
- 2007-03-29 JP JP2007087202A patent/JP2010135864A/ja active Pending
-
2008
- 2008-03-25 WO PCT/JP2008/055588 patent/WO2008123254A1/ja active Application Filing
- 2008-03-26 TW TW97110810A patent/TW200850012A/zh unknown
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11128856B2 (en) | 2010-01-14 | 2021-09-21 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order |
KR101675118B1 (ko) | 2010-01-14 | 2016-11-10 | 삼성전자 주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
US9894356B2 (en) | 2010-01-14 | 2018-02-13 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order |
US10582194B2 (en) | 2010-01-14 | 2020-03-03 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order |
US10110894B2 (en) | 2010-01-14 | 2018-10-23 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding video and method and apparatus for decoding video by considering skip and split order |
KR20110083366A (ko) * | 2010-01-14 | 2011-07-20 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101681303B1 (ko) * | 2010-07-29 | 2016-12-01 | 에스케이 텔레콤주식회사 | 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치 |
KR20120011428A (ko) * | 2010-07-29 | 2012-02-08 | 에스케이 텔레콤주식회사 | 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치 |
US9973750B2 (en) | 2010-07-29 | 2018-05-15 | Sk Telecom Co., Ltd. | Method and device for image encoding/decoding using block split prediction |
WO2012096095A1 (ja) * | 2011-01-12 | 2012-07-19 | 株式会社エヌ・ティ・ティ・ドコモ | 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム |
WO2012121369A1 (ja) * | 2011-03-10 | 2012-09-13 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム |
KR101373670B1 (ko) | 2011-11-04 | 2014-03-14 | 연세대학교 산학협력단 | 인트라 예측 방법 및 장치 |
WO2013105457A1 (ja) * | 2012-01-12 | 2013-07-18 | ソニー株式会社 | 画像処理装置および方法 |
JP2016519898A (ja) * | 2013-04-08 | 2016-07-07 | ジーイー ビデオ コンプレッション エルエルシー | コンポーネント間予測 |
US10237567B2 (en) | 2013-04-08 | 2019-03-19 | Ge Video Compression Llc | Inter-component prediction |
KR20150034707A (ko) * | 2015-03-11 | 2015-04-03 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101675120B1 (ko) | 2015-03-11 | 2016-11-22 | 삼성전자 주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101768209B1 (ko) | 2016-11-03 | 2017-08-16 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
KR101857800B1 (ko) | 2017-08-08 | 2018-05-14 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
WO2019194440A1 (ko) * | 2018-04-02 | 2019-10-10 | 엘지전자 주식회사 | 인트라 예측 모드에 대한 룩업 테이블을 이용한 영상 코딩 방법 및 그 장치 |
US11303929B2 (en) | 2018-04-02 | 2022-04-12 | Lg Electronics Inc. | Image coding method using lookup table for intra prediction mode and apparatus therefor |
KR101917656B1 (ko) | 2018-05-03 | 2018-11-12 | 삼성전자주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
JP2023500223A (ja) * | 2020-02-12 | 2023-01-05 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 画像処理方法、装置、端末及びコンピュータプログラム |
JP7391456B2 (ja) | 2020-02-12 | 2023-12-05 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 画像処理方法、装置、端末及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008123254A1 (ja) | 2008-10-16 |
TW200850012A (en) | 2008-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010135864A (ja) | 画像符号化方法及び装置並びに画像復号化方法及び装置 | |
JP6321749B2 (ja) | 動画符号化装置 | |
JP6164600B2 (ja) | ビデオ符号化での分割ブロック符号化方法、ビデオ復号化での分割ブロック復号化方法及びこれを実現する記録媒体 | |
KR102064154B1 (ko) | 휘도 샘플을 이용한 색차 블록의 화면 내 예측 방법 및 이러한 방법을 사용하는 장치 | |
DK3282705T3 (en) | PROCEDURE FOR DECODING AND APPARATUS FOR ENCODING A PICTURE THROUGH INTRAPHIC PREDICTION. | |
CN104811714B (zh) | 使用平面表达的增强帧内预测编码 | |
KR101581100B1 (ko) | 참조 픽쳐 리스트 관리 방법 및 이러한 방법을 사용하는 장치 | |
WO2011125256A1 (ja) | 画像符号化方法及び画像復号化方法 | |
WO2012087034A2 (ko) | 화면 내 예측 방법 및 이러한 방법을 사용하는 장치 | |
AU2018204503B2 (en) | Method and apparatus for motion compensation prediction | |
US20090310677A1 (en) | Image encoding and decoding method and apparatus | |
JP5219089B2 (ja) | 画像データの生成方法 | |
JP2018056685A (ja) | 画像符号化装置、画像符号化方法、及び画像符号化プログラム、並びに、画像復号装置、画像復号方法、及び画像復号プログラム | |
JP6244864B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
CN112567743B (zh) | 图像编码装置、图像解码装置及程序 | |
KR20190116101A (ko) | 어파인 모델 기반의 영상 부호화/복호화 방법 및 장치 | |
KR101108681B1 (ko) | 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법 | |
KR101615643B1 (ko) | 픽처들의 압축 | |
JP5004180B2 (ja) | 動画像符号化装置および復号装置 | |
JP2023168518A (ja) | 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム | |
KR20180096194A (ko) | 변환 계수 부호화 및 복호화 장치와 이를 구비하는 부호화 장치 및 복호화 장치 | |
JP6528635B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
JP2011135460A (ja) | 動画像符号化装置および動画像復号装置 | |
JP2009049969A (ja) | 動画像符号化装置及び方法並びに動画像復号化装置及び方法 | |
JP5513333B2 (ja) | 動画像符号化装置、動画像符号化方法、およびプログラム |