JP5983704B2 - 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム - Google Patents
動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム Download PDFInfo
- Publication number
- JP5983704B2 JP5983704B2 JP2014220876A JP2014220876A JP5983704B2 JP 5983704 B2 JP5983704 B2 JP 5983704B2 JP 2014220876 A JP2014220876 A JP 2014220876A JP 2014220876 A JP2014220876 A JP 2014220876A JP 5983704 B2 JP5983704 B2 JP 5983704B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- block
- picture
- bit
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000004590 computer program Methods 0.000 title claims description 9
- 238000004364 calculation method Methods 0.000 claims description 46
- 238000012545 processing Methods 0.000 claims description 32
- 230000005540 biological transmission Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 description 46
- 238000013139 quantization Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000003111 delayed effect Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- YEPGIYSLLAGBSS-UHFFFAOYSA-M chloro-[3-[(4-iodophenyl)carbamoylamino]-2-methoxypropyl]mercury Chemical compound Cl[Hg]CC(OC)CNC(=O)NC1=CC=C(I)C=C1 YEPGIYSLLAGBSS-UHFFFAOYSA-M 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
受信バッファのアンダーフローとは、動画像符号化装置が一定の伝送レートでデータストリームを送信した場合に、各ピクチャの符号量が多く、動画像復号装置が復号・表示するべき時刻までにピクチャを復号するのに必要なデータの伝送が完了せず、復号受信バッファ内に必要データが存在していないことである。この場合、動画像復号装置は復号処理を行うことが出来ないため、フレームスキップが発生することとなる。
上述したように、理想復号装置では、処理時間0で、瞬時的に復号処理が完了すると規定される。そのため、動画像符号化装置へのi番目ピクチャの入力時刻をt(i)、理想復号装置における、i番目ピクチャの復号時刻をdt(i)とすれば、そのピクチャが表示可能となる時刻は、同様にdt(i)となる。全てのピクチャにおいてピクチャの表示期間{t(i+1)-t(i)}と{dt(i+1)-dt(i)}が等しくなるので、復号時刻dt(i)は、入力時刻t(i)から固定時間dly分だけ遅延させた時刻{dt(i)=t(i)+dly}となる。従って、動画像符号化装置は、時刻dt(i)までに復号に必要なデータを動画像復号装置の受信バッファに伝送完了させなければならない。
受信バッファでは、所定の伝送レートでバッファ占有量が回復し、各ピクチャの復号時刻にそのピクチャを復号するために用いられる分のデータがバッファから引き抜かれる。i番目ピクチャのデータが、時刻at(i)から受信バッファに入力開始され、i番目ピクチャの最後のデータが時刻ft(i)に入力される。理想復号装置は時刻dt(i)でi番目ピクチャの復号を完了し、その時刻dt(i)においてi番目ピクチャが表示可能となる。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
図2は、一つの実施形態による、動画像符号化装置の概略構成図である。動画像符号化装置10は、符号化処理部11と、符号量制御部12と、グループ決定部13と、グループ復号時刻情報算出部14と、グループ情報付加部15と、ビットカウンタ25とを有する。動画像符号化装置10が有するこれらの各部は、それぞれ、別個の回路として動画像符号化装置10に実装される。あるいは、動画像符号化装置10が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像符号化装置10に実装されてもよい。あるいはまた、動画像符号化装置10が有するこれらの各部は、動画像符号化装置10が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
各ブロックは直交変換部21に入力される。そして直交変換部21は、各ブロックに対して、それぞれ、例えば離散コサイン変換(Discrete Cosine Transform、DCT)などの直交変換処理を行って周波数係数の組を算出する。算出された周波数係数の組は量子化部22に入力される。なお、各ブロックに対して、既に符号化されたピクチャを動き補償することなどにより予測画像が生成される場合には、各ブロックと予測画像間の差分演算により求められる予測誤差画像が直交変換部21に入力されてもよい。
また、符号化された動画像は、カラー動画像であってもよく、あるいは、モノクロ動画像であってもよい。
量子化部22により量子化された各周波数係数は、可変長符号化部23に入力される。また量子化された各周波数係数は、以降に符号化されるピクチャまたはブロックに対する予測画像を作成するために逆量子化され、さらに逆直交変換されて図示しない画像メモリに記憶されてもよい。
また、可変長符号化部23にて発生したビット系列のビット量はブロックごとにビットカウンタ25にて加算され、発生符号量として符号量制御部12のバッファ占有量算出部26に通知される。
可変長符号化部23の実施形態の詳細については後述する。
なお、グループに含まれるブロックの数は、1から画面全体のブロック数までの間の値にしてもよい。
グループ決定部13は、符号化対象ブロックが属するグループの識別情報を符号量制御部12のバッファ占有量算出部26へ通知する。またグループ決定部13は、グループの総数Nをグループ復号時刻情報算出部14及びグループ情報付加部15へ通知する。なお、グループ決定部13は、各グループの先頭に位置するブロックのインデックスをグループ情報付加部15へ通知してもよい。
以下、符号化対象ピクチャに含まれる水平方向のブロック数をM、垂直方向のブロック数をNとして、全ブロックを1ブロックライン単位でN個のグループに等分割した場合を例に説明する。
さらにグループ復号時刻情報算出部14は、2番目以降に符号化・復号されるグループの復号時刻dgt(i,n)(n≧2)を、次式のように決定してもよい。
グループ復号時刻情報算出部14は、各グループの復号時刻を含む復号時刻情報を、バッファ占有量算出部26及びグループ情報付加部15へ出力する。
バッファ占有量算出部26は、各グループの最後のブロックの符号化処理が行われた後に、次式に従ってバッファ占有量dを回復させる。
量子化値算出部24は、例えば、MPEG-2における標準化団体参照ソフトウェアTest Model5(非特許文献1を参照)における量子化値算出方法に従って量子化値を算出する。次に、量子化値算出部24は、バッファ占有量dを所定の閾値DTH1と比較する。量子化値をその取り得る値の範囲のうちの最大値としたときに、各ブロックで発生する最大の符号量をb0、符号化処理中のブロックの属するグループで、まだ符号化処理を行っていないブロックの数をM0とすると、閾値DTH1は、次式で表される。
またb0として、周波数係数を全て0としたときのブロックの符号量を用いてもよい。このとき、dがDTH1よりも小さければ、量子化値算出部24は、符号化対象ブロックの全ての周波数係数が0に量子化されるように量子化値を決定する。この制御により、グループ内の符号化処理が済んでいない残りブロックの符号量の平均値がb0を超えなければ、仮想的な復号受信バッファはアンダーフローしない。
これにより、符号量制御部12は、動画像符号化装置10からの出力ストリームを実際に所定のレートRに従って動画像復号装置へ伝送すれば、動画像復号装置の受信バッファがアンダーフローしないように動画像データの符号量を制御することが可能となる。
量子化値算出部24は、求めた量子化値を量子化部22へ通知する。
そこで、グループ情報付加部15は、例えば、グループ情報を、各ピクチャ、もしくは所定のピクチャ間隔で、出力データストリームのヘッダ情報に付加する。
ヘッダ情報は、例えば、MPEG-2に規定される、シーケンスヘッダー(Sequence Header)、またはH.264に規定されるシーケンスパラメータセット(Sequence Parameter Set)若しくはSupplemental Enhancement Informationとすることができる。なお、グループごとの復号時刻は、MPEG-2に規定されるピクチャヘッダー(Picture Header)、またはH.264に規定されるスライスヘッダー(Slice Header)など、各ピクチャに必ず付随されるヘッダ情報に付加されてもよい。
動画像復号装置は、通知されたグループ数Nと各グループの復号時刻情報に基づき、表示遅延量を算出する。各グループに含まれるブロック数が等しくなるように各グループが設定されている場合、表示遅延量は、1ピクチャの復号処理に必要な最悪の処理時間をctとして、ct/Nとなる。
図3は、動画像符号化装置10により伝送される符号化動画像データストリームが蓄積される受信バッファのバッファ占有量の遷移を示す図である。また図4は、第1のグループの復号時刻を遅らせた場合における、受信バッファのバッファ占有量の遷移を示す図である。なお、図3及び図4において、横軸は時間を表し、縦軸はバッファ占有量を表す。また、グループ数N=4であるとする。そして図3におけるグラフ300は、バッファ占有量の時間遷移を表す。また矢印301で表される期間は、各グループの復号に要する最大時間ct/Nを表す。同様に、図4におけるグラフ400は、バッファ占有量の時間遷移を表す。
(9)式を(8)式と比較すると、第1のグループの復号時刻を遅らせても、ctが大きい動画像復号装置については、第1のグループの復号時刻を遅らせない場合に対して遅延が増加するものの、ctが十分短い動画像復号装置においては、遅延は増加しないことがわかる。
グループ決定部13は、各ブロックの属するグループを決定する(ステップS101)。そしてグループ決定部13は、ブロックの属するグループを表す識別情報を符号量制御部12のバッファ占有量算出部26へ通知する。またグループ決定部13は、グループの総数Nをグループ復号時刻情報算出部14及びグループ情報付加部15へ通知する。なお、グループ決定部13は、各グループの先頭に位置するブロックのインデックスをグループ情報付加部15へ通知してもよい。
次に、グループ復号時刻情報算出部14は、グループ毎に復号時刻を算出する(ステップS102)。そしてグループ復号時刻情報算出部14は、各グループの復号時刻を表す情報をバッファ占有量算出部26及びグループ情報付加部15へ通知する。
一方、バッファ占有量算出部26は、グループに含まれる全てのブロックの復号に必要なデータが、所定の伝送レートで動画像復号装置に伝送された場合における、各グループの復号時刻における受信バッファのバッファ占有量を推定する(ステップS104)。その際、バッファ占有量算出部26は、ビットカウンタ25から受け取った、それまでに符号化されたグループ内のブロックの符号量を参照する。そしてバッファ占有量算出部26は、推定したバッファ占有量を符号量制御部12の量子化値算出部24へ通知する。量子化値算出部24は、各グループの復号時刻までに各グループの全てのデータが動画像復号装置のストリーム受信バッファに到達するように、各グループに属するブロックの符号量を制御する(ステップS105)。そして量子化値算出部24は、その符号量に応じた量子化値を符号量の制御情報として算出し、その量子化値を符号化処理部11の量子化部22へ通知する。
量子化部22は、符号量の制御情報である量子化値に基づいて各ブロックの周波数係数の組を量子化する(ステップS107)。そして量子化部22は、量子化された各周波数係数を符号化処理部11の可変長符号化部23へ出力する。可変長符号化部23は、量子化された各周波数係数を可変長符号化する(ステップS108)。そして可変長符号化部23は、得られた可変長符号を出力する。この可変長符号とグループ情報付加部15からの出力されたグループ情報、復号時刻情報などが出力データストリームに格納される。また可変長符号化部23は、ブロックごとの符号量をビットカウンタ25へ出力する。
ステップS108の後、動画像符号化装置10は、動画像符号化処理を終了する。
ピクチャがイントラ符号化ピクチャの場合、ブロックのスキップは許容されないので、MbSkipRun1110は常に0となる。そのため、出力データストリームにMbSkipRun1110は含まれない。
ビット列1202は、最終ブロックxのMbSkipRun(= 0)及びMacroblockLayerを可変長符号化したビット列である。ビット列1202のうち、Code 0はMbSkipRunを可変長符号化したビット列であり、Code M (M = [1, N[x])は、MacroblockLayerの各要素を可変長符号化したビット列である。N[x]は、最終ブロックxのMacroblockLayerの要素数である。
この例では、最終ブロックxの最終ビットは、矢印1210で示される、ビット列Code N[x]の最終ビットとなる。
この例では、ブロック(x-L)とブロックxとの間には、MacroblockLayerが出力データストリームに含まれない、(L-1)個のブロック(x-L+1)〜ブロック(x-1)が存在する。従って、ブロック(x-L+1)〜ブロック(x-1)の何れかが最終ブロックとなる場合、これらのブロックの最終ビットは、矢印1310で示される、MbSkipRun = (L-1)に相当するコードCode 0の最終ビットとなる。またブロックxが最終ブロックとなる場合、ブロックxの最終ビットは、矢印1311で示される、ビット列1302に含まれるCode N[x]の最終ビットとなる。
MbSkipFlag2111は、現在のブロックがスキップされたか否かを表す。例えば、現在のブロックがスキップされている場合には、MbSkipFlag2111は'1'となり、一方、現在のブロックがスキップされていなければ、MbSkipFlag2111は'0'となる。またMacroblockLayer2112は、ブロック符号化種別、動きベクトル情報、及び量子化DCT係数等のブロック圧縮データである。ブロックのスキップとは、そのスキップされたブロックのMacroblockLayer2112が出力データストリームに含まれないことを意味する。
ピクチャがイントラ符号化ピクチャの場合、ブロックのスキップは許容されないので、MbSkipFlag2111は常に'0'となる。そのため、出力データストリームにMbSkipFlag2111は含まれない。
ビット列2202は、最終ブロックxのMbSplitFlag(= 0)、MbSkipFlag(= 0)及びMacroblockLayerを可変長符号化したビット列である。ビット列2202のうち、SpはMbSplitFlagを可変長符号化したビット列であり、SkはMbSkipFlagを可変長符号化したビット列である。またCode M (M = [1, N[x])は、MacroblockLayerの各要素を可変長符号化したビット列である。N[x]は、最終ブロックxのMacroblockLayerの要素数である。
この例では、最終ブロックxの最終ビットは、矢印2210で示される、ビット列Code N[x]の最終ビットとなる。
この例では、ブロック(x-L)とブロックxとの間には、MacroblockLayerが出力データストリームに含まれない、(L-1)個のブロック(x-L+1)〜ブロック(x-1)が存在する。従って、ブロック(x-L+p) (p = {1, ..., L-1})の何れかが最終ブロックとなる場合、これらのブロックの最終ビットは、矢印2310で示される、(L-1)個のMbSkipFlag(=1)コードの内、左からp番目のコードの最終ビットとなる。またブロックxが最終ブロックとなる場合、ブロックxの最終ビットは、矢印2311で示される、ビット列2302に含まれるCode N[x]の最終ビットとなる。
MbSkipFlag3110は、現在のブロックがスキップされたか否かを表す。例えば、現在のブロックがスキップされている場合には、MbSkipFlag3110は'1'となり、一方、現在のブロックがスキップされていなければ、MbSkipFlag3110は'0'となる。またMacroblockLayer3111は、ブロック符号化種別、動きベクトル情報、及び量子化DCT係数等のブロック圧縮データである。ブロックのスキップとは、そのスキップされたブロックのMacroblockLayer3111が出力データストリームに含まれないことを意味する。
ピクチャがイントラ符号化ピクチャの場合、ブロックのスキップは許容されないので、MbSkipFlag3110は常に'0'となる。そのため、出力データストリームにMbSkipFlag3110は含まれない。
EndOfSliceFlag3112は、現在のブロックがスライスの最終ブロックか否かを表す。例えば、現在のブロックが最終ブロックである場合には、EndOfSliceFlag3112は'1'となり、一方、現在のブロックが最終ブロックでなければ、EndOfSliceFlag3112は'0'となる。
図8(B)に示されるように、出力データストリームのビット列の一例であるビット列3210は12個のビットを含む。この場合において、ドットの集合3211は、ビット列3210に含まれる各ビットに対応する、ビット列3210を算術復号することにより得られる圧縮データに含まれるビンを表す。ビンとは、圧縮データをバイナリ表現したものであり、各符号語に対応する圧縮データ中のビットまたはビット列である。この例では、ビット列3210はビン0〜ビン7に対応する。そして、ビン0〜ビン2はブロック0に含まれ、ビン3〜ビン5はブロック1に含まれ、ビン6はブロック2に含まれ、ビン7はブロック3に含まれる。ドットの集合3211に含まれる各ドットは、それぞれ、そのドットの上方に示された変換後のビット列3210に含まれるビットが、そのドットの左側に示されたビンを復号するために使用されることを表す。例えばビン0は、0番目のビットと1番目のビットとを用いて復号される。またビン1は、1番目のビットを用いて復号される。またビン5は、3番目のビットから11番目のビットを用いて復号される。
この時点で、インデックスがjよりも小さい全てのグループについて、復号処理に必要な全ビットがビットストリームとして出力されている。そこで、可変長符号化部23は、キャリー数cを0にリセットする(ステップS209)。
最終ビット位置pが最終ビット位置qと異なる場合(ステップS218−Yes)、EndOfSliceFlagを算術符号化することにより新たなビットが生成されている。従って、グループjの最終ブロックの全てを復号するのに必要な全てのビットがビットストリームとして出力されている。そこで可変長符号化部23は、この時点で出力されたグループjを復号するのに必要なビット列の最終ビット位置BitEnd()をビット位置qに設定し(ステップS219)、さらにグループのインデックスjを1インクリメントする(ステップS220)。
一方、最終ビット位置pが最終ビット位置qと等しい場合(ステップS218−No)、EndOfSliceFlagが算術符号化されても新たなビットが生成されていない。従って、可変長符号化部23は、キャリー数cを1インクリメントし、かつグループのインデックスjを1インクリメントする(ステップS221)。
現在のブロックmがピクチャ内の最終ブロックでなければ(ステップS222−No)、ピクチャ内に未処理のブロックがあるので、可変長符号化部23は、ステップS202以降の処理を繰り返す。一方、現在のブロックmがピクチャ内の最終ブロックであれば(ステップS222−Yes)、可変長符号化部23は、1ピクチャの全てのブロックの符号化を完了したので、最終ビット特定処理を終了する。
可変長符号化部23は、i番目のピクチャの(j-c)番目のグループを復号するのに必要なビット列の最終ビット位置BitEnd(i,(j-c))をqに設定する(ステップS250)。その後、可変長符号化部23は、キャリー数cが0以下か否かを判定する(ステップS251)。キャリー数cが0より大きい場合(ステップS251−No)、最終ビット位置BitEnd()を設定する必要のあるグループがまだ残っている。そこで可変長符号化部23は、キャリー数cを1だけ減算し、その後再度ステップS250の処理を実行する。一方、キャリー数cが0以下である場合(ステップS251−Yes)、最終ビット位置BitEnd()を設定する必要のあるグループは無い。そのため、可変長符号化部23は、最終ビット位置の設定処理を終了する。
非特許文献2に開示された手法は、基本的にCABACと同様に算術符号化技術を用いる。しかし、この手法では、バイナリ化された圧縮データを1ビットずつ算術符号化する代わりに、バイナリ化された圧縮データの各ビットの推定確率に基づく複数個の算術符号化部が用いられる。各算術符号化部には、それぞれ別個の推定確率が割り当てられ、バイナリ化された圧縮データの各ビットは、その推定確率に対応する算術符号化部において算術符号化される。
非特許文献2に開示された手法では、CABACと同様に、変換されたビット列と変換前の圧縮デ−タとの関係が一対一ではない。また、先に算術符号化部に入力されたビンに相当するワードが、そのビンよりも後に算術符号化部に入力されたビンに相当するワードよりも後に出力データのビットストリームに出現することもある。
CABACによりブロックが符号化される場合と同様に、ブロックの圧縮データのバイナリ化データの先頭ビット及び最終ビットは、常にMbSkipFlag及びEndOfSliceFlagである。そしてピクチャ中にブロックがw個あった場合、出力データのビットストリーム中には必ずw個のMbSkipFlagとw個のEndOfSliceFlagがある。
テーブル860〜863において、一つの行が、多重化部705のバッファ内に格納された一つのエントリに対応する。そして各テーブル内には、生成された順序に従って、上から順にエントリが表記される。多重化部705は、出力データのビットストリームとして、バッファ内に格納されたエントリのワードを、上から下の順番に沿って出力する。"#"はバッファ内のエントリのインデクスである。"Idx"は対応するビン符号化部のインデクスであり、この例では、理解を容易にするために、ビン符号化部のインデックスは、そのビン符号化部に入力される入力ビットに付加された確率インデックスと同一の値を持つ。「入力」は、入力されたビット列(ビン列)である。「ワード」は入力されたビット列に対応するワードである。もし入力ビット列に対応するワードが存在しない場合(例えば、入力ビット列が"00"の場合)、各テーブルにおいてワードは"N/A"と表記される。
多重化部705のバッファが空の状態で、ビットがビン符号化部に入力されると、ビットが入力されたビン符号化部は、多重化部705のバッファに新しいエントリを作成する。この例では、テーブル860に示されるように、確率インデックスが'0'で、かつ値が'0'であるビット850がビン符号化部704−1へ入力されることにより、多重化部705のバッファ内にエントリインデクスが'0'の最初のエントリが作成される。ビット850の確率インデックスが'0'であるため、このエントリの"Idx"は'0'である。またビット850の値が'0'であるため、最初のエントリの入力ビット列は"0"となる。ワードはまだ未完成であるため、このエントリのワードは"N/A"である。
多重化部705は、エントリを出力する場合、そのエントリのワードを出力データのビットストリームに追加する。出力されたエントリは、多重化バッファから除かれる。
一方、最終ビット位置pが最終ビット位置qと等しいか、あるいは、インデックスtがインデックスsと等しい場合(ステップS307−No)、新たなビットが生成されていない。そのため、可変長符号化部23は、ステップS308及びS309の処理を行わずにステップS310の処理を行う。
pがqと異なり、かつtがsより大きい場合(ステップS318−Yes)、EndOfSliceFlagを算術符号化することにより新たなビットが生成されている。従って、グループjの最終ブロックの全てを復号するのに必要な全てのビットがビットストリームとして出力されている。そこで可変長符号化部23は、この時点で出力されたグループjを復号するのに必要なビット列の最終ビット位置BitEnd()をビット位置qに設定する(ステップS319)。
一方、pがqと等しいか、あるいはtがsと等しい場合(ステップS318−No)、EndOfSliceFlagが算術符号化されても新たなビットが生成されていない。従って、可変長符号化部23は、キャリー数cを1インクリメントし、かつグループのインデックスjを1インクリメントする(ステップS321)。
11 符号化処理部
12 符号量制御部
13 グループ決定部
14 グループ復号時刻情報算出部
15 グループ情報付加部
21 直交変換部
22 量子化部
23 可変長符号化部
24 量子化値算出部
25 ビットカウンタ
26 バッファ占有量算出部
700 エントロピー符号化部
701 バイナリ化部
702 コンテキストモデル化部
703 確率量子化部
704−1〜704−k ビン符号化部
705 多重化部
Claims (6)
- 動画像データに含まれる各ピクチャを複数のブロックに分割して符号化する動画像符号化装置であって、
前記ピクチャを任意の大きさの複数のグループに分割した際、各ブロックの属するグループを決定するグループ決定部と、
前記グループ毎に当該グループの直前のグループの復号時刻との差分として復号時刻を算出するグループ復号時刻情報算出部と、
前記各ブロックの属するグループを表すグループ情報と、前記グループ情報に対応する前記復号時刻を表す情報を出力データに付加するグループ情報付加部と、
前記グループに含まれる全てのブロックの復号に必要なデータが、所定の伝送レートで動画像復号装置に伝送された場合に、前記グループ復号時刻情報算出部で算出された当該グループの復号時刻までに当該動画像復号装置のストリーム受信バッファに到達するように、当該グループに含まれる各ブロックの符号量を制御する符号量制御部と、
前記符号量の制御情報に基づいて前記各ブロックを符号化する符号化処理部と、
を有する動画像符号化装置。 - 前記グループ復号時刻情報算出部は、符号化対象ピクチャの最初のグループに対応する前記復号時刻と、前記符号化対象ピクチャの直前のピクチャの最後のグループに対応する前記復号時刻との差分値が、前記符号化対象ピクチャの2番目以降のグループに含まれる、連続する二つのグループのそれぞれの前記復号時刻間の差分値よりも大きくなるように前記グループ毎の復号時刻を算出する、請求項1に記載の動画像符号化装置。
- 動画像データに含まれる各ピクチャを複数のブロックに分割して符号化する動画像符号化方法であって、
前記ピクチャを任意の大きさの複数のグループに分割した際、各ブロックの属するグループを決定し、
前記グループ毎に当該グループの直前のグループの復号時刻との差分として復号時刻を算出し、
前記各ブロックの属するグループを表すグループ情報と、前記グループ情報に対応する前記復号時刻を表す情報を出力データに付加し、
前記グループに含まれる全てのブロックの復号に必要なデータが、所定の伝送レートで動画像復号装置に伝送された場合に、当該グループの復号時刻までに当該動画像復号装置のストリーム受信バッファに到達するように、当該グループに含まれる各ブロックの符号量を制御し、
前記符号量の制御情報に基づいて前記各ブロックを符号化する、
ことを含む動画像符号化方法。 - 前記グループ毎の復号時刻は、符号化対象ピクチャの最初のグループに対応する前記復号時刻と、前記符号化対象ピクチャの直前のピクチャの最後のグループに対応する前記復号時刻との差分値が、前記符号化対象ピクチャの2番目以降のグループに含まれる、連続する二つのグループのそれぞれの前記復号時刻間の差分値よりも大きくなるように算出される、請求項3に記載の動画像符号化方法。
- 動画像データに含まれる各ピクチャを複数のブロックに分割して符号化することをコンピュータに実行させる動画像符号用コンピュータプログラムであって、
前記ピクチャを任意の大きさの複数のグループに分割した際、各ブロックの属するグループを決定し、
前記グループ毎に当該グループの直前のグループの復号時刻との差分として復号時刻を算出し、
前記各ブロックの属するグループを表すグループ情報と、前記グループ情報に対応する前記復号時刻を表す情報を出力データに付加し、
前記グループに含まれる全てのブロックの復号に必要なデータが、所定の伝送レートで動画像復号装置に伝送された場合に、当該グループの復号時刻までに当該動画像復号装置のストリーム受信バッファに到達するように、当該グループに含まれる各ブロックの符号量を制御し、
前記符号量の制御情報に基づいて前記各ブロックを符号化する、
ことをコンピュータに実行させる動画像符号化用コンピュータプログラム。 - 前記グループ毎の復号時刻は、符号化対象ピクチャの最初のグループに対応する前記復号時刻と、前記符号化対象ピクチャの直前のピクチャの最後のグループに対応する前記復号時刻との差分値が、前記符号化対象ピクチャの2番目以降のグループに含まれる、連続する二つのグループのそれぞれの前記復号時刻間の差分値よりも大きくなるように算出される、請求項5に記載の動画像符号化用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014220876A JP5983704B2 (ja) | 2010-09-30 | 2014-10-29 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010222247 | 2010-09-30 | ||
JP2010222247 | 2010-09-30 | ||
JP2014220876A JP5983704B2 (ja) | 2010-09-30 | 2014-10-29 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012536233A Division JP5720691B2 (ja) | 2010-09-30 | 2011-01-13 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015057909A JP2015057909A (ja) | 2015-03-26 |
JP5983704B2 true JP5983704B2 (ja) | 2016-09-06 |
Family
ID=45892402
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012536233A Active JP5720691B2 (ja) | 2010-09-30 | 2011-01-13 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
JP2014220876A Active JP5983704B2 (ja) | 2010-09-30 | 2014-10-29 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012536233A Active JP5720691B2 (ja) | 2010-09-30 | 2011-01-13 | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム |
Country Status (7)
Country | Link |
---|---|
US (1) | US9621886B2 (ja) |
EP (1) | EP2624554B1 (ja) |
JP (2) | JP5720691B2 (ja) |
KR (2) | KR101503190B1 (ja) |
CN (1) | CN103202015B (ja) |
ES (1) | ES2750328T3 (ja) |
WO (1) | WO2012042916A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6234659B2 (ja) * | 2012-04-27 | 2017-11-22 | 富士通株式会社 | 動画像復号装置 |
JP5994367B2 (ja) * | 2012-04-27 | 2016-09-21 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法 |
JP6234660B2 (ja) * | 2012-04-27 | 2017-11-22 | 富士通株式会社 | 動画像復号装置 |
US10958989B2 (en) | 2016-02-25 | 2021-03-23 | Synamedia Limited | Framework for embedding data in encoded video |
JP6194973B2 (ja) * | 2016-03-07 | 2017-09-13 | 富士通株式会社 | 動画像復号装置及び動画像復号方法 |
JP6146502B2 (ja) * | 2016-03-07 | 2017-06-14 | 富士通株式会社 | 動画像符号化復号システム及び動画像符号化復号方法 |
JP6288129B2 (ja) * | 2016-03-07 | 2018-03-07 | 富士通株式会社 | 動画像復号装置及び動画像復号方法 |
JP6194974B2 (ja) * | 2016-03-07 | 2017-09-13 | 富士通株式会社 | 動画像復号装置及び動画像復号方法 |
JP6164324B2 (ja) * | 2016-03-14 | 2017-07-19 | 富士通株式会社 | 動画像復号方法 |
JP6249040B2 (ja) * | 2016-04-11 | 2017-12-20 | 富士通株式会社 | 動画像復号方法 |
CN110022481B (zh) * | 2018-01-10 | 2023-05-02 | 中兴通讯股份有限公司 | 视频码流的解码、生成方法及装置、存储介质、电子装置 |
CN115086572A (zh) * | 2022-06-29 | 2022-09-20 | 浙江大华技术股份有限公司 | 一种图像传输方法及装置、电子设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2787599B2 (ja) | 1989-11-06 | 1998-08-20 | 富士通株式会社 | 画像信号符号化制御方式 |
JPH0993537A (ja) * | 1995-09-27 | 1997-04-04 | Mitsubishi Electric Corp | ディジタル映像信号記録再生装置及びディジタル映像信号符号化方法 |
WO1998032281A1 (en) * | 1997-01-21 | 1998-07-23 | Sarnoff Corporation | Information stream syntax for indicating the presence of a splice point |
JP3299185B2 (ja) | 1998-06-10 | 2002-07-08 | 日本ビクター株式会社 | 符号化装置 |
JP2001251616A (ja) * | 2000-03-02 | 2001-09-14 | Media Glue Corp | 多重化音響・動画圧縮符号化信号変換方法、装置および変換プログラムを記録した媒体 |
JP2001346201A (ja) | 2000-03-27 | 2001-12-14 | Sony Corp | 画像符号化装置とその方法、画像復号化装置とその方法、画像記録装置、画像伝送装置 |
US6819714B2 (en) * | 2000-04-20 | 2004-11-16 | Matsushita Electric Industrial Co., Ltd. | Video encoding apparatus that adjusts code amount by skipping encoding of image data |
GB0013273D0 (en) * | 2000-06-01 | 2000-07-26 | Philips Electronics Nv | Video signal encoding and buffer management |
US7418007B1 (en) * | 2000-09-20 | 2008-08-26 | General Instrument Corporation | Method and apparatus for determining a transmission bit rate in a statistical multiplexer |
US7532670B2 (en) * | 2002-07-02 | 2009-05-12 | Conexant Systems, Inc. | Hypothetical reference decoder with low start-up delays for compressed image and video |
MY134659A (en) * | 2002-11-06 | 2007-12-31 | Nokia Corp | Picture buffering for prediction references and display |
DE602004010668T2 (de) * | 2003-07-11 | 2008-12-04 | Matsushita Electric Industrial Co., Ltd., Kadoma | Aufzeichnungsmedium und -verfahren, wiedergabegerät und -verfahren, und computerlesbares programm |
EP1638333A1 (en) * | 2004-09-17 | 2006-03-22 | Mitsubishi Electric Information Technology Centre Europe B.V. | Rate adaptive video coding |
JP5072893B2 (ja) | 2009-03-25 | 2012-11-14 | 株式会社東芝 | 画像符号化方法および画像復号化方法 |
-
2011
- 2011-01-13 ES ES11828481T patent/ES2750328T3/es active Active
- 2011-01-13 WO PCT/JP2011/050462 patent/WO2012042916A1/ja active Application Filing
- 2011-01-13 CN CN201180051895.6A patent/CN103202015B/zh active Active
- 2011-01-13 JP JP2012536233A patent/JP5720691B2/ja active Active
- 2011-01-13 EP EP11828481.9A patent/EP2624554B1/en active Active
- 2011-01-13 KR KR1020137010375A patent/KR101503190B1/ko active IP Right Grant
- 2011-01-13 KR KR1020157002906A patent/KR101627568B1/ko active IP Right Grant
-
2013
- 2013-03-27 US US13/851,560 patent/US9621886B2/en active Active
-
2014
- 2014-10-29 JP JP2014220876A patent/JP5983704B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2012042916A1 (ja) | 2012-04-05 |
EP2624554B1 (en) | 2019-09-18 |
KR20150028835A (ko) | 2015-03-16 |
JPWO2012042916A1 (ja) | 2014-02-06 |
US20130208793A1 (en) | 2013-08-15 |
KR20130070645A (ko) | 2013-06-27 |
KR101627568B1 (ko) | 2016-06-09 |
JP5720691B2 (ja) | 2015-05-20 |
KR101503190B1 (ko) | 2015-03-16 |
JP2015057909A (ja) | 2015-03-26 |
US9621886B2 (en) | 2017-04-11 |
ES2750328T3 (es) | 2020-03-25 |
EP2624554A4 (en) | 2015-01-07 |
CN103202015B (zh) | 2016-08-03 |
EP2624554A1 (en) | 2013-08-07 |
CN103202015A (zh) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5983704B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
JP5447695B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
RU2647655C1 (ru) | Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений | |
JP5421408B2 (ja) | αチャンネル映像復号化装置、αチャンネル復号化方法及び記録媒体 | |
KR101479141B1 (ko) | 트리 구조를 이용한 부호화/복호화 방법 및 장치 | |
JP2010226532A (ja) | 画像圧縮装置および画像伸張装置 | |
US9014274B2 (en) | Video image encoding device, video image encoding method | |
JP4388771B2 (ja) | 動画像復号装置、および動画像復号方法 | |
JP2008289105A (ja) | 画像処理装置およびそれを搭載した撮像装置 | |
JP4847423B2 (ja) | 動画像符号化装置、および、コンピュータプログラム | |
JP5819754B2 (ja) | 画像符号化装置 | |
JP4924744B2 (ja) | 復号装置及びその方法 | |
JP2011101404A (ja) | 復号装置及び復号方法 | |
JP2010288070A (ja) | 画像符号化装置 | |
JP4661992B2 (ja) | 動画像符号化装置および動画像復号装置 | |
JP4924743B2 (ja) | 復号装置及びその方法 | |
CN117063465A (zh) | 视频编码设备、视频解码设备、视频编码方法、视频解码方法和视频系统 | |
JP2022548685A (ja) | 画像データの符号化及び復号化 | |
JP2009296622A (ja) | 動画像符号化装置および動画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160718 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5983704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |