[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4257655B2 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP4257655B2
JP4257655B2 JP2004321315A JP2004321315A JP4257655B2 JP 4257655 B2 JP4257655 B2 JP 4257655B2 JP 2004321315 A JP2004321315 A JP 2004321315A JP 2004321315 A JP2004321315 A JP 2004321315A JP 4257655 B2 JP4257655 B2 JP 4257655B2
Authority
JP
Japan
Prior art keywords
picture
image
screen complexity
complexity
scene change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004321315A
Other languages
English (en)
Other versions
JP2006135557A (ja
Inventor
朋行 進藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2004321315A priority Critical patent/JP4257655B2/ja
Priority to US11/255,889 priority patent/US7903732B2/en
Publication of JP2006135557A publication Critical patent/JP2006135557A/ja
Application granted granted Critical
Publication of JP4257655B2 publication Critical patent/JP4257655B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、前の画像の画面複雑度から次に符号化する画像の画面複雑度を推定して量子化スケールを決定する動画像符号化装置に関する。
TV信号などの動画像を高能率に符号化する技術の国際標準として既にMPEG( Moving Picture Experts Group )2が規定されている。MPEG2は、動画像を構成する「フレーム」画像を「マクロブロック」と呼ばれる16×16画素のブロックに分割し、各マクロブロック単位で、時間的に前又は後に所定の数フレーム離れた参照画像と被符号化画像の間で「動きベクトル」と呼ばれる動き量を求め、この動き量を基に参照画像から被符号化画像を構成する「動き補償予測」技術と、動き補償予測の誤差信号又は符号化画像そのものに対して、直交変換の一種であるDCT(離散コサイン変換)を用いて情報量を圧縮する「変換符号化」技術の2つの画像符号化の要素技術をベースに規定されている。
従来のMPEG2の動画像符号化装置の一構成例を図4に示す。また、符号化ピクチャ構造の一例を図5に示し、動き補償予測では、図5に示した符号化ピクチャ構造のように、I(フレーム内符号化)ピクチャ、P(順方向予測符号化)ピクチャ、B(双方向予測符号化)ピクチャと呼ばれる、予測方法の異なる3種類のピクチャの組合せによって構成される。
図4に示されるように、Iピクチャに符号化する場合には符号化対象の画像そのもの(原画像)に対し、また、P、Bピクチャに符号化する場合には動き補償予測器79による動き補償予測の誤差信号である減算器71の出力に対して、DCTがDCT器72で施される。このDCT器72で得られたDCT係数に対して、符号量制御部90の出力により制御される量子化器73によって量子化がなされた後に、動きベクトルなどのその他の付帯情報と共に可変長符号化器75で可変長符号化され、符号列が「ビットストリーム」としてバッファ76に記憶された後に出力される。この際、バッファ76の充足度に応じて符号量制御部90で量子化器73の量子化スケールが制御される。
一方、量子化器73の出力係数は、逆量子化器77、IDCT器78に供給されて、局部復号された後に、加算器80を介してブロックごとにフレームメモリ81に貯えられる。MPEG2は可変長符号化であるため、単位時間当たりの発生符号量(ビットレート)は一定ではない。そこで量子化器73での量子化の際の量子化スケールをマクロブロック単位に適宜変更することにより、所要のビットレートに制御することが可能になっている。
MPEG2 Test Model(テストモデル)5では、GOP( Group Of Pictures )単位で発生符号量を一定にする固定ビットレート制御方法が提案されている。この固定ビットレート制御方法は、一定の転送レートが要求される用途に適した方法である。Test Model 5における、図4の符号量制御部90の動作に相当する、固定ビットレート制御方法の概略は次の通りである。目標ビットレートを BitRate、1秒当たりのフレーム数を PictureRate、1つの符号化単位である1GOP(通常はIピクチャの間隔)のフレーム数をNとすると、1GOPに割り当てられる符号量Rは次式(1)で与えられる。
R=( BitRate / PictureRate )*N (1)
式(1)で得られた符号量Rを1GOP内の各画像に配分することになるが、ここで各ピクチャタイプの符号化直後の画像について、1フレームの発生符号量と平均量子化スケールの積を画面複雑度(Complexity)Xi(Iピクチャ)、Xp(Pピクチャ)、Xb(Bピクチャ)として求め、これから符号化する画像を含むGOP内の画像が一様に画面複雑度に等しいと仮定して、これから符号化する画像の目標割当符号量を決定する。現在のGOPで符号化の終了していないPピクチャ、Bピクチャのフレーム数をそれぞれNp、Nbとし、Iピクチャに対するPピクチャ、Bピクチャの量子化スケールの設定比率をそれぞれKp、Kbとする。このとき、I、P、Bの各ピクチャタイプの目標割当符号量Ti、Tp、Tbは次式(2)、(3)、(4)で与えられる。なお、MAX[A、B]はAとBのいずれか大きい方を選択する動作を示す。
Iピクチャ:Ti=MAX[A、B]
A=R/{1+Np*Xp/(Xi*Kp)+Nb*Xb/(Xi*Kb)}
B=BitRate/(8*PictureRate) (2)
Pピクチャ:Tp=MAX[C、D]
C=R/{Np+Nb*Kp*Xb/(Xp*Kb)}
D=BitRate/(8*PictureRate) (3)
Bピクチャ:Tb=MAX[E、F]
E=R/{Nb+Np*Kb*Xp/(Xb*Kp)}
F=BitRate/(8*PictureRate) (4)
なお、符号量Rの値は、1フレームの符号化が終了するごとに、そのフレームの発生符号量を減算し、GOPの先頭(Iピクチャ)において、式(1)の値を加算する。次に、上式(2)、(3)、(4)で決定された目標割当符号量と、バッファ76で検出される各マクロブロックの発生符号量を基に、各マクロブロックの量子化スケールを決定する。
一方、DVD−Video のように可変転送レートが可能な用途に適した方法として、可変ビットレート制御方法がある。下記の特許文献1には、可変ビットレート制御による符号化装置が開示されている。この符号化装置では、最初に入力動画像に対して固定量子化スケールによって仮符号化を行い、単位時間ごとに発生符号量がカウントされる。次に入力動画像全体の発生符号量が所要値になるように、仮符号化時の発生符号量に基づいて各部分の目標転送レートを設定する。そしてこの目標転送レートに合致するように制御を行いながら、入力動画像に対して2回目の符号化、言い換えると実符号化が行われる。
しかし、上記従来例では、出力ビットストリームを得るためには少なくとも2回の符号化を行わなければならず、リアルタイム性を要求されるような用途ではこの符号化装置のような2パス方式の可変ビットレート制御は使用できない。
これに対し、動画像をほぼリアルタイムで符号化するための可変ビットレート制御方法、すなわち1パス方式の可変ビットレート制御方法も存在する。下記の特許文献2には、1パス方式の可変ビットレート制御方法による符号化装置が開示されている。この従来例における動画像符号化装置の一構成例を図6に示す。なお、図4と同一構成部材に対しては同一符号を付してその説明は省略する。この従来例の符号化装置では、バッファ76に記憶した符号量を発生符号量検出器83に供給し、量子化器73からの量子化スケールを平均量子化スケール検出器82に供給し、この平均量子化スケール検出器82による画面内の量子化スケールの平均値と、発生符号量検出器83による発生符号量との積を、「画面複雑度」として画面複雑度検出器84で求め、過去の画面複雑度の平均値に対する現在の画面複雑度の割合を基に、画面の目標発生符号量又は目標量子化スケールを決定することにより、可変ビットレート制御を符号量制御器74で実現している。
上記従来例においてはこれから符号化する画像の画面複雑度が、直前に符号化した同じピクチャタイプの画面複雑度と同程度であると仮定して符号化制御が行われている。しかしながら、入力動画像にシーンチェンジのような大きな変化が生じた場合、変化点の前後で画像の性質が変わるため画面複雑度自体が変化するばかりでなく、予測符号化を行うP及びBピクチャでは、変化の生じた前と後の画像の間では予測がほとんど当たらないため、変化直後の画像ではほとんどのマクロブロックが画面内符号化を行うI(イントラ)ピクチャになる場合が多い。そのような画像では変化前の画像に比べ、実際の画面複雑度が極端に高くなるのにもかかわらず、上記従来例では、変化前の画像の画面複雑度を基準にして符号量割当が行われるため、割当符号量が不足して量子化スケールが上昇し、結果として変化点の直後で画質劣化が生じてしまうという問題があった。
一方、変化直後の画像から次に予測を行う画像では、画像が小刻みに変化する場合を除いては予測が比較的当たりやすくなり、実際の画面複雑度は変化直後の画像よりも低くなるにもかかわらず、上記従来例では変化直後の高い画面複雑度を基準にして符号量割当が行われるため、割当符号量が過剰となって量子化スケールが不必要に下降し、符号量に無駄が生じてしまうという問題があった。
そこで、以上の問題を解決して、入力動画像にシーンチェンジのような大きな変化が発生した場合でも、より適切な符号量割当を行う従来例として、下記の特許文献3には、過去の画像のI、P、Bピクチャごとの実測画面複雑度を算出してこの実測画面複雑度などから現在の画像のI、P、Bピクチャごとの推定画面複雑度を算出し、この現在の画像のI、P、Bピクチャごとの推定画面複雑度などから次に符号化する画像のI、P、Bピクチャごとの量子化スケールを決定する方法が提案されている。また、現在の画像のI、P、Bピクチャごとの推定画面複雑度を算出する際には、現在の画像の符号化画像特性と、それと同じピクチャタイプの直前において検出された符号化画像特性との比を因数とする所定の関数を、前述の直前の画像における実測画面複雑度に乗算することにより求める。また、特許文献3では、現在の画像がシーンチェンジ画像と判定された場合には、前述の所定の関数を変更し、現在の画像がシーンチェンジ画像の次の画像と判定された場合には「現在の画像と同じピクチャタイプの直前の画像」を「現在の画像と同じピクチャタイプのシーンチェンジ画像の前の画像」に変更する。
特開平6−141298号公報(要約書) 特開平10−164577号公報(図6) 特開平10−164577号公報(請求項1、2、3、段落0038、0039、0040)
しかしながら、上記の特許文献3では、シーンチェンジ画像と判定された場合にも、同じピクチャタイプの実測画面複雑度を用いて現在の画像の推定画面複雑度を算出するので、特に双方向予測であるBピクチャに符号化する場合に、正確な推定画面複雑度を算出することができず、このため、発生符号量が増加するという問題点がある。
本発明は上記従来例の問題点に鑑み、シーンチェンジ画像と判定された場合、特に双方向予測であるBピクチャに符号化する場合に正確な推定画面複雑度を算出して発生符号量の増加を抑制することができる動画像符号化装置を提供することを目的とする。
本発明の動画像符号化装置は上記目的を達成するために、
入力動画像及び入力動画像の動き補償予測誤差を直交変換し、直交変換された係数を量子化スケールに基づいて量子化して可変長符号化するとともに、発生符号量を前記量子化スケールにより制御する動画像符号化手段と、
前記入力動画像についてマクロブロック単位で検出されたI、P、Bピクチャごとのアクティビティがフレーム単位で加算されて得られる画像特性を検出する画像特性検出手段と、
前記画像特性検出手段により検出されたこれから符号化する現在の画像のI、P、BピクチャごとのアクティビティACTi、ACTp、ACTbと、直前に符号化した同じピクチャタイプの画像のアクティビティACTi-p、ACTp-p、ACTb-pの比率(ACTi/ACTi-p)、(ACTp/ACTp-p)、(ACTb/ACTb-p)を計算し、その結果得られたI、P、Bピクチャごとの比率(現在のアクティビティ/直前のアクティビティ)が一定範囲を超えたとき、シーンチェンジであると判定するシーンチェンジ検出手段と、
前記量子化スケールの1フレームの平均量子化スケールを検出する平均量子化スケール検出手段と、
前記符号化により発生した1フレームの符号量を検出する発生符号量検出手段と、
記平均量子化スケール検出手段により検出された各フレームの平均量子化スケールと、前記発生符号量検出手段により検出された各フレームの符号量とが乗算されて得られるMPEG2Test Model 5におけるComplexityに相当する各フレームのI、P、Bピクチャごとの実測画面複雑度Xi-p、Xp-p、Xb-pを求め、前記シーンチェンジ検出手段によりシーンチェンジであると判定されたとき、これから符号化する画像であるシーンチェンジ画像については、Pピクチャの推定画面複雑度Xpを算出する際にPピクチャとは異なるIピクチャの前記実測画面複雑度Xi-pを用い、Bピクチャの推定画面複雑度Xbを算出する際にBピクチャとは異なるPピクチャの前記実測画面複雑度Xp-pを用いることにより、過去に算出された前記実測画面複雑度により、入力画像の推定画面複雑度を算出し、前記シーンチェンジ画像の次の同じタイプのP又はBピクチャについては、P、Bピクチャの実測画面複雑度Xp-p、Xb-pの代わりに、前記シーンチェンジ画像の時点で保持されたP、Bピクチャの実測画面複雑度Xp-pold、Xb-poldと、その実測画面複雑度Xp-pold、Xb-poldの対象となったP、Bピクチャの前記画像特性としてのアクティビティACTp-pold、ACTb-poldと、これから符号化する現在の画像のP、BピクチャのアクティビティACTp、ACTbから次の2つの式
Xp=Xp-pold*(ACTp/ACTp-pold)
Xb=Xb-pold*(ACTb/ACTb-pold)
によってP、Bピクチャの画面複雑度Xp、Xbを推定することにより、画面複雑度の適正化図るよう構成された画面複雑度算出手段と、
前記画面複雑度算出手段により算出された推定画面複雑度により次に符号化する画像の前記量子化スケールを決定する手段とを備え、
前記画面複雑度算出手段は、前記過去に算出された実測画面複雑度として、前記シーンチェンジ検出手段によりシーンチェンジと判定されない画像を符号化する場合には過去に算出された同じピクチャタイプの実測画面複雑度を用いるよう構成された。
また、前記画面複雑度算出手段は、インターレース画像のフレームアクティビティとフィールドアクティビティとの比が一定値より大きいときは、符号化する画像が動いていると判断し、それ以外のときは静止していると判断し、静止していると判断された場合には過去に算出された同じピクチャタイプの実測画面複雑度を用い、動いていると判断された場合にはPピクチャではIピクチャの画面複雑度を用い、BピクチャではPピクチャの実測画面複雑度を用いて前記推定画面複雑度を算出することを特徴とする。
本発明によれば、イントラ・マクロブロックが増大すると予想されるPピクチャでは、もともとイントラ・マクロブロックで構成されるIピクチャの実測画面複雑度を利用し、双方向予測の減少が予想されるBピクチャではもともと双方向予測のないPピクチャの実測画面複雑度を利用することにより発生符号量の増加を抑制することができる。
<第1の実施の形態>
以下、図面を参照して本発明の実施の形態について説明する。図1は本発明に係る動画像符号化装置の第1の実施の形態を示すブロック図である。
図1において、入力画像(原画像)は、減算器11、DCT器12、量子化器13、符号量制御器14、可変長符号化器15により動画像符号化され、バッファ16を経由して出力される。また、動き補償予測を行うために、量子化器13の出力が逆量子化器17、IDCT器18によりデコードされ、加算器20、フレームメモリ21、動き補償予測器19を経由して減算器11に印加される。本発明の符号量制御は、平均量子化スケール検出器22、発生符号量検出器23、画面複雑度算出器24、画面複雑度メモリ24M、画像特性検出器25、及びシーンチェンジ検出器28によって量子化器13の量子化スケールを制御することにより行われる。
図1は固定ビットレート符号化に適用した実施の形態を示す。なお、以下の説明において、添え字iはIピクチャ、pはPピクチャ、bはBピクチャと対応している。入力する動画像は画像ブロック分割器(図示せず)によって、あらかじめマクロブロック単位で分割されているものとする。分割された動画像は、Iピクチャに符号化する際には動き補償予測が行われず、原動画像ブロックそのものが減算器11を介してDCT器12に送られ、DCTされた係数が量子化器13で符号量制御器14から送られる量子化スケールによって量子化される。その量子化された信号は、可変長符号化器15で符号に変換されて、次のバッフア16で時間調整された後に符号が出力される。一方、量子化器13の出力係数は逆量子化器17、IDCT器18で局部復号されて、動き補償予測器19の出力が加算器20で加算されることなく、ブロックごとにフレームメモリ21に貯えられる。
動画像をP及びBピクチャに符号化する際には、分割された動画像とフレームメモリ21に貯えられた所定の局部復号画像ブロックが動き補償予測器19に供給され、ここで動きベクトル検出及び動き補償が行われて、減算器11で予測画像ブロックと原画像ブロックとの間の画素間差分が取られ、差分値である誤差画像ブロックがDCT器12に供給される。この後はIピクチャと同様に、DCT器12で差分値がDCTされ、量子化器13で符号量制御器14から送られる量子化スケールによって量子化された後に、可変長符号化器15で符号に変換されて、次のバッファ16で時間調整された後に符号が出力される。一方、量子化器13の出力係数は、逆量子化器17とIDCT器18とで局部復号された後に予測画像ブロックが加算器20によって画素ごとに加算され、ブロックごとにフレームメモリ21に貯えられる。
また、各ピクチャについて、量子化器13からマクロブロックごとの量子化スケールが平均量子化スケール検出器22に送られ、そこで1フレーム分の量子化スケールが加算され、1フレームの平均量子化スケールが算出される。一方、バッファ16において発生符号量が監視され、その値が発生符号量検出器23に供給される。この発生符号量検出器23において、発生符号量がフレーム単位で加算され、1フレームの発生符号量が検出される。
フレームごとに検出された平均量子化スケール、及び発生符号量は各々画面複雑度算出器24にフレームごとに供給される。画面複雑度算出器24では、供給された各フレームの平均量子化スケールと発生符号量が乗じられた後に所定の操作を施して、MPEG2 Test Model 5における Complexity に相当する各フレームのI、P、Bピクチャごとの実測画面複雑度Xi-p、Xp-p、Xb-pが求められる。
一方、画像特性検出器25では、入力時に原画像を分割した動画像が供給され、動画像の各フレームについてマクロブロック単位で画像特性を示すパラメータであるアクティビティACTが検出されてフレーム単位で加算されて、その結果が1フレームごとに画面複雑度算出器24及びシーンチェンジ検出器28に供給される。ここで、画像特性検出器25で画像特性を検出する動作は、実際の符号化動作に先行して行われている。画像特性を示すパラメータとしては輝度値の分散、画素間差分値などが考えられるが、画像特性を示すものであれば、当然その他のパラメータでもよい。
シーンチェンジ検出器28では、これから符号化する現在の画像のI、P、BピクチャごとのアクティビティACTi、ACTp、ACTbと、直前に符号化した同じピクチャタイプの画像のアクティビティACTi-p、ACTp-p、ACTb-pの比率(ACTi/ACTi-p)、(ACTp/ACTp-p)、(ACTb/ACTb-p)が計算される。そして、この計算されたI、P、Bピクチャごとの比率(現在のアクティビティ/直前のアクティビティ)が一定範囲を超えたとき、例えば、比率<Amin又は比率>Amax(0<Amin<1、Amax>1)の場合、これら2つの画像の間でシーンチェンジが起こったとシーンチェンジ検出器28は判定し、このフレームの位置情報を画面複雑度算出器24に送る。シーンチェンジが起こったと判定されたとき、これから符号化する現在の画像を以後、シーンチェンジ画像と呼ぶ。
シーンチェンジが発生したというフレームの位置情報が画面複雑度算出器24に送られると、画面複雑度算出器24では、P及びBピクチャについて、シーンチェンジ画像における発生符号量の増加を抑制するための画面複雑度の推定が行われる。ここで、先に求めた実測画面複雑度Xi-p、Xp-p、Xb-pは、シーンチェンジが発生しない場合にはその次の同じピクチャタイプの画面複雑度Xi、Xp、Xbの推定に使用するため、画面複雑度メモリ24Mに貯えられる。
そして、本発明では、シーンチェンジが発生した場合、Pピクチャの推定画面複雑度Xpを算出する際にPピクチャとは異なるIピクチャの実測画面複雑度Xi-pを用い、Bピクチャの推定画面複雑度Xbを算出する際にBピクチャとは異なるPピクチャの実測画面複雑度Xp-pを用いる。シーンチェンジによって、Pピクチャではイントラ・マクロブロックが増大するが、もともとイントラ・マクロブロックで構成されるIピクチャの実測画面複雑度Xi-pを利用し、Bピクチャでは双方向予測が減少するが、もともと双方向予測のないPピクチャの実測画面複雑度Xp-pを利用することにより発生符号量の増加を抑制することができる。
また、シーンチェンジ画像の次の同じピクチャタイプのP又はBピクチャについては、シーンチェンジ画像により増加した発生符号量から計算されるP、Bピクチャの画面複雑度Xp-p、Xb-pを基準としてそれぞれP、Bピクチャの推定画面複雑度Xp、Xbを計算すると、推定画面複雑度Xp、Xbが必要以上に大きな値となってしまう。そこで、P、Bピクチャの実測画面複雑度Xp-p、Xb-pの代わりに、シーンチェンジ画像の時点で画面複雑度メモリ24Mに貯えられたP、Bピクチャの実測画面複雑度Xp-pold、Xb-poldと、その実測画面複雑度Xp-pold、Xb-poldの対象となったP、BピクチャのアクティビティACTp-pold、ACTb-poldと、これから符号化する現在の画像のP、BピクチャのアクティビティACTp、ACTbから次式(5)(6)によってP、Bピクチャの画面複雑度Xp、Xbを推定することにより、画面複雑度の適正化が図られる。
Xp=Xp-pold*(ACTp/ACTp-pold) (5)
Xb=Xb-pold*(ACTb/ACTb-pold) (6)
なお、画面複雑度メモリ24Mには、シーンチェンジ画像における実測画面複雑度Xp-pold、Xb-poldの他に、各ピクチャタイプにおける直前数フレームの画像のP、BピクチャのアクティビティACTp-pold、ACTb-poldが貯えられる。
第1の実施の形態においては、P、Bピクチャのシーンチェンジ画像ではそれぞれ過去に算出されたI、Pピクチャの実測画面複雑度Xi-p、Xp-pを用いて推定画面複雑度Xp、Xbを算出し、シーンチェンジ画像の次の同じピクチャタイプのP又はBピクチャについては式(5)(6)によって推定画面複雑度Xp、Xbを算出し、それ以外の通常のP、Bピクチャ及びIピクチャについては、実測画面複雑度をMPEG2 Test Model 5の式(2)〜(4)のXi、Xp、Xbに代入して、これから符号化する画像の目標割当符号量Ti、Tp、Tbを決定することにより、シーンチェンジに対応した符号量割当を行うことができる。そして、この目標割当符号量Ti、Tp、Tbと、バッファ16で検出される各マクロブロックの発生符号量を基に、MPEG2 Test Model 5の方法を用いて各マクロブロックの量子化スケールを決定する。
なお、画像特性検出器25からは符号量制御器14へも各マクロブロックのアクティビティACTi、ACTp、ACTbが送られ、MPEG2 Test Model 5におけるアクティビティに基づいて各マクロブロックの量子化スケールを変更する適応量子化制御に使用されるが、この適応量子化制御は行わなくてもよい。符号量制御器14から出力される各マクロブロックの量子化スケールが量子化器13に送られ、現在の画像(DCT後の分割された原動画像又は動き補償予測の誤差画像ブロック)がこの量子化スケールで量子化器13で量子化され、可変長符号化器15で可変長符号化されて、次のバッファ16で時間調整された後に符号が出力される。量子化器13のマクロブロックごとの量子化スケール、バッファ16で監視される発生符号量がそれぞれ、平均量子化スケール検出器22、発生符号量検出器23に送られ、次のピクチャの符号量制御に使用される。
<第2の実施の形態>
第1の実施の形態では、符号化時にシーンチェンジ検出をしているが、図2に示す第2の実施の形態のように、シーンチェンジ検出を符号化前にしていてもよい。第2の実施の形態に用いる符号化回路部分は第1の実施の形態と同様である。符号化の順番が入力順ではなく、いったんフレームメモリ(FM)10に蓄えられてから、所定の符号化順に可変長符号化器15に入力、符号化される。
一方、画像特性検出器25には、入力された順番でアクティビティACTi、ACTp、ACTbが計算され、フレーム単位で加算される。その結果がシーンチェンジ検出器28に供給される一方、符号量計算で利用するためにメモリ(図示しない)に保存される。シーンチェンジ検出器28では、現在の画像のアクティビティACTと、直前に入力された画像のアクティビティACT-pの比率(ACT/ACT-p)が計算される。そして、この計算された比率(現在のアクティビティ/直前のアクティビティ)が一定範囲を超えたとき、例えば比率<Amin又は比率>Amax(0<Amin<1、Amax>1)の場合、シーンチェンジ検出器28はこれら2つの画像の間でシーンチェンジが起こったと判定し、このフレームの位置情報を画面複雑度算出器24に送る。
画面複雑度算出器24では、上記の判定情報をいったん画面複雑度メモリ24Mに保存し、I、Pピクチャに符号化する時に参照する。このときシーンチェンジと判定された画像が存在すれば、符号化する現在の画像をシーンチェンジと判定する。図3に入力画像と符号化画像の関係を示し、ここではピクチャB4に符号化する画像の手前でシーンチェンジがある。シーンチェンジ検出器28ではピクチャB4に符号化する画像が入力されたときにシーンチェンジであると判定され、画面複雑度算出器24に送られる。この情報はI又はPピクチャに符号化するときに参照され、ここではピクチャP5に符号化するときに参照され、シーンチェンジが検出されているのでピクチャP5がシーンチェンジ画像となる。
その後、画面複雑度算出器24では、シーンチェンジ画像における発生符号量の増加を抑制するためのPピクチャの画面複雑度Xpの推定が行われる。シーンチェンジ画像におけるPピクチャの推定画面複雑度Xpは、Iピクチャの実測画面複雑度Xi-pを用いる。また、シーンチェンジ画像の次の1つあるいは複数のBピクチャの推定画面複雑度Xbに関しては、シーンチェンジ画像符号化直前のPピクチャの画面複雑度Xp-poldを使用する。シーンチェンジでは双方向予測が減少するが、もともと双方向予測のないPピクチャの画面複雑度Xp-pを利用することにより発生符号量の増加を抑制することができる。
また、第2の実施の形態では、シーンチェンジ画像のピクチャタイプは変更されていないが、イントラ・マクロブロックが増大することから、シーンチェンジ画像がPピクチャの時はIピクチャにピクチャタイプを変更して符号化することも可能である。
<第3の実施の形態>
第3の実施の形態はインターレース画像の符号化装置であり、第2の実施の形態のシーンチェンジ検出器28内に動き検出回路(図示省略)を追加したものである。シーンチェンジ検出器28内の動き検出回路以外の動作は第2の実施の形態とほぼ同様である。インターレース画像では1フレームが2フィールドで構成されているため、画像特性検出器25でアクティビティACTを計算する際にマクロブロックを16×16画素として処理するフレームアクティビティFRMACTと、16×8×2画素として処理するフィールドアクティビティFLDACTとを計算し、1フレーム分の結果がシーンチェンジ検出器28内の動き検出器に送られる。
動き検出器ではフレームアクティビティFRMACTとフィールドアクティビティFLDACTの比=FRMACT/FLDACTを計算し、ある一定値Aより大きいときは対象としている画像が動いている状態であると判断し、それ以外のときには静止している状態と判断し、その状態情報を画面複雑度算出器24に送る。
動いている状態:FRMACT/FLDACT>A
静止している状態:FRMACT/FLDACT≦A
画面複雑度算出器24では、P、Bピクチャの各推定画面複雑度Xp、Xbを算出する際、参照画像と現在符号化しようとしている画像の動きの状態が同一であれば、従来例(特許文献3)と同様に同じピクチャタイプの実測画面複雑度Xp-p、Xb-pを使用し、異なるときは、第1の実施の形態と同様に、異なるピクチャタイプであるI、Pのピクチャの各実測画面複雑度Xi-p、Xp-pを使用する。このように、イントラ・マクロブロックが増大すると予想されるPピクチャでは、もともとイントラ・マクロブロックで構成されるIピクチャの画面複雑度Xi-pを利用し、双方向予測の減少が予想されるBピクチャではもともと双方向予測のないPピクチャの画面複雑度Xp-pを利用することにより発生符号量の増加を抑制することができる。
本発明に係る動画像符号化装置の第1の実施の形態を示すブロック図である。 第2の実施の形態の動画像符号化装置を示すブロック図である。 第2の実施の形態の入力画像と符号化画像の関係を示す説明図である。 従来の動画像符号化装置を示すブロック図である。 符号化ピクチャ構造の一例を示す説明図である。 従来の他の動画像符号化装置を示すブロック図である。
符号の説明
11 減算器
12 DCT器
13 量子化器
14 符号量制御器
15 可変長符号化器
16 バッファ
17 逆量子化器
18 IDCT器
19 動き補償予測器
20 加算器
21 フレームメモリ
22 平均量子化スケール検出器
23 発生符号量検出器
24 画面複雑度算出器
24M 画面複雑度メモリ
25 画像特性検出器
28 シーンチェンジ検出器

Claims (2)

  1. 入力動画像及び入力動画像の動き補償予測誤差を直交変換し、直交変換された係数を量子化スケールに基づいて量子化して可変長符号化するとともに、発生符号量を前記量子化スケールにより制御する動画像符号化手段と、
    前記入力動画像についてマクロブロック単位で検出されたI、P、Bピクチャごとのアクティビティがフレーム単位で加算されて得られる画像特性を検出する画像特性検出手段と、
    前記画像特性検出手段により検出されたこれから符号化する現在の画像のI、P、BピクチャごとのアクティビティACTi、ACTp、ACTbと、直前に符号化した同じピクチャタイプの画像のアクティビティACTi-p、ACTp-p、ACTb-pの比率(ACTi/ACTi-p)、(ACTp/ACTp-p)、(ACTb/ACTb-p)を計算し、その結果得られたI、P、Bピクチャごとの比率(現在のアクティビティ/直前のアクティビティ)が一定範囲を超えたとき、シーンチェンジであると判定するシーンチェンジ検出手段と、
    前記量子化スケールの1フレームの平均量子化スケールを検出する平均量子化スケール検出手段と、
    前記符号化により発生した1フレームの符号量を検出する発生符号量検出手段と、
    記平均量子化スケール検出手段により検出された各フレームの平均量子化スケールと、前記発生符号量検出手段により検出された各フレームの符号量とが乗算されて得られるMPEG2Test Model 5におけるComplexityに相当する各フレームのI、P、Bピクチャごとの実測画面複雑度Xi-p、Xp-p、Xb-pを求め、前記シーンチェンジ検出手段によりシーンチェンジであると判定されたとき、これから符号化する画像であるシーンチェンジ画像については、Pピクチャの推定画面複雑度Xpを算出する際にPピクチャとは異なるIピクチャの前記実測画面複雑度Xi-pを用い、Bピクチャの推定画面複雑度Xbを算出する際にBピクチャとは異なるPピクチャの前記実測画面複雑度Xp-pを用いることにより、過去に算出された前記実測画面複雑度により、入力画像の推定画面複雑度を算出し、前記シーンチェンジ画像の次の同じタイプのP又はBピクチャについては、P、Bピクチャの実測画面複雑度Xp-p、Xb-pの代わりに、前記シーンチェンジ画像の時点で保持されたP、Bピクチャの実測画面複雑度Xp-pold、Xb-poldと、その実測画面複雑度Xp-pold、Xb-poldの対象となったP、Bピクチャの前記画像特性としてのアクティビティACTp-pold、ACTb-poldと、これから符号化する現在の画像のP、BピクチャのアクティビティACTp、ACTbから次の2つの式
    Xp=Xp-pold*(ACTp/ACTp-pold)
    Xb=Xb-pold*(ACTb/ACTb-pold)
    によってP、Bピクチャの画面複雑度Xp、Xbを推定することにより、画面複雑度の適正化図るよう構成された画面複雑度算出手段と、
    前記画面複雑度算出手段により算出された推定画面複雑度により次に符号化する画像の前記量子化スケールを決定する手段とを備え、
    前記画面複雑度算出手段は、前記過去に算出された実測画面複雑度として、前記シーンチェンジ検出手段によりシーンチェンジと判定されない画像を符号化する場合には過去に算出された同じピクチャタイプの実測画面複雑度を用いるよう構成された動画像符号化装置。
  2. 前記画面複雑度算出手段は、インターレース画像のフレームアクティビティとフィールドアクティビティとの比が一定値より大きいときは、符号化する画像が動いていると判断し、それ以外のときは静止していると判断し、静止していると判断された場合には過去に算出された同じピクチャタイプの実測画面複雑度を用い、動いていると判断された場合にはPピクチャではIピクチャの画面複雑度を用い、BピクチャではPピクチャの実測画面複雑度を用いて前記推定画面複雑度を算出することを特徴とする請求項1に記載の動画像符号化装置。
JP2004321315A 2004-11-04 2004-11-04 動画像符号化装置 Expired - Fee Related JP4257655B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004321315A JP4257655B2 (ja) 2004-11-04 2004-11-04 動画像符号化装置
US11/255,889 US7903732B2 (en) 2004-11-04 2005-10-24 Method and apparatus for encoding a moving-picture signal by calculating the complexity of the moving-picture signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004321315A JP4257655B2 (ja) 2004-11-04 2004-11-04 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2006135557A JP2006135557A (ja) 2006-05-25
JP4257655B2 true JP4257655B2 (ja) 2009-04-22

Family

ID=36261836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004321315A Expired - Fee Related JP4257655B2 (ja) 2004-11-04 2004-11-04 動画像符号化装置

Country Status (2)

Country Link
US (1) US7903732B2 (ja)
JP (1) JP4257655B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100972482B1 (ko) * 2005-12-21 2010-07-26 파나소닉 주식회사 화상 압축 장치, 화상 신장 장치 및 초음파 진단 장치
JP2008004980A (ja) * 2006-06-20 2008-01-10 Fujitsu Ltd 符号化装置、符号化方法、プログラム記録媒体、プログラム、シーン変化検知装置、およびシーン変化検知方法
JP4908943B2 (ja) * 2006-06-23 2012-04-04 キヤノン株式会社 画像符号化装置及び画像符号化方法
US7734146B1 (en) * 2006-07-11 2010-06-08 Seagate Technology Video data reduction in MPEG bit stream
US8472529B2 (en) * 2007-09-14 2013-06-25 General Instrument Corporation Estimating complexity of video frames for encoding
KR20100057388A (ko) * 2008-11-21 2010-05-31 삼성전자주식회사 버퍼 상태에 적응적인 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
RU2538285C2 (ru) 2010-05-12 2015-01-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ и устройство управления размером кода
RU2573279C2 (ru) 2011-03-10 2016-01-20 Ниппон Телеграф Энд Телефон Корпорейшн Устройство и способ управления квантованием и программа управления квантованием
EP2756662A1 (en) * 2011-10-11 2014-07-23 Telefonaktiebolaget LM Ericsson (PUBL) Scene change detection for perceptual quality evaluation in video sequences
JP5871602B2 (ja) * 2011-12-19 2016-03-01 キヤノン株式会社 符号化装置
WO2014155471A1 (ja) * 2013-03-25 2014-10-02 日立マクセル株式会社 符号化方法および符号化装置
US9955191B2 (en) 2015-07-01 2018-04-24 At&T Intellectual Property I, L.P. Method and apparatus for managing bandwidth in providing communication services
US11323703B2 (en) 2018-07-03 2022-05-03 Nec Corporation Moving-image encoding device, moving-image encoding method, and program

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2950065B2 (ja) 1992-10-28 1999-09-20 日本ビクター株式会社 可変転送レート符号化装置
US6100931A (en) * 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
JP3872849B2 (ja) 1996-11-28 2007-01-24 松下電器産業株式会社 動画像符号化装置
JP3748895B2 (ja) * 1997-02-13 2006-02-22 三菱電機株式会社 符号化装置及び復号装置及び符号化方法及び復号方法
US5978029A (en) * 1997-10-10 1999-11-02 International Business Machines Corporation Real-time encoding of video sequence employing two encoders and statistical analysis
CN1234246C (zh) * 1998-09-29 2005-12-28 松下电器产业株式会社 可变比特率编码装置
JP2000333169A (ja) * 1999-05-24 2000-11-30 Mitsubishi Electric Corp 動画像符号化装置
DE60035740T2 (de) * 1999-06-22 2007-12-06 Victor Company of Japan, Ltd., Yokohama Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen
JP3812267B2 (ja) 2000-02-21 2006-08-23 日本ビクター株式会社 動画像符号化装置及びその方法
JP4428680B2 (ja) * 2000-11-06 2010-03-10 パナソニック株式会社 映像信号符号化方法および映像信号符号化装置

Also Published As

Publication number Publication date
US7903732B2 (en) 2011-03-08
JP2006135557A (ja) 2006-05-25
US20060093032A1 (en) 2006-05-04

Similar Documents

Publication Publication Date Title
JP3954656B2 (ja) 画像符号化装置及び方法
KR100335052B1 (ko) 프레임 레벨 속도 제어 방법
EP1942678B1 (en) Video encoding method and scene cut detection method
JP4257655B2 (ja) 動画像符号化装置
JP2001008215A (ja) 動画像符号化装置及びその方法
JP4362795B2 (ja) 動画像符号化装置及びその方法
JP4525878B2 (ja) 動画像符号化方法
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
JP3173369B2 (ja) 画像圧縮符号化装置
JP2001128179A (ja) 動画像符号化装置および方法
JP3812267B2 (ja) 動画像符号化装置及びその方法
JP3480067B2 (ja) 画像符号化装置及び方法
JP4362794B2 (ja) 動画像符号化装置及びその方法
JP4253276B2 (ja) 画像符号化方法
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP3858520B2 (ja) 動画像符号化装置及びその方法
JP2002010270A (ja) 画像符号化装置及び画像符号化方法
JP2000261809A (ja) 画像特徴に応じた画像符号化装置
JP4232976B2 (ja) 動き予測情報検出装置
KR100336497B1 (ko) 공간예측 오차 모델을 이용한 동영상 부호화기의 율제어장치 및 방법
JP3428332B2 (ja) 画像符号化方法及び装置、並びに画像伝送方法
JP2003032691A (ja) 画像特徴に応じた画像符号化装置
JP5871602B2 (ja) 符号化装置
JP4676513B2 (ja) 符号化ピクチャタイプ決定方法,装置,そのプログラムおよびその記録媒体
JP2005303555A (ja) 動画像符号化装置および動画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120213

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130213

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140213

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees