[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2007089035A - 動画像符号化方法、装置及びプログラム - Google Patents

動画像符号化方法、装置及びプログラム Download PDF

Info

Publication number
JP2007089035A
JP2007089035A JP2005278044A JP2005278044A JP2007089035A JP 2007089035 A JP2007089035 A JP 2007089035A JP 2005278044 A JP2005278044 A JP 2005278044A JP 2005278044 A JP2005278044 A JP 2005278044A JP 2007089035 A JP2007089035 A JP 2007089035A
Authority
JP
Japan
Prior art keywords
code amount
picture
encoding
bit rate
quantization parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2005278044A
Other languages
English (en)
Inventor
Naomi Takeda
奈穂美 武田
Takeshi Nakajo
健 中條
Atsushi Matsumura
淳 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005278044A priority Critical patent/JP2007089035A/ja
Priority to US11/384,367 priority patent/US20070071094A1/en
Priority to CNA2006100887612A priority patent/CN1941915A/zh
Publication of JP2007089035A publication Critical patent/JP2007089035A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】1パスレート制御において画像の性質に応じた適切な制御を行い、画質を向上させる動画像符号化装置を提供する。
【解決手段】第1、第2量子化パラメータを用いて対象動画像に含まれるn枚のピクチャを符号化したときの第1、第2ピクチャタイプ別符号量を算出するピクチャタイプ別符号量算出部5と、第1、第2ピクチャタイプ別符号量からそれぞれ求まるピクチャ単位の第1、第2平均発生符号量に設定フレームレートを乗じて第1、第2ビットレートを算出するビットレート算出部6と、前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよび前記ターゲットビットレートを用いて第3量子化パラメータを算出する量子化パラメータ算出部7と、第3量子化パラメータを初期値として用いてレート制御を行いつつ符号化を行う符号化部9とを有する。
【選択図】 図1

Description

本発明は、特に動画像符号化におけるレート制御技術に関する。
動画像のデータ、すなわち映像データは膨大なデータ量をもつため、映像データを配信したり蓄積したりする際には、圧縮符号化が行われる。圧縮符号化に際しては、配信時には伝送能力を超えないビットレートで符号化することが要求され、蓄積時には確保できる容量を超えない符号量で符号化することが要求される。このような要求に対し、例えば非特許文献1に記載されているように、動画像符号化の際に定ビットレート(CBR)制御、可変ビットレート(VBR)制御などの手法を用いてビットレートを制御することが行われる。CBR制御では、対象動画像のシーケンス全体にわたって与えられたターゲットビットレートで符号化を行う。一方、VBR制御は対象動画像のシーケンス全体について平均化したビットレートがターゲットビットレートになるように符号化を行う。
これらのレート制御方式は、大きく二つに分類される。符号化の対象動画像を一度だけスキャンして符号化するレート制御方式を1パスレート制御と呼び、これは1パスCBR制御と1パスVBR制御に分類される。これに対し、はじめに対象動画像のシーケンス全体を一度スキャンして解析を行い、解析結果に基づいてシーケンスに含まれる各シーンに割り当てる符号量を決定するレート制御方式を2パスレート制御と呼び、これは2パスCBR制御と2パスVBR制御に分類される。
2パスレート制御は、対象動画像のシーケンス全体の画質がわかっていないと符号化を開始できず、また符号化時には符号化処理以外に解析のための処理を必要とする。このため、放送されている映像データを受信しつつリアルタイムで符号化を行うような用途には利用できない。このような用途には、1パスレート制御が用いられる。
1パスレート制御を行う際には、グループ・オブ・ピクチャ(GOP)単位に符号量を割り振り、GOP単位符号量をさらに各ピクチャの画像複雑度指標に応じてピクチャ単位符号量として割り振るという処理が行われる。こうして割り振られた符号量と実際の符号化時の発生符号量との乖離が大きくならないように、量子化パラメータを調整しながら符号化を行う。このとき、Iピクチャの画像複雑度指標はIピクチャ符号化の度に更新され、Pピクチャ及びBピクチャの画像複雑度指標はそれぞれPピクチャ及びBピクチャの符号化の度に更新される。
一方、特許文献1には動画像の各シーンにおける符号化難度に応じて量子化パラメータを切り替えることにより、画質の劣化を防ぐ方法が記載されている。
亀山 渉,花村 剛:IDG情報通信シリーズ MPEG-1/MPEG-2/MPEG-4 ディジタル放送教科書(上),株式会社IDGジャパン(2003/1/28) 特開2000−115786号公報
1パスCBR制御は対象動画像の解析を行わないため、次に現れる画像が激しい動きを含むのか、静止画像であるか、平坦な画像であるか、あるいは解像度が高い画像であるか、などの性質がわからない。このため1パスCBR制御では、動画像シーケンス全体の画質を考慮した符号化を行うことはできない。また、主観画質を一定にするために必要な符号量は画像の性質によって大きく異なる。従って、画像の性質によらず各ピクチャの画像で用いる符号量を一定に保とうとする制御を行うCBR制御では、必ずしも高画質な符号結果を得られない。
一方、1パスVBR制御では、1パスCBR制御の場合と同様に続いて現れる画像の解析が行われないため、画像の性質に配慮した高画質化を行うことが難しい。さらに、1パスVBR制御は画質を劣化させないことを優先し、瞬時ビットレートをターゲットビットレートに厳密に合わせることを行わない。すなわち、量子化パラメータQPの値を極端に変動させない制御を行う。このため対象動画像のシーケンスが短い場合には、ターゲットビットレートへの収束性が悪く、発生符号量が所望の符号量に収まらない場合がある。
一方、特許文献1の手法は動きのあるシーンから静止画のシーンになったり、逆に静止画のシーンから動きのあるシーンになったりというようなシーンの変化があると、画質が劣化しやすい。これは符号化難度に基づいて量子化パラメータを決定しても、ピクチャタイプ別のアロケーションが適切とはならないからである。
さらに、1パスレート制御を行う際にGOP単位に符号量を割り振り、GOP単位符号量をI,P及びBの各ピクチャの画像複雑度指標に応じてピクチャ単位符号量として割り振るという処理において、各ピクチャの画像複雑度指標を更新する際にP,Bピクチャと比較してIピクチャの更新頻度が小さい。従って、Iピクチャでは適切でない画像複雑度指標の値を用いてピクチャ単位符号量を割り当ててしまう場合があるため、Iピクチャに割り振られる符号量が適切でないことが起こる。さらに、Iピクチャと次のIピクチャとの時間差が大きいため、Iピクチャ間では画像の性質の変化も大きい。このためIピクチャの画像複雑度指標の更新精度が低く、このことも画質劣化の要因となる。
本発明の目的は、1パスレート制御において画像の性質に応じた適切な制御を行い、画質を向上させる動画像符号化方法、装置及びプログラムを提供することにある。
本発明の他の目的は、対象動画像のシーン変化に対して適切なレート制御を行うことにある。
本発明のさらに別の目的は、レート制御のための画像複雑度指標の更新精度を向上することにある。
本発明の第1の観点によると、符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプを用いて対象動画像を符号化する動画像符号化方法であって、第1量子化パラメータを用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第1符号量情報を求めるステップと、前記第1符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて第1ビットレートを求めるステップと、前記第1量子化パラメータとは異なる第2量子化パラメータを用いて前記n枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第2符号量情報を求めるステップと、前記第2符号量情報から求まるピクチャ単位の第2平均発生符号量に設定フレームレートを乗じて第2ビットレートを求めるステップと、
前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよびターゲットビットレートを用いて第3量子化パラメータを求めるステップと、
前記第3量子化パラメータを初期値として用いて前記レート制御を行うステップとを具備する動画像符号化方法とを具備する動画像符号化方法を提供する。
本発明の第2の観点によると、符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ対象動画像を符号化する、インター符号化モードとイントラ符号化モードを有する動画像符号化方法であって、前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の発生符号量を算出するステップと、前記発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新するステップと、前記画像複雑度指標を用いて前記レート制御を行うステップとを具備する動画像符号化方法を提供する。
対象動画像の性質に適した量子化パラメータの設定が可能となるため、符号化画像の画質が改善される。対象動画像全体でなく、限られたn枚のピクチャに関して解析を行うことにより、符号化時間の増大を避けることができる。従って、放送途中の映像データなどに対しても、n枚のピクチャ分の符号化時刻の遅延のみで適用が可能である。
また、シーン変化毎にシーン変化後の画像の性質に適した量子化パラメータの設定が可能になるため、シーン変化後の画質が改善される。
さらに、イントラ符号化のための画像複雑度指標の更新頻度が頻繁になり、かつ更新精度が高くなるため、複雑度が変化する画像における画質劣化を低減できる。
以下に、本発明の実施形態を図面に基づいて詳細に説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る動画像符号化装置であり、ターゲットビットレート(BR)の入力部1、フレームレート(FR)、リオーダリングディレイ(M)及びGOP数の入力部2、適応型初期パラメータ決定部3、及びレート制御符号化部9を有する。適応型初期パラメータ決定部3は、第1の量子化パラメータ(QP1)の決定部4、ピクチャタイプ別符号量算出部5、ピクチャタイプ別符号量を用いた仮ビットレート算出部6、第2の量子化パラメータ(QP2)の決定部7、及び初期パラメータ決定部8を有する。
図2は、図1中のレート制御符号化部9の詳細を示している。この例は、H.264に準拠したビデオエンコーダの主要部を表している。符号化対象の動画像信号101は減算器201に入力され、減算器201により動画像信号101と予測信号110との差分である予測残差信号102が生成される。予測残差信号102に対して、離散コサイン変換(DCT)/量子化ユニット202によりDCT及び量子化が施される。量子化されたDCT係数情報103は、逆量子化/逆DCTユニット203とエントロピー符号化器212に入力される。ここでは、直交変換/逆直交変換の一例としてDCT/逆DCTを挙げたが、これに限られるものではない。
量子化されたDCT係数情報103は、逆量子化/逆DCTユニット203により処理され、これによって予測残差信号102に対応した信号104が生成される。逆量子化/逆DCTユニット203は、DCT/量子化ユニット202の処理と逆の処理である逆DCT及び逆量子化を行う。逆量子化/逆DCTユニットユニット203からの出力信号104は、加算器204においてモード選択スイッチ209からの予測信号110と加算され、これによって局部復号画像信号105が生成される。局部復号画像信号105は、参照画像メモリ205に参照画像信号として記憶される。参照画像メモリ205には、複数フレームの参照画像信号が順次記憶される。
参照画像メモリ205から読み出される参照画像信号は、イントラ予測器206に入力され、イントラ予測信号106が生成される。参照画像信号は、さらにデブロッキングフィルタ207によってフィルタリングされる。フィルタリング後の参照画像信号107は、インター予測器(動き補償予測器)208に入力される。インター予測器208では、フィルタリング後の複数フレームの参照画像信号について動きベクトルの探索と、探索された動きベクトルによる動き補償を行い、動きベクトル情報108とフレーム単位のインター予測信号109を生成する。
モード選択スイッチ209は、符号化制御部211から出力される符号化モード情報(図示せず)に従ってイントラ予測モード時にはイントラ予測信号106を選択し、インター予測モード時にはインター予測信号109を選択する。モード選択スイッチ209によって選択された予測信号110は、減算器201に入力される。
エントロピー符号化器212では、量子化されたDCT係数情報103、動きベクトル情報108及び予測モード情報111に対して例えば算術符号化のようなエントロピー符号化を施し、情報103,108及び111の各々に対応する可変長符号113を生成する。可変長符号113は、図示しない後段の多重化器にシンタックス用データとして与えられ、多重化されることにより符号化ビットストリームが生成される。符号化ビットストリームは、図示しない出力バッファにより平滑化された後、図示しない伝送系または蓄積系へ送出される。
符号化制御部211は、図1中に示した適応的初期パラメータ決定部8からの初期パラメータを受けて、符号化ビットレートを制御するために、例えばDCT/量子化ユニット202及びIDCT/逆量子化ユニット203における量子化パラメータの制御とエントロピー符号化器212の制御を行う。
次に、図3を用いて本実施形態における初期パラメータ設定手順を説明する。以下の説明では、符号化対象の動画像信号101を対象動画像という。初期パラメータの設定に際しては、適応的初期パラメータ決定部3に対象動画像101を入力すると共に、入力部1からターゲットビットレート(BR)の情報を入力し、入力部2から対象動画像101の設定フレームレート(FR)、リオーダリングディレイ(M)及びグループ・オブ・ピクチャ(GOP)の数(N)の情報を入力する。リオーダリングディレイは、IピクチャまたはPピクチャが現れる周期である。リオーダリングディレイがMであることは、IピクチャまたはPピクチャの後にBピクチャがM−1枚続くことを意味する。GOPは、対象動画像101のあるIピクチャから次のIピクチャの前までのIピクチャ、Pピクチャ及びBピクチャの合計N個のピクチャの集合を表す。例えばM=3,N=15の場合のGOPは図4に示される。ここで、図4ではピクチャは左から順番に表示順で並んでいる。
適応的初期パラメータ決定部3では、まず第1の量子化パラメータ決定部4が第1の量子化パラメータQP1を決定する(ステップS1)。この場合、ユーザの入力に従って量子化パラメータQP1を決定してもよいし、1ピクセル当たりの発生符号量を基準にQP1を決定してもよい。後者の方法の一例を挙げると、例えばSiwei Ma; Wen Gao; Feng Wu; Yan Lu; Image Processing, 2003. Proceedings. 2003 International Conference on, Volume 3, 14-17 Sept. 2003, Pages:III - 793-6 vol. 2(以下「参考文献1」)に記載されているように、ビットレート/(フレームレート×1ピクチャ当たりのピクセル数)を計算し、その計算結果に応じて量子化パラメータを決定する。
次に、このようにして決定された量子化パラメータQP1を用いてピクチャタイプ別符号量算出部5において、符号化に用いられるピクチャタイプ毎に、ピクチャ単位の発生符号量すなわちピクチャ1枚あたりの発生符号量を示す情報であるピクチャタイプ別符号量I1,P1及びB1を算出する(ステップS2)。ここで、ピクチャタイプ別符号量I1はIピクチャの発生符号量、ピクチャタイプ別符号量P1はPピクチャの発生符号量、ピクチャタイプ別符号量B1はBピクチャの発生符号量を表す。
既に良く知られているように、MPEG−2ではIピクチャは符号化済みの他のピクチャを参照せずに符号化されるピクチャ、Pピクチャは符号化済みのI及びPピクチャのうち時間的に過去のピクチャを参照して符号化されるピクチャ、Bピクチャは符号化済みのI,Pピクチャのうち時間的に前後のピクチャを参照して符号化されるピクチャである。H.264では、ピクチャより小さい符号化単位としてスライスを定義しており、符号化対象スライスの符号化済部分のみを参照して符号化されるIスライス、符号化済みのIおよびPスライスのみを最大一つ参照して符号化されるPスライス、符号化済みのIおよびPスライスを最大二つ参照して符号化されるBスライスがある。MPEG−2と違いがあるが、1スライスを1ピクチャとした場合においては似た性質があるため、以下の説明ではIピクチャ、Pピクチャ、Bピクチャとして記述するものとする。
上ではB1を算出すると記述したが、実際の符号化の際にBピクチャを用いない場合(すなわち、リオーダリングディレイMが1の場合)、B1の算出は不要である。同様に、すべてIピクチャで符号化する場合(すなわちGOP Nが1の場合)はP1の算出は不要である。
ピクチャタイプ別符号量I1,P1,B1を算出するための一つの方法は、対象動画像101に含まれるピクチャを実際に符号化する方法である。例えば動画像シーケンスの最初のn枚のピクチャに対して、量子化パラメータQP1で符号化を行うことである。これによってIピクチャ、Pピクチャ及びBピクチャについて、少なくとも1ピクチャ単位の発生符号量I1,P1及びB1を求めることができる。このときのnの最小値は以下に示すとおり、リオーダリングディレイMの値によって決まる。
リオーダリングディレイMが1の場合、最初のピクチャはIピクチャとして符号化され、次のピクチャはPピクチャとして符号化されるので、対象動画像の最初から少なくとも2枚のピクチャを符号化すればよい。リオーダリングディレイMが3の場合、対象動画像の1枚目のピクチャがIピクチャとして符号化されるとすると、次に4枚目のピクチャがPピクチャとして符号化され、次に2枚目のピクチャ、次に3枚目のピクチャが順次Bピクチャとして符号化される。従って、対象動画像の最初から少なくともn=4枚のピクチャが符号化されればよい。すなわち、図5に示される対象動画像のフレームのうち、量子化パラメータQP1で実際に符号化されるのは図5の斜線で示す最初の4つのフレームのみであり、それ以外のフレームに関してはQP1による符号化(従って画像の解析)は行われない。
上記ではM+1枚のピクチャを符号化する例(n=M+1)を示したが、k×M+1枚符号化して(n=k×M+1)、同じピクチャタイプのピクチャの発生符号量を平均してピクチャタイプ別符号量を算出しても良い。以下ではM+1枚のピクチャを符号化する例(n=M+1)を示す。
ここでは1枚のフレームを1枚のピクチャとして符号化する場合について説明を行ったが、1枚のフレームを2つのフィールドに分割し、1つのフィールドを1枚のピクチャとして符号化する場合にも同様でよい。このことは、後述する他の実施形態においても同様である。
このように実際に量子化パラメータQP1で符号化してみて発生符号量を調べる方法のほかに、符号化の途中段階であるDCTまでの処理が終了した段階で得られるDCT係数に対して、量子化パラメータQP1で量子化を行った際に得られるゼロ係数の個数から発生符号量を推定する方法を用いてもよい。この方法は、例えばZ. He, Y. K. Kim, Sanjit. K. Mitra “Low-Delay Rate Control for DCT Video Coding via ρ-domain Source Modeling”, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 11, No. 8, oag.928-940, Aug. 2001.(以下「参考文献2」)によって報告されている。この方法を使う場合には、図5の斜線で示すフレームのみにおいて、DCTまでの処理が終了した段階で得られるDCT係数に対して発生符号量を推定すればよい。
このようにして求められたIピクチャの符号量をI1、Pピクチャの符号量をP1とし、2つのBピクチャの符号量の平均あるいは大きい方の符号量、あるいは小さい方の符号量をB1とする。ここで、本実施形態においては対象動画像のn枚のピクチャ、例えば最初のn枚のピクチャのみからピクチャタイプ別符号量I1,P1,B1を算出することが重要である。実際に符号化を行って符号量を求めるのか、ゼロ係数の個数からの近似を用いるのかなど、I1,P1,B1を算出する方法自体は特に限定されない。
次に、上記のようにピクチャタイプ別符号量算出部5において算出されたピクチャタイプ別符号量I1,P1,B1と、入力部2から入力された設定フレームレートFRの情報を用いて、仮ビットレート算出部5において仮ビットレート(第1ビットレート)BR1を算出する(ステップS3)。例えば、1枚のフレームを1枚のピクチャとして符号化する場合を考えると、仮ビットレートBR1は以下のように算出される。
Figure 2007089035
ここで、前述したようにMはリオーダリングディレイを表し、NはGOPの数を表し、FRはフレームレートを表す。
一方、1フィールドを1ピクチャとして符号化する場合を考えると、仮ビットレートBR1は以下のように算出される。
Figure 2007089035
このようにピクチャタイプ別符号量I1,P1,B1から求まるピクチャ単位の平均発生符号量(式(1)または(2)の右辺左側)に設定フレームレートFRを乗じることによって、仮ビットレートBR1を求める。
次に、第2の量子化パラメータ決定部8において、上記のように算出された仮ビットレートBR1とターゲットビットレート入力部1から入力されたターゲットビットレートBRを比較し(ステップS4)、その結果に応じて第2量子化パラメータQP2を決定する(ステップS5−S6)。すなわち、ターゲットビットレートBRに対して仮ビットレートBR1が大きい場合には、ステップS5においてQP2としてQP1よりΔQP1分大きな値を設定し、それ以外の場合にはステップS6においてQP2としてQP1よりΔQP2だけ小さな値を設定する。ここで、ΔQP1,ΔQP2はBR1がBRより小さい場合にはQP2を用いて得られるBR2がBRに近づくか、BR2より大きくなるようにQP2を設定し、逆の場合はBR2がBRに近づくかBR1より小さくなるようにQP2を設定するために用いられる。ΔQP1とΔQP2とは同じ値でもよいし、異なる値でもよい。
次に、第2の量子化パラメータ決定部8において決定したQP2を用いてピクチャタイプ符号量算出部5においてピクチャタイプ別符号量I2,P2,B2を算出する(ステップS7)。ステップS7ではステップS2と同様に、図5の斜線で示すフレームからI2,P2,B2を求める。
次に、ステップS7で算出されたピクチャタイプ別符号量I2,P2,B2と入力部2から入力されたフレームレートFR、リオーダリングディレイM及びGOP数Nを基に、仮ビットレート算出部6においてBR1の算出式(1)または(2)と同様の式(3)または(4)を用いて仮ビットレートBR2を算出する(ステップS8)。
Figure 2007089035
Figure 2007089035
すなわち、式(1)または(2)と同様にピクチャタイプ別符号量I2,P2,B2から求まるピクチャ単位の平均発生符号量(式(3)または(4)の右辺左側)に設定フレームレートFRを乗じることによって、ビットレートBR2を求める。
次に、初期パラメータ決定部7においてQP1,QP2,BR1、BR2及びターゲットビットレートBRから量子化パラメータQPを決定する(ステップS9)。量子化パラメータQPの決定方法としては、一例としてビットレートBRの対数は量子化パラメータQPに対して線形の関係QP=a×log(BR)+bにあると仮定して、次式のような補間または補外計算を行う方法が考えられる。
Figure 2007089035
ただし、QP1及びBR1と、QP2及びBR2との関係を用いてビットレートBRに適合すると予測される量子化パラメータQPを算出すればよく、QPの算出方法は特に式(5)に限定されない。
また、上記の例では図5のように最初のフレームからn枚のピクチャを符号化する例(最初のピクチャをIピクチャとする例)を示したが、各ピクチャタイプの符号化効率を考えた場合、このようにせずに、最初のM−1枚をPピクチャとし、M番目をIピクチャとする場合が多い。これを考慮した場合、そのようなGOP構造にあわせてピクチャタイプ別符号量を算出するとよい。
例えば図6の場合、対象動画像の最初のフレームから数えて3フレーム目から6フレーム目までの4枚のフレーム(4枚のピクチャ)に、符号化に用いられるすべてのピクチャタイプ(Iピクチャ、Pピクチャ、および、Bピクチャ)が出現する。そこで、図6に示すように3フレーム目から6フレーム目までの4枚のフレーム(4枚のピクチャ)の画像の性質から、ピクチャタイプ別符号量を算出することも考えられる。上に述べたように符号化効率を考えて、最終的な符号化において、対象動画像の最初のフレームをIピクチャにするのではなく、最初の2フレームをPピクチャにして、その後にIピクチャが続くように符号化する場合がある。そのような場合には、ピクチャタイプ別符号量の算出に用いるn枚のピクチャを図6のように定める方が図5のように定める方法に比較してIピクチャの位置が一致するため、最終的な符号化画像の画質を改善することも考えられる。
また上の説明では、対象動画像の最初のn枚のピクチャの画像を用いてピクチャタイプ別符号量を算出するとしたが、実際には対象動画像の符号量の大まかな値が算出できればよい。従って、画面に変化がなければ途中のn枚のピクチャの画像を用いてピクチャタイプ別符号量を算出してもよい。
また、本実施例においては、二つの量子化パラメータを用いた時の、符号化に用いられるピクチャタイプ毎の発生符号量を示す符号量情報からビットレートを算出し、その量子化パラメータとビットレートの対の二組と、ターゲットビットレートから第3の量子化パラメータを求める例を示したが、三つ以上の量子化パラメータとそれらのビットレートの対と、ターゲットビットレートから量子化パラメータを用いる方法も考えられる。
この場合は、三組以上の量子化パラメータとビットレート、ターゲットビットレートから本符号化に用いる量子化パラメータを推定するが、その推定方法はいろいろ考えられる。
一つの推定方法は三組以上から二組を選択し、その二組に対して上記数式(5)を適用する方法であり、また別な推定方法は三組以上の量子化パラメータとビットレートの関係から最小二乗法などを用いて近似曲線を求め、この近似曲線上でターゲットビットレートにマッチする量子化パラメータを推定する方法である。
三組以上の量子化パラメータとビットレートの対から二組を選択する方法もいろいろ考えられる。
例えば、ターゲットビットレートにもっとも近いビットレートAに対応する量子化パラメータAとターゲットビットレートに2番目に近いビットレートBに対応する量子化パラメータBを選択する方法や、ターゲットビットレート以上のビットレートCに対応する量子化パラメータCと、ターゲットビットレート以下のビットレートDに対応する量子化パラメータDがある場合にはこの二つの量子化パラメータC,DとビットレートC,Dとターゲットビットレートを選択する方法などである。どのように選択するかは本発明には依存しない。
最後に、初期パラメータ決定部7においてステップS9で決定された量子化パラメータの初期値QPを用いて、レート制御符号化部9においてレート制御を用いて符号化を行う(ステップS10)。量子化パラメータの初期値QPが画像の性質に応じて適切に設定されない場合には、量子化パラメータが安定するまで画質が劣化するという問題がある。本実施形態によると、予め対象動画像の性質とターゲットビットレートBRに適した初期パラメータQPを算出して設定するため、このような初期の画質劣化を回避することができる。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態では、図1の初期パラメータ決定部7において量子化パラメータの初期QPだけでなく、画像複雑度指標(グローバルコンプレキシティメジャー)の初期値も決定する。
以下に、グローバルコンプレキシティメジャーについての説明を行う。グローバルコンプレキシティメジャーは、MPEG-2のTM5で採用された方式で用いられるパラメータである。TM5においては、画像が変化しない限り平均量子化パラメータと発生符号量との積はピクチャタイプ毎に一定値であるというモデルを仮定している。以下の式でXはピクチャタイプ別グローバルコンプレキシティメジャー、Sはピクチャタイプ別符号量、Qはピクチャタイプ別平均量子化パラメータである。
Figure 2007089035
TM5のレート制御では、式(6)に示されるIピクチャ、Pピクチャ及びBピクチャ毎のグローバルコンプレキシティメジャーXi,Xp,Xbの値を用いて、次のピクチャのビットアロケーションを行う。このビットアロケーションに従って、できるだけピクチャ当たりの発生符号量が規定値から逸脱しないように、マクロブロック毎に量子化パラメータQPの調整を行う。つまり、Xi,Xp,Xbの初期値によって符号化開始時のI,P,B各ピクチャのビットアロケーションを決定する。Xi,Xp,Xbの初期値は、TM5では以下のように選ばれる。
Figure 2007089035
式(7)は、Iピクチャの発生符号量を160とした場合に、Pピクチャの発生符号量は60程度、Bピクチャの発生符号量は42程度であるということを示している。静止画あるいはそれに近い動きの小さい画像では、Pピクチャ及びBピクチャの発生符号量に対してIピクチャの発生符号量は非常に大きい。逆に動きの大きい画像では、Pピクチャの発生符号量とIピクチャの発生符号量には殆ど差がない場合もある。従って、式(7)のような初期値で符号化を開始すると当初は画質の劣化が見られ、符号化対象のピクチャ数が進むに連れてXの値が更新されてゆくために画質は徐々に安定してゆく。
本発明の第2の実施形態においては、Xの初期値を式(7)のような画像に依存しない一定の値ではなく、画像の性質に応じて適応的に決定する。すなわち、図1に示した動画像符号化装置において図7に示す適応型初期パラメータ決定処理S14を行う。図7においては、図3に示した第1の実施形態における適応型初期パラメータ処理S13に対してステップS11の処理が追加されている。第1の実施形態とは異なり、初期パラメータ決定部7とレート制御符号化部9は以下のように動作を行う。
初期パラメータ決定部7では、最初に第1の実施形態と同様に量子化パラメータQPを決定する(ステップS9)。次に、量子化パラメータQPでのグローバルコンプレキシティメジャーXi,Xp,Xbの初期値を算出する(ステップS11)。ステップS11の具体的な方法の一つとしては、例えば図8に示すように量子化パラメータQPを用いてピクチャタイプ別符号量I3,P3,B3を算出し(ステップS110)、I3,P3,B3の比率に合わせてXi,Xp,Xbの初期値を決定する(ステップS111)。
ステップS110のピクチャタイプ別符号量を算出する方法は、第1の実施形態の中で述べたステップS2の方法と同様である。具体的には、例えば対象動画像の最初のn枚のピクチャに関してピクチャタイプ別に符号化を行ったときの発生符号量を用いる。つまり、図5の斜線で示されるフレームのみ量子化パラメータQPで符号化する。そのときのIピクチャ及びPピクチャの発生符号量をそれぞれI3及びP3とし、2つのBピクチャの発生符号量の平均値、最大値あるいは最小値をB3とする。
このようにして得られたピクチャタイプ別符号量I3,P3,B3の比率に応じてグローバルコンプレキシティメジャーXi,Xp,Xbの初期値を決定し、レート制御符号化部9において量子化パラメータQPの初期値及びXi,Xp,Xbの初期値を設定して対象動画像の符号化を行う。このようにすることによって、対象動画像の開始動画像の性質と符号化QPに適合したグローバルコンプレキシティメジャーの初期値が設定されるため、符号化の開始直後から安定した画質を得ることができる。
ここではI3,P3,B3を算出する際の解析対象画像が図5に斜線で示す4つのフレームである場合を述べたが、図6に斜線で示す4つのフレームでもよい。また、ここではI,P及びBピクチャに対して同じ量子化パラメータQPを用いてピクチャタイプ別符号量I3,P3,B3を算出する例を示したが、PピクチャとBピクチャに対する量子化パラメータあるいはBピクチャに対する量子化パラメータをIピクチャに対する量子化パラメータQPより大きくしてピクチャタイプ別符号量I3,P3,B3を算出してもよい。IピクチャはP及びBピクチャよりも参照される頻度が高いため、P及びBピクチャと比べて画質を上げた方が全体の画質が向上すると一般に考えられる。従って、このようにピクチャタイプに応じて量子化パラメータを異ならせることは有効である。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。本実施形態では図1に示した動画像符号化装置において図9に示す適応型初期パラメータ決定処理S15を行う。図9においては、図7に示した第2の実施形態における適応型初期パラメータ処理S14に対してさらにステップS12の処理が追加されている。
すなわち、第3の実施形態では図1の初期パラメータ決定部7において、まず第2の実施形態と同様にターゲットビットレートBRに適した量子化パラメータQPを算出する(ステップS9)。次に、第2の実施形態と同様に当該QPでグローバルコンプレキシティメジャーの初期値を算出する(ステップS11)。この後、量子化パラメータQP1及びQP2とピクチャタイプ別符号量I1,I2,P1,P2,B1及びB2から、グローバルコンプレキシティメジャーの更新式における定数パラメータを決定する(ステップS12)。
第2の実施形態では、ピクチャタイプ別グローバルコンプレキシティメジャー、ピクチャタイプ別符号量及びピクチャタイプ別平均量子化パラメータの間に、式(6)に示した関係がある場合のモデル(MPEG2のTM5)について説明を行った。しかし、動画像符号化方式によってはモデルが異なる場合が考えられる。例えば、H.264では量子化パラメータQPが6増えると発生符号量が半分になるというモデルが用いられる。そこで、H.264のモデルに合うようにグローバルンプレキシティメジャーXi,Xp,Xbの更新式を書き直すと、以下のようになる。
Figure 2007089035
この場合、QP1,QP2,I1,I2,P1,P2,B1,B2の値から式(8)中のCI,CP,CBを以下のように算出する。
Figure 2007089035
I,CP,CBの値は、画像の解像度、量子化パラメータQPの値及び画像の時間的変化の大きさに応じて変わる傾向にある。従って、CI,CP,CBの値を対象動画像の最初のピクチャの性質に合わせて設定することによって、画像が変化しない限り画像の性質に適合したグローバルコンプレキシティメジャーの更新が行われるようになるため、画質が安定する。
(第4の実施形態)
図10は、本発明の第4の実施形態に係る動画像符号化装置であり、図1に対してシーン変化検出部11が追加されている。シーン変化検出部11は、例えば(a)対象動画像の現フレームと前フレームとの間の画素差分がある閾値より大きくなった状態、(b)対象画像が動いているシーンから静止画に変化した状態、及び(c)対象動画像が静止画から動き始めた状態、などを対象動画像のシーン変化として検出する。(a)に示されるような典型的なシーン変化だけでなく、(b)(c)のような動きの有無の変化もレート制御におけるパラメータの大きな変化となる。そこで、このようなシーン変化が起こったシーン(フレーム)においてパラメータを適応的に決定することによって、シーン変化による画質の劣化を防ぐ。適応的初期パラメータ決定部10では、シーン変化検出部11によって検出された全てのシーン変化に対応して、シーン変化の検出されたシーンに対して適応的初期パラメータを決定する。
本実施形態では図11に示される処理手順に従って、まずステップS16でシーン変化検出を行った後、シーン変化が検出されたシーンに対して、図3のS13、図7のS14または図9のS15に示した適応的初期パラメータ決定処理を行う。次に、シーン変化に対応して算出された初期パラメータをシーン変化毎の初期値として、レート制御を用いて符号化を行う(ステップS10)。具体的には、シーン変化検出部11で検出された少なくとも一つのシーンに対して、例えばターゲットビットレートBRに適した量子化パラメータQPを決定する。レート制御符号化部9では、検出されたシーンの符号化開始時に、決定された量子化パラメータQPを用いて符号化を行う。
シーン変化が検出されたシーンに対して量子化パラメータQPを決定して用いることに加えて、グローバルコンプレキシティメジャーの初期値、あるいは更にグローバルコンプレキシティメジャーの更新式に用いる定数パラメータの値を適応的初期パラメータ決定部10において決定してもよい。
シーン変化に応じた適応的初期パラメータの決定に際しては、シーン変化が生じた最初のフレームからnフレームについて解析を行う。例えば、リオーダリングディレイMが3の場合には、図12に示すようにシーン変化iが検出されたフレームから4フレーム、及びシーン変化i+1が検出されたフレームから4フレーム(図12の斜線で示すフレーム)について解析を行う。シーンi及びシーンi+1に対して、それぞれ適切な初期パラメータを決定する。また、図13に示すようにシーン変化i,i+1が検出されたフレームより数えてMフレーム目からM+1フレーム分をつまり、M=3の場合には3フレーム目から6フレーム目までの4フレームを適応的初期パラメータの設定のための解析に用いてもよい。
このように本実施形態によればシーン変化、すなわち(a)対象動画像のシーンが大きく変化する、(b)対象動画像が静止画から動きのある画像へ変化する、あるいは(c)対象動画像が動画から静止画へ変化する、などの変化が生じたときに画像の性質に合ったパラメータを設定することができる。これによって、シーン変化後の画質を安定させることが可能となる。
(第5の実施形態)
図14は、本発明の第5の実施形態に係る動画像符号化装置であり、図11に対してさらにシーン毎ターゲットビットレート決定部12が追加されている。本実施形態の処理手順では、図15に示すようにステップS16においてシーン変化検出部11で対象動画像のシーン変化を検出した後、シーン変化が検出されたシーンのターゲットビットレートBRsiをターゲットビットレート決定部12において決定する(ステップS17)。次に、適応的初期パラメータ決定部10では検出されたシーン変化に対してターゲットビットレートBRの代わりに、ステップS17で決定されたBRsiを入力して、図3のS13、図7のS14または図9のS15に示した適応的初期パラメータ決定処理を行う。この後、シーン変化に対応して決定された初期パラメータをシーン変化毎の初期値として、レート制御を用いて符号化を行う(ステップS10)。
ここで、ステップS17においてあるシーンsiにおけるターゲットビットレートBRsiを決定する方法は種々考えられる。最も簡単には、図16に示す手順を用いる。まず、ある一定の第4の量子化パラメータQP4を決定し(ステップS19)、QP4の下で各シーンsiのピクチャタイプ別符号量I4_si,P4_si及びB4_siを算出する(ステップS20)。ステップS16におけるQP4の決定方法は、第1の実施形態における第1の量子化パラメータQP1の決定方法と同様でよい。ステップS20におけるI4_si,P4_si,B4_siの算出方法も、第1の実施形態におけるI1,P1,B1の算出方法と同様でよい。
次に、シーンsiにおけるビットレートBR4_siを算出し、さらにシーンiにおけるターゲットビットレートBRsiを決定する(ステップS21)。このとき、シーンsiのフレーム数をFNUM_siとする。FNUM_siの総和は、以下のように対象動画像のフレーム数FNUMと一致するものとする。
Figure 2007089035
ステップS21において、シーンsiにおけるビットレートBR4_siはI_si,P_si,B_siの値から以下のように算出される。
Figure 2007089035
さらに、ステップS21においてシーンsiにおけるターゲットビットBRsiは、以下のように対象動画像全体でのビットレートとターゲットビットレートの比にBR4_siを乗じることで決定される。
Figure 2007089035
こうして決定されたシーンsiのターゲットビットレートBR_siをターゲットビットレートBRに代えて適応的初期パラメータ決定部10へ入力し、シーン変化のそれぞれに対して適応的初期パラメータ決定処理を行う(図15のステップS13,S14またはS15)。こうして得られたシーン変化のそれぞれに対する適応的初期パラメータを該当するシーン変化毎に設定した後、レート制御を用いた符号化を行う(図15のステップS10)。
(第6の実施形態)
図17に示される本発明の第6の実施形態に係る動画像符号化装置は、大きく分けて符号化部15とレート制御部28からなる。符号化部15はイントラ符号化部13、インター符号化部14及び符号化モード選択スイッチSW1を有する。スイッチSW1は、符号化モード選択のために、すなわちイントラ符号化部13の出力とインター符号化部14の出力を切り替えて、いずれかの出力から符号化部15の出力信号を取り出すために用いられる。
イントラ符号化部13及びインター符号化部14は、図2に示したレート制御符号化部のうちイントラ符号化の機能及びインター符号化の機能にそれぞれ関わる部分を包括的に表している。例えば、イントラ符号化部13は図2においてイントラ予測器206により生成されるイントラ予測信号106を用いて符号化を行う機能を有する部分を表す。同様に、インター符号化部14はインター予測器208により生成されるインター予測信号109を用いて符号化を行う機能を有する部分を表す。図2においてイントラ予測器206、ブロッキングフィルタ207及びインター予測器208以外の要素は、イントラ符号化部13及びインター符号化部14で共通である。
レート制御部28は、符号量割り当て部19、仮想バッファ占有量更新部20、量子化パラメータ決定部21、スライス毎イントラビット量算出部24、スライス毎発生ビット量算出部25、イントラスライス用画像複雑度指標更新部26、インタースライス用画像複雑度指標更新部27、スイッチSW4及びSW5を有する。スイッチSW4は、スライス毎イントラビット量算出部24の出力とスライス毎発生ビット量算出部25の出力を切り替えてイントラスライス用画像複雑度指標更新部26に入力するために用いられる。スイッチSW5は、スライス毎イントラビット量算出部24の出力とインタースライス用画像複雑度指標更新部27の入力との間をスイッチングするために用いられる。
図18A〜図18Bを用いて処理の流れについて説明する。ステップS22でスライス単位の符号化が開始すると、入力動画像信号を符号化部15の中のイントラ符号化部13及びインター符号化部14に入力して、ある符号化単位でイントラ符号化及びインター符号化を行う(ステップS23〜S24)。イントラ符号化及びインター符号化の符号化単位は入力動画像信号の一部分であり、例えば図19の斜線部に示される縦16×横16の256画素の単位、あるいは図20の斜線部に示される縦16画素の画面右端から画面左端までの単位とされる。このように符号化単位や符号化順序は種々と考えられるが、それは本実施形態では特に限定されない。
符号化に用いる量子化パラメータは、量子化パラメータ決定部21で決定される。すなわち、量子化パラメータは、符号化開始時点からの発生符号量が目標値より多い場合には次の符号化時に発生符号量が少なくなるように、逆の場合には発生符号量が多くなるようにフィードバック制御によって決定される。このように1つまたはそれ以上の符号化単位毎に符号量の割り当てを行い、その割り当てと実際の発生符号量との差を小さくするように量子化パラメータは決定される。
符号量の割り当て単位は、先に述べた符号化単位とは別に設定される。ここでは符号量割り当て単位をスライスと呼ぶことにする。スライス全体についてイントラ符号化が行われるスライスをイントラスライスと呼び、スライス全体についてインター符号化が行われるスライスをインタースライスと呼ぶことにする。
インタースライスの符号化時には、符号化部15において符号化単位の符号化モードをイントラ符号化モードとインター符号化モードから選択する(ステップS25)。ステップS25でイントラ符号化モードが選択されたかどうかを調べる(ステップS26)。イントラ符号化モードが選択された場合には、図21に示すようにスイッチSW1をイントラ符号化部13の出力に接続する(ステップS27)。インター符号化モードが選択された場合には、図22に示すようにスイッチSW1をインター符号化部14の出力に接続する(ステップS28)。
ステップS27では、図21に示すようにイントラ符号化結果が符号化部15から出力信号として取り出されると共に、イントラ符号化時の符号化単位の発生符号量の情報がスライス毎イントラビット量算出部24、スライス毎発生ビット量算出部25及び仮想バッファ占有量更新部20に入力される。ステップS28では、図22に示すようにインター符号化結果が符号化部15から出力信号として取り出されると共に、インター符号化時の符号化単位の発生符号量の情報がスライス毎発生ビット量算出部25及び仮想バッファ占有量更新部20に入力される。
次に、仮想バッファ占有量更新部20において、符号量割り当て部19によって現スライスに割り当てられている符号量と符号化部15からの符号化単位の発生符号量の情報に従って仮想バッファ占有量を更新する(ステップS29)。ステップS29で更新された仮想バッファ占有量の値から、符号化部15で次に符号化すべき符号化単位に対応する量子化パラメータを決定する(ステップS30)。ステップS29及びS30の処理については、後に補足する。上述したステップS23〜S30の処理を対象動画像のスライス内の全ての符号化単位について行う。
次に、スライス毎発生ビット量算出部25において符号化部15からのイントラ符号化時及びインター符号化時の符号化単位の発生符号量の情報を受け、スライス内の全ての符号化単位の発生符号量を加算することにより、スライス毎発生ビット量(スライス毎の発生符号量)を算出する(ステップS31)。さらに、スライス毎イントラビット量算出部24において符号化部15からのイントラ符号化時の符号化単位の発生符号量の情報に基づいて、スライス内の全てのイントラ符号化時の符号化単位の発生符号量を加算(合算)することにより、スライス毎イントラビット量(スライス毎のイントラ符号化時の発生符号量)を算出する(ステップS32)。
次に、現スライスがイントラスライスかインタースライスかどうかを判断する(ステップS33)。ステップS33の判断の結果、現スライスがインタースライスである場合には図23に示すように、スライス毎イントラビット量算出部24の出力がイントラスライス用画像複雑度指標更新部26へ入力されるようにスイッチSW4を設定すると共に、スライス毎発生ビット量算出部25の出力がインタースライス用画像複雑度指標更新部27へ入力されるようにスイッチSW5を設定する(ステップS34)。イントラスライス用画像複雑度指標更新部26は、スライス毎イントラビット量算出部24により算出されたスライス毎イントラビット量に従ってイントラスライス用画像複雑度指標を更新する。インタースライス用画像複雑度指標更新部27は、スライス毎発生ビット量算出部25により算出されたスライス毎発生ビット量に従ってインタースライス用画像複雑度指標を更新する。
インタースライスとしては、1つの参照フレームから動き補償予測を行うPスライスと、2つの参照フレームから動き補償予測を行うBスライスがあるが、ここではこれらPスライスとBスライスを区別せずにインタースライスと称する。しかし、インタースライス用画像複雑度指標更新部27においてBスライス及びPスライスのそれぞれの画像複雑度指標を個別に更新してもよい。この場合、符号量割り当て部19においては、Bスライス及びPスライスのそれぞれの画像複雑度指標を利用してBスライス毎及びPスライス毎に符号量割り当てを行う。インタースライスについて予測残差の分散値の大きさに応じたグループ分けを行い、それらのグループ毎に画像複雑度指標の保持、更新及び参照を行うというように、複数の画像複雑度指標を管理する場合も考えられる。このように本実施形態におけるインタースライス用画像複雑度指標の利用法は、特定の方法に限定されない。
一方、ステップS33の判断の結果、現スライスがイントラスライスである場合には図24に示すように、スライス毎発生ビット量算出部25の出力がイントラスライス用画像複雑度指標更新部26へ入力されるようにスイッチSW4を設定する(ステップS35)。イントラスライス用画像複雑度指標更新部26は、スライス毎発生ビット量算出部25により算出されたスライス毎発生ビット量に従ってイントラスライス用画像複雑度指標を更新する。このとき、スライス毎発生ビット量算出部25の出力はインタースライス用画像複雑度指標更新部27へは入力されないようにスイッチSW5を設定する。従って、インタースライス用画像複雑度指標の更新は行われない。
ここで、インタースライス用及びイントラスライス用画像複雑度指標の更新に関しては、レート制御方式で用いられるモデルに合わせて行えばよく、更新のためのモデルは特に限定されない。例えば、MPEG−2で採用されているTM5においては、ピクチャタイプ毎に[画像複雑度指標=発生符号量×量子化パラメータ]という関係式を用いて画面複雑度指標の更新をIピクチャ、Pピクチャ及びBピクチャのそれぞれにおいて行う。図17、図21〜図24では、インタースライス用画像複雑度指標更新部27は一つの要素であるように表されているが、発生符号量と量子化パラメータとの関係が異なるピクチャタイプ毎に画面複雑度指標の更新を個別に行う機能を含むものとする。
次に、符号量割り当て部19において、次に符号化すべきスライスに割り当てる符号量を決定する(ステップS36)。この場合、イントラスライス用画像複雑度指標更新部26及びインタースライス用画像複雑度指標更新部27で更新された画像複雑度指標を用いる。例えば、イントラスライス用画像複雑度指標に対してインタースライス用符号化ピクチャ用画像複雑度指標が大きければ、インター符号化ピクチャにより多くの符号量を割り当て、逆であればイントラ符号化ピクチャにより多くの符号量を割り当てる。
例えばMPEG−2で用いられるTM5においては、Iピクチャ、Pピクチャ及びBピクチャにそれぞれ割り当てる符号量TI,TP及びTBを以下のように算出する。
Figure 2007089035
ここで、XI,XP及びXBはそれぞれIピクチャ用、Pピクチャ用及びBピクチャ用の画像複雑度指標、NP及びNBはそれぞれ次のIピクチャまでの残りのPピクチャ数及びBピクチャ数、Rは次のIピクチャまでの割り当て符号量を表す。KP及びKBはそれぞれ量子化に依存する恒常的な定数を表し、例えばKP=1.0, KB=1.4 とされる。
仮想バッファ占有量更新部20においては、符号量割り当て部19によって割り当てられた符号量と発生ビット量との差分を仮想バッファ占有量として累積することにより、仮想バッファ占有量の更新を行う。この処理は図18AのステップS29に示される。符号化済みピクチャに関して累積した差分は、正の値であれば割り当て分を超えてビットを発生していることを示す。
次に、量子化パラメータ決定部21において、更新された仮想バッファ占有量を入力して量子化パラメータを決定する。すなわち、仮想バッファ占有量が大きくなった場合には、次のピクチャの発生符号量を減らすように量子化パラメータを大きくする。一方、仮想バッファ占有量が小さい場合には、次のピクチャの発生符号量を増やすように量子化パラメータを小さくする。この処理は図18AのステップS30に示される。このようにして決定した量子化パラメータを次の符号化単位の符号化時に用いる。この結果、対象動画像のシーケンス全体の発生符号量が目標符号量に近づくようにレート制御が行われる。
ここで、符号量割り当てを行うスライス単位と、仮想バッファ占有量の更新を行い、それをフィードバックして量子化パラメータを変更する単位は、同じ場合と異なる場合が考えられる。符号量割り当てを行う単位とフィードバック制御により量子化パラメータを変更する単位が異なる場合、例えば(a1)ピクチャ単位で符号量割り当てを行い(この場合、上の説明におけるスライスがピクチャとなる)、(a2)ピクチャ中のマクロブロック(図19中の一つの四画で示してある16画素×16画素)毎に符号化を行い、(a3)仮想バッファ占有量をマクロブロック毎に更新し、(a4)マクロブロック毎に量子化パラメータの決定を行う、ことが考えられる。この場合の処理フローは図18A〜18Bでよい。また、(b1)図20の一列(斜線部またはそれ以外の部分)単位に符号量割り当てを行い(この場合、スライスはこの一列となる)、(b2)各列のマクロブロック毎に符号化を行い、(b3)仮想バッファ占有量をマクロブロック毎に更新し、(b4)マクロブロック毎に量子化パラメータの決定を行う、ことも考えられる。さらに、(c1)ピクチャ単位で符号量割り当てを行い、(c2)マクロブロック毎に符号化を行い、(c3)仮想バッファ占有量の更新を図20の一列単位に行い、(c4)量子化パラメータの決定を一列単位に行う、ことも考えられる。
一方、符号量割り当てを行う単位とフィードバック制御により量子化パラメータを変更する単位が同じ場合は、(d1)ピクチャ単位で符号量割り当てを行い、(d2)マクロブロック単位で符号化を行い、(d3)ピクチャ単位で仮想バッファの占有量の更新及び(d4)量子化パラメータの決定を行う、ことが考えられる。この場合の処理フローは図25A〜25Bとなる。図18A〜18Bと図25A〜25Bとでは、仮想バッファ占有量の更新ステップS29及び量子化パラメータの決定ステップS30の位置が異なるが、本発明はこれらの位置に依存するものではなく、どのような場合でも適用可能である。符号量割り当てを行う単位及びフィードバックによる量子化パラメータの変更を行う単位については、任意に変更することが可能である。
本実施形態によると、イントラスライス用画像複雑度指標の更新がスライス毎に行われるため、更新頻度が高くなる。従って、イントラスライス用画像複雑度指標の最適値からの乖離が小さい。従来では、イントラスライス用画像複雑度指標をイントラスライス符号化モードのときのみ更新している。このため更新前後のイントラスライス用画像の性質が大きく異なる場合に更新の精度が悪くなり、画質に劣化が見られる場合がある。これに対して、本実施形態によればイントラスライス用画像複雑度指標をインタースライス時にも更新するため、更新前後のイントラスライス用画像の性質の変化が小さくなる。従って更新精度が向上し、画質の劣化が小さくなる。
図17における符号化部15においては、スイッチSW1によってマクロブロック毎に最適な符号化モードを選択する。本発明の第6の実施形態の変形例では、スイッチSW1が最適な符号化モードを選択する際に、以下のようにしてレート制御を行う。イントラスライス毎ビット量算出部24は、イントラ符号化部13が入力動画像信号に対してイントラ符号化を行ったときのマクロブロック当たりの発生符号量を求めてそれらを合算することにより、イントラスライス単位の発生符号量を算出する。イントラスライス用画像複雑度指標更新部26は、この合算されたイントラスライス単位の発生符号量に基づいてイントラスライス用画像複雑度指標の更新を行い、これに基づいて符号化部15はレート制御を行う。
(第7の実施形態)
第6の実施形態においては、イントラ符号化部13は図26に示されるようにイントラ予測/DCT/量子化ユニット31と、量子化されたDCT係数(直交変換係数)を符号化するエントロピー符号化部32により構成される。これに対し、本発明の第7の実施形態に係る動画像符号化装置では、イントラ符号化部13は図27に示されるようにイントラ予測/DCT/量子化ユニット31と、量子化されたDCT係数から発生符号量を見積もる符号量見積もり部33を有し、エントロピー符号化部32を含まない。
第7の実施形態の変形例として、図28に示されるようにイントラ符号化部13にはイントラ予測/DCT/量子化ユニット31のみを置き、図29に示されるようにスライス毎イントラビット量算出部25の前に符号量見積もり部34を配置してもよい。この場合も、イントラ符号化部13にはエントロピー符号化部32を含まない。
符号量見積もり部33及び34は、符号化単位当たりの発生符号量を見積もり、スライス毎イントラビット量算出部25は、見積もられた符号化単位当たりの発生符号量を合算してスライス単位の発生符号量を算出する。
第1の実施形態で述べたように、エントロピー符号化結果より発生符号量を調べる他にも、符号化の途中段階であるDCT変換により得られるDCT係数を量子化した際のゼロ係数の個数から、発生符号量を推定する方法も報告されている(たとえば前述の「参考文献2」)。これを用いて発生符号量の見積もりを行い、それをスライス毎イントラビット量算出部24へ入力してイントラスライス用画像複雑度指標の更新に用いるという変形例も考えられる。この変形例では、イントラ符号化部13からスライス毎イントラビット量算出の過程で発生符号量の推定を行う部分を除いて第6の実施形態と同様でよい。
以上説明した本発明の実施形態に基づく動画像符号化処理は、ハードウェアでも実現可能であるが、パーソナルコンピュータのようなコンピュータを用いてソフトウェアにより実行することも可能である。従って、本発明によれば以下に挙げるようなプログラム、あるいは当該プログラムを格納したコンピュータ読み取り可能な記憶媒体を提供することができる。
(1)符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプを用いて対象動画像を符号化する処理をコンピュータに行わせるプログラムであって、第1量子化パラメータを用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第1符号量情報を求める処理と、前記第1符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて第1ビットレートを求める処理と、前記第1量子化パラメータとは異なる第2量子化パラメータを用いて前記n枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第2符号量情報を求める処理と、前記第2符号量情報から求まるピクチャ単位の第2平均発生符号量に設定フレームレートを乗じて第2ビットレートを求める処理と、前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよびターゲットビットレートを用いて第3量子化パラメータを求める処理と、前記第3量子化パラメータを初期値として用いて前記レート制御を行う処理とを含む動画像符号化処理を前記コンピュータに行わせるプログラム、あるいは当該プログラムを格納したコンピュータ読み取り可能な記憶媒体。
(2)符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ対象動画像を符号化する、インター符号化モードとイントラ符号化モードを有する動画像符号化処理をコンピュータに行わせるプログラムであって、前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の発生符号量を算出する処理と、前記発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新する処理と、前記画像複雑度指標を用いて前記レート制御を行う処理とを含む動画像符号化処理を前記コンピュータに行わせるプログラム、あるいは当該プログラムを格納したコンピュータ読み取り可能な記憶媒体。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の第1の実施形態に係る動画像符号化装置のブロック図 図1中のレート制御可能な符号化部の詳細なブロック図 本発明の第1の実施形態における初期パラメータ設定手順を示すフローチャート グループ・オブ・ピクチャ(GOP)の一例を示す図 対象動画像シーケンスとピクチャタイプ別符号量の計算に用いるn枚のピクチャの位置について説明する図 対象動画像シーケンスとピクチャタイプ別符号量の計算に用いるn枚のピクチャの他の位置について説明する図 本発明の第2の実施形態における初期パラメータ設定手順を示すフローチャート 図7中のグローバルコンプレキシティメジャーの初期値算出ステップの詳細を示すフローチャート 本発明の第3の実施形態における初期パラメータ設定手順を示すフローチャート 本発明の第4の実施形態に係る動画像符号化装置のブロック図 第4の実施形態における初期パラメータ設定手順を示すフローチャート 第4の実施形態におけるシーン変化が検出されたフレームと初期パラメータの設定に用いるフレームとの関係について説明する図 第4の実施形態におけるシーン変化が検出されたフレームと初期パラメータの設定に用いるフレームとの関係について説明する図 本発明の第5の実施形態に係る動画像符号化装置のブロック図 第5の実施形態における初期パラメータ設定手順を示すフローチャート 図15中のシーン毎ターゲットビットレートの決定ステップの詳細を示すフローチャート 本発明の第6の実施形態に係る動画像符号化装置のブロック図 第6の実施形態における処理手順を示すフローチャート 第6の実施形態における処理手順を示すフローチャート 第6の実施形態における符号化単位の一例について説明する図 第6の実施形態における符号化単位の他の例について説明する図 第6の実施形態において符号化単位の符号化時にイントラ符号化が選ばれた場合の結線図 第6の実施形態において符号化単位の符号化時にインター符号化が選ばれた場合の結線図 第6の実施形態におけるイントラスライスの符号化時の結線図 第6の実施形態におけるインタースライスの符号化時の結線図 第6の実施形態においてピクチャ単位で符号量割り当てを行い、マクロブロック単位で符号化を行い、仮想バッファの占有量の更新及び量子化パラメータの決定をピクチャ単位に行う場合の処理手順を示すフローチャート 第6の実施形態においてピクチャ単位で符号量割り当てを行い、マクロブロック単位で符号化を行い、仮想バッファの占有量の更新及び量子化パラメータの決定をピクチャ単位に行う場合の処理手順を示すフローチャート 第6の実施形態に係る動画像符号化装置におけるイントラ符号化部の詳細を示すブロック図 本発明の第7の実施形態に係る動画像符号化装置におけるイントラ符号化部の詳細を示すブロック図 本発明の第7の実施形態の変形例に係る動画像符号化装置におけるイントラ符号化部の詳細を示すブロック図 本発明の第7の実施形態の変形例に係る動画像符号化装置のブロック図
符号の説明
1・・・ターゲットビットレート入力部;
2・・・フレーム/リオーダリングディ例/GOP入力部;
3・・・適応型初期パラメータ設定部;
4・・・第1の量子化パラメータ決定部;
5・・・ピクチャタイプ別符号量算出部(第1及び第2ピクチャタイプ別符号量算出部);
6・・・仮ビットレート算出部(第1及び第2のビットレート算出部);
7・・・初期パラメータ決定部;
8・・・第2の量子化パラメータ決定部;
9・・・レート制御符号化部;
11・・・シーン変化検出部;
12・・・シーン毎ターゲットビットレート決定部;
13・・・イントラ符号化部;
14・・・インター符号化部;
15・・・符号化部;
SW1・・・符号化モード選択スイッチ;
19・・・符号量割り当て部
20・・・仮想バッファ占有量更新部;
21・・・量子化パラメータ決定部;
24・・・スライス毎イントラビット量算出部;
25・・・スライス毎発生ビット量算出部;
26・・・イントラスライス用画像複雑度指標更新部;
27・・・インタースライス用画像複雑度指標更新部;
28・・・レート制御部;
33,34・・・符号量見積もり部

Claims (18)

  1. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプを用いて対象動画像を符号化する動画像符号化方法であって、
    第1量子化パラメータを用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第1符号量情報を求めるステップと、
    前記第1符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて第1ビットレートを求めるステップと、
    前記第1量子化パラメータとは異なる第2量子化パラメータを用いて前記n枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第2符号量情報を求めるステップと、
    前記第2符号量情報から求まるピクチャ単位の第2平均発生符号量に設定フレームレートを乗じて第2ビットレートを求めるステップと、
    前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよびターゲットビットレートを用いて第3量子化パラメータを求めるステップと、
    前記第3量子化パラメータを初期値として用いて前記レート制御を行うステップとを具備する動画像符号化方法。
  2. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプを用いて対象動画像を符号化する動画像符号化装置であって、
    第1量子化パラメータを用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第1符号量情報を算出する第1符号量情報算出部と、
    前記第1符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて第1ビットレートを算出する第1ビットレート算出部と、
    前記第1量子化パラメータとは異なる第2量子化パラメータを用いて前記n枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第2符号量情報を算出する第2符号量情報算出部と、
    前記第2符号量情報から求まるピクチャ単位の第2平均発生符号量に設定フレームレートを乗じて第2ビットレートを算出する第2ビットレート算出部と、
    前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよび前記ターゲットビットレートを用いて第3量子化パラメータを算出する第3量子化パラメータ算出部と、
    前記第3量子化パラメータを初期値として用いて前記レート制御を行いつつ符号化を行う符号化部とを具備する動画像符号化装置。
  3. 前記第3量子化パラメータ算出部は、前記第3量子化パラメータを次式により算出する請求項2記載の動画像符号化装置。
    Figure 2007089035
    ここで、QP1は前記第1量子化パラメータ、QP2は前記第2量子化パラメータ、QPは前記第3量子化パラメータ、BR1は前記第1ビットレート、BR2は前記第2ビットレート、BRは前記ターゲットビットレートをそれぞれ表す。
  4. 前記動画像符号化装置は複数のピクチャタイプを用いて前記対象動画像を符号化し、
    前記第1および前記第2符号量情報算出部は、n枚のピクチャ(n≧2)を符号化したときのピクチャ単位の発生符号量を求め、
    前記動画像符号化装置は、前記第3量子化パラメータを用いて前記n枚のピクチャを符号化したときのピクチャタイプ毎の発生符号量を示す第3符号量情報を算出する第3符号量情報算出部と、前記第3符号量情報の比率に応じてピクチャタイプ別画像複雑度指標を算出するピクチャタイプ別画像複雑度指標算出部とをさらに具備し、
    前記符号化部は前記ピクチャタイプ別画像複雑度指標を初期値として用いてレート制御を行う手段をさらに含む請求項2記載の動画像符号化装置。
  5. 前記ピクチャタイプ別画像複雑度指標を予め定められた、定数パラメータを有する更新式に従って更新する更新部と、
    前記第1符号量情報、第1量子化パラメータ、第2符号量情報及び第2量子化パラメータから前記定数パラメータをピクチャタイプ毎に算出する定数パラメータ算出部とをさらに具備する請求項4記載の動画像符号化装置。
  6. 前記更新式は次式であり、
    Figure 2007089035
    ここで、Xi,Xp及びXbはIピクチャ、Pピクチャ及びBピクチャのピクチャタイプ別画像複雑度指標、Si,Sp及びSbはIピクチャ、Pピクチャ及びBピクチャのピクチャタイプ別発生符号量、CI,CP,CBは前記定数パラメータをそれぞれ表し、
    前記定数パラメータCI,CP,CBは次式により算出される請求項5記載の動画像符号化装置。
    Figure 2007089035
    ここで、QP1は前記第1量子化パラメータ、QP2は前記第2量子化パラメータ、I1,P1及びB1はそれぞれIピクチャ、Pピクチャ及びBピクチャの第1ピクチャタイプ別符号量、I2,P2及びB2はそれぞれIピクチャ、Pピクチャ及びBピクチャの第2ピクチャタイプ別符号量をそれぞれ表す。
  7. 前記第3量子化パラメータ算出部は、前記対象動画像のシーンチェンジ毎に前記第3量子化パラメータを求める請求項2記載の動画像符号化装置。
  8. 前記ピクチャタイプ別画像複雑度指標算出部は、前記対象画像のシーンチェンジ毎に前記ピクチャタイプ別画像複雑度指標を求める請求項4記載の動画像符号化装置。
  9. 前記定数パラメータ算出部は、前記対象動画像のシーンチェンジ毎に前記定数パラメータを求めるステップを含む請求項5記載の動画像符号化装置。
  10. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ対象動画像を符号化する、インター符号化モードとイントラ符号化モードを有する動画像符号化方法であって、
    前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の発生符号量を算出するステップと、
    前記発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新するステップと、
    前記画像複雑度指標を用いて前記レート制御を行うステップとを具備する動画像符号化方法。
  11. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ対象動画像を符号化する、インター符号化モードとイントラ符号化モードを有する動画像符号化装置であって、
    前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の発生符号量を算出する符号量算出部と、
    前記発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新する更新部と、
    前記画像複雑度指標を用いて前記レート制御を行いつつ符号化を行う符号化部とを具備する動画像符号化装置。
  12. 前記符号化部が前記画像複雑度指標を用いて前記レート制御を行いつつ符号化を行う際に、前記対象動画像のマクロブロック単位毎に前記インター符号化モードとイントラ符号化モードのうち最適な符号化モードを選択する選択部をさらに具備し、前記符号量算出部は前記選択部が前記最適な符号化モードを選択する際に、前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の前記マクロブロック単位当たりの発生符号量を合算し、前記画像複雑度指標更新部は合算された発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新する請求項11記載の動画像符号化装置。
  13. 前記符号化部が前記画像複雑度指標を用いて前記レート制御を行いつつ符号化を行う際に、前記対象動画像のマクロブロック単位毎に前記インター符号化モードとイントラ符号化モードのうち最適な符号化モードを選択する選択部と、前記選択部が前記最適な符号化モードを選択する際に、前記対象動画像をイントラ符号化モードにより符号化した場合の前記マクロブロック単位当たりの発生符号量を見積もる符号量見積もり部とをさらに具備し、前記符号量算出部は見積もられた前記マクロブロック単位当たりの発生符号量を合算し、前記画像複雑度指標更新部は合算された発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新する請求項11記載の動画像符号化装置。
  14. 前記符号化部は直交変換係数を量子化する量子化部を含み、前記見積もり部は前記直交変換係数を用いて前記符号化単位当たりの発生符号量を見積もりかつ合算する請求項13記載の動画像符号化装置。
  15. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプを用いて対象動画像を符号化する処理をコンピュータに行わせるプログラムであって、
    第1量子化パラメータを用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第1符号量情報を求める処理と、
    前記第1符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて第1ビットレートを求める処理と、
    前記第1量子化パラメータとは異なる第2量子化パラメータを用いて前記n枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す第2符号量情報を求める処理と、
    前記第2符号量情報から求まるピクチャ単位の第2平均発生符号量に設定フレームレートを乗じて第2ビットレートを求める処理と、
    前記第1ビットレート、第1量子化パラメータ、第2ビットレート、第2量子化パラメータおよびターゲットビットレートを用いて第3量子化パラメータを求める処理と、
    前記第3量子化パラメータを初期値として用いて前記レート制御を行う処理とを含む動画像符号化処理を前記コンピュータに行わせるプログラム。
  16. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ対象動画像を符号化する、インター符号化モードとイントラ符号化モードを有する動画像符号化処理をコンピュータに行わせるプログラムであって、
    前記対象動画像の符号化対象ピクチャをイントラ符号化モードにより符号化した場合の発生符号量を算出する処理と、
    前記発生符号量を用いて前記イントラ符号化モードに関わる画像複雑度指標を更新する処理と、
    前記画像複雑度指標を用いて前記レート制御を行う処理とを含む動画像符号化処理を前記コンピュータに行わせるプログラム。
  17. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプのピクチャを有する対象動画像を符号化する動画像符号化方法であって、
    複数の異なる値の仮量子化パラメータの各々を用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す符号量情報を、前記仮量子化パラメータの各々に関して求めるステップと、
    前記仮量子化パラメータの各々に関する前記符号量情報から求まるピクチャ単位の第1平均発生符号量に設定フレームレートを乗じて、前記仮量子化パラメータの各々に関する仮ビットレートを求めるステップと、
    前記仮量子化パラメータ、前記仮量子化パラメータの各々に関する前記仮ビットレート、および、ターゲットビットレートを用いて、量子化パラメータの初期パラメータを求めるステップと、
    前記初期パラメータを用いて前記レート制御を行うステップとを具備する動画像符号化方法。
  18. 符号化データのビットレートがターゲットビットレートに近づくようにレート制御を行いつつ一つ以上のピクチャタイプのピクチャを有する対象動画像を符号化する動画像符号化装置であって、
    複数の異なる値の仮量子化パラメータの各々を用いて前記対象動画像に含まれるn枚のピクチャを符号化したときの、符号化に用いられるピクチャタイプ毎の発生符号量を示す符号量情報を、前記仮量子化パラメータの各々に関して求める符号量情報算出部と、
    前記仮量子化パラメータの各々に関する前記符号量情報から求まるピクチャ単位の平均発生符号量に設定フレームレートを乗じて、前記仮量子化パラメータの各々に関する仮ビットレートを求める仮ビットレート算出部と、
    前記仮量子化パラメータ、前記仮量子化パラメータの各々に関する前記仮ビットレート、および、ターゲットビットレートを用いて、量子化パラメータの初期パラメータを求める初期値算出部と、
    前記初期パラメータを用いた前記レート制御の下で符号化を行う符号化部と、
    を具備する動画像符号化方法。
JP2005278044A 2005-09-26 2005-09-26 動画像符号化方法、装置及びプログラム Abandoned JP2007089035A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005278044A JP2007089035A (ja) 2005-09-26 2005-09-26 動画像符号化方法、装置及びプログラム
US11/384,367 US20070071094A1 (en) 2005-09-26 2006-03-21 Video encoding method, apparatus, and program
CNA2006100887612A CN1941915A (zh) 2005-09-26 2006-06-05 视频编码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005278044A JP2007089035A (ja) 2005-09-26 2005-09-26 動画像符号化方法、装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2007089035A true JP2007089035A (ja) 2007-04-05

Family

ID=37893905

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005278044A Abandoned JP2007089035A (ja) 2005-09-26 2005-09-26 動画像符号化方法、装置及びプログラム

Country Status (3)

Country Link
US (1) US20070071094A1 (ja)
JP (1) JP2007089035A (ja)
CN (1) CN1941915A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105376568A (zh) * 2015-12-22 2016-03-02 广州通达汽车电气股份有限公司 一种abr视频编码码率控制的优化方法
JP2017527194A (ja) * 2014-08-08 2017-09-14 クアルコム,インコーポレイテッド マルチモードビデオコーディングのための空間予測モードによるビデオコーディングのための方法
CN113676730A (zh) * 2021-08-12 2021-11-19 北京百度网讯科技有限公司 视频编码方法、装置、电子设备和存储介质
JP2022504772A (ja) * 2018-10-31 2022-01-13 エーティーアイ・テクノロジーズ・ユーエルシー 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法
US11597878B2 (en) 2018-12-20 2023-03-07 Nichia Corporation Method for producing rare earth aluminate fluorescent material, rare earth aluminate fluorescent material, and light emitting device

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006123606A1 (ja) * 2005-05-16 2006-11-23 Pioneer Corporation レート変換器
JP4973871B2 (ja) * 2005-10-14 2012-07-11 日本電気株式会社 画像符号化方法及び、これを用いた装置とコンピュータプログラム
CN101632308B (zh) * 2007-03-14 2011-08-03 日本电信电话株式会社 编码比特率控制方法和装置
CN101682775B (zh) * 2007-03-14 2015-04-01 日本电信电话株式会社 运动矢量搜索方法和装置
ES2676119T3 (es) * 2007-03-14 2018-07-16 Nippon Telegraph And Telephone Corporation Método de control de cuantificación, dispositivo, programa y medio de grabación que contiene el programa
WO2008111511A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 符号量推定方法、装置、そのプログラムおよび記録媒体
WO2008147565A2 (en) * 2007-05-25 2008-12-04 Arc International, Plc Adaptive video encoding apparatus and methods
US8290037B2 (en) * 2007-06-28 2012-10-16 Polytechnic Institute Of New York University Feedback assisted transmission of multiple description, forward error correction coded, streams in a peer-to-peer video system
JP4569840B2 (ja) * 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
CN101127909B (zh) * 2007-09-29 2010-07-07 华为技术有限公司 一种图像码率控制方法及装置
US8665948B2 (en) * 2007-11-23 2014-03-04 Stmicroelectronics International N.V. Adaptive rate control to cover multiple encoding standards
WO2009069316A1 (ja) * 2007-11-28 2009-06-04 Panasonic Corporation 画像符号化方法および画像符号化装置
JPWO2009157581A1 (ja) * 2008-06-27 2011-12-15 ソニー株式会社 画像処理装置及び画像処理方法
JP5472106B2 (ja) * 2008-06-27 2014-04-16 ソニー株式会社 画像処理装置及び画像処理方法
CN101827263B (zh) * 2009-03-03 2011-11-16 展讯通信(上海)有限公司 可视电话视频编码的流量控制方法及移动终端
JP5641755B2 (ja) * 2010-03-25 2014-12-17 キヤノン株式会社 符号化装置、符号化装置の制御方法、プログラム
CN102316313B (zh) * 2010-06-29 2013-08-28 凌阳科技股份有限公司 嵌入式实时视频压缩系统中的低复杂度的比特率控制方法
US8483272B2 (en) * 2010-09-24 2013-07-09 Intel Corporation System and method for frame level bit rate control without pre-analysis
JP2012124653A (ja) * 2010-12-07 2012-06-28 Canon Inc 符号化装置、符号化方法およびプログラム
JP2012178818A (ja) * 2011-01-31 2012-09-13 Panasonic Corp 映像符号化装置および映像符号化方法
KR20130049523A (ko) 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 장치
KR20130049526A (ko) * 2011-11-04 2013-05-14 오수미 복원 블록 생성 방법
KR20130050404A (ko) 2011-11-07 2013-05-16 오수미 인터 모드에서의 복원 블록 생성 방법
JP6080375B2 (ja) * 2011-11-07 2017-02-15 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20130142249A1 (en) * 2011-12-06 2013-06-06 Advanced Micro Devices, Inc. Method and apparatus for performing video and image compression using a video encoder
JP5847199B2 (ja) * 2012-01-11 2016-01-20 日立マクセル株式会社 符号化動画像の生成方法、画像符号化方法および画像符号化装置
US9451250B2 (en) * 2012-10-03 2016-09-20 Broadcom Corporation Bounded rate compression with rate control for slices
US9363517B2 (en) 2013-02-28 2016-06-07 Broadcom Corporation Indexed color history in image coding
US9538190B2 (en) * 2013-04-08 2017-01-03 Qualcomm Incorporated Intra rate control for video encoding based on sum of absolute transformed difference
CN104754361B (zh) * 2013-12-28 2018-01-23 同济大学 图像编码、解码方法及装置
US10397574B2 (en) * 2014-05-12 2019-08-27 Intel Corporation Video coding quantization parameter determination suitable for video conferencing
US10419760B2 (en) * 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
US10165272B2 (en) * 2015-01-29 2018-12-25 Arris Enterprises Llc Picture-level QP rate control performance improvements for HEVC encoding
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
EP3513563A4 (en) * 2016-10-18 2019-07-24 Zhejiang Dahua Technology Co., Ltd METHODS AND SYSTEMS FOR VIDEO PROCESSING
US10979747B2 (en) 2017-12-21 2021-04-13 Arris Enterprises Llc Statistical multiplexing system for variable bit rate encoding with constant bit rate encoder
CN118368423B (zh) * 2024-06-19 2024-10-15 摩尔线程智能科技(北京)有限责任公司 一种视频编码方法及视频编码器、电子设备和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017527194A (ja) * 2014-08-08 2017-09-14 クアルコム,インコーポレイテッド マルチモードビデオコーディングのための空間予測モードによるビデオコーディングのための方法
CN105376568A (zh) * 2015-12-22 2016-03-02 广州通达汽车电气股份有限公司 一种abr视频编码码率控制的优化方法
CN105376568B (zh) * 2015-12-22 2018-11-06 广州通达汽车电气股份有限公司 一种abr视频编码码率控制的优化方法
JP2022504772A (ja) * 2018-10-31 2022-01-13 エーティーアイ・テクノロジーズ・ユーエルシー 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法
JP7265622B2 (ja) 2018-10-31 2023-04-26 エーティーアイ・テクノロジーズ・ユーエルシー 低遅延ビデオ符号化のための効率的な量子化パラメータ予測方法
US11597878B2 (en) 2018-12-20 2023-03-07 Nichia Corporation Method for producing rare earth aluminate fluorescent material, rare earth aluminate fluorescent material, and light emitting device
CN113676730A (zh) * 2021-08-12 2021-11-19 北京百度网讯科技有限公司 视频编码方法、装置、电子设备和存储介质
CN113676730B (zh) * 2021-08-12 2022-12-02 北京百度网讯科技有限公司 视频编码方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US20070071094A1 (en) 2007-03-29
CN1941915A (zh) 2007-04-04

Similar Documents

Publication Publication Date Title
JP2007089035A (ja) 動画像符号化方法、装置及びプログラム
KR100319994B1 (ko) 동화상부호화장치
US8559501B2 (en) Method and apparatus for adaptively determining a bit budget for encoding video pictures
US7792193B2 (en) Image encoding/decoding method and apparatus therefor
CN100463523C (zh) 帧层速率控制的视讯编码方法和系统
JP5180294B2 (ja) ビデオ符号化において、フレームの複雑さ、バッファレベル、およびイントラフレームの位置を利用するバッファベースのレート制御
KR100559924B1 (ko) 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법
US8681858B2 (en) Rate control for two-pass encoder
EP1992169B1 (en) Method and apparatus for bit rate control in scalable video signal encoding using a rate-distortion optimisation
US11356672B2 (en) System and method for controlling video coding at frame level
US20110286516A1 (en) Apparatus and method for coding/decoding image selectivly using descrete cosine/sine transtorm
JP2001512643A (ja) コード化システムにおけるレート制御を最適化するための装置および方法
US20110150074A1 (en) Two-pass encoder
US20220014758A1 (en) System and method for controlling video coding within image frame
CN110419215B (zh) 比特率控制方法及其装置
Tan et al. Single-pass rate control with texture and non-texture rate-distortion models
US8094716B1 (en) Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding
US20090046779A1 (en) Method and apparatus for determining block mode using bit-generation probability estimation in moving picture coding
JP5649296B2 (ja) 画像符号化装置
KR101522391B1 (ko) 양자화 제어 장치 및 방법, 및 양자화 제어 프로그램
JP4532607B2 (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
Kaminsky et al. Dynamic computational complexity and bit allocation for optimizing H. 264/AVC video compression
JP3812269B2 (ja) 動画像符号化装置及びその方法
JP2004266640A (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
KR101610029B1 (ko) 가변 크기 블록 매칭 기반의 모션 추정 방법 및 이를 이용한 비디오 인코딩 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090210