[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3734286B2 - 動画像符号化装置及び動画像伝送装置 - Google Patents

動画像符号化装置及び動画像伝送装置 Download PDF

Info

Publication number
JP3734286B2
JP3734286B2 JP32643594A JP32643594A JP3734286B2 JP 3734286 B2 JP3734286 B2 JP 3734286B2 JP 32643594 A JP32643594 A JP 32643594A JP 32643594 A JP32643594 A JP 32643594A JP 3734286 B2 JP3734286 B2 JP 3734286B2
Authority
JP
Japan
Prior art keywords
encoding
code amount
signal sequence
quantization step
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32643594A
Other languages
English (en)
Other versions
JPH08186821A (ja
Inventor
晋一郎 古藤
敏則 尾高
朋夫 山影
知也 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP32643594A priority Critical patent/JP3734286B2/ja
Publication of JPH08186821A publication Critical patent/JPH08186821A/ja
Application granted granted Critical
Publication of JP3734286B2 publication Critical patent/JP3734286B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、特に蓄積メディアのように符号化時にリアルタイム性が要求されない動画像システムにおいて高い圧縮率で高画質の符号化を実現する動画像符号化装置及び動画像伝送装置に関する。
【0002】
【従来の技術】
動画像の圧縮符号化方式の国際規格として、ビデオCDの規格にも採用されたMPEG−1(ISO/IEC11172)や、次世代のデジタル放送、VOD(Video On Demand) あるいはDVD(Digital Video Disk)などへの応用が期待されているMPEG−2(ISO/IEC13818)などが知られている。
【0003】
MPEG符号化方式では、動き補償予測とDCT(離散コサイン変換)をベースにしたエントロピー符号化が用いられているため、均一な画質での符号化を行う場合、入力動画像信号に対する予測効率や解像度といった性質に応じて、発生符号量が大幅に変動する。伝送路やメディアの制約から、この発生符号量の時間変動は所定範囲内に収まるように制限される必要がある。通常、量子化の精度(量子化ステップ幅)を制御することで、この条件を満たすように発生符号量は制御される。しかし、この方法では入力動画像信号の画像の動きが激しいために予測効率が低い場合や、解像度が高くフレーム内の情報量が大きい場合には、量子化ステップ幅が大きくなるため、量子化による符号化歪みが大きくなり、画質劣化が顕著となる。
【0004】
一方、こうして符号化された信号の伝送方式として固定レート伝送方式を用いた場合、発生符号量の時間変動は符号化ビットストリームを伝送前に一時蓄える平滑化バッファによってのみ吸収される。従って、発生符号量の時間変動は規定された平滑化バッファのサイズの中で制限されるが、その自由度は大きくとることが出来ず、入力動画像信号の画像の性質に依存して画質劣化が顕著になる場合がある。
【0005】
符号化ビットストリームの伝送方式として、伝送レートを時間的に変動させる可変レート伝送方式も知られている。ATMのパケット伝送やHDDなどのようにバースト転送を基本とする伝送方式では、この可変レート伝送を実現することが可能である。可変レート伝送では、伝送路の最大レートと平滑化バッファのサイズにより制限される範囲で、固定レート伝送に比べて大幅な発生符号量の時間変動を許容できる。したがって、入力動画像信号の画像の性質に応じた、より高能率な符号化を実現することが可能となる。
【0006】
符号化ビットストリームを光ディスクなどのディジタル蓄積メディア、つまりDSM(Digital Storage Media) に蓄積する場合には、DSMの最大容量と最大転送レートで制限される可変レート伝送が可能である。このような蓄積系への応用では、実時間での符号化は必ずしも要求されず、効率的な符号化による高画質化や記録時間の拡大が重要となる。このためには、入力動画像信号系列全体の性質に基づいて最適な可変レート制御を行うことが有効と考えられるが、動画像信号の可変レート伝送における最適なレート制御方法は未だ確立されていない。
【0007】
【発明が解決しようとする課題】
上述したように、動画像符号化技術を蓄積系に応用を考えた場合、記録時間の拡大や高画質化を図るために入力動画像信号の全体の性質に基づいて最適なレート制御を行うことが有効と考えられるが、そのようなレート制御方法は未だ確立されておらず、その実現が望まれていた。
【0008】
本発明は、入力動画像信号系列の全体の性質に応じたレート制御の最適化による大幅な高画質化と記録時間の拡大を可能とする蓄積系に適した動画像符号化装置を提供することを目的とする。
【0009】
【課題を解決するための手段】
上記課題を解決するため、本発明においては、入力動画像信号系列全体を一旦符号化した後、この全体にわたる発生符号量を含む統計量に基づいて再度同一の入力動画像信号系列全体を符号化する動画像符号化装置において、前記入力動画像信号系列を画素ブロック毎に複数の量子化ステップ幅を交互に切り換えて符号化する符号化手段と、前記複数の量子化ステップ幅でそれぞれ符号化された画素ブロックの符号量をフレーム毎に独立に加算し、複数の加算符号量を求める手段と、前記複数の加算符号量から量子化ステップ幅毎のフレームの発生符号量を推定する手段と、推定された発生符号量に基づいて前記符号化手段に対して最終回符号化のための前記入力動画像信号系列全体の最適符号量割り当てを行う符号量割り当て手段とにより構成される動画像符号化装置を提供する。
【0010】
また本発明に係る動画像符号化装置において、前記符号量割り当ての結果に基づき平滑化バッファ占有量の時間変動を推定する手段と、推定結果に応じて符号量の配分を補正する手段とを含み、前記符号化手段は補正符号量に従って動画像信号系列全体を符号化することを特徴とする。
【0014】
【作用】
第1の発明においては、少なくとも1回目を含む符号化で入力動画像信号系列全体の性質に依存する入力動画像信号系列の全体にわたる発生符号量などの統計量を抽出し、それに基づいて入力動画像信号系列の所定数のフレーム毎に符号量配分または量子化ステップ幅あるいはその両方を選択する。そして、こうして選択された符号量配分や量子化ステップ幅に基づいて、最終回、例えば2回目の符号化を行う際の量子化ステップ幅を画面内の所定の領域毎に制御する。DSMのような総符号量が一定の蓄積メディアにおいては、実際にメディアに符号化データを蓄積する前に、可変レート伝送を利用した最適な符号量配分を事前に行うことができるため、このような制御が容易に可能となる。
【0015】
従って、動画像信号系列の可変レート伝送において入力動画像信号系列全体の性質に基づく最適なレート制御が可能となり、平均伝送レートを上げることなく高画質化およびメディアへの記録時間の拡大を実現することができる。また、符号量配分や量子化ステップ幅の選択単位としてのフレーム数を1フレームあるいは少数のフレーム群とすることで、シーンチェンジ等の急激な入力動画像信号系列変動にも対応した安定な画質を得ることが可能となる。
【0016】
また、第2の発明ではさらに伝送時に必要な一時記憶手段である平滑化バッファの占有量の時間変動も事前に推定することができるため、その記憶容量つまり平滑化バッファのサイズを最大限利用して、先に示した2または3つの条件を満たすように符号量配分を最適化することが可能となる。従って、可変レート伝送では平滑化バッファを有効に用いることにより、瞬時のビットレートは伝送路の最大伝送レートを超えて符号量の配分を行うことも可能となる。固定レート伝送においても、平滑化バッファで吸収できる範囲での発生符号量の変動を最大限に利用して、高画質化を実現することが可能となる。
【0017】
また、本発明では入力動画像信号系列全体の性質を分析するために、符号化部における量子化ステップ幅の選択を外部より指定して1回目の符号化を行い、その時の統計量の収集を行う。従って、統計量を抽出できる符号化装置ではハードウェアを変更することなく入力動画像信号系列全体の性質を分析できる。一方、統計量抽出機能を持たない符号化装置の場合、例えば量子化ステップ幅の選択を外部より指定して符号化ビットストリームを分析することにより、入力動画像信号系列全体の性質を分析するのと等価な結果を得ることが可能であり、統計量抽出手段を既存の符号化装置と独立に持つことで、大きなハードウェアの変更を必要とすることなく分析が可能となる。
【0018】
一般に、符号化画像のS/Nは量子化ステップ幅と単調な関係を持っており、量子化ステップ幅を基準にして画質を決定することが可能である。また、量子化ステップ幅は発生符号量の動的な制御にも用いられる。従って、入力動画像信号系列全体の性質の一つとして、量子化ステップ幅と発生符号量の関係を表すパラメータの推定を行うことは、画質を考慮したレート制御を行う上で有効な方法である。量子化ステップ幅と発生符号量の関係を表すパラメータの次元をnとすると、そのパラメータ推定には少なくともn個以上の固定の量子化ステップ幅を用いて符号化を行い、その結果からパラメータ推定を行うことが必要になる。つまり、全シーケンスに渡ってn回の符号化を繰り返すことが必要になる。
【0019】
これに対し、本発明では連続するフレームの類似性を考慮し、フレーム群毎にフレーム単位で量子化ステップ幅を切替えて符号化を行うことで、各フレーム群における量子化ステップ幅と発生符号量の関係の推定を一度の符号化で行うことができる。さらに、フレーム内において画素ブロック単位に量子化ステップ幅を切替えて符号化することにより、各フレームに対する量子化ステップ幅と発生符号量の関係を一度の符号化で高精度に推定することが可能となる。
【0020】
また、入力画像の性質に応じて視覚特性を考慮した適応量子化処理を必要とする場合は、固定の量子化ステップ幅に対して、フレーム単位あるいは画素領域単位の補正係数を乗じた量子化ステップ幅を用いて、統計量の抽出を行うことにより、各フレームあるいは各フレーム群単位の量子化ステップ幅と発生符号量の関係の推定を行うことが可能である。
【0021】
【実施例】
以下、図面を参照して本発明の実施例を説明する。
(実施例1)
図1は、本発明に係る一実施例の概略構成を示すブロック図である。同図において、ディジタルVTR10にはディジタル化された映画その他の番組の動画像信号系列が記録されている。このディジタルVTR10から再生された動画像符号化系列(入力動画像信号系列)11は符号化部12に入力され、圧縮符号化される。符号化部12からは符号化データがビットストリームの形で出力され、この符号化ビットストリーム13は、ディジタル蓄積メディア(DSM)14に蓄積される。さらに、この動画像符号化装置においては、符号化部12に加えて統計量蓄積用のデータメモリ16、画像分析部17、符号量割当部19およびレート制御パラメータ蓄積用のデータメモリ21が設けられており、これらは符号化部12に対するレート制御に用いられる。
【0022】
ディジタルVTR10から所望の番組の動画像信号を再生し、それを符号化部12で符号化して、符号化ビットストリーム13をDSM14に蓄積する場合、ディジタルVTR10から同じ番組の入力動画像信号系列11が繰り返し2回再生される。すなわち、符号化部12には同じ入力動画像信号系列11が2回繰り返して入力され、符号化される。ここで、2回繰り返して入力される入力動画像信号系列11は、1本の番組全体の動画像信号系列であってもよいし、番組が長編映画のように長いものである場合は、その番組を前半と後半の2つに分けるなど、複数の時間帯に分割した系列であってもよい。
【0023】
符号化部12での1回目の符号化は、入力動画像信号系列11全体の性質を分析してその統計量を抽出するために行われ、2回目の符号化は、1回目の符号化で抽出された統計量に基づいて符号量配分や量子化ステップ幅の選択による最適なレート制御のために行われる。そして、2回目の符号化によって最適レート制御の下で得られた符号化ビットストリーム13が最終的にDSM14に蓄積される。
【0024】
次に、本実施例の詳細な構成と動作について述べる。
ディジタルVTR10からの入力動画像信号系列11は、前述したように2回繰り返して符号化部12に入力され、符号化される。符号化部12は1回目の符号化時には、固定の量子化ステップ幅を用いて符号化を行う。この1回目の符号化の際、符号化部12からフレーム毎の発生符号量、アクティビティ、予測効率等の統計量が統計量パラメータ15として抽出され、これがデータメモリ16に蓄積される。
【0025】
この1回目の符号化が終了した時点で、データメモリ16に蓄積された各統計量の統計パラメータから、画像分析部17によってフレーム単位で統計量の自動分析を行い、入力動画像信号系列11の各画像の特性パラメータ18を得る。
【0026】
この特性パラメータ18は符号量割当部19に送られ、各フレームについて符号化部12でのバッファリングの制限及び伝送レートの制限を満たす範囲で、入力動画像信号系列11全体に対して、主観的な画質変動を抑えた最適符号量割当がなされる。この最適符号量割当の結果得られたフレーム単位のレート制御パラメータ20は、もう一つのデータメモリ21に蓄積される。
【0027】
次に、ディジタルVTR10から同じ入力動画像信号系列11が符号化部12入力され、2回目の符号化が行われる。この2回目の符号化に際しては、1回目の符号化で上述のようにデータメモリ21に蓄積され、ここから読出されたレート制御パラメータ22に基づきレート制御を行う。そして、この2回目の符号化で得られた符号化ビットストリーム13がDSM14に蓄積される。
【0028】
図2は、符号化部12の具体的な構成例を示すブロック図である。この符号化部12での符号化方式自体は、MPEG等で規定された公知のものである。図2において、入力動画像信号系列11は減算器101と動き補償予測回路109に入力される。動き補償予測回路109では、入力動画像信号系列11とフレームメモリ108に蓄えられている既に符号化/局部復号化によって得られた参照画像信号との間の動きベクトルが検出され、この動きベクトルに基づいて動き補償予測信号102が作成される。減算器101では、入力動画像信号系列11から予測信号102が減算されることにより予測残差信号が生成される。この予測残差信号は、離散コサイン変換(DCT)回路103において一定の大きさのブロック単位で離散コサイン変換され、DCT係数情報となる。DCT係数情報は、量子化回路104で量子化される。
【0029】
量子化回路104からの量子化されたDCT係数情報は、逆量子化回路105により逆量子化される。逆量子化回路105の出力は、逆離散コサイン変換(逆DCT)回路106により逆離散コサイン変換される。すなわち、逆量子化回路105および逆DCT回路106では量子化回路104およびDCT回路103と逆の処理がそれぞれ行われ、逆DCT回路106の出力に減算器101から出力される予測残差信号に近似した信号が得られる。逆DCT回路106の出力は加算回路107において動き補償予測回路109からの予測信号102と加算され、局部復号信号が生成される。この局部復号信号は、フレームメモリ108に参照画像信号として記憶される。
【0030】
一方、量子化回路104からの量子化されたDCT係数情報は可変長符号化回路110にも入力され、可変長符号化される。可変長符号化されたデータは、平滑化バッファ111を経て符号化ビットストリーム13として取り出される。
【0031】
入力動画像信号系列11は、アクティビティ計算回路112にも入力される。アクティビティ計算回路112では、入力動画像信号系列11の画像のアクティビティが計算され、その結果はレート制御回路113に入力される。レート制御回路113は、アクティビティと平滑化バッファ111のバッファ量(占有量)および図1のデータメモリ21からのレート制御パラメータ22に基づいて量子化回路104での量子化ステップ幅を制御することにより、レート制御、つまり符号化ビットストリーム13の伝送レートの制御を行う。
【0032】
また、図2では可変長符号化回路110からのフレーム毎の発生符号量、アクティビィティ計算回路112で計算されたアクティビィティおよび減算器101から出力される予測残差信号で示される予測効率を示す情報が統計量パラメータ15として図1のデータメモリ16へ出力される。
【0033】
(実施例2)
図3は、本実施例の概略構成を示すブロック図である。同図において、ディジタルVTR30、符号化部32、DSM34、データメモリ36、画像分析部37、符号量割当部39およびデータメモリ41は、図1中に示したディジタルVTR10、符号化部12、DSM14、データメモリ16、画像分析部17、符号量割当部19およびデータメモリ21と基本的に同じである。
【0034】
本実施例では、実施例1で示した統計量抽出のための1回目の符号化時においても、符号化部32から出力される符号化ビットストリーム33をDSM34に記録する。DSM34に記録される1回目の符号化における符号化ビットストリームは、順次、統計量抽出部43で解析されることにより統計量が抽出され、抽出された各統計量はデータメモリ36に記録される。
【0035】
そして、この1回目の符号化の終了後、実施例1と同様にフレーム単位で統計量の自動分析、及び符号量割当処理を行い、その結果に基づくレート制御の下で2回目の符号化を行う。
【0036】
(実施例3)
本実施例では、実施例1および実施例2における符号量割当部19,39での最適符号量割当の具体例について述べる。図4〜図6は、最適符号量割当の様子とその効果を模式的に示した図である。
【0037】
図4は、入力動画像信号系列11の画像(以下、入力画像という)のエントロピー(複雑さ)の時間変動を示す図である。図5は、一様な符号量割当を行った場合の画質とビットレートの時間変動を示したものである。符号量割当を一様とすると、入力画像の複雑さの度合に応じて、符号化画像の画質は一般にその逆相の時間変動を示す。つまり、入力画像が複雑なほど符号化画像の画質は低下し、また準静止画のような情報量が少ない入力画像に対しては、画質は高くなる。この場合、視覚的に画質劣化した部分が顕著に知覚され、全体的な符号化画像の印象が悪いものとなる。
【0038】
一方、図6は統計量の分析に基づいて最適符号量割当を行った場合の画質とビットレートの時間変動を示したものである。最適符号量割当は、伝送路の最大レートとバッファリングの制限を満たす範囲で安定した画質を得るために、入力画像の複雑さに応じた符号量割当を行うことでなされる。そのため、得られる画質は非常に安定したものとなり、全体としての視覚的な符号化画像の印象が向上する。また、エントロピー符号化におけるレート−歪み関数が通常は非線形特性を有していることから、最適符号量割当を行うことにより、一様な符号量割当の場合と比較して、総符号量が一定の下では符号化画像全体にわたるS/Nも向上することになる。
【0039】
画質を考慮した最適な符号量割当および符号量制御を行うためには、量子化ステップ幅と発生符号量の関係を高精度に推定できることが重要となる。図7は、各画像における量子化ステップ幅と発生符号量の関係の例を示したものである。同図に示されるように、一般に発生符号量は量子化ステップ幅に対して単調に減少する。発生符号量と量子化ステップ幅との関係は、符号化方式に依存するとともに、入力画像の性質に応じて固有な特性を有する。MPEG符号化方式では、図2にも示したように動き補償予測とDCTを用いているため、発生符号量と量子化ステップ幅との関係は、各画像の予測効率と入力動画像信号系列の空間周波数分布等に依存する。
【0040】
ここで、所定のフレーム数(1フレームあるいは比較的少数のフレーム群)に対する量子化ステップ幅Qと発生符号量Rとの関係は、画像jに固有な統計量パラメータをai j (i=0,1,…,n)とすると、
R=f(Q,a1 j ,a2 j ,…,an
と表すことができる。ここで、モデル化した関数fに対して、計算されたアクティビティや空間周波数分布、あるいは予測効率といった間接的なパラメータから、パラメータai を推定する試みもなされている。しかし、一般には実測データのモデル化した関数系からのばらつきが大きくなり、これら間接的なパラメータからは、高精度に発生符号量と量子化ステップ幅の関係を推定することが困難である。そこで、入力動画像信号系列11の所定数のフレーム毎(1フレーム毎あるいはフレーム群毎)に量子化ステップ幅と発生符号量の関係を直接実測し、回帰分析等により統計量パラメータai j (i=0,1,…,n)を求めることによって、高精度な発生符号量の推定が可能となる。
【0041】
(実施例4)
図8は、本実施例における符号化処理の流れを示すフローチャート図である。本実施例における動画像符号化装置の構成は、図1または図3と同様である。
【0042】
入力動画像信号系列11(または31)の所定数のフレーム(1フレームあるいはフレーム群j)に対する発生符号量Rと量子化ステップ幅Qの関係をR=f(Q,a1 j ,a2 j )として、はじめに入力動画像信号系列全体にわたり統計量抽出のための前符号化として、固定の量子化ステップ幅Q=Q1 及びQ=Q2 を用いて符号化部12(または32)により2回の符号化を順次行う(ステップS11)。
【0043】
そして、これらの符号化時の各フレームあるいはフレーム群毎の発生符号量を例えば図2の可変長符号化回路110の出力から実測することにより、統計量パラメータa1 j ,a2 j の推定を行う。すなわち、統計量の分析処理を行う(ステップS12)。
【0044】
こうして推定された量子化ステップ幅と発生符号量の関係を用いることで、画質変動を抑え、且つ最大レート、平均レートおよび平滑化バッファサイズ等の伝送路の条件を満たした最適な符号量配分を符号量割当部19(または38)で行い(ステップS13)、それに基づいて符号化部12(または32)で圧縮符号化を行う(ステップS14)。
【0045】
(実施例5)
図9を用いて本実施例を説明する。図9において、Iはフレーム内符号化のみを行う画像、Pは前方予測を行う画像、Bは前方および後方予測を行う画像をそれぞれ示している。本実施例は、時間的に連続するI,P,Bの画像タイプ毎に、量子化ステップ幅をQ1 ,Q2 と交互に切り換えて符号化することにより、時間的に隣接するフレームの類似性を考慮して、入力動画像信号系列全体にわたる一度の符号化により、等価的に2回の符号化を実現するものである。つまり、例えば図中のB1およびB2について、ともに発生符号量Rと量子化ステップ幅Qの関係を
R=f(Q,a1 12,a2 12
として、量子化ステップ幅Qb1,Qb2を用いたときのB1およびB2の符号化時の発生符号量の実測値をそれぞれRb1, Rb2として、
(R,Q)=(Rb1,Qb1),(Rb2,Qb2
から、上式のa1 12,a2 12を求める。
【0046】
このように1回の符号化によって、同じ動画像信号系列を実質的に2回行ったのと同じ結果を得ることも可能である。
(実施例6)
図10および図11を用いて本実施例を説明する。図10および図11は、1フレーム内の各画素ブロックの量子化ステップ幅を示し、図10は量子化ステップ幅が2種類の場合、図11は量子化ステップ幅が3種類の場合である。
【0047】
今、フレームjの量子化ステップ幅Qと発生符号量Rの関係を、
R=f(Q,a1 j ,a2 j
とする。ここでフレームjの各画素ブロック毎に量子化ステップ幅を図10に示すようにQ1 ,Q2 、あるいは図11に示すようにQ1 ,Q2 ,Q3 と交互に切り換え、それぞれの量子化ステップ幅に対応する画素ブロック毎に、独立に発生符号量をフレーム内で加算する。ここで、1フレーム内の量子化ステップ幅の種類は2または3に限るものではなく、一般にN種類を1フレーム内で用いるものとする。量子化ステップ幅Qn (n=1,2,…,N)に対するブロック毎の発生符号量のフレーム内加算値をそれぞれRn として、
(R,Q)=(N×Rn ,Qn )(n=1,2,…,N)
から、上式のパラメータa1 j ,a2 j を求める。これにより、1度の符号化から、等価的にN回の固定の量子化ステップ幅の符号化結果を得ることが可能となる。なお、1フレーム内の量子化ステップ幅の組Nは、パラメータa1 j の次数以上に設定することで、回帰分析によるパラメータ推定が可能となる。
【0048】
(実施例7)
図12は、本実施例の概略構成を示すブロック図である。同図において、ディジタルVTR50、符号化部52、DSM54、データメモリ56、画像分析部57、符号量割当部59およびデータメモリ61は、図1に示したディジタルVTR10、符号化部12、DSM14、データメモリ16、画像分析部17、符号量割当部19およびデータメモリ21と基本的に同じである。
【0049】
本実施例では、主観的な画質に影響を及ぼすアクティビティ、予測効率、動き量、予測モード等のパラメータに応じて、各画素ブロック単位あるいはフレーム単位に量子化ステップ幅に対して視覚補正の重み付けを行うことが先の実施例1および2と異なっている。すなわち、本実施例では適応量子化重み計算部64が新たに追加され、この適応量子化重み計算部64では、これらアクティビティ、予測効率、動き量、予測モード等のパラメータ62から適応量子化重みパラメータ63を計算する。適応量子化処理は、視覚的に画質劣化が目立ちやすい部分では量子化を細かくし、また画質劣化が目立ちにくい部分では量子化を粗くすることで、全体としての主観的な画質を向上させることが目的である。
【0050】
図13および図14は、それぞれ時間方向およびフレーム内の空間方向での適応量子化処理を用いる場合の適応量子化重みパラメータの一例を示したものである。適応量子化処理を用いる場合、図13および図14で示されるような時間方向または空間方向の適応処理の重み関数がそのフレームを符号化する以前に得られる場合には、統計量抽出のための固定の量子化ステップ幅での1回目の符号化の際に、この適応処理の重み関数で固定の量子化ステップ幅を変化させて符号化を行う。これによって、所定数のフレーム(1フレームまたはフレーム群)に対する発生符号量と量子化ステップ幅の関係をより高精度に推定することが可能となる。
【0051】
(実施例8)
図15は、本発明による動画像符号化装置により得られた符号化データから元の動画像信号系列を復号するための可変レート動画像復号化装置の実施例を示したものである。同図において、DSM70には符号化データが蓄積されており、このDSM70から再生された符号化ビットストリームは伝送路72を介して動画像復号化装置71に入力され、まず平滑化バッファであるFIFOバッファ73に入力される。ここで、伝送路72は規定された最大伝送レートRmaxで符号化データを伝送し、FIFOバッファ73の占有率が規定値を越えると伝送を停止するように構成されている。
【0052】
FIFOバッファ73は、デコーダ75からの要求に応じて符号化データをデコーダ75に送出する。このとき、1フレーム分の符号化データは、該フレームをデコードすべき時刻においてFIFOバッファ73からデコーダ75へ瞬時に転送するものとする。なお、本伝送モデルはISO/IEC13818−2において規定されている。こうしてデコーダ75で復号された動画像信号系列76は、表示装置77に送られて表示される。
【0053】
(実施例9)
図16は、本発明に係る動画像符号化装置における符号量割当処理の一実施例の処理手順を示している。まず、前述のように抽出された各統計パラメータを用いて、入力動画像系列全体に渡って最適符号量配分を行う(ステップS21)。次に、その符号量配分結果に基づき、前記平滑化バッファ占有量の時間変動の推定を行う(ステップS23)。
【0054】
図17は、与えられた総符号量の下で主観的な画質が一定となるように最適符号量配分を行った場合の、前記伝送モデルに従った平滑化バッファの占有量推移の推定結果を示したものである。ここで、バッファ占有量の時間的変動の傾きは伝送路の最大伝送レートを示し、またフレーム周期の時刻において符号化データが平滑化バッファから瞬時に抜き取られている。図17では、平滑化バッファの制限を考慮していないため、時刻mにおいて平滑化バッファのアンダーフローを起こすことが推定される。
【0055】
そこで、本実施例では図16のステップS24で平滑化バッファのアンダーフローの可能性を検証し、アンダーフローが予測される場合には、アンダーフロー予測時刻から遡り、バッファ占有率が十分高くなる時刻(図17の例ではn)までの間の配分符号量を他の時刻領域に再配分することにより、符号量配分の補正を行う(ステップS25)。これにより、アンダーフローを起こさない符号量配分を実現することができる。
【0056】
図18は、平滑化バッファの制限により補正された符号量配分による平滑化バッファ占有量の時間変動の推定結果を示している。このとき、短時間平均伝送レートの時間変動は図19に示されるようになり、バッファ変動を有効に利用することで、伝送路の最大レートを瞬間的に越えた符号量配分も可能となる。すなわち、伝送路の最大伝送レートと平滑化バッファを組み合わせた最適な符号量配分が実現できる。
【0057】
また、固定レート伝送においても、平滑化バッファのアンダーフローとオーバーフローを起こさないように制御することが必要となるが、平滑化バッファで吸収できる範囲で、可変レート伝送と同様に高画質化の意味で最適な符号量配分が可能となる。
【0058】
このように本実施例では、伝送路の最大伝送レートと平滑化バッファの記憶容量によって規定される瞬時の最大伝送レートの制限を満たす、(b) 平滑化バッファがアンダーフロー及びオーバーフローを起こさない、(c) 前記伝送路に規定された平均伝送レートを満たす、の3つの条件を満足するように最適な符号量配分を行うことができる。
【0059】
【発明の効果】
以上説明したように、本発明によれば符号化時にリアルタイム性が必ずしも要求されない蓄積系での動画像圧縮符号化において、例えば固定の量子化ステップ幅を用いて入力動画像信号系列全体に渡る1回目の符号化を行うことで統計量を抽出して、所定数のフレーム(1フレームあるいはフレーム群)に対する発生符号量と量子化ステップ幅の関係を推定し、それに基づいて発生符号量の符号量配分および量子化ステップ幅の少なくとも一方を選択し、2回目の符号化時の量子化ステップ幅を入力動画像信号系列の画面内の所定の領域毎に制御することにより、伝送路の制約と限られた総符号量の下での高画質化を両立した最適な符号量配分が可能となる。
【0060】
ここで、さらに平均伝送レートおよび伝送路の最大ビットレートの制限に加えて、平滑化バッファ占有量の時間推移も含めて符号量配分を最適化することにより、可変レート伝送および固定レート伝送のいずれにおいても、平滑化バッファのオーバーフローまたはアンダーフローを防ぐとともに、より高画質化を実現することが可能となる。
【0061】
また、1回目の符号化時にフレーム毎あるいは画素ブロック毎に、複数の量子化ステップ幅を切り換えて符号化を行うことで、1回目の符号化から数回に渡り入力動画像信号系列全体の符号化を繰り返し行った場合と同等の高い精度で、フレーム単位あるいはフレーム群単位の発生符号量と量子化ステップ幅の関係を推定することが可能となる。
【0062】
さらに、フレーム毎あるいは画素ブロック毎に視覚特性を考慮した適応量子化処理を用いる場合には、固定の量子化を用いた1回目の符号化時においても、適応処理の重み関数を用いて固定の量子化スケールの値を変化させて用いることにより、各フレームあるいはフレーム群の符号化特性を精度を落とさずに得ることができる。
【図面の簡単な説明】
【図1】実施例1に係る動画像符号化装置の概略構成を示すブロック図
【図2】図1における符号化部の具体的な構成例を示すブロック図
【図3】実施例2に係る動画像符号化装置の概略構成を示すブロック図
【図4】実施例3を説明するための入力画像のエントロピーの時間変化を示す図
【図5】実施例3を説明するための固定レート符号化における画質とビットレートの時間変動を示す図
【図6】実施例3を説明するための可変レート符号化における画質とビットレートの時間変動を示す図
【図7】実施例3を説明するための画像毎の量子化ステップ幅と発生符号量の関係を示す図
【図8】実施例4における符号化処理の流れを示すフローチャート
【図9】実施例5を説明するための複数の画像タイプを示す図
【図10】実施例6を説明するための1フレーム内の各画素ブロックの量子化ステップ幅を示す図
【図11】実施例6を説明するための1フレーム内の各画素ブロックの量子化ステップ幅を示す図
【図12】実施例7に係る動画像符号化装置の概略構成を示すブロック図
【図13】実施例7における時間方向の適応量子化処理に用いる重み関数の例を示す図
【図14】実施例7における空間方向の適応量子化処理に用いる重み関数の例を示す図
【図15】実施例8に係る蓄積系の動画像復号化装置の構成例を示すブロック図
【図16】実施例9における符号量配分処理を示すフローチャート図
【図17】実施例9を説明するための平滑化バッファ占有量の時間変動を示す図
【図18】実施例9を説明するための平滑化バッファ占有量の時間変動を示す図
【図19】実施例9を説明するためのビットレートの時間変動を示す図
【符号の説明】
10,30,50…ディジタルVTR
11,31,51…入力画像信号
12,32,52…符号化部
13,33,42,53…符号化ビットストリーム
14,34,54…DSM(ディジタル蓄積メディア)
15,55…統計量パラメータ
16,36,56…統計量蓄積用データメモリ
17,37,57…画像分析部
18,38,58…特性パラメータ
19,39,59…符号量割当部
20,40,60…レート制御パラメータ
21,41,61…レート制御パラメータ用データメモリ
22…レート制御パラメータ
43…統計量抽出部
62…アクティビティ、予測効率、動き量、予測モード等
63…適応量子化重みパラメータ
64…適応量子化重み計算処理部
70…DSM
71…動画像復号化装置
72…伝送路
73…FIFOバッファ
74…符号化データ
75…デコーダ
76…復号化された動画像信号系列
77…表示装置
101…減算器
102…予測信号
103…DCT回路
104…量子化回路
105…逆量子化回路
106…逆DCT回路
107…加算器
108…フレームメモリ
109…動き補償予測回路
110…可変長符号化回路
111…平滑化バッファ
112…アクティビィティ計算回路
113…レート制御回路

Claims (2)

  1. 入力動画像信号系列全体を一旦符号化した後、この全体にわたる発生符号量を含む統計量に基づいて再度同一の入力画像信号系列全体を符号化する動画像符号化装置において、前記入力動画像信号系列を画素ブロック毎に複数の量子化ステップ幅を交互に切り換えて符号化する符号化手段と、前記複数の量子化ステップ幅でそれぞれ符号化された画素ブロックの符号量をフレーム毎に独立に加算し、複数の加算符号量を求める手段と、前記複数の加算符号量から量子化ステップ幅毎のフレームの発生符号量を推定する手段と、推定された発生符号量に基づいて前記符号化手段に対して最終回符号化のための前記入力動画像信号系列全体の最適符号量割り当てを行う符号量割り当て手段とにより構成される動画像符号化装置。
  2. 前記符号量割り当ての結果に基づき平滑化バッファ占有量の時間変動を推定する手段と、推定結果に応じて符号量の配分を補正する手段とを含み、前記符号化手段は補正符号量に従って動画像信号系列全体を符号化する請求項1記載の動画像符号化装置。
JP32643594A 1994-12-27 1994-12-27 動画像符号化装置及び動画像伝送装置 Expired - Fee Related JP3734286B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32643594A JP3734286B2 (ja) 1994-12-27 1994-12-27 動画像符号化装置及び動画像伝送装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32643594A JP3734286B2 (ja) 1994-12-27 1994-12-27 動画像符号化装置及び動画像伝送装置

Publications (2)

Publication Number Publication Date
JPH08186821A JPH08186821A (ja) 1996-07-16
JP3734286B2 true JP3734286B2 (ja) 2006-01-11

Family

ID=18187780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32643594A Expired - Fee Related JP3734286B2 (ja) 1994-12-27 1994-12-27 動画像符号化装置及び動画像伝送装置

Country Status (1)

Country Link
JP (1) JP3734286B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819004A (en) * 1995-05-08 1998-10-06 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of previously encoded video frames
JP3866538B2 (ja) 2001-06-29 2007-01-10 株式会社東芝 動画像符号化方法及び装置
JP2003087785A (ja) 2001-06-29 2003-03-20 Toshiba Corp 動画像符号化データの形式変換方法及び装置
JP4842899B2 (ja) 2007-08-15 2011-12-21 Kddi株式会社 動画像符号化装置、動画像符号化方法およびプログラム
JP6486120B2 (ja) * 2015-01-29 2019-03-20 キヤノン株式会社 符号化装置、符号化装置の制御方法、及びプログラム

Also Published As

Publication number Publication date
JPH08186821A (ja) 1996-07-16

Similar Documents

Publication Publication Date Title
JP4256574B2 (ja) 画像信号符号化方法および画像信号符号化装置
US7313283B2 (en) Image coding apparatus
CN100401782C (zh) 控制视频序列速率的方法和装置及视频编码装置
JP3866538B2 (ja) 動画像符号化方法及び装置
JPH07288810A (ja) 動画符号化方法
JP4099682B2 (ja) 画像処理装置および方法、並びに記録媒体
KR19980042772A (ko) 동화상 가변 비트 속도 부호화 장치, 동화상 가변 비트 속도 부호화 방법, 및 동화상 가변 비트 속도 부호화 프로그램 기록 매체
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
JP3872849B2 (ja) 動画像符号化装置
JP2001008215A (ja) 動画像符号化装置及びその方法
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
JP4362795B2 (ja) 動画像符号化装置及びその方法
JP3734286B2 (ja) 動画像符号化装置及び動画像伝送装置
JP2950065B2 (ja) 可変転送レート符号化装置
JPH0998427A (ja) 動画像符号化装置
JP4362794B2 (ja) 動画像符号化装置及びその方法
JP4362793B2 (ja) 動画像符号化装置及びその方法
JP4421734B2 (ja) 符号化データ変換方法,及びデータ記録媒体
JPH08149413A (ja) 可変ビットレート符号化装置および記録装置および記録媒体
JP3149673B2 (ja) 映像符号化装置、映像符号化方法、映像再生装置及び光ディスク
JP4605183B2 (ja) 画像信号処理装置及び方法
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JP3425130B2 (ja) 符号化装置及び符号化方法
JP3399472B2 (ja) 記録装置、記録方法、および記録媒体

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051018

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081028

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101028

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121028

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees