JP3259702B2 - 動画像可変ビットレート符号化装置および方法 - Google Patents
動画像可変ビットレート符号化装置および方法Info
- Publication number
- JP3259702B2 JP3259702B2 JP36822298A JP36822298A JP3259702B2 JP 3259702 B2 JP3259702 B2 JP 3259702B2 JP 36822298 A JP36822298 A JP 36822298A JP 36822298 A JP36822298 A JP 36822298A JP 3259702 B2 JP3259702 B2 JP 3259702B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization width
- image
- bit rate
- average
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
レート符号化装置および方法に関し、特に、可変ビット
レートで符号量をリアルタイムに制御する動画像可変ビ
ットレート符号化装置および方法に関する。
る方法としては、MPEG−2(ISO/IEC−13
818−2)等に代表される方法が知られている。
らなるブロックに分割し、各ブロックに対して離散コサ
イン変換(DCT)を施すことにより空間領域の信号を
周波数領域の信号に変換する。この離散コサイン変換に
より得られるDCT係数と呼ばれる各周波数成分は、係
数位置(周波数)毎に定められた量子化幅で量子化さ
れ、量子化変換係数に可変長符号を割り当てることで可
変長符号化し、符号化データのビットストリームとして
出力していた。
13818−2)に準拠した画像符号化方法を説明する
ための図であり、図8によれば、減算器501と、離散
コサイン変換器502と、量子化器503と、可変長符
号化器504と、符号量制御器505と、逆量子化器5
06と、逆離散コサイン変換器507と、加算器508
と、フレームメモリ509と、動き補償フレーム間予測
器510と、選択器511とにより構成される。
うI ピクチャと、順方向予測だけを用いてフレーム間予
測符号化を行うPピクチャと、順方向逆方向の両方から
予測を行うBピクチャとに分類される。また入力画像
は、16×16画素のマクロブロックに分割され、マク
ロブロック単位に符号化処理を行う。
わずにフレーム内符号化を行う。このとき、選択器51
1では信号値0を予測値として選択され、減算器501
からは、入力画像信号値と同じ値が出力される。この減
算器501からの出力信号値は、離散コサイン変換器5
02にて離散コサイン変換されることによりDCT係数
が出力される。DCT係数は量子化器503において、
予め設定された量子化幅により量子化される。
DCT係数は、量子化変換係数として可変長符号化器5
04へ出力され、ここで量子化変換係数は可変長符号化
される。可変長符号化された量子化変換係数は他のデー
タとともにビットストリームとして出力される。また、
量子化器503から出力された量子化変換係数は逆量子
化器506へも出力され、ここでこの量子化係数は逆量
子化されることにより得られた逆量子化変換係数は、逆
離散コサイン変換器507にて逆離散コサイン変換さ
れ、当初の入力画像信号が復元される。
換器507を経て復元された画像信号は、後のフレーム
間予測における参照画像として用いられるものであり、
加算器508を通してフレームメモリ509に記録され
る。このフレーム間予測は、PピクチャおよびBピクチ
ャに対して動き補償フレーム間予測器510において行
われる。先ず、入力画像信号とフレームメモリ509に
記録された参照画像とを比較し、入力画像において分割
されたマクロブロック単位毎に動きベクトル探索を行う
ことにより、動きベクトルを決定する。この動きベクト
ル探索の結果に基づいた予測モードをマクロブロック毎
に決定する。この処理においてPピクチャおよびBピク
チャに対するマクロブロックの符号化処理をイントラモ
ードで実行した方がよいか否かが決定される。
定された符号化処理の内容がイントラモードである場
合、PピクチャおよびBピクチャに対しても当該マクロ
ブロックの符号化処理は、上記のIピクチャに対する符
号化処理と同様であり、決定された動きベクトルによる
動き補償付きフレーム間予測は行われず、フレーム内符
号化処理となる。
定された符号化処理の内容が非イントラモードである場
合、フレームメモリ509に記録された画像信号を参照
画像としてPピクチャおよびBピクチャに対する当該マ
クロブロックの符号化処理はフレーム間予測によって行
われる。動き補償フレーム間予測器510は、先に決定
された動きベクトルを基に動き補償フレーム予測を行う
ことにより入力画像信号に対する予測画像信号を生成す
る。
へ与えられる一方で加算器508へも出力される。ここ
では、減算器501へ与えられた予測画像信号について
述べる。減算器501は、入力画像信号と与えられた予
測画像信号との差分信号を算出し、以降の差分信号に対
する符号化処理は上記Iピクチャの符号化処理と同様で
あり、離散コサイン変換器502でDCT変換係数とさ
れ、量子化器503で量子化される。
は、可変長符号化器504へ与えられビットストリーム
として出力される他、逆量子化器506へも与えられ
る。以降符号化処理された差分信号に対する復元処理が
行われるが、この逆量子化器506、逆離散コサイン変
換器507を介して行われる復元処理も前述したPピク
チャおよびBピクチャに対する復元処理と同様であっ
て、復元された差分信号は、先に加算器508に与えら
れた予測画像信号と加算器508で加算されることによ
り復元画像信号が生成される。
は、フレームメモリ509に記憶され、後のフレーム間
予測による符号化処理の参照画像となる。
13818−2)等に代表される方法では、入力動画像
信号に対する符号化処理は、DCT変換による空間方法
の冗長性の削減と、フレーム間予測による時間方向の冗
長性の削減ができることから効率的な符号化処理を行う
ことができる。
3818−2)等に代表される方法では、可変長符号化
器504と量子化器503と間に符号量制御器505を
備えるものもあり、この符号量制御制御器505によっ
て、可変長符号化器504から発生符号量の情報を獲得
し、ビットレートの制約を満たすよう量子化幅を決定し
て量子化器503へ量子化幅データを送ることにより発
生符号量を制御することができる。
IEC−13818−2)の符号化処理を行う従来技術
を具体的に述べる。
量子化処理を伴う符号化方式における符号量の制御方式
として、MPEG−2のテストモデル(Test Model 5,
ISO/ICE JTC1/SC21/WG11/N0400,1993 年4 月)の方法が
知られている。
びフレーム間予測による符号化処理により発生した符号
量を、ある単位時間毎に一定にしようとする固定ビット
レート符号化方式を採用しており、符号化処理する複数
の画面の集合であるGOP(Group Of Picture)を単位と
して、GOP毎に対する符号化処理により発生した符号
量が一定になるよう画面を16×16画素に分割したマ
クロブロック単位毎に設定する量子化幅を調整すること
で符号量を制御するものが知られている。
ト符号化方式を採用していることから単位時間当たりの
符号量を一定に制御しなければならないことから、符号
量を多く発生するようなシーンでは量子化幅を大きくす
るように制御し、発生符号量を抑制しており、また、符
号をあまり発生しないようなシーンでは、量子化幅を小
さくするように制御し、発生符号量を多くしている。
いては、画像に対応した符号化処理は行わず、単位時間
当たりの符号量を一定に制御するために量子化幅を設定
するため、特に、多く符号量を必要とするシーンに対す
る符号化処理においては、量子化幅を大きくとり、発生
符号量を抑えてしまうため画質が劣化する等の問題点が
あった。
ビットレート符号化方式にかわり、可変ビットレート符
号化方式が提案されている。この可変ビットレート符号
化方式における例として、記録する総符号量が決められ
ている蓄積媒体に符号化された画像を記録するとき、画
像毎に必要とする符号量の多少に基づいて、出力するビ
ットレートを制御することにより、蓄積媒体の記録符号
容量の制約を満たしながら平均画質を向上させるものが
ある。
変ビットレート符号化方式を採用しているものが特開平
6−141298号公報に開示されている。
幅を予め設定し、この標準量子化幅に基づいてDCT係
数を量子化し、そして発生する符号量を算出する仮符号
化処理の後、実際に符号化する本符号化処理を実行す
る。即ち、仮符号化処理全体が終了してから、本符号化
処理を実行する「2パス符号化」であって、コンテンツ
全体の特性を知った上で再符号化するため高画質符号化
を達成するものである。
いては、あるビデオコンテンツを符号化する際、仮符号
化処理と本符号化処理との2度の処理を実行する必要が
あるため、少なくとも2倍の時間がかかってしまうた
め、リアルタイム処理を行うことができないといった問
題点があった。
をリアルタイムで実行するため、仮符号化処理なしで符
号化処理を行う「1パス符号化」方式が考えられてい
る。
変ビットレート符号化方式における「1パス符号化」方
式を採用したものがあり、 1998年3月電子情報通信学会総合大会 情報・システム講演論文集2D−11−3(P3)稲田
他 「量子化ステップを利用したMPEG2実時間可変ビッ
トレート符号化方式」が知られている。
準拠した画像符号化処理を行い、所定の期間後に、予め
設定された平均ビットレートになるように、GOP毎に
量子化幅を設定し、発生符号量を調整するものである。
0−164577号公報に開示されるものがある。
量から、それ以後の数GOPで割り当て可能な符号量を
更新し、GOP毎における過去の画面複雑度の平均値に
対する現在の画面のピクチャタイプの複雑度の割合を基
に、目標発生符号量、または目標量子化幅を決定してい
る。
1パスの可変ビットレート符号化装置は、一連の符号化
処理が画質の劣化を招く可能性があるといった問題点が
あった。
は、先に割り当て可能な符号量、あるいは目標レートを
算出し、それに基づいて目標符号量や量子化幅の計算を
しているために、一定期間内での符号量の制御が優先さ
れ、画像シーンに依存した量子化幅の割り当てが十分で
はなく、結果的に固定ビットレートの場合と大差ない符
号化画質になることもあるからである。
化の易しい画像であっても平均ビットレートに対する符
号量が不足していれば、十分な画質が得られているにも
かかわらず、量子化幅を小さくして発生符号量を大きく
しようとするため、割り当て符号量を過剰に多くしてし
まい、符号が無駄に消費されることがある。その結果、
符号を多く発生するような難しい画像において、十分な
符号量を割り当てができなくなることがあるからであ
る。
のであり、リアルタイム処理可能な1パス可変ビットレ
ート符号化制御装置において、従来の1パス可変ビット
レート符号化装置以上に高画質な可変ビットレート符号
化装置を提供することにある。
めに、請求項1記載の発明は、動画像データをあらかじ
め設定した平均ビットレートのもとで、可変ビットレー
トで符号化する動画像可変ビットレート符号化装置にお
いて、与えられた量子化幅で入力動画像データを符号化
し、符号化データと発生符号量とを出力する動画像符号
化手段と、動画像符号化手段で既に符号化済みの画像に
ついて、動画像符号化手段に与えた量子化幅と、動画像
符号化手段から得られる発生符号量とから、平均ビット
レートに対応して、第1の画像単位ごとに、以降に入力
される画像に適用するための基準となる基準量子化幅を
定める量子化幅設定手段と、動画像符号化手段から得ら
れる発生符号量と平均ビットレートに対する過不足量と
から第1の画像単位よりも小さい第2の画像単位ごとに
基準量子化幅を調整し、その調整後の量子化幅を動画像
符号化手段に与える量子化幅調整手段とを有することを
特徴とする。
明において、第1の画像単位は、複数の画面の集合で構
成されることを特徴とする。
記載の発明において、第2の画像単位は、画面を分割し
たブロックの集合で構成されることを特徴とする。
いずれか1項に記載の発明において、量子化幅設定手段
は、現在まで符号化してきた画像の平均量子化幅と、発
生符号量の積で定義される複雑度とを計算し、複雑度と
平均ビットレートの比から前記第1の画像単位ごとに基
準となる基準量子化幅を計算することを特徴とする。
いずれか1項に記載の発明において、量子化幅調整手段
は、設定可能な量子化幅に対する最小値を設定すること
を特徴とする。
いずれか1項に記載の発明において、量子化幅調整手段
は、平均ビットレートからの超過量の最大値を設定し、
最大超過量をバッファサイズとし、平均ビットレートで
符号を引き出す仮想バッファを設定し、仮想バッファの
占有量と、バッファサイズから占有量を減じて求められ
る利用可能な符号量とを用いて前記第2の映像単位ごと
の前記量子化幅の調整を行うことを特徴とする。
いずれか1項に記載の発明において、量子化幅調整手段
は、量子化幅設定手段にて設定された量子化幅を、動画
像符号化手段から得られる発生符号量と平均ビットレー
トからの過不足量とから第2の画像単位ごとに量子化幅
を調整し、第1の量子化幅を計算するとともに、最大ビ
ットレートを設定し、量子化幅設定手段にて設定された
量子化幅に対して、動画像符号化手段から得られる発生
符号量から、最大ビットレートのもとで固定ビットレー
ト制御をした場合に設定される第2の量子化幅を計算
し、これら第1の量子化幅と第2の量子化幅のうち、値
の大きな方を画像符号化手段へ与える量子化幅とするこ
とを特徴とする。
いずれか1項に記載の発明において、量子化幅設定手段
は、第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、第1の画像単位ごとの複雑
度と第1の画像単位あたりのビットレートとから第1の
画像単位の量子化幅を決定することを特徴とする。
いずれか1項に記載の発明において、量子化幅設定手段
は、第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、現在まで符号化してきた画
像の前記第1の画像単位ごとの複雑度の平均値と、直前
の第1の画像単位のみ、あるいは、直前の第1の画像単
位を含む複数の画像単位での平均複雑度と、第1の画像
単位あたりのビットレートとから第1の画像単位の量子
化幅を決定することを特徴とする。
のいずれか1項に記載の発明において、量子化幅調整手
段は、あらかじめ量子化幅の閾値を設定し、平均レート
に対する過不足符号量が超過していない場合には、第1
の画像単位ごとに設定された基準量子化幅の値と、前記
の量子化幅の閾値とを比較し、基準量子化幅が前記閾値
以下であれば量子化幅調整を行わず、基準量子化幅が前
記閾値を越えていれば、平均レートに対する過不足符号
量に応じた量子化幅調整を行い、さらに閾値と比較して
大きな方を選択し、平均レートに対する過不足符号量が
超過している場合には、平均レートに対する過不足符号
量に応じた量子化幅調整を行い、第2の画像単位ごとの
量子化幅を出力することを特徴とする。
あらかじめ設定した平均ビットレートのもとで、可変ビ
ットレートで符号化する動画像可変ビットレート符号化
方法において、与えられた量子化幅で入力動画像データ
を符号化し、符号化データと発生符号量とを出力する動
画像符号化工程と、動画像符号化工程で既に符号化済み
の画像について、動画像符号化工程に与えた量子化幅
と、動画像符号化工程から得られる発生符号量から、平
均ビットレートに対応して、第1の画像単位ごとに、以
降に入力される画像に適用するための基準となる量子化
幅を定める量子化幅設定工程と、量子化幅設定工程にて
設定された量子化幅を、動画像符号化工程から得られる
発生符号量と平均ビットレートからの過不足量から第1
の画像単位よりも小さい第2の画像単位ごとに量子化幅
を調整し、その調整後の量子化幅を動画像符号化工程に
与える量子化幅調整工程とを有することを特徴とする。
の発明において、第1の画像単位は、複数の画面の集合
で構成されることを特徴とする。
は12記載の発明において、第2の画像単位は、画面を
分割したブロックの集合で構成されることを特徴とす
る。
13のいずれか1項に記載の発明において、第1の画像
単位ごとに基準となる量子化幅の設定する工程におい
て、現在まで符号化してきた画像の平均量子化幅と、発
生符号量の積で定義される複雑度とを計算し、複雑度と
平均ビットレートの比から第1の画像単位ごとに基準と
なる量子化幅を計算することを特徴とする。
14のいずれか1項に記載の発明において、第2の画像
単位ごとの量子化幅の調整工程において、設定可能な量
子化幅に対する最小値を設定することを特徴とする。
15のいずれか1項に記載の発明において、第2の画像
単位ごとの量子化幅の調整工程において、平均ビットレ
ートからの超過量の最大値を設定し、最大超過量をバッ
ファサイズとし、平均ビットレートで符号を引き出す仮
想バッファを設定し、仮想バッファの占有量と、バッフ
ァサイズから占有量を減じて求められる利用可能な符号
量とを用いて第2の映像単位ごとの量子化幅の調整を行
うことを特徴とする。
1から16のいずれか1項に記載の発明において、第2
の画像単位ごとの量子化幅調整工程において、量子化幅
設定工程にて設定された量子化幅を、動画像符号化工程
から得られる発生符号量と平均ビットレートからの過不
足量とから第2の画像単位ごとに量子化幅を調整し、第
1の量子化幅を計算するとともに、最大ビットレートを
設定し、量子化幅設定手段にて設定された量子化幅に対
して、動画像符号化工程から得られる発生符号量とか
ら、最大ビットレートのもとで固定ビットレート制御を
した場合に設定される第2の量子化幅を計算し、第1の
量子化幅と第2の量子化幅との値の大きな方を画像符号
化工程へ与える量子化幅とすることを特徴とする。
17のいずれか1項に記載の発明において、第1の画像
単位ごとの基準となる量子化幅の設定工程において、第
1の画像単位ごとの発生符号量の累算値と量子化幅の平
均値とから、これらの積で定義される第1の画像単位ご
との複雑度を計算し、第1の画像単位ごとの複雑度と第
1の画像単位あたりのビットレートとから第1の画像単
位の量子化幅を決定することを特徴とする。
18のいずれか1項に記載の発明において、第1の画像
単位ごとの基準となる量子化幅の設定方法において、第
1の画像単位ごとの発生符号量の累算値と量子化幅の平
均値とから、これらの積で定義される第1の画像単位ご
との複雑度を計算し、現在まで符号化してきた画像の第
1の画像単位ごとの複雑度の平均値と、直前の第1の画
像単位のみ、あるいは、直前の第1の画像単位を含む複
数の画像単位での平均複雑度と、第1の画像単位あたり
のビットレートとから第1の画像単位の量子化幅を決定
することを特徴とする。
19のいずれか1項に記載の発明において、第2の画像
単位ごとの量子化幅調整工程において、あらかじめ量子
化幅の閾値を設定し、平均レートに対する過不足符号量
が超過していない場合には、第1の画像単位ごとに設定
された基準量子化幅の値と、前記の量子化幅の閾値とを
比較し、基準量子化幅が前記閾値以下であれば量子化幅
調整を行わず、基準量子化幅が前記閾値を越えていれ
ば、平均レートに対する過不足符号量に応じた量子化幅
調整を行い、さらに閾値と比較して大きな方を選択し、
平均レートに対する過不足符号量が超過している場合に
は、平均レートに対する過不足符号量に応じた量子化幅
調整を行い、第2の画像単位ごとの量子化幅を出力する
ことを特徴とする。
ト符号化に、画像の特徴を利用した量子幅の設定と、平
均ビットレートの調整を分離して実現している。即ち、
先ず、量子化幅の設定においては、符号化画質を複数の
ピクチャ群に渡って一定のレベルに保つよう量子化幅を
設定する。
記設定された量子化幅を基準として、平均ビットレート
からの実際の発生符号量の過不足から量子化幅を調整す
る。従って、シーンに依存して決まる量子化幅が常に一
定となり、その後で符号量が平均ビットレートに近づく
ように量子化幅が調整されるため、従来の1パス可変ビ
ットレート符号化装置以上に高画質な可変ビットレート
符号化装置を提供することができる。
ことや、シーンに依存して決まる量子化幅と、平均ビッ
トレートからの過不足符号量の状態から過不足符号量の
調整処理を制御することにより、過剰な符号の発生を抑
制して符号を多く費やしたい画像で符号を消費できるよ
うになり、より平均的な画質の向上を得ることができ
る。
を参照しながら詳細に説明する。
符号化方法を説明するための図である。ここで、符号化
方式としては、MPEG−2(ISO/ICE−138
18)の方式を用いることとする。尚、符号化方式とし
ては、MPEG−2(ISO/ICE−13818)に
限らず、スカラー量子化処理を伴い、量子化幅によって
符号量が制御される符号化技術であればよい。例えば、
MPEG−1(ISO/IEC−11172)や、IT
U−T H.261、ITU−T H.263、などの
方式を用いてもよい。
は、符号量制御のための基準として与えられる値である
ので、画面内の局所的な位置に対応する適応量子化を妨
げるものではない。そのため、最終的に与えられた適応
量子化幅が、動画像符号化手段へ符号量制御の基準とし
て与えられた量子化幅と異なっていても構わない。
roup of Picture)に、第2の画像符号
化単位をマクロブロックとするものとする。この符号化
処理の単位についてもここに示したものに限らず、第1
の画像符号化単位および第2の画像符号化単位として
は、大局的に一定期間の画質を制御する単位と、そこで
設定される値をより細かく修正するためのより小さな単
位とが設定できればよく、この方式に限定されるもので
はない。
GOPでもよい。第2の画像符号化単位も複数個のマク
ロブロックからなる単位でもよく、画面の横一列に並ぶ
マクロブロックの集合であったり、MPEG−1やMP
EG−2で定義されているスライス、あるいはH.26
1で定義されるGOB(Group Of Bloc
k)等も考えられる。
ビットレート符号化装置の実施の形態における一構成例
を説明する。
レート符号化装置は、動画像符号化手段101と、ピク
チャ群量子化幅設定手段102と、平均ビットレート調
整手段103とを有して構成される。動画像符号化手段
101は、ここではマクロブロックごとに与えられた量
子化幅Qj に基づいて画像の符号化処理を行い、この符
号化処理における発生符号量Sj を出力する。
ては、動画像符号化手段101に与えられた量子化幅Q
j はピクチャ群量子化設定手段102にも与えられ、こ
の与えられた量子化幅Qj と、動画像符号化手段101
に与えられた量子化幅Qj による符号化処理で発生した
符号量Sj とからGOPの基準量子化幅Qgop を設定す
る。
は、ピクチャ群量子化幅設定手段102に与えられた符
号量Sj は平均ビットレート調整手段103にも与えら
れ、この与えられた符号量Sj と、平均ビットレートと
を比較し、この比較により平均ビットレートに対する実
際に発生した符号量Sj の過不足量をもとめ、その過不
足量に応じてピクチャ群量子化幅設定手段102から与
えられたGOP基準量子化幅Qgop を調整し、動画像符
号化手段101に与える量子化幅Qj を決定する。
段102を説明するための図である。
段102は、量子化幅累積器201と、発生符号量累積
器202と、複雑度計算器203と、ピクチャ群量子化
幅計算器204とを有して構成される。
ットレート調整手段103からピクチャ群量子化設定手
段102に与えられる量子化幅Qj を累積する。この量
子化幅Qj の累積動作は、シーケンス全体に対する処理
動作全体で続けられる。また、発生符号量累積器202
においては、動画像符号化手段101からピクチャ群量
子化設定手段102に与えられる発生符号量Sj を累積
する。この発生符号量Sj の累積動作も、同じくシーケ
ンス全体の間で続けられる処理である。
01に累積された量子化幅から求められた量子化幅Qj
の平均値と、発生符号量累積器202に累積された発生
符号化量Sj の累積値とからGOP当たりの複雑度を計
算する。量子化幅Qj の平均値は、量子化累積器201
から与えられた量子化幅Qj の累積値と、平均ビットレ
ート調整手段103から量子化幅Qj を与えられた回数
とから求められたものであり、また、発生符号化量Sj
の累積値は、それまでの平均ビットレート調整手段10
3からマクロブロック毎に与えられた量子化幅Qj によ
り動画像符号化手段101で発生した発生符号量Sj の
累積値である。
度計算器203から与えられたGOP毎の複雑度と、平
均ビットレートとから、GOP毎における基準量子化幅
Ggop を計算する。
103を説明するための図である。
103は、平均ビットレート仮想バッファ占有量計算器
301と量子化幅修正器302とを有して構成される。
器301は、動画像符号化手段101から与えられたG
OP毎の発生符号量Sj と、平均ビットレートとから、
平均レート仮想バッファのバッファ占有率を計算する。
は、平均ビットレート仮想バッファ占有量計算器301
が算出した平均レート仮想バッファのバッファ占有率に
応じて、ピクチャ群量子化幅設定手段102から与えら
れた量子化幅Qgop を修正し、修正した量子化幅Qgop
を量子化幅Qj として動画像符号化手段101およびピ
クチャ群量子化設定手段102へ送る。
ートである。
て初期化操作を行う。まず、ピクチャ群量子化幅設定手
段102から出力される基準量子化幅Qgop の初期値設
定を行う。予め量子化幅の初期値Qinitを設定してお
き、この初期値Qinitによって基準量子化幅Qgop の初
期化を行い、ピクチャ群量子化幅設定手段102から初
期化された基準量子化幅Qgop を出力する。すなわち、
Qgop =Qinitとする。
のリセット、およびバッファ占有量のリセットを行う。
ここでは、ピクチャ群量子化幅設定手段102内の発生
符号量累積器201における発生符号量Sj の累積値S
sum と、同じくピクチャ群量子化幅設定手段102内の
量子化幅累算器202における量子化幅の累算値Qsum
とを0にリセットする。また、マクロブロック数のカウ
ンタj、GOP数カウンタNgop を0にし、さらに平均
レート仮想バッファの仮想バッファ占有量vbocもリ
セットする。すなわち、
にて、平均ビットレート調整手段103は、ピクチャ群
量子化幅設定手段102から与えられた基準量子化幅Q
gopを更新する。これは、動画像符号化手段101の符
号化処理において発生した符号量Sj と、平均ビットレ
ートとからもとめられた仮想バッファ占有量vbocに
応じてピクチャ群量子化幅設定手段102から出力され
た基準量子化幅Qgopを修正している。
によって修正し、出力する量子化幅Qj を、更新される
前のピクチャ群量子化設定手段102に設定される基準
量子化幅Qgop と、更新される前の仮想バッファ占有量
vbocから、 Qj =Qgop *(1+vboc/Qreact ) と設定する。
対する発生符号量Sj の過不足量における制御の反応の
大きさを決めるパラメータである。
平均ビットレート調整手段103が出力した量子化幅Q
j に基づいて、動画像符号化手段101は、次のマクロ
ブロックに対する符号化処理を行う。
ブロックに対する符号化処理の終了後、仮想バッファ占
有量vbocと、ピクチャ群量子化設定手段102で設
定されていた発生符号化量の累積値Ssum とを更新す
る。仮想バッファ占有量vbocの更新については、仮
想バッファ占有量vbocに、第jマクロブロックに対
する符号化処理で発生した発生符号量Sj を加え、マク
ロブロック当たりの平均ビットレートRave_mbを
差し引く。
内の量子化累積器201において設定されていた発生符
号量の累積値Ssum や、発生符号量累積器202におい
て設定されていた量子化幅の累積値Qsum を更新し、マ
クロブロック数カウンタjをインクリメントする。すな
わち、
バッファ占有量は平均ビットレートRave_mbに対
する実際の発生符号量の過不足量を示している。
5)にて、符号化処理するマクロブロックがGOP最後
のマクロブロックであるか否かを判断する。この判断に
おいて、符号化処理するマクロブロックがGOP最後の
マクロブロックでなければ(ステップS5/NO)、符
号化処理ステップS2に戻り、次のマクロブロックに対
する処理へ移行し、符号化処理を繰り返す。
化処理するマクロブロックがGOP最後のマクロブロッ
クであると判断したとき(ステップS5/YES)、複
雑度更新処理(ステップS6)にて、次のGOPに対す
る符号化処理へ移るとともに、GOP数カウンタNgop
をインクリメントし、先のGOPに対する符号化処理の
シーケンス全体の発生符号量の累積値Ssum と、シーケ
ンス全体の量子化幅の累積値Qsum とから、ピクチャ群
量子化幅設定手段102内の複雑度計算器203におい
て新たな複雑度Xgop を計算し、更新する。すなわち、
て、先のGOPにおける基準量子化幅Qgop を更新す
る。新たな基準量子化幅Qgop は、上記の関係式でもと
められた複雑度Xgop とGOP当たりの平均ビットレー
トRgop との比から計算する。すなわち、更新された後
の新たな複雑度Xgop 、上記の関係式でもとめられたG
OP当たりの平均ビットレートRgop とから、更新後の
基準量子化幅Qgop を、 Qgop =Xgop /Rgop とする。
ブロックに対する符号化処理が終了したか否かを判断す
る(ステップS8)。この判断において、最後のマクロ
ブロックに対する符号化処理が終了したと判断すると
(ステップS8/YES)、このGOPに対する符号化
処理を終了する。また、ステップS8における判断にお
いて、符号化処理しているマクロブロックが、このGO
Pにおける最後のマクロブロックでなく、このGOPに
対する符号化処理が終了していないと判断すると(ステ
ップS8/NO)、符号化処理をステップS2へ移行
し、その後の処理を繰り返し実行する。
図5〜図7に基づいて説明する。
説明するためのブロック図である。図5に示されるブロ
ック図は、図1に示されるブロック図に最大ビットレー
ト調整手段104を追加したものである。
ビットレート調整手段103の出力である量子化幅Qa
と、動画像符号化手段101の出力である発生符号量S
j とから、最大ビットレート調整手段104に設定され
ている最大ビットレートの制約を守るよう量子化幅の調
整を行い、第2の画像単位の量子化幅Qj を出力する。
調整手段104の構成を示すブロック図である。図5に
よれば、最大ビットレート調整手段104は、固定ビッ
トレート符号量制御手段601と、量子化幅選択器60
2とを有して構成される。
は、予め設定されている最大ビットレートのもとで固定
ビットレート符号化を行い、マクロブロック単位の量子
化幅を計算する。量子化幅選択器602は、固定ビット
レート符号量制御手段601において算出された量子化
幅と、平均ビットレート調整手段103における前回符
号化処理したマクロブロックまでの平均ビットレート調
整により設定された量子化幅Qa とを比較して、大きな
方を動画像符号化手段に与える量子化幅Qj とする。
る方式としては、例えば、TestModel 5の方
法を使うことができる。
均ビットレート調整手段から出力された量子化幅に対し
て調整を行う手段として、量子化幅の最小値Qmin を予
め設定しておき、設定された最小値Qmin と、平均ビッ
トレート調整手段103から出力された量子化幅Qa と
の大きい方を、動画像符号化手段101やピクチャ群量
子化幅設定手段102へ出力する量子化幅Qj Qj =max(Qa ,Qmin ) としてもよい。
均ビットレート調整手段から出力された量子化幅に対し
て調整を行う手段として、仮想バッファ占有量vboc
の平均ビットレートからの最大超過符号量Dmaxを設
定して制御してもよい。例えば、仮想バッファ占有量v
bocによる量子化幅の修正において使用されるパラメ
ータQreact については、最大超過符号量Dmaxから
仮想バッファ占有量vbocを差し引くことにより、利
用可能な符号量(Dmax−vboc)を計算し、Qre
act とDmax−vbocとの小さな方をパラメータQ
react Qreact =min(Qreact ,Dmax−vboc) としてもよい。
に、 Qj =Qgop *(1+vboc/(Dmax−vboc)) または、 Qj =Qgop *(Dmax/(Dmax−vboc)) としてもよい。
OP毎の符号化処理において、動画像符号化手段101
が発生した符号量Sj の累積値Ssum.gop と、一つのG
OP当たりで平均ビットレート調整手段103から出力
された量子化幅Qj の累積値Qsum.gop から計算された
平均量子化幅とのこれらの積により算出されるGOP毎
の複雑度Xを求め、それらのシーケンス、即ちそれぞれ
のGOP毎の符号化処理当たりの平均としてXgop を求
めてもよい。
理が終了し、この符号化処理終了によって、第i番目の
符号量の累積値Ssum.gop と、量子化幅の累積値Qsum.
gopとが得られ、これらの積により、第i番目のGOP
の複雑度X(i)が得られる。また、量子化幅の累積は
マクロブロック単位に設定された量子化幅の累積であ
り、Nmb.gopをGOP当たりのマクロブロック数とす
る。
て、以下の式でXgop が計算される。 X(i)=Ssum.gop *(Qsum.gop/Nmb.gop) Xgop =(X(i)+X(i−1)+X(i−2)+・・・+X(1))/i
記のように求められたXgop は、GOP番号1からGO
P番号iまでの複雑度Xの平均に限らず、過去に符号化
処理されたGOP番号であればよく、その中で設定され
たGOP番号からのGOP番号iまでの複雑度Xの平均
としてもよい。ここで、Xgop は、 Xgop =(X(i)+X(i−1)+・・・+X(i−N))/(N+1) Nは平均を計算するGOPの数を設定するパラメータで
ある。
述のようにGOP毎の複雑度Xを計算し、それらのシー
ケンス全体の、即ちGOP番号1からGOP番号iまで
の複雑度Xから算出された平均複雑度Xave と、直前に
符号化したGOPを含む過去数GOP、即ち、直前に符
号化処理されたGOPからGOP番号iまでのGOP毎
の複雑度Xから算出された平均複雑度Xgop との関係か
ら基準値量子化幅Qgop を設定してもよい。
い。 Xave =(X(i)+X(i−1)+X(i−2)+・・・+X(1))/i Xgop =(X(i)+X(i−1)+・・・・+X(i−N))/(N+1) Qgop =(Xave /Rgop )*(1+a*(Xgop −Xave ))
求められるXの偏差によるQgop を設定するときの制御
の強さを決めるパラメータであり、さらにシーケンス全
体の複雑度の標準偏差δxを計算して、このパラメータ
aを、 a=a′/δx としてもよい。
均ビットレート調整手段103における基準量子化幅Q
gop の修正の際に、量子化幅の許容限としての閾値Qth
を設けて平均ビットレートを調整してもよい。例えば、
図4のフローチャートに基づく説明におけるステップS
2の量子化幅更新処理において、図7のフローチャート
に示されるような処理を実行する。
理において発生する符号量Sj が、一つのマクロブロッ
ク当たり割り当てる平均ビットレートに対して超過して
いるか否かを判断する(ステップS11)。この判断に
おいて、符号量Sj が平均ビットレートを超過している
と判断すると(ステップS11/YES)、平均ビット
レート調整手段103において、ピクチャ群量子化設定
手段102から入力した基準量子化幅Qgop を更新し
(ステップS12)、更新した後の量子化幅Qjを動画
像符号化手段101およびピクチャ群量子化設定手段1
02へ出力する。
j が平均ビットレートを超過していないと判断すると
(ステップS11/NO)、ピクチャ群量子化幅設定手
段102から入力した基準量子化幅Qgop が、量子化幅
の許容限としての閾値Qth以上であるか否かを判断する
(ステップS13)。この判断において、ピクチャ群量
子化幅設定手段102から入力した基準量子化幅Qgop
が、量子化幅の許容限としての閾値Qth以上であると判
断すると(ステップS13/YES)、前述と同じよう
にピクチャ群量子化設定手段102から入力した基準量
子化幅Qgop を更新し(ステップS12)、更新した後
の量子化幅Qj を計算し(ステップS14)、さらに、
計算した後の量子化幅Qj と閾値とを比較して大きな方
を選択する(ステップS15)。
群量子化幅設定手段102から入力した基準量子化幅Q
gop が、量子化幅の許容限としての閾値Qth以下である
と判断すると(ステップS13/NO)、ピクチャ群量
子化幅設定手段102から入力した基準量子化幅Qgop
に対する変更は行わず、この基準量子化幅Qgop を量子
化幅Qj として(ステップS16)、動画像符号化手段
101へ出力する。
03は、ピクチャ群量子化幅設定手段102から入力さ
れた基準量子化幅の調整を常時実行するのではなく、マ
クロブロック毎の符号化処理の際に発生した符号量の一
つのマクロブロックあたりに割り当てた平均ビットレー
トに対する過不足量と、基準量子化幅と量子化幅の許容
限との大小関係とにより、ピクチャ群量子化幅設定手段
102から入力された基準量子化幅の調整処理を制御す
る。
102から入力された基準量子化幅が設定された許容限
以下で、マクロブロック毎の符号化処理の際に発生した
符号量が、一つのマクロブロックあたりに割り当てた平
均ビットレート以下である場合に、平均ビットレートに
おける余剰分を補おうとするための無駄な発生符号量を
抑制することができる。
力されたときに抑制した符号を多く分配できるようにな
り、平均画質を向上することができる。
によれば、可変ビットレート符号化のリアルタイム処理
を実行することが可能であり、さらに、この可変ビット
レート符号化のリアルタイム処理を行う従来の1パス可
変ビットレート符号化装置以上に、高画質符号化を達成
することができる。
レート符号化装置の一構成例を示すブロック図である。
幅設定手段の構成例を示すブロック図である。
調整手段の構成例を示すブロック図である。
レート符号化装置の動作例を示すフローチャートであ
る。
ットレート符号化装置の構成例を示すブロック図であ
る。
ート調整手段の構成例を示すブロック図である。
幅更新処理に動作例を示すフローチャートである。
を説明するためのブロック図である。
Claims (20)
- 【請求項1】 動画像データをあらかじめ設定した平均
ビットレートのもとで、可変ビットレートで符号化する
動画像可変ビットレート符号化装置において、 与えられた量子化幅で入力動画像データを符号化し、符
号化データと発生符号量とを出力する動画像符号化手段
と、前記動画像符号化手段で既に符号化済みの画像につい
て、 前記動画像符号化手段に与えた量子化幅と、前記動
画像符号化手段から得られる発生符号量とから、前記平
均ビットレートに対応して、第1の画像単位ごとに、以
降に入力される画像に適用するための基準となる基準量
子化幅を定める量子化幅設定手段と、 前記動画像符号化手段から得られる発生符号量と前記平
均ビットレートに対する過不足量とから前記第1の画像
単位よりも小さい第2の画像単位ごとに前記基準量子化
幅を調整し、その調整後の量子化幅を前記動画像符号化
手段に与える量子化幅調整手段とを有することを特徴と
する動画像可変ビットレート符号化装置。 - 【請求項2】 前記第1の画像単位は、複数の画面の集
合で構成されることを特徴とする請求項1記載の動画像
可変ビットレート符号化装置。 - 【請求項3】 前記第2の画像単位は、画面を分割した
ブロックの集合で構成されることを特徴とする請求項1
また2記載の動画像可変ビットレート符号化装置。 - 【請求項4】 前記量子化幅設定手段は、 現在まで符号化してきた画像の平均量子化幅と、前記発
生符号量の積で定義される複雑度とを計算し、前記複雑
度と平均ビットレートの比から前記第1の画像単位ごと
に基準となる前記基準量子化幅を計算することを特徴と
する請求項1から3のいずれか1項に記載の動画像可変
ビットレート符号化装置。 - 【請求項5】 前記量子化幅調整手段は、 設定可能な量子化幅に対する最小値を設定することを特
徴とする1から4のいずれか1項に記載の動画像可変ビ
ットレート符号化装置。 - 【請求項6】 前記量子化幅調整手段は、 前記平均ビットレートからの超過量の最大値を設定し、
前記最大超過量をバッファサイズとし、前記平均ビット
レートで符号を引き出す仮想バッファを設定し、前記仮
想バッファの占有量と、バッファサイズから占有量を減
じて求められる利用可能な符号量とを用いて前記第2の
映像単位ごとの前記量子化幅の調整を行うことを特徴と
する請求項1から5のいずれか1項に記載の動画像可変
ビットレート符号化装置。 - 【請求項7】 前記量子化幅調整手段は、 前記量子化幅設定手段にて設定された量子化幅を、前記
動画像符号化手段から得られる発生符号量と前記平均ビ
ットレートからの過不足量とから前記第2の画像単位ご
とに量子化幅を調整し、第1の量子化幅を計算するとと
もに、 最大ビットレートを設定し、前記量子化幅設定手段にて
設定された量子化幅に対して、前記動画像符号化手段か
ら得られる発生符号量から、前記最大ビットレートのも
とで固定ビットレート制御をした場合に設定される第2
の量子化幅を計算し、これら第1の量子化幅と第2の量
子化幅のうち、値の大きな方を前記画像符号化手段へ与
える量子化幅とすることを特徴とする請求項1から6の
いずれか1項に記載の動画像可変ビットレート符号化装
置。 - 【請求項8】 前記量子化幅設定手段は、 前記第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、前記第1の画像単位ごとの
複雑度と第1の画像単位あたりのビットレートとから第
1の画像単位の量子化幅を決定することを特徴とする請
求項1から7のいずれか1項に記載の動画像可変ビット
レート符号化装置。 - 【請求項9】 前記量子化幅設定手段は、 前記第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、現在まで符号化してきた画
像の前記第1の画像単位ごとの複雑度の平均値と、直前
の第1の画像単位のみ、あるいは、直前の第1の画像単
位を含む複数の画像単位での平均複雑度と、第1の画像
単位あたりのビットレートとから第1の画像単位の量子
化幅を決定することを特徴とする請求項1から8のいず
れか1項に記載の動画像可変ビットレート符号化装置。 - 【請求項10】 前記量子化幅調整手段は、 あらかじめ量子化幅の閾値を設定し、平均レートに対す
る過不足符号量が超過していない場合には、 前記第1の画像単位ごとに設定された基準量子化幅の値
と、前記の量子化幅の閾値とを比較し、前記基準量子化
幅が前記閾値以下であれば量子化幅調整を行わず、 前記基準量子化幅が前記閾値を越えていれば、 平均レートに対する過不足符号量に応じた量子化幅調整
を行い、さらに閾値と比較して大きな方を選択し、 平均レートに対する過不足符号量が超過している場合に
は、 平均レートに対する過不足符号量に応じた量子化幅調整
を行い、前記第2の画像単位ごとの量子化幅を出力する
ことを特徴とする請求項1から9のいずれか1項に記載
の動画像可変ビットレート符号化装置。 - 【請求項11】 動画像データをあらかじめ設定した平
均ビットレートのもとで、可変ビットレートで符号化す
る動画像可変ビットレート符号化方法において、 与えられた量子化幅で入力動画像データを符号化し、符
号化データと発生符号量とを出力する動画像符号化工程
と、前記動画像符号化工程で既に符号化済みの画像につい
て、 前記動画像符号化工程に与えた量子化幅と、前記動
画像符号化工程から得られる発生符号量から、前記平均
ビットレートに対応して、第1の画像単位ごとに、以降
に入力される画像に適用するための基準となる基準量子
化幅を定める量子化幅設定工程と、 前記量子化幅設定工程にて設定された量子化幅を、前記
動画像符号化工程から得られる発生符号量と平均ビット
レートからの過不足量から前記第1の画像単位よりも小
さい第2の画像単位ごとに量子化幅を調整し、その調整
後の量子化幅を前記動画像符号化工程に与える量子化幅
調整工程とを有することを特徴とする動画像可変ビット
レート符号化方法。 - 【請求項12】 前記第1の画像単位は、複数の画面の
集合で構成されることを特徴とする請求項11記載の動
画像可変ビットレート符号化方法。 - 【請求項13】 前記第2の画像単位は、画面を分割し
たブロックの集合で構成されることを特徴とする請求項
11また12記載の動画像可変ビットレート符号化方
法。 - 【請求項14】 前記第1の画像単位ごとに基準となる
量子化幅の設定する工程において、 現在まで符号化してきた画像の平均量子化幅と、前記発
生符号量の積で定義される複雑度とを計算し、前記複雑
度と平均ビットレートの比から前記第1の画像単位ごと
に基準となる基準量子化幅を計算することを特徴とする
請求項11から13のいずれか1項に記載の動画像可変
ビットレート符号化方法。 - 【請求項15】 前記第2の画像単位ごとの量子化幅の
調整工程において、 設定可能な量子化幅に対する最小値を設定することを特
徴とする11から14のいずれか1項に記載の動画像可
変ビットレート符号化方法。 - 【請求項16】 前記第2の画像単位ごとの量子化幅の
調整工程において、 前記平均ビットレートからの超過量の最大値を設定し、 前記最大超過量をバッファサイズとし、前記平均ビット
レートで符号を引き出す仮想バッファを設定し、 前記仮想バッファの占有量と、バッファサイズから占有
量を減じて求められる利用可能な符号量とを用いて前記
第2の画像単位ごとの前記量子化幅の調整を行うことを
特徴とする請求項11から15のいずれか1項に記載の
動画像可変ビットレート符号化方法。 - 【請求項17】 前記第2の画像単位ごとの量子化幅調
整工程において、 前記量子化幅設定工程にて設定された量子化幅を、前記
動画像符号化工程から得られる発生符号量と前記平均ビ
ットレートからの過不足量とから前記第2の画像単位ご
とに量子化幅を調整し、第1の量子化幅を計算するとと
もに、 最大ビットレートを設定し、 前記量子化幅設定工程にて設定された量子化幅に対し
て、前記動画像符号化工程から得られる発生符号量か
ら、前記最大ビットレートのもとで固定ビットレート制
御をした場合に設定される第2の量子化幅を計算し、 前記第1の量子化幅と第2の量子化幅のうち、値の大き
な方を前記画像符号化工程へ与える量子化幅とすること
を特徴とする請求項11から16のいずれか1項に記載
の動画像可変ビットレート符号化方法。 - 【請求項18】 前記第1の画像単位ごとの基準となる
量子化幅の設定工程において、 前記第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、 前記第1の画像単位ごとの複雑度と第1の画像単位あた
りのビットレートとから第1の画像単位の量子化幅を決
定することを特徴とする請求項11から17のいずれか
1項に記載の動画像可変ビットレート符号化方法。 - 【請求項19】 前記第1の画像単位ごとの基準となる
量子化幅の設定方法において、 前記第1の画像単位ごとの発生符号量の累算値と量子化
幅の平均値とから、これらの積で定義される第1の画像
単位ごとの複雑度を計算し、 現在まで符号化してきた画像の前記第1の画像単位ごと
の複雑度の平均値と、直前の第1の画像単位のみ、ある
いは、直前の第1の画像単位を含む複数の画像単位での
平均複雑度と、第1の画像単位あたりのビットレートと
から第1の画像単位の量子化幅を決定することを特徴と
する請求項11から18のいずれか1項に記載の動画像
可変ビットレート符号化方法。 - 【請求項20】 前記第2の画像単位ごとの量子化幅調
整工程において、 あらかじめ量子化幅の閾値を設定し、平均レートに対す
る過不足符号量が超過していない場合には、 前記第1の画像単位ごとに設定された基準量子化幅の値
と、前記の量子化幅の閾値とを比較し、前記基準量子化
幅が前記閾値以下であれば量子化幅調整を行わず、 前記基準量子化幅が前記閾値を越えていれば、 平均レートに対する過不足符号量に応じた量子化幅調整
を行い、さらに閾値と比較して大きな方を選択し、 平均レートに対する過不足符号量が超過している場合に
は、 平均レートに対する過不足符号量に応じた量子化幅調整
を行い、第2の画像単位ごとの量子化幅を出力すること
を特徴とする請求項11から19のいずれか1項に記載
の動画像可変ビットレート符号化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36822298A JP3259702B2 (ja) | 1998-12-24 | 1998-12-24 | 動画像可変ビットレート符号化装置および方法 |
US09/467,812 US6879632B1 (en) | 1998-12-24 | 1999-12-20 | Apparatus for and method of variable bit rate video coding |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36822298A JP3259702B2 (ja) | 1998-12-24 | 1998-12-24 | 動画像可変ビットレート符号化装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000197049A JP2000197049A (ja) | 2000-07-14 |
JP3259702B2 true JP3259702B2 (ja) | 2002-02-25 |
Family
ID=18491267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36822298A Expired - Lifetime JP3259702B2 (ja) | 1998-12-24 | 1998-12-24 | 動画像可変ビットレート符号化装置および方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6879632B1 (ja) |
JP (1) | JP3259702B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2830143B1 (fr) * | 2001-09-21 | 2004-02-27 | St Microelectronics Sa | Procede et dispositif de compression d'un signal d'image |
GB2387059A (en) * | 2002-03-28 | 2003-10-01 | Sony Uk Ltd | Data compression using trial quantisations to determine final quantiser |
US7263125B2 (en) * | 2002-04-23 | 2007-08-28 | Nokia Corporation | Method and device for indicating quantizer parameters in a video coding system |
US7567722B2 (en) * | 2005-03-22 | 2009-07-28 | Qualcomm Incorporated | Dynamically scaled file encoding |
US20060233258A1 (en) * | 2005-04-15 | 2006-10-19 | Microsoft Corporation | Scalable motion estimation |
KR100718134B1 (ko) * | 2005-07-21 | 2007-05-14 | 삼성전자주식회사 | 비트율에 적응적인 영상 데이터 이진 산술 부호화/복호화장치 및 방법 |
JP4795223B2 (ja) * | 2006-01-31 | 2011-10-19 | キヤノン株式会社 | 画像処理装置 |
KR100790986B1 (ko) | 2006-03-25 | 2008-01-03 | 삼성전자주식회사 | 가변 비트율 비디오 코딩에서 비트율을 제어하는 장치 및방법 |
US8155195B2 (en) * | 2006-04-07 | 2012-04-10 | Microsoft Corporation | Switching distortion metrics during motion estimation |
US8494052B2 (en) * | 2006-04-07 | 2013-07-23 | Microsoft Corporation | Dynamic selection of motion estimation search ranges and extended motion vector ranges |
US20070268964A1 (en) * | 2006-05-22 | 2007-11-22 | Microsoft Corporation | Unit co-location-based motion estimation |
US8213498B2 (en) | 2007-05-31 | 2012-07-03 | Qualcomm Incorporated | Bitrate reduction techniques for image transcoding |
KR20080107965A (ko) * | 2007-06-08 | 2008-12-11 | 삼성전자주식회사 | 객체 경계 기반 파티션을 이용한 영상의 부호화, 복호화방법 및 장치 |
US20090074315A1 (en) * | 2007-09-19 | 2009-03-19 | Himax Technologies Limited | Method of image compression and device thereof |
MX2010012040A (es) * | 2008-05-16 | 2010-12-06 | Sharp Kk | Aparato de grabacion de video. |
US20110255594A1 (en) | 2010-04-15 | 2011-10-20 | Soyeb Nagori | Rate Control in Video Coding |
US8976857B2 (en) * | 2011-09-23 | 2015-03-10 | Microsoft Technology Licensing, Llc | Quality-based video compression |
DE102018115959A1 (de) | 2018-07-02 | 2020-01-02 | Wirtgen Gmbh | Verschleißbauteil einer Fräsmaschine, Fräsmaschine und Verfahren zur Bestimmung des Verschleißes des Verschleißbauteils |
FI3878175T3 (fi) * | 2018-11-08 | 2024-05-16 | Interdigital Vc Holdings Inc | Kvantisointi videokoodaukselle tai dekoodaukselle lohkon pinnalla |
US20240171741A1 (en) * | 2022-11-22 | 2024-05-23 | Rovi Guides, Inc. | Video compression at scene changes for low latency interactive experience |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5038209A (en) * | 1990-09-27 | 1991-08-06 | At&T Bell Laboratories | Adaptive buffer/quantizer control for transform video coders |
EP0514663A3 (en) | 1991-05-24 | 1993-07-14 | International Business Machines Corporation | An apparatus and method for motion video encoding employing an adaptive quantizer |
JP2950065B2 (ja) | 1992-10-28 | 1999-09-20 | 日本ビクター株式会社 | 可変転送レート符号化装置 |
KR0166722B1 (ko) | 1992-11-30 | 1999-03-20 | 윤종용 | 부호화 및 복호화방법 및 그 장치 |
US5703646A (en) | 1993-04-09 | 1997-12-30 | Sony Corporation | Picture encoding method, picture encoding apparatus and picture recording medium |
JP3224465B2 (ja) | 1993-12-22 | 2001-10-29 | シャープ株式会社 | 画像符号化装置 |
JP4223571B2 (ja) | 1995-05-02 | 2009-02-12 | ソニー株式会社 | 画像符号化方法及び装置 |
KR100471956B1 (ko) * | 1996-04-25 | 2005-05-16 | 마쯔시다덴기산교 가부시키가이샤 | 화상압축부호화장치및방법 |
JPH1023433A (ja) | 1996-06-27 | 1998-01-23 | Sanyo Electric Co Ltd | 目標符号量計算装置及び符号量制御装置 |
JP3151173B2 (ja) | 1996-09-25 | 2001-04-03 | 松下電器産業株式会社 | 画像圧縮符号化装置及び方法 |
US6055330A (en) * | 1996-10-09 | 2000-04-25 | The Trustees Of Columbia University In The City Of New York | Methods and apparatus for performing digital image and video segmentation and compression using 3-D depth information |
JPH10164588A (ja) | 1996-11-26 | 1998-06-19 | Sony Corp | 映像信号符号化方法、映像信号符号化装置及び記録媒体 |
JP3392335B2 (ja) | 1996-11-26 | 2003-03-31 | 松下電器産業株式会社 | 動画像可変ビットレート符号化装置、動画像可変ビットレート符号化方法、および動画像可変ビットレート符号化プログラム記録媒体 |
JP3872849B2 (ja) | 1996-11-28 | 2007-01-24 | 松下電器産業株式会社 | 動画像符号化装置 |
US5969764A (en) | 1997-02-14 | 1999-10-19 | Mitsubishi Electric Information Technology Center America, Inc. | Adaptive video coding method |
JPH10294936A (ja) | 1997-04-21 | 1998-11-04 | Sony Corp | バッファ残量制限処理装置 |
US6181742B1 (en) * | 1998-01-26 | 2001-01-30 | International Business Machines Corporation | Single pass target allocation for video encoding |
-
1998
- 1998-12-24 JP JP36822298A patent/JP3259702B2/ja not_active Expired - Lifetime
-
1999
- 1999-12-20 US US09/467,812 patent/US6879632B1/en not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
MPEG実時間可変ビットレート符号化方式,テレビジョン学会技術報告,20/68,1996.12 |
Also Published As
Publication number | Publication date |
---|---|
JP2000197049A (ja) | 2000-07-14 |
US6879632B1 (en) | 2005-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3259702B2 (ja) | 動画像可変ビットレート符号化装置および方法 | |
JP3871840B2 (ja) | 圧縮動画像再符号化装置 | |
EP1372113B1 (en) | Variable bit rate video encoding method and device | |
US6141380A (en) | Frame-level rate control for video compression | |
EP1063851B1 (en) | Apparatus and method of encoding moving picture signal | |
US6823008B2 (en) | Video bitrate control method and device for digital video recording | |
Wang | Rate control for MPEG video coding | |
JPH07184196A (ja) | 画像符号化装置 | |
GB2337392A (en) | Encoder and encoding method | |
JP3907875B2 (ja) | 符号化レート制御装置及び情報符号化装置 | |
JP3508916B2 (ja) | 動画像可変ビットレート符号化方法および装置 | |
JP2004274236A (ja) | 符号化装置および符号化方法、プログラム、並びに記録媒体 | |
JP4362795B2 (ja) | 動画像符号化装置及びその方法 | |
JPH10164577A (ja) | 動画像符号化装置 | |
KR100588795B1 (ko) | 부호화 장치 및 부호화 방법 | |
JP4362794B2 (ja) | 動画像符号化装置及びその方法 | |
JP3812269B2 (ja) | 動画像符号化装置及びその方法 | |
JP3218994B2 (ja) | 画像符号化方法および装置 | |
JP2005045736A (ja) | 画像信号符号化方法及び装置、符号化制御装置並びにプログラム | |
JP2000041240A (ja) | 可変ビットレート符号化装置および方法 | |
JP3889552B2 (ja) | 符号量割り当て装置および方法 | |
JP4193080B2 (ja) | 符号化装置及び方法 | |
JP2001025015A (ja) | 動画像符号化装置及びその方法 | |
JP3211778B2 (ja) | 改良された適応性のあるビデオ符号化方法 | |
JP4035747B2 (ja) | 符号化装置および符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20011113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071214 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081214 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091214 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091214 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131214 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |