JP2000059766A - 符号化装置および方法、並びに提供媒体 - Google Patents
符号化装置および方法、並びに提供媒体Info
- Publication number
- JP2000059766A JP2000059766A JP20015898A JP20015898A JP2000059766A JP 2000059766 A JP2000059766 A JP 2000059766A JP 20015898 A JP20015898 A JP 20015898A JP 20015898 A JP20015898 A JP 20015898A JP 2000059766 A JP2000059766 A JP 2000059766A
- Authority
- JP
- Japan
- Prior art keywords
- data
- picture
- encoding
- code
- extension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
に、再符号化に伴う画像の劣化を抑制する。 【解決手段】 符号化パラメータ多重装置103は、現
符号化パラメータと履歴復号装置104より供給される
履歴情報に含まれる複数世代の符号化パラメータとを、
復号装置102より供給されるビデオデータに多重化
し、ベースバンドのデジタルビデオ信号として符号化パ
ラメータ分離装置105に出力する。符号化パラメータ
分離装置105は、符号化装置106で符号化に使用す
る符号化パラメータを選択し、現符号化パラメータとし
て符号化装置106に出力するともに、残りの複数世代
の符号化パラメータを履歴符号化装置107に出力す
る。符号化装置106は、符号化パラメータ分離装置1
05より供給されるビデオデータを現符号化パラメータ
で符号化してビットストリームを生成すると共に、その
ビットストリームに履歴符号化装置107より供給され
る複数世代の符号化パラメータが履歴情報として含まれ
ているユーザデータを多重化し、後段のトランスコーダ
に出力する。
Description
方法、並びに提供媒体に関し、特に、動画像信号を、例
えば光磁気ディスクや磁気テープなどの記録媒体に記録
し、これを再生して、ステレオ視が可能なディスプレイ
などに表示したり、テレビ会議システム、テレビ電話シ
ステム、放送用機器など、動画像信号を伝送路を介して
送信側から受信側に伝送し、受信側において、これを受
信して表示する場合などに用いて好適な符号化装置およ
び方法、並びに提供媒体に関する。
話システムなどのように、動画像信号を遠隔地に伝送す
るシステムにおいては、伝送路を効率良く利用するた
め、映像信号のライン相関やフレーム間相関が利用され
て、画像信号が圧縮符号化される。
れるビットストリームが、所定のビットレートになるよ
うに符号化が行われる。しかしながら、実運用上におい
て、伝送路の都合により、ビットストリームのビットレ
ートを変換する必要が生じることがある。このような場
合、図68に示すようなトランスコーダ131により、
符号化されている情報を一旦復号し、ビットレートが所
定の値になるように、再び符号化する方法が一般的であ
る。図68の例の場合、10Mbpsで送られてきたビット
ストリームが、復号装置132により復号され、デジタ
ルビデオ信号として符号化装置133に供給され、符号
化装置133により、ビットレートが5Mbpsであるビッ
トストリームに符号化されて出力される。
再符号化する場合、符号化装置133には、図69に示
すように、映像信号のライン相関やフレーム間相関を検
出する動き検出部134が必要となり、符号化装置13
3の規模が大きくなる課題があった。
集が秒単位で行われるので、フレームの画像情報が他の
フレームの画像情報と独立しているほうがよい。そこ
で、図70に示すように、低いビットレート(3乃至9
Mbps)で転送しても画質が劣化しないように、情報が相
関関係にあるフレームの集合であるGOP(Group of Pictu
re)を構成するフレーム数が多いLong GOPの符号化装置
133−1から出力されたビットストリームは、放送局
の符号化装置133−2により、GOPを構成するフレー
ム数が少ないShort GOPに変換されて高ビットレート
(18乃至50Mbps)で伝送され、編集終了後、符号化
装置133−3により、再度Long GOPに変換されて出力
される。このように、画像情報に符号化、復号が繰り返
されると、符号化の度に使用される符号化パラメータが
変化するので画像情報が劣化する課題があった。
ものであり、過去に演算した動きベクトルを用いて再符
号化を行うことにより、装置の規模を小さくするととも
に、再符号化に伴う画像の劣化を抑制することを可能と
するものである。
装置は、ソースビデオデータをMPEG規格に基づいて符号
化し、符号化ビットストリームを生成する符号化手段
と、符号化手段により生成された符号化ビットストリー
ムのピクチャ層のユーザデータエリアに、ソースビデオ
データの過去の符号化処理における符号化履歴情報を挿
入する挿入手段とを備えることを特徴とする。
デオデータをMPEG規格に基づいて符号化し、符号化ビッ
トストリームを生成する符号化ステップと、符号化ステ
ップで生成された符号化ビットストリームのピクチャ層
のユーザデータエリアに、ソースビデオデータの過去の
符号化処理における符号化履歴情報を挿入する挿入ステ
ップとを含むことを特徴とする。
オデータをMPEG規格に基づいて符号化し、符号化ビット
ストリームを生成する符号化ステップと、符号化ステッ
プで生成された符号化ビットストリームのピクチャ層の
ユーザデータエリアに、ソースビデオデータの過去の符
号化処理における符号化履歴情報を挿入する挿入ステッ
プとを含む処理を実行させるコンピュータが読み取り可
能なプログラムを提供することを特徴とする。
記載の符号化方法、および請求項3に記載の提供媒体に
おいては、生成された符号化ビットストリームのピクチ
ャ層のユーザデータエリアに、符号化履歴情報が挿入さ
れる。
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態(但し一例)を付
加して本発明の特徴を記述すると、次のようになる。
デオデータをMPEG規格に基づいて符号化し、符号化ビッ
トストリームを生成する符号化手段(例えば、図15の
符号化装置106)と、符号化手段により生成された符
号化ビットストリームのピクチャ層のユーザデータエリ
アに、ソースビデオデータの過去の符号化処理における
符号化履歴情報を挿入する挿入手段(例えば、図15の
符号化装置106)とを備えることを特徴とする。
のに限定することを意味するものではない。
説明する前に、動画像信号の圧縮符号化について説明す
る。なお、本明細書においてシステムの用語は、複数の
装置、手段などにより構成される全体的な装置を意味す
るものである。
システムなどのように、動画像信号を遠隔地に伝送する
システムにおいては、伝送路を効率良く利用するため、
映像信号のライン相関やフレーム間相関を利用して、画
像信号を圧縮符号化するようになされている。
えばDCT(離散コサイン変換)処理するなどして圧縮す
ることができる。
信号をさらに圧縮して符号化することが可能となる。例
えば図1に示すように、時刻t1乃至t3において、フ
レーム画像PC1乃至PC3がそれぞれ発生している場
合、フレーム画像PC1およびPC2の画像信号の差を
演算して、PC12を生成し、また、フレーム画像PC
2およびPC3の差を演算して、PC23を生成する。
通常、時間的に隣接するフレームの画像は、それ程大き
な変化を有していないため、両者の差を演算すると、そ
の差分信号は小さな値のものとなる。そこで、この差分
信号を符号化すれば、符号量を圧縮することができる。
では、元の画像を復元することができない。そこで、各
フレームの画像を、Iピクチャ、PピクチャまたはBピ
クチャの3種類のピクチャタイプのいずれかとし、画像
信号を圧縮符号化するようにしている。
ームF1乃至F17までの17フレームの画像信号をグ
ループオブピクチャ(GOP)とし、処理の1単位とする。
そして、その先頭のフレームF1の画像信号はIピクチ
ャとして符号化し、第2番目のフレームF2はBピクチ
ャとして、また第3番目のフレームF3はPピクチャと
して、それぞれ処理する。以下、第4番目以降のフレー
ムF4乃至F17は、BピクチャまたはPピクチャとし
て交互に処理する。
レーム分の画像信号をそのまま伝送する。これに対し
て、Pピクチャの画像信号としては、基本的には、図2
に示すように、それより時間的に先行するIピクチャま
たはPピクチャの画像信号からの差分を伝送する。さら
にBピクチャの画像信号としては、基本的には、図3に
示すように、時間的に先行するフレームまたは後行する
フレームの両方の平均値からの差分を求め、その差分を
符号化する。
号化する方法の原理を示している。同図に示すように、
最初のフレームF1は、Iピクチャとして処理されるた
め、そのまま伝送データF1Xとして伝送路に伝送され
る(画像内符号化)。これに対して、第2のフレームF
2は、Bピクチャとして処理されるため、時間的に先行
するフレームF1と、時間的に後行するフレームF3の
平均値との差分が演算され、その差分が伝送データF2
Xとして伝送される。
さらに細かく説明すると、4種類存在する。その第1の
処理は、元のフレームF2のデータをそのまま伝送デー
タF2Xとして伝送するものであり(SP1)(イント
ラ符号化)、Iピクチャにおける場合と同様の処理とな
る。第2の処理は、時間的に後のフレームF3からの差
分を演算し、その差分(SP2)を伝送するものである
(後方予測符号化)。第3の処理は、時間的に先行する
フレームF1との差分(SP3)を伝送するものである
(前方予測符号化)。さらに第4の処理は、時間的に先
行するフレームF1と後行するフレームF3の平均値と
の差分(SP4)を生成し、これを伝送データF2Xと
して伝送するものである(両方向予測符号化)。
送データが最も少なくなる方法が採用される。
演算する対象となるフレームの画像(予測画像)との間
の動きベクトルx1(フレームF1とF2の間の動きベ
クトル)(前方予測の場合)、もしくはx2(フレーム
F3とF2の間の動きベクトル)(後方予測の場合)、
またはx1とx2の両方(両方向予測の場合)が、差分
データとともに伝送される。
的に先行するフレームF1を予測画像として、このフレ
ームとの差分信号(SP3)と、動きベクトルx3が演
算され、これが伝送データF3Xとして伝送される(前
方予測符号化)。あるいはまた、元のフレームF3のデ
ータが、そのままデータF3Xとして伝送される(SP
1)(イントラ符号化)。いずれの方法により伝送され
るかは、Bピクチャにおける場合と同様に、伝送データ
がより少なくなる方法が選択される。
信号を符号化して伝送し、これを復号化する装置の構成
例を示している。符号化装置1は、入力された映像信号
を符号化し、伝送路としての記録媒体3に伝送するよう
になされている。そして、復号装置2は、記録媒体3に
記録された信号を再生し、これを復号して出力するよう
になされている。
信号が前処理回路11に入力され、そこで輝度信号と色
信号(本実施の形態の場合、色差信号)が分離され、そ
れぞれA/D変換器12,13でアナログ信号がデジタル
信号に変換される。A/D変換器12,13によりデジタ
ル信号に変換された映像信号は、フレームメモリ14に
供給され、記憶される。フレームメモリ14は、輝度信
号を輝度信号フレームメモリ15に、また、色差信号を
色差信号フレームメモリ16に、それぞれ記憶させる。
モリ14に記憶されたフレームフォーマットの信号を、
ブロックフォーマットの信号に変換する。すなわち、図
6に示すように、フレームメモリ14に記憶された映像
信号は、1ライン当りHドットのラインがVライン集め
られた、図6(A)に示すようなフレームフォーマットの
データとされている。フォーマット変換回路17は、こ
の1フレームの信号を、図6(B)に示すように、16ラ
インを単位としてM個のスライスに区分する。そして、
各スライスは、M個のマクロブロックに分割される。マ
クロブロックは、図6(C)に示すように、16×16個
の画素(ドット)に対応する輝度信号により構成され、
この輝度信号は、さらに8×8ドットを単位とするブロ
ックY[1]乃至Y[4]に区分される。そして、この
16×16ドットの輝度信号には、8×8ドットのCb
信号と、8×8ドットのCr信号が対応される。
されたデータは、フォーマット変換回路17からエンコ
ーダ18に供給され、ここでエンコード(符号化)が行
われる。その詳細については、図7を参照して後述す
る。
号は、ビットストリームとして伝送路に出力される。例
えば記録回路19に供給され、デジタル信号として記録
媒体3に記録される。
れたデータは、復号装置2のデコーダ31に供給され、
デコードされる。デコーダ31の詳細については、図1
2を参照して後述する。
は、フォーマット変換回路32に入力され、ブロックフ
ォーマットからフレームフォーマットに変換される。そ
して、フレームフォーマットの輝度信号は、フレームメ
モリ33の輝度信号フレームメモリ34に供給されて記
憶され、色差信号は色差信号フレームメモリ35に供給
されて記憶される。輝度信号フレームメモリ34と色差
信号フレームメモリ35から読み出された輝度信号と色
差信号は、それぞれD/A変換器36,37によりアナ
ログ信号に変換され、後処理回路38に供給される。後
処理回路38は、輝度信号と色差信号を合成して出力す
る。
成について説明する。符号化される画像データは、マク
ロブロック単位で動きベクトル検出回路50に入力され
る。動きベクトル検出回路50は、予め設定されている
所定のシーケンスに従って、各フレームの画像データ
を、Iピクチャ、Pピクチャ、またはBピクチャとして
処理する。シーケンシャルに入力される各フレームの画
像を、I,P、またはBのいずれのピクチャとして処理
するかは、予め定められている(例えば、図2と図3に
示したように、フレームF1乃至F17により構成され
るグループオブピクチャが、I,B,P,B,P,・・
・B,Pとして処理される)。
えば、フレームF1)の画像データは、動きベクトル検
出回路50からフレームメモリ51の前方原画像部51
aに転送、記憶され、Bピクチャとして処理されるフレ
ーム(例えば、フレームF2)の画像データは、原画像
部51bに転送、記憶され、Pピクチャとして処理され
るフレーム(例えば、フレームF3)の画像データは、
後方原画像部51cに転送、記憶される。
ピクチャ(フレームF4)またはPピクチャ(フレーム
F5)として処理すべきフレームの画像が入力されたと
き、それまで後方原画像部51cに記憶されていた最初
のPピクチャ(フレームF3)の画像データが、前方原
画像部51aに転送され、次のBピクチャ(フレームF
4)の画像データが、原画像部51bに記憶(上書き)
され、次のPピクチャ(フレームF5)の画像データ
が、後方原画像部51cに記憶(上書き)される。この
ような動作が順次繰り返される。
ャの信号は、そこから読み出され、予測モード切り替え
回路52において、フレーム予測モード処理、またはフ
ィールド予測モード処理が行なわれる。
に、演算部53において、画像内予測、前方予測、後方
予測、または両方向予測の演算が行なわれる。これらの
処理のうち、いずれの処理を行なうかは、予測誤差信号
(処理の対象とされている参照画像と、これに対する予
測画像との差分)に対応して決定される。このため、動
きベクトル検出回路50は、この判定に用いられる予測
誤差信号の絶対値和(自乗和でもよい)を生成する。
けるフレーム予測モードとフィールド予測モードについ
て説明する。
いては、予測モード切り替え回路52は、動きベクトル
検出回路50より供給される4個の輝度ブロックY
[1]乃至Y[4]を、そのまま後段の演算部53に出
力する。すなわち、この場合においては、図8に示すよ
うに、各輝度ブロックに奇数フィールドのラインのデー
タと、偶数フィールドのラインのデータとが混在した状
態となっている。このフレーム予測モードにおいては、
4個の輝度ブロック(マクロブロック)を単位として予
測が行われ、4個の輝度ブロックに対して1個の動きベ
クトルが対応される。
2は、フィールド予測モードにおいては、図8に示す構
成で動きベクトル検出回路50より入力される信号を、
図9に示すように、4個の輝度ブロックのうち、輝度ブ
ロックY[1]とY[2]を、例えば奇数フィールドの
ラインのドットだけで構成させ、他の2個の輝度ブロッ
クY[3]とY[4]を、偶数フィールドのラインのド
ットだけで構成させて、演算部53に出力する。この場
合においては、2個の輝度ブロックY[1]とY[2]
に対して、1個の動きベクトルが対応され、他の2個の
輝度ブロックY[3]とY[4]に対して、他の1個の
動きベクトルが対応される。
測モードにおける予測誤差の絶対値和、およびフィール
ド予測モードにおける予測誤差の絶対値和を予測モード
切り替え回路52に出力する。予測モード切り替え回路
52は、フレーム予測モードとフィールド予測モードに
おける予測誤差の絶対値和を比較し、その値が小さい予
測モードに対応する処理を施して、データを演算部53
に出力する。
ベクトル検出回路50で行われる。すなわち、動きベク
トル検出回路50は、決定されたモードに対応する構成
の信号を予測モード切り替え回路52に出力し、予測モ
ード切り替え回路52は、その信号を、そのまま後段の
演算部53に出力する。
場合、図8に示すように、奇数フィールドのラインのデ
ータと偶数フィールドのラインのデータとが混在する状
態で、演算部53に供給される。また、フィールド予測
モードの場合、図9に示すように、各色差ブロックC
b,Crの上半分(4ライン)が、輝度ブロックY
[1],Y[2]に対応する奇数フィールドの色差信号
とされ、下半分(4ライン)が、輝度ブロックY
[3],Y[4]に対応する偶数フィールドの色差信号
とされる。
に示すようにして、予測判定回路54において、画像内
予測、前方予測、後方予測、または両方向予測のいずれ
の予測を行なうかを決定するための予測誤差の絶対値和
を生成する。
和として、参照画像のマクロブロックの信号Aijの総和
ΣAijの絶対値|ΣAij|と、マクロブロックの信号A
ijの絶対値|Aij|の総和Σ|Aij|の差を求める。ま
た、前方予測の予測誤差の絶対値和として、参照画像の
マクロブロックの信号Aijと、予測画像のマクロブロッ
クの信号Bijの差Aij−Bijの絶対値|Aij−Bij|の
総和Σ|Aij−Bij|を求める。また、後方予測と両方
向予測の予測誤差の絶対値和も、前方予測における場合
と同様に(その予測画像を前方予測における場合と異な
る予測画像に変更して)求める。
供給される。予測判定回路54は、前方予測、後方予測
および両方向予測の予測誤差の絶対値和のうちの最も小
さいものを、インタ予測の予測誤差の絶対値和として選
択する。さらに、このインタ予測の予測誤差の絶対値和
と、画像内予測の予測誤差の絶対値和とを比較し、その
小さい方を選択し、この選択した絶対値和に対応するモ
ードを予測モードとして選択する。すなわち、画像内予
測の予測誤差の絶対値和の方が小さければ、画像内予測
モードが設定される。インタ予測の予測誤差の絶対値和
の方が小さければ、前方予測、後方予測または両方向予
測モードのうちの対応する絶対値和が最も小さかったモ
ードが設定される。
は、参照画像のマクロブロックの信号を、フレームまた
はフィールド予測モードのうち、予測モード切り替え回
路52により選択されたモードに対応する構成で、予測
モード切り替え回路52を介して演算部53に供給する
とともに、4つの予測モードのうちの予測判定回路54
により選択された予測モードに対応する予測画像と参照
画像の間の動きベクトルを検出し、可変長符号化回路5
8と動き補償回路64に出力する。上述したように、こ
の動きベクトルとしては、対応する予測誤差の絶対値和
が最小となるものが選択される。
路50が前方原画像部51aよりIピクチャの画像デー
タを読み出しているとき、予測モードとして、フレーム
またはフィールド(画像)内予測モード(動き補償を行
わないモード)を設定し、演算部53のスイッチ53d
を接点a側に切り替える。これにより、Iピクチャの画
像データがDCTモード切り替え回路55に入力される。
たは図11に示すように、4個の輝度ブロックのデータ
を、奇数フィールドのラインと偶数フィールドのライン
が混在する状態(フレームDCTモード)、または、分離
された状態(フィールドDCTモード)、のいずれかの状
態にして、DCT回路56に出力する。
は、奇数フィールドと偶数フィールドのデータを混在し
てDCT処理した場合における符号化効率と、分離した状
態においてDCT処理した場合の符号化効率とを比較し、
符号化効率の良好なモードを選択する。
ように、奇数フィールドと偶数フィールドのラインが混
在する構成とし、上下に隣接する奇数フィールドのライ
ンの信号と偶数フィールドのラインの信号の差を演算
し、さらにその絶対値の和(または自乗和)を求める。
うに、奇数フィールドと偶数フィールドのラインが分離
した構成とし、上下に隣接する奇数フィールドのライン
同士の信号の差と、偶数フィールドのライン同士の信号
の差を演算し、それぞれの絶対値の和(または自乗和)
を求める。
い値に対応するDCTモードを設定する。すなわち、前者
の方が小さければ、フレームDCTモードを設定し、後者
の方が小さければ、フィールドDCTモードを設定する。
成のデータをDCT回路56に出力するとともに、選択し
たDCTモードを示すDCTフラグを、可変長符号化回路5
8、および動き補償回路64に出力する。
モード(図8と図9)と、このDCTモード切り替え回路
55におけるDCTモード(図10と図11)を比較して
明らかなように、輝度ブロックに関しては、両者の各モ
ードにおけるデータ構造は実質的に同一である。
レーム予測モード(奇数ラインと偶数ラインが混在する
モード)が選択された場合、DCTモード切り替え回路5
5においても、フレームDCTモード(奇数ラインと偶数
ラインが混在するモード)が選択される可能性が高く、
また予測モード切り替え回路52において、フィールド
予測モード(奇数フィールドと偶数フィールドのデータ
が分離されたモード)が選択された場合、DCTモード切
り替え回路55において、フィールドDCTモード(奇数
フィールドと偶数フィールドのデータが分離されたモー
ド)が選択される可能性が高い。
ードが選択されるわけではなく、予測モード切り替え回
路52においては、予測誤差の絶対値和が小さくなるよ
うにモードが決定され、DCTモード切り替え回路55に
おいては、符号化効率が良好となるようにモードが決定
される。
たIピクチャの画像データは、DCT回路56に入力され
てDCT処理され、DCT係数に変換される。このDCT係数
は、量子化回路57に入力され、送信バッファ59のデ
ータ蓄積量(バッファ蓄積量)に対応した量子化スケー
ルで量子化された後、可変長符号化回路58に入力され
る。
より供給される量子化スケール(スケール)に対応し
て、量子化回路57より供給される画像データ(いまの
場合、Iピクチャのデータ)を、例えばハフマン符号な
どの可変長符号に変換し、送信バッファ59に出力す
る。
路57より量子化スケール(スケール)、予測判定回路
54より予測モード(画像内予測、前方予測、後方予
測、または両方向予測のいずれが設定されたかを示すモ
ード)、動きベクトル検出回路50より動きベクトル、
予測モード切り替え回路52より予測フラグ(フレーム
予測モードまたはフィールド予測モードのいずれが設定
されたかを示すフラグ)、およびDCTモード切り替え回
路55が出力するDCTフラグ(フレームDCTモードまたは
フィールドDCTモードのいずれが設定されたかを示すフ
ラグ)が入力されており、これらも可変長符号化され
る。
一時蓄積し、蓄積量に対応するデータを量子化回路57
に出力する。送信バッファ59は、そのデータ残量が許
容上限値まで増量すると、量子化制御信号によって量子
化回路57の量子化スケールを大きくすることにより、
量子化データのデータ量を低下させる。また、これとは
逆に、データ残量が許容下限値まで減少すると、送信バ
ッファ59は、量子化制御信号によって量子化回路57
の量子化スケールを小さくすることにより、量子化デー
タのデータ量を増大させる。このようにして、送信バッ
ファ59のオーバフローまたはアンダフローが防止され
る。
ータは、所定のタイミングで読み出され、伝送路に出力
され、例えば記録回路19を介して記録媒体3に記録さ
れる。
クチャのデータは、逆量子化回路60に入力され、量子
化回路57より供給される量子化スケールに対応して逆
量子化される。逆量子化回路60の出力は、IDCT(逆離
散コサイン変換)回路61に入力され、逆離散コサイン
変換処理された後、演算器62を介してフレームメモリ
63の前方予測画像部63a供給されて記憶される。
ャルに入力される各フレームの画像データを、たとえ
ば、I,B,P,B,P,B・・・のピクチャとしてそ
れぞれ処理する場合、最初に入力されたフレームの画像
データをIピクチャとして処理した後、次に入力された
フレームの画像をBピクチャとして処理する前に、さら
にその次に入力されたフレームの画像データをPピクチ
ャとして処理する。Bピクチャは、後方予測を伴うた
め、後方予測画像としてのPピクチャが先に用意されて
いないと、復号することができないからである。
クチャの処理の次に、後方原画像部51cに記憶されて
いるPピクチャの画像データの処理を開始する。そし
て、上述した場合と同様に、マクロブロック単位でのフ
レーム間差分(予測誤差)の絶対値和が、動きベクトル
検出回路50から予測モード切り替え回路52と予測判
定回路54に供給される。予測モード切り替え回路52
と予測判定回路54は、このPピクチャのマクロブロッ
クの予測誤差の絶対値和に対応して、フレーム/フィー
ルド予測モード、または画像内予測、前方予測、後方予
測、もしくは両方向予測の予測モードを設定する。
れたとき、スイッチ53dを上述したように接点a側に
切り替える。したがって、このデータは、Iピクチャの
データと同様に、DCTモード切り替え回路55、DCT回路
56、量子化回路57、可変長符号化回路58、および
送信バッファ59を介して伝送路に伝送される。また、
このデータは、逆量子化回路60、IDCT回路61、およ
び演算器62を介してフレームメモリ63の後方予測画
像部63bに供給されて記憶される。
スイッチ53dが接点bに切り替えられるとともに、フ
レームメモリ63の前方予測画像部63aに記憶されて
いる画像(いまの場合、Iピクチャの画像)データが読
み出され、動き補償回路64により、動きベクトル検出
回路50が出力する動きベクトルに対応して動き補償さ
れる。すなわち、動き補償回路64は、予測判定回路5
4より前方予測モードの設定が指令されたとき、前方予
測画像部63aの読み出しアドレスを、動きベクトル検
出回路50が、現在、出力しているマクロブロックの位
置に対応する位置から動きベクトルに対応する分だけず
らしてデータを読み出し、予測画像データを生成する。
データは、演算器53aに供給される。演算器53a
は、予測モード切り替え回路52より供給された参照画
像のマクロブロックのデータから、動き補償回路65よ
り供給された、このマクロブロックに対応する予測画像
データを減算し、その差分(予測誤差)を出力する。こ
の差分データは、DCTモード切り替え回路55、DCT回路
56、量子化回路57、可変長符号化回路58、および
送信バッファ59を介して伝送路に伝送される。また、
この差分データは、逆量子化回路60、およびIDCT回路
61により局所的に復号され、演算器62に入力され
る。
供給されている予測画像データと同一のデータが供給さ
れている。演算器62は、IDCT回路61が出力する差分
データに、動き補償回路64が出力する予測画像データ
を加算する。これにより、元の(復号した)Pピクチャ
の画像データが得られる。このPピクチャの画像データ
は、フレームメモリ63の後方予測画像部63bに供給
されて記憶される。
に、IピクチャとPピクチャのデータが前方予測画像部
63aと後方予測画像部63bにそれぞれ記憶された
後、次にBピクチャの処理を実行する。予測モード切り
替え回路52と予測判定回路54は、マクロブロック単
位でのフレーム間差分の絶対値和の大きさに対応して、
フレーム/フィールドモードを設定し、また、予測モー
ドを画像内予測モード、前方予測モード、後方予測モー
ド、または両方向予測モードのいずれかに設定する。
前方予測モードの時、スイッチ53dは接点aまたはb
に切り替えられる。このとき、Pピクチャにおける場合
と同様の処理が行われ、データが伝送される。
向予測モードが設定された時、スイッチ53dは、接点
cまたはdにそれぞれ切り替えられる。
いる後方予測モードの時、後方予測画像部63bに記憶
されている画像(いまの場合、Pピクチャの画像)デー
タが読み出され、動き補償回路64により、動きベクト
ル検出回路50が出力する動きベクトルに対応して動き
補償される。すなわち、動き補償回路64は、予測判定
回路54より後方予測モードの設定が指令されたとき、
後方予測画像部63bの読み出しアドレスを、動きベク
トル検出回路50が、現在、出力しているマクロブロッ
クの位置に対応する位置から動きベクトルに対応する分
だけずらしてデータを読み出し、予測画像データを生成
する。
データは、演算器53bに供給される。演算器53b
は、予測モード切り替え回路52より供給された参照画
像のマクロブロックのデータから、動き補償回路64よ
り供給された予測画像データを減算し、その差分を出力
する。この差分データは、DCTモード切り替え回路5
5、DCT回路56、量子化回路57、可変長符号化回
路58、および送信バッファ59を介して伝送路に伝送
される。
いる両方向予測モードの時、前方予測画像部63aに記
憶されている画像(いまの場合、Iピクチャの画像)デ
ータと、後方予測画像部63bに記憶されている画像
(いまの場合、Pピクチャの画像)データが読み出さ
れ、動き補償回路64により、動きベクトル検出回路5
0が出力する動きベクトルに対応して動き補償される。
回路54より両方向予測モードの設定が指令されたと
き、前方予測画像部63aと後方予測画像部63bの読
み出しアドレスを、動きベクトル検出回路50がいま出
力しているマクロブロックの位置に対応する位置から動
きベクトル(この場合の動きベクトルは、前方予測画像
用と後方予測画像用の2つとなる)に対応する分だけず
らしてデータを読み出し、予測画像データを生成する。
データは、演算器53cに供給される。演算器53c
は、動きベクトル検出回路50より供給された参照画像
のマクロブロックのデータから、動き補償回路64より
供給された予測画像データの平均値を減算し、その差分
を出力する。この差分データは、DCTモード切り替え回
路55、DCT回路56、量子化回路57、可変長符号化
回路58、および送信バッファ59を介して伝送路に伝
送される。
とされることがないため、フレームメモリ63には記憶
されない。
予測画像部63aと後方予測画像部63bは、必要に応
じてバンク切り替えが行われ、所定の参照画像に対し
て、一方または他方に記憶されているものを、前方予測
画像あるいは後方予測画像として切り替えて出力するこ
とができる。
中心として説明をしたが、色差ブロックについても同様
に、図8乃至図11に示すマクロブロックを単位として
処理されて伝送される。なお、色差ブロックを処理する
場合の動きベクトルは、対応する輝度ブロックの動きベ
クトルを垂直方向と水平方向に、それぞれ1/2にした
ものが用いられる。
すブロック図である。伝送路(記録媒体3)を介して伝
送された符号化された画像データは、図示せぬ受信回路
で受信されたり、再生装置で再生され、受信バッファ8
1に一時記憶された後、復号回路90の可変長復号化回
路82に供給される。可変長復号化回路82は、受信バ
ッファ81より供給されたデータを可変長復号化し、動
きベクトル、予測モード、予測フラグ、およびDCTフラ
グを動き補償回路87に出力し、量子化スケールを逆量
子化回路83に出力するとともに、復号された画像デー
タを逆量子化回路83に出力する。
2より供給された画像データを、同じく可変長復号化回
路82より供給された量子化スケールに従って逆量子化
し、IDCT回路84に出力する。逆量子化回路83より出
力されたデータ(DCT係数)は、IDCT回路84により、
逆離散コサイン変換処理が施され、演算器85に供給さ
れる。
画像データが、Iピクチャのデータである場合、そのデ
ータは演算器85より出力され、演算器85に後に入力
される画像データ(PまたはBピクチャのデータ)の予
測画像データ生成のために、フレームメモリ86の前方
予測画像部86aに供給されて記憶される。また、この
データは、フォーマット変換回路32(図5)に出力さ
れる。
が、その1フレーム前の画像データを予測画像データと
するPピクチャのデータであり、前方予測モードのデー
タである場合、フレームメモリ86の前方予測画像部8
6aに記憶されている、1フレーム前の画像データ(I
ピクチャのデータ)が読み出され、動き補償回路87で
可変長復号化回路82より出力された動きベクトルに対
応する動き補償が施される。そして、演算器85におい
て、IDCT回路84より供給された画像データ(差分のデ
ータ)と加算され、出力される。この加算されたデー
タ、すなわち、復号されたPピクチャのデータは、演算
器85に後に入力される画像データ(Bピクチャまたは
Pピクチャのデータ)の予測画像データ生成のために、
フレームメモリ86の後方予測画像部86bに供給され
て記憶される。
測モードのデータは、Iピクチャのデータと同様に、演
算器85において処理は行われず、そのまま後方予測画
像部86bに記憶される。
表示されるべき画像であるため、この時点では、まだフ
ォーマット変換回路32へ出力されない(上述したよう
に、Bピクチャの後に入力されたPピクチャが、Bピク
チャより先に処理され、伝送されている)。
が、Bピクチャのデータである場合、可変長復号化回路
82より供給された予測モードに対応して、フレームメ
モリ86の前方予測画像部86aに記憶されているIピ
クチャの画像データ(前方予測モードの場合)、後方予
測画像部86bに記憶されているPピクチャの画像デー
タ(後方予測モードの場合)、または、その両方の画像
データ(両方向予測モードの場合)が読み出され、動き
補償回路87において、可変長復号化回路82より出力
された動きベクトルに対応する動き補償が施されて、予
測画像が生成される。但し、動き補償を必要としない場
合(画像内予測モードの場合)、予測画像は生成されな
い。
補償が施されたデータは、演算器85において、IDCT回
路84の出力と加算される。この加算出力は、フォーマ
ット変換回路32に出力される。
タであり、他の画像の予測画像生成のために利用される
ことがないため、フレームメモリ86には記憶されな
い。
測画像部86bに記憶されているPピクチャの画像デー
タが読み出され、動き補償回路87を介して演算器85
に供給される。但し、このとき、動き補償は行われな
い。
コーダ18における予測モード切り替え回路52とDC
Tモード切り替え回路55に対応する回路が図示されて
いないが、これらの回路に対応する処理、すなわち、奇
数フィールドと偶数フィールドのラインの信号が分離さ
れた構成を元の構成に必要に応じて戻す処理は、動き補
償回路87により実行される。
の処理について説明したが、色差信号の処理も同様に行
われる。ただし、この場合の動きベクトルは、輝度信号
用の動きベクトルを、垂直方向および水平方向に1/2
にしたものが用いられる。
ている。画像の品質(SNR:Signal toNoise Ratio)は、ピ
クチャタイプに対応して制御され、Iピクチャ、および
Pピクチャは高品質とされ、Bピクチャは、I,Pピク
チャに比べて劣る品質とされて伝送される。これは、人
間の視覚特性を利用した手法であり、全ての画像品質を
平均化するよりも、品質を振動させたほうが視覚上の画
質が良くなるためである。このピクチャタイプに対応し
た画質の制御は、図7の量子化回路57により実行され
る。
ダ101の構成を示しており、図15は、そのさらに詳
細な構成を示している。復号装置102は、所定のビッ
トレート(この例の場合、10Mbps)のビットストリーム
に含まれる(多重化されている)符号化された画像信号
を、ビットストリームに含まれる(多重化されている)
そのビットストリームの現符号化パラメータ(フレーム
/フィールドDCTフラグ、フレーム/フィールド予測フ
ラグ、予測モード、ピクチャタイプ、動きベクトル、マ
クロブロック情報、および量子化スケール)を用いて復
号し、符号化パラメータ多重装置103に出力するとと
もに、現符号化パラメータも符号化パラメータ多重装置
103に出力するようになされている。
に含まれるユーザデータを復号、分離し、履歴復号装置
104に出力する。その詳細は後述するが、このユーザ
データには、直近の3世代分の符号化パラメータで構成
される世代履歴情報が含まれている。これに対して、現
符号化パラメータは、例えばgroup_of_pictures_header
(1),extension_and_user_data(1),picture_heade
r(),picture_coding_extension(),extensions_data
(2),picture_data()、または、sequence_extension()
に含まれている(後述する図38)。履歴復号装置10
4は、入力されたユーザデータを復号し、3世代分の符
号化パラメータを含む世代履歴情報を符号化パラメータ
多重装置103に出力する。
2のデコーダ31(図12)を図16に示すデコーダ1
11に変更したものである。デコーダ111の可変長復
号化回路112は、現符号化パラメータをビットストリ
ームから抽出し、所定の回路に供給するとともに、世代
履歴情報を含むユーザデータを抽出し、履歴復号装置1
04に出力するようになされている。デコーダ111の
その他の構成は、デコーダ31と同様であるので、その
説明は省略する。
された画像データの空き領域(その詳細は、図18を参
照して説明する)に4世代分の符号化パラメータを書き
込み(多重化し)、ベースバンドのデジタルビデオ信号
として、粗結合された(符号化パラメータ伝送用の専用
バス等が設けられていない)符号化パラメータ分離装置
105に出力する。符号化パラメータ分離装置105
は、ベースバンドのデジタルビデオ信号から、画像デー
タと、符号化装置106で符号化に用いる符号化パラメ
ータを分離して符号化装置106に供給するようになさ
れている。
入力されたベースバンドのデジタルビデオ信号から、符
号化装置106で用いる符号化パラメータを除く3世代
分の符号化パラメータを抽出し、履歴符号化装置107
に出力する。履歴符号化装置107は、入力された3世
代分の符号化パラメータをユーザデータに書き込み、そ
のユーザデータを符号化装置106に出力する。
のフォーマットについて、図17と図18を参照して説
明する。1個のマクロブロックは、図17に示すよう
に、16×16画素で構成される。この16×16画素
のデータは、8×8画素の輝度信号Y[0][x]乃至Y[4][x]
と、8×8画素の色差信号Cr[0][x],Cr[1][x]およびCb
[0][x],Cb[1][x](x=2乃至9)から構成されてい
る。例えば、輝度信号Y[0][9]は、8×8画素の1行目
の画素(8画素)の輝度信号を示している。1画素当た
りの輝度信号の情報量は8ビットなので、輝度信号Y[0]
[9]の情報量は、8(画素)×8(ビット)=64ビッ
トとなる。色差信号についても同様である。
は、図18に示すように、10行分の領域(D0乃至D
9)が設けられているので、2行分の領域(D0,D
1)が不要となる。この空き領域には、64ビット×1
6=1024ビットの情報が記録できるので、この2行
分の領域に本来の画像データ以外の符号化パラメータを
書き込む。なお、1個のマクロブロックに対応する符号
化パラメータは、256ビットの情報量があるので、こ
の領域には、過去4回の符号化に使用された符号化パラ
メータを記録することができる。
化パラメータ分離装置105に伝送される画像データ
(デジタルビデオ信号)には、輝度信号Y、色差信号C
r,Cbを記載する領域として、10行分(D0乃至D
9)の領域が設けられている。しかしながら実際に輝度
信号Y等が書き込まれる領域は、D2乃至D9の8行分
の領域であり、D0,D1の領域は利用されない。そこ
で、この2ビットの領域を符号化パラメータの書き込み
用領域として利用する。これにより、図17の16×1
6画素の所定の位置の画素の下位2ビットに、符号化パ
ラメータが書き込まれることとなる。
のための符号化パラメータとして供給された現符号化パ
ラメータを利用して画像データを符号化するとともに、
履歴符号化装置107から供給されるユーザデータをビ
ットストリームに多重化して、所定のビットレート(こ
の例の場合、5Mbps)でSDTI(Serial Data Transfer Int
erface)108−i(i=1,2,・・・,N)(後述
する図30)に出力するようになされている。
装置1のエンコーダ18(図7)を図19に示すエンコ
ーダ121に変更したものである。エンコーダ121
は、エンコーダ18から符号化パラメータを生成する動
きベクトル検出回路50、フレームメモリ51、予測モ
ード切り替え回路52、予測判定回路54、およびDCT
モード切り替え回路55を削除し、履歴符号化装置10
7の出力するユーザデータを可変長符号化回路58で可
変長符号化するようにしたものである。エンコーダ12
1のその他の構成は、エンコーダ18と同様であるの
で、その説明は省略する。
と履歴符号化装置107についてさらに説明する。同図
に示すように、履歴復号装置104は、復号装置102
より供給されるユーザデータをデコードするユーザデー
タデコーダ201、ユーザデータデコーダ201の出力
を変換するコンバータ202、およびコンバータ202
の出力から履歴情報を再生するヒストリデコーダ203
により構成されている。
ラメータ分離装置105より供給される3世代分の符号
化パラメータをフォーマット化するヒストリフォーマッ
タ211、ヒストリフォーマッタ211の出力を変換す
るコンバータ212、コンバータ212の出力をユーザ
データのフォーマットにフォーマットするユーザデータ
フォーマッタ213により構成されている。
102より供給されるユーザデータをデコードして、コ
ンバータ202に出力する。詳細は後述するが、ユーザ
データ(user_data())は、user_data_start_codeとuse
r_dataからなり、MPEG規格においてはuser_dataの中
に、連続する23ビットの”0”を発生させることを禁
止している。これは、start_codeを誤検出されないよう
にするためである。履歴情報内には、このような連続す
る23ビット以上の”0”が存在することがあり得るの
で、これを処理して、converted_history_stream()(後
述する図38)に変換する必要がある。この変換を行う
のは、履歴符号化装置107のコンバータ212であ
る。履歴復号装置104のコンバータ202は、このコ
ンバータ212と逆の変換処理を行うものである。
02の出力から履歴情報を生成し、符号化パラメータ多
重装置103に出力する。
ヒストリフォーマッタ211が符号化パラメータ分離装
置105より供給される3世代分の符号化パラメータを
履歴情報のフォーマットに変換する。このフォーマット
には、固定長のもの(後述する図40乃至図46)と、
可変長のもの(後述する図47)とがある。これらの詳
細については後述する。
ーマット化された履歴情報は、コンバータ212におい
て、converted_history_stream()に変換される。これ
は、上述したように、user_data()のstart_codeが誤検
出されないようにするためのものである。すなわち、履
歴情報内には連続する23ビット以上の”0”が存在す
るが、user_data中には連続する23ビット以上の”
0”を配置することができないので、この禁止項目に触
れないようにコンバータ212によりデータを変換する
のである。
バータ212より供給されるconverted_history_stream
()に、後述する図38に基づいて、Data_IDを付加し、
さらに、user_data_stream_codeを付加して、video str
eam中に挿入できるuser_dataを生成し、符号化装置10
6に出力する。
構成例を表している。その符号語変換器301と符号長
変換器305には、符号化パラメータ(今回、履歴情報
として伝送する符号化パラメータ)(項目データ)と、
この符号化パラメータを配置するストリームを特定する
情報(例えば、シンタックスの名称)(例えば、後述す
るsequence_headerの名称)(項目NO.)が、符号化パラ
メータ分離装置105から供給されている。符号語変換
器301は、入力された符号化パラメータを、指示され
たシンタックスに対応する符号語に変換し、バレルシフ
タ302に出力する。バレルシフタ302は、符号語変
換器301より入力された符号語を、アドレス発生回路
306より供給されるシフト量に対応する分だけシフト
し、バイト単位の符号語として、スイッチ303に出力
する。アドレス発生回路306が出力するビットセレク
ト信号により切り換えられるスイッチ303は、ビット
分設けられており、バレルシフタ302より供給される
符号語を、RAM304に供給し、記憶させる。このとき
の書き込みアドレスは、アドレス発生回路306から指
定される。また、アドレス発生回路306から読み出し
アドレスが指定されたとき、RAM304に記憶されてい
るデータ(符号語)が読み出され、後段のコンバータ2
12に供給されるとともに、必要に応じて、スイッチ3
03を介してRAM304に再び供給され、記憶される。
ックスと符号化パラメータとから、その符号化パラメー
タの符号長を決定し、アドレス発生回路306に出力す
る。アドレス発生回路306は、入力された符号長に対
応して、上述したシフト量、ビットセレクト信号、書き
込みアドレス、または読み出しアドレスを生成し、それ
らを、それぞれバレルシフタ302、スイッチ303、
またはRAM304に供給する。
1は、いわゆる可変長符号化器として構成され、入力さ
れた符号化パラメータを可変長符号化して出力する。
ーマット化されたデータをデコードするヒストリデコー
ダ203の構成例を表している。このヒストリデコーダ
203には、コンバータ202から供給された符号化パ
ラメータのデータがRAM311に供給されて、記憶され
る。このときの書き込みアドレスは、アドレス発生回路
315から供給される。アドレス発生回路315はま
た、所定のタイミングで読み出しアドレスを発生し、RA
M311に供給する。このとき、RAM311は、読み出し
アドレスに記憶されているデータを読み出し、バレルシ
フタ312に出力する。バレルシフタ312は、アドレ
ス発生回路315が出力するシフト量に対応する分だ
け、入力されるデータをシフトし、逆符号長変換器31
3と逆符号語変換器314に出力する。
タ202から、符号化パラメータが配置されているスト
リームのシンタックスの名称が供給されている。逆符号
長変換器313は、そのシンタックスに基づいて、入力
されたデータ(符号語)から符号長を求め、求めた符号
長をアドレス発生回路315に出力する。
フタ312より供給されたデータを、シンタックスに基
づいて復号し(逆符号語化し)、符号化パラメータ多重
装置103に出力する。
な符号語が含まれているのかを特定するのに必要な情報
(符号語の区切りを決定するのに必要な情報)を抽出
し、アドレス発生回路315に出力する。アドレス発生
回路315は、この情報と逆符号長変換器313より入
力された符号長に基づいて、書き込みアドレスおよび読
み出しアドレスを発生し、RAM311に出力するととも
に、シフト量を発生し、バレルシフタ312に出力す
る。
している。この例においては、ヒストリフォーマッタ2
11とコンバータ212の間に配置されているバッファ
メモリ320の、コントローラ326が出力する読み出
しアドレスから8ビットのデータが読み出され、D型フ
リップフロップ(D−FF)321に供給され、保持さ
れるようになされている。そして、D型フリップフロッ
プ321より読み出されたデータは、スタッフ回路32
3に供給されるとともに、8ビットのD型フリップフロ
ップ322にも供給され、保持される。D型フリップフ
ロップ322より読み出された8ビットのデータは、D
型フリップフロップ321より読み出された8ビットの
データと合成され、16ビットのパラレルデータとし
て、スタッフ回路323に供給される。
6より供給されるスタッフ位置を示す信号(stuff posi
tion)の位置に符号”1”を挿入し(スタッフィング
し)、合計17ビットのデータとして、バレルシフタ3
24に出力する。
6より供給されるシフト量を示す信号(shift)に基づ
いて入力されたデータをシフトして、8ビットのデータ
を抽出し、8ビットのD型フリップフロップ325に出
力する。D型フリップフロップ325に保持されたデー
タは、そこから読み出され、バッファメモリ327を介
して、後段のユーザデータフォーマッタ213に供給さ
れる。この時、コントローラ326は、出力するデータ
とともに、書き込みアドレスを発生し、コンバータ21
2とユーザデータフォーマッタ213との間に介在する
バッファメモリ327に供給する。
表している。D型フリップフロップ322,321より
入力された16ビットのデータは、それぞれスイッチ3
31−16乃至331−1の接点aに入力されている。
スイッチ331−i(i=0乃至15)の接点cには、
MSB側(図中上方)に隣接するスイッチのデータが供給
されている。例えば、スイッチ331−12の接点cに
は、MSB側に隣接するスイッチ331−13の接点aに
供給されているLSBから13番目のデータが供給されて
おり、スイッチ331−13の接点cには、MSB側に隣
接するスイッチ331−13の接点aに供給されている
LSB側から14番目のデータが供給されている。
よりさらに下側のスイッチ331−0の接点aは、開放
されている。また、MSBに対応するスイッチ331−1
6の接点cは、それより上位のスイッチが存在しないた
め、開放されている。
接点bには、データ”1”が供給されている。
り供給されるデータ”1”を挿入する位置を示す信号st
uff positionに対応して、スイッチ331−0乃至33
1−16のうち、1つのスイッチを接点b側に切り替
え、それよりLSB側のスイッチは、接点c側にそれぞれ
切り替え、それよりMSB側のスイッチは、接点a側に切
り替えさせる。
1”を挿入する場合の例を示している。従って、この場
合、スイッチ331−0乃至スイッチ331−12は、
いずれも接点c側に切り替えられ、スイッチ331−1
3は、接点b側に切り替えられ、スイッチ331−14
乃至スイッチ331−16は、接点a側に切り替えられ
ている。
な構成により、22ビットの符号を23ビットに変換し
て、出力することになる。
部の出力データのタイミングを表している。コンバータ
212のコントローラ326がバイト単位のクロックに
同期して、読み出しアドレス(図24(A))を発生す
ると、バッファメモリ320から、それに対応するデー
タが、バイト単位で読み出され、D型フリップフロップ
321に一旦保持される。そして、D型フリップフロッ
プ321より読み出されたデータ(図24(B))は、
スタッフ回路323に供給されるとともに、D型フリッ
プフロップ322に供給され、保持される。D型フリッ
プフロップ322に保持されたデータは、そこからさら
に読み出され(図24(C))、スタッフ回路323に
供給される。
4(D))は、読み出しアドレスA1のタイミングにお
いて、最初の1バイトのデータD0とされ、次の読み出
しアドレスA2のタイミングにおいて、1バイトのデー
タD0と1バイトのデータD1より構成される2バイト
のデータとなり、さらに読み出しアドレスA3のタイミ
ングにおいては、データD1とデータD2より構成され
る2バイトのデータとなる。
挿入する位置を示す信号stuff position(図24
(E))がコントローラ326より供給される。スタッ
フ回路323のデコーダ332は、スイッチ331−1
6乃至331−0のうち、この信号stuff positionに対
応するスイッチを接点bに切り換え、それよりLSB側の
スイッチを接点c側に切り換え、さらにそれよりMSB側
のスイッチを接点a側に切り換える。これにより、デー
タ”1”が挿入されるので、スタッフ回路323から
は、信号stuff positionで示す位置に、データ”1”が
挿入されたデータ(図24(F))が出力される。
を、コントローラ326より供給される信号shift(図
24(G))で示される量だけバレルシフトして、出力
する(図24(H)) 。この出力がさらにD型フリッ
プフロップ325で一旦保持された後、後段に出力され
る(図24(I))。
るデータには、22ビットのデータの次に、データ”
1”が挿入されている。従って、データ”1”と、次の
データ”1”の間には、その間のビットが全て0であっ
たとしても、0のデータの連続する数は22となる。
している。このコンバータ202のD型フリップフロッ
プ341乃至コントローラ346よりなる構成は、図2
2に示したコンバータ212のD型フリップフロップ3
21乃至コントローラ326と基本的に同様の構成であ
るが、コンバータ212におけるスタッフ回路323に
代えて、ディリート回路343が挿入されている点がコ
ンバータ212におけり場合と異なっている。その他の
構成は、図22のコンバータ212における場合と同様
である。
は、コントローラ346が出力する削除するビットの位
置を示す信号delete positionに従って、ディリート回
路343が、そのビット(図22のスタッフ回路323
で挿入されたデータ”1”)が削除される。
2における場合と同様である。
を表している。この構成例においては、D型フリップフ
ロップ342,341より入力された16ビットのデー
タのうち、LSB側の15ビットが、それぞれ対応するス
イッチ351−0乃至351−14の接点aに供給され
ている。各スイッチの接点bには、1ビットだけMSB側
のデータが供給されている。デコーダ352は、コント
ローラ346より供給される信号delete positionによ
り指定されるビットを削除して、15ビットのデータと
して出力するようになされている。
ディリートされる状態を示している。従って、この場
合、スイッチ351−0乃至スイッチ351−11が接
点a側に切り替えられ、LSBから第12番目までの12
ビットが、そのまま選択、出力されている。また、スイ
ッチ351−12乃至351−14は、それぞれ接点b
側に切り替えられているので、第14番目乃至第16番
目のデータが、第13番目乃至第15番目のビットのデ
ータとして選択、出力される。
のディリート回路343の入力が16ビットとなってい
るのは、それぞれ図22のコンバータ212のスタッフ
回路323の入力が、D型フリップフロップ322,3
21より供給される16ビットとされており、また、図
25のコンバータ202においても、ディリート回路3
43の入力が、D型フリップフロップ342,341に
より16ビットとされているためである。図22におい
て、スタッフ回路323の出力する17ビットをバレル
シフタ324でバレルシフトすることにより、例えば8
ビットを最終的に選択、出力しているのと同様に、図2
5のコンバータ202においても、ディリート回路34
3の出力する15ビットのデータを、バレルシフタ34
4で所定量だけバレルシフトすることにより、8ビット
のデータとしている。
を表している。この構成例においては、カウンタ361
が入力データのうち、連続する0のビットの数をカウン
トし、そのカウント結果をコントローラ326に出力す
るようになされている。コントローラ326は、例えば
カウンタ361が連続する0のビットを22個カウント
したとき、信号stuff positionをスタッフ回路323に
出力する。また、このとき、コントローラ326は、カ
ウンタ361をリセットし、再び連続する0のビットの
数をカウンタ361にカウントさせる。
合と同様である。
を表している。この構成例においては、入力データのう
ち、連続する0の数をカウンタ371がカウントし、そ
のカウント結果をコントローラ346に出力するように
なされている。カウンタ371のカウント値が22に達
したとき、コントローラ346は、信号delete positio
nをディリート回路343に出力するとともに、カウン
タ371をリセットし、再び新たな連続する0のビット
の数をカウンタ371にカウントさせる。その他の構成
は、図25における場合と同様である。
のパターン(データ”0”の連続する数)に基づいて、
マーカービットとしてのデータ”1”が挿入され、ま
た、削除されることになる。
25に示す構成よりも効率的な処理が可能となる。但
し、変換後の長さが元の履歴情報に依存することにな
る。
3の構成例を表している。この例においては、コントロ
ーラ383がコンバータ212とユーザデータフォーマ
ッタ213との間に配置されているバッファメモリ(図
示せず)に読み出しアドレスを出力すると、そこから読
み出されたデータが、ユーザデータフォーマッタ213
のスイッチ382の接点a側に供給される。ROM381
には、ユーザデータスタートコード、データIDなどの
user_data()を生成するのに必要なデータが記憶されて
いる。コントローラ313は、所定のタイミングにおい
て、スイッチ382を接点a側または接点b側に切り替
え、ROM381に記憶されているデータ、またはコンバ
ータ212より供給されるデータを適宜選択し、出力す
る。これにより、user_data()のフォーマットのデータ
が符号化装置106に出力される。
コーダ201は、図29のROM381より読み出され、
挿入されたデータを削除するスイッチを介して、入力デ
ータを出力するようにすることで実現することができ
る。
て、複数のトランスコーダ101−1乃至101−Nが
直列に接続されて使用される状態を示している。各トラ
ンスコーダ101−i(i=1乃至N)の符号化パラメ
ータ多重装置103−iは、上述した符号化パラメータ
用の領域の最も古い符号化パラメータが記録されている
区画に、自己が用いた最新の符号化パラメータを上書き
する。このことにより、ベースバンドの画像データに
は、同一のマクロブロックに対応する直近の4世代分の
符号化パラメータ(世代履歴情報)が記録されることに
なる。
1−i(図19)は、その可変長符号化回路58におい
て、符号化パラメータ分離装置105−iから供給され
る今回用いる符号化パラメータに基づいて、量子化回路
57より供給されるビデオデータを符号化する。このよ
うにして生成されるビットストリーム(例えば、pictur
e_header())中に、その現符号化パラメータは多重化さ
れる。
装置107−iより供給されるユーザデータ(世代履歴
情報を含む)を、出力するビットストリーム中に多重化
する(図18に示すような埋め込み処理ではなく、ビッ
トストリーム中に多重化される)。そして、符号化装置
106−iの出力するビットストリームは、SDTI108
−iを介して、後段のトランスコーダ101−(i+
1)に入力される。
ダ101−(i+1)は、それぞれ図15に示すように
構成されている。従って、その処理は、図15を参照し
て説明した場合と同様となる。
符号化として、現在Iピクチャとして符号化されていた
ものを、PもしくはBピクチャに変更したい場合、過去
の符号化パラメータの履歴を見て、過去にPもしくはB
ピクチャであった場合を探し、これらの履歴が存在した
場合は、その動きベクトルなどのパラメータを利用し
て、ピクチャタイプを変更する。反対に過去に履歴がな
い場合は、動き検出を行わないピクチャタイプの変更を
断念する。もちろん履歴がない場合であっても、動き検
出を行えばピクチャタイプを変更できる。
分の符号化パラメータを埋め込むようにしたが、I、
P、Bの各ピクチャタイプのパラメータを埋め込むよう
にすることもできる。図31は、この場合のフォーマッ
トの例を示している。この例では、同一のマクロブロッ
クが、過去にピクチャタイプの変更を伴って符号化され
たときにおける、ピクチャタイプ毎に1世代分の符号化
パラメータ(ピクチャ履歴情報)が記録される。したが
って、図16に示したデコーダ111、および図19に
示したエンコーダ121は、現在(最新)、1世代前、
2世代前、および3世代前の符号化パラメータの代わり
に、Iピクチャ、Pピクチャ、およびBピクチャに対応
する1世代分の符号化パラメータを入出力することにな
る。
の領域は利用しないので、Cb[1][x]とCr[1][x]の領域を
有さない4:2:0フォーマットの画像データにも本発
明を適用することができる。
パラメータを復号と同時に取り出し、ピクチャタイプを
判定して、画像信号のピクチャタイプに対応した場所に
符号化パラメータを書き込んで(多重化して)符号化パ
ラメータ分離装置105に出力する。符号化パラメータ
分離装置105は、符号化パラメータを分離し、これか
ら符号化したいピクチャタイプと、入力された過去の符
号化パラメータを考慮して、ピクチャタイプを変更しな
がら再符号化を行うことができる。
変更が可能なピクチャタイプを判定する処理について、
図32のフローチャートを参照して説明する。なお、こ
の処理はトランスコーダ101におけるピクチャタイプ
の変更は、過去の動きベクトルを利用するので、動き検
出を行わないで実行されることを前提としている。ま
た、以下に説明する処理は、符号化パラメータ分離装置
105により実行される。
に1世代分の符号化パラメータ(ピクチャ履歴情報)が
符号化パラメータコントローラ122に入力される。
分離装置105は、ピクチャ履歴情報にBピクチャに変
更したときの符号化パラメータが存在するか否かを判定
する。ピクチャ履歴情報にBピクチャに変更したときの
符号化パラメータが存在すると判定された場合、ステッ
プS3に進む。
分離装置105は、ピクチャ履歴情報にPピクチャに変
更したときの符号化パラメータが存在するか否かを判定
する。ピクチャ履歴情報にPピクチャに変更したときの
符号化パラメータが存在すると判定された場合、ステッ
プS4に進む。
分離装置105は、変更可能なピクチャタイプがIピク
チャ、Pピクチャ、およびBピクチャであると判断す
る。
にPピクチャに変更したときの符号化パラメータが存在
しないと判定された場合、ステップS5に進む。
分離装置105は、変更可能なピクチャタイプがIピク
チャ、およびBピクチャであると判断する。さらに、符
号化パラメータ分離装置105は、特殊処理(Bピクチ
ャの履歴情報に含まれる後方予測ベクトルを使わず、前
方予測ベクトルだけを使う)を施すことにより、擬似的
にPピクチャに変更可能であると判断する。
にBピクチャに変更したときの符号化パラメータが存在
しないと判定された場合、ステップS6に進む。
分離装置105は、ピクチャ履歴情報にPピクチャに変
更したときの符号化パラメータが存在するか否かを判定
する。ピクチャ履歴情報にPピクチャに変更したときの
符号化パラメータが存在すると判定された場合、ステッ
プS7に進む。
分離装置105は、変更可能なピクチャタイプがIピク
チャ、およびPピクチャであると判断する。さらに、符
号化パラメータ分離装置105は、特殊処理(Pピクチ
ャに履歴情報に含まれる前方予測ベクトルだけを使う)
を施すことにより、Bピクチャに変更可能であると判断
する。
にPピクチャに変更したときの符号化パラメータが存在
しないと判定された場合、ステップS8に進む。ステッ
プS8において、符号化パラメータ分離装置105は、
動きベクトルが存在しないので、変更可能なピクチャタ
イプがIピクチャだけである(IピクチャなのでIピク
チャ以外には変更できない)と判断する。
次にステップS9において、符号化パラメータ分離装置
105は、変更可能なピクチャタイプを表示装置(図示
せず)に表示してユーザに通知する。
ている。ピクチャタイプの変更は、GOPを構成するフレ
ーム数が変更される。すなわち、この例の場合、N=15
(GOPのフレーム数N=15)、M=3(GOP内のI、またはP
ピクチャの出現周期M=3)のフレームから構成されるLong
GOP(第1世代)から、N=1,M=1のフレームで構成され
るShort GOP(第2世代)に変換され、再度、N=15,M=3
のフレームから構成されるLong GOP(第3世代)に変換
されている。なお、図中において破線は、GOPの境界を
示している。
変更される場合において、上述した変更可能ピクチャタ
イプ判定処理の説明から明らかなように、全てのフレー
ムは、ピクチャタイプをIピクチャに変更することが可
能である。このピクチャタイプ変更のとき、動画像(第
0世代)が第1世代に変換されたときに演算された全て
の動きベクトルは、ピクチャ履歴情報に保存された(残
された)状態となる。次に、再度Long GOPに変換される
(第2世代から第3世代にピクチャタイプが変更され
る)場合、第0世代から第1世代に変換されたときのピ
クチャタイプ毎の動きベクトルが保存されているので、
これを再利用することにより、画質劣化を抑えて、再
度、Long GOPに変換することが可能となる。
示している。この例の場合、N=14,M=2であるLong GOP
(第1世代)から、N=2,M=2であるShort GOP(第2世
代)に変換され、さらに、N=1,M=1であるフレーム数
が1のShort GOP(第3世代)に変換されて、フレーム
数NがランダムなGOP(第4世代)に変換される。
に変換されたときのピクチャタイプ毎の動きベクトル
が、第3世代から第4世代への変換のときまで保存され
る。そこで、図34に示すように、複雑にピクチャタイ
プを変更しても、保存されている符号化パラメータを再
利用されることにより、画質劣化を小さく抑えることが
できる。さらに、保存されている符号化パラメータの量
子化スケールを有効に利用すれば画質劣化の少ない符号
化を実現できる。
35を参照して説明する。図35は、所定のフレーム
が、第1世代から第4世代まで常に、Iピクチャに変換
されており、ビットレートだけが、4Mbps,18Mbps、
または50Mbpsに変更されていることを示している。
(18Mbps)への変換の際に、ビットレートの高速化に伴
って、細かい量子化スケールで再符号化しても画質は向
上しない。なぜならば、過去において粗い量子化ステッ
プで量子化されたデータは、復元しないからである。し
たがって、図35に示すように、途中でビットレートが
高速化しても、それに伴って細かい量子化ステップで量
子化することは、情報量が増加するだけであって画質の
向上には繋がらない。したがって、過去のもっとも粗い
(大きい)量子化スケールを維持するように制御すれ
ば、最も無駄が無く、効率的な符号化が可能となる。
るときは、過去の量子化スケールの履歴を利用して符号
化することは非常に有効である。
ローチャートを参照して説明する。ステップS11にお
いて、符号化パラメータ分離装置105は、入力された
ピクチャ履歴情報に、いまから変換するピクチャタイプ
の符号化パラメータが存在するか否かを判定する。変換
するピクチャタイプの符号化パラメータが存在すると判
定された場合、ステップS12に進む。
タ分離装置105は、ピクチャ履歴情報の対照となる符
号化パラメータから量子化スケール(Q_history)を抽出
する。
タ分離装置105は、送信バッファ59から量子化回路
57にフィードバックされる量子化スケールの候補値Q_
feedbackを読み取る。
タ分離装置105は、Q_historyがQ_feedbackよりも大
きい(粗い)か否かを判定する。Q_historyがQ_feedbac
kよりも大きいと判定された場合、ステップS15に進
む。
タ分離装置105は、量子化スケールとしてQ_history
を量子化回路57に出力する。量子化回路57は、Q_hi
storyを用いて量子化を実行する。
れる全てのマクロブロックが量子化されたか否かが判定
される。全てのマクロブロックが量子化されていないと
判定された場合、ステップS13に戻り、ステップS1
3乃至S16の処理が、全てのマクロブロックが量子化
されるまで繰り返される。
eedbackよりも大きくない(細かい)いと判定された場
合、ステップS17に進む。
タ分離装置105は、量子化スケールとしてQ_feedback
を量子化回路57に出力する。量子化回路57は、Q_fe
edbackを用いて量子化を実行する。
ャタイプの符号化パラメータが存在しないと判定された
場合、ステップS18に進む。
は、送信バッファ59からフィードバックされる量子化
スケールの候補値Q_feedbackを受け付ける。
は、Q_feedbackを用いて量子化を実行する。
れる全てのマクロブロックが量子化されたか否かが判定
される。全てのマクロブロックが量子化されていないと
判定された場合、ステップS18に戻り、ステップS1
8乃至S20の処理が、全てのマクロブロックが量子化
されるまで繰り返される。
ダ101の内部においては、上述したように、復号側と
符号側が粗結合されており、符号化パラメータを画像デ
ータに多重化させて伝送させたが、図37に示すよう
に、復号装置102と符号化装置106を符号化パラメ
ータ伝送用の高速バス111で接続する(密結合する)
ようにしてもよい。
デコードするためのシンタックスを表わした図である。
デコーダは、このシンタックスに従ってMPEGビット
ストリームをデコードすることによって、ビットストリ
ームから意味のある複数のデータ項目(データエレメン
ト)を抽出する。以下に説明するシンタックスは、図に
おいて、その関数や条件文は細活字で表わされ、そのデ
ータエレメントは、太活字で表されている。データ項目
は、その名称、ビット長、及びそのタイプと伝送順序を
示すニーモニック(Mnemonic)で記述されている。
クスにおいて使用されている関数について説明する。
ーム中に記述されているスタートコードを探すための関
数である。よって、この図38に示されたシンタックス
において、このnext_start_code()関数の次に、sequenc
e_header()関数とsequence_extension()関数とが順に配
置されているので、このビットストリームには、このse
quence_header()関数とsequence_extension()関数によ
って定義されたデータエレメントが記述されている。従
って、ビットストリームのデコード時には、このnext_s
tart_code()関数によって、sequence_header()関数とse
quence_extension()関数の先頭に記述されているスター
トコード(データエレメントの一種)をビットストリー
ム中から見つけ、それを基準にして、 sequence_header
()関数とsequence_extension()関数をさらに見つけ、そ
れらによって定義された各データエレメントをデコード
する。
ビットストリームのシーケンス層のヘッダデータを定義
するための関数であって、sequence_extension()関数
は、MPEGビットストリームのシーケンス層の拡張デ
ータを定義するための関数である。
ている do{ }while構文は、while文によって定義されて
いる条件が真である間、do文の{ }内の関数に基いて記
述されたデータエレメントをデータストリーム中から抽
出するための構文である。すなわち、 do{ }while構文
によって、while文によって定義されている条件が真で
ある間、ビットストリーム中から、do文内の関数に基い
て記述されたデータエレメントを抽出するデコード処理
が行われる。
関数は、ビットストリーム中に現れるビット又はビット
列と、次にデコードされるデータエレメントとを比較す
るための関数である。この図38のシンタックスの例で
は、nextbits()関数は、ビットストリーム中のビット列
とビデオシーケンスの終わりを示すsequence_end_code
とを比較し、ビットストリーム中のビット列とsequence
_end_codeとが一致しないときに、このwhile文の条件が
真となる。従って、sequence_extension()関数の次に配
置されている do{ }while構文は、ビットストリーム中
に、ビデオシーケンスの終わりを示すsequence_end_cod
eが現れない間、do文中の関数によって定義されたデー
タエレメントがビットストリーム中に記述されているこ
とを示している。
sion()関数によって定義された各データエレメントの次
には、extension_and_user_data(0)関数によって定義さ
れたデータエレメントが記述されている。このextensio
n_and_user_data(0)関数は、MPEGビットストリーム
のシーケンス層の拡張データとユーザデータを定義する
ための関数である。
に配置されている do{ }while構文は、while文によって
定義されている条件が真である間、do文の{ }内の関数
に基いて記述されたデータエレメントを、ビットストリ
ーム中から抽出するための関数である。このwhile文に
おいて使用されているnextbits()関数は、ビットストリ
ーム中に現れるビット又はビット列と、picture_start_
code又はgroup_start_codeとの一致を判断するための関
数であって、ビットストリーム中に現れるビット又はビ
ット列と、picture_start_code又はgroup_start_codeと
が一致する場合には、while文によって定義された条件
が真となる。よって、このdo{ }while構文は、ビットス
トリーム中において、picture_start_code又はgroup_st
art_codeが現れた場合には、そのスタートコードの次
に、do文中の関数によって定義されたデータエレメント
のコードが記述されているので、このpicture_start_co
de又はgroup_start_codeによって示されるスタートコー
ドを探し出すことによって、ビットストリーム中からdo
文中に定義されたデータエレメントを抽出することがで
きる。
ビットストリーム中にgroup_start_codeが現れた場合、
という条件を示しいる。このif文による条件が真である
場合には、ビットストリーム中には、このgroup_start_
codeの次にgroup_of_picture_header(1)関数及びextens
ion_and_user_data(1)関数によって定義されているデー
タエレメントが順に記述されている。
MPEGビットストリームのGOP層のヘッダデータを
定義するための関数であって、 extension_and_user_da
ta(1)関数は、MPEGビットストリームのGOP層の
拡張データ(extension_data)及びユーザデータ(user
_data)を定義するための関数である。
oup_of_picture_header(1)関数及びextension_and_user
_data(1)関数によって定義されているデータエレメント
の次に、picture_header()関数とpicture_coding_exten
sion()関数によって定義されたデータエレメントが記述
されている。もちろん、先に説明したif文の条件が真と
ならない場合には、 group_of_picture_header(1)関数
及びextension_and_user_data(1)関数によって定義され
ているデータエレメントは記述されていないので、 ext
ension_and_user_data(0)関数によって定義されている
データエレメントの次に、 picture_header()関数とpic
ture_coding_extension()関数によって定義されたデー
タエレメントが記述されている。
ビットストリームのピクチャ層のヘッダデータを定義す
るための関数であって、 picture_coding_extension()
関数は、MPEGビットストリームのピクチャ層の第1
の拡張データを定義するための関数である。
されている条件が真である間、次のif文の条件判断を行
うための関数である。このwhile文において使用されて
いるnextbits()関数は、ビットストリーム中に現れるビ
ット列と、extension_start_code又はuser_data_start_
codeとの一致を判断するための関数であって、ビットス
トリーム中に現れるビット列と、 extension_start_cod
e又はuser_data_start_codeとが一致する場合には、こ
のwhile文によって定義された条件が真となる。
るビット列とextension_start_cod
eとの一致を判断するための関数である。ビットストリ
ーム中に現れるビット列と32ビットのextensi
on_ start_codeとが一致する場合には、
ビットストリーム中において、extension_start_codeの
次にextension_data(2)関数によって定義されるデータ
エレメントが記述されていることを示している。
るビット列とuser_data_start_codeとの一致を判断する
ための構文であって、ビットストリーム中に現れるビッ
ト列と32ビットのuser_data_start_codeとが一致する
場合には、第3のif文の条件判断が行われる。このuser
_data_start_codeは、MPEGビットストリームのピク
チャ層のユーザデータエリアの開始を示すためのスター
トコードである。
るビット列とHistory_Data_IDとの一致を判断するため
の構文である。ビットストリーム中に現れるビット列と
この8ビットのHistory_Data_IDとが一致する場合に
は、このMPEGビットストリームのピクチャ層のユー
ザデータエリアにおいて、この8ビットのHistory_Data
_IDによって示されるコードの次に、converted_history
_stream()関数によって定義されるデータエレメントが
記述されていることを示している。
EG符号化時に使用したあらゆる符号化パラメータを伝
送するための履歴情報及び履歴データを記述するための
関数である。このconverted_history_stream()関数によ
って定義されているデータエレメントの詳細は後述す
る。また、このHistory_Data_IDは、MPEGビットス
トリームのピクチャ層のユーザデータエリアに記述され
たこの履歴情報及び履歴データが記述されている先頭を
示すためのスタートコードである。
真であることを示すための構文である。従って、このM
PEGビットストリームのピクチャ層のユーザデータエ
リアにおいて、converted_history_stream()関数によっ
て定義されたデータエレメントが記述されていない場合
には、user_data()関数によって定義されたデータエレ
メントが記述されている。
トリームのピクチャ層のユーザデータの次に、スライス
層及びマクロブロック層に関するデータエレメントを記
述するための関数である。通常は、このpicture_data()
関数によって示されるデータエレメントは、ビットスト
リームのピクチャ層のユーザデータエリアに記述された
converted_history_stream()関数によって定義されるデ
ータエレメント又はuser_data()関数によって定義され
たデータエレメントの次に記述されているが、ピクチャ
層のデータエレメントを示すビットストリーム中に、ex
tension_start_code又はuser_data_start_code が存在
しない場合には、このpicture_data()関数によって示さ
れるデータエレメントは、 picture_coding_extensio
n()関数によって定義されるデータエレメントの次に記
述されるている。
データエレメントの次には、sequence_header()関数とs
equence_extension()関数とによって定義されたデータ
エレメントが順に配置されている。このsequence_heade
r()関数とsequence_extension()関数によって記述され
たデータエレメントは、ビデオストリームのシーケンス
の先頭に記述されたsequence_header()関数とsequence_
extension()関数によって記述されたデータエレメント
と全く同じである。このように同じデータをストリーム
中に記述する理由は、ビットストリーム受信装置側でデ
ータストリームの途中(例えばピクチャ層に対応するビ
ットストリーム部分)から受信が開始された場合に、シ
ーケンス層のデータを受信できなくなり、ストリームを
デコード出来なくなることを防止するためである。
nce_extension()関数とによって定義されたデータエレ
メントの次、つまり、データストリームの最後には、シ
ーケンスの終わりを示す32ビットのsequence_end_cod
eが記述されている。
を示すと、図39に示すようになる。
よって定義されたヒストリーストリームに関して説明す
る。
EGのピクチャ層のユーザデータエリアに履歴情報を示
すヒストリーストリームを挿入するための関数である。
尚、「converted」の意味は、スタートエミュレーショ
ンを防止するために、ユーザエリアに挿入すべき履歴デ
ータから構成される履歴ストリームの少なくとも22ビ
ット毎にマーカービット(1ビット)を挿入する変換処
理を行ったストリームであることを意味している。
に説明する固定長の履歴ストリーム(図40乃至図4
6)又は可変長の履歴ストリーム(図47)のいずれか
の形式で記述される。エンコーダ側において固定長の履
歴ストリームを選択した場合には、デコーダ側において
履歴ストリームから各データエレメントをデコードする
ための回路及びソフトウエアが簡単になるというメリッ
トがある。一方、エンコーダ側において可変長の履歴ス
トリームを選択した場合には、エンコーダにおいてピク
チャ層のユーザエリアに記述される履歴情報(データエ
レメント)を必要に応じて任意に選択することができる
ので、履歴ストリームのデータ量を少なくすることがで
き、その結果、符号化されたビットストリーム全体のデ
ータレートを低減することができる。
歴データ」「履歴パラメータ」とは、過去の符号化処理
において使用した符号化パラメータ(又はデータエレメ
ント)のことであって、現在の(最終段の)符号化処理
において使用した符号化パラメータのことではない。例
えば、第1世代の符号化処理において、あるピクチャを
Iピクチャで符号化して伝送し、次なる第2世代の符号
化処理において、このピクチャを今度はPピクチャとし
て符号化して伝送し、さらに、第3世代の符号化処理に
おいて、このピクチャをBピクチャで符号化して伝送す
る例をあげて説明する。第3世代の符号化処理において
使用した符号化パラメータが、第3世代の符号化処理に
おいて生成された符号化ビットストリームのシーケンス
層、GOP層、ピクチャ層、スライス層及びマクロブロ
ック層の所定位置に記述されている。一方、過去の符号
化処理である第1世代及び第2世代の符号化処理におい
て使用した符号化パラメータは、第3世代の符号化処理
において使用した符号化パラメータが記述されるシーケ
ンス層やGOP層に記述されるのでは無く、既に説明し
たシンタックスに従って、符号化パラメータの履歴情報
として、ピクチャ層のユーザデータエリアに記述され
る。
スについて図40乃至図46を参照して説明する。
おいて生成されたビットストリームのピクチャ層のユー
ザエリアには、まず最初に、過去(例えば第1世代及び
第2世代)の符号化処理において使用されていたシーケ
ンス層のシーケンスヘッダに関する符号化パラメータ
が、履歴ストリームとして挿入される。尚、過去の符号
化処理において生成されたビットストリームのシーケン
ス層のシーケンスヘッダ等の履歴情報は、最終段の符号
化処理において生成されたビットストリームのシーケン
ス層のシーケンスヘッダに挿入されることは無いという
点に注意すべきである。
ッダに関するデータエレメントは、sequence_header_co
de、sequence_header_present_flag、horizontal_size_
value、vertical_size_value、aspect_ratio_informati
on、frame_rate_code、bit_rate_value、marker_bit、V
BV_buffer_size_value、constrained_parameter_flag、
load_intra_quantizer_matrix、intra_quantizer_matri
x、load_non_intra_quantizer_matrix、及びnon_intra_
quantizer_matrix等から構成される。
スタート同期コードを表すデータである。sequence_hea
der_present_flagは、sequence_header内のデータが有
効か無効かを示すデータである。 horizontal_size_val
ueは、画像の水平方向の画素数の下位12ビットから成る
データである。vertical_size_valueは、画像の縦のラ
イン数の下位12ビットからなるデータである。aspect_r
atio_informationは、画素のアスペクト比(縦横比)ま
たは表示画面アスペクト比を表すデータである。frame_
rate_codeは、画像の表示周期を表すデータである。
制限のためのビット・レートの下位18ビット(400bsp単
位で切り上げる)データである。marker_bitは、スター
トコードエミュレーションを防止するために挿入される
ビットデータである。VBV_buffer_size_valueは、発生
符号量制御用の仮想バッファ(ビデオバッファベリファ
イヤー)の大きさを決める値の下位10ビットデータであ
る。constrained_parameter_flagは、各パラメータが制
限以内であることを示すデータである。load_intra_qua
ntizer_matrixは、イントラMB用量子化マトリックス・
データの存在を示すデータである。intra_quantizer_ma
trixは、イントラMB用量子化マトリックスの値を示す
データである。load_non_intra_quantizer_matrixは、
非イントラMB用量子化マトリックス・データの存在を
示すデータである。non_intra_quantizer_matrixは、非
イントラMB用量子化マトリックスの値を表すデータで
ある。
れたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたシーケンス層
のシーケンスエクステンションを表わすデータエレメン
トが、履歴ストリームとして記述される。
スエクステンションを表わすデータエレメントは、 ext
ension_start_code、extension_start_code_identifie
r、sequence_extension_present_flag、profile_and_le
vel_indication、progressive_sequence、chroma_forma
t、horizontal_size_extension、vertical_size_extens
ion、bit_rate_extension、vbv_buffer_size_extensio
n、low_delay、frame_rate_extension_n 、及び frame_
rate_extension_d等のデータエレメントである。
ンデータのスタート同期コードを表すデータである。ex
tension_start_code_identifierは、どの拡張データが
送られるかを示すデータである。sequence_extension_p
resent_flagは、シーケンスエクステンション内のデー
タが有効であるか無効であるかを示すデータである。pr
ofile_and_level_indicationは、ビデオデータのプロフ
ァイルとレベルを指定するためのデータである。progre
ssive_sequenceは、ビデオデータが順次走査であること
を示すデータである。chroma_formatは、ビデオデータ
の色差フォーマットを指定するためのデータである。
スヘッダのhorizntal_size_valueに加える上位2ビット
のデータである。vertical_size_extensionは、シーケ
ンスヘッダのvertical_size_valueに加える上位2ビッ
トのデータである。bit_rate_extensionは、シーケンス
ヘッダのbit_rate_valueに加える上位12ビットのデー
タである。vbv_buffer_size_extensionは、シーケンス
ヘッダのvbv_buffer_size_valueに加える上位8ビット
のデータである。low_delayは、Bピクチャを含まない
ことを示すデータである。frame_rate_extension_nは、
シーケンスヘッダのframe_rate_codeと組み合わせてフ
レームレートを得るためのデータである。frame_rate_e
xtension_dは、シーケンスヘッダのframe_rate_codeと
組み合わせてフレームレートを得るためのデータであ
る。
ユーザエリアには、過去の符号化処理において使用され
たシーケンス層のシーケンスディスプレイエクステンシ
ョンを表わすデータエレメントが、履歴ストリームとし
て記述される。
ョンとして記述されているデータエレメントは、extens
ion_start_code、extension_start_code_identifier、s
equence_display_extension_present_flag、video_form
at、color_description、color_primaries、transfer_c
haracteristics、matrix_coeffients、display_horizon
tal_size、及びdisplay_vertical_sizeから構成され
る。
ンデータのスタート同期コードを表すデータである。ex
tension_start_code_identifierは、どの拡張データが
送られるかを示すコードである。sequence_display_ext
ension_present_flagは、シーケンスディスプレイエク
ステンション内のデータエレメントが有効か無効かを示
すデータである。video_formatは、原信号の映像フォー
マットを表すデータである。color_descriptionは、色
空間の詳細データがあることを示すデータである。colo
r_primariesは、原信号の色特性の詳細を示すデータで
ある。transfer_characteristicsは、光電変換がどのよ
うに行われたのかの詳細を示すデータである。matrix_c
oeffientsは、原信号が光の三原色からどのように変換
されたかの詳細を示すデータである。display_horizont
al_sizeは、意図するディスプレイの活性領域(水平サ
イズ)を表すデータである。display_vertical_size
は、意図するディスプレイの活性領域(垂直サイズ)を
表すデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において生成されたマクロブロッ
クの位相情報を示すマクロブロックアサイメントデータ
(macroblock_assignment_in_user_data)が、履歴スト
リームとして記述される。
oblock_assignment_in_user_dataは、macroblock_assig
nment_present_flag、v_phase、h_phase等のデータエレ
メントから構成される。
は、macroblock_assignment_in_user_data内のデータエ
レメントが有効か無効かを示すデータである。 v_phase
は、画像データからマクロブロックを切り出す際の垂直
方向の位相情報を示すデータである。 h_phaseは、画像
データからマクロブロックを切り出す際の水平方向の位
相情報を示すデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたGOP層のG
OPヘッダを表わすデータエレメントが、履歴ストリー
ムとして記述されている。
トは、group_start_code、group_of_picture_header_pr
esent_flag、time_code、closed_gop、及びbroken_link
から構成される。
コードを示すデータである。 group_of_picture_header
_present_flagは、 group_of_picture_header内のデー
タエレメントが有効であるか無効であるかを示すデータ
である。 time_codeは、GOPの先頭ピクチャのシーケ
ンスの先頭からの時間を示すタイムコードである。clos
ed_gopは、GOP内の画像が他のGOPから独立再生可
能なことを示すフラグデータである。broken_linkは、
編集などのためにGOP内の先頭のBピクチャが正確に
再生できないことを示すフラグデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたピクチャ層の
ピクチャヘッダを表わすデータエレメントが、履歴スト
リームとして記述されている。
ントは、picture_start_code、temporal_reference、pi
cture_coding_type、vbv_delay、full_pel_forward_vec
tor、forward_f_code、full_pel_backward_vector、及
び backward_f_codeから構成される。
チャ層の開始同期コードを表すデータである。temporal
_referenceは、ピクチャの表示順を示す番号でGOPの
先頭でリセットされるデータである。picture_coding_t
ypeは、ピクチャタイプを示すデータである。vbv_delay
は、ランダムアクセス時の仮想バッファの初期状態を示
すデータである。full_pel_forward_vectorは、順方向
動きベクトルの精度が整数単位か半画素単位かを示すデ
ータである。forward_f_codeは、順方向動きベクトル探
索範囲を表すデータである。full_pel_backward_vector
は、逆方向動きベクトルの精度が整数単位か半画素単位
かを示すデータである。backward_f_codeは、逆方向動
きベクトル探索範囲を表すデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたピクチャ層の
ピクチャコーディングエクステンションが、履歴ストリ
ームとして記述されている。
ンに関するデータエレメントは、extension_start_cod
e、extension_start_code_identifier、f_code[0][0]、
f_code[0][1]、f_code[1][0]、f_code[1][1]、intra_dc
_precision、picture_structure、top_field_first、fr
ame_predictive_frame_dct、concealment_motion_vecto
rs、q_scale_type、intra_vlc_format、alternate_sca
n、repeat_firt_field、chroma_420_type、progressive
_frame、composite_display_flag、v_axis、field_sequ
ence、sub_carrier、burst_amplitude、及びsub_carrie
r_phaseから構成される。
クステンションデータのスタートを示す開始コードであ
る。extension_start_code_identifierは、どの拡張デ
ータが送られるかを示すコードである。 f_code[0][0]
は、フォワード方向の水平動きベクトル探索範囲を表す
データである。f_code[0][1]は、フォワード方向の垂直
動きベクトル探索範囲を表すデータである。f_code[1]
[0]は、バックワード方向の水平動きベクトル探索範囲
を表すデータである。f_code[1][1]は、バックワード方
向の垂直動きベクトル探索範囲を表すデータである。
すデータである。picture_structureは、フレームスト
ラクチャかフィールドストラクチャかを示すデータであ
る。フィールドストラクチャの場合は、上位フィールド
か下位フィールドかもあわせて示すデータである。top_
field_firstは、フレームストラクチャの場合、最初の
フィールドが上位か下位かを示すデータである。frame_
predictive_frame_dctは、フレーム・ストラクチャの場
合、フレーム・モードDCTの予測がフレーム・モード
だけであることを示すデータである。concealment_moti
on_vectorsは、イントラマクロブロックに伝送エラーを
隠蔽するための動きベクトルがついていることを示すデ
ータである。
用するか、非線形量子化スケールを利用するかを示すデ
ータである。intra_vlc_formatは、イントラマクロブロ
ックに、別の2次元VLCを使うかどうかを示すデータ
である。alternate_scanは、ジグザグスキャンを使う
か、オルタネート・スキャンを使うかの選択を表すデー
タである。repeat_firt_fieldは、2:3プルダウンの
際に使われるデータである。chroma_420_typeは、信号
フォーマットが4:2:0の場合、次のprogressive_fr
ame と同じ値、そうでない場合は0を表すデータであ
る。progressive_frameは、このピクチャが、順次走査
できているかどうかを示すデータである。composite_di
splay_flagは、ソース信号がコンポジット信号であった
かどうかを示すデータである。
使われるデータである。field_sequenceは、ソース信号
が、PALの場合に使われるデータである。sub_carrie
rは、ソース信号が、PALの場合に使われるデータで
ある。burst_amplitudeは、ソース信号が、PALの場
合に使われるデータである。sub_carrier_phaseは、ソ
ース信号が、PALの場合に使われるデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用された量子化マトリ
ックスエクステンションが、履歴ストリームとして記述
されている。
に関するデータエレメントは、extension_start_code、
extension_start_code_identifier、quant_matrix_exte
nsion_present_flag、load_intra_quantizer_matrix、i
ntra_quantizer_matrix[64]、load_non_intra_quantize
r_matrix、non_intra_quantizer_matrix[64]、load_chr
oma_intra_quantizer_matrix、chroma_intra_quantizer
_matrix[64]、load_chroma_non_intra_quantizer_matri
x、及びchroma_non_intra_quantizer_matrix[64] から
構成される。
リックスエクステンションのスタートを示す開始コード
である。extension_start_code_identifierは、どの拡
張データが送られるかを示すコードである。 quant_mat
rix_extension_present_flagは、この量子化マトリック
スエクステンション内のデータエレメントが有効か無効
かを示すためのデータである。load_intra_quantizer_m
atrixは、イントラマクロブロック用の量子化マトリッ
クスデータの存在を示すデータである。intra_quantize
r_matrixは、イントラマクロブロック用の量子化マトリ
ックスの値を示すデータである。
イントラマクロブロック用の量子化マトリックスデータ
の存在を示すデータである。non_intra_quantizer_matr
ixは、非イントラマクロブロック用の量子化マトリック
スの値を表すデータである。load_chroma_intra_quanti
zer_matrixは、色差イントラマクロブロック用の量子化
マトリックス・データの存在を示すデータである。chro
ma_intra_quantizer_matrixは、色差イントラマクロブ
ロック用の量子化マトリックスの値を示すデータであ
る。load_chroma_non_intra_quantizer_matrixは、色差
非イントラマクロブロック用の量子化マトリックス・デ
ータの存在を示すデータである。chroma_non_intra_qua
ntizer_matrixは、色差非イントラマクロブロック用の
量子化マトリックスの値を示すデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたコピーライト
エクステンションが、履歴ストリームとして記述されて
いる。
るデータエレメントは、extension_start_code、extens
ion_start_code_itentifier、copyright_extension_pre
sent_flag、copyright_flag、copyright_identifier、o
riginal_or_copy、copyright_number_1、copyright_num
ber_2、及び copyright_number_3から構成される。
クステンションのスタート示す開始コードである。exte
nsion_start_code_itentifierのどのエクステンション
データが送られるかを示すコードである。 copyright_e
xtension_present_flagは、このコピーライトエクステ
ンション内のデータエレメントが有効か無効かを示すた
めのデータである。copyright_flagは、次のコピーライ
トエクステンション又はシーケンスエンドまで、符号化
されたビデオデータに対してコピー権が与えられている
か否かを示す。
JTC/SC29によって指定されたコピー権の登録
機関を識別するためのデータである。original_or_copy
は、ビットストリーム中のデータが、オリジナルデータ
であるかコピーデータであるかを示すデータである。co
pyright_number_1は、コピーライトナンバーのビット4
4から63を表わすデータである。copyright_number_2
は、コピーライトナンバーのビット22から43を表わ
すデータである。copyright_number_3は、コピーライト
ナンバーのビット0から21を表わすデータである。
されたビットストリームのピクチャ層のユーザエリアに
は、過去の符号化処理において使用されたピクチャディ
スプレイエクステンション( picture_display_extensi
on )が、履歴ストリームとして記述されている。
ンを表わすデータエレメントは、extension_start_cod
e、extension_start_code_identifier、picture_displa
y_extension_present_flag、frame_center_horizontal_
offset_1、frame_center_vertical_offset_1、frame_ce
nter_horizontal_offset_2、frame_center_vertical_of
fset_2、frame_center_horizontal_offset_3、及びfram
e_center_vertical_offset_3から構成される。
プレイエクステンションのスタートを示すための開始コ
ードである。extension_start_code_identifierは、ど
の拡張データが送られるかを示すコードである。pictur
e_display_extension_present_flagは、ピクチャディス
プレイエクステンション内のデータエレメントが有効か
無効かを示すデータである。frame_center_horizontal_
offsetは、表示エリアの水平方向のオフセットを示すデ
ータであって、3つのオフセット値まで定義することが
できる。frame_center_vertical_offsetは、表示エリア
を垂直方向のオフセットを示すデータであって、3つの
オフセット値まで定義することができる。
ットストリームのピクチャ層のユーザエリアには、既に
説明したピクチャディスプレイエクステンションを表わ
す履歴情報の次に、過去の符号化処理において使用され
たユーザデータが、履歴ストリームとして記述されてい
る。
処理において使用されたマクロブロック層に関する情報
が、履歴ストリームとして記述されている。
croblock_address_h、macroblock_address_v、slice_he
ader_present_flag、skipped_macroblock_flag等のマク
ロブロックの位置に関するデータエレメントと、macrob
lock_quant、macroblock_motion_forward、macroblock_
motion_backward、mocroblock_pattern、macroblock_in
tra、spatial_temporal_weight_code_flag、frame_moti
on_type、及びdct_type等のマクロブロックモードに関
するデータエレメントと、quantiser_scale_code等の量
子化ステップ制御に関するデータエレメントと、PMV[0]
[0][0]、PMV[0][0][1]、motion_vertical_field_select
[0][0]、PMV[0][1][0]、PMV[0][1][1]、motion_vertica
l_field_select[0][1]、PMV[1][0][0]、PMV[1][0][1]、
motion_vertical_field_select[1][0]、PMV[1][1][0]、
PMV[1][1][1]、motion_vertical_field_select[1][1]等
の動き補償に関するデータエレメントと、coded_block_
pattern等のマクロブロックパターンに関するデータエ
レメントと、num_mv_bits、num_coef_bits、及びnum_ot
her_bits等の発生符号量に関するデータエレメントから
構成されている。
レメントについて詳細に説明する。
ロックの水平方向の絶対位置を定義するためのデータで
ある。macroblock_address_vは、現在のマクロブロック
の垂直方向の絶対位置を定義するためのデータである。
slice_header_present_flagは、このマクロブロックが
スライス層の先頭であり、スライスヘッダを伴なうか否
かを示すデータである。skipped_macroblock_flagは、
復号化処理においてこのマクロブロックをスキップする
か否かを示すデータでる。
図67に示されたマクロブロックタイプ( macroblock_
type )から導かれるデータであって、quantiser_scale
_codeがビットストリーム中に現れるか否かを示すデー
タである。macroblock_motion_forwardは、図65乃至
図67に示されたマクロブロックタイプから導かれるデ
ータであって、復号化処理で使用されるデータである。
macroblock_motion_backwardは、図65乃至図67に示
されたマクロブロックタイプから導かれるデータであっ
て、復号化処理で使用されるデータである。mocroblock
_patternは、図65乃至図67に示されたマクロブロッ
クタイプから導かれるデータであって、coded_block_pa
tternがビットストリーム中に現れるか否かを示すデー
タである。
示されたマクロブロックタイプから導かれるデータであ
って、復号化処理で使用されるデータである。spatial_
temporal_weight_code_flagは、図65乃至図67に示
されたマクロブロックタイプから導かれるデータであっ
て、時間スケーラビリティで下位レイヤ画像のアップサ
ンプリング方法を示すspatial_temporal_weight_code
は、ビットストリーム中に存在するか否かを示すデータ
である。
ブロックの予測タイプを示す2ビットのコードである。
予測ベクトルが2個でフィールドベースの予測タイプで
あれば「00」であって、予測ベクトルが1個でフィー
ルドベースの予測タイプであれば「01」であって、予
測ベクトルが1個でフレームベースの予測タイプであれ
ば「10」であって、予測ベクトルが1個でディアルプ
ライムの予測タイプであれば「11」である。field_mo
tion_typeは、フィールドのマクロブロックの動き予測
を示す2ビットのコードである。予測ベクトルが1個で
フィールドベースの予測タイプであれば「01」であっ
て、予測ベクトルが2個で18×8マクロブロックベー
スの予測タイプであれば「10」であって、予測ベクト
ルが1個でディアルプライムの予測タイプであれば「1
1」である。dct_typeは、DCTがフレームDCTモー
ドか、フィールドDCTモードかを示すデータである。
quantiser_scale_codeはマクロブロックの量子化ステッ
プサイズを示すデータである。
トについて説明する。動きベクトルは、復号時に必要な
動きベクトルを減少させるために、先に符号化されたベ
クトルに関し差分として符号化される。動きベクトルの
復号を行うために復号器は、4個の動きベクトル予測値
(それぞれ水平及び垂直成分を伴なう)を維持しなけれ
ばいけない。この予測動きベクトルをPMV[r][s][v]と表
わすことにしている。[r]は、マクロブロックにおける
動きベクトルが第1のベクトルであるのか、第2のベク
トルであるのかを示すフラグであって、マクロブロック
におけるベクトルが第1のベクトルである場合には
「0」となって、マクロブロックにおけるベクトルが第
2のベクトルである場合には「1」となる。[s]は、マ
クロブロックにおける動きベクトルの方向が、前方向で
あるのか後方向であるのかを示すフラグであって、前方
向動きベクトルの場合には「0」となって、後方向動き
ベクトルの場合には「1」となる。[v]は、マクロブロ
ックにおけるベクトルの成分が、水平方向であるのか垂
直方向であるのかを示すフラグであって、水平方向成分
の場合には「0」となって、垂直方向成分の場合には
「1」となる。
の前方向の動きベクトルの水平方向成分のデータを表わ
し、PMV[0][0][1]は、第1のベクトルの前方向の動きベ
クトルの垂直方向成分のデータを表わし、PMV[0][1][0]
は、第1のベクトルの後方向の動きベクトルの水平方向
成分のデータを表わし、PMV[0][1][1]は、第1のベクト
ルの後方向の動きベクトルの垂直方向成分のデータを表
わし、 PMV[1][0][0]は、第2のベクトルの前方向の動
きベクトルの水平方向成分のデータを表わし、PMV[1]
[0][1]は、第2のベクトルの前方向の動きベクトルの垂
直方向成分のデータを表わし、 PMV[1][1][0]は、第2
のベクトルの後方向の動きベクトルの水平方向成分のデ
ータを表わし、PMV[1][1][1] は、第2のベクトルの後
方向の動きベクトルの垂直方向成分のデータを表わして
いる。
予測の形式にいずれの参照フィールドを使用するのかを
示すデータである。このmotion_vertical_field_select
[r][s]が「0」の場合には、トップ参照フィールドを使
用し、「1」の場合には、ボトム参照フィールドを使用
することを示している。
[0][0]は、第1のベクトルの前方向の動きベクトルを生
成する際の参照フィールドを示し、motion_vertical_fi
eld_select[0][1]は、第1のベクトルの後方向の動きベ
クトルを生成する際の参照フィールドを示し、motion_v
ertical_field_select[1][0]は、第2のベクトルの前方
向の動きベクトルを生成する際の参照フィールドを示
し、motion_vertical_field_select[1][1]は、第2ベク
トルの後方向の動きベクトルを生成する際の参照フィー
ルドを示している。
納する複数のDCTブロックのうち、どのDCTブロッ
クに、有意係数(非0係数)があるかを示す可変長のデ
ータである。num_mv_bitsは、マクロブロック中の動き
ベクトルの符号量を示すデータである。num_coef_bits
は、マクロブロック中のDCT係数の符号量を示すデー
タである。num_other_bitsは、マクロブロックの符号量
で、動きベクトル及びDCT係数以外の符号量を示すデ
ータである。
タエレメントをデコードするためのシンタックスについ
て、図47乃至図64を参照して説明する。
rt_code()関数、sequence_header()関数、sequence_ext
ension()関数、extension_and_user_data(0)関数、grou
p_of_picture_header()関数、extension_and_user_data
(1)関数、picture_header()関数、picture_coding_exte
nsion()関数、extension_and_user_data(2)関数、及びp
icture_data()関数によって定義されたデータエレメン
トによって構成される。
ーム中に存在するスタートコードを探すための関数であ
るので、履歴ストリームの最も先頭には、図48に示す
ような、過去の符号化処理において使用されたデータエ
レメントであってsequence_header()関数によって定義
されたデータエレメントが記述されている。
たデータエレメントは、sequence_header_code、sequen
ce_header_present_flag、horizontal_size_value、ver
tical_size_value、aspect_ratio_information、frame_
rate_code、bit_rate_value、marker_bit、VBV_buffer_
size_value、constrained_parameter_flag、load_intra
_quantizer_matrix、intra_quantizer_matrix、load_no
n_intra_quantizer_matrix、及びnon_intra_quantizer_
matrix等である。
スタート同期コードを表すデータである。sequence_hea
der_present_flagは、sequence_header内のデータが有
効か無効かを示すデータである。 horizontal_size_val
ueは、画像の水平方向の画素数の下位12ビットから成る
データである。vertical_size_valueは、画像の縦のラ
イン数の下位12ビットからなるデータである。aspect_r
atio_informationは、画素のアスペクト比(縦横比)ま
たは表示画面アスペクト比を表すデータである。frame_
rate_codeは、画像の表示周期を表すデータである。bit
_rate_valueは、発生ビット量に対する制限のためのビ
ット・レートの下位18ビット(400bsp単位で切り上げる)
データである。
ションを防止するために挿入されるビットデータであ
る。VBV_buffer_size_valueは、発生符号量制御用の仮
想バッファ(ビデオバッファベリファイヤー)の大きさ
を決める値の下位10ビットデータである。constrained_
parameter_flagは、各パラメータが制限以内であること
を示すデータである。load_intra_quantizer_matrix
は、イントラMB用量子化マトリックス・データの存在を
示すデータである。intra_quantizer_matrixは、イント
ラMB用量子化マトリックスの値を示すデータである。
load_non_intra_quantizer_matrixは、非イントラMB
用量子化マトリックス・データの存在を示すデータであ
る。non_intra_quantizer_matrixは、非イントラMB用
量子化マトリックスの値を表すデータである。
たデータエレメントの次には、図49で示すような、se
quence_extension()関数によって定義されたデータエレ
メントが、履歴ストリームとして記述されている。
れたデータエレメントとは、extension_start_code、ex
tension_start_code_identifier、sequence_extension_
present_flag、profile_and_level_indication、progre
ssive_sequence、chroma_format、horizontal_size_ext
ension、vertical_size_extension、bit_rate_extensio
n、vbv_buffer_size_extension、low_delay、frame_rat
e_extension_n 、及びframe_rate_extension_d等のデー
タエレメントである。
ンデータのスタート同期コードを表すデータである。ex
tension_start_code_identifierは、どの拡張データが
送られるかを示すデータである。sequence_extension_p
resent_flagは、シーケンスエクステンション内のデー
タが有効であるか無効であるかを示すスデータである。
profile_and_level_indicationは、ビデオデータのプロ
ファイルとレベルを指定するためのデータである。prog
ressive_sequenceは、ビデオデータが順次走査であるこ
とを示すデータである。chroma_formatは、ビデオデー
タの色差フォーマットを指定するためのデータである。
horizontal_size_extensionは、シーケンスヘッダのhor
izntal_size_valueに加える上位2ビットのデータであ
る。vertical_size_extensionは、シーケンスヘッダのv
ertical_size_value加える上位2ビットのデータであ
る。bit_rate_extensionは、シーケンスヘッダのbit_ra
te_valueに加える上位12ビットのデータである。vbv_
buffer_size_extensionは、シーケンスヘッダのvbv_buf
fer_size_valueに加える上位8ビットのデータである。
を示すデータである。frame_rate_extension_nは、シー
ケンスヘッダのframe_rate_codeと組み合わせてフレー
ムレートを得るためのデータである。frame_rate_exten
sion_dは、シーケンスヘッダのframe_rate_codeと組み
合わせてフレームレートを得るためのデータである。
れたデータエレメントの次には、図50に示すようなex
tension_and_user_data(0)関数によって定義されたデー
タエレメントが、履歴ストリームとして記述されてい
る。 extension_and_user_data(i)関数は、「i」が2以
外のときは、extension_data()関数によって定義される
データエレメントは記述せずに、user_data()関数によ
って定義されるデータエレメントのみを履歴ストリーム
として記述する。よって、 extension_and_user_data
(0)関数は、 user_data()関数によって定義されるデー
タエレメントのみを履歴ストリームとして記述する。
うなシンタックスに基いて、ユーザデータを履歴ストリ
ームとして記述する。
定義されたデータエレメントの次には、図52に示すよ
うなgroup_of_picture_header()関数によって定義され
たデータエレメント、及びextension_and_user_data(1)
関数によって定義されるデータエレメントが、履歴スト
リームとして記述されている。但し、履歴ストリーム中
に、GOP層のスタートコードを示すgroup_start_code
が記述されている場合にのみ、 group_of_picture_head
er()関数によって定義されたデータエレメント、及びex
tension_and_user_data(1)関数によって定義されるデー
タエレメントが記述されている。
定義されたデータエレメントは、group_start_code、gr
oup_of_picture_header_present_flag、time_code、clo
sed_gop、及びbroken_linkから構成される。
コードを示すデータである。 group_of_picture_header
_present_flagは、 group_of_picture_header内のデー
タエレメントが有効であるか無効であるかを示すデータ
である。 time_codeは、GOPの先頭ピクチャのシーケ
ンスの先頭からの時間を示すタイムコードである。clos
ed_gopは、GOP内の画像が他のGOPから独立再生可
能なことを示すフラグデータである。broken_linkは、
編集などのためにGOP内の先頭のBピクチャが正確に
再生できないことを示すフラグデータである。
ension_and_user_data(0)関数と同じように、user_data
()関数によって定義されるデータエレメントのみを履歴
ストリームとして記述する。
タートコードを示すgroup_start_codeが存在しない場合
には、これらのgroup_of_picture_header()関数及びext
ension_and_user_data(1)関数によって定義されるデー
タエレメントは、履歴ストリーム中には記述されていな
い。その場合には、 extension_and_user_data(0)関数
によって定義されたデータエレメントの次に、picture_
headr()関数によって定義されたデータエレメントが履
歴ストリームとして記述されている。
データエレメントは、図53に示すように、picture_st
art_code、temporal_reference、picture_coding_typ
e、vbv_delay、full_pel_forward_vector、forward_f_c
ode、full_pel_backward_vector、backward_f_code、ex
tra_bit_picture、及びextra_information_pictureであ
る。
チャ層の開始同期コードを表すデータである。temporal
_referenceは、ピクチャの表示順を示す番号でGOPの
先頭でリセットされるデータである。picture_coding_t
ypeは、ピクチャタイプを示すデータである。vbv_delay
は、ランダムアクセス時の仮想バッファの初期状態を示
すデータである。full_pel_forward_vectorは、順方向
動きベクトルの精度が整数単位か半画素単位かを示すデ
ータである。forward_f_codeは、順方向動きベクトル探
索範囲を表すデータである。full_pel_backward_vector
は、逆方向動きベクトルの精度が整数単位か半画素単位
かを示すデータである。backward_f_codeは、逆方向動
きベクトル探索範囲を表すデータである。 extra_bit_p
ictureは、後続する追加情報の存在を示すフラグであ
る。このextra_bit_pictureが「1」の場合には、次にe
xtra_information_pictureが存在し、extra_bit_pictur
eが「0」の場合には、これに続くデータが無いことを
示している。extra_information_pictureは、規格にお
いて予約された情報である。
データエレメントの次には、図54に示すようなpictur
e_coding_extension()関数によって定義されたデータエ
レメントが、履歴ストリームとして記述されている。
って定義されたデータエレメントとは、extension_star
t_code、extension_start_code_identifier、f_code[0]
[0]、f_code[0][1]、f_code[1][0]、f_code[1][1]、int
ra_dc_precision、picture_structure、top_field_firs
t、frame_predictive_frame_dct、concealment_motion_
vectors、q_scale_type、intra_vlc_format、alternate
_scan、repeat_firt_field、chroma_420_type、progres
sive_frame、composite_display_flag、v_axis、field_
sequence、sub_carrier、burst_amplitude、及びsub_ca
rrier_phaseから構成される。
クステンションデータのスタートを示す開始コードであ
る。extension_start_code_identifierは、どの拡張デ
ータが送られるかを示すコードである。 f_code[0][0]
は、フォワード方向の水平動きベクトル探索範囲を表す
データである。f_code[0][1]は、フォワード方向の垂直
動きベクトル探索範囲を表すデータである。f_code[1]
[0]は、バックワード方向の水平動きベクトル探索範囲
を表すデータである。f_code[1][1]は、バックワード方
向の垂直動きベクトル探索範囲を表すデータである。in
tra_dc_precisionは、DC係数の精度を表すデータであ
る。
チャかフィールドストラクチャかを示すデータである。
フィールドストラクチャの場合は、上位フィールドか下
位フィールドかもあわせて示すデータである。top_fiel
d_firstは、フレームストラクチャの場合、最初のフィ
ールドが上位か下位かを示すデータである。frame_pred
ictive_frame_dctは、フレーム・ストラクチャの場合、
フレーム・モードDCTの予測がフレーム・モードだけ
であることを示すデータである。concealment_motion_v
ectorsは、イントラマクロブロックに伝送エラーを隠蔽
するための動きベクトルがついていることを示すデータ
である。q_scale_typeは、線形量子化スケールを利用す
るか、非線形量子化スケールを利用するかを示すデータ
である。intra_vlc_formatは、イントラマクロブロック
に、別の2次元VLCを使うかどうかを示すデータであ
る。
うか、オルタネート・スキャンを使うかの選択を表すデ
ータである。repeat_firt_fieldは、2:3プルダウン
の際に使われるデータである。chroma_420_typeは、信
号フォーマットが4:2:0の場合、次のprogressive_
frame と同じ値、そうでない場合は0を表すデータであ
る。progressive_frameは、このピクチャが、順次走査
できているかどうかを示すデータである。composite_di
splay_flagは、ソース信号がコンポジット信号であった
かどうかを示すデータである。v_axisは、ソース信号
が、PALの場合に使われるデータである。field_sequ
enceは、ソース信号が、PALの場合に使われるデータ
である。sub_carrierは、ソース信号が、PALの場合
に使われるデータである。burst_amplitudeは、ソース
信号が、PALの場合に使われるデータである。sub_ca
rrier_phaseは、ソース信号が、PALの場合に使われ
るデータである。
定義されたデータエレメントの次には、extensions_and
_user_data(2)によって定義されたデータエレメント
が、履歴ストリームとして記述されている。このextens
ion_and_user_data(2)関数は、図50に示したように、
ビットストリーム中にエクステンションスタートコード
(extension_start_code)が存在する場合には、extens
ion_data()関数によって定義されるデータエレメントが
記述されている。このデータエレメントの次には、ビッ
トストリーム中にユーザデータスタートコード(user_d
ata_start_code)が存在する場合には、user_data()関
数によって定義されるデータエレメントが記述されてい
る。但し、ビットストリーム中にエクステンションスタ
ートコード及びユーザデータスタートコードが存在しな
い場合には extension_data()関数及びuser_data()関数
によって定義されるデータエレメントはビットトリーム
中には記述されていない。
うに、extension_start_codeを示すデータエレメント
と、quant_matrix_extension()関数、copyright_extens
ion()関数、及びpicture_display_extension()関数によ
って定義されるデータエレメンエトとを、ビットストリ
ーム中に履歴ストリームとして記述するための関数であ
る。
義されるデータエレメントは、図56に示すように、ex
tension_start_code、extension_start_code_identifie
r、quant_matrix_extension_present_flag、load_intra
_quantizer_matrix、intra_quantizer_matrix[64]、loa
d_non_intra_quantizer_matrix、non_intra_quantizer_
matrix[64]、load_chroma_intra_quantizer_matrix、ch
roma_intra_quantizer_matrix[64]、load_chroma_non_i
ntra_quantizer_matrix、及びchroma_non_intra_quanti
zer_matrix[64] である。
リックスエクステンションのスタートを示す開始コード
である。extension_start_code_identifierは、どの拡
張データが送られるかを示すコードである。 quant_mat
rix_extension_present_flagは、この量子化マトリック
スエクステンション内のデータエレメントが有効か無効
かを示すためのデータである。load_intra_quantizer_m
atrixは、イントラマクロブロック用の量子化マトリッ
クスデータの存在を示すデータである。intra_quantize
r_matrixは、イントラマクロブロック用の量子化マトリ
ックスの値を示すデータである。
イントラマクロブロック用の量子化マトリックスデータ
の存在を示すデータである。non_intra_quantizer_matr
ixは、非イントラマクロブロック用の量子化マトリック
スの値を表すデータである。load_chroma_intra_quanti
zer_matrixは、色差イントラマクロブロック用の量子化
マトリックス・データの存在を示すデータである。chro
ma_intra_quantizer_matrixは、色差イントラマクロブ
ロック用の量子化マトリックスの値を示すデータであ
る。load_chroma_non_intra_quantizer_matrixは、色差
非イントラマクロブロック用の量子化マトリックス・デ
ータの存在を示すデータである。chroma_non_intra_qua
ntizer_matrixは、色差非イントラマクロブロック用の
量子化マトリックスの値を示すデータである。
されるデータエレメントは、図57に示すように、 ext
ension_start_code、extension_start_code_itentifie
r、copyright_extension_present_flag、copyright_fla
g、copyright_identifier、original_or_copy、copyrig
ht_number_1、copyright_number_2、及び copyright_nu
mber_3から構成される。
クステンションのスタート示す開始コードである。exte
nsion_start_code_itentifierどのエクステンションデ
ータが送られるかを示すコードである。 copyright_ext
ension_present_flagは、このコピーライトエクステン
ション内のデータエレメントが有効か無効かを示すため
のデータである。
ステンション又はシーケンスエンドまで、符号化された
ビデオデータに対してコピー権が与えられているか否か
を示す。copyright_identifierは、ISO/IEC J
TC/SC29によって指定されたコピー権の登録機関
を識別するためのデータである。original_or_copyは、
ビットストリーム中のデータが、オリジナルデータであ
るかコピーデータであるかを示すデータである。copyri
ght_number_1は、コピーライトナンバーのビット44か
ら63を表わすデータである。copyright_number_2は、
コピーライトナンバーのビット22から43を表わすデ
ータである。copyright_number_3は、コピーライトナン
バーのビット0から21を表わすデータである。
て定義されるデータエレメントは、図58に示すよう
に、extension_start_code_identifier、frame_center_
horizontal_offset、frame_center_vertical_offset等
である。
の拡張データが送られるかを示すコードである。 frame
_center_horizontal_offsetは、表示エリアの水平方向
のオフセットを示すデータであって、number_of_frame_
center_offsetsによって定義される数のオフセット値を
定義することができる。frame_center_vertical_offset
は、表示エリアを垂直方向のオフセットを示すデータで
あって、 number_of_frame_center_offsetsによって定
義される数のオフセット値を定義することができる。
_data(2)関数によって定義されるデータエレメントの次
には、picture_data()関数によって定義されるデータエ
レメントが、履歴ストリームとして記述されている。
ータエレメントは、図59に示すように、slice()関数
によって定義されるデータエレメントである。但し、ビ
ットストリーム中に、slice()関数のスタートコードを
示すslice_start_codeが存在しない場合には、このslic
e()関数によって定義されるデータエレメントはビット
ストリーム中に記述されていない。
に、slice_start_code、slice_quantiser_scale_code、
intra_slice_flag、intra_slice、reserved_bits、extr
a_bit_slice、extra_information_slice、及びextra_bi
t_slice 等のデータエレメントと、macroblock()関数に
よって定義されるデータエレメントを、履歴ストリーム
として記述するための関数である。
て定義されるデータエレメントのスタートを示すスター
トコードである。slice_quantiser_scale_codeは、この
スライス層に存在するマクロブロックに対して設定され
た量子化ステップサイズを示すデータである。しかし、
各マクロブロック毎に、quantiser_scale_codeが設定さ
れている場合には、各マクロブロックに対して設定され
たmacroblock_quantiser_scale_codeのデータが優先し
て使用される。
にintra_slice及びreserved_bitsが存在するか否かを示
すフラグである。intra_sliceは、スライス層中にノン
イントラマクロブロックが存在するか否かを示すデータ
である。スライス層におけるマクロブロックのいずれか
がノンイントラマクロブロックである場合には、intra_
sliceは「0」となり、スライス層におけるマクロブロ
ックの全てがノンイントラマクロブロックである場合に
は、intra_sliceは「1」となる。reserved_bitsは、7
ビットのデータであって「0」の値を取る。extra_bit_
sliceは、履歴ストリームとして追加の情報が存在する
ことを示すフラグであって、次にextra_information_sl
iceが存在する場合には「1」に設定される。追加の情
報が存在しない場合には「0」に設定される。
oblock()関数によって定義されたデータエレメントが、
履歴ストリームとして記述されている。
に、macroblock_escape、macroblock_address_incremen
t、及びmacroblock_quantiser_scale_code等のデータエ
レメントと、macroblock_modes()関数、及び macrobloc
k_vecters(s)関数によって定義されたデータエレメント
を記述するための関数である。
クと前のマクロブロックとの水平方向の差が34以上で
あるか否かを示す固定ビット列である。参照マクロブロ
ックと前のマクロブロックとの水平方向の差が34以上
の場合には、macroblock_address_incrementの値に33
をプラスする。macroblock_address_incrementは、参照
マクロブロックと前のマクロブロックとの水平方向の差
を示すデータである。もし、このmacroblock_address_i
ncrementの前にmacroblock_escapeが1つ存在するので
あれば、このmacroblock_address_incrementの値に33
をプラスした値が、実際の参照マクロブロックと前のマ
クロブロックとの水平方向の差分を示すデータとなる。
マクロブロック毎に設定された量子化ステップサイズで
ある。各スライス層には、スライス層の量子化ステップ
サイズを示すslice_quantiser_scale_codeが設定されて
いるが、参照マクロブロックに対してmacroblock_quant
iser_scale_codeが設定されている場合には、この量子
化ステップサイズを選択する。
macroblock_modes()関数によって定義されるデータエレ
メントが記述されている。macroblock_modes()関数は、
図62に示すように、macroblock_type、frame_motion_
type、field_motion_type、dct_type等のデータエレメ
ントを、履歴ストリームとして記述するための関数であ
る。
符号化タイプを示すデータである。具体的には、図65
乃至図67に示されるように、macroblock_typeは、mac
roblock_quant、dct_type_flag、macroblock_motion_fo
rward、及びmacroblock_motion_backwardなどのフラグ
から生成された可変長データである。 macroblock_quan
tは、マクロブロックに対して量子化ステップサイズを
設定するためのmacroblock_quantiser_scale_codeが設
定されているか否かを示すフラグあって、ビットストリ
ーム中にmacroblock_quantiser_scale_codeが存在する
場合には、 macroblock_quantは「1」の値を取る。
フレームDCT又はフィールドDCTで符号化されてい
るかを示すdct_typeが存在するか否かを示すためのフラ
グ(言い換えるとDCTされているか否かを示すフラ
グ)であって、ビットストリーム中にdct_typeが存在す
る場合には、このdct_type_flagは「1」の値を取る。m
acroblock_motion_forwardは、参照マクロブロックが前
方予測されているか否かを示すフラグであって、前方予
測されている場合には「1」の値を取る。macroblock_m
otion_backwardは、参照マクロブロックが後方予測され
ているか否かを示すフラグであって、後方予測されてい
る場合には「1」の値を取る。
roblock_motion_backwardが「1」のときに、ピクチャ
構造がフレームのときに、frame_period_frame_dctが
「0」のときには、macroblock_typeを表わすデータエ
レメントの次にframe_motion_typeを表わすデータエレ
メントが記述されている。尚、このframe_period_frame
_dctは、 frame_motion_typeがビットストリーム中に存
在するか否かを示すフラグである。
ブロックの予測タイプを示す2ビットのコードである。
予測ベクトルが2個でフィールドベースの予測タイプで
あれば「00」であって、予測ベクトルが1個でフィー
ルドベースの予測タイプであれば「01」であって、予
測ベクトルが1個でフレームベースの予測タイプであれ
ば「10」であって、予測ベクトルが1個でディアルプ
ライムの予測タイプであれば「11」である。
roblock_motion_backwardが「1」のときに、ピクチャ
構造がフレーム出ない場合には、macroblock_typeを表
わすデータエレメントの次にfield_motion_typeを表わ
すデータエレメントが記述されている。
ロブロックの動き予測を示す2ビットのコードである。
予測ベクトルが1個でフィールドベースの予測タイプで
あれば「01」であって、予測ベクトルが2個で18×
8マクロブロックベースの予測タイプであれば「10」
であって、予測ベクトルが1個でディアルプライムの予
測タイプであれば「11」である。
_period_frame_dctがframe_motion_typeがビットストリ
ーム中に存在することを示し、且つ、frame_period_fra
me_dctがdct_typeがビットストリーム中に存在すること
を示す場合には、macroblock_typeを表わすデータエレ
メントの次にdct_typeを表わすデータエレメントが記述
されている。尚、dct_typeは、DCTがフレームDCT
モードか、フィールドDCTモードかを示すデータであ
る。
ロックが前方予測マクロブロックであるか又は参照マク
ロブロックがイントラマクロブロックであって且つコン
シール処理のマクロブロックのいずれかの場合には、mo
tion_vectors(0)関数によって定義されるデータエレメ
ントが記述される。また、参照マクロブロックが後方予
測マクロブロックである場合には、motion_vectors(1)
関数によって定義されるデータエレメントが記述され
る。尚、 motion_vectors(0)関数は、第1番めの動きベ
クトルに関するデータエレメントを記述するための関数
であって、motion_vectors(1)関数は、第2番めの動き
ベクトルに関するデータエレメントを記述するための関
数である。
れるように、動きベクトルに関するデータエレメントを
記述するための関数である。
イム予測モードを使用していない場合には、motion_ver
tical_field_select[0][s]とmotion_vector(0,s)によっ
て定義されるデータエレメントが記述される。
は、第1番目の動きベクトル(前方又は後方のどちらの
ベクトルであっても良い)が、ボトムフィールドを参照
して作られたベクトルであるかトップフィールドを参照
して作られたベクトルであるかを示すフラグである。こ
の指標“r”は、第1番めのベクトル又は第2番めのベ
クトルのいずれのベクトルであるかを示す指標であっ
て、“s”は、予測方向が前方又は後方予測のいずれで
あるかを示す指標である。
れるように、motion_code[r][s][t]に関するデータ列
と、motion_residual[r][s][t]に関するデータ列と、dm
vector[t]を表わすデータとを記述するための関数であ
る。
大きさを−16〜+16の範囲で表わす可変長のデータ
である。 motion_residual[r][s][t]は、動きベクトル
の残差を表わす可変長のデータである。よって、このmo
tion_code[r][s][t]と motion_residual[r][s][t]との
値によって詳細な動きベクトルを記述することができ
る。 dmvector[t]は、ディユアルプライム予測モードの
ときに、一方のフィールド(例えばボトムフィールドに
対してトップフィールドを一方のフィールドとする)に
おける動きベクトルを生成するために、時間距離に応じ
て既存の動きベクトルがスケールされると共に、トップ
フィールドとボトムフィールドとのライン間の垂直方向
のずれを反映させるために垂直方向に対して補正を行う
データである。この指標“r”は、第1番めのベクトル
又は第2番めのベクトルのいずれのベクトルであるかを
示す指標であって、“s”は、予測方向が前方又は後方
予測のいずれであるかを示す指標である。“s”は、動
きベクトルが垂直方向の成分であるか水平方向の成分で
あるかを示すデータである。
よって、まず、水平方向のmotion_coder[r][s][0]を表
わすデータ列が、履歴ストリームとして記述される。mo
tion_residual[0][s][t]及びmotion_residual[1][s][t]
の双方のビット数は、f_code[s][t]で示されるので、 f
_code[s][t]が1でない場合には、 motion_residual[r]
[s][t] がビットストリーム中に存在することを示すこ
とになる。水平方向成分のmotion_residual[r][s][0]が
「1」でなくて、水平方向成分のmotion_code[r][s][0]
が「0」でないということは、ビットストリーム中にmo
tion_residual[r][s][0]を表わすデータエレメントが存
在し、動きベクトルの水平方向成分が存在するというこ
とを意味しているので、その場合には、水平方向成分の
motion_residual[r][s][0]を表わすデータエレメントが
記述されている。
[1]を表わすデータ列が、履歴ストリームとして記述さ
れる。同じようにmotion_residual[0][s][t]及びmotion
_residual[1][s][t]の双方のビット数は、f_code[s][t]
で示されるので、 f_code[s][t]が1でない場合には、
motion_residual[r][s][t] がビットストリーム中に存
在することを表わすことになる。motion_residual[r]
[s][1]が「1」でなくて、motion_code[r][s][1]が
「0」でないということは、ビットストリーム中にmoti
on_residual[r][s][1]を表わすデータエレメントが存在
し、動きベクトルの垂直方向成分が存在するということ
を意味しているので、その場合には、垂直方向成分のmo
tion_residual[r][s][1]を表わすデータエレメントが記
述されている。
送するビットレートを減少させるために、履歴情報を削
減することができる。
ors()は転送するが、quantiser_scale_codeを転送しな
い場合には、slice_quantiser_scale_codeを”0000
0”とすることで、ビットレートを減少させることがで
きる。
n_vectors()、quantiser_scale_code、およびdct_type
を転送しない場合には、macroblock_typeとして、”not
coded”を使用することで、ビットレートを減少するこ
とができる。
送し、slice()以下の情報は全て転送しない場合には、s
lice_start_codeを持たないpicture_data()を使用する
ことで、ビットレートを減少させることができる。
トの連続する”0”が出ないようにする場合に、22ビ
ット毎に”1”を挿入するようにしたが、22ビット毎
でなくてもよい。また、連続する”0”の個数を数え
て”1”を挿入するのではなく、Byte_allignを調べて
挿入するようにすることも可能である。
続する”0”の発生を禁止しているが、実際には、バイ
トの先頭から23ビット連続する場合だけが問題とさ
れ、バイトの先頭ではなく、途中から0が23ビット連
続する場合は、問題とされない。従って、例えば24ビ
ット毎に、LSB以外の位置に”1”を挿入するようにし
てもよい。
o elementary streamに近い形式にしたが、packetized
elementary streamやtransport streamに近い形式にし
てもよい。また、Elementary Streamのuser_dataの場所
を、picture_dataの前としたが、他の場所にすることも
できる。
グラムは、磁気ディスク、CD-ROM等の情報記録媒体より
なる提供媒体のほか、インターネット、デジタル衛星な
どのネットワーク提供媒体を介してユーザに提供するこ
とができる。
置、請求項2に記載の符号化方法、および請求項3に記
載の提供媒体によれば、符号化ビットストリームのピク
チャ層のユーザデータエリアに、符号化履歴情報を挿入
するようにしたので、小さい規模の装置で、再符号化に
伴う画像の劣化を抑制することが可能となる。
イプを説明する図である。
イプを説明する図である。
る。
示すブロック図である。
である。
る図である。
る図である。
する図である。
する図である。
である。
る図である。
成を示すブロック図である。
構成を示すブロック図である。
ダ111の構成を示すブロック図である。
る図である。
コーダ121の構成を示すブロック図である。
例を示すブロック図である。
を示すブロック図である。
ロック図である。
ブロック図である。
タイミングチャートである。
ロック図である。
すブロック図である。
すブロック図である。
すブロック図である。
構成例を示すブロック図である。
される状態を示す図である。
る図である。
ャタイプ判定処理を説明するフローチャートである。
る。
である。
を説明する図である。
を説明するフローチャートである。
示すブロック図である。
である。
ある。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
()のシンタックスを説明する図である。
る図である。
する図である。
を説明する図である。
ある。
を説明する図である。
図である。
を説明する図である。
図である。
説明する図である。
明する図である。
スを説明する図である。
である。
る。
ある。
る図である。
る図である。
る図である。
長符号を説明する図である。
長符号を説明する図である。
長符号を説明する図である。
示すブロック図である。
示すブロック図である。
る図である。
12,13 A/D変換器, 14 フレームメモリ,
15 輝度信号フレームメモリ, 16 色差信号フ
レームメモリ, 17 フォーマット変換回路, 18
エンコーダ,31 デコーダ, 32 フォーマット
変換回路, 33 フレームメモリ,34 輝度信号フ
レームメモリ, 35 色差信号フレームメモリ, 3
6,37 D/A変換器, 50 動きベクトル検出回
路, 51 フレームメモリ,52 予測モード切り替
え回路, 53 演算部, 54 予測判定回路,55
DCTモード切り替え回路, 56 DCT回路, 57
量子化回路, 58可変長符号化回路, 59 送信バ
ッファ, 60 逆量子化回路, 61IDCT回路, 6
2 演算器, 63 フレームメモリ, 64 動き補
償回路,81 受信バッファ, 82 可変長復号化回
路, 83 逆量子化回路,84 IDCT回路, 85
演算器, 86 フレームメモリ, 87 動き補償回
路, 101 トランスコーダ, 102 復号装置,
103 符号化パラメータ多重装置, 105 符号
化パラメータ分離装置, 106 符号化装置, 10
6 SDTI, 111 デコーダ, 112 可変長復号
化回路, 121 エンコーダ, 122 符号化パラ
メータコントローラ, 131 トランスコーダ, 1
32 復号装置, 133 符号化装置, 134 動
き検出部, 135 符号化部
Claims (3)
- 【請求項1】 ソースビデオデータを符号化する符号化
装置において、 前記ソースビデオデータをMPEG規格に基づいて符号化
し、符号化ビットストリームを生成する符号化手段と、 前記符号化手段により生成された符号化ビットストリー
ムのピクチャ層のユーザデータエリアに、前記ソースビ
デオデータの過去の符号化処理における符号化履歴情報
を挿入する挿入手段とを備えることを特徴とする符号化
装置。 - 【請求項2】 ソースビデオデータを符号化する符号化
装置の符号化方法において、 前記ソースビデオデータをMPEG規格に基づいて符号化
し、符号化ビットストリームを生成する符号化ステップ
と、 前記符号化ステップで生成された符号化ビットストリー
ムのピクチャ層のユーザデータエリアに、前記ソースビ
デオデータの過去の符号化処理における符号化履歴情報
を挿入する挿入ステップとを含むことを特徴とする符号
化方法。 - 【請求項3】 ソースビデオデータを符号化する符号化
装置に、 前記ソースビデオデータをMPEG規格に基づいて符号化
し、符号化ビットストリームを生成する符号化ステップ
と、 前記符号化ステップで生成された符号化ビットストリー
ムのピクチャ層のユーザデータエリアに、前記ソースビ
デオデータの過去の符号化処理における符号化履歴情報
を挿入する挿入ステップとを含む処理を実行させるコン
ピュータが読み取り可能なプログラムを提供することを
特徴とする提供媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20015898A JP3724203B2 (ja) | 1998-03-10 | 1998-07-15 | 符号化装置および方法、並びに記録媒体 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5811898 | 1998-03-10 | ||
JP15724398 | 1998-06-05 | ||
JP10-58118 | 1998-06-05 | ||
JP10-157243 | 1998-06-05 | ||
JP20015898A JP3724203B2 (ja) | 1998-03-10 | 1998-07-15 | 符号化装置および方法、並びに記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000059766A true JP2000059766A (ja) | 2000-02-25 |
JP3724203B2 JP3724203B2 (ja) | 2005-12-07 |
Family
ID=27296485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20015898A Expired - Fee Related JP3724203B2 (ja) | 1998-03-10 | 1998-07-15 | 符号化装置および方法、並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3724203B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007081983A (ja) * | 2005-09-15 | 2007-03-29 | Sony Corp | 符号化装置、符号化方法、復号装置、復号方法およびプログラム |
JP4898064B2 (ja) * | 2000-05-26 | 2012-03-14 | トムソン ライセンシング | ビデオ画像ストリームを記録する方法及びデコードする方法 |
JP2012182797A (ja) * | 2002-01-22 | 2012-09-20 | Microsoft Corp | 開始符号エミュレーションの防止およびデータ充填のための方法およびシステム |
US10271069B2 (en) | 2016-08-31 | 2019-04-23 | Microsoft Technology Licensing, Llc | Selective use of start code emulation prevention |
CN113711589A (zh) * | 2019-04-01 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 帧间编解码模式中的二分之一像素插值滤波器 |
US11503288B2 (en) | 2019-08-20 | 2022-11-15 | Beijing Bytedance Network Technology Co., Ltd. | Selective use of alternative interpolation filters in video processing |
CN115379248A (zh) * | 2022-07-14 | 2022-11-22 | 百果园技术(新加坡)有限公司 | 一种视频源流替换方法、系统、设备及存储介质 |
-
1998
- 1998-07-15 JP JP20015898A patent/JP3724203B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4898064B2 (ja) * | 2000-05-26 | 2012-03-14 | トムソン ライセンシング | ビデオ画像ストリームを記録する方法及びデコードする方法 |
JP2012182797A (ja) * | 2002-01-22 | 2012-09-20 | Microsoft Corp | 開始符号エミュレーションの防止およびデータ充填のための方法およびシステム |
JP2007081983A (ja) * | 2005-09-15 | 2007-03-29 | Sony Corp | 符号化装置、符号化方法、復号装置、復号方法およびプログラム |
US10271069B2 (en) | 2016-08-31 | 2019-04-23 | Microsoft Technology Licensing, Llc | Selective use of start code emulation prevention |
US11483552B2 (en) | 2019-04-01 | 2022-10-25 | Beijing Bytedance Network Technology Co., Ltd. | Half-pel interpolation filter in inter coding mode |
CN113711589B (zh) * | 2019-04-01 | 2022-10-25 | 北京字节跳动网络技术有限公司 | 帧间编解码模式中的二分之一像素插值滤波器 |
CN113711589A (zh) * | 2019-04-01 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 帧间编解码模式中的二分之一像素插值滤波器 |
US11595641B2 (en) | 2019-04-01 | 2023-02-28 | Beijing Bytedance Network Technology Co., Ltd. | Alternative interpolation filters in video coding |
US11936855B2 (en) | 2019-04-01 | 2024-03-19 | Beijing Bytedance Network Technology Co., Ltd. | Alternative interpolation filters in video coding |
US11503288B2 (en) | 2019-08-20 | 2022-11-15 | Beijing Bytedance Network Technology Co., Ltd. | Selective use of alternative interpolation filters in video processing |
US12075038B2 (en) | 2019-08-20 | 2024-08-27 | Beijing Bytedance Network Technology Co., Ltd. | Selective use of alternative interpolation filters in video processing |
CN115379248A (zh) * | 2022-07-14 | 2022-11-22 | 百果园技术(新加坡)有限公司 | 一种视频源流替换方法、系统、设备及存储介质 |
CN115379248B (zh) * | 2022-07-14 | 2023-12-12 | 百果园技术(新加坡)有限公司 | 一种视频源流替换方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3724203B2 (ja) | 2005-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100571687B1 (ko) | 코딩 시스템 및 방법, 부호화 장치 및 방법, 복호화 장치및 방법, 기록 장치 및 방법, 및 재생 장치 및 방법 | |
KR100766740B1 (ko) | 부호화 히스토리 정보를 이용하는 데이터 변환 장치 및 방법 | |
JP3724205B2 (ja) | 復号装置および方法、並びに記録媒体 | |
JP2000059766A (ja) | 符号化装置および方法、並びに提供媒体 | |
JP3724204B2 (ja) | 符号化装置および方法、並びに記録媒体 | |
JP2001169278A (ja) | ストリーム生成装置および方法、ストリーム伝送装置および方法、符号化装置および方法、並びに記録媒体 | |
JP3890838B2 (ja) | 符号化ストリーム変換装置、および、符号化ストリーム変換方法、並びに、記録媒体 | |
JP4016290B2 (ja) | ストリーム変換装置およびストリーム変換方法、符号化装置および符号化方法、並びに、記録媒体 | |
JP4139983B2 (ja) | 符号化ストリーム変換装置、および、符号化ストリーム変換方法、並びに、ストリーム出力装置、および、ストリーム出力方法 | |
JP4016294B2 (ja) | 符号化装置および符号化方法、ストリーム変換装置およびストリーム変換方法、並びに記録媒体 | |
JP3817951B2 (ja) | ストリーム伝送装置および方法、並びに記録媒体 | |
JP4539637B2 (ja) | ストリーム記録装置およびストリーム記録方法、ストリーム再生装置およびストリーム再生方法、ストリーム伝送装置およびストリーム伝送方法、並びに、プログラム格納媒体 | |
JP3724202B2 (ja) | 画像データ処理装置および方法、並びに記録媒体 | |
JP2000059770A (ja) | データ伝送装置および方法、並びに提供媒体 | |
JP3817952B2 (ja) | 再符号化装置および方法、符号化装置および方法、並びに記録媒体 | |
JP4478630B2 (ja) | 復号装置および復号方法、プログラム、並びに記録媒体 | |
JP4016348B2 (ja) | ストリーム変換装置およびストリーム変換方法、並びに、記録媒体 | |
JP4016293B2 (ja) | 符号化装置および符号化方法、並びに記録媒体 | |
JP4016349B2 (ja) | ストリーム変換装置およびストリーム変換方法、並びに、記録媒体 | |
JP4016347B2 (ja) | ストリーム変換装置およびストリーム変換方法、並びに、記録媒体 | |
JP4482811B2 (ja) | 記録装置及び方法 | |
JP4543321B2 (ja) | 再生装置及び方法 | |
JP2007124703A (ja) | 復号装置および復号方法、伝送装置および伝送方法、並びに記録媒体 | |
JP2007124704A (ja) | 復号装置および復号方法、伝送装置および伝送方法、並びに、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040130 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041015 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050531 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050801 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050912 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080930 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090930 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090930 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100930 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100930 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110930 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110930 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120930 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120930 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130930 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |