JP3837889B2 - エンコード方法およびエンコード装置 - Google Patents
エンコード方法およびエンコード装置 Download PDFInfo
- Publication number
- JP3837889B2 JP3837889B2 JP36926497A JP36926497A JP3837889B2 JP 3837889 B2 JP3837889 B2 JP 3837889B2 JP 36926497 A JP36926497 A JP 36926497A JP 36926497 A JP36926497 A JP 36926497A JP 3837889 B2 JP3837889 B2 JP 3837889B2
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- layer
- recording
- bytes
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8227—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Description
【発明の属する技術分野】
本発明は、画像/音声信号を圧縮して記録媒体に記録するためのエンコード方法および装置に関し、特に画像/音声信号をディジタルビデオディスク(DVD)などのいわゆるパッケージメディアに蓄積するために好適なエンコード方法および装置に関する。
【0002】
【従来の技術】
ビデオ情報を圧縮符号化してディジタルビデオディスク(Digital Video Disk:DVD)やビデオCDのようないわゆるパッケージメディアに蓄積するエンコードシステムでは、まず、ビデオ素材の画像の符号化難易度(Difficulty)を測定し、次に、その符号化難易度に基づいてパッケージメディアの記録容量の範囲内の与えられたバイト数に収まるように、各ビデオ情報のフレームごとにビット配分(Bit assign)処理を行う方法が一般に採用されている。以下では、このような2段階のエンコード処理を2パスエンコードという。
【0003】
図20は、ビデオ情報を圧縮符号化してディジタルビデオディスク(DVD)などのオーサリングに用いられるオーサリングシステムの基本的な構成を例示している。
【0004】
このオーサリングシステムは、ビデオエンコーダ22,オーディオエンコーダ21,サブタイトルエンコーダ23,メニューエンコーダ24,エミュレータ26,マルチプレクサ25等の各エンコード作業工程のための装置と、エンコード結果が書き込まれるハードディスクアレイ(RAID)4と、これらの動作を統括管理するスーパーバイザ3とが、ネットワーク2で相互に接続されている。
【0005】
このようなオーサリングシステムは、ビデオやオーディオなどの各パートのエンコード作業が同時並列的に行えるため、作業効率が非常に良い。
【0006】
図21は、図20に例示したオーサリングシステムにおける、従来のビデオエンコードシステムの構成例を示している。
【0007】
スーパーバイザ103は、ビデオエンコードシステムの全体を管理するものであり、ビデオ,オーディオ,メニューなどの各エンコードシステムにエンコード条件を与え、エンコード結果の報告を受ける。この例では、ファイル「v.enc 」によってビデオエンコード条件が指定され、ビデオエンコーダ側からはエンコード結果のビットストリームが書き込まれたRAID104上のアドレス「v.adr 」と、ビットストリームをマルチプレックスする際に必要なデータ「vxxx.aui」が報告される。
【0008】
主コントローラ111は、ネットワーク102を介して接続されるスーパーバイザ103との間の通信により、このビデオエンコードシステム全体の動作を制御する。
【0009】
具体的には、主コントローラ111は、グラフィカルユーザーインターフェース(GUI:Graphical User Interface)部114の管理により、スーパーバイザ103からの制御を受け付けると共に、オペレータの操作を受け付け、このGUI部114により管理されるビットアサイン部115,エンコーダコントロール部116,VTRコントロール部117により、エンコーダ112,ビデオテープレコーダ(VTR)110の動作を制御する。これにより主コントローラ111は、スーパーバイザ103から通知されたエンコード条件に従って処理対象の素材を符号化処理し、その処理結果をスーパーバイザ103に通知する。さらに、主コントローラ111は、GUI部114を介してオペレータの設定を受け付けて、上記の符号化の詳細な条件を変更できるようにされている。
【0010】
上記の主コントローラ111のGUI部114は、ビットアサイン部115のビット配分プログラム「BIT_ASSIGN」,エンコーダコントロール部116のエンコーダコントロールプログラム「CTRL_ENC」およびVTRコントロール部117のVTRコントロールプログラムの3つのプログラムを管理している。
【0011】
また、ビットアサイン部115は、スーパーバイザ103から通知されるエンコード条件のファイル「v.enc 」に従って符号化処理の条件をフレーム単位で決定し、この条件による制御データをファイル形式「CTL file」によりコントロール部116に通知する。
【0012】
このとき、ビットアサイン部115は、符号化処理におけるビット配分(ビットアサイン)を設定し、さらに設定された条件をオペレータの操作に応じて変更する。さらに、ビットアサイン部115は、データ圧縮されたビデオデータD2がRAID104に記録されると、そのビデオデータD2が書き込まれたRAID104上のアドレスのデータ「v.adr 」を、後段における多重化処理に必要なデータ量等の情報「vxxx.aui」と共にスーパーバイザ103に通知する。
【0013】
エンコーダコントロール部116は、ビットアサイン部115から通知される制御ファイル「CTL file」に従ってエンコーダ112の動作を制御する。さらに、エンコーダコントロール部116は、符号化処理に要する符号化難易度「Difficulty」のデータをフレーム単位でビットアサイン部115に通知し、RAID104にビデオデータD2が記録されると、その記録アドレスのデータ「v.adr 」,後の多重化処理に必要なデータ「vxxx.aui 」をビットアサイン部115に通知する。
【0014】
VTRコントロール部117は、スーパーバイザ3から通知される編集リストに従ってビデオテープレコーダ(VTR)110の動作を制御し、所望の編集対象の素材を再生する。
【0015】
ビデオテープレコーダ(VTR)110は、主コントローラ111を介してスーパーバイザ103から通知される編集リストに従って、磁気テープに記録されたビデオデータD1を再生してエンコーダ112に出力する。
【0016】
エンコーダ112は、スーパーバイザ103から主コントローラ111を介して通知される条件に従って動作を切り換え、VTR110から出力されるビデオデータD1を、MPEG(Moving Picture Experts Group)の手法により圧縮符号化する。
【0017】
このとき、エンコーダ112は、符号化処理の結果を主コントローラ111に通知し、主コントローラ111は、そのデータ圧縮における符号化の条件を制御し、発生するビット量を制御する。これにより、主コントローラ111は、データ圧縮により発生するビット量をフレーム単位で把握できる。
【0018】
また、エンコーダ112は、2パスエンコードにおける事前のエンコード条件設定の処理時(仮エンコード時)には、単にビデオデータD1をデータ圧縮して処理結果を主コントローラ111に通知するだけであるが、最終的なデータ圧縮処理時(本エンコード時)には、圧縮処理されたビデオデータD2をRAID104に記録し、さらにそのデータが記録されたアドレス,データ量等を主コントローラ11に通知する。
【0019】
モニタ装置113は、エンコーダ112によりデータ圧縮されたビデオデータD2をモニタできるように構成される。このビデオエンコードシステムでは、モニタ装置113により、オペレータがデータ圧縮処理の結果を必要に応じて確認する、いわゆるプレビューを行うことができる。そして、オペレータが、このプレビュー結果に基づいて主コントローラ111を操作して、符号化の条件を詳細に変更できるようにされている。
【0020】
前述したように、いわゆるDVDなどのパッケージメディアには、ビデオデータの圧縮方式としてMPEG(Moving Picture Experts Group)が採用されている。
【0021】
MPEGは、動き補償予測による時間方向の冗長度を除去することによりデータ圧縮する方式であり、フレーム内だけで符号化されるI(Intra )ピクチャ,過去の画面から現在を予測して符号化されるP(Predictive)ピクチャ,過去の画像と未来の画像とから現在を予測して符号化されるB(Bidirectionally Predictive)ピクチャの3種類の符号化画像が用いられる。
【0022】
また、これらの画像は、Iピクチャを必ず1つ含むまとまりであるGOP(Group of Pictures )とされる。
【0023】
次に、従来の2パスエンコード作業について、図20に例示したビデオエンコードシステムの構成を参照しながら説明する。
【0024】
図22は、図21に例示した従来のビデオエンコードシステムにおける、2パスエンコードの基本的な処理手順を示している。
【0025】
まず、ステップS51で、スーパーバイザ103からネットワーク102を経由して、ビデオ情報に割り当てられるビット総量や最大レートなどのエンコード条件「v.enc 」が与えられ、エンコーダコントロール部116はこのエンコード条件に従って設定される。
【0026】
次に、ステップS52で、エンコーダコントロール部116が、エンコーダ112を使ってエンコード素材の符号化難易度(Difficulty)を測定する。このとき、素材の各画素のDC値や動きベクトル量MEも併せて測定される。そして、これらの測定結果に基づいてファイルが作成される。
【0027】
符号化難易度の実際の測定は、以下のように行われる。
【0028】
エンコード素材となるビデオ情報は、マスターテープであるディジタルビデオカセットからVTR110により再生される。
【0029】
エンコーダコントロール部116は、エンコーダ112を介して、VTR110により再生されたビデオ情報D1の符号化難易度を測定する。ここでは、符号化の際に量子化ステップ数を固定値に設定して発生ビット量が測定される。動きが多く、高い周波数成分が多い画像では発生ビット量が多くなり、静止画や平坦な部分が多い画像では発生ビット量が少なくなる。この発生ビット量の大きさが符号化難易度とされる。
【0030】
次に、ステップS53では、ステップS51で設定されたエンコード条件に従ってステップS52で測定された、各ピクチャの符号化難易度の大きさに応じて、エンコーダコントロール部116が、ビットアサイン部115内のビット配分計算プログラム「BIT_ASSIGN」を実行し、割り当てビット量(ターゲット量)の配分計算を行う。
【0031】
そして、上記のビット配分計算の結果を使って仮エンコードを行い、ステップS54で、エンコーダ112に内蔵されているローカルデコーダ出力の画質によって、本エンコードを実行するかどうかをオペレータに判断させるようにする。実際には、上記のビット配分によるビットストリームをRAID4に出力しないで、オペレータが任意の処理範囲を指定できるモードであるプレビユー(Preview )モードで画質が確認される。
【0032】
そして、ステップS55で、画質評価が行われ、画質に問題がある場合(NG)にはステップS56に進み、問題がある部分のビットレートを上げたりフィルターレベルを調整するといった画質調整のためのカスタマイズ作業が行われた後に、ステップS57でビット配分再計算が実行される。
【0033】
その後、ステップS54に戻り、カスタマイズされた部分がプレビューされ、ステップS55で画質が確認される。ここで、全ての部分の画質が良好であればステップS58に進み、エンコーダ112によって、ステップS57で再計算されたビット配分による素材全体についての最終的なエンコード処理(本エンコード)が実行される。
【0034】
一方、ステップS55で、画質に問題がないと判断された場合には、そのままステップS58に進み、エンコーダ112により、ステップS53で計算されたビット配分による本エンコードが実行される。
【0035】
そして、ステップS59で、エンコード結果であるビットストリームがSCSI(Small Computer System Interface )等を介してRAID104に書き込まれる等の後処理が行われ、2パスエンコード処理が終了する。
【0036】
ステップS58におけるエンコードの実行後、ビデオエンコーダコントロール部116は、上述したようなエンコード結果の情報をネットワーク102経由でスーパーバイザ103に報告する。
【0037】
なお、この図22の各ステップのうち、ステップS52,ステップS54およびステップS58を除く各ステップの処理は、オフラインで行われる。
【0038】
この一連の作業工程において、エンコード素材を1本のビデオテープに記録し切れない場合には、複数のロール(テープ)に亘って記録されることになる。このテープの入れ換え作業のため、連続してエンコードを行うことができない。
【0039】
また、マルチアングルの場合には、その部分のタイムコードはアングルブロック間で同じなので、この場合も連続してエンコードすることができない。このような、エンコード作業を一旦中断しなければならない処理単位をエンコードユニットENCU(Encode unit) と定義する。
次に、上述したような2パスエンコード作業におけるビット配分計算について説明する。
【0040】
まず、エンコード結果が蓄積されるパッケージメディアの記録容量のうちのビデオに割り当てられたビット総量「QTY_BYTES 」と最大ビットレート「MAXRATE 」とが、オーサリングシステムから指定される。これに対して、最大ビットレート以下になるように制限を加えられた総ビット数「USB_BYTES 」を求め、その値から「GOP header」に必要なビット数「TOTAL_HEADER」を引いた値と全体のフレーム総数から、ターゲット数の総和の目標値となる「SUPPLY_BYTES」を算出する。そして、この「SUPPLY_BYTES 」の大きさに収まるように、各ピクチャへの割り当てビット量(以下ターゲット(target)量という。)が配分される。
【0041】
図23は、図22のステップS53における、上記のビット配分計算の処理手順の一具体例を示している。
【0042】
まず、ステップS61で、上述したようにスーパーバイザから送られるビット総量「QTY_BYTES 」と最大ビットレート「MAXRATE 」が入力される。
【0043】
次に、ステップS62で、図22のステップS52で作成された符号化難易度(Difficulty)の測定結果のファイルが読み込まれる。
【0044】
次に、ステップS63で、符号化難易度と共に測定された各画像のDC値や動きベクトル量MEの大きさのパラメータの変化量から、シーンが変化するポイントが検出される。
【0045】
図24は、このようなシーンチェンジ指定されたフレームの処理を示している。
【0046】
符号化難易度(Difficulty)測定の際に併せて測定される、各画像のDC値や動きベクトル量の大きさなどのパラメータの変化量から、シーンが変化するポイントを見つけることが可能である。これにより、図24に示すように、シーンチェンジとして検出されたPピクチャをIピクチャに変更して、画質改善を図ることができる。なお、ここではフレーム数N=15の場合を例示している。
【0047】
次に、ステップS64では、チャプター(CHAPTER )境界処理が行われる。ディスク再生装置でのチャプターサーチ時には、再生されるピクチャが、特定されないピクチャからジャンプしてくる。その場合でも再生画像が乱れないようにするため、このチャプタ境界処理によって、チャプターの位置が必ずGOPの先頭になるようにピクチャタイプが変更されたり、GOP長が制限される。
【0048】
図25は、このようなチャプタ(CHAPTER )指定されたフレームの処理、すなわち、セル(CELL)境界の処理を示している。
【0049】
そして、ステップS65では、上記の一連の作業の結果として変更された、Iピクチャ,Pピクチャ,Bピクチャなどのピクチャタイプに合わせて符号化難易度(Difficulty)の値が補間/補正される。
これは、いわゆるDVDなどの記録媒体では、1GOPのデコード時に、表示される最大のフィールド数が制限されていることから、ピクチャタイプの変更に伴ってGOP構造が変化したことにより1GOPの長さがこの制限を越えることがあるためである。そのような場合には、制限を満たすように、PピクチャをIピクチャに変更してGOP長が短くされるGOP制約処理が行われる。
【0050】
次に、ステップS66では、各エンコードユニット(ENCU)ごとに、ビット量が配分される。
【0051】
次に、ステップS67では、ステップS65における補間/補正処理によって得られた符号化難易度、およびエンコードされる素材全体に与えられたビット数「SUPPLY_BYTES」に応じて、まず各ENCUごとにビットが配分(supply_bytes[encu_nb] )し、それがターゲットビット(Target bit)量の総和の目標値とされる。その後、各ENCUごとに、その目標値に応じて各ピクチャ単位のビット配分が実行される。
【0052】
そして、ステップS68でエンコード結果のビットストリームを書き込む際のRAIDのアドレス(ADDRESS )が計算された上で、ステップS69でエンコーダ用のコントロールファイルが作成されて一連の処理が終了する。
【0053】
上記のような手順により、素材の符号化難易度(Difficulty)および素材全体に与えられたビット数「SUPPLY_BYTES」に応じて、各ピクチャごとのターゲットビット数が計算され、エンコーダ用のコントロールファイルが作成される。
【0054】
以下では、このようなビット配分の手順について、図26に示す、素材がいわゆるアングルブロックを含む場合のビット配分例を参照しながら、さらに詳しく説明する。なお、このマルチアングルについての詳細は後述する。
【0055】
図27は、シームレスアングル部分に対する重み係数が考慮されたビット配分の基本的な手順を示している。
【0056】
まず、ステップS71で、パッケージメディアの記録容量のうちのビデオに割り当てられたビット総量「QTY_BYTES 」がスーパーバイザから取得される。
【0057】
次に、ステップS72では、このビット総量「QTY_BYTES 」に対して、エンコード条件として指定された総ビット数「USB_BYTES 」が求められる。
【0058】
ここで、ビデオ素材のフォーマットがNTSC方式である場合には KT = 1/8(bits)/30(Hz),PAL方式である場合には KT = 1/8(bits)/25(Hz)である。また、「total_frame_number」はエンコードされる素材のフレーム総数,「min(s,t)」はs,tのうちの小さい方を選択する関数である。
【0059】
次に、ステップS73では、この「USB_BYTES 」から「GOP header」に必要なビット数の総和「TOTAL_HEADER 」を引いた値「ΣTOTAL_SUPPLY_BYTES 」が求められる。なお、総和Σは、各記録層についての和を意味している。
【0060】
また、ステップS74では、全体のフレーム総数「total_framenb 」から、シームレスアングル部分の「ALL_ANGLE_BYTES 」が計算される。ここで、最初にシームレスアングルブロックにビット配分するのは、シームレスアングルブロックには他の部分よりも厳しい制約があり、より多くのビット量が必要なことと、対応するシームレスアングルブロックに同一量のビットが割り当てられることが必要なためである。
【0061】
各エンコードユニット(ENCU)のフレーム数を「ENCU_frame[encu_nb] 」とすると、
このとき、対応するシームレスアングルブロックのフレーム数は互いに同じであるため、各々の「supply_bytes」も必ず同じになる。
【0062】
次に、ステップS75では、「USB_BYTES 」から「ALL_ANGLE_BYTES 」を引いた値に対し、アングルブロックではない部分の各ENCUの「supply_bytes」、すなわち「ALL_SUPPLY_BYTES」が算出される。このとき、単純にフレーム数の比率でビット分配すると、ENCU間での画像の難しさにばらつきがある場合に最適なビット割当ができないため、各ENCUでの符号難易度の総和「ENCU_diff[encu_nb]」を求めておき、ステップS76ではその比率でビット量が分配される。
【0063】
その際、ユーザーが、ENCU間のビット配分を、素材の段階で意識的に操作したい場合がある。例えば、映画素材の前にコマーシャルなどをいれる場合に、その部分だけはビットレートを意識的に上げたい場合などが考えられる。このような要求は、各ENCUの符号化難易度の総和に対して、重み係数「e_weight」を設定することで実現される。
【0064】
この重み係数は、例えば、以下の表1に示されるようなファイルで設定され、ビット計算の実行時にロードされる。
【0065】
【表1】
以下では、ビット配分計算の例として、まずGOP単位にビット量を配分し、その後に各GOP内で各ピクチャの難しさ「GOP_DIFFICULTY」に応じたビット配分を行うものとして説明する。各GOPごとのDifficultyの和である「GOP_diff」に応じて、エンコードする際のGOP単位のビット割り当て量「GOP_target」が配分される。
【0066】
図28は、GOPごとの符号化難易度の和「gop_diff」とエンコード時のGOP単位のビット割当て量「gop_target」とを変換するための、最も簡単な関数の例を示している。
【0067】
この例では、「GOP_target」をY , 「GOP_diff」 をX とし、
DIFFICULTY_SUM = ENCU_diff[encu_nb]
として、
Y = AX + B
という形で表される評価関数が用いられる。また、全てのピクチャの「Difficulty」の総和「ENCU_diff[encu_nb]」が用られる。
B = GOP_MINBYTES ---- [7]
Σy = A×Σx + B×n
ここで、Σy = supply_bytes[encu_nb],Σx = ENCU_diff[encu_nb],nはGOPの総数である。よって、
A = (supply_bytes[encu_nb] - B×n)/ ENCU_diff[encu_nb]
となる。
【0068】
GOP_target = A × GOP_diff + B ---- [8]
その後、各GOP内で各ピクチャの符号化難易度「gen_bit[k]」に応じたビット配分を行う。この「gen_bit[k]」は、仮エンコードによって測定されたk番目のフレームの符号化難易度の値であり、大きいほど画像が難しいことを表す。GOP内での各ピクチャの配分は Difficulty の大きさに比例させた場合には、各ピクチャのターゲット量は以下の式で求められる。
【0069】
target(k) = GOP_TARGET × gen_bit[k]/GOP_diff ---- [9]
(1 ≦ k ≦ GOP 内の picture 数)
この場合、素材の中に極端に難しい(すなわち、「GOP_diff」が大きい)ピクチャがあると、非常に大きい「gop_target」量になってしまい、システムにおいて許容されている最大レートを越えてしまうため、「GOP_MAXBYTES」といった固定量でリミッタをかけることが必要である。また、最小のターゲット量も「GOP_MINBYTES」により同様に制限される。
【0070】
MPEGによるビデオのエンコード時には、仮想デコーダのバッファ残量を考慮しながらビット配分することが義務付けられている。この仮想バッファ残量の計算をVBV(Video buffering verifier) という。
【0071】
以下に、この仮想バッファ残量の計算方法について説明する。
【0072】
図29は、VBV計算方法を示している。
【0073】
記録媒体がいわゆるDVDの場合、バッファサイズ「VBV MAX 」(1.75Mbits )に対して、k番目のピクチャのバッファのスタート点を「Occupancy_up(k) 」,k番目のピクチャのターゲット量を「target(k) 」とすると、ピクチャにビットを供給した後のバッファ残量「Occupancy_down(k) 」は[7] 式で表される。
【0074】
このバッファには、デコーダのピックアップからビデオのデータ量に応じたビットレートのデータ量「SYSTEM_SUPPLY 」が蓄積される。この供給後のバッファ残量「Occupancy_up(k+1) 」は [8] 式で表される。
【0075】
この供給量は、図中の右上にあがる量に相当する。供給されるビットレートが大きいほど傾きは大きくなり、バッファにデータがたまりやすくなる。バッファがいっぱいになった場合には、ピックアップからバッファへの供給がストップするため、バッファのオーバーフローに関しては考慮する必要はない。このことは、ある設定値ちょうどに制御する必要はなく、設定値以上になるように制御すれば良いことを意味している。
【0076】
逆に、各ピクチャのデータ量が大きいと、バッファにたまったデータは減少する。このバッファ残量が一定値以下にならないようにターゲットビット量を計算する。この計算の最初の「Occupancy_up(0) 」は固定値(この例ではVBV MAX×2/3 )からスタートする。
【0077】
以下の「Occupancy_up 」はグラフ上の各ピクチャの上側のポイント、「Occupancy_down 」はグラフ上の各ピクチャの下側のポイントを意味している。
【0078】
Occupancy_up(0) = VBV MAX × 2/3 ---- [10]
Occupancy_down(k) = Ouucpancy_up(k) - target(k) ---- [11]
Occupancy_up(k+1) = Ouucpancy_down(k) + SYSTEM_SUPPLY ---- [12]
SYSTEM_SUPPLY = MAXRATE(bps)×KT ---- [13]
次に、以上説明したような、GOP単位でのターゲットビット配分計算を行った例を示す。
【0079】
図30は、評価関数と「GOP_MAXRATE 」制限を考慮して求めたターゲット量に対して、VBVバッファ計算を行った場合のターゲットビット配分例を示している。
【0080】
図30中の1番目,4番目,7番目のピクチャは、VBVバッファの下限である「VBV MIN 」の値を下回っている。そこで、VBVが「VBV MIN 」を下回ったピクチャを含むGOPのターゲット量を削減させる。
【0081】
GOP内でVBV制限を加える前のターゲット量でVBV計算を実行したときの「Occupancy 」の最小値を「Occ_min 」とすると、調整量は以下の式で表される。ここで、制限を行うスタート点「kstart」は、「Occupancy_up(k) 」が基準値「VBVLINE 」とされる。この「VBVLINE 」は、例えば、 VBV MAX×(3/4) 以上のkの値で、このときの「Occupancy_up(k) 」の値を「Occ_start 」とする。
【0082】
Occupancy_min < VBV MIN の時
r = (Occ_start - VBV MIN)/(VBVSTART - Occ_min) ---- [14]
各ターゲットに対して
target(j) = target(j) × r (kstart ≦ j ≦ k)
とする。
【0083】
図31は、上記のようなVBV制限処理を行った後のターゲットビット配分例を示している。
【0084】
VBV制限処理前には、VBVバッファの下限である「VBV MIN 」の値を下回っていた1番目,4番目,7番目のピクチャも、この下限値を下回らないように調整されている。
【0085】
このようにして求められたターゲット量を用いて作成されたコントロールファイルによりエンコード処理を行うことで、素材の画像の難しさに応じて、簡単な画像には少ないビット量が割り当てられ、難しい画像により多くのビット量が割り当られるようになるため、演奏時間の中で画質のばらつきが少ない可変レートエンコーディングが実現される。
【0086】
【発明が解決しようとする課題】
ところで、DVD(デジタルビデオディスク)は、片面に2層の記録層を有するディスク、および両面に計4層の記録層を有するディスクのフォーマットが規定されている。
【0087】
各記録層に記録されるビデオデータに対して、どの程度のバイト数を割り当てるかは、ディスク全体の構成に関わるため、スーパーバイザ側からエンコード条件として指定される。スーパーバイザ側でエンコード条件を決める際には、各記録層に記録される予定の素材の画像の難しさの違いは分からないため、例えば、単純に各記録層に記録されるフレーム数の比率を用いてバイト数を分配するしかない。
【0088】
しかし、実際のエンコードでは、各記録層に記録される素材の画像にはばらつきがあるため、このようにバイト数が一律に配分された場合には、記録層の間に画質の差が生じることになる。
【0089】
例えば、第1層の演奏時間と第2層の演奏時間とが同じである場合には、同じ量のバイト数がエンコード条件として指定される。ところが、第1層には簡単な静止画像が多く含まれ、第2層には情報量の多い画像が多く含まれる場合には、第1層の画質と第2層の画質との間に大きな差が生じることとなり、ディスク再生装置で記録層間を切替えて再生させた場合に違和感を生じさせるという問題がある。
【0090】
図32は、2層の記録層を有するいわゆるDVDなどの記録媒体に対して、従来方式によりビット配分された例を示している。
【0091】
エンコードユニットENCU1とENCU3とは、符号化難易度の和およびフレーム数が全く同じであり、同じエンコード条件であるにも関わらず、各記録層「Layer 1」と「layer 2」との間でのビット配分が変わってしまっている。この条件でエンコードを実行すると、ENCU1とENCU3との間には明らかな画質の差が生じてしまう。
【0092】
図33は、図32に示す例における各エンコードユニット(ENCU)に対するビット配分結果をまとめて示している。
【0093】
このような従来方式における記録層の間の画質の差は、エンコード後の画質評価によって始めて確認できるため、画質が望ましくないと判断された場合には、その時点でエンコード条件が変更されることになる。しかし、エンコード条件をどの程度調整してよいかは分からないため、カットアンドトライによる作業となり、効率が非常に悪いという問題がある。
【0094】
次に、エンコード素材が、いわゆるアングルブロックを含む場合について説明する。
【0095】
DVD(ディジタルビデオディスク)におけるアングル再生とは、図34に示すように、デコーダ(再生装置)側で、ユーザーが、同一の被写体の同じ時間における画像を、複数の角度から再生できるようにするものであり、切替時に再生画像が一旦中断する(黒などが挿入される)ことを許すノンシームレスアングルと、切替時に乱れることなく(シームレスに)つながるシームレスアングルとがある。ここでは、3つの角度からの画像である「Angle 1」,「Angle 2」,「Angle 3」 が切替られる場合を例示している。
【0096】
図35は、アングルブロックを含むデータの一例を示している。
【0097】
この図中で、各エンコードユニットENCU2,ENCU4,ENCU5は、アングルの組合せを意味している。シームレスアングルの場合には、アングルの組合せであるENCU2,ENCU4,ENCU5において、ピクチャ数とGOP構造とが同じであるようにされる。
【0098】
再生時にアングルを切替えると、再生装置の再生ピックアップが所定のアングルのデータの位置に移動し、データの読み出しを開始する。再生時のアングル切替えにかかるディレイを少なくするためには、この移動距離が小さいことが必要であるため、アングルブロックのデータは、ディスク上での配置がインターリーブ処理されている。インターリーブされる単位はM個のGOP単位で、Mの値はエンコード条件によって異なる。
【0099】
図36は、このインターリーブ処理の一例を示している。
【0100】
このように、データをユニットごとにインターリーブする作業は、個々のアングルごとのインターリーブされるデータ量が異なる場合には、非常に複雑になり、アングル数が多いと処理時間も指数関数的に増加するため問題となる。
【0101】
そこで、図36(a)に示すように、インターリーブされる単位内の各アングルのデータ量が、エンコード後の出力データの段階で同じになるようにビットを割り当てれば、図36(b)に示すようなダミーデータの挿入(スタッフィング)は不要となり、アングル部分でのビデオレートを上げることができる。よって、図36(c)に示すように、アングル部分のビット配分時に対応する各GOPに同じターゲット量を割り当てる。つまり、同一のシームレスアングルブロックには同じビット量を割り当てることが望ましい。
【0102】
図37は、上記のようなシームレスアングルブロックの処理例を示している。
【0103】
再生装置側でシームレスに再生するには、VBVバッファ残量の境界での最後のピクチャのVBVのバッファ残量の値と、次のスタート点のピクチャのVBVのバッファ残量の値が、一定値以上に(例えば、VBV MAX * 2/3) なるように制御すればよい。
【0104】
図38(a)は、VBVバッファ残量の制限を加えたエンコードを行った例を示している。また、図38(b)は、このエンコード結果をデコーダ(再生装置)で再生したときのバッファ残量を示している。
【0105】
このように、デコーダでのバッファ残量は、エンコード時のVBV計算値よりも必ず大きくなる。デコーダでは、バッファがいっぱいになった場合には、ピックアップからバッファへの供給がストップするため、バッファのオーバーフローに関しては考慮する必要はない。したがって、エンコード時にこのような条件で制限を加えれば、切替時にバッファが破綻することがないため、シームレスな切替えが補償される。
【0106】
また、シームレスアングルでは、GOP単位で相互に切替えられることを想定しているため、図39に示すように、全てのGOPの最初と最後のVBVの値は、一定値以上になるように制御されることになる。
【0107】
このように、シームレスアングルブロックは、通常のブロックに対して制約が多いため、同じビットレートを割り当てても同等の画質を得ることが困難である。そこで、シームレスアングルブロックへのビット配分を優先して行なうことが望ましい。
【0108】
ところが、いわゆるDVDなどの記録媒体の複数の記録層に記録される、シームレスアングルブロックを含むビデオデータに対して、各記録層ごとに閉じたビット配分が実行されると、記録層によってはシームレスアングルブロックに十分なレートが割り当てられない場合がでてくる。エンコード後に十分な画質が得られなかった場合には、条件を変更して、エンコード作業を最初からやり直さなければならなくなる。
【0109】
DVDのようなパッケージメディアのディスク作成のためのエンコード作業は、オーディオ、ビデオ、サブタイトル、メニューなどの各パートの作業が並列して行われるため、ビデオのエンコード条件に修正が必要になった場合には、例えばオーディオのエンコードなどのビデオ以外の工程にも影響が及ぶため、ビデオ以外の工程も最初からやり直さなければならなくなる。このように、ビット配分の適否の判定が遅れるほど、エンコード作業のやり直しに伴う多くの無駄な工数がかかってしまう。
【0110】
本発明は、このような問題を解決するために行われたものであり、複数の記録領域に記録される圧縮ビデオデータに対してビットの配分を行う際に、与えられたエンコード条件下で、各記録領域の間の画質に大きな差が無いようにビット配分できるかどうかを評価し、画質が定められた条件を満たさない場合には、そのばらつき量を最適もしくは許容できるようにするエンコード条件の変更内容をオペレーターに提示できる機能を有する2パスのエンコード方法および装置を提供することを目的とする。
【0111】
【課題を解決するための手段】
上記の課題を解決するために提案する本発明のエンコード方法は、ビデオ素材を圧縮符号化して複数の記録領域に記録するエンコード方法において、本エンコードに先立つプリエンコード工程と、与えられたエンコード条件下で、各記録領域の間の画質の差を許容できるビット配分の可否を評価する評価工程と、上記各記録領域の間の画質の差が許容できるビット配分の適正範囲を提示する提示工程とを有し、上記与えられたエンコード条件または上記提示された適正範囲のビット配分により本エンコードを行うことを特徴とするものである。
【0112】
また、上記の課題を解決するために提案する本発明の別のエンコード方法は、複数の記録領域にシームレスアングルブロックを含むエンコードを行うエンコード方法において、各記録領域ごとに与えられる上限が考慮されたバイト数の総和および総フレーム数からエンコードされた素材の平均レートを求める工程と、
重み係数を考慮したフレーム数の比率に従って、上記各記録領域に記録されるべきシームレスアングルブロックに割り当てられるバイト数を、上記各記録領域から確保する工程と、上記シームレスアングルブロックに割り当てられるバイト数が差し引かれた残りのバイト数を、上記シームレスアングルブロック以外のブロックに重み係数を考慮した符号化難易度の和の比率で配分する工程とを有することを特徴とするものである。
【0113】
また、上記の課題を解決するために提案する本発明のエンコード装置は、ビデオ素材を圧縮符号化して複数の記録領域に記録するエンコード装置において、本エンコードに先立ってプリエンコードを行う手段と、各記録領域の間の画質の差を許容できるビット配分の可否を評価する評価手段と、上記各記録領域の間の画質の差が許容できるビット配分の適正範囲を提示する提示手段とを備え、上記与えられたエンコード条件または上記提示された適正範囲のビット配分により本エンコードを行うことを特徴とするものである。
【0114】
また、上記の課題を解決するために提案する本発明の別のエンコード装置は、複数の記録領域にシームレスアングルブロックを含むエンコードを行うエンコード装置において、各記録領域ごとに与えられる上限が考慮されたバイト数の総和および総フレーム数からエンコードされた素材の平均レートを求める手段と、
重み係数を考慮したフレーム数の比率に従って、上記各記録領域に記録されるべきシームレスアングルブロックに割り当てられるバイト数を、上記各記録領域から確保する手段と、上記シームレスアングルブロックに割り当てられるバイト数が差し引かれた残りのバイト数を、上記シームレスアングルブロック以外のブロックに重み係数を考慮した符号化難易度の和の比率で配分する手段とを備えることを特徴とするものである。
【0115】
上記の本発明によれば、複数の記録領域に記録される圧縮ビデオデータに対してビットの配分を行う場合に、各記録領域の間に画質の差が生じにくく、早い時点でエンコード条件の見直しや変更を行うことができるエンコード方法およびエンコード装置を提供できる。
【0116】
【発明の実施の形態】
以下に、本発明の好ましい実施の形態について図面を参照しながら説明する。
【0117】
なお、本発明の具体的な説明に先だって、以下の説明に用いる用語について説明する。
【0118】
encu_max :ENCU の個数
layer_max :記録層の個数
angle_num_max :アングルブロックに含まれるアングル数
angle_block_max :アングルブロック数
gen_bit[k] :仮エンコードによって測定されたk番目のフレームの符号化難易度(Difficulty)の値。大きいほど画像が難しいことを示す。
ENCU_mode[encu_nb]:対象となるENCUがシームレスアングルであるかどうかを示す情報。シームレスアングルのとき「1」,それ以外のとき「0」。
ENCU_angle[encu_nb] :対象となるENCUがどのアングルブロックに属するかどうかを示す情報。シームレスアングル以外のときは「0」となる。
ENCU_weight[encu_nb]:対象となるシームレスアングルブロックのビット配分時の重み係数
ANGLE_weight[angle_blk] :対象となるシームレスアングルブロックのビット配分時の重み係数。同一のアングルブロックでのビット配分時の重みは同じ値にするため、該当するアングルブロックの「ENCU_weight 」の平均値とする。(最大値、最小値でも良いが、この例では平均値とする。)
ENCU_diff [encu_nb]: 対象となるENCUの符号難易度
(gen_bit[k])× ENCU_weight[encu_nb] の総和
ENCU_frame[encu_nb]: 対象となるENCUのフレーム数の総和
ENCU_layer[encu_nb]: 対象となるENCUがどの記録層に属するかを示す情報。 0 ≦ ENCU_layer[encu_nb] ≦ layer_max
QTY_BYTES[layer_nb]: 対象となる記録層のスーパーバイザから指定された利用可能なバイト数
USB_BYTES[layer_nb]: 対象となる記録層での上限値を考慮した利用可能なバイト数
QTY_change[layer_nb]:対象となる記録層で「QTY_BYTES 」が上限値を越えていたかどうかの情報。変更された場合「1」,変更されていない場合「0」。
【0119】
TOTAL_HEADER[layer_nb]:対象となる記録層のGOPヘッダーの総バイト数
TOTAL_FRAME [layer_nb]:対象となる記録層の総フレーム数
SUM_DIFF[layer_nb] :対象となる記録層のシームレスアングル以外の 重み係数を掛けた符号化難易度の総和
(ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[encu_nb] == 0 ) を満たす encu_nb に対して
SUM_DIFF[layer_nb] = ΣENCU_diff[encu_nb] ---- [16]
ここで、「=」は代入を意味しているのに対し、「==」はC言語等で用いられるのと同様に等しいかどうかの条件判定を意味するものである。
【0120】
ANGLE_WFRAME[layer_nb]:対象となる記録層の重み係数の反映されたシームレスアングルだけの総フレーム量
(ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[encu_nb] > 0 ) を満たす「encu_nb」に対して
SUM_WFRAME:シームレスアングルの重み係数の反映された総フレーム量
SUM_WFRAME = ΣENCU_frame[encu_nb] (ただし、ENCU_mode[encu_nb] == 0 を満たす encu_nb) + ΣANGLE_WFRAME[layer_nb] ---- [18]
CHECK_USB_ [layer_nb]:対象となる記録層での利用可能なバイト数の適正値
CHECK_SUPPLY[layer_nb]:対象となる記録層でのシームレスアングル以外の利用可能なバイト数の適正値
CHECK_DIFF [layer_nb]:対象となる記録層のシームレスアングル以外の Difficulty の総和の適正値
CHECK_FRAME [layer_nb]:対象となる記録層でのシームレスアングル以外の総フレーム数の適正値
supply_bytes[encu_nb] :対象となる ENCU に配分されたバイト数
まず、本発明の実施の形態に係るエンコード方法における、各エンコードユニット(ENCU)へのビット配分方法について、複数の記録領域を有する記録媒体であるDVDなどの記録媒体の複数の記録層に記録される圧縮ビデオデータに対してビット配分を行う場合を例として説明する。
【0121】
本発明の実施の形態に係るエンコードは、従来の方式を拡張して「QTY_BYTES 」を各記録層に分けて管理する。
【0122】
各記録層の最大バイト数を
前述したように、シームレスアングルブロックでは、対応するブロック間のビット配分量が、ほぼ同じにされなければならないため、「layer_nb」で示される記録層の各エンコードユニットENCUへのビット配分は、シームレスアングルである場合と、それ以外である場合とで分けて行われる。
【0123】
すなわち、従来方式では各記録層ごとにシームレスアングルのフレームの比率でビット配分が行われていたが、本発明の実施の形態に係る方式では全ての記録層の「TOTAL_SUPPLY_BYTES」に対して、フレーム数に重み係数を考慮した比率でビット配分が行われる。
【0124】
このようにすることで、全ての記録層においてシームレスアングルブロックのレートを同じにできる。また、オペレータがレートを意識的にコントロールしたければ、重み係数を変えることにより実現できる。
【0125】
(1)シームレスアングルブロックのENCUへのビット配分
(ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle[encu_nb] == 1)
を満たす「encu_nb 」に対して、
(2)シームレスアングルブロック以外のENCUへのビット配分
(ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle[encu_nb] == 0)
を満たす「encu_nb 」に対して、
次に、本発明の具体的な実施例を示す。なお以下では、
Gr_min_limit = 0.9
Gr_max_limit = 1.1
とし、説明の簡略化のために
ENCU_weight[encu_nb] = 1.0
とする。
【0126】
図1は、いわゆるDVDなどの記録媒体の2つの記録層「Layer 0 」および「Layer 1 」に記録される、それぞれシームレスアングルブロックを含む圧縮ビデオデータに対して、フレーム数の比率に応じてビット配分される例を示している。
【0127】
ここで、「Layer 0 」のENCU(エンコードユニット)2,ENCU4,ENCU5、および「Layer 1 」のENCU7,ENCU9,ENCU10は、シームレスアングルからなるアングルブロック1およびアングルブロック2である。
【0128】
図2は、図1に例示した2つの記録層からなる記録媒体に記録される圧縮ビデオデータに対する、ビット配分の一具体例を示している。
【0129】
すなわち、エンコード素材から、オーディオデータやサブタイトルデータなどのデータ量を記録媒体の記録容量から差し引いたデータ量である「QTY_BYTES[0]」および「QTY_BYTES[1]」が、スーパーバイザから与えられる。
【0130】
この「QTY_BYTES[0]」および「QTY_BYTES[1]」は、DVDのフォーマットで規定されている最大レート制限やVBV制限などの条件を満たさない場合がある。そこで、「QTY_BYTES[0]」および「QTY_BYTES[1]」は、これらの制限を満足するようにレート制限されて「USB_BYTES[0]」および「USB_BYTES[1]」とされる。
【0131】
そして、「USB_BYTES[0]」および「USB_BYTES[1]」のヘッダ領域「TOTAL_HEADER[0] 」および「TOTAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」とされる。
【0132】
ここで、上記の「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」jは、各記録層のアングル部分に対してはフレーム数の比率で配分され、アングル以外の部分には符号化難易度(Difficulty)の和の比率で配分される。
【0133】
つまり、「Layer 0 」のENCU2,ENCU4,ENCU5、および「Layer 1 」のENCU7,ENCU9,ENCU10に対しては、「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」がフレーム数の比率で配分され、「Layer 0 」のENCU1,ENCU3、および「Layer 1 」のENCU6,ENCU8に対しては、「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」を符号化難易度(Difficulty)の和の比率で配分される。このように配分されたビットが、「SUPPLY_BYTES」とされる。
【0134】
図3および図4は、比較のために従来方式によるビット配分例を示している。以下では、この従来方式を参照しながら、本発明によるビット配分方式についてさらに説明する。
【0135】
図3は、従来方式により、DVDなどの記録媒体の2つの記録層「Layer 0 」および「Layer 1 」に記録される、それぞれシームレスアングルを含む対して、フレーム数の比率に応じてビット配分される様子を示している。
【0136】
ここで、図3(a)中の「Layer 0 」のENCU2,ENCU4、および「Layer 1 」のENCU6,ENCU8は、シームレスアングルからなるアングルブロック1およびアングルブロック2とされる。
【0137】
図3(b)に示すように、これらの各記録層ごとに、ヘッダ領域「TOTAL_HEADER[0] 」および「TOTAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」とされる。
【0138】
ここで、上記の「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」は、各記録層のアングル部分に対してはフレーム数の比率で配分され、アングル以外の部分に対しては符号化難易度(Difficulty)の和の比率で配分される。
なお、ここでは説明の簡略化のため、TOTAL_HEADER = 0 としている。
【0139】
図4は、図3の例における各エンコードユニット(ENCU)に対するビット配分結果をまとめて示している。
【0140】
この例では、アングルブロック1のレートに対して、アングルブロック2のレートが不十分であることが分かる。このように、従来方式によるビット配分では、シームレスアングルブロックにおいて、エンコード制約が厳しいため、レートが低いと満足できる画質が得られないことが非常に多い。
【0141】
次に、上記のような問題点を解決するために提案された、本発明の実施の形態に係るビット配分方式について説明する。
図5は、本発明の実施の形態に係る方式により、DVDの2つの記録層「Layer 0 」および「Layer 1 」に記録される、それぞれシームレスアングルを含む圧縮ビデオデータに対して、フレーム数の比率に応じてビット配分される様子を示している。
【0142】
図5(a)中の、「Layer 0 」のENCU2,ENCU4、および「Layer 1 」のENCU6,ENCU8は、図3(a)と同様のシームレスアングルからなるアングルブロック1およびアングルブロック2とされる。
【0143】
そして、図5(b)に示すように、これらの各記録層から、ヘッダ領域「TOTAL_HEADER[0] 」および「TOTAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」とされる。
【0144】
ここで、本発明の実施の形態に係るビット配分方式においては、上記の「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」が、最初に、各記録層のアングル部分に対して全体のレートからフレーム数の比率で配分され、次に、アングル以外の部分に対しては符号化難易度(Difficulty)の和の比率で配分される。
なお、ここでも説明の簡略化のため、TOTAL_HEADER = 0 としている。
【0145】
図6は、図5の例における、各エンコードユニット(ENCU)に対するビット配分結果をまとめて示している。
【0146】
このように、本発明の実施の形態に係るビット配分によれば、例えばDVDの2つの記録層のどちらのアングルブロックのレートも同じにすることが可能となっている。
【0147】
ところが、上記のような方法により複数の記録層にビット配分すると、シームレスアングルでない部分に、符号化難易度に応じて配分されるビット量にばらつきが生じることがある。図5,図6に示したビット配分の例でも、調整前の段階では、ENCU3のレートとENCU7のレートとが大きく異なっている。
【0148】
このような現象は、スーパーバイザから与えられた「QTY_BYTES 」が適切でなかったために生じるが、スーパーバイザがエンコード条件を決める際には、素材の画像の難しさ(符号化難易度)の情報がまだ得られていないため、最適なエンコード条件を発行できない。
【0149】
そこで、このような状況においては、ビデオエンコードシステム側で、各記録層間のビット配分のばらつき量を計算し、所定の規定値を越えている場合には、警告を発し、エンコード条件の再発行を促すことが必要となる。
【0150】
図7は、上述した本発明の実施の形態に係るビット配分計算の基本的な手順を示している。
【0151】
まず、ステップS1でエンコード条件が入力され、ステップS2で符号化難易度(Difficulty)パラメータが入力さる。
【0152】
次に、ステップS3で、符号化難易度と共に測定された各画像のDC値や動きベクトル量MEの大きさのパラメータの変化量から、シーンが変化するポイントが検出され、画質改善のためのピクチャタイプの変更処理などが行われる。
【0153】
次に、ステップS4では、チャプター(CHAPTER )境界処理が行われる。再生装置でのチャプターサーチ時には、再生されるピクチャが、特定されないピクチャからジャンプしてくることになる。その場合でも再生画像が乱れないようにするため、ステップS5では、このチャプタ境界処理によってチャプターの位置が必ずGOPの先頭になるようにピクチャタイプが変更されたり、GOP長が制限される。
【0154】
次に、ステップS6では、上記の一連の作業の結果として変更された、Iピクチャ,Pピクチャ,Bピクチャなどのピクチャタイプに合わせて、符号化難易度(Difficulty)の値が補間/補正される。
【0155】
次に、ステップS7では、ステップS6における補間/補正処理によって得られた符号化難易度、およびエンコードされる素材全体に与えられたビット数「SUPPLY_BYTES」に応じて、各エンコードユニットENCUごとにビット配分が行われる。
【0156】
次に、ステップS8では、各記録層の間のビット配分量のばらつきが検出される。
【0157】
そして、ステップS9で、ステップS8で検出された記録層間のビット配分のばらつき量が許容できるかどうかが評価され、許容できない(No)場合にはステップS10でワーニング(警告)が表示され、ステップS11でエンコードを続けるかどうかがオペレータにより判断される。そして、ステップS11で、当初のエンコード条件で処理を続けるとされた場合にはステップS12に進む。一方、ステップS9で、ステップS8で評価された記録層間のばらつき量が許容できる(Yes)場合にはそのままステップS12に進む。
【0158】
なお、ステップS11でエンコードを続けないとされた場合には、ステップS15で、ビット配分量などの条件の適正値がオペレータに提示されて、処理が終了される。この場合には、ステップS1で入力されるエンコード条件等が見直されて、エンコード条件の適否が評価される。
【0159】
ステップS12では、ステップS6における補間/補正処理によって得られた符号化難易度、およびエンコードされる素材全体に与えられたビット数「SUPPLY_BYTES」に応じて、各ピクチャごとのターゲットビット(Target bit)数が計算される。
【0160】
次に、ステップS13では、エンコード結果が記録される記録媒体のアドレス(ADDRESS )が計算される。
【0161】
そして、ステップS14で、エンコーダ用コントロールファイルが作成されて、ビット配分計算処理が終了する。そして、このコントロールファイルにより最終的なエンコードである本エンコードが実行される。
【0162】
次に、上述した各記録層の間でのビット配分のばらつき量を計算するためのアルゴリズムについて説明する。
【0163】
いわゆるDVDなどの記録媒体の各記録層に配分されるビット量のばらつき量は、全体のシームレスアングルブロック以外のビット配分量と符号化難易度(Difficulty)の総和の比「Gr_avr 」に対して、各記録層の値が規定値以内であるかどうかにより評価される。
【0164】
上記の規定値に入らない場合には、各記録層に記録されるフレーム数はそのままにした場合に配分されるバイト数(「QTY_BYTES 」から「USB_BYTES 」に置き換えられている)の適正範囲が計算される。
【0165】
また、これとは別に、DVDなどの記録媒体の各記録層へのビット配分量を同じにした場合に、各記録層に記録されるフレーム数の適正範囲が計算される。このことは、素材が記録される境界をずらすことを意味している。
【0166】
以下では、以上説明した本発明の実施の形態に係るエンコード方法におけるビット配分計算について、さらに具体的に説明する。
【0167】
以下の説明では、複数層の場合でのフレーム数もしくはバイト数の適正値の計算は、最初の記録層から順次実行される。
【0168】
[STEP 1] 「Gr_avr」の計算
【0169】
[STEP 2] フレーム数固定条件での「USB_BYTES」調整範囲の提示ループ初期化
CHECK_USB_[layer_nb] = USER_BYTES[layer_nb] ---- [27]
CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb] ---- [28]
CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] ---- [29]
ただし、0 ≦ layer_nb ≦ layer_max)
layer_nb = 0
とする。
【0170】
[STEP 3] 「Gr_check」の計算
gr[layer_nb] = CHECK_SUPPLY[layer_nb]/SUM_DIFF[layer_nb] ---- [30]
GR[layer_nb] = gr[layer_nb]/Gr_avr ---- [31]
(1)Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit の場合
この記録層の画質の全体に対するばらつきは許容範囲である。
【0171】
Gcheck [layer_nb] = 0
(2)GR[layer_nb] < Gr_min_limit の場合
CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に対して不足している。
【0172】
Gcheck [layer_nb] = 1
(3)Gr_max_limit < GR[layer_nb] の場合
CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に対して余裕がある。
【0173】
Gcheck [layer_nb] = 2 ---- [32]
【0174】
[STEP 4] 調整範囲の提示
「USB_BYTES 」調整後に、「USB_BYTES 」の最大バイト数制限を越えないようにされなければならない。また、すでに最大バイト数制限を受けている記録層については「USB_BYTES 」の増加は許されない。
【0175】
QTY_change[layer_nb] == 0
かつ QTY_change[layer_nb+1] == 0
かつ Gcheck[layer_nb] == 1 or 2
または
QTY_change[layer_nb] == 1
かつ QTY_change[layer_nb+1] == 0
かつ Gcheck[layer_nb] == 2
または
QTY_change[layer_nb] == 0
かつ QTY_change[layer_nb+1] == 1
かつ Gcheck[layer_nb] == 1 ---- [33]
の条件を満たす「layer_nb」の記録層の「USB_BYTES 」の調整量を提示する。
【0176】
MAXBYTES = MAXRATE×KT×total_framenb[layer_nb] ---- [34]
Gr_min_limit×Gr_avr×CHECK_DIFF[layer_nb]≦ CHECK_SUPPLY[layer_nb]
かつ
仮に、
CHECK_SUPPLY[layer_nb] = Gr_avr×CHECK_DIFF[layer_nb]
としたとすれば、次の「layer_nb」の「CHECK_SUPPLY」は、以下のように修正される。
【0177】
【0178】
[STEP 5]
layer_nb = layer_nb + 1
とし、「layer_nb」が「layer_max 」と同じ値でなければ[STEP 3]に戻る。
【0179】
[STEP 6]「USB_BYTES」数固定条件での記録層へのフレーム数調整範囲の提示ループ初期化
CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb]
CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb]
CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb]
CHECK_FRAME [layer_nb] = total_frame[layer_nb]
ただし、0 ≦ layer_nb ≦ layer_max
layer_nb = 0
とする。
【0180】
[STEP 7] 「Gr_check」の計算
gr[layer_nb] = CHECK_SUPPLY[layer_nb]/CHECK_DIFF[layer_nb]
GR[layer_nb] = gr[layer_nb]/Gr_avr
(1)Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit の場合
Gcheck [layer_nb] = 0
(2)GR[layer_nb] < Gr_min_limit の場合
Gcheck [layer_nb] = 1
(3)Gr_max_limit < GR[layer_nb] の場合
Gcheck [layer_nb] = 2
【0181】
[STEP 8] 調整範囲の提示
フレーム数調整後に、「USB_BYTES 」の最大バイト数制限を越えないようにされなければならない。また、すでに最大バイト数制限を受けている記録層については、フレーム数の削減は許されない。
【0182】
QTY_change[layer_nb] == 0
かつ QTY_change[layer_nb+1] == 0
かつ Gcheck[layer_nb] == 1 or 2
または
QTY_change[layer_nb] == 1
かつ QTY_change[layer_nb+1] == 0
かつ Gcheck[layer_nb] == 2
または
QTY_change[layer_nb] == 0
かつ QTY_change[layer_nb+1] == 1
かつ Gcheck[layer_nb] == 1
の条件を満たす「layer_nb」の記録層のフレーム数の調整量が提示される。
【0183】
を満たすフレーム数の境界が検出される。
【0184】
具体的には、
MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_limit/Gr_avr
MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_limit/Gr_avr
MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/ KT
また、layer_nb == layer_max -1 のとき、
MAX_CHECK_FRAME = CHECK_FRAME[layer_nb] + CHECK_FRAME[layer_nb]
- CHECK_USB[layer_nb+1]/MAXRATE/ KT
の制約も考慮される。
【0185】
CHECK_FRAME[layer_nb] = CHECK_DIFF[layer_nb] = 0
とし、対象となる「layer_nb」で示される記録層のエンコードユニット(ENCU)のうち、シームレスアングル以外のENCUの
gen_bit[k]×ENCU_weight[encu_nb]
(0 ≦ k ≦ k_max : k フレーム目の Difficulty の大きさ)
を演奏時間の早い順から「CHECK_DIFF[layer_nb]」に順次加算し、フレームのカウント数を「CHECK_FRAME[layer_nb] 」に順次加算していくことで、上記の条件を満たす k の範囲(フレームの範囲)を求めていく。
【0186】
この際に、範囲内に境界として望ましいチャプターポイントやシーンチェンジポイントがあれば、その情報も提示される。
仮に、
CHECK_DIFF[layer_nb] = CHECK_SUPPLY[layer_nb]/Gr_avr
となるように境界を変更したとして、境界変更対象となる記録層の符号化難易度(Difficulty)の総和とフレーム数を変更する。
【0187】
この結果、次の「layer_nb」の符号化難易度の総和とフレーム数は、以下のように修正される。
【0188】
[STEP 9] layer_nb = layer_nb + 1 とし、「layer_nb」が「layer_max 」と同じ値でなければ [STEP 7] に戻る。
【0189】
各記録層のフレーム数を変えるということは、素材の記録される場所を変えることを意味するため、素材の切れ目(シーンの切れ目)などの情報が非常に重要になる。
【0190】
図8は、以上説明した本発明の実施の形態に係るエンコード方法の[STEP 1]〜[STEP 5]の処理の流れを示している。
【0191】
ステップS21では、各記録層へのビット配分数「QTY_BYTES 」をスーパーバイザから受け取る。
【0192】
次に、ステップS22では、各記録層の最大バイト数制限を考慮して「USB_BYTES 」が求められる。
【0193】
次に、ステップS23では、各記録層の「USB_BYTES 」から「GOP_Header」のバイト数を除いたものの総和「ΣTOTAL_SUPPLY_BYTES」が求められる。
【0194】
次に、ステップS24では、各記録層のシームレスアングルブロックの重み係数を考慮した総フレーム量「ANGLE_WFRAME」が求められ、「ΣTOTAL_SUPPLY_BYTES」がフレーム量「frame×weight」の比率で各アングルブロックに配分される。
【0195】
次に、ステップS25では、各記録層の「TOTAL_SUPPLY_BYTES」からシームレスアングルへの配分ビット数の総和を引いて、「ALL_SUPPLY_BYTES」が求められる。
【0196】
次に、ステップS26では、各記録層毎の符号簡易度(Difficulty)の総和「SUM_DIFF」と、各ENCUごとの重み係数を考慮した符号簡易度の総和「ENCU_DIFF 」との比率から、「ALL_SUPPLY_BYTES」が各ENCUブロックに配分される。
【0197】
そして、ステップS27では、各記録層ごとのビット配分のばらつき量が計算される。このばらつき量が規定値を越えていたら、オペレータおよびスーパーバイザに警告され、適正値が計算されて提示される。
【0198】
以上の手順により、本発明の実施の形態に係るエンコード方法の[STEP 1]〜[STEP 5]の処理が終了する。
【0199】
また、図9および図10に、前述した本発明の実施の形態に係るエンコード方法の[STEP 6]〜[STEP 9]の処理の流れを示す。これらの各ステップは、フレーム数固定の条件での USB_BYTES の調整範囲の提示方法を示している。
【0200】
図9のステップS31では、全体のビット配分のばらつき度の平均値「Gr_avr」が計算される。
【0201】
Gr_avr = ΣALL_SUPPLY_BYTES[layer_nb]/ΣSUM_DIFF[layer_nb]
次に、ステップS32では、フレーム数固定の条件での「USB_BYTES 」調整範囲の提示用に値が初期化される。
【0202】
CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb]
CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb]
CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb]
CHECK_FRAME [layer_nb] = total_framenb[layer_nb]
そして、ステップS33で、layer_nb = 0 とされる。
【0203】
次に、図10のステップS34で、ばらつき度が判定される。
【0204】
Gr [layer_nb] = CHECK_SUPPLY[layer_nb]/CHECK_DIFF[layer_nb]/Gr_avr
(1)Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limit の場合
Gcheck[layer_nb] = 0
(2)Gr [layer_nb] < Gr_min_limit の場合
Gcheck[layer_nb] = 1
(3)Gr_min_limit < Gr [layer_nb]の場合
Gcheck[layer_nb] = 2
次に、ステップS35で、以下の条件を満たす「layer_nb」の記録層の「USB_BYTES 」の調整範囲が提示される。
【0205】
QTY_change [layer_nb]== 0 かつ QTY_change [layer_nb+1]==0
かつ Gcheck[layer_nb]==1 or 2
または
QTY_change [layer_nb]==1 かつ QTY_change [layer_nb+1]==0
かつ Gcheck[layer_nb]==2
または
QTY_change [layer_nb]==0 かつ QTY_change [layer_nb+1]==1
かつ Gcheck[layer_nb]==1
適正範囲
Gr_min_limit × Gr_avr × CHECK_DIFF[layer_nb]≦ CHECK_SUPPLY[layer_nb]
かつ
次に、ステップS36で、layer_nb = layer_nb + 1 とされる。
【0206】
そして、ステップS37で、layer_nb > layer_max を満足するかどうかが判断され、この条件を満足しないときにはステップS34以降の手順が繰り返される。一方、ステップS37の条件を満足する場合には、図11および図12に示す、バイト数固定の条件でのフレーム数の調整範囲の提示方法の処理手順に進む。
【0207】
図11のステップS38で、USB_BYTES 数固定の条件での記録層へのフレーム数の調整範囲の提示用に値が初期化される。
【0208】
CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb]
CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb]
CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb]
CHECK_FRAME [layer_nb] = total_framenb[layer_nb]
なお、ステップS38に先立って、全体のビット配分のばらつき度の平均値「Gr_avr」が計算される必要があるが、図9のステップS31で得られた値を用いることができる。
【0209】
そして、ステップS39で、layer_nb = 0 とされる。
【0210】
次に、図12のステップS40で、ビット配分量のばらつき度が判定される。
【0211】
次に、ステップS41で、以下の条件を満たす「layer_nb」の記録層のフレーム数の調整範囲が提示される。
【0212】
QTY_change [layer_nb]== 0 かつ QTY_change [layer_nb+1]==0
かつ Gcheck[layer_nb]==1 or 2
または
QTY_change [layer_nb]==1 かつ QTY_change [layer_nb+1]==0
かつ Gcheck[layer_nb]==2
または
QTY_change [layer_nb]==0 かつ QTY_change [layer_nb+1]==1
かつ Gcheck[layer_nb]==1
適正範囲
MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_limit/Gr_avr
MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_limit/Gr_avr
MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/kT
とすると、
MIN_CHECK_DIFF ≦ CHECK_DIFF[layer_nb] ≦ MAX_CHECK_DIFF
の条件を満たし、かつ
MIN_FRAME = CHECK_DIFF = 0
とし、layer_nb 層のENCUのうち、シームレスアングル以外のENCUの
Difficulty × ENCU_weight
の大きさを、演奏時間の早い順から、「CHECK_DIFF」にフレームのカウント数を、「CHECK_FRAME 」に、それぞれ順次加算していく。
【0213】
この際に、範囲内に境界として望ましいチャプターポイント、シーンチェンジポイントがあれば、その情報も提示される。
【0214】
次に、ステップS42で、layer_nb = layer_nb + 1 とされる。
【0215】
そして、ステップS43で、layer_nb > layer_max を満足するかどうかが判断され、この条件を満足しないときにはステップS40以降の手順が繰り返される。一方、ステップS43の条件を満足する場合には、以上の処理が終了する。
【0216】
各記録層に割り当てるビット数やフレーム数を変更すると、「MAX_BYTES 」条件によって新たに制限を受けることになる。このことから、逆に、すでにそのような制限を受けている場合には、ビット数やフレーム数を変更できない場合があることが予想される。
【0217】
図13は、2層の記録層を有する、いわゆるDVDなどの記録媒体において、「MAXBYTES」制限をすでに受けている場合の処理の分類を示している。
【0218】
また、図14は、4層の記録層を有する記録媒体において、上記の条件を適応させた場合の例を示している。
【0219】
以下に、2層の記録層を有するDVDなどのディスクに対して、ビット配分を行う場合を例として、上記の処理の分類について説明する。なお、以下の説明では、
Gr_min_limit = 0.9
Gr_max_limit = 1.1
とする。
(1)GR[0] < 0.9 の場合
ALL_SUPPLY_BYTES[0] が SUM_DIFF[0] に対して不足している。
(2)1.1 < GR[0] の場合
ALL_SUPPLY_BYTES[1] が SUM_DIFF[1] に対して不足している。
(3)上記(1),(2)以外の場合
処理を行なわない。
【0220】
<A>フレーム数固定の場合の USB_BYTES の適正範囲「CHECK_USB」
0.9×Gr_avr×CHECK_DIFF[0]
≦ CHECK_SUPPLY[0] ≦ 1.1×Gr_avr×CHECK_DIFF[0]
CHECK_USB[0]
= CHECK_SUPPLY[0] + ALL_ANGLE_BYTES[0] + TOTAL_HEADER[0]
【0221】
<B>「USB_BYTES」数固定の場合の記録フレーム数の適正範囲「CHECK_FRAME」
CHECK_SUPPLY[0]/1.1/Gr_avr ≦ CHECK_DIFF[0] ≦ CHECK_SUPPLY[0]/0.9/Gr_avr
を満たす範囲を探す。
【0222】
「layer 0 」のシームレスアングル以外のENCUの
gen_bit[k]×_ENCU_weight[encu_nb]
を順次加算して「CHECK_DIFF[0] 」を再計算していく過程で、上記の条件を満たすkの範囲を求めていく。この際に、範囲内に境界として望ましいチャプターポイントやシーンチェンジポイントがあれば、その情報も提示する。
このようにして適正範囲に修正して再度ビット配分した例を、図15〜図18に示した。
【0223】
どの例においても、符号簡易度(Difficulty)の和とビット配分量との関係が理想的になっていることが分かる。
【0224】
次に、本発明の実施の形態に係るエンコード装置について説明する。
【0225】
図19は、本発明の実施の形態に係るビデオエンコードシステムの構成例を示している。
【0226】
このビデオエンコードシステムは、上述した本発明の実施の形態に係るエンコード方法を適用して、ディジタルビデオディスク(DVD)用にビデオ情報を圧縮符号化してオーサリングなどを行うために用いることができるものであり、その基本的な構成は図21に示した従来のビデオエンコードシステムの構成とほぼ同様とすることができる。
【0227】
主コントローラ11は、このビデオエンコードシステムに割り当てられた計算機により構成され、ネットワーク2を介して接続されるスーパーバイザ3との間でデータ通信を行って、このビデオエンコードシステム全体の動作を制御する。
【0228】
具体的には、主コントローラ11は、グラフィカルユーザーインターフェース(GUI:Graphical User Interface)部14の管理により、スーパーバイザ3からの制御を受け付けると共に、図示していないオペレータの操作を受け付け、このGUI部14により管理されるビットアサイン部15,エンコーダコントロール部16,VTRコントロール部17により、エンコーダ12,ビデオテープレコーダ(VTR)10の動作を制御する。これにより、主コントローラ11は、スーパーバイザ3から通知されたエンコード条件に従って、処理対象の素材を符号化処理し、その処理結果をスーパーバイザ3に通知する。さらに、主コントローラ11は、GUI部14を介してオペレータの設定を受け付けて、上記の符号化の詳細な条件を変更できるようにされている。
【0229】
具体的には、主コントローラ11のGUI部14は、ビットアサイン部15のビット配分プログラム「BIT_ASSIGN」,エンコーダコントロール部16のエンコーダコントロールプログラム「CTRL_ENC」およびVTRコントロール部17のVTRコントロールプログラムの3つのプログラムを管理している。
【0230】
また、ビットアサイン部15は、スーパーバイザ3から通知される符号化ファイル「v.enc 」に従って符号化処理の条件をフレーム単位で決定し、この条件による制御データをファイル形式「CTL file」によりコントロール部16に通知する。
【0231】
このとき、ビットアサイン部15は、符号化処理におけるビット配分を設定し、さらに設定された条件をオペレータの操作に応じて変更する。さらに、ビットアサイン部15は、データ圧縮されたビデオデータD2が、エンコーダ12かあSCSIなどを介してRAID4に記録されると、RAID4上のアドレスデータ「v.adr 」を、後段における多重化処理に必要なデータ量等の情報「vxxx.aui」と共にスーパーバイザ3に通知する。
【0232】
エンコーダコントロール部16は、ビットアサイン部15から通知される制御ファイル「CTL file」に従って、イーサネットETHER などを介してエンコーダ12の動作を制御する。さらに、エンコーダコントロール部16は、符号化処理に要する符号化難易度(difficulty)のデータをフレーム単位でビットアサイン部15に通知し、ビデオデータD2が記録されたRAID4の記録アドレスのデータ「v.adr 」,後の多重化処理に必要なデータ「vxxx.aui 」をビットアサイン部15に通知する。
【0233】
VTRコントロール部17は、スーパーバイザ103から通知される編集リストに従って、RS−422(9ピンリモート)などを介してビデオテープレコーダ(VTR)10の動作を制御し、所望の編集対象の素材を再生する。
【0234】
ビデオテープレコーダ(VTR)10は、主コントローラ11を介してスーパーバイザ3から通知される編集リストに従って、磁気テープに記録されたビデオデータD1を再生して、処理対象の「SDI 」,「REF V 」,「TIME CODE 」をエンコーダ12に出力する。このVTR10としては、通常はディジタルVTRが用いられる。
【0235】
エンコーダ12は、スーパーバイザ3から主コントローラ11を介して通知される条件に従って動作を切り換え、VTR10から出力されるビデオデータD1を、MPEG(Moving Picture Experts Group)の手法により圧縮符号化する。
【0236】
このとき、エンコーダ12は、符号化処理の結果を主コントローラ11に通知し、主コントローラ11は、そのデータ圧縮における符号化の条件を制御し、発生するビット量を制御する。これにより、主コントローラ11は、データ圧縮により発生するビット量をフレーム単位で把握できる。
【0237】
また、エンコーダ12は、2パスエンコードにおける事前のエンコード条件設定の処理時(仮エンコード時)には、VTR10からはビデオデータを単にデータ圧縮して処理結果を主コントローラ11に通知するだけであるが、最終的なデータ圧縮処理時(本エンコード時)には、圧縮処理されたビデオデータD2をRAID4に記録し、さらにそのデータが記録されたアドレス,データ量等を主コントローラ11に通知する。
【0238】
モニタ装置13は、エンコーダ12によりデータ圧縮されたビデオデータD2をモニタできるように構成される。このモニタ装置13ににより、このビデオエンコードシステムでは、オペレータがデータ圧縮処理の結果を必要に応じて確認する、いわゆるプレビューを行うことができる。そして、オペレータが、このプレビュー結果に基づいて主コントローラ11を操作して、符号化の条件を詳細に変更できるようにされている。
【0239】
また、モニタ装置13には、仮エンコード時に測定された符号化難易度に基づいて、与えられたエンコード条件によるビット配分が、記録層間に許容できない程の画質の差を生じることの警告や、適正とされるビット配分などの条件が表示される。
【0240】
以上のように、本発明の実施の形態に係るエンコード方法およびエンコード装置によれは、ビデオの2パスエンコード方式の場合に、スーパーバイザから与えられたエンコード条件による複数の記録層または記録領域の画質のばらつき量を本エンコードの実行前に予測し評価できる。
【0241】
なお、ここでは、DVDの複数層のビット配分について説明したが、必ずしも記録層間ではなく、同一記録層内に固定された、パーティションが設けられた複数の記録領域間に亘って記録されるデータに対するビット配分にも適応可能である。
【0242】
また、ここでは、複数の記録層を有する記録媒体に記録されるビデオデータのエンコードについて説明したが、本発明の実施の形態に係る処理の基本的なアルゴリズムは、2パス可変ビットレートエンコードを行うオーディオ処理システムで、オーディオデータを複数の固定された記録領域に対して、音質のばらつきを少なくなるようにビット配分するシステムに対しても適応可能である。
【0243】
【発明の効果】
本発明によれば、2パスエンコード方式の場合に、本エンコードの実行前にスーパーバイザから与えられたエンコード条件による複数の記録層または記録領域の画質のばらつき量を予測評価できるようにしたため、早い時点でスーパーバイザへの条件の見直しを促すことができ、DVDなどのパッケージメディアのディスク作成のためのエンコード作業工数を削減することができる。
【図面の簡単な説明】
【図1】2つの記録領域に記録されるシームレスアングルブロックを含むデータに対して、フレーム数の比率に応じてビット配分される様子を説明するための図である。
【図2】上記のビット配分の詳細を示す図である。
【図3】2つの記録領域に記録されるシームレスアングルブロックを含むデータに対して、従来方式によりビット配分される様子を説明するための図である。
【図4】上記の例における各エンコードユニット(ENCU)に対するビット配分結果をまとめて示す図である。
【図5】2つの記録領域に記録されるシームレスアングルブロックを含むデータに対して、本発明の実施の形態に係る方式によりビット配分される様子を説明するための図である。
【図6】上記の例における、各エンコードユニット(ENCU)に対するビット配分結果をまとめて示す図である。
【図7】本発明の実施の形態に係るビット配分計算の基本的な手順を示すフローチャートである。
【図8】本発明の実施の形態に係るエンコード方法の[STEP 1]〜[STEP 5]における処理の流れを示すフローチャートである。
【図9】本発明の実施の形態に係るエンコード方法の[STEP 6]〜[STEP 9]における、フレーム数固定の条件での「USB_BYTES 」の調整範囲の提示方法についての処理の流れを示すフローチャートである。
【図10】本発明の実施の形態に係るエンコード方法の[STEP 6]〜[STEP 9]における、フレーム数固定の条件での「USB_BYTES 」の調整範囲の提示方法についての処理の流れを示す、図9に続くフローチャートである。
【図11】本発明の実施の形態に係るエンコード方法における、バイト数固定の条件でのフレーム数の調整範囲の提示方法についての処理の流れを示すフローチャートである。
【図12】本発明の実施の形態に係るエンコード方法における、バイト数固定の条件でのフレーム数の調整範囲の提示方法についての処理の流れを示す、図11に続くフローチャートである。
【図13】2つの記録層を有する記録媒体において「MAXBYTES」制限をすでに受けている場合の処理の分類を示す図である。
【図14】上記の条件を4つの記録層を有する記録媒体に適応した場合の処理例を説明するための図である。
【図15】適正範囲に修正して再度ビット配分した例を示す図である。
【図16】適正範囲に修正して再度ビット配分した例を示す図である。
【図17】適正範囲に修正して再度ビット配分した例を示す図である。
【図18】適正範囲に修正して再度ビット配分した例を示す図である。
【図19】本発明の実施の形態に係るビデオエンコードシステムの構成例を示す図である。
【図20】エンコード装置の一形態を示す図である。
【図21】従来のビデオエンコードシステムの構成例を示す図である。
【図22】従来のエンコード作業の流れを示すフローチャートである。
【図23】従来のエンコード作業における、ビット配分計算処理の手順の一具体例を示すフローチャートである。
【図24】従来のエンコード作業における、シーンチェンジの検出/処理について説明するための図である。
【図25】従来のエンコード作業における、チャプタ(CHAPTER )指定されたフレームの処理について説明するための図である。
【図26】本発明の実施の形態における、各エンコードユニット(ENCU)へのビット配分例を示す図である。
【図27】シームレスアングル部分に対する重み係数が考慮された、本発明の実施の形態に係るビット配分の基本的な手順を示すフローチャートである。
【図28】GOPごとの符号化難易度の和「gop_diff」とエンコード時のGOP単位のビット割当て量「gop_target」とを変換するための、最も簡単な関数の例を示す図である。
【図29】VBV(Video buffering verifier)計算方法について説明するための図である。
【図30】評価関数と「GOP_MAXRATE 」制限を考慮して求めたターゲット量に対して、VBVバッファ計算を行った場合のターゲットビット配分例を示す図である。
【図31】VBV制限処理後のターゲットビット配分例を示す図である。
【図32】2つの記録層を有する記録媒体に対して、従来方式によりビット配分した例を示す図である。
【図33】2つの記録層を有する記録媒体に対して、従来方式によりビット配分した例を示す図である。
【図34】いわゆるDVD(ディジタルビデオディスク)におけるアングルブロックおよびアングル再生について説明するための図である。
【図35】素材がアングルブロックを含む場合について説明するための図である。
【図36】インターリーブ処理について説明するための図である。
【図37】シームレスアングルブロックの処理について説明するための図である。
【図38】VBVバッファ残量の制限を加えたエンコードおよびデコードを行った場合の例を示す図である。
【図39】シームレスアングルで、全てのGOPの最初と最後のVBVの値が一定値以上になるように制御される様子を説明するための図である。
【符号の説明】
2 ネットワーク、 3 スーパーバイザ、 4 RAID、 10 ビデオテープレコーダ(VTR)、 11 主コントローラ、 12 エンコーダ、 14 GUI(グラフィカルユーザインターフェース)部、 15 ビットアサイン部、 16 エンコーダコントロール部、 17 VTRコントロール部
Claims (18)
- ビデオ素材を圧縮符号化して複数の記録領域に記録するエンコード方法において、
本エンコードに先立つプリエンコード工程と、
与えられたエンコード条件下で、各記録領域の間の画質の差を許容できるビット配分の可否を評価する評価工程と、
上記各記録領域の間の画質の差が許容できるビット配分の適正範囲を提示する提示工程と
を有し、上記与えられたエンコード条件または上記提示された適正範囲のビット配分により本エンコードを行うことを特徴とするエンコード方法。 - 上記評価工程では、上記プリエンコード工程で測定された上記ビデオ素材の符号化難易度を用いて、上記与えられたエンコード条件により上記各記録領域に配分されるビット量と上記各記録領域ごとの符号化難易度の総和との比率を求め、その比率のばらつき量に基づいて、上記各記録領域のエンコード後の画質のばらつき量を推定することを特徴とする請求項1記載のエンコード方法。
- 上記提示工程では、上記比率のばらつき量が所定値を越えるときに、上記各記録領域のフレーム数を固定した場合の、各記録領域に配分されるべきビット数の適正範囲値を表示することを特徴とする請求項2記載のエンコード方法。
- 上記提示工程では、上記比率のばらつき量が所定値を越えるときに、上記各記録領域のビット配分量を固定した場合の、各記録領域に記録されるべきフレーム数の適正範囲値を表示することを特徴とする請求項2記載のエンコード方法。
- 上記提示工程では、上記フレーム数の適正範囲内でのチャプター位置、またはシーンチェンジ検出位置を検出し、新たに記録層の境界を変更する際のビデオ素材上での適切な場所として表示することを特徴とする請求項4記載のエンコード方法。
- 上記複数の記録領域は、ディジタルビデオディスクの複数の記録層であることを特徴とする請求項1記載のエンコード方法。
- 複数の記録領域にシームレスアングルブロックを含むエンコードを行うエンコード方法において、
各記録領域ごとに与えられる上限が考慮されたバイト数の総和および総フレーム数からエンコードされた素材の平均レートを求める工程と、
重み係数を考慮したフレーム数の比率に従って、上記各記録領域に記録されるべきシームレスアングルブロックに割り当てられるバイト数を、上記各記録領域から確保する工程と、
上記シームレスアングルブロックに割り当てられるバイト数が差し引かれた残りのバイト数を、上記シームレスアングルブロック以外のブロックに重み係数を考慮した符号化難易度の和の比率で配分する工程と
を有することを特徴とするエンコード方法。 - 上記エンコードされたビデオ素材の平均レートは、本エンコードに先立つプリエンコードにより求められることを特徴とする請求項7記載のエンコード方法。
- 上記複数の記録領域は、ディジタルビデオディスクの複数の記録層であることを特徴とする請求項7記載のエンコード方法。
- ビデオ素材を圧縮符号化して複数の記録領域に記録するエンコード装置において、
本エンコードに先立ってプリエンコードを行うプリエンコード手段と、
各記録領域の間の画質の差を許容できるビット配分の可否を評価する評価手段と、
上記各記録領域の間の画質の差が許容できるビット配分の適正範囲を提示する提示手段と
を備え、上記与えられたエンコード条件または上記提示された適正範囲のビット配分により本エンコードを行うことを特徴とするエンコード装置。 - 上記評価手段は、上記プリエンコード手段により測定された上記ビデオ素材の符号化難易度を用いて、上記与えられたエンコード条件により上記各記録領域に配分されるビット量と上記各記録領域ごとの符号化難易度の総和との比率を求め、その比率のばらつき量に基づいて、上記各記録領域のエンコード後の画質のばらつき量を推定することを特徴とする請求項10記載のエンコード装置。
- 上記提示手段は、上記比率のばらつき量が所定値を越えるときに、上記各記録領域のフレーム数を固定した場合の、各記録領域に配分されるべきビット数の適正範囲値を表示することを特徴とする請求項11記載のエンコード装置。
- 上記提示手段は、上記比率のばらつき量が所定値を越えるときに、上記各記録領域のビット配分量を固定した場合の、各記録領域に記録されるべきフレーム数の適正範囲値を表示することを特徴とする請求項11記載のエンコード装置。
- 上記提示手段は、上記フレーム数の適正範囲内でのチャプター位置、またはシーンチェンジ検出位置を検出し、新たに記録層の境界を変更する際の素材上での適切な場所として表示することを特徴とする請求項13記載のエンコード装置。
- 上記複数の記録領域は、ディジタルビデオディスクの複数の記録層であることを特徴とする請求項10記載のエンコード装置。
- 複数の記録領域にシームレスアングルブロックを含むエンコードを行うエンコード装置において、
各記録領域ごとに与えられる上限が考慮されたバイト数の総和および総フレーム数からエンコードされた素材の平均レートを求める手段と、
重み係数を考慮したフレーム数の比率に従って、上記各記録領域に記録されるべきシームレスアングルブロックに割り当てられるバイト数を、上記各記録領域から確保する手段と、
上記シームレスアングルブロックに割り当てられるバイト数が差し引かれた残りのバイト数を、上記シームレスアングルブロック以外のブロックに重み係数を考慮した符号化難易度の和の比率で配分する手段と
を備えることを特徴とするエンコード装置。 - 上記エンコードされた素材の平均レートは、本エンコードに先立つプリエンコードにより求められることを特徴とする請求項16記載のエンコード装置。
- 上記複数の記録領域は、ディジタルビデオディスクの複数の記録層であることを特徴とする請求項16記載のエンコード装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36926497A JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
US09/221,459 US6356178B1 (en) | 1997-12-29 | 1998-12-28 | Method and apparatus for encoding video material for recording |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36926497A JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11196375A JPH11196375A (ja) | 1999-07-21 |
JP3837889B2 true JP3837889B2 (ja) | 2006-10-25 |
Family
ID=18493988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36926497A Expired - Fee Related JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6356178B1 (ja) |
JP (1) | JP3837889B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100303727B1 (ko) * | 1998-04-28 | 2001-09-24 | 구자홍 | 동영상의적응적디스플레이속도자동조절장치와방법 |
JP3584033B1 (ja) * | 2003-03-25 | 2004-11-04 | 株式会社リコー | 情報記録方法、情報記録装置、プログラム及び記憶媒体 |
JP3675464B2 (ja) * | 2003-10-29 | 2005-07-27 | ソニー株式会社 | 動画像符号化装置および動画像符号化制御方法 |
US20060168632A1 (en) * | 2004-02-20 | 2006-07-27 | Yoshimasa Honda | Video reception device, video transmission device, and video transmission system |
TW200845724A (en) | 2004-06-02 | 2008-11-16 | Matsushita Electric Ind Co Ltd | Multiplexing apparatus and demultiplexing apparatus |
US9070408B2 (en) | 2005-08-26 | 2015-06-30 | Endless Analog, Inc | Closed loop analog signal processor (“CLASP”) system |
US8630727B2 (en) * | 2005-08-26 | 2014-01-14 | Endless Analog, Inc | Closed loop analog signal processor (“CLASP”) system |
US7751916B2 (en) * | 2005-08-26 | 2010-07-06 | Endless Analog, Inc. | Closed loop analog signal processor (“CLASP”) system |
JP5028798B2 (ja) * | 2005-12-27 | 2012-09-19 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
JP2010523048A (ja) * | 2007-03-29 | 2010-07-08 | トムソン ライセンシング | デジタルシネマシステムへのコンテンツ配信及びデジタルシネマシステムでの再生方法及び装置 |
JP5057872B2 (ja) * | 2007-07-17 | 2012-10-24 | 株式会社東芝 | 情報処理装置およびプログラム |
CA2705676C (en) * | 2007-11-15 | 2017-08-29 | Thomson Licensing | System and method for re-encoding video using version comparison data to determine re-encoding parameters |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3629728B2 (ja) * | 1994-08-31 | 2005-03-16 | ソニー株式会社 | 動画像信号符号化方法、動画像信号符号化装置及び動画像信号記録媒体 |
GB9517130D0 (en) * | 1995-08-22 | 1995-10-25 | Nat Transcommunications Ltd | Statistical multiplexing |
US6243417B1 (en) * | 1996-12-12 | 2001-06-05 | Sony Corporation | Device and method for encoding image data, and image data transmission method |
US6038256A (en) * | 1996-12-31 | 2000-03-14 | C-Cube Microsystems Inc. | Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics |
US6229850B1 (en) * | 1997-07-22 | 2001-05-08 | C-Cube Semiconductor Ii, Inc. | Multiple resolution video compression |
-
1997
- 1997-12-29 JP JP36926497A patent/JP3837889B2/ja not_active Expired - Fee Related
-
1998
- 1998-12-28 US US09/221,459 patent/US6356178B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11196375A (ja) | 1999-07-21 |
US6356178B1 (en) | 2002-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3361009B2 (ja) | ビデオ符号化方法および速度量子化モデルを利用して符号化を行うシステム | |
KR100288094B1 (ko) | 부호화된 비디오 시퀀스의 품질을 수동으로 변경하기 위한 방법 및 시스템 | |
JP4430580B2 (ja) | エンコードされたビデオのビットストリームにビデオを追加する方法およびシステム | |
US8331457B2 (en) | Information processing apparatus and method, and recording medium and program used therewith | |
JP3710820B2 (ja) | オーディオエンコーダの数が低減されるオーディオ映像エンコードシステム | |
WO1996036170A1 (en) | System for altering the encoded video frames | |
JP2001128126A6 (ja) | エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム | |
JP3837889B2 (ja) | エンコード方法およびエンコード装置 | |
JP3740813B2 (ja) | 画像符号化方法および画像符号化装置 | |
JP3911768B2 (ja) | 画像符号化方法及び画像符号化装置 | |
EP2112663A2 (en) | Information processing apparatus and information processing method | |
JP4650454B2 (ja) | 符号化装置及び符号化方法 | |
US6282242B1 (en) | Data compression device that switches between intra-frame coding and inter-frame coding | |
JP4462643B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JPH10304372A (ja) | 画像符号化方法および装置、画像伝送方法 | |
JPH1198514A (ja) | 画像符号化装置および方法 | |
JP4161385B2 (ja) | 画像符号化方法及び装置並びに画像処理装置及び画像処理方法 | |
JP3558384B2 (ja) | 映像記録再生方法 | |
JP4207098B2 (ja) | 符号化制御装置及び符号化制御方法、符号化装置及び符号化方法 | |
JPH10308942A (ja) | 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法 | |
JPH08331556A (ja) | 画像符号化装置および画像符号化方法 | |
JPH10304376A (ja) | 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法 | |
JPH10290429A (ja) | データ圧縮装置 | |
JP4423215B2 (ja) | 画像処理装置 | |
JPH1198499A (ja) | 画像符号化装置および画質予測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060724 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100811 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110811 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120811 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130811 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |