JP6249040B2 - Video decoding method - Google Patents
Video decoding method Download PDFInfo
- Publication number
- JP6249040B2 JP6249040B2 JP2016078836A JP2016078836A JP6249040B2 JP 6249040 B2 JP6249040 B2 JP 6249040B2 JP 2016078836 A JP2016078836 A JP 2016078836A JP 2016078836 A JP2016078836 A JP 2016078836A JP 6249040 B2 JP6249040 B2 JP 6249040B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- decoding
- picture
- time
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 69
- 230000008569 process Effects 0.000 claims description 27
- 239000000872 buffer Substances 0.000 description 109
- 238000004364 calculation method Methods 0.000 description 69
- 238000012545 processing Methods 0.000 description 54
- 238000013139 quantization Methods 0.000 description 26
- 238000000605 extraction Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 21
- 239000000945 filler Substances 0.000 description 15
- 238000003860 storage Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 12
- 230000003111 delayed effect Effects 0.000 description 11
- 230000001186 cumulative effect Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 101150114515 CTBS gene Proteins 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動画像データが分割された各ブロックの符号化データを示す入力ストリームを復号する動画像復号方法に関する。 The present invention relates to a moving picture decoding method for decoding an input stream indicating encoded data of each block obtained by dividing moving picture data.
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを符号化することにより圧縮する。 The moving image data generally has a very large amount of data. Therefore, a device that handles moving image data compresses the moving image data by encoding it when transmitting the moving image data to another device or when storing the moving image data in the storage device. .
代表的な動画像の符号化標準技術として、ISO/IEC(International Standardization Organization/International Electrotechnical Commission)で策定されたMPEG(Moving Picture Experts Group phase)−2、MPEG−4、あるいはMPEG−4 AVC/H.264(H.264 MPEG-4 Advanced Video Coding)が広く利用されている。 As a typical moving picture coding standard technology, MPEG (Moving Picture Experts Group phase) -2, MPEG-4, or MPEG-4 AVC / H established by ISO / IEC (International Standardization Organization / International Electrotechnical Commission) . H.264 (H.264 MPEG-4 Advanced Video Coding) is widely used.
このような符号化標準技術では、符号化対象のピクチャと、その前後のピクチャの情報を用いて、符号化対象のピクチャを符号化するインター符号化方法及び符号化対象ピクチャが持つ情報のみを用いて符号化するイントラ符号化方法が採用されている。 In such an encoding standard technique, only the information of the encoding target picture and the inter encoding method for encoding the encoding target picture using the information of the encoding target picture and the preceding and succeeding pictures are used. Intra-coding method is used.
一般に、インター符号化方法で符号化されたピクチャ又はブロックの符号量は、イントラ符号化方法で符号化されたピクチャ又はブロックの符号量に比べて小さい。このように、選択された符号化モードにより、シーケンス内でピクチャの符号量の偏りが生じる。同様に、選択された符号化モードにより、ピクチャ内でブロックの符号量の偏りが生じる。 In general, the code amount of a picture or block encoded by the inter encoding method is smaller than the code amount of a picture or block encoded by the intra encoding method. In this way, the coding amount of the picture is biased in the sequence depending on the selected coding mode. Similarly, the coding amount selected causes a deviation in the code amount of the block in the picture.
そこで、符号量が時間的に変動しても、一定の伝送レートにて符号化された動画像を含むデータストリームを伝送できるように、伝送元の装置にデータストリーム用の送信バッファが用意され、また伝送先の装置にデータストリーム用の受信バッファが用意される。 Therefore, even if the code amount fluctuates with time, a transmission buffer for the data stream is prepared in the transmission source device so that a data stream including a moving image encoded at a constant transmission rate can be transmitted. In addition, a reception buffer for the data stream is prepared in the transmission destination device.
これらのバッファによる遅延(以降、バッファ遅延と呼ぶ)が、符号化装置における各ピクチャの入力から、復号装置における復号した各ピクチャの表示までの遅延(以降、コーデック遅延と呼ぶ)の主要因となる。コーデック遅延には、復号に関する遅延である復号遅延と、表示(出力)に関する遅延である表示遅延とを含む。 The delay due to these buffers (hereinafter referred to as buffer delay) is the main factor of the delay (hereinafter referred to as codec delay) from the input of each picture in the encoding device to the display of each decoded picture in the decoding device. . The codec delay includes a decoding delay that is a delay related to decoding and a display delay that is a delay related to display (output).
バッファのサイズを小さくすることでバッファ遅延及びコーデック遅延は減少する。しかし、バッファのサイズが小さくなるほど、ピクチャ毎の符号量配分の自由度も減少し、その結果として再生される動画像の画質が劣化する。符号量配分の自由度は、符号量の変動度合いを意味する。 By reducing the size of the buffer, buffer delay and codec delay are reduced. However, as the buffer size decreases, the degree of freedom of code amount distribution for each picture also decreases, and as a result, the quality of a moving image to be reproduced deteriorates. The degree of freedom of code amount distribution means the degree of code amount variation.
MPEG−2及びMPEG−4 AVC/H.264では、それぞれVBV(Video Buffering Verifier)とCPB(Coded Picture Buffer)と呼ばれる、理想的な復号装置における受信バッファの動作を規定している。以降、理想的な復号装置を理想復号装置と呼ぶ。 MPEG-2 and MPEG-4 AVC / H. H.264 defines the operation of a reception buffer in an ideal decoding device called VBV (Video Buffering Verifier) and CPB (Coded Picture Buffer), respectively. Hereinafter, an ideal decoding device is referred to as an ideal decoding device.
動画像符号化装置は、理想復号装置の受信バッファをオーバーフロー及びアンダーフローさせないように、符号量を制御する。理想復号装置は、復号処理に要する時間が0である瞬時復号を行うと規定されている。例えば、VBVに関する動画像符号化装置の制御を行う技術がある(例えば、特許文献1参照)。 The moving image encoding device controls the amount of codes so that the reception buffer of the ideal decoding device does not overflow and underflow. The ideal decoding device is defined to perform instantaneous decoding in which the time required for the decoding process is zero. For example, there is a technique for controlling a moving image encoding apparatus related to VBV (see, for example, Patent Document 1).
動画像符号化装置は、理想復号装置の受信バッファがオーバーフロー及びアンダーフローしないように、理想復号装置があるピクチャを復号する時刻にそのピクチャのデータが受信バッファに格納されていることを保証するように符号量を制御する。 The moving picture coding apparatus ensures that the data of the picture is stored in the reception buffer at the time when the picture is decoded by the ideal decoding apparatus so that the reception buffer of the ideal decoding apparatus does not overflow and underflow. The code amount is controlled.
受信バッファのアンダーフローは、動画像符号化装置が一定の伝送レートでストリームを送信した場合に、各ピクチャの符号量が多く、動画像復号装置が復号、表示するべき時刻までに、ピクチャの復号に必要なデータの伝送が完了していない場合に生じる。すなわち、受信バッファのアンダーフローは、復号装置の受信バッファ内にピクチャを復号するために必要データが存在していないことである。この場合、動画像復号装置は復号処理を行うことができないため、フレームスキップが発生することとなる。 The underflow of the reception buffer is caused when the video encoding device transmits a stream at a constant transmission rate, and the amount of code of each picture is large, and the video decoding device decodes the picture before the time to be decoded and displayed. This occurs when the transmission of data necessary for the transfer is not completed. That is, the underflow of the reception buffer means that data necessary for decoding a picture does not exist in the reception buffer of the decoding device. In this case, since the video decoding device cannot perform the decoding process, a frame skip occurs.
動画像復号装置は、受信バッファのアンダーフローを起こさずに復号処理するため、受信時刻から所定の時間だけストリームを遅延させてからピクチャを表示する。 Since the moving picture decoding apparatus performs decoding without causing an underflow of the reception buffer, the video is displayed after delaying the stream by a predetermined time from the reception time.
上述したように、理想復号装置では、処理時間0で、瞬時的に復号処理が完了すると規定される。そのため、動画像符号化装置へのi番目ピクチャ(以降、P(i)とも表記する)の入力時刻をt(i)、理想復号装置における、P(i)の復号時刻をdt(i)とすれば、そのピクチャが表示可能となる時刻は、復号時刻と同様でdt(i)となる。
As described above, in the ideal decoding device, it is defined that the decoding process is instantaneously completed at the
全てのピクチャにおいてピクチャの表示期間{t(i+1)−t(i)}と{dt(i+1)−dt(i)}が等しくなるので、復号時刻dt(i)は、入力時刻t(i)から固定時間dly分だけ遅延させた時刻{dt(i)=t(i)+dly}となる。従って、動画像符号化装置は、時刻dt(i)までに復号に必要なデータを動画像復号装置の受信バッファに伝送完了させなければならない。 Since the picture display period {t (i + 1) -t (i)} is equal to {dt (i + 1) -dt (i)} in all the pictures, the decoding time dt (i) is equal to the input time t (i). Is a time {dt (i) = t (i) + dly} delayed by a fixed time dly. Therefore, the moving picture encoding apparatus must complete transmission of data necessary for decoding to the reception buffer of the moving picture decoding apparatus by time dt (i).
図1は、従来技術による受信バッファのバッファ占有量の遷移例を示す図である。図1に示す例では、横軸は時刻を表し、縦軸は受信バッファのバッファ占有量を表す。実線のグラフ10は、各時刻におけるバッファ占有量を表す。
FIG. 1 is a diagram illustrating a transition example of the buffer occupation amount of the reception buffer according to the conventional technique. In the example shown in FIG. 1, the horizontal axis represents time, and the vertical axis represents the buffer occupation amount of the reception buffer. A
受信バッファでは、所定の伝送レートでバッファ占有量が回復し、各ピクチャの復号時刻にそのピクチャを復号するために用いられる分のデータがバッファから引き抜かれる。図1に示す例ではP(i)のデータが、時刻at(i)から受信バッファに入力開始され、P(i)の最後のデータが時刻ft(i)に入力される。理想復号装置は時刻dt(i)でP(i)の復号を完了し、その時刻dt(i)においてP(i)が表示可能となる。 In the reception buffer, the buffer occupancy is restored at a predetermined transmission rate, and data used for decoding the picture is extracted from the buffer at the decoding time of each picture. In the example shown in FIG. 1, the input of P (i) data is started to the reception buffer from time at (i), and the last data of P (i) is input at time ft (i). The ideal decoding device completes the decoding of P (i) at time dt (i), and P (i) can be displayed at the time dt (i).
理想復号装置が瞬時復号を行う一方で、実際の動画像復号装置は所定の復号処理時間を要する。一般には1ピクチャの復号処理時間は、ピクチャの表示期間よりも短いが、ピクチャの表示期間に近い時間となる。 While an ideal decoding device performs instantaneous decoding, an actual moving image decoding device requires a predetermined decoding processing time. In general, the decoding processing time for one picture is shorter than the picture display period, but is close to the picture display period.
時刻at(i)からft(i)までP(i)のデータが受信バッファに入力されるが、各ブロックの復号に必要なデータがat(i)からft(i)内のどの時刻に到着するか保証されない。そのため、実際の動画像復号装置は、時刻ft(i)からP(i)の復号処理を開始することとなる。従って、1ピクチャの復号処理に必要な最悪の処理時間をctとすれば、実際の動画像復号装置は、時刻ft(i)+ctにしか復号処理を完了することが保証できない。 Data of P (i) is input to the reception buffer from time at (i) to ft (i), but data required for decoding each block arrives at any time within ft (i) from at (i) It is not guaranteed to do. Therefore, the actual moving picture decoding apparatus starts the decoding process of P (i) from time ft (i). Therefore, if the worst processing time required for decoding one picture is ct, the actual moving picture decoding apparatus can only guarantee that the decoding process is completed only at time ft (i) + ct.
動画像符号化装置が保証しているのは、時刻dt(i)までに、P(i)の復号に必要なデータが受信バッファに到着していること、すなわち、ft(i)≦dt(i)となることである。そのため、ft(i)が最も遅くなる場合、ft(i)はdt(i)と等しくなる。 The video encoding apparatus guarantees that data necessary for decoding P (i) has arrived at the reception buffer by time dt (i), that is, ft (i) ≦ dt ( i). Therefore, when ft (i) is the slowest, ft (i) is equal to dt (i).
このとき、P(i)全体の復号処理が完了することが保証される時刻は、dt(i)+ctとなる。表示するピクチャの間隔が一定となるよう、全てのピクチャを表示するには、動画像復号装置は、各ピクチャの表示時刻を理想復号装置よりも少なくとも時間ctだけ遅延させなければならない。 At this time, the time at which the decoding process for the entire P (i) is guaranteed is dt (i) + ct. In order to display all the pictures so that the interval between pictures to be displayed is constant, the moving picture decoding apparatus must delay the display time of each picture by at least time ct from the ideal decoding apparatus.
MPEG−2のVBV、及びMPEG−4 AVC/H.264のCPBでは、動画像復号装置における各符号化ピクチャの到着時刻と、復号した各符号化ピクチャの表示時刻との差は、(ft(i)−at(i)+ct)となる。すなわち、符号化装置への各ピクチャ入力から、復号化装置での該当ピクチャ出力までのコーデック遅延を時間ct未満にすることは困難である。つまり、時間ctは通常1ピクチャ処理時間であるので、1ピクチャ処理時間未満のコーデック遅延を達成することは困難である。 MPEG-2 VBV and MPEG-4 AVC / H. In H.264 CPB, the difference between the arrival time of each encoded picture in the video decoding device and the display time of each encoded picture is (ft (i) −at (i) + ct). That is, it is difficult to make the codec delay from each picture input to the encoding device to the corresponding picture output at the decoding device less than the time ct. That is, since the time ct is usually one picture processing time, it is difficult to achieve a codec delay less than one picture processing time.
従来技術では、コーデック遅延を1ピクチャ処理時間にするのは困難であるが、コーデック遅延を1ピクチャ処理時間未満にするには、次の方法がある。例えば、この方法は、ピクチャ内の各ブロックを、N個のグループのどれか一つに割り当て、また各グループに復号開始時刻を割り当てる。グループは、例えば1ブロックラインである。ブロックラインは、ピクチャの水平方向のブロック列を表す。 In the prior art, it is difficult to set the codec delay to one picture processing time, but there are the following methods to make the codec delay less than one picture processing time. For example, this method assigns each block in a picture to one of N groups and assigns a decoding start time to each group. A group is, for example, one block line. A block line represents a block row in the horizontal direction of a picture.
各グループの発生情報量を均一にできれば、連続するグループの復号開始時刻の差はグループ当たりの処理時間と一致し、また時間ctはグループ当たりの処理時間ct/Nとなる。そのため、結果として、コーデック遅延をグループ当たりの処理時間にまで小さくすることが可能になる。 If the amount of generated information in each group can be made uniform, the difference between the decoding start times of successive groups matches the processing time per group, and the time ct becomes the processing time ct / N per group. As a result, the codec delay can be reduced to the processing time per group.
図2は、グループ分割によりコーデック遅延を1ピクチャ時間未満にした例を示す図である。図2に示すグラフ17は、従来方式のバッファ占有量の時間遷移を表す。一方、図2に示すグラフ15は、グループ分割によるバッファ占有量の時間遷移を表す。
FIG. 2 is a diagram illustrating an example in which the codec delay is less than one picture time by group division. A
グループ分割方式により、P(i)のn番目のグループ(以降G(i,n)とも表記する)の復号開始時刻dgt(i,n)が規定され、バッファ占有量が小さくなる。各グループは、対応する復号開始時刻から、符号16が示すグループ復号時間ct/Nを要して復号されることにより、各グループの表示可能時刻の遅延が短縮される。 By the group division method, the decoding start time dgt (i, n) of the nth group of P (i) (hereinafter also referred to as G (i, n)) is defined, and the buffer occupation amount is reduced. Each group is decoded for a group decoding time ct / N indicated by reference numeral 16 from the corresponding decoding start time, thereby reducing the delay of the displayable time of each group.
グループ分割方式は、各グループの発生情報量をほぼ均一にすることで、コーデック遅延をグループ当たりの時間にまで小さくする。このコーデック遅延は、グループ内での各ブロックの発生情報量が極端に偏った場合の最悪値であるが、実際には適切なレート制御により、グループ内の各ブロックの発生情報量の偏りを小さくすることができる。この場合、コーデック遅延を更に軽減することが理論上可能であるが、ブロック分割方法では実現することは困難である。この理由を図3〜6を用いて説明する。 The group division method reduces the codec delay to the time per group by making the amount of information generated in each group substantially uniform. This codec delay is the worst value when the amount of information generated in each block in the group is extremely biased. In practice, however, the bias in the amount of information generated in each block in the group is reduced by appropriate rate control. can do. In this case, it is theoretically possible to further reduce the codec delay, but it is difficult to realize with the block division method. The reason for this will be described with reference to FIGS.
図3は、動画像復号装置の受信バッファの様子を示す図である。図3に示す例では、受信バッファへの符号化データの到着量累積値と、復号処理により消費した符号化データの累積値とを用いて表現したものである。 FIG. 3 is a diagram illustrating a state of the reception buffer of the video decoding device. In the example shown in FIG. 3, it is expressed by using the accumulated amount of encoded data arrival to the reception buffer and the accumulated value of the encoded data consumed by the decoding process.
図3に示すグラフ20は、符号化データの到着量累積値を表す。符号化データは、一定のレートRにて動画像符号化装置から動画像復号装置へと伝送される。図3に示す例では、動画像復号装置の受信バッファへの最初のビットの到着時刻、すなわちat(0)を0としている。
A
図3に示すグラフ21は、ピクチャ単位の瞬時復号処理により消費した符号化データの累積値である。初期遅延dly後に、i番目のピクチャP(i)(i=0,...)を順に、dt(i)にて瞬時復号する。連続する2つのピクチャの瞬時復号時刻の差dt(i+1)−dt(i)は一定である。P(i)の符号化情報量は、b(i)で表わす。 A graph 21 shown in FIG. 3 is an accumulated value of the encoded data consumed by the instantaneous decoding process in units of pictures. After the initial delay dly, the i-th picture P (i) (i = 0,...) Is sequentially decoded in sequence by dt (i). The difference dt (i + 1) −dt (i) between the instantaneous decoding times of two consecutive pictures is constant. The encoded information amount of P (i) is represented by b (i).
at(i)及びft(i)はそれぞれ、P(i)の符号化データの先頭ビット及び最終ビットが動画像復号装置に到着する時刻を表す。動画像復号装置の受信バッファをアンダーフローさせないためには、dt(i)にてP(i)の全符号化データが到着してなければならい。すなわち、dt(i)≧ft(i)及びdt(i−1)≧at(i)が満たされていることを要する。 at (i) and ft (i) represent the time at which the first bit and the last bit of the encoded data of P (i) arrive at the video decoding device, respectively. In order not to underflow the reception buffer of the moving picture decoding apparatus, all the encoded data of P (i) must arrive at dt (i). That is, it is necessary that dt (i) ≧ ft (i) and dt (i−1) ≧ at (i) are satisfied.
各時刻での受信バッファの容量は、各時刻でのグラフ20とグラフ21との差分に対応する。例えば時刻dt(0)でのP(0)の瞬時復号後の受信バッファの容量は、符号25で示したビット量になる。
The capacity of the reception buffer at each time corresponds to the difference between the
図4は、1つのP(i)に着目した受信バッファの様子を示す図である。図4は、図3の一部を拡大して説明する。特に、図4に示す例では、ピクチャ単位で瞬時復号した場合に動画像復号装置の受信バッファがアンダーフローせず、かつat(i)及びft(i)が最も遅い時刻の場合、即ちdt(i)=ft(i)及びdt(i−1)=at(i)の場合を示している。図4に示す例では、グループ数Nは4とし、各グループに含まれるブロック数及び発生情報量、dgt(i,n+1)−dgt(i,n)は均一であるとする。 FIG. 4 is a diagram illustrating a state of the reception buffer focusing on one P (i). FIG. 4 is an enlarged view of a part of FIG. In particular, in the example shown in FIG. 4, when instantaneous decoding is performed in units of pictures, the reception buffer of the video decoding device does not underflow, and at (i) and ft (i) are the latest time, that is, dt ( i) = ft (i) and dt (i−1) = at (i). In the example shown in FIG. 4, it is assumed that the number of groups N is 4, and the number of blocks included in each group and the amount of generated information, dgt (i, n + 1) -dgt (i, n) are uniform.
図4に示すグラフ30は、動画像復号装置の受信バッファへの符号化データの到着量累積値を表す。グラフ31は、ピクチャ単位で瞬時復号した場合の、消費した符号化データの累積値である。
A
グラフ32は、dgt(i,n)にてP(i)のn番目のグループG(i,n)の瞬時復号を行った場合の、消費した符号化データの累積値である。
A
グループ分割方式は、各グループの発生情報量が、ピクチャ内で平均化されているということを前提にする。すわなち、P(i)の各グループにおける各ブロックの発生情報量の総和が、b(i)/Nとなるということである。b(i)は、P(i)の発生情報量とする。 The group division method is based on the premise that the amount of information generated in each group is averaged within a picture. In other words, the sum of the amount of generated information of each block in each group of P (i) is b (i) / N. b (i) is the generated information amount of P (i).
P(i)のグループ内の各ブロックの発生情報量の最小値は0であり、最大値はb(i)/Nとなる。P(i)内の各ブロックをdt(i−1)からdt(i)までの間で等間隔にて瞬時復号した場合、消費した符号化データの累積値グラフf(t)は、符号35〜38で示される四角形領域の内部に存在することになる。
The minimum value of the generated information amount of each block in the group P (i) is 0, and the maximum value is b (i) / N. When each block in P (i) is instantaneously decoded at equal intervals between dt (i−1) and dt (i), the cumulative value graph f (t) of the consumed encoded data is represented by
各ブロックの発生情報量が均一の場合、f(t)は、符号35〜38で示される四角形領域の左下頂点と右上頂点とを結ぶ直線(グラフ30と一致)となる。先頭ブロックでグループ全体のビット量が発生する場合には、f(t)は各四角形の左端線及び上端線をつないだ線となる。後者はバッファ遅延の観点で最悪の場合となる。
When the amount of information generated in each block is uniform, f (t) is a straight line (matching the graph 30) connecting the lower left vertex and the upper right vertex of the rectangular area indicated by
図4に示す例では、dt(i−1)からdt(i)までの時刻の間に、P(i)の各ブロックのビットが到着する。x番目のビット(x=[1,b(i)])の到着時刻g(x)は、以下の式で表される。 In the example shown in FIG. 4, the bits of each block of P (i) arrive during the time from dt (i−1) to dt (i). The arrival time g (x) of the xth bit (x = [1, b (i)]) is expressed by the following equation.
実際の動画像復号装置の挙動を鑑み、P(i)の各ブロックをdt(i−1)からdt(i)までの間で等間隔にて瞬時復号した場合を考える。ピクチャ内のブロック総数をMとした場合、P(i)内のm番目のブロックの理想瞬時復号時刻p(i,m)は、以下の式で表される。
Considering the actual behavior of the moving picture decoding apparatus, let us consider a case where each block of P (i) is instantaneously decoded at equal intervals between dt (i−1) and dt (i). When the total number of blocks in the picture is M, the ideal instantaneous decoding time p (i, m) of the mth block in P (i) is expressed by the following equation.
f(t)の形状によっては、f(t)がグラフ30よりも上側になる。つまり、f(p(i,m))<g(f(p(i,m)))となり、ブロックの復号に必要となる全てのビットが動画像復号装置の受信バッファに届かず、アンダーフローが発生する。各ブロックのビット量が均一の場合には、f(p(i,m))=g(f(p(i,m)))となりアンダーフローは発生しないが、バッファ遅延の観点で最悪のケースである。
Depending on the shape of f (t), f (t) is on the upper side of the
先頭ブロックでグループ全体のビット量が発生する場合には、先頭ブロックの復号に必要な全ビットの到着時刻がdgt(i,n+1)−dtg(i,n)だけ遅れることになる。 When the bit amount of the entire group is generated in the first block, the arrival time of all the bits necessary for decoding the first block is delayed by dgt (i, n + 1) −dtg (i, n).
グループ分割方式では、動画像復号装置がf(t)の形状を知ることができない。よって、G(i,n)の先頭ブロックのビット到着遅延が、最悪値であるdgt(i,n)−dgt(i,n−1)の場合になった場合でもアンダーフローの発生回避を保証するようにする。そうすると、G(i,n)内の全ブロックの瞬時復号時刻をdgt(i,n)まで遅くすることが要求される。すなわち、P(i)の先頭ブロックの復号開始時刻は、dgt(i,1)となり、従来技術には、コーデック遅延のさらなる軽減を行うことができないという1つ目の課題があった。 In the group division method, the moving picture decoding apparatus cannot know the shape of f (t). Therefore, even if the bit arrival delay of the first block of G (i, n) is the worst value dgt (i, n) -dgt (i, n-1), it is guaranteed that underflow will be avoided. To do. Then, it is required to delay the instantaneous decoding time of all the blocks in G (i, n) to dgt (i, n). That is, the decoding start time of the leading block of P (i) is dgt (i, 1), and the prior art has a first problem that the codec delay cannot be further reduced.
また、従来技術では、復号時間ct/Nで復号したのちに、瞬時に表示可能であることを仮定している。しかし、非特許文献1では、ピクチャを水平だけではなく、垂直に分割することも許すタイルと呼ばれる符号化方法が採用されている。そのため、復号時間ct/Nで復号したのちも、瞬時に表示可能ではない場合が存在する。瞬時に表示可能ではない場合の例を、図5を用いて説明する。
In the prior art, it is assumed that the image can be displayed instantaneously after decoding with the decoding time ct / N. However,
図5は、瞬時に表示可能ではない場合の一例を示す図である。非特許文献1において、ピクチャを水平だけでなく、垂直に分割したそれぞれの領域は、タイルと呼ばれる。図5に示す例では、ピクチャを4つのタイルに分割している。
FIG. 5 is a diagram illustrating an example of a case where display is not possible instantaneously. In
左上、右上、左下、右下の順番に、タイル0(t40)、タイル1(t41)、タイル2(t42)、タイル3(t43)とし、タイルはこの順番に処理される。 Tile 0 (t40), tile 1 (t41), tile 2 (t42), and tile 3 (t43) are arranged in the order of upper left, upper right, lower left, and lower right, and the tiles are processed in this order.
さらに、それぞれのタイルの内部で、複数ブロックを持ついくつかのグループを含む。図5に示す例では、グループ0から3までがs41〜s44で示されている。この時、復号は、グループの順番に処理され、sc41からsc42で示されるようなスキャン順又は復号順となる。
In addition, within each tile, several groups with multiple blocks are included. In the example shown in FIG. 5,
この復号順に対して、表示順は、ディスプレイによってはラスタスキャンである場合があり、そのとき、符号sc43で示されるような順番となる。この時、グループは復号処理が終わっても、瞬時に表示可能とはならない場合が存在する。 In contrast to this decoding order, the display order may be a raster scan depending on the display, and at this time, the order is as indicated by reference sign sc43. At this time, there is a case where the group cannot be displayed instantaneously even after the decoding process is completed.
例えば、グループ0(s41)の復号が終わった直後を考える。このとき、タイル0(t40)に含まれるピクチャ上段の左半分のCTB、例えばブロックb41、ブロックb42は、グループ0(s41)に属しているため表示可能である。しかし、タイル1(t41)に含まれるピクチャ上段の右半分に含まれているCTB、例えばブロックb45、ブロックb46はグループ2(s43)に属しているため、復号されておらず、従って表示可能ではない。 For example, consider immediately after decoding of group 0 (s41). At this time, the CTB in the upper left half of the picture included in tile 0 (t40), for example, block b41 and block b42, can be displayed because it belongs to group 0 (s41). However, since the CTB included in the upper right half of the picture included in tile 1 (t41), for example, block b45 and block b46 belong to group 2 (s43), they are not decoded, and therefore cannot be displayed. Absent.
ディスプレイがラスタスキャンである場合、画面左端から右端まで順番に表示するような構造になっているため、ピクチャ上段を表示しようとした時、グループ2(s43)に属するブロックも表示しなくてはならず、従って、グループ2(s43)が復号され、表示可能になるまで待つ必要がある。 When the display is a raster scan, it is structured to display in order from the left end to the right end of the screen. Therefore, when attempting to display the upper row of the picture, the blocks belonging to group 2 (s43) must also be displayed. Therefore, it is necessary to wait until group 2 (s43) is decoded and can be displayed.
グループ2(s43)の復号完了までに必要な時間は、スキャン順でsc41とsc42が通過するブロックがすべて復号された時間となる。 The time required to complete the decoding of group 2 (s43) is the time when all the blocks through which sc41 and sc42 pass in the scan order are decoded.
グループ分割方式においては、復号を早くすることはできるが、表示可能時刻に関して何も考慮していない。そのため、従来技術には、ピクチャが表示されることを保証するために、結局1ピクチャ分の時間を待つ必要があるという2つ目の課題があった。 In the group division method, decoding can be performed earlier, but nothing is considered regarding the displayable time. For this reason, the prior art has a second problem in that it is necessary to wait for a time corresponding to one picture in order to guarantee that a picture is displayed.
また、非特許文献1では、バッファに累積可能であるビット量よりも、ピクチャが複雑である場合など、ピクチャの復号に必要なビット量の方が大きいときの動作を規定している。
図6は、ピクチャの復号に必要なビット量の方が大きいときの動作を説明するための図である。動画像符号化装置は、図6に示すグラフ50のように決められたレート51で示されたレートRの累積を、ピクチャの引き抜きビット量の累積52を超えないように、符号量の調整を行う。 FIG. 6 is a diagram for explaining the operation when the amount of bits necessary for decoding a picture is larger. The moving image encoding apparatus adjusts the code amount so that the accumulation of the rate R indicated by the rate 51 determined as in the graph 50 shown in FIG. 6 does not exceed the accumulation 52 of the extracted bit amount of the picture. Do.
しかし、ピクチャが複雑であるなど、符号化に必要なビット量がバッファに累積しているビット量では足りず、アンダーフローを起こしてしまう場合がある。例えば、図6に示すグラフ53のような場合である。 However, the amount of bits required for encoding is not sufficient for the amount of bits accumulated in the buffer, for example, the picture is complex, and underflow may occur. For example, it is a case like the graph 53 shown in FIG.
アンダーフローを起こす時は、図6に示すグラフ54のように、復号装置は、そもそものピクチャの復号時刻dt(0)では復号を開始せず、復号に必要なビットがバッファに受信された時刻dt'に復号を実行する。 When underflow occurs, the decoding device does not start decoding at the decoding time dt (0) of the original picture, as shown in the graph 54 in FIG. 6, and the time when the bits necessary for decoding are received by the buffer. Perform decryption on dt ′.
そして、一般的に、遅延したピクチャの表示タイミングは、本来その次のピクチャが表示されるべきタイミングdt(1)となる。そして、本来dt(1)の時刻に表示されるべきピクチャは、復号は行われるが表示はスキップされる。 In general, the display timing of the delayed picture is the timing dt (1) at which the next picture should be displayed. The picture that should originally be displayed at the time of dt (1) is decoded but skipped.
しかし、非特許文献1において、グループ単位でアンダーフローが発生した場合の規定については、明確に定義されていないという3つ目の課題があった。
However, in
そこで、以下に開示の技術は、上記2つ目の課題を少なくとも解決すべく、1ピクチャ時間未満のコーデック遅延を実現する際、さらなる低遅延化を実現することができる動画像符号化装置、動画像符号化方法、動画像復号装置及び動画像復号方法を提供することを目的とする。 Therefore, the technique disclosed below is a moving picture encoding apparatus, moving image, which can realize further lower delay when realizing a codec delay of less than one picture time in order to solve at least the second problem. An object is to provide an image encoding method, a moving image decoding apparatus, and a moving image decoding method.
開示の一態様における動画像符号化方法は、動画像データに含まれる各ピクチャが分割された各ブロックの符号化データを示す入力ストリームを復号する動画像復号方法であって、前記入力ストリームから符号化された各ブロックのデータを取得して復号し、前記各ブロックの復号ブロックをフレームメモリに保存し、前記入力ストリームから、ピクチャを構成する各ブロックがピクチャを所定単位に分割したグループのどのグループに属するかを示すグループ情報を抽出し、前記入力ストリームからピクチャを所定単位に分割した際の分割形状に伴うグループの出力遅延を含むグループ出力遅延情報を抽出し、前記グループ情報と前記グループ出力遅延情報とに基づき前記ピクチャの先頭グループの出力時刻を算出し、前記出力時刻になると、復号された出力対象のピクチャに属するグループの各ブロックの復号データを順に出力し、前記復号の際に、前記グループ単位にアンダーフローの発生を検知し、前記ピクチャの先頭グループの出力時刻に、当該ピクチャを構成するグループにおいてアンダーフローが検知されている場合には、当該ピクチャの代りに前記フレームメモリに保存された別の復号ブロックを出力する処理をコンピュータが実行する。 A moving image encoding method according to an aspect of the disclosure is a moving image decoding method for decoding an input stream indicating encoded data of each block obtained by dividing each picture included in the moving image data, wherein the encoding is performed from the input stream. Which group of blocks in which each block constituting the picture is divided into predetermined units from the input stream, the decoded block of each block is acquired and decoded in a frame memory Group information indicating whether it belongs to a group, and extracting group output delay information including a group output delay associated with a division shape when a picture is divided into predetermined units from the input stream, and the group information and the group output delay The output time of the first group of the picture is calculated based on the information and becomes the output time , Sequentially output the decoded data of each block of the group belonging to the decoded output target picture, during the decoding, detecting the occurrence of underflow in the group unit, at the output time of the first group of the picture, When underflow is detected in the group constituting the picture, the computer executes a process of outputting another decoded block stored in the frame memory instead of the picture.
開示の技術によれば、1ピクチャ時間未満のコーデック遅延を実現する際、さらなる低遅延化を実現することができる。 According to the disclosed technique, when a codec delay of less than one picture time is realized, a further reduction in delay can be realized.
以下、添付図面を参照しながら各実施例について詳細に説明する。実施例で説明する動画像符号化装置は、動画像データに含まれる各ピクチャをグループ単位で符号化し、符号化データとしてビットストリームを出力する。 Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. The moving image encoding apparatus described in the embodiment encodes each picture included in moving image data in units of groups, and outputs a bit stream as encoded data.
なお、ピクチャは、フレーム又はフィールドの何れであってもよい。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。 The picture may be either a frame or a field. The frame is one still image in the moving image data, while the field is a still image obtained by extracting only odd-numbered data or even-numbered data from the frame.
また、符号化対象の動画像は、カラー動画像であってもよく、又はモノクロ動画像であってもよい。 The moving image to be encoded may be a color moving image or a monochrome moving image.
[実施例1]
<構成>
図7は、実施例1による動画像符号化装置100の概略構成の一例を示すブロック図である。動画像符号化装置100は、符号化処理部110と、符号量制御部120と、グループ決定部130と、復号時刻決定部140と、出力時刻決定部150とを有する。
[Example 1]
<Configuration>
FIG. 7 is a block diagram illustrating an example of a schematic configuration of the
符号化処理部110は、直交変換部111と、量子化部112と、エントロピー符号化部113とを有する。
The
符号量制御部120は、量子化値算出部121と、バッファ占有量算出部122と、ビットカウンタ123とを有する。
The code
符号量制御部120は、グループに含まれるすべてのブロックの出力に必要なデータが、出力遅延時間で示される出力時刻までに復号装置の復号バッファに到達し、復号が完了するように符号量を制御する。
The code
グループ決定部130は、グループ構成決定部131と、グループ情報付加部132とを有する。
The
復号時刻決定部140は、グループ復号時刻算出部141と、グループ復号遅延決定部142と、グループ復号遅延情報付加部153とを有する。
The decoding
出力時刻決定部150は、グループ出力時刻算出部151と、グループ出力遅延決定部152と、グループ出力遅延情報付加部152とを有する。
The output
動画像符号化装置100が有するこれらの各部は、それぞれ、別個の回路として動画像符号化装置100に実装される。あるいは、動画像符号化装置100が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像符号化装置100に実装されてもよい。あるいはまた、動画像符号化装置100が有するこれらの各部は、動画像符号化装置100が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
Each of these units included in the
動画像データに含まれる符号化対象ピクチャは、図示しない制御部によりブロック単位に分割され、ブロックごとに直交変換部111に入力される。各ブロックは、例えば、16×16画素を有する。 The encoding target picture included in the moving image data is divided into blocks by a control unit (not shown), and is input to the orthogonal transform unit 111 for each block. Each block has, for example, 16 × 16 pixels.
直交変換部111は、図示しないフレームメモリに蓄積された局所復号済ピクチャからイントラ予測値もしくはインター予測値を算出し、入力ブロックとの差分演算を行いブロック予測誤差を算出する。更にブロック予測誤差に対し直交変換を行う。 The orthogonal transform unit 111 calculates an intra prediction value or an inter prediction value from a locally decoded picture stored in a frame memory (not shown), calculates a difference from the input block, and calculates a block prediction error. Further, orthogonal transformation is performed on the block prediction error.
量子化部112は、直交変換したブロック予測誤差に対し量子化演算を行う。量子化演算における量子化パラメータ(制御情報)は、量子化値算出部121から与えられる。この結果である、量子化直交変換係数、及びイントラ予測もしくはインター予測のパラメータ(イントラ予測方向、動きベクトル情報等)は、ブロック圧縮データとしてエントロピー符号化部113に出力される。量子化された直交変換係数は、図示しない局所復号部により、逆量子化・逆直交変換を行った後、イントラ予測値もしくはインター予測値を加算して局所復号ブロックを生成後、図示しないフレームメモリに蓄積する。
The
エントロピー符号化部113は、量子化部112から出力されるブロック圧縮データに対しエントロピー符号化を行う。
The
量子化値算出部121は、バッファ占有量算出部122から出力される、理想復号装置の受信バッファの状態及び次に符号化するブロックの発生情報量上限とから各ブロックの量子化値を計算する。
The quantization
バッファ占有量算出部122は、ビットカウンタ123から出力される、符号化データのビット量累積値と、グループ構成決定部131から出力されるグループ情報、グループ復号遅延決定部142から出力されるグループの復号時刻及びグループの復号遅延から、理想復号装置の受信バッファの状態及び次に符号化するブロックの発生情報量上限を計算する。
The buffer occupancy
ビットカウンタ123は、エントロピー符号化部113の出力ビット数をカウントし、符号化データの累積値を出力する。
The bit counter 123 counts the number of output bits of the
グループ構成決定部131は、複数のブロックに対し、各ブロックが属するグループを決定する。グループ構成決定部131は、例えば符号化処理中のブロックが属するグループを、図示しない制御部から受け取ったブロックカウント情報と図示しない制御部より受け取った符号化方法指定情報とを用いて所定方法に従って決定する。
The group
ブロックカウント情報は、ピクチャに含まれる各ブロックの番号を表す情報であり、例えば、ピクチャの左上端のブロックに対する番号が1に設定され、ラスタスキャン順に従って各ブロックに番号が割り当てられる。そして、ピクチャの右下端のブロックに対して、最大の番号が割り当てられる。なお、ブロックカウント情報は、他の順序に従って各ブロックに割り当てられた番号を含んでもよい。 The block count information is information indicating the number of each block included in the picture. For example, the number for the upper left block of the picture is set to 1, and a number is assigned to each block according to the raster scan order. The largest number is assigned to the block at the lower right corner of the picture. The block count information may include a number assigned to each block according to another order.
グループ構成決定部131は、グループ毎の復号処理時間を均等化するために、各グループに含まれるブロックの数が出来る限り等しくなるように複数のグループを決定することが好ましい。
The group
例えば、グループ構成決定部131は、ブロックライン単位で各ブロックをグループに分割すれば、任意のピクチャサイズにおいて各グループに含まれるブロックの数を等しくすることができる。
For example, if the group
例えば、ピクチャサイズが、高精細度テレビジョン放送(High Definition Television、HDTV)相当の1920画素×1088画素であり、ブロックサイズが16画素×16画素であれば、ブロックライン数は68である。したがって、この場合、符号化対象ピクチャに含まれる各ブロックは、68個のグループの何れかに分類される。 For example, if the picture size is 1920 pixels × 1088 pixels equivalent to high definition television broadcasting (HDTV), and the block size is 16 pixels × 16 pixels, the number of block lines is 68. Therefore, in this case, each block included in the encoding target picture is classified into one of 68 groups.
グループに含まれるブロックの数は、1から画面全体のブロック数までの間の値に設定しても良い。 The number of blocks included in the group may be set to a value between 1 and the number of blocks in the entire screen.
グループ構成決定部131は、符号化対象ブロックが属するグループの識別情報をバッファ占有量算出部122へ通知する。グループ構成決定部131は、各グループに含まれるブロックの情報をグループ復号時刻算出部141とグループ出力時刻算出部151へ通知する。なお、グループ構成決定部131は、各グループの先頭に位置するブロックのインデックスをグループ復号時刻算出部141とグループ出力時刻算出部151へ通知してもよい。
The group
グループ情報付加部132は、ピクチャ内のグループ数と各グループ内のブロック情報とを示すグループ情報を符号化データに付加する。
The group
グループ復号時刻算出部141は、グループ構成決定部131から出力されるグループ情報から各グループの復号時刻を算出し、グループ復号遅延決定部142に通知する。
The group decoding
グループ復号遅延決定部142は、各グループの復号遅延を決定し、各グループの復号時刻と共にバッファ占有量算出部122とグループ復号遅延情報付加部143とに通知する。決定された復号遅延は、遅延情報として通知される。
The group decoding
グループ復号遅延情報付加部143は、グループの復号時刻と復号遅延とを受け取り、グループ復号遅延情報として符号化データに付加する。
Group decoding delay
グループ出力時刻算出部151は、図示しない制御部より受け取った符号化方法指定情報と、グループ構成決定部131から出力されるグループ情報より、各グループの出力時刻(表示時刻とも呼ぶ)を算出し、出力時刻情報をグループ出力遅延決定部152へ通知する。
The group output
グループ出力遅延決定部152は、各グループの出力時刻から、各グループの出力遅延を決定し、出力遅延情報をグループ出力遅延情報付加部153へ通知する。
The group output
グループ出力遅延情報付加部153は、各グループの出力時刻と出力遅延とを受け取り、グループ毎の復号時刻からの出力遅延時間をグループ出力遅延情報として符号化データに付加する。
The group output delay
≪復号遅延≫
i番目のピクチャP(i)内の各ブロックをdt(i−1)からdt(i)までの間で等間隔にて瞬時復号した場合を考える。この場合、消費した符号化データの累積値グラフf(t)は、ブロック当たりの情報量の下限・上限を設定する等の適切なレート制御により、ブロック伝送遅延を小さくすることが可能である。また、この情報を動画像復号装置に通知することで、ブロックの復号開始最早時刻を更に早めることが可能である。図8を用いて説明する。
<< Decoding delay >>
Consider a case where each block in the i-th picture P (i) is instantaneously decoded at equal intervals from dt (i−1) to dt (i). In this case, the accumulated value graph f (t) of the consumed encoded data can reduce the block transmission delay by appropriate rate control such as setting the lower limit / upper limit of the information amount per block. In addition, by notifying this information to the video decoding device, it is possible to further advance the earliest decoding start time of the block. This will be described with reference to FIG.
図8は、P(i)に着目した場合の符号化データの累積値を表す図である。グラフ60は、レートがRである符号化データの到着量累積値である。グラフ61は、ピクチャ単位で瞬時復号した場合の消費した符号化データの累積値である。
FIG. 8 is a diagram illustrating a cumulative value of encoded data when attention is paid to P (i). The
符号62〜66は、符号67〜71で表される各グループ(G0〜G4)にて復号のために消費した符号化データの累積値である。
Reference numerals 62 to 66 are cumulative values of encoded data consumed for decoding in the groups (G0 to G4) represented by
各グループの存在範囲とグラフ60との関係を見ると、G(1)〜G(4)においては、常にレートが符号化データの累積値より上であるため、G(1)〜G(4)の各ブロックの瞬時復号をdt(i−1)からdgt(i,1)の間で等間隔に行った場合でもアンダーフローは発生しない。
Looking at the relationship between the existence range of each group and the
G(0)においては、G(0)の符号化データの累積値がレートを超えてしまうため、アンダーフローが発生する。このアンダーフローを回避するためには、符号化データの累積値がレートを超えなければよく、その最小値は間隔Δtとなる。 In G (0), since the accumulated value of the encoded data of G (0) exceeds the rate, underflow occurs. In order to avoid this underflow, it is sufficient that the accumulated value of the encoded data does not exceed the rate, and the minimum value is the interval Δt.
Δtは、どのグループで発生してもdgt(i,n)−dgt(i,n−1)よりも小さくなる。動画像復号装置は、P(i)における、それぞれのグループのΔtの最大値を用いて、P(i)の先頭ブロックの復号開始時刻をdt(i−1)+Δt(i)とすることで、全ブロックをアンダーフローすることなく、等間隔で瞬時復号することが出来る。 Δt is smaller than dgt (i, n) −dgt (i, n−1) regardless of which group is generated. The moving picture decoding apparatus uses the maximum value of Δt of each group in P (i) and sets the decoding start time of the first block of P (i) to dt (i−1) + Δt (i). , Instantaneous decoding can be performed at equal intervals without underflowing all blocks.
シーケンス全体では、全ピクチャのΔt(i)の最大値Δtから、最初のピクチャの先頭ブロック復号開始時刻dinitを以下の式のようにすることで、全ピクチャの全ブロックをアンダーフローすることなく、等間隔で瞬時復号することが出来る。 In the entire sequence, from the maximum value Δt of Δt (i) of all pictures, the start block decoding start time dinit of the first picture is made as shown in the following formula without underflowing all blocks of all pictures: Instantaneous decoding can be performed at equal intervals.
またP(i)内でn番目のグループの復号開始が可能となる時刻の最早値r(i,n)は、以下の式で表される。
Further, the earliest value r (i, n) at which decoding of the nth group can be started within P (i) is expressed by the following equation.
動画像符号化装置にて、Δtがdgt(i,n)−dgt(i,n−1)より小さい値になるように各ピクチャ、各グループの発生情報量を制御し、Δtの値を明示的に動画像復号装置に伝送する。動画像復号装置にて、グループG(i,n)の瞬時復号時刻をr(i, n)とすることで、確実に各ブロックの復号開始時刻を保証することができる。
In the moving picture coding apparatus, the amount of generated information for each picture and each group is controlled so that Δt becomes a value smaller than dgt (i, n) −dgt (i, n−1), and the value of Δt is clearly indicated. To the video decoding device. By setting the instantaneous decoding time of the group G (i, n) to r (i, n) in the video decoding device, the decoding start time of each block can be reliably guaranteed.
動画像復号装置側のグループは、動画像符号化装置から通知されたグループと必ずしも一致しなくても良い。動画像復号装置側のグループが、動画像符号化装置から通知されたグループと一致する場合には、r(i,n)=dgt(i,n)となる。 The group on the video decoding device side does not necessarily match the group notified from the video encoding device. When the group on the video decoding device side matches the group notified from the video encoding device, r (i, n) = dgt (i, n).
≪表示遅延≫
対象とするグループの表示遅延を明示的に付加拡張情報とすることで、復号装置の方に最も早い表示タイミングを通知することができ、表示遅延を最小のものとすることができる。例えば、図5に示すようなタイル分割かつグループ分割であった場合の表示遅延の指定方法を図5と図9を用いて説明をする。
≪Display delay≫
By explicitly setting the display delay of the target group as additional extension information, it is possible to notify the decoding device of the earliest display timing and to minimize the display delay. For example, a display delay designation method in the case of tile division and group division as shown in FIG. 5 will be described with reference to FIGS.
図5に示す場合、最も表示遅延が大きくなるのは、グループ0(s41)の最上段の表示である。グループ0(s41)の最上段の表示を開始するためには、少なくともグループ2(s43)のピクチャ最上段の画素値の復号が終わっている必要がある。そこで、表示遅延を明示的に付加拡張情報として通知する。 In the case shown in FIG. 5, the display with the largest display delay is the uppermost display of group 0 (s41). In order to start the display of the uppermost row of group 0 (s41), it is necessary that at least the decoding of the pixel values of the uppermost row of pictures of group 2 (s43) has been completed. Therefore, the display delay is explicitly notified as additional extension information.
図9は、表示遅延を説明するための図である。グループ0(s41)の最上段の表示が可能になる時刻を図9に示すogt(0)とする。ogt(0)はグループ2の引き抜き時刻dgt(2)よりも、その復号にかかる時間が遅く設定されている。この時の表示時刻は、ピクチャの復号がある一定の速さで行われるとして、以下の式であらわされる。
ogt(0)=dgt(0)+(dgt(2)−dgt(1))+l/L(dgt(3)−dgt(2)) ・・・式(5)
Lはs43で表されるグループ2内の垂直方向の総ライン数、lはs43で表されるグループ2内でピクチャ右上端が何ライン目かを表す。l/L(dgt(3)−dgt(2))は、グループを復号するために、1グループ時間かかると仮定したとき、s43で表されるグループ2のピクチャ右上端の復号が完了する時刻を表す。
FIG. 9 is a diagram for explaining display delay. The time when the uppermost display of the group 0 (s41) becomes possible is ogt (0) shown in FIG. ogt (0) is set later than the
ogt (0) = dgt (0) + (dgt (2) −dgt (1)) + 1 / L (dgt (3) −dgt (2)) (5)
L represents the total number of lines in the vertical direction in the
つまり、表示可能時刻は、s41で表されるグループ0の復号時刻dgt(0)に対し、s41で表されるグループ0の瞬時復号時刻からs43で表されるグループ2の瞬時復号時刻までの時間を足す。さらに、表示可能時刻は、グループ2のピクチャ右上端の復号が完了するまでに実際にかかる時間を足したものである。
That is, the displayable time is the time from the instantaneous decoding time of
動画像符号化装置側では、上式で表される時間を明示的に付加拡張情報として送信することで、復号装置側に、実復号時間も考慮した適切な時刻を通知することが可能になり、遅延の少ない表示を保証することができる。 On the video encoding device side, it is possible to notify the decoding device side of an appropriate time considering the actual decoding time by explicitly transmitting the time represented by the above formula as additional extension information. Can guarantee a display with little delay.
また、上記の例で、表示時刻の内のグループ2のピクチャ右上端の復号が完了する時刻の部分を、s43で表されるグループ2全ての復号が実際に完了する時間dgt(3)−dgt(2)としても、1ピクチャの復号が完了した時刻を表示可能時刻とするよりも早い時刻を通知することができるため、遅延の少ない表示を保証することができる。
In the above example, the time at which the decoding of the upper right end of the picture of the
≪復号時刻の算出≫
実施例1におけるグループ復号時刻情報の算出方法を説明する。以降の説明は、符号化対象ピクチャに含まれる総ブロック数をMとする。
<< Decoding time calculation >>
A method for calculating group decoding time information in the first embodiment will be described. In the following explanation, M is the total number of blocks included in the current picture.
グループ復号時刻算出部141は、まず、符号化順番でi番目のピクチャP(i)の入力時刻t(i)から所定の遅延時間dly分遅延させたP(i)の復号時刻dt(i){=t(i)+dly}に基づいて、ピクチャP(i)のn番目のグループG(i,n)が復号される時刻を表す復号時刻dgt(i,n)を算出する。または、グループ復号時刻算出部141は、復号時刻として、dgt(i,n)の代わりに、dgt(i,n)と等価な{dgt(i,n)−dgt(i,n−1)}を算出してもよい。また、グループ復号時刻算出部141は復号時刻を適当な単位、例えば1/90000秒単位の倍数となるように丸めてもよい。
First, the group decoding
グループ復号時刻算出部141は、各グループの復号時刻を、各グループに含まれる各ブロックの復号処理に要する時間を均等とするために、1ピクチャ当たりの復号処理に要する時間をグループ数Nで等分割するように決定する。この場合、G(i,n)(n=1,2,...,N)の復号時刻dgt(i,n)は、次式に従って算出される。
The group decoding
なお、dt(i)はP(i)の復号時刻である。d(i+1)−d(i)はiによらず一定であり、以降sと表現する。
Note that dt (i) is the decoding time of P (i). d (i + 1) -d (i) is constant regardless of i, and is hereinafter expressed as s.
さらにグループ復号時刻算出部141は、2番目以降に符号化・復号されるグループの復号時刻dgt(i,n)(n≧2)を、次式のように決定してもよい。
Furthermore, the group decoding
さらに、グループ復号時刻決定部141は、2番目以降に符号化・復号されるグループの復号時刻dgt(i,n)(n≧2)を、次式のように決定してもよい。
Further, the group decoding
グループ復号遅延決定部142は、ピクチャ全体のブロック遅延最大値Δtを符号化開始前に決定する。Δtは次式で表される範囲の値にする。
The group decoding
バッファ占有量算出部122は、理想復号装置の受信バッファのバッファ占有量、及び次に符号化するブロックの発生情報量上限を、以下のように計算する。
The buffer
図10は、P(i)の符号化処理における、理想復号装置の受信バッファに到着した符号化データのビット量の累積値と、P(i)内の各ブロックでの発生情報量の累積値との関係を示す図である。 FIG. 10 shows the accumulated value of the bit amount of the encoded data arriving at the reception buffer of the ideal decoding device and the accumulated value of the generated information amount in each block in P (i) in the encoding process of P (i). It is a figure which shows the relationship.
グラフ72は、理想復号装置の受信バッファに到着した符号化データのビット量の累積値R(t)である。グラフ75は、グラフ72をΔtだけ左にずらしたものであり、R´(t)とする。R´(t)=R(t+Δt)の関係がある。
A
図10に示すB(i)は、P(0)からP(i)までの発生符号化データの累積値を表す。b(i)はP(i)全体の発生情報量を表し、B(i)−B(i−1)と同じである。 B (i) shown in FIG. 10 represents the accumulated value of the generated encoded data from P (0) to P (i). b (i) represents the generated information amount of the entire P (i) and is the same as B (i) -B (i-1).
グラフ73は、時刻dt(i−1)での値がB(i−1)、時刻dt(i)での値がB(i)であり、傾きがb(i)/sとなる直線V(t)である。sは1ピクチャ時間であり、dt(i)−dt(i−1)と同じである。
The
グラフ73は、時刻dt(i−1)からdt(i)までの間に、各ブロックを均等間隔で復号化し、また発生情報量が等しくb(i)/Mとなる場合の、ブロック単位の符号化データの消費曲線f(t)に相当する。
The
グラフ74は、実際のブロック単位の符号化データの消費曲線f(t)であり、点77は、m番目のブロックまで復号した場合のブロック単位の符号化データの消費量累積値である。
A graph 74 is an actual consumption data f (t) of the block-unit encoded data, and a
理想復号装置が、グループ復号時刻情報から算出されるグループ復号開始早時刻r(i,n)にグループnを復号したときに受信バッファのアンダーフローを生じさせないためには、以下の条件を満たす必要がある。量子化値算出部121は、常に以下の条件が満たされるように量子化値を算出する。
In order for the ideal decoding apparatus not to cause an underflow of the reception buffer when the group n is decoded at the group decoding start early time r (i, n) calculated from the group decoding time information, the following conditions must be satisfied: There is. The quantized
領域76は、f(t)が、時刻dtg(i,u−1)からdtg(i,u)までの間で取ることが許される範囲を示す。
A
≪量子化値算出≫
量子化値算出部121における、ブロックmの量子化値算出方法を以下に説明する。実施例1では、各グループに含まれるブロック数は等しくM/Nとしている。
≪Quantization value calculation≫
The quantization value calculation method of the block m in the quantization
ブロックmが属するn番目のグループG(i,n)の先頭ブロックの処理を開始するに当たり、G(i,n)の目標情報量T(i,n)を以下の式に従い計算する。ここでn=Ceil(m*N/M)である。 In starting the processing of the first block of the nth group G (i, n) to which the block m belongs, the target information amount T (i, n) of G (i, n) is calculated according to the following equation. Here, n = Ceil (m * N / M).
T(i)はP(i)全体の目標情報量であり、T'(i,n)はG(i,n)の実発生情報量である。T(i)は、公知の方式を用いて、P(0)からP(i−1)までの実発生情報量の総和によって決定される。
T (i) is the target information amount of the entire P (i), and T ′ (i, n) is the actual generated information amount of G (i, n). T (i) is determined by the sum total of the actual amount of information generated from P (0) to P (i-1) using a known method.
量子化値算出部121は例えば、MPEG−2における標準化団体参照ソフトウェアTest Model5(非特許文献2を参照)における量子化値算出方法に従い、G(i,n)の実発生情報量がT(i,n)に近づくように量子化値を算出する。
For example, according to the quantization value calculation method in the standardization organization reference software Test Model 5 (see Non-Patent Document 2) in MPEG-2, the quantization
次に量子化値算出部121は、G(i,n)全体の符号化処理が終了した時のP(i)内の発生情報量累積値の期待値b'(i,n)と、n番目のグループをエントロピー符号化する前のP(i)内の発生情報量累積値B(i,n−1)との差d1を所定の閾値DTH1と比較する。
Next, the quantized
b'(i,n)は以下の式で計算される。 b ′ (i, n) is calculated by the following equation.
閾値DTH1は、次式で表される。
The threshold value DTH1 is expressed by the following equation.
b0は量子化値をその取り得る値の範囲のうちの最大値とした場合に、各ブロックで発生する最大の符号量である。((M/N)−m)は、G(i,m)で符号化処理が終わっていないブロック数に相当する。offsetはマージン項である。
b0 is the maximum code amount generated in each block when the quantized value is the maximum value in the range of possible values. ((M / N) -m) corresponds to the number of blocks in G (i, m) that have not been encoded. offset is a margin term.
d1<DTH1となる場合には、量子化値算出部121は、量子化値を最大値とする。
When d1 <DTH1, the quantized
なおb0は、周波数係数を全て0としたときのブロックの符号量を用いても良い。d1<DTH1となる場合には、量子化値算出部121は、符号化対象ブロックの全ての周波数係数が0に量子化されるように量子化値を決定する。この制御により、グループ内の符号化処理が済んでいない残りブロックの符号量の平均値がb0を超えなければ、T(i,n)≧T'(i,n)、即ちf(dtg(i,n))≦V(dtg(i,n))が保証される。そして理想復号装置の受信バッファがアンダーフローしないことが保証される。
For b0, the code amount of the block when the frequency coefficients are all 0 may be used. When d1 <DTH1, the quantization
以上により、量子化値算出部121は、動画像符号化装置100からの出力ストリームを実際に所定のレートRに従って動画像復号装置へ伝送すれば、動画像復号装置の受信バッファがアンダーフローしないように動画像データの符号量を制御することが可能となる。
As described above, if the quantization
量子化値算出部121は、求めた量子化値を量子化部112へ通知する。
The quantization
以上のように、グループ単位にバッファ制御を行い、かつ、グループ符号化遅延を付加することで、オーバーフローまたはアンダーフローを起こすことがなく、適切にバッファ遅延を小さくすることができる。 As described above, by performing buffer control for each group and adding a group coding delay, it is possible to appropriately reduce the buffer delay without causing overflow or underflow.
≪出力時刻算出≫
次に、実施例1における、グループ出力時刻情報の算出方法について説明する。図11は、グループ出力時刻情報の算出を説明するための図である。
≪Output time calculation≫
Next, a method for calculating group output time information in the first embodiment will be described. FIG. 11 is a diagram for explaining calculation of group output time information.
以降の説明は、符号化対象ピクチャに含まれる総ブロック数をMとする。また、ピクチャの幅と高さ、タイルの幅と高さ、CTBの幅と高さをそれぞれ(widthp,heightp)、(widtht,heightt)、(widthc,heightc)とする。ここで、すべてのタイル(t80〜t83)のサイズは等しく、タイルはラスタスキャン順sc83に処理されるとする。つまり、図11に示す例では、タイル0(t80)、タイル1(t81)、タイル2(t82)、タイル3(t83)の順番に処理される。 In the following explanation, M is the total number of blocks included in the current picture. Also, let the width and height of the picture, the width and height of the tile, and the width and height of the CTB be (widthp, heightp), (widthth, heightt), and (widthc, heightc), respectively. Here, it is assumed that all the tiles (t80 to t83) have the same size, and the tiles are processed in the raster scan order sc83. That is, in the example shown in FIG. 11, the processing is performed in the order of tile 0 (t80), tile 1 (t81), tile 2 (t82), and tile 3 (t83).
さらに、図11に示す例では、グループは17個のCTBを持つとし、すべてのグループで、CTBの個数は等しいとする。この時、グループ0(s81)はピクチャ内のCTBのインデックス0から3列目の4行目までとなる。
Furthermore, in the example shown in FIG. 11, it is assumed that a group has 17 CTBs, and the number of CTBs is the same in all groups. At this time, the group 0 (s81) is from the
このように考えると右上のタイル1(t81)の最上段のCTB列は、グループ2(s83)に含まれることになる。そのため、ディスプレイがラスタスキャン順に表示される場合、少なくとも、グループ0(s81)はグループ2(s83)が復号されたのちにしか表示することは出来ない。 In this way, the uppermost CTB column of the upper right tile 1 (t81) is included in the group 2 (s83). Therefore, when the display is displayed in raster scan order, at least group 0 (s81) can be displayed only after group 2 (s83) is decoded.
グループ2(s83)が復号されたのち表示する場合、まず、瞬時復号であることを仮定し、グループkの引き抜きタイミングをd(k)とすれば、グループ0(s81)の出力時刻ogt(0)は次式のように表される。 When the group 2 (s83) is displayed after being decoded, first, assuming that the decoding is instantaneous decoding and the extraction timing of the group k is d (k), the output time ogt (0) of the group 0 (s81) ) Is expressed as:
また、復号に1ピクチャ時間sかかり、ピクチャ内のグループの数をNとする場合、グループの復号に必要な時間は、s/Nとなる。つまり、瞬時復号時の復号時刻dgtを利用すると、グループ2の復号が完了する時刻dgt'(2)とグループ0(s81)の表示時刻ogt(0)は次式のように表される。
In addition, when decoding takes one picture time s and the number of groups in a picture is N, the time required for decoding a group is s / N. That is, when the decoding time dgt at the time of instantaneous decoding is used, the time dgt ′ (2) when the decoding of the
ここで、動画像符号化装置100は、前復号ピクチャの復号時刻より、グループの出力時刻を減算した出力遅延時間を復号装置に通知することで、復号装置側において、表示時刻を保証することが出来る。
Here, the moving
また、非特許文献1で開示されるHEVCにおけるデブロッキングフィルタのような、ポストフィルタにおいても、当該グループを表示するために、当該グループに後に復号されるグループの復号を待たなければならない場合が存在する。その様な場合でも、後に復号されるグループの復号時刻を考慮し、適切に表示遅延を設定してやることで、1ピクチャ時間未満の表示遅延を達成することが可能である。
In addition, even in a post filter such as a deblocking filter in HEVC disclosed in
≪出力ストリーム≫
動画像符号化装置100は、動画像復号装置と、各ブロックが属するグループ、グループ復号遅延、及びグループ出力遅延を共有するために、少なくとも、各グループに属するブロックを表すグループ情報、グループ復号遅延情報、及びグループ出力遅延情報を出力データストリームに付加して、動画像復号装置へ通知する。出力データストリームは、単に出力ストリームとも呼ぶ。
<< Output stream >>
In order to share the group to which each block belongs, the group decoding delay, and the group output delay with the moving picture decoding apparatus, the moving
そこで、グループ復号遅延情報付加部143は、例えば、グループ復号遅延を、各ピクチャもしくは所定のピクチャ間隔で、出力データストリームのヘッダ情報に付加する。
Therefore, the group decoding delay
また、グループ出力遅延情報付加部153は、例えばグループ出力遅延を、各ピクチャもしくは所定のピクチャ間隔で、出力データストリームのヘッダ情報に付加する。
Further, the group output delay
また、グループ情報付加部132は、例えばグループ情報を、各ピクチャもしくは所定のピクチャ間隔で、出力データストリームのヘッダ情報に付加する。
Further, the group
ヘッダ情報は、例えば、MPEG−2に規定される、シーケンスヘッダー(Sequence Header)、またはH.264に規定されるシーケンスパラメータセット(Sequence Parameter Set)若しくはSupplemental Enhancement Informationとすることができる。なお、グループごとの復号時刻は、MPEG−2に規定されるピクチャヘッダー(Picture Header)、またはH.264に規定されるスライスヘッダー(Slice Header)など、各ピクチャに必ず付随されるヘッダ情報に付加されてもよい。 The header information is, for example, a sequence header defined in MPEG-2, or H.264. H.264 can be used as a sequence parameter set or supplemental enhancement information. The decoding time for each group is a picture header (Picture Header) defined in MPEG-2 or H.264. It may be added to header information that is always attached to each picture, such as a slice header defined in H.264.
各グループに含まれるブロックの数が等しくなるようにグループが決定されている場合、動画像符号化装置100は動画像復号装置へ全ブロックがN個のグループに等分割されたことを通知する。そのために、グループ構成決定部131から、グループ情報付加部132に、グループ情報としてグループ数Nが通知される。
When the groups are determined so that the number of blocks included in each group is equal, the moving
グループ情報付加部132は、そのグループ情報を符号化する。MPEG−2及びH.264では、マクロブロックと呼ばれる16x16画素のブロック単位で符号化が行われており、このブロック数は通常20bitで表現可能な範囲を超えない。グループの数Nの最大値は、せいぜいブロック数の最大値と等しいことから、Nの符号化も固定bit長で符号化すればよい。
The group
また、各グループに含まれるブロックの数が等しいと限らない場合、グループ構成決定部131からグループ情報付加部132に対して、グループ数Nとともに、各グループの先頭ブロックのインデックス情報がグループ情報として通知される。
If the number of blocks included in each group is not necessarily equal, the group
グループ情報付加部132は、まず、グループ数Nを符号化し、順次各グループの先頭ブロックのインデックス情報を符号化する。先頭ブロックのインデックス情報に対する符号化方法も、例えば、固定bit長の符号化方式が用いられる。また、グループ情報付加部132は、グループ数N及び各グループの先頭ブロックのインデックス情報を符号化するために、ハフマン符号といった可変長符号化方式など、他の符号化方式を用いてもよい。
First, the group
<動作>
次に、実施例1における動画像符号化装置100の動作について説明する。図12は、実施例1における動画像符号化処理の一例を示すフローチャートである。
<Operation>
Next, the operation of the moving
ステップS100で、シーケンスの符号化動作開始に当たり、まずグループ復号遅延Δtが決定される。Δtは、シーケンス内にて内包するブロック数が最小となるグループの時間より小さくなるように決定される。 In step S100, the group decoding delay Δt is first determined at the start of the sequence encoding operation. Δt is determined to be smaller than the time of the group in which the number of blocks included in the sequence is minimum.
ステップS101で、グループ復号遅延情報付加部143は、グループ情報、グループ復号時刻遅延情報をデータストリームに付加する。
In step S101, the group decoding delay
ステップS102で、グループ構成決定部131は、各ピクチャの符号化開始に当たり、まずピクチャ内のグループを決定する。シーケンス内の各ピクチャにおけるグループ数及び各グループが内包するブロック数はピクチャ毎に決定することが可能である。またはシーケンス内の全ピクチャで同じグループ数とし、また各グループが内包するブロック数を均等にしても良い。
In step S102, the group
ステップS103で、グループ復号遅延決定部142は、グループ毎にグループ復号遅延を算出する(ステップS103)。
In step S103, the group decoding
ステップS104で、バッファ占有量算出部122は、各グループの復号開始に当たり、理想復号装置の受信バッファのバッファ状態、及び次に符号化するグループの発生情報量上限を推定する。
In step S104, the buffer occupation
ステップS105で、量子化値算出部121は、受信バッファのバッファ状態、及び次に符号化するグループの発生情報量上限を元に、グループの復号開始最早時刻までにグループの全データが受信バッファに到着するように、ブロックの量子化値を計算する。
In step S105, the quantized
ステップS106で、符号化処理部110は、計算した量子化値を用いてブロックの符号化を行う。
In step S106, the
次に、実施例1における動画像符号化装置100の出力処理について説明する。図13は、実施例1における出力処理の一例を示すフローチャートである。
Next, output processing of the moving
ステップS200で、出力時刻決定部150は、グループ情報をデータストリームから抽出する。
In step S200, the output
ステップS201で、グループ出力遅延決定部152は、グループ出力遅延情報を決定する。グループ出力遅延時刻は、上述したようにして決定することができる。
In step S201, the group output
ステップS202で、グループ出力遅延情報付加部153は、グループ出力遅延情報をデータストリームに付加する。
In step S202, the group output delay
以上、実施例1によれば、1ピクチャ時間未満のコーデック遅延を実現する際、グループの復号又は出力を早めることで、さらなる低遅延化を実現することができる。 As described above, according to the first embodiment, when realizing a codec delay of less than one picture time, further delay reduction can be realized by advancing group decoding or output.
[実施例2]
次に、実施例2における動画像復号装置について説明する。実施例2では、実施例1における動画像符号化装置100で符号化されたストリームを適切に復号する。
[Example 2]
Next, a moving picture decoding apparatus according to the second embodiment will be described. In the second embodiment, the stream encoded by the moving
<構成>
図14は、実施例2における動画像復号装置200の概略構成の一例を示すブロック図である。動画像復号装置200は、受信バッファ205と、ブロック復号部210と、フレームメモリ211と、グループ出力部212と、復号時刻算出部220と、出力時刻算出部230と、グループ情報抽出部240とを有する。
<Configuration>
FIG. 14 is a block diagram illustrating an example of a schematic configuration of the
グループ情報抽出部240は、入力したストリーム(入力ストリームとも呼ぶ)から、各ブロックを所定の間隔で分割したグループを示すグループ情報を抽出する。
The group
復号時刻算出部220は、グループ復号遅延情報抽出部221と、グループ復号時刻算出部222とを有する。
The decoding
出力時刻算出部230は、グループ出力遅延情報抽出部231と、グループ出力時刻算出部232とを有する。
The output
動画像復号装置200が有するこれらの各部は、それぞれ、別個の回路として動画像復号装置200に実装される。あるいは、動画像復号装置200が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像復号装置200に実装されてもよい。あるいはまた、動画像復号装置200が有するこれらの各部は、動動画像復号装置200が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
Each of these units included in the
受信バッファ205は、動画像符号化装置100により送信されたストリームを受信し、バッファリングする。
The
ブロック復号部210は、グループ復号時刻算出部222から出力されるグループの復号開始時刻に、受信バッファ205からデータを取得し、先頭ブロックから順に復号処理を行い、復号したブロックを順次出力する。復号開始時刻は、単に復号時刻とも呼ぶ。
The
フレームメモリ211は、ブロック復号部210から出力される復号ブロックを保存する。フレームメモリ211は、例えば出力対象グループが出力される前にバッファリングされる復号バッファとしても機能する。また、復号バッファは、フレームメモリ211とは異なる構成であってもよい。
The
グループ出力部212は、グループ出力時刻算出部232から出力されるグループ出力時刻に、該当グループの出力を行う。
The
グループ復号遅延情報抽出部221は、符号化データである入力ストリームから、グループ復号遅延情報を抽出する。
The group decoding delay
グループ復号時刻算出部222は、グループ情報抽出部240から出力されるグループ情報と、グループ復号遅延情報抽出部221から出力されるグループ復号遅延情報から各グループの復号開始時刻を算出する。
The group decoding
グループ復号時刻算出部222は、例えばi番目のピクチャP(i)の先頭ブロックの復号開始時刻dtb(i)を、以下の式で計算する。
The group decoding
グループ出力遅延情報抽出部231は、符号化データである入力ストリームから、グループ出力遅延情報を抽出する。
The group output delay
グループ出力時刻算出部232は、グループ情報抽出部240から出力されるグループ情報と、グループ出力遅延情報抽出部231から出力されるグループ出力遅延情報から各グループの出力時刻を算出する。
The group output
動画像復号装置200は、通知されたグループ数N、グループの復号遅延情報に基づき、各復号グループの復号開始時刻を算出する。また、通知されたグループ数N、グループの出力遅延情報に基づき、各復号グループの出力時刻を算出する。
The moving
<動作>
次に、実施例2における動画像復号装置200の動作について説明する。図15は、実施例2における動画像復号処理の一例を示すフローチャートである。図15に示すステップS300で、グループ情報抽出部240は、各ピクチャの復号開始に当たり、まず、グループ情報をデータストリームから抽出する。
<Operation>
Next, the operation of the
ステップS301で、グループ復号遅延情報抽出部221は、グループ復号遅延情報をデータストリームから抽出する。
In step S301, the group decoding delay
ステップS302で、グループ復号時刻算出部222は、先頭グループの復号開始時刻を算出する。
In step S302, the group decoding
シーケンス内の各ピクチャにおける復号グループ数及び各復号グループが内包するブロック数はピクチャ毎に決定することが可能である。またはシーケンス内の全ピクチャで同じ復号グループ数とし、また各復号グループが内包するブロック数を均等にしても良い。更に、復号グループは、ブロック復号時刻情報に記述されているグループと同じとしても良い。 The number of decoding groups in each picture in the sequence and the number of blocks included in each decoding group can be determined for each picture. Alternatively, the same number of decoding groups may be used for all pictures in the sequence, and the number of blocks included in each decoding group may be equalized. Furthermore, the decoding group may be the same as the group described in the block decoding time information.
ステップS303で、ブロック復号部210は、グループ復号ループ内で、グループの復号時刻まで待つ。
In step S303, the
ステップS304で、ブロック復号部210は、受信バッファ205からデータを取得し、各ブロックを復号する。
In step S304, the
ステップS305で、グループ復号時刻算出部222は、次のグループの復号開始時刻を計算する。
In step S305, the group decoding
ステップS306で、ブロック復号部210は、復号された復号ブロックをフレームメモリに出力する。
In step S306, the
次に、実施例2における動画像復号装置200の出力処理について説明する。図16は、実施例2における出力処理の一例を示すフローチャートである。
Next, output processing of the moving
ステップS400で、グループ情報抽出部240は、各ピクチャの復号開始に当たり、まず、グループ情報をデータストリームから抽出する。
In step S400, the group
ステップS401で、グループ出力遅延情報抽出部231は、次に、データストリームからグループ出力遅延情報を抽出する。
In step S401, the group output delay
ステップS402で、グループ出力時刻算出部232は、グループ情報抽出部240から出力されるグループ情報と、グループ出力遅延情報抽出部231から出力されるグループ出力遅延情報から、P(i)の先頭グループの出力開始時刻を算出する。ステップS403で、P(i)の先頭グループの出力開始時刻に従い、グループに属する復号ブロックを出力する。
In step S402, the group output
以上、実施例2によれば、実施例1における動画像符号化装置100で符号化されたストリームを適切に復号することができる。
As described above, according to the second embodiment, it is possible to appropriately decode the stream encoded by the moving
[実施例3]
次に、実施例3における動画像符号化装置について説明する、実施例3では、グループ単位でアンダーフローが発生する場合に、どのような処理を行うか規定する。
[Example 3]
Next, a moving picture coding apparatus according to the third embodiment will be described. In the third embodiment, what kind of processing is performed when underflow occurs in units of groups is defined.
<構成>
図17は、実施例3による動画像符号化装置300の概略構成の一例を示すブロック図である。動画像符号化装置301は、符号化処理部310と、符号量制御部320と、グループ決定部330と、復号時刻決定部340と、出力時刻決定部350とを有する。
<Configuration>
FIG. 17 is a block diagram illustrating an example of a schematic configuration of a
符号化処理部310、グループ決定部330、復号時刻決定部340、出力時刻決定部350は、図7に示す符号化処理部110、グループ決定部130、復号時刻決定部140、出力時刻決定部150と同様の処理を行う。
The
符号量制御部320は、量子化値算出部321と、バッファ占有量算出部322と、ビットカウンタ323と、フィラー付加部324とを有する。
The code
符号量制御部320は、グループに含まれる全てのブロックの復号に必要なデータが、所定の伝送レートで復号装置に伝送された場合に、決定された表示時刻により表される時刻までに復号装置の受信バッファに到達するように符号量を制御する。
When the data necessary for decoding all the blocks included in the group is transmitted to the decoding device at a predetermined transmission rate, the code
量子化値算出部321、ビットカウンタ323は、図7に示す量子化値算出部121、ビットカウンタ123と同様の処理を行う。
The quantization
バッファ占有量算出部322は、図7に示すバッファ占有量算出部122の動作に加え、グループの発生情報量が目標値を上回り、復号開始時刻までにグループの全データが理想復号装置の受信バッファに到達しない、バッファアンダーフロー状態になるどうかを調べる。
In addition to the operation of the buffer
バッファアンダーフロー状態を検出した場合、フィラー付加部324に対し処理ピクチャの最後にダミーデータを入れるように指示すると共に、図示しない全体制御部に対してバッファアンダーフロー状態を通知する。図示しない全体制御部はバッファアンダーフロー状態を通知された場合、次に符号化するピクチャの符号化処理をスキップするように制御する。
When a buffer underflow state is detected, the
フィラー付加部324は、処理ピクチャの最後にダミーデータを挿入する。挿入するダミーデータの量はバッファ占有量算出部322から指示される。
The
フィラー付加部324は、グループに含まれる全てのブロックの復号に必要なデータが表示時刻までに復号装置の受信バッファに到達しない場合には、出力ストリームにフィラーデータを付加する。また、フィラー付加部324は、フィラーデータを付加することで、グループを含むピクチャ最後のブロックの復号に必要なデータが、表示時刻までに復号装置の受信バッファに到達しないように制御する。
The
《アンダーフロー時の処理》
まず、図18を用いて、ピクチャ内のグループにおいて、アンダーフローが起こった場合を考える。図18は、アンダーフローの発生を説明するための図である。図18に示すグラフ90のように、基本的に、グループ単位の復号時刻を定義したときも、符号化装置側はSEIメッセージなどの追加情報で復号装置に送る情報通りにスケジューリングされた復号時刻で復号できるように、符号量の調整を行う。
<Processing at underflow>
First, the case where underflow occurs in a group in a picture will be considered with reference to FIG. FIG. 18 is a diagram for explaining the occurrence of underflow. As shown in the
しかし、図18に示すグラフ91のように、dgt(0)において、グループのアンダーフローが発生した場合、復号に必要なビットがバッファに受信されるまで、復号を行わないことは上記と同様である。
However, as in the
留意すべきは、1ピクチャの表示が保証される必要があり、グループのアンダーフローが発生した場合でも、表示を1ピクチャ遅らせなければならないことである。なぜなら、グループのアンダーフローが発生した場合、1グループの復号に必要なビットがバッファに受信されるまで待つためである。次の復号タイミングは、図18に示すグラフ91に示すdgt'となる。
It should be noted that the display of one picture needs to be guaranteed and the display must be delayed by one picture even if a group underflow occurs. This is because when a group underflow occurs, it waits until a bit necessary for decoding of one group is received in the buffer. The next decoding timing is dgt ′ shown in the
この場合、その後の復号時刻もその分だけ遅延してしまうため、そのグループの属するピクチャが復号され、表示される時刻dt(0)になっても、全てのグループの復号が完了しなくなるので、1ピクチャ表示を遅らせる。 In this case, since the subsequent decoding time is also delayed by that amount, even when the picture to which the group belongs is decoded and the displayed time dt (0) is reached, the decoding of all the groups is not completed. Delay one picture display.
ここで、グループとしてはアンダーフローを起こしても、ピクチャとしてはアンダーフローを起こしていなかった場合を考える。グループ単位ではアンダーフローを起こしているため、グループ復号を遅らせ、かつ1ピクチャ表示を遅らせ、次のピクチャをスキップしようとする。 Here, a case is considered in which underflow has not occurred as a picture even though underflow has occurred as a group. Since underflow has occurred in the group unit, group decoding is delayed, one picture display is delayed, and an attempt is made to skip the next picture.
しかし、ピクチャ単位ではアンダーフローを起こしていないため、通常の時刻でピクチャ表示を行おうとする、という矛盾した状況が発生する。この場合、グループの復号が遅れているため、通常のピクチャのタイミングでは復号が終わっておらず、適切なピクチャを出力することができない。 However, since there is no underflow in units of pictures, a contradictory situation occurs in which a picture is displayed at a normal time. In this case, since the decoding of the group is delayed, the decoding is not completed at the normal picture timing, and an appropriate picture cannot be output.
さらに、その次のピクチャの表示タイミングでも、その次のピクチャに必要な復号が終わっておらず、適切なピクチャを出力することができない。といったように、ピクチャの表示タイミングに適切なピクチャが復号されなくなる。 Furthermore, even at the display timing of the next picture, the decoding necessary for the next picture is not finished, and an appropriate picture cannot be output. As described above, a picture appropriate for the display timing of the picture is not decoded.
そこで、図19に示すように、グループでアンダーフローが起こった場合には、ピクチャとしても、アンダーフローが起こったものと仮定し、1ピクチャ表示を遅らせ、その次に表示されるべきピクチャをスキップすると規定する。これにより、次のピクチャをスキップすることができるため、表示時刻を正しく修正することができる。 Therefore, as shown in FIG. 19, when an underflow occurs in a group, it is assumed that an underflow has occurred as a picture, and one picture display is delayed, and the next picture to be displayed is skipped. Then stipulate. Thereby, since the next picture can be skipped, the display time can be corrected correctly.
図19は、アンダーフロー発生時の処理を説明するための図である。例えば、図19に示す例において、dgt(1)でアンダーフローが起こった場合、dt(1)で復号されるべきピクチャの量は符号95で示したように、符号化ストリーム到着レート96よりも小さいにもかかわらず、dt(1)においてアンダーフローが起こったものとする。これにより、1ピクチャ表示を遅らせ、dt(1)で表示されるピクチャをdt(2)で表示し、dt(2)で表示されるべきピクチャをスキップする。
FIG. 19 is a diagram for explaining processing when underflow occurs. For example, in the example shown in FIG. 19, when an underflow occurs in dgt (1), the amount of pictures to be decoded in dt (1) is larger than the encoded
また符号化装置側においても、グループでアンダーフローが起こった場合には、ピクチャの符号化データにfiller dataを詰めるなどする。これにより、アンダーフローを故意に起こすことで、次のピクチャをスキップすることが出来るため、表示時刻を正しく修正することが可能である。 On the encoding device side, if underflow occurs in a group, filler data is packed into encoded data of a picture. As a result, it is possible to skip the next picture by intentionally causing underflow, so that the display time can be corrected correctly.
≪アンダーフロー検出、ストリーム編集≫
実施例3による動画像符号化装置における、アンダーフロー検出方法、及びビットストリーム編集方法を以下に示す。
≪Underflow detection, stream editing≫
An underflow detection method and a bitstream editing method in the moving image encoding apparatus according to the third embodiment will be described below.
まず、符号量制御部320は、実施例1の場合と同様の動作を行うとする。アンダーフローは、バッファ占有量算出部322において検出される。このとき、少なくとも一つのグループで、上記の条件(2)に示される条件が満たされない場合、当該ピクチャに含まれるグループで、アンダーフローが発生したと検出される。
First, it is assumed that the code
この時、バッファ占有量算出部322は、フィラー付加部324にアンダーフロー発生情報を通知する。フィラー付加部324は、アンダーフロー発生情報を受け取り、アンダーフローが発生したことを確認したとき、ピクチャの表示がスキップされるような処理を行う。
At this time, the buffer occupation
例えば、Filler dataを出力ストリームに付与することで、ピクチャ単位でのアンダーフローを故意に発生させ、ピクチャの表示をスキップさせる。Filler dataの付加方法は、容易に類推できるため、ここでは説明を省略する。 For example, by adding Filler data to the output stream, an underflow in units of pictures is intentionally generated, and display of pictures is skipped. Since the method for adding Filler data can be easily inferred, description thereof is omitted here.
以上の処理を行うことで、ピクチャの表示をスキップさせることで、ピクチャの表示順番がずれることを防ぐことが出来る。 By performing the above processing, it is possible to prevent the picture display order from being shifted by skipping the picture display.
<動作>
次に、実施例3における動画像符号化装置300の動作について説明する。図20は、実施例3における動画像符号化装置の処理の一例を示すフローチャートである。
<Operation>
Next, the operation of the moving
ステップS500で、バッファ占有量算出部322は、復号装置の受信バッファのバッファ占有量に基づいて、グループ単位にアンダーフローするかどうかを確認する。
In step S500, the buffer
ステップS501で、バッファ占有量算出部322は、グループ単位でアンダーフローが発生すると判断したら、ピクチャ単位に見てもアンダーフローするように、フィラー付加部324に出力ストリームの編集を指示する。フィラー付加部324は、出力ストリームを編集し、ピクチャの表示をスキップさせるようにする。アンダーフローを起こしたピクチャは、ビッグピクチャとも呼ばれる。
In step S501, when the buffer occupation
以上、実施例3によれば、グループ単位でアンダーフローが発生する場合にも適切に処理することができる。
[実施例4]
次に、実施例4における動画像復号装置について説明する、実施例4では、実施例3における動画像符号化装置により符号化された符号化データを適切に復号することができる。
As described above, according to the third embodiment, it is possible to appropriately process even when an underflow occurs in units of groups.
[Example 4]
Next, the moving picture decoding apparatus according to the fourth embodiment will be described. In the fourth embodiment, the encoded data encoded by the moving picture encoding apparatus according to the third embodiment can be appropriately decoded.
<構成>
図21は、実施例4における動画像復号装置400の概略構成の一例を示すブロック図である。動画像復号装置400は、受信バッファ405と、グループ復号遅延情報抽出部421と、グループ出力遅延情報抽出部431と、グループ復号時刻算出部422と、グループ出力時刻算出部と432と、グループ情報抽出部440と、ブロック復号部410と、フレームメモリ411と、グループ出力部412と、表示制御部413とを有する。
<Configuration>
FIG. 21 is a block diagram illustrating an example of a schematic configuration of the
動画像復号装置400が有するこれらの各部は、それぞれ、別個の回路として動画像復号装置400に実装される。あるいは、動画像復号装置400が有するこれらの各部は、その各部の機能を実現する回路が集積された一つの集積回路として動画像復号装置400に実装されてもよい。あるいはまた、動画像復号装置400が有するこれらの各部は、動動画像復号装置400が有するプロセッサ上で実行されるコンピュータプログラムにより実現される機能モジュールであってもよい。
Each of these units included in the
≪アンダーフロー検出、ストリーム編集≫
実施例4による動画像復号装置400における、アンダーフロー検出方法、及びビットストリーム編集方法を説明する。
≪Underflow detection, stream editing≫
An underflow detection method and a bitstream editing method in the
まず、ブロック復号部410は、実施例2の場合と同様の動作を行うとする。アンダーフローは、ブロック復号部410において検出される。ブロック復号部410は、図示しないエントロピー復号部からのビット量情報を受け取る。
First, it is assumed that the
このとき、少なくとも一つのグループで、上記の条件(2)に示される条件が満たされない場合、当該ピクチャに含まれるグループで、アンダーフローが発生したと検出される。例えば、図18に示すグラフ91においては、dgt(1)でアンダーフローが発生していることを示している。
At this time, if at least one group does not satisfy the condition (2), it is detected that an underflow has occurred in the group included in the picture. For example, the
この時、ブロック復号部410は、表示制御部413にアンダーフロー発生情報を通知する。表示制御部413は、アンダーフロー発生情報を受け取ったことでアンダーフローが発生したことを確認し、ピクチャの表示をスキップする処理を行う。
At this time, the
つまり、復号時刻がdt(k)である当該ピクチャのグループdgt(l)においてアンダーフローが発生した場合、dt(k)にピクチャとしては復号可能なビット量がバッファに蓄えられていても、dt(k)はdt(k+1)に表示される。また、本来dt(k+1)に表示されるはずだったピクチャは、スキップされる。 That is, when an underflow occurs in the group dgt (l) of the picture whose decoding time is dt (k), even if a bit amount that can be decoded as a picture is stored in the buffer in dt (k), dt (K) is displayed in dt (k + 1). Also, the picture that was supposed to be displayed at dt (k + 1) is skipped.
例えば、図19に示す例では、dt(1)に表示されるはずだったピクチャはdt(2)に表示され、dt(2)に表示されるはずだったピクチャはスキップされる。なお、この例では復号は瞬時だとし、さらに出力(表示)は復号と同時に行うことが出来るとしている。 For example, in the example shown in FIG. 19, the picture that should have been displayed at dt (1) is displayed at dt (2), and the picture that should have been displayed at dt (2) is skipped. In this example, it is assumed that decoding is instantaneous, and that output (display) can be performed simultaneously with decoding.
これにより、ピクチャの表示をスキップさせることで、ピクチャの表示順番がずれることを防ぐことが出来る。 Accordingly, it is possible to prevent the picture display order from being shifted by skipping the picture display.
<動作>
次に、実施例4における動画像復号装置400の動作について説明する。図22は、実施例4における動画像復号装置400の処理の一例を示すフローチャートである。
<Operation>
Next, the operation of the
ステップS600で、ブロック復号部410は、受信バッファ405のバッファ占有量に基づいて、グループ単位にアンダーフローするかどうかを確認する。
In step S600, the
ステップS601で、ブロック復号部410は、グループ単位でアンダーフローが発生していると判断したら、表示制御部413にアンダーフロー発生情報を通知する。表示制御部413は、アンダーフロー発生情報が通知されると、表示ピクチャのタイミングが正しくなるように修正する。
If the
以上、実施例4によれば、実施例3における動画像符号化装置300により符号化された符号化データを適切に復号することができる。
As described above, according to the fourth embodiment, it is possible to appropriately decode the encoded data encoded by the moving
[実施例5]
図23は、動画像処理装置500の概略構成の一例を示すブロック図である。動画像処理装置500は、各実施例で説明した動画像符号化装置、又は動画像復号装置の一例である。図23に示すように、動画像処理装置500は、制御部501、主記憶部502、補助記憶部503、ドライブ装置504、ネットワークI/F部506、入力部507、表示部508を含む。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
[Example 5]
FIG. 23 is a block diagram illustrating an example of a schematic configuration of the moving
制御部501は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPUである。また、制御部501は、主記憶部502や補助記憶部503に記憶されたプログラムを実行する演算装置であり、入力部507や記憶装置からデータを受け取り、演算、加工した上で、表示部508や記憶装置などに出力する。
The
主記憶部502は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部501が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
The
補助記憶部503は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
The
ドライブ装置504は、記録媒体505、例えばフレキシブルディスクからプログラムを読み出し、記憶装置にインストールする。
The
また、記録媒体505は、所定のプログラムを格納する。この記録媒体505に格納されたプログラムは、ドライブ装置504を介して動画像処理装置500にインストールされる。インストールされた所定のプログラムは、動画像処理装置500により実行可能となる。
The
ネットワークI/F部506は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と動画像処理装置500とのインターフェースである。
The network I /
入力部507は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部508の表示画面上でキーの選択等を行うためのマウスやスライドパッド等を有する。また、入力部507は、ユーザが制御部501に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
The
表示部508は、LCD(Liquid Crystal Display)等を有し、制御部501から入力される表示データに応じた表示が行われる。なお、表示部508は、外部に設けられてもよく、その場合は、動画像処理装置500は、表示制御部を有する。
The
このように、前述した各実施例で説明した動画像符号化処理又は動画像復号装置は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、前述した動画像符号化処理又は動画像復号装置を実現することができる。 As described above, the moving image encoding process or the moving image decoding apparatus described in each of the above-described embodiments may be realized as a program for causing a computer to execute. By installing this program from a server or the like and causing it to be executed by a computer, the above-described moving image encoding process or moving image decoding apparatus can be realized.
また、この動画像符号化プログラム又は動画像復号プログラムを記録媒体505に記録し、このプログラムが記録された記録媒体505をコンピュータや携帯端末に読み取らせて、前述した処理を実現させることも可能である。
It is also possible to record the moving picture encoding program or the moving picture decoding program on the
なお、記録媒体505は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。なお、記録媒体505には、搬送波は含まれない。
The
動画像処理装置500で実行されるプログラムは、各実施例で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部501が補助記憶部503からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部502上にロードされ、1又は複数の各部が主記憶部502上に生成されるようになっている。
The program executed by the moving
また、前述した各実施例で説明した動画像符号化処理は、1つ又は複数の集積回路に実装してもよい。 Further, the moving image encoding processing described in each of the above embodiments may be implemented in one or a plurality of integrated circuits.
上述した各実施例による動画像符号化装置は、様々な用途に利用される。例えば、この動画像符号化装置又は動画像復号装置は、ビデオカメラ、映像送信装置、映像受信装置、テレビ電話システム、コンピュータあるいは携帯電話機に組み込まれる。 The moving picture encoding apparatus according to each of the embodiments described above is used for various purposes. For example, the moving image encoding device or moving image decoding device is incorporated in a video camera, a video transmission device, a video reception device, a videophone system, a computer, or a mobile phone.
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。 All examples and specific terms listed herein are intended for instructional purposes to help the reader understand the concepts contributed by the inventor to the present invention and the promotion of the technology. It should be construed that it is not limited to the construction of any example herein, such specific examples and conditions, with respect to showing the superiority and inferiority of the present invention. Although embodiments of the present invention have been described in detail, it should be understood that various changes, substitutions and modifications can be made thereto without departing from the spirit and scope of the present invention.
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。 Although each embodiment has been described in detail above, it is not limited to a specific embodiment, and various modifications and changes can be made within the scope described in the claims. It is also possible to combine all or a plurality of the components of the above-described embodiments.
なお、以上の各実施例に関し、さらに以下の付記を開示する。
(付記1)
動画像データに含まれる各ピクチャを複数のブロックに分割して符号化する動画像符号化装置であって、
複数のブロックに対し、各ブロックの属するグループを決定するグループ構成決定部と、
前記各ブロックの属するグループ情報を出力ストリームに付加するグループ情報付加部と、
前記グループ毎に出力時刻を復号算出するグループ出力時刻算出部と、
前記グループ毎に出力遅延を決定するグループ出力遅延決定部と、
前記グループ毎の復号時刻からの出力遅延時間を出力ストリームに付加するグループ出力遅延情報付加部と、
グループに含まれるすべてのブロックの出力に必要なデータが、前記出力遅延時間で示される出力時刻までに復号装置の復号バッファに到達し、復号が完了するように符号量を制御する符号量制御部と、
前記符号量制御手段の制御情報に基づいて符号化を行う符号化処理部と、
を備える動画像符号化装置
(付記2)
動画像データに含まれる各ピクチャを複数のブロックに分割して符号化する動画像符号化方法であって、
複数のブロックに対し、各ブロックの属するグループを決定し、
前記各ブロックの属するグループ情報を出力ストリームに付加し、
前記グループ毎に出力時刻を算出し、
前記グループ毎に出力遅延を決定し、
前記グループ毎の復号時刻からの出力遅延時間を出力ストリームに付加し、
グループに含まれるすべてのブロックの出力に必要なデータが、前記出力遅延時間で示される出力時刻までに復号装置の復号バッファに到達し、復号が完了するように符号量を制御し、
前記制御された符号量に基づいて符号化を行う処理を
コンピュータが実行する画像符号化方法。
(付記3)
動画像データに含まれる各ピクチャが分割された各ブロックの符号化データを示す入力データを復号する動画像復号装置であって、
前記入力ストリームから、各ブロックを所定の間隔で分割したグループを示すグループ情報を抽出するグループ情報抽出部と、
前記入力ストリームからグループの出力遅延を含むグループ出力遅延情報を抽出する出力遅延情報抽出部と、
前記グループ情報と前記グループ出力遅延情報とに基づきグループの出力時刻を算出する出力時刻算出部と、
前記出力時刻になると、復号された出力対象グループを順に出力する出力部と、
を備える動画像復号装置。
(付記4)
動画像データに含まれる各ピクチャが分割された各ブロックの符号化データを示す入力データを復号する動画像復号方法であって、
データを復号する動画像復号装置であって、
前記入力ストリームから、各ブロックを所定の間隔で分割したグループを示すグループ情報を抽出し、
前記入力ストリームからグループの出力遅延を含むグループ出力遅延情報を抽出し、
前記グループ情報と前記グループ出力遅延情報とに基づきグループの出力時刻を算出し、
前記出力時刻になると、復号された出力対象グループを順に出力する処理をコンピュータが実行する動画像復号方法。
In addition, the following additional notes are disclosed regarding each of the above embodiments.
(Appendix 1)
A moving image encoding apparatus that divides and encodes each picture included in moving image data into a plurality of blocks,
A group configuration determining unit that determines a group to which each block belongs, for a plurality of blocks;
A group information adding unit for adding group information to which each block belongs to an output stream;
A group output time calculator for decoding and calculating an output time for each group;
A group output delay determining unit for determining an output delay for each group;
A group output delay information adding unit for adding an output delay time from the decoding time for each group to an output stream;
A code amount control unit that controls the code amount so that the data necessary for the output of all the blocks included in the group reaches the decoding buffer of the decoding device by the output time indicated by the output delay time and the decoding is completed When,
An encoding processing unit that performs encoding based on control information of the code amount control means;
Video encoding device (Appendix 2)
A moving image coding method for dividing and coding each picture included in moving image data into a plurality of blocks,
For multiple blocks, determine the group to which each block belongs,
Adding group information to which each block belongs to an output stream;
Calculate the output time for each group,
Determine the output delay for each group,
An output delay time from the decoding time for each group is added to the output stream,
Data necessary for output of all the blocks included in the group reaches the decoding buffer of the decoding device by the output time indicated by the output delay time, and controls the code amount so that decoding is completed,
An image encoding method in which a computer executes a process of performing encoding based on the controlled code amount.
(Appendix 3)
A moving picture decoding apparatus for decoding input data indicating encoded data of each block obtained by dividing each picture included in moving picture data,
A group information extraction unit that extracts group information indicating a group obtained by dividing each block at a predetermined interval from the input stream;
An output delay information extraction unit for extracting group output delay information including the output delay of the group from the input stream;
An output time calculation unit for calculating a group output time based on the group information and the group output delay information;
When the output time is reached, an output unit that sequentially outputs the decoded output target groups;
A video decoding device comprising:
(Appendix 4)
A moving picture decoding method for decoding input data indicating encoded data of each block obtained by dividing each picture included in moving picture data,
A video decoding device for decoding data,
Extracting group information indicating a group obtained by dividing each block at a predetermined interval from the input stream,
Extracting group output delay information including group output delay from the input stream;
Calculating a group output time based on the group information and the group output delay information;
A moving picture decoding method in which a computer executes a process of sequentially outputting decoded output target groups at the output time.
100、300 動画像符号化装置
200、400 動画像復号装置
500 動画像処理装置
110 符号化処理部
120 符号量制御部
130 グループ決定部
140 復号時刻決定部
142 グループ復号遅延決定部
143 グループ復号遅延情報付加部
150 出力時刻決定部
152 グループ出力遅延決定部
153 グループ出力遅延情報付加部
210 ブロック復号部
212 グループ出力部
221 グループ復号遅延情報抽出部
222 グループ復号時刻算出部
231 グループ出力遅延情報抽出部
232 グループ出力時刻算出部
324 フィラー付加部
413 表示制御部
100, 300
Claims (1)
前記入力ストリームから符号化された各ブロックのデータを取得して復号し、
前記各ブロックの復号ブロックをフレームメモリに保存し、
前記入力ストリームから、ピクチャを構成する各ブロックがピクチャを所定単位に分割したグループのどのグループに属するかを示すグループ情報を抽出し、
前記入力ストリームからピクチャを所定単位に分割した際の分割形状に伴うグループの出力遅延を含むグループ出力遅延情報を抽出し、
前記グループ情報と前記グループ出力遅延情報とに基づき前記ピクチャの先頭グループの出力時刻を算出し、
前記出力時刻になると、復号された出力対象のピクチャに属するグループの各ブロックの復号データを順に出力し、
前記復号の際に、前記グループ単位にアンダーフローの発生を検知し、前記ピクチャの先頭グループの出力時刻に、当該ピクチャを構成するグループにおいてアンダーフローが検知されている場合には、当該ピクチャの代りに前記フレームメモリに保存された別の復号ブロックを出力する処理を
コンピュータが実行する動画像復号方法。 A moving picture decoding method for decoding an input stream indicating encoded data of each block obtained by dividing each picture included in moving picture data,
Obtain and decode data of each block encoded from the input stream,
Storing the decoded block of each block in a frame memory;
Extracting from the input stream group information indicating which group of blocks each of which constitutes a picture belongs to a group obtained by dividing a picture into predetermined units,
Extracting group output delay information including the output delay of the group associated with the division shape when the picture is divided into predetermined units from the input stream;
Calculating the output time of the first group of the picture based on the group information and the group output delay information;
When the output time is reached, the decoded data of each block of the group belonging to the decoded picture to be output is output in order,
At the time of decoding, occurrence of underflow is detected for each group, and if underflow is detected in a group constituting the picture at the output time of the first group of the picture, A video decoding method in which a computer executes a process of outputting another decoding block stored in the frame memory.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016078836A JP6249040B2 (en) | 2016-04-11 | 2016-04-11 | Video decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016078836A JP6249040B2 (en) | 2016-04-11 | 2016-04-11 | Video decoding method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012104005A Division JP6234660B2 (en) | 2012-04-27 | 2012-04-27 | Video decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016165122A JP2016165122A (en) | 2016-09-08 |
JP6249040B2 true JP6249040B2 (en) | 2017-12-20 |
Family
ID=56876290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016078836A Expired - Fee Related JP6249040B2 (en) | 2016-04-11 | 2016-04-11 | Video decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6249040B2 (en) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3338425B2 (en) * | 1994-11-30 | 2002-10-28 | 三洋電機株式会社 | MPEG video decoder |
JP3078991B2 (en) * | 1994-12-07 | 2000-08-21 | 株式会社グラフィックス・コミュニケーション・ラボラトリーズ | Low delay mode image decoding method and apparatus |
JP2001189933A (en) * | 1999-12-28 | 2001-07-10 | Fujitsu Ltd | Decoding buffer controller |
JP4513841B2 (en) * | 2007-08-28 | 2010-07-28 | ソニー株式会社 | Encoding apparatus, encoding method, encoding method program, and recording medium recording the encoding method program |
JP5072893B2 (en) * | 2009-03-25 | 2012-11-14 | 株式会社東芝 | Image encoding method and image decoding method |
JP5521940B2 (en) * | 2010-09-22 | 2014-06-18 | 富士通株式会社 | Encoding method, decoding method, encoding device, and decoding device |
WO2012042916A1 (en) * | 2010-09-30 | 2012-04-05 | 富士通株式会社 | Dynamic image encoding device, dynamic image encoding method, and computer program for dynamic image encoding |
-
2016
- 2016-04-11 JP JP2016078836A patent/JP6249040B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016165122A (en) | 2016-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5994367B2 (en) | Moving picture coding apparatus and moving picture coding method | |
JP6234660B2 (en) | Video decoding device | |
JP6234659B2 (en) | Video decoding device | |
JP6194973B2 (en) | Moving picture decoding apparatus and moving picture decoding method | |
JP6394766B2 (en) | Moving picture coding apparatus and moving picture coding method | |
JP5772623B2 (en) | Moving picture coding apparatus, moving picture coding method, and moving picture coding program | |
JP6249040B2 (en) | Video decoding method | |
JP6164324B2 (en) | Video decoding method | |
JP6288129B2 (en) | Moving picture decoding apparatus and moving picture decoding method | |
JP6194974B2 (en) | Moving picture decoding apparatus and moving picture decoding method | |
JP6146502B2 (en) | Video encoding / decoding system and video encoding / decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6249040 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |