JP6065088B2 - Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program - Google Patents
Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program Download PDFInfo
- Publication number
- JP6065088B2 JP6065088B2 JP2015217367A JP2015217367A JP6065088B2 JP 6065088 B2 JP6065088 B2 JP 6065088B2 JP 2015217367 A JP2015217367 A JP 2015217367A JP 2015217367 A JP2015217367 A JP 2015217367A JP 6065088 B2 JP6065088 B2 JP 6065088B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- block
- motion information
- candidate
- combined motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 67
- 230000005540 biological transmission Effects 0.000 title claims description 20
- 230000033001 locomotion Effects 0.000 claims description 811
- 238000012545 processing Methods 0.000 claims description 88
- 239000013598 vector Substances 0.000 description 321
- 230000002123 temporal effect Effects 0.000 description 49
- 238000011156 evaluation Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 27
- 230000001502 supplementing effect Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 239000013589 supplement Substances 0.000 description 17
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 230000000153 supplemental effect Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000009414 blockwork Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、動き補償予測を用いた動画像符号化技術に関し、特に動き補償予測で利用する動き情報を符号化する動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、並びに、送信装置、送信方法、及び送信プログラムに関する。 The present invention relates to a moving picture coding technique using motion compensated prediction, and in particular, a moving picture coding apparatus, a moving picture coding method, a moving picture coding program, and a moving picture coding program for coding motion information used in motion compensated prediction, and The present invention relates to a transmission device, a transmission method, and a transmission program.
一般的な動画像圧縮符号化では動き補償予測が利用される。動き補償予測は、対象画像を細かいブロックに分割し、復号済みの画像を参照画像として、動きベクトルで示される動き量に基づいて、対象画像の処理対象ブロックから参照画像の参照ブロックに移動した位置の信号を予測信号として生成する技術である。動き補償予測には1本の動きベクトルを利用して単予測に行うものと、2本の動きベクトルを利用して双予測に行うものがある。 In general video compression coding, motion compensation prediction is used. The motion compensated prediction is performed by dividing the target image into fine blocks, using the decoded image as a reference image, and moving from the processing target block of the target image to the reference block of the reference image based on the amount of motion indicated by the motion vector. This is a technique for generating a signal as a prediction signal. There are two types of motion compensated prediction, one for single prediction using one motion vector and the other for bi-prediction using two motion vectors.
動きベクトルについては、処理対象ブロックに隣接する符号化済みのブロックの動きベクトルを予測動きベクトル(単に「予測ベクトル」ともいう)とし、処理対象ブロックの動きベクトルと予測ベクトルとの差分を求め、差分ベクトルを符号化ベクトルとして伝送することで圧縮効率を向上させている。 For a motion vector, a motion vector of an encoded block adjacent to the processing target block is set as a prediction motion vector (also simply referred to as “prediction vector”), and a difference between the motion vector of the processing target block and the prediction vector is obtained. The compression efficiency is improved by transmitting the vector as an encoded vector.
MPEG−4AVC/H.264(以下、MPEG−4AVC)のような動画像圧縮符号化では、動き補償予測を行うブロックサイズを細かく且つ多様にすることで、精度の高い動き補償予測を可能としている。一方、ブロックサイズを小さくすることで、符号化ベクトルの符号量は大きくなる問題があった。 MPEG-4 AVC / H. In moving picture compression coding such as H.264 (hereinafter referred to as MPEG-4 AVC), motion compensation prediction with high accuracy is made possible by making the block size for motion compensation prediction fine and diverse. On the other hand, there is a problem that the code amount of the encoded vector is increased by reducing the block size.
そこで、MPEG−4AVCでは、時間方向の動きの連続性に着目し、処理対象ブロックと同一位置にある処理対象ブロックのある処理対象画像とは別の処理済み画像である参照画像上のブロックが有する動きベクトルをフレーム間距離でスケーリングして処理対象ブロックの動きベクトルとして利用して、符号化ベクトルを伝送することなく動き補償予測を実現する、時間ダイレクトモードによる動き補償予測が用いられている。これによって、動きベクトルの符号量が削減されて、符号化効率の向上が実現されていた。 Therefore, in MPEG-4 AVC, focusing on the continuity of movement in the time direction, a block on a reference image which is a processed image different from a processing target image having a processing target block at the same position as the processing target block has. Motion compensated prediction in the temporal direct mode is used in which a motion vector is scaled by a distance between frames and used as a motion vector of a processing target block to realize motion compensated prediction without transmitting an encoded vector. As a result, the code amount of the motion vector is reduced, and the encoding efficiency is improved.
また、特許文献1では、空間方向の動きの連続性に着目し、処理対象ブロックに隣接する処理済みのブロックが有する動きベクトルを処理対象ブロックの動きベクトルとして利用して、符号化ベクトルを伝送することなく動き補償予測を実現する方法が開示されている。
Also, in
上述したMPEG−4AVCで定義されているような時間ダイレクトモードによる動きベクトルの導出では、導出の際にはスケーリングが必要となるため、複雑な演算が必要となってしまう。また、特許文献1に記載された方法においては、処理対象予測ブロックに隣接する処理済みのブロックが有する動きベクトルを処理対象予測ブロックの動きベクトルとして利用しており、隣接する複数の予測ブロックをまとめて動き補償予測を行うようにした場合に、並列的な動き補償予測処理が行えない場合がある。
In the derivation of the motion vector in the temporal direct mode as defined in the above-described MPEG-4 AVC, since the derivation requires scaling, a complicated calculation is required. In the method described in
本発明はこうした状況に鑑みてなされたものであり、その目的は、処理対象予測ブロックに隣接する処理済みのブロックが有する動きベクトルを処理対象予測ブロックの動きベクトル生成に利用しながら、隣接する複数の予測ブロックをまとめて動き補償予測する動き補償予測の並列処理を高効率に実現することのできる動画像符号化および動画像復号技術を提供することにある。 The present invention has been made in view of such a situation, and an object of the present invention is to use a plurality of adjacent motion vectors while generating a motion vector of a processed block adjacent to a processing target prediction block for generating a motion vector of the processing target prediction block. It is an object of the present invention to provide a moving picture coding and moving picture decoding technique capable of realizing high-efficiency parallel processing of motion compensated prediction in which motion compensation prediction is performed for all the prediction blocks.
上記課題を解決するために、本発明のある態様の動画像符号化装置は、1以上の予測ブロックからなる符号化ブロックを符号化する動画像符号化装置であって、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成部(140)と、前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択部(141)と、選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化部(104)とを備え、前記結合動き情報候補生成部は、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出する。 In order to solve the above-described problem, a video encoding device according to an aspect of the present invention is a video encoding device that encodes a coding block including one or more prediction blocks, and includes a coding block in the coding block. Information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks is derived derives joint motion information candidates to be commonly used for all of the prediction blocks in the coding block. The combined motion information candidate generating unit (140) for deriving a plurality of combined motion information candidates to be used in common for all of the prediction blocks in the encoded block, and the plurality of combined motions A combined motion information selection unit (141) that selects one combined motion information candidate from the information candidates and uses the selected combined motion information candidate in a prediction block to be encoded; The a coding unit (104) for encoding as a candidate specifying index index for identifying the one coupling motion information candidates, the coupling motion information candidate generating unit, the prediction block of the coded block Information indicating whether or not joint motion information candidates to be used in common for all of the coding blocks are to be derived indicates that joint motion information candidates to be used in common for all of the prediction blocks in the coding block are not derived. If it is information, the plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded .
本発明のさらに別の態様は、動画像符号化方法である。この方法は、1以上の予測ブロックからなる符号化ブロックを符号化する動画像符号化方法であって、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出する。 Yet another aspect of the present invention is a video encoding method. This method is a moving image coding method for coding a coding block composed of one or more prediction blocks, and derives joint motion information candidates to be used in common for all the prediction blocks in the coding block. If the information indicating whether or not to perform is information indicating that joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived, the prediction block of the encoded block A combined motion information candidate generating step for deriving a plurality of combined motion information candidates to be used in common for all, selecting one combined motion information candidate from the plurality of combined motion information candidates, and selecting the one combined Combined motion information selection step for using motion information candidates in a prediction block to be encoded, and an index for identifying the selected combined motion information candidate And a coding step of coding a candidate particular index, the combined motion information candidate generating step, whether or not to derive the binding motion information candidates to use in common for all the prediction blocks of the coded block Is information indicating that joint motion information candidates to be used in common for all prediction blocks in the encoded block are not derived, based on the size and position of the prediction block to be encoded The plurality of combined motion information candidates are derived .
本発明のさらに別の態様は、送信装置である。この装置は、1以上の予測ブロックからなる符号化ブロックを符号化する動画像符号化方法により符号化された符号化ストリームを送信する送信装置であって、前記符号化ストリームをパケット化して符号化データを得るパケット処理部と、パケット化された前記符号化データを送信する送信部とを備える。前記動画像符号化方法は、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出する。
本発明のさらに別の態様は、送信方法である。この方法は、1以上の予測ブロックからなる符号化ブロックを符号化する動画像符号化方法により符号化された符号化ストリームを送信する送信方法であって、前記符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、パケット化された前記符号化データを送信する送信ステップとを備える。前記動画像符号化方法は、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出する。
Yet another embodiment of the present invention is a transmission device. This apparatus is a transmitting apparatus that transmits an encoded stream encoded by a moving image encoding method for encoding an encoded block composed of one or more prediction blocks, wherein the encoded stream is packetized and encoded. A packet processing unit for obtaining data; and a transmission unit for transmitting the packetized encoded data. In the moving image encoding method, information indicating whether or not joint motion information candidates to be commonly used for all prediction blocks in the encoding block are derived is included in all prediction blocks in the encoding block. In the case of information indicating that a joint motion information candidate to be used in common is derived, joint motion for deriving a plurality of joint motion information candidates to be used in common for all the prediction blocks in the coding block An information candidate generation step; a combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded; , and a coding step of coding the index for identifying the one coupling motion information candidates selected as candidates particular index, the formation In the motion information candidate generation step, information indicating whether to derive joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block includes information for all of the prediction blocks in the encoded block. If the information indicates that joint motion information candidates to be commonly used are not derived, the plurality of joint motion information candidates are derived based on the size and position of the prediction block to be encoded .
Yet another embodiment of the present invention is a transmission method. This method is a transmission method for transmitting an encoded stream encoded by a moving image encoding method for encoding an encoded block composed of one or more prediction blocks, wherein the encoded stream is packetized and encoded. A packet processing step of obtaining data; and a transmission step of transmitting the packetized encoded data. In the moving image encoding method, information indicating whether or not joint motion information candidates to be commonly used for all prediction blocks in the encoding block are derived is included in all prediction blocks in the encoding block. In the case of information indicating that a joint motion information candidate to be used in common is derived, joint motion for deriving a plurality of joint motion information candidates to be used in common for all the prediction blocks in the coding block An information candidate generation step; a combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded; , and a coding step of coding the index for identifying the one coupling motion information candidates selected as candidates particular index, the formation In the motion information candidate generation step, information indicating whether to derive joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block includes information for all of the prediction blocks in the encoded block. If the information indicates that joint motion information candidates to be commonly used are not derived, the plurality of joint motion information candidates are derived based on the size and position of the prediction block to be encoded .
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。 It should be noted that any combination of the above-described constituent elements and a conversion of the expression of the present invention between a method, an apparatus, a system, a recording medium, a computer program, etc. are also effective as an aspect of the present invention.
本発明によれば、処理対象予測ブロックに隣接する処理済みのブロックが有する動きベクトルを処理対象予測ブロックの動きベクトル生成に利用しながら、隣接する複数の予測ブロックをまとめて動き補償予測する動き補償予測の並列処理を高効率に実現することができる。 According to the present invention, motion compensation for performing motion compensation prediction on a plurality of adjacent prediction blocks collectively while using a motion vector of a processed block adjacent to the processing target prediction block for generating a motion vector of the processing target prediction block. Predictive parallel processing can be realized with high efficiency.
まず、本発明の実施の形態の前提となる技術を説明する。 First, a technique that is a premise of the embodiment of the present invention will be described.
現在、MPEG(Moving Picture Experts Group)などの符号化方式に準拠した装置およびシステムが普及している。そのような符号化方式では、時間軸上に連続する複数の画像をデジタル信号の情報として取り扱う。その際、効率の高い情報の放送、伝送または蓄積などを目的とし、画像を複数のブロックに分割して時間方向の冗長性を利用した動き補償予測、および空間方向の冗長性を利用した離散コサイン変換などの直交変換を用いて圧縮符号化する。 Currently, apparatuses and systems that comply with an encoding method such as MPEG (Moving Picture Experts Group) are widely used. In such an encoding method, a plurality of images that are continuous on the time axis are handled as digital signal information. At that time, for the purpose of broadcasting, transmitting or storing information with high efficiency, motion compensated prediction using the temporal redundancy by dividing the image into a plurality of blocks and the discrete cosine using the redundancy in the spatial direction Compression encoding is performed using orthogonal transformation such as transformation.
2003年に、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU−T)の共同作業によってMPEG−4 AVC/H.264と呼ばれる符号化方式(ISO/IECでは14496−10、ITU−TではH.264の規格番号がつけられている。以下、これをMPEG−4AVCと呼ぶ)が国際標準として制定された。MPEG−4AVCでは、基本的に処理対象ブロックの複数の隣接ブロックの動きベクトルの中央値を予測ベクトルとする。予測ブロックサイズが正方形でない場合で処理対象ブロックの特定の隣接ブロックの参照インデックスと処理対象ブロックの参照インデックスが一致する場合には、その特定の隣接ブロックの動きベクトルを予測ベクトルとする。 In 2003, a joint effort between the International Organization for Standardization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunication Union Telecommunication Standardization Sector (ITU-T) AVC / H. An encoding method called H.264 (the ISO / IEC has a standard number of 14496-10 and ITU-T has an H.264 standard number, hereinafter referred to as MPEG-4AVC) has been established as an international standard. In MPEG-4 AVC, basically, a median value of motion vectors of a plurality of adjacent blocks of a processing target block is used as a prediction vector. When the prediction block size is not square and the reference index of a specific adjacent block of the processing target block matches the reference index of the processing target block, the motion vector of the specific adjacent block is set as a prediction vector.
現在、国際標準化機構(ISO)と国際電気標準会議(IEC)のジョイント技術委員会(ISO/IEC)と、国際電気通信連合電気通信標準化部門(ITU−T)の共同作業によってHEVCと呼ばれる符号化方式の標準化が検討されている。 Coding currently called HEVC by the joint work of the International Technical Organization (ISO) and the International Electrotechnical Commission (IEC) Joint Technical Committee (ISO / IEC) and the International Telecommunication Union Telecommunication Standardization Sector (ITU-T) Standardization of the method is being studied.
HEVCの標準化では、複数の隣接ブロックと復号済みの別の画像のブロックを候補ブロックとして、これら候補ブロックで構成される候補ブロック群から1つの候補ブロックが選択されて、選択された候補ブロックの情報が符号化および復号されるマージモードが検討されている。 In the HEVC standardization, a plurality of adjacent blocks and another decoded image block are used as candidate blocks, and one candidate block is selected from a candidate block group composed of these candidate blocks, and information on the selected candidate block is obtained. A merge mode in which is encoded and decoded is under consideration.
[実施の形態1]
(符号化ブロック)
本実施の形態では、入力された画像信号は最大符号化ブロック単位に分割され、分割された最大符号化ブロックをラスタースキャン順序で処理する。符号化ブロックは階層構造となっており、符号化効率などを考慮して順次4分割することでより小さい符号化ブロックにすることができる。なお、4分割された符号化ブロックはジグザグスキャン順で符号化される。これ以上小さくすることのできない符号化ブロックを最小符号化ブロックと呼ぶ。符号化ブロックは符号化の単位となり、最大符号化ブロックも分割回数が0である場合は符号化ブロックとなる。本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とする。
[Embodiment 1]
(Encoding block)
In the present embodiment, the input image signal is divided into units of maximum encoding blocks, and the divided maximum encoding blocks are processed in a raster scan order. The encoding block has a hierarchical structure, and can be made into a smaller encoding block by sequentially dividing into four in consideration of encoding efficiency and the like. Note that the encoded blocks divided into four are encoded in the zigzag scan order. An encoded block that cannot be further reduced is called a minimum encoded block. The encoded block is a unit of encoding, and the maximum encoded block is also an encoded block when the number of divisions is zero. In this embodiment, the maximum coding block is 64 pixels × 64 pixels, and the minimum coding block is 8 pixels × 8 pixels.
図1(a)、(b)は、符号化ブロックを説明するための図である。図1(a)の例では、符号化ブロックが10個に分割されている。CU0、CU1およびCU9は32画素×32画素の符号化ブロック、CU2、CU3およびCU8は16画素×16画素の符号化ブロック、ならびにCU4、CU5、CU6およびCU7は8画素×8画素の符号化ブロックとなっている。図1(b)の例では、符号化ブロックが1個に分割されている。 FIGS. 1A and 1B are diagrams for explaining an encoded block. In the example of FIG. 1A, the encoded block is divided into ten. CU0, CU1 and CU9 are 32 × 32 coding blocks, CU2, CU3 and CU8 are 16 × 16 coding blocks, and CU4, CU5, CU6 and CU7 are 8 × 8 coding blocks. It has become. In the example of FIG. 1B, the encoded block is divided into one.
(予測ブロック)
本実施の形態では、符号化ブロックはさらに予測ブロック(パーティションともいう)に分割される。符号化ブロックは予測ブロックサイズタイプ(「分割タイプ」やパーティションタイプともいう)によって1以上の予測ブロックに分割される。図2(a)〜(d)は、予測ブロックサイズタイプを説明するための図である。図2(a)は符号化ブロックを分割しない2N×2N、図2(b)は水平に2分割する2N×N、図2(c)は垂直に2分割するN×2N、および図2(d)は水平と垂直に4分割するN×Nを示す。2N×2Nは1個の予測ブロック0、2N×NとN×2Nは2個の予測ブロック0と予測ブロック1、N×Nは4個の予測ブロック0、予測ブロック1、予測ブロック2、予測ブロック3からなる。予測ブロック0、予測ブロック1、予測ブロック2、予測ブロック3の順に符号化される。
(Prediction block)
In the present embodiment, the encoded block is further divided into prediction blocks (also referred to as partitions). The encoded block is divided into one or more prediction blocks according to a prediction block size type (also referred to as “partition type” or partition type). FIGS. 2A to 2D are diagrams for explaining the prediction block size type. 2 (a) is 2N × 2N that does not divide the encoded block, FIG. 2 (b) is 2N × N that is horizontally divided, FIG. 2 (c) is N × 2N that is vertically divided, and FIG. d) shows N × N which is divided into 4 parts horizontally and vertically. 2N × 2N is one
図3は、符号化ブロックの分割回数と予測ブロックサイズタイプによる予測ブロックサイズを説明するための図である。本実施の形態における予測ブロックサイズは、CU分割回数が0であって予測ブロックサイズタイプが2N×2Nである64画素×64画素からCU分割回数が3であって予測ブロックサイズタイプN×Nである4画素×4画素までの13の予測ブロックサイズが存在することになる。例えば、符号化ブロックを非対称に水平や垂直に2分割することもできる。 FIG. 3 is a diagram for explaining the prediction block size according to the number of times of coding block division and the prediction block size type. The prediction block size in the present embodiment is from 64 pixels × 64 pixels in which the number of CU divisions is 0 and the prediction block size type is 2N × 2N, and the number of CU divisions is 3, and the prediction block size type is N × N. There are 13 predicted block sizes up to 4 pixels x 4 pixels. For example, the coding block can be asymmetrically divided into two horizontally and vertically.
本実施の形態では、最大符号化ブロックを64画素×64画素、最小符号化ブロックを8画素×8画素とするが、この組み合わせに限定されない。また、予測ブロックの分割のパターンを図2(a)〜(d)としたが、1以上に分割される組み合わせであればよくこれに限定されない。 In the present embodiment, the maximum encoding block is 64 pixels × 64 pixels and the minimum encoding block is 8 pixels × 8 pixels, but the present invention is not limited to this combination. In addition, although the prediction block division pattern is shown in FIGS. 2A to 2D, the combination is not limited to this as long as the combination is divided into one or more.
(予測符号化モード)
本実施の形態では、動き補償予測や符号化ベクトル数を予測ブロック毎に切り替えることが可能となっている。ここで、動き補償予測と符号化ベクトル数を関連付けた予測符号化モードの一例について図4を用いて簡単に説明する。図4は、予測符号化モードを説明するための図である。
(Predictive coding mode)
In the present embodiment, the motion compensation prediction and the number of encoded vectors can be switched for each prediction block. Here, an example of a predictive coding mode in which motion compensation prediction is associated with the number of coding vectors will be briefly described with reference to FIG. FIG. 4 is a diagram for explaining the predictive coding mode.
図4に示す予測符号化モードには、動き補償予測の予測方向が単予測(L0予測)であって符号化ベクトル数が1であるPredL0、動き補償予測の予測方向が単予測(L1予測)であって符号化ベクトル数が1であるPredL1、動き補償予測の予測方向が双予測(BI予測)であって符号化ベクトル数が2であるPredBI、および動き補償予測の予測方向が単予測(L0予測/L1予測)または双予測(BI予測)であって符号化ベクトル数が0であるマージモード(MERGE)がある。また、動き補償予測を実施しない予測符号化モードであるイントラモード(Intra)もある。ここで、PredL0、PredL1、およびPredBIが予測ベクトルモードとなる。 In the predictive coding mode shown in FIG. 4, the prediction direction of motion compensation prediction is single prediction (L0 prediction) and the number of coding vectors is PredL0, and the prediction direction of motion compensation prediction is single prediction (L1 prediction). PredL1 in which the number of encoding vectors is 1, PredBI in which the prediction direction of motion compensation prediction is bi-prediction (BI prediction) and the number of encoding vectors is 2, and the prediction direction in motion compensation prediction is single prediction ( There is a merge mode (MERGE) which is L0 prediction / L1 prediction) or bi-prediction (BI prediction) and the number of encoding vectors is zero. There is also an intra mode (Intra) which is a predictive coding mode in which motion compensation prediction is not performed. Here, PredL0, PredL1, and PredBI are prediction vector modes.
マージモードでは予測方向がL0予測/L1予測/BI予測のいずれにもなるが、それは、マージモードの予測方向は候補ブロック群から選択された候補ブロックの予測方向をそのまま引き継ぐか、復号済みの情報から導出されるためである。また、マージモードでは符号化ベクトルが符号化されない。これは、マージモードの符号化ベクトルは候補ブロック群から選択された候補ブロックの動きベクトルをそのまま引き継ぐか、あらかじめ定められた規則によって導出されるためである。 In the merge mode, the prediction direction is any of L0 prediction / L1 prediction / BI prediction. This is because the prediction direction of the merge mode takes over the prediction direction of the candidate block selected from the candidate block group as it is, or is decoded information. This is because it is derived from In the merge mode, the encoded vector is not encoded. This is because the merge mode encoding vector inherits the motion vector of the candidate block selected from the candidate block group as it is or is derived by a predetermined rule.
(参照インデックス)
本実施の形態では、動き補償予測の精度向上のために、動き補償予測において複数の参照画像の中から最適な参照画像を選択することを可能とする。そのため、動き補償予測で利用した参照画像を参照画像インデックスとして符号化ベクトルとともに符号化する。動き補償予測で利用される参照画像インデックスは0以上の数値となる。動き補償予測が単予測であれば、参照インデックスは1つ利用され、動き補償予測が双予測であれば、2つの参照インデックスが利用される(図4)。
(Reference index)
In this embodiment, in order to improve the accuracy of motion compensation prediction, it is possible to select an optimal reference image from a plurality of reference images in motion compensation prediction. For this reason, the reference image used in the motion compensation prediction is encoded as a reference image index together with the encoded vector. The reference image index used in motion compensation prediction is a numerical value of 0 or more. If the motion compensation prediction is uni-prediction, one reference index is used, and if the motion compensation prediction is bi-prediction, two reference indexes are used (FIG. 4).
マージモードでは参照インデックスは符号化されない。これは、マージモードの参照インデックスは候補ブロック群から選択された候補ブロックの参照インデックスをそのまま引き継ぐか、あらかじめ定められた規則によって導出されるためである。 In merge mode, the reference index is not encoded. This is because the merge mode reference index is derived from the reference index of the candidate block selected from the candidate block group as it is or according to a predetermined rule.
(参照インデックスリスト)
本実施の形態では、動き補償予測で利用できる1以上の参照画像を参照インデックスリスト内に登録しておき、参照インデックスリスト内に登録された参照画像を参照インデックスで示すことによって参照画像を確定させて動き補償予測で利用する。参照インデックスリストには、参照インデックスリストL0(L0予測の参照インデックスリストともいう)と参照インデックスリストL1(L1予測の参照インデックスリストともいう)がある。動き補償予測が単予測の場合は、参照インデックスリストL0の中の参照画像を用いたL0予測、または参照インデックスリストL1の中の参照画像を用いたL1予測のいずれかを利用する。双予測の場合は参照インデックスリストL0と参照インデックスリストL1の2つを利用したBI予測を利用する。各参照インデックスリストに登録できる参照画像の最大数は16とする。
(Reference index list)
In the present embodiment, one or more reference images that can be used in motion compensation prediction are registered in the reference index list, and the reference image is confirmed by indicating the reference image registered in the reference index list with the reference index. Used in motion compensated prediction. The reference index list includes a reference index list L0 (also referred to as a reference index list for L0 prediction) and a reference index list L1 (also referred to as a reference index list for L1 prediction). When the motion compensation prediction is simple prediction, either L0 prediction using a reference image in the reference index list L0 or L1 prediction using a reference image in the reference index list L1 is used. In the case of bi-prediction, BI prediction using the reference index list L0 and the reference index list L1 is used. The maximum number of reference images that can be registered in each reference index list is 16.
(マージインデックス)
本実施の形態では、マージモードの場合には、処理対象画像内の複数の隣接ブロックおよび符号化済みの別の画像内の処理対象の予測ブロックと同一位置にある同一位置予測ブロック内と同一位置予測ブロックの周辺にあるブロックを候補ブロック群として、候補ブロック群の中から最適な予測符号化モード、動きベクトル、及び参照インデックスを持つ候補ブロックを選択し、選択した候補ブロックを示すためのマージインデックスを符号化および復号する。マージモードのときのみマージインデックスが1つ利用される(図4)。マージインデックスの最大個数(マージ候補最大数ともいう)は5であり、マージインデックスは0から4までの整数となる。ここでは、マージインデックスの最大数を5としたが、2以上であればよく、これに限定されない。
(Merge index)
In the present embodiment, in the merge mode, the same position in the same position prediction block that is at the same position as the plurality of adjacent blocks in the processing target image and the processing target prediction block in another encoded image A merge index for selecting a candidate block having an optimal predictive coding mode, motion vector, and reference index from the candidate block group using blocks around the prediction block as a candidate block group, and indicating the selected candidate block Is encoded and decoded. Only one merge index is used in the merge mode (FIG. 4). The maximum number of merge indexes (also called the maximum number of merge candidates) is 5, and the merge index is an integer from 0 to 4. Here, the maximum number of merge indexes is set to 5, but it may be 2 or more, and is not limited to this.
以降、マージインデックスの対象となる候補ブロックの動き情報を結合動き情報候補と呼び、結合動き情報候補の集合体を結合動き情報候補リストと呼ぶ。以降、動き情報とは予測方向、動きベクトル、及び参照インデックスを含む。 Hereinafter, the motion information of the candidate block that is the target of the merge index is referred to as a combined motion information candidate, and the aggregate of combined motion information candidates is referred to as a combined motion information candidate list. Hereinafter, the motion information includes a prediction direction, a motion vector, and a reference index.
次に、マージインデックスと符号列の関係について説明する。図5はマージインデックスと符号列の関係を説明するための図である。マージインデックスが0の場合の符号列は'0'、マージインデックスが1の場合の符号列は'10'、マージインデックスが2の場合の符号列は'110'、マージインデックスが3の場合の符号列は'1110'、マージインデックスが4の場合の符号列は'1111'となり、マージインデックスが大きくなるほど符号列が長くなるように設定される。そのため、選択率の高い候補ブロックに小さいマージインデックスを割り当てることで、符号化効率を向上させることができる。 Next, the relationship between the merge index and the code string will be described. FIG. 5 is a diagram for explaining the relationship between the merge index and the code string. The code string when the merge index is 0 is '0', the code string when the merge index is 1 is '10', the code string when the merge index is 2 is '110', and the code string when the merge index is 3 When the column is “1110” and the merge index is 4, the code string is “1111”, and the code string is set to be longer as the merge index is larger. Therefore, it is possible to improve the encoding efficiency by assigning a small merge index to a candidate block with a high selection rate.
次に、結合動き情報候補リストとマージインデックスの関係について説明する。マージインデックス0は結合動き情報候補リストの最初(0番目)の結合動き情報候補を示す。以下、マージインデックスmは結合動き情報候補リストのm番目の結合動き情報候補を示す。ここで、mは0から(マージ候補最大数−1)の整数となる。
Next, the relationship between the combined motion information candidate list and the merge index will be described. The
(予測ベクトルインデックス)
本実施の形態では、予測ベクトルの精度を向上させるために、処理対象画像内の複数の隣接ブロックおよび符号化済みの別の画像の処理対象ブロックと同一位置にある同一位置予測ブロック内と同一位置予測ブロックの周辺にあるブロックを候補ブロック群として、候補ブロック群から予測ベクトルとして最適な動きベクトルを持つ候補ブロックを選択し、選択した候補ブロックを示すための予測ベクトルインデックスを符号化および復号する。動き補償予測が単予測であれば、予測ベクトルインデックスは1つ利用され、動き補償予測が双予測であれば、2つの予測ベクトルインデックスが利用される(図4)。予測ベクトルインデックスの最大数(予測ベクトル候補最大数ともいう)は2であり、予測ベクトルインデックスは0または1の整数となる。ここでは、予測ベクトル候補最大数を2としたが、2以上であればよく、これに限定されない。
(Predicted vector index)
In the present embodiment, in order to improve the accuracy of the prediction vector, the same position in the same position prediction block that is in the same position as the plurality of adjacent blocks in the processing target image and the processing target block of another encoded image A candidate block having an optimal motion vector as a prediction vector is selected from the candidate block group using blocks around the prediction block as a candidate block group, and a prediction vector index for indicating the selected candidate block is encoded and decoded. If the motion compensation prediction is uni-prediction, one prediction vector index is used, and if the motion compensation prediction is bi-prediction, two prediction vector indexes are used (FIG. 4). The maximum number of prediction vector indexes (also referred to as the maximum number of prediction vector candidates) is 2, and the prediction vector index is an integer of 0 or 1. Although the maximum number of prediction vector candidates is 2 here, it may be 2 or more, and is not limited to this.
次に、予測ベクトルインデックスと符号列の関係について説明する。予測ベクトルインデックスの符号列は予測ベクトルインデックスが0の場合の符号列は'0'、予測ベクトルインデックスが1の場合の符号列は'1'とする。なお、予測ベクトル候補最大数が3以上である場合にはマージインデックスと同様な規則(インデックスが大きくなるほど符号列が長くなる)で符号列が割り当てることができる。 Next, the relationship between the prediction vector index and the code string will be described. The code string of the prediction vector index is “0” when the prediction vector index is 0, and is “1” when the prediction vector index is 1. When the maximum number of prediction vector candidates is 3 or more, a code string can be assigned according to the same rule as the merge index (the code string becomes longer as the index becomes larger).
以降、予測ベクトルインデックスの対象となる候補ブロックの動きベクトルを予測ベクトル候補と呼び、予測ベクトル候補の集合体を予測ベクトル候補リストと呼ぶ。 Hereinafter, a motion vector of a candidate block that is a target of a prediction vector index is referred to as a prediction vector candidate, and a set of prediction vector candidates is referred to as a prediction vector candidate list.
(シンタックス)
本実施の形態による予測ブロックのシンタックスの一例について説明する。図6は本実施の形態に係るシンタックスを説明する図である。図6は符号化木(Coding Tree)、符号化ブロック(Coding Unit)、及び予測ブロック(Prediction Unit)のシンタックス構成の一例を示す。符号化木では符号化ブロックの分割情報が管理される。符号化木にはsplit_coding_unit_flagが設置され、split_coding_unit_flagが1であれば符号化木は4個の符号化木に分割される。split_coding_unit_flagが0であれば符号化木は符号化ブロック(Coding Unit)となる。符号化ブロックには、スキップモードフラグ(skip_flag)、予測モード(pred_mode)と予測ブロックサイズタイプ(part_mode)が設置され、スキップモードフラグと予測ブロックサイズタイプに応じて1個または2個または4個の予測ブロックに分割される。予測モードはイントラ予測(画面内予測)を行う符号化ブロックであるかインター予測(動き補償予測)を行う符号化ブロックであるかを示す。スキップモードフラグが1である場合はスキップモードとなる。スキップモードは1個の予測ブロックを持つ。符号化ブロック(符号化木)の分割回数は符号化ブロック(符号化木)の深さともいう。
(Syntax)
An example of the syntax of the prediction block according to the present embodiment will be described. FIG. 6 is a diagram for explaining the syntax according to the present embodiment. FIG. 6 shows an example of a syntax configuration of a coding tree, a coding block, and a prediction block. In the coding tree, the division information of the coding block is managed. A split_coding_unit_flag is set in the coding tree. If split_coding_unit_flag is 1, the coding tree is divided into four coding trees. If split_coding_unit_flag is 0, the coding tree is a coding block (Coding Unit). The encoded block is provided with a skip mode flag (skip_flag), a prediction mode (pred_mode), and a prediction block size type (part_mode), and one, two, or four according to the skip mode flag and the prediction block size type. Divided into prediction blocks. The prediction mode indicates whether it is a coding block that performs intra prediction (intra-screen prediction) or an encoding block that performs inter prediction (motion compensation prediction). When the skip mode flag is 1, the skip mode is set. The skip mode has one prediction block. The number of divisions of the coding block (coding tree) is also referred to as the depth of the coding block (coding tree).
予測ブロックには、マージフラグ(merge_flag)、マージインデックス(merge_idx)、インター予測タイプ(inter_pred_type)、L0予測の参照インデックス(ref_idx_l0)、L0予測の差分ベクトル(mvd_l0[0]、mvd_l0[1])、L0予測の予測ベクトルインデックス(mvp_idx_l0)、L1予測の参照インデックス(ref_idx_l1)、L1予測の差分ベクトル(mvd_l1[0]、mvd_l1[1])、及びL1予測の予測ベクトルインデックス(mvp_idx_l1)が設置されている。差分ベクトルの[0]は水平成分、[1]は垂直成分を示す。 The prediction block includes a merge flag (merge_flag), a merge index (merge_idx), an inter prediction type (inter_pred_type), an L0 prediction reference index (ref_idx_l0), an L0 prediction difference vector (mvd_l0 [0], mvd_l0 [1]), A prediction vector index for L0 prediction (mvp_idx_l0), a reference index for L1 prediction (ref_idx_l1), a difference vector for L1 prediction (mvd_l1 [0], mvd_l1 [1]), and a prediction vector index for L1 prediction (mvp_idx_l1) are installed. Yes. [0] of the difference vector indicates a horizontal component and [1] indicates a vertical component.
ここで、inter_pred_typeは動き補償予測の予測方向(インター予測タイプとも呼ぶ)を示し、Pred_L0(L0予測の単予測)、Pred_L1(L1予測の単予測)およびPred_BI(BI予測の双予測)の3種類がある。inter_pred_typeがPred_L0またはPred_BIの場合は、L0予測に関する情報が設置されて、inter_pred_typeがPred_L1またはPred_BIの場合は、L1予測に関する情報が設置される。Pピクチャ(Pスライス)ではinter_pred_typeは一意にPred_L0となるため、inter_pred_typeは省略される。 Here, inter_pred_type indicates a prediction direction (also referred to as inter prediction type) of motion compensation prediction, and three types of Pred_L0 (uni prediction of L0 prediction), Pred_L1 (uni prediction of L1 prediction) and Pred_BI (bi prediction of BI prediction). There is. When inter_pred_type is Pred_L0 or Pred_BI, information about L0 prediction is installed, and when inter_pred_type is Pred_L1 or Pred_BI, information about L1 prediction is installed. In the P picture (P slice), inter_pred_type is uniquely Pred_L0, and therefore inter_pred_type is omitted.
また、スキップモードの場合、予測ブロックはインター予測を行う符号化ブロックであって、予測符号化モードとしてはマージモードとなる。そのため、スキップモードの場合はマージインデックスが設置される。 In the skip mode, the prediction block is an encoding block that performs inter prediction, and the prediction encoding mode is the merge mode. Therefore, a merge index is set in the skip mode.
なお、本実施の形態に係るシンタックスを図6のように設定したが、符号化ブロックや予測ブロックが複数のブロックサイズを有し、マージモードと予測ベクトルモードが利用できればよく、これに限定されない。 Although the syntax according to the present embodiment is set as shown in FIG. 6, the encoding block and the prediction block have a plurality of block sizes, and the merge mode and the prediction vector mode may be used, and the present invention is not limited to this. .
以下、図面とともに本発明の好適な実施の形態に係る動画像符号化装置、動画像符号化方法および動画像符号化プログラム、ならびに動画像復号装置、動画像復号方法および動画像復号プログラムの詳細について説明する。なお、図面の説明において同一要素には同一符号を付与して重複する説明を省略する。 Hereinafter, with reference to the drawings, details of a moving image encoding apparatus, a moving image encoding method, a moving image encoding program, a moving image decoding apparatus, a moving image decoding method, and a moving image decoding program according to a preferred embodiment of the present invention will be described. explain. In the description of the drawings, the same elements are denoted by the same reference numerals and redundant description is omitted.
(動画像符号化装置100の構成)
図7は、本実施の形態1に係る動画像符号化装置100の構成を示す。動画像符号化装置100は、動画像信号を、動き補償予測を実施する予測ブロック単位で符号化する装置である。符号化ブロックの分割、スキップモードの決定、予測ブロックサイズタイプの決定、予測ブロックサイズと予測ブロックの符号化ブロック内の位置(予測ブロックの位置情報や予測ブロック番号ともいう)の決定、予測符号化モードがイントラであるかの決定は図示しない上位の符号化制御部で決定されているものとし、実施の形態1では予測符号化モードがイントラでない場合について説明する。また、実施の形態1では双予測に対応したBピクチャ(Bスライス)について説明するが、双予測に対応しないPピクチャ(Pスライス)についてはL1予測を省略すればよい。
(Configuration of moving picture coding apparatus 100)
FIG. 7 shows the configuration of moving
動画像符号化装置100は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像符号化装置100は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。なお、処理対象の予測ブロックの位置情報、予測ブロックサイズおよび動き補償予測の予測方向に関しては動画像符号化装置100内で共有していることとし、図示しない。
The moving
実施の形態1の動画像符号化装置100は、予測ブロック画像取得部101、減算部102、予測誤差符号化部103、符号列生成部104、予測誤差復号部105、動き補償部106、加算部107、動きベクトル検出部108、動き情報生成部109、フレームメモリ110、および動き情報メモリ111を含む。
The moving
(動画像符号化装置100の機能と動作)
以下、各部の機能と動作について説明する。予測ブロック画像取得部101は、予測ブロックの位置情報と予測ブロックサイズに基づいて、端子10より供給される画像信号から処理対象の予測ブロックの画像信号を取得し、予測ブロックの画像信号を減算部102、動きベクトル検出部108および動き情報生成部109に供給する。
(Function and operation of moving picture coding apparatus 100)
Hereinafter, the function and operation of each unit will be described. The prediction block
動きベクトル検出部108は、予測ブロック画像取得部101より供給される画像信号および内部に記憶している複数の参照画像に相当する画像信号から、L0予測とL1予測それぞれの動きベクトルと参照画像を示す参照インデックスを検出する。当該L0予測とL1予測の動きベクトル、および当該L0予測とL1予測の参照インデックスを動き情報生成部109に供給する。ここでは、動きベクトル検出部108は参照画像として内部に記憶している複数の参照画像に相当する画像信号を利用するとしたが、フレームメモリ110に記憶されている参照画像を利用することもできる。
The motion
一般的な動きベクトルの検出方法は、対象画像の画像信号と、同一位置より所定の移動量だけ移動させた参照画像の予測信号について誤差評価値を算出し、誤差評価値が最小となる移動量を動きベクトルとする。参照画像が複数ある場合には各参照画像について動きベクトルを検出し、誤差評価値が最小となる参照画像を選択する。誤差評価値としては、絶対差分和を示すSAD(Sum of Absolute Difference)や二乗誤差平均を示すMSE(Mean Square Error)などを利用することが可能である。また、動きベクトル符号量を誤差評価値に加算して評価することも可能である。 A general motion vector detection method calculates an error evaluation value for an image signal of a target image and a prediction signal of a reference image moved by a predetermined movement amount from the same position, and a movement amount that minimizes the error evaluation value. Is a motion vector. When there are a plurality of reference images, a motion vector is detected for each reference image, and a reference image having a minimum error evaluation value is selected. As the error evaluation value, SAD (Sum of Absolute Difference) indicating the sum of absolute differences, MSE (Mean Square Error) indicating the mean square error, or the like can be used. It is also possible to evaluate by adding the motion vector code amount to the error evaluation value.
動き情報生成部109は、動きベクトル検出部108より供給されるL0予測とL1予測の動きベクトルおよびL0予測とL1予測の参照インデックス、動き情報メモリ111より供給される候補ブロック群、参照インデックスで示されるフレームメモリ110内の参照画像、および予測ブロック画像取得部101より供給される画像信号から、予測符号化モードを決定する。
The motion
決定された予測符号化モードに基づいて、マージフラグ、マージインデックス、動き補償予測の予測方向、L0予測とL1予測の参照インデックス、L0予測とL1予測の差分ベクトルおよびL0予測とL1予測の予測ベクトルインデックスを必要に応じて、符号列生成部104に供給する。動き補償予測の予測方向、L0予測とL1予測の参照インデックス、およびL0予測とL1予測の動きベクトルを動き補償部106および動き情報メモリ111に供給する。動き情報生成部109の詳細については後述する。
Based on the determined predictive coding mode, the merge flag, the merge index, the prediction direction of motion compensation prediction, the reference index of L0 prediction and L1 prediction, the difference vector of L0 prediction and L1 prediction, and the prediction vector of L0 prediction and L1 prediction The index is supplied to the code
動き補償部106は、動き情報生成部109より供給される動き補償予測の予測方向がLN予測であれば、動き情報生成部109より供給されるLN予測の参照インデックスで示されるフレームメモリ110内の参照画像を、動き情報生成部109より供給されるLN予測の動きベクトルに基づき動き補償してLN予測の予測信号を生成する。Nは0または1である。ここで、動き補償予測の予測方向が双予測であれば、L0予測とL1予測の予測信号の平均値が予測信号となる。なお、L0予測とL1予測の予測信号を重みづけしてもよい。動き補償部106は、当該予測信号を減算部102に供給する。
If the prediction direction of the motion compensation prediction supplied from the motion
減算部102は、予測ブロック画像取得部101より供給される画像信号と動き補償部106より供給される予測信号を減算して予測誤差信号を算出し、当該予測誤差信号を予測誤差符号化部103に供給する。
The
予測誤差符号化部103は、減算部102より供給される予測誤差信号に対して、直交変換や量子化などの処理を行って予測誤差符号化データを生成し、当該予測誤差符号化データを符号列生成部104および予測誤差復号部105に供給する。
The prediction
符号列生成部104は、予測誤差符号化部103より供給される予測誤差符号化データ、ならびに動き情報生成部109より供給されるマージフラグ、マージインデックス、動き補償予測の予測方向(インター予測タイプ)、L0予測とL1予測の参照インデックス、L0予測とL1予測の差分ベクトルおよびL0予測とL1予測の予測ベクトルインデックスを図6に示すシンタックスの順序に従ってエントロピー符号化して符号列を生成し、当該符号列を符号化ストリームとして端子11に供給する。エントロピー符号化は算術符号化やハフマン符号化などの可変長符号化を含む方法によって実施される。
The code
また、符号列生成部104は、動画像符号化装置100で利用された符号化ブロックの分割情報、予測ブロックサイズタイプ、及び予測符号化モードを、符号化ストリームの特性を決定するためのパラメータ群を定義したSPS(Sequence Parameter Set)、ピクチャの特性を決定するためのパラメータ群を定義したPPS(Picture Parameter Set)、やスライスの特性を決定するためのパラメータ群を定義したスライスヘッダなどと共に符号化ストリーム中に多重化する。
In addition, the code
予測誤差復号部105は、予測誤差符号化部103より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部107に供給する。加算部107は、予測誤差復号部105より供給される予測誤差信号と、動き補償部106より供給される予測信号を加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ110に供給する。
The prediction
フレームメモリ110は、加算部107より供給される復号画像信号を記憶する。また、画像全体の復号が完了した復号画像については参照画像として、1以上の所定の画像数を記憶する。フレームメモリ110は、記憶した参照画像信号を動き補償部106および動き情報生成部109に供給する。参照画像を記憶する記憶領域はFIFO(First In First Out)方式で制御される。
The
動き情報メモリ111は、動き情報生成部109より供給される動き情報を最小の予測ブロックサイズ単位で所定の画像数、記憶する。処理対象の予測ブロックの隣接ブロックの動き情報を空間候補ブロック群とする。
The
また、動き情報メモリ111は、処理対象の予測ブロックと同一位置にあるColPic上の同一位置予測ブロック内とその周辺ブロックの動き情報を時間候補ブロック群とする。動き情報メモリ111は、空間候補ブロック群と時間候補ブロック群を候補ブロック群として動き情報生成部109に供給する。動き情報メモリ111は、フレームメモリ110と同期しており、FIFO(First In First Out)方式で制御される。
In addition, the
ここで、ColPicとは、処理対象の予測ブロックのある画像とは別の復号済みの画像であって、フレームメモリ110に参照画像として記憶されている。実施の形態1では、ColPicは処理対象画像の直前に復号した参照画像とする。なお、実施の形態1では、ColPicは処理対象画像の直前に復号した参照画像としたが、復号済みの画像であればよく、例えば、表示順で直前の参照画像や表示順で直後の参照画像でもよく、符号化ストリーム中で指定することも可能である。
Here, ColPic is a decoded image different from an image having a prediction block to be processed, and is stored in the
ここで、動き情報メモリ111における動き情報の管理方法について説明する。動き情報は最小の予測ブロック単位で各メモリエリアに記憶される。各メモリエリアには、少なくとも予測方向、L0予測の動きベクトル、L0予測の参照インデックス、L1予測の動きベクトル、およびL1予測の参照インデックスが記憶される。
Here, a method for managing motion information in the
なお、予測符号化モードがイントラモードである場合、L0予測とL1予測の動きベクトルとして(0,0)が記憶され、L0予測とL予測の参照インデックスとして「−1」が記憶される。これ以降、動きベクトルの(H、V)は、Hが水平成分、Vが垂直成分を表すこととする。なお、参照インデックスの「−1」は動き補償予測を実施しないモードであることが判定できればどのような値でもよい。これ以降は特に断らない限り単にブロックと表現する場合には、最小の予測ブロック単位のことを示すこととする。また、領域外のブロックである場合もイントラモードと同様に、L0予測とL1予測の動きベクトルとして(0,0)が記憶され、L0予測とL1予測の参照インデックスとして「−1」が記憶される。LX方向(Xは0または1)が有効であるとはLX方向の参照インデックスが0以上であることで、LX方向が無効である(有効でない)とはLX方向の参照インデックスが「−1」であることである。 When the predictive coding mode is the intra mode, (0, 0) is stored as a motion vector for L0 prediction and L1 prediction, and “−1” is stored as a reference index for L0 prediction and L prediction. Hereinafter, in the motion vector (H, V), H represents a horizontal component and V represents a vertical component. The reference index “−1” may be any value as long as it can be determined that the mode in which motion compensation prediction is not performed. From this point onward, unless expressed otherwise, the term “block” refers to the smallest predicted block unit when expressed simply as a block. Also, in the case of a block outside the area, (0, 0) is stored as a motion vector for L0 prediction and L1 prediction, and “−1” is stored as a reference index for L0 prediction and L1 prediction, as in the intra mode. The When the LX direction (X is 0 or 1) is valid, the reference index in the LX direction is 0 or more, and when the LX direction is invalid (not valid), the reference index in the LX direction is “−1”. That is.
(動き情報生成部109の構成)
続いて、動き情報生成部109の詳細な構成について説明する。図8は、動き情報生成部109の構成を示す。動き情報生成部109は、予測ベクトルモード決定部120、マージモード決定部121および予測符号化モード決定部122を含む。端子12は動き情報メモリ111に、端子13は動きベクトル検出部108に、端子14はフレームメモリ110に、端子15は予測ブロック画像取得部101に、端子16は符号列生成部104に、端子50は動き補償部106に、および端子51は動き情報メモリ111にそれぞれ接続されている。
(Configuration of the motion information generation unit 109)
Next, a detailed configuration of the motion
(動き情報生成部109の機能と動作)
以下、各部の機能と動作について説明する。予測ベクトルモード決定部120は、端子12より供給される候補ブロック群、端子13より供給されるL0予測とL1予測の動きベクトルおよびL0予測とL1予測の参照インデックス、端子14より供給される参照インデックスで示される参照画像、および端子15より供給される画像信号から、インター予測タイプを決定し、インター予測タイプに従って、L0予測とL1予測の予測ベクトルインデックスを選択してL0予測とL1予測の差分ベクトルを算出するとともに、予測誤差を算出し、レート歪み評価値を算出する。そして、当該インター予測タイプに基づいた動き情報、差分ベクトル、予測ベクトルインデックス、およびレート歪み評価値を予測符号化モード決定部122に供給する。
(Function and operation of motion information generation unit 109)
Hereinafter, the function and operation of each unit will be described. The prediction vector
マージモード決定部121は、端子12より供給される候補ブロック群、端子14より供給される参照画像、および端子15より供給される画像信号から、結合動き情報候補リストを生成し、当該結合動き情報候補リストの中から1つの結合動き情報候補を選択してマージインデックスを決定し、レート歪み評価値を算出する。そして、当該結合動き情報候補の動き情報、当該マージインデックスおよび当該レート歪み評価値を予測符号化モード決定部122に供給する。マージモード決定部121の詳細については後述する。
The merge
予測符号化モード決定部122は、予測ベクトルモード決定部120より供給されるレート歪み評価値と、マージモード決定部121より供給されるレート歪み評価値とを比較してマージフラグを決定する。
The prediction coding
予測ベクトルモードレート歪み評価値がマージモードレート歪み評価値未満の場合は、マージフラグを「0」に設定する。予測符号化モード決定部122は、当該マージフラグ、予測ベクトルモード決定部120より供給されるインター予測タイプ、参照インデックス、差分ベクトルと予測ベクトルインデックスを端子16に供給し、予測ベクトルモード決定部120より供給される動き情報を端子50および端子51に供給する。
If the predicted vector mode rate distortion evaluation value is less than the merge mode rate distortion evaluation value, the merge flag is set to “0”. The prediction encoding
マージモードレート歪み評価値が予測ベクトルモードレート歪み評価値以下の場合は、マージフラグを「1」に設定する。予測符号化モード決定部122は、当該マージフラグおよびマージモード決定部121より供給されるマージインデックスを端子16に供給し、マージモード決定部121より供給される動き情報を端子50および端子51に供給する。なお、レート歪み評価値の具体的な算出方法は本発明の主眼ではないため詳細な説明は省略するが、予測誤差と符号量から符号量当たりの予測誤差量を算出し、レート歪み評価値が小さいほど符号化効率は高くなる特性を持つ評価値である。そのため、レート歪み評価値が小さい予測符号化モードを選択することで符号化効率を向上させることができる。
If the merge mode rate distortion evaluation value is less than or equal to the predicted vector mode rate distortion evaluation value, the merge flag is set to “1”. The predictive coding
(マージモード決定部121の構成)
続いて、マージモード決定部121の詳細な構成について説明する。図9は、マージモード決定部121の構成を説明するための図である。マージモード決定部121は、結合動き情報候補リスト生成部140および結合動き情報選択部141を含む。結合動き情報候補リスト生成部140は、実施の形態1に係る動画像符号化装置100により生成された符号列を復号する動画像復号装置200にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて同一の結合動き情報リストが生成される。
(Configuration of merge mode determination unit 121)
Next, a detailed configuration of the merge
(マージモード決定部121の機能と動作)
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部140は、端子12より供給される候補ブロック群からマージ候補最大数の結合動き情報候補を含む結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部141に供給する。結合動き情報候補リスト生成部140の詳細な構成については後述する。
(Function and operation of merge mode determination unit 121)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidate
結合動き情報選択部141は、結合動き情報候補リスト生成部140より供給される結合動き情報候補リストの中から、最適な結合動き情報候補を選択し、選択された結合動き情報候補を示す情報であるマージインデックスを決定して、当該マージインデックスを端子17に供給する。
The combined motion
ここで、最適な結合動き情報候補の選択方法について説明する。結合動き情報候補の予測方向、動きベクトルおよび参照インデックスに基づいて動き補償予測されて得られる端子14より供給される参照画像と、端子15より供給される画像信号とから予測誤差量が算出される。マージインデックスの符号量と、当該予測誤差量とからレート歪み評価値が算出されて、レート歪み評価値が最小となる結合動き情報候補が最適な結合動き情報候補として選択される。 Here, a method for selecting an optimal combined motion information candidate will be described. A prediction error amount is calculated from the reference image supplied from the terminal 14 obtained by motion compensation prediction based on the prediction direction, motion vector, and reference index of the combined motion information candidate, and the image signal supplied from the terminal 15. . A rate distortion evaluation value is calculated from the code amount of the merge index and the prediction error amount, and a combined motion information candidate that minimizes the rate distortion evaluation value is selected as an optimal combined motion information candidate.
(結合動き情報候補リスト生成部140の構成)
続いて、結合動き情報候補リスト生成部140の詳細な構成について説明する。図10は、結合動き情報候補リスト生成部140の構成を説明するための図である。端子19は結合動き情報選択部141に接続されている。結合動き情報候補リスト生成部140は、空間結合動き情報候補生成部160、時間結合動き情報候補生成部161、冗長結合動き情報候補削除部162、第1結合動き情報候補補充部163、および第2結合動き情報候補補充部164を含む。以降、結合動き情報候補を生成すると表記するが、導出すると言い換えてもよい。
(Configuration of combined motion information candidate list generation unit 140)
Next, a detailed configuration of the combined motion information candidate
(結合動き情報候補リスト生成部140の機能と動作)
以下、各部の機能と動作について説明する。図11は、結合動き情報候補リスト生成部140の動作を説明するためのフローチャートである。まず、結合動き情報候補リスト生成部140は、結合動き情報候補リストを初期化する(S100)。初期化された結合動き情報候補リストには結合動き情報候補は存在しない。
(Function and operation of combined motion information candidate list generation unit 140)
Hereinafter, the function and operation of each unit will be described. FIG. 11 is a flowchart for explaining the operation of the combined motion information candidate
次に、空間結合動き情報候補生成部160は、端子12より供給される候補ブロック群から0個から空間結合動き情報候補最大数の空間結合動き情報候補を生成して結合動き情報候補リストに追加し(S101)、当該結合動き情報候補リストと候補ブロック群を時間結合動き情報候補生成部161に供給する。空間結合動き情報候補生成部160の詳細な動作については後述する。また、空間結合動き情報候補最大数についても後述する。
Next, the spatially coupled motion information
次に、時間結合動き情報候補生成部161は、空間結合動き情報候補生成部160より供給される候補ブロック群から0個から時間結合動き情報候補最大数の時間結合動き情報候補を生成して空間結合動き情報候補生成部160より供給される結合動き情報候補リストに追加し(S102)、当該結合動き情報候補リストを冗長結合動き情報候補削除部162に供給する。時間結合動き情報候補生成部161の詳細な動作については後述する。また、時間結合動き情報候補最大数についても後述する。
Next, the temporally combined motion information
次に、冗長結合動き情報候補削除部162は、時間結合動き情報候補生成部161より供給される結合動き情報候補リストに登録されている結合動き情報候補を検査し、同一の動き情報を有する結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残してその他の結合動き情報候補を削除し(S103)、当該結合動き情報候補リストを第1結合動き情報候補補充部163に供給する。ここで、当該結合動き情報候補リストに登録されている結合動き情報候補は全てが異なる結合動き情報候補となる。
Next, the redundant combined motion information
次に、第1結合動き情報候補補充部163は、冗長結合動き情報候補削除部162より供給される結合動き情報候補リストに登録された結合動き情報候補から0個から2個の第1補充結合動き情報候補を生成して結合動き情報候補リストに追加し(S104)、当該結合動き情報候補リストを第2結合動き情報候補補充部164に供給する。第1結合動き情報候補補充部163の詳細な動作については後述する。
Next, the first combined motion information
次に、第2結合動き情報候補補充部164は、第1結合動き情報候補補充部163より供給される結合動き情報候補リストに登録された結合動き情報候補の数がマージ候補最大数に達するまで第2補充結合動き情報候補を生成して当該結合動き情報候補リストに追加し(S105)、当該結合動き情報候補リストを端子19に供給する。第2結合動き情報候補補充部164の詳細な動作については後述する。
Next, the second combined motion information
ここでは、空間結合動き情報候補生成部160と時間結合動き情報候補生成部161はそれぞれ空間結合動き情報候補と時間結合動き情報候補を生成して結合動き情報候補リストに追加するとしたが、空間結合動き情報候補生成部160と時間結合動き情報候補生成部161はそれぞれ空間結合動き情報候補と時間結合動き情報候補を生成するのみで、冗長結合動き情報候補削除部162の直前に生成した候補から結合動き情報候補リストを生成するようにしてもよい。
Here, the spatial combination motion information
(2N×2N候補ブロック群について)
以降、予測ブロックの候補ブロック群について説明する。最初に、予測ブロックサイズタイプが2N×2Nである予測ブロックについて説明する。図12は予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロック群について説明する図である。図12では予測ブロックサイズが16画素×16画素である例を示す。なお、後述する時間候補ブロックH及びIは、同じく後述する空間候補ブロックA〜Eが存在するピクチャとは別の復号済みのピクチャとは別のピクチャに存在するが、理解及び説明の容易のため、図12中では空間候補ブロックA〜Eとあわせて図示されている。
(About 2N × 2N candidate block group)
Hereinafter, candidate block groups of prediction blocks will be described. First, a prediction block whose prediction block size type is 2N × 2N will be described. FIG. 12 is a diagram for explaining a candidate block group of prediction blocks whose prediction block size type is 2N × 2N. FIG. 12 shows an example in which the predicted block size is 16 pixels × 16 pixels. Note that temporal candidate blocks H and I, which will be described later, exist in pictures different from decoded pictures that are different from pictures in which spatial candidate blocks A to E, which will also be described later, exist, but for ease of understanding and explanation. In FIG. 12, it is shown together with the space candidate blocks A to E.
空間候補ブロック群は、予測ブロックの左下の画素の左に位置するブロックA、予測ブロックの右上の画素の上に位置するブロックB、予測ブロックの右上の画素の右斜め上に位置するブロックC、予測ブロックの左下の画素の左斜め下に位置するブロックE、及び予測ブロックの左上の画素の左斜め上に位置するブロックDとする。このように、空間候補ブロック群は予測ブロックの位置と大きさに基づいて決定される。時間候補ブロック群は、ColPicの所定領域の代表ブロックであるブロックHとブロックIの2つとする。処理対象の予測ブロックの左上の画素の位置を ( x , y )、処理対象の予測ブロックの幅と高さをそれぞれPUW、PUHとすると、 ((((x+PUW)>>4)<<4), (((y+PUH)>>4)<<4))となる画素の位置をブロックの左上の画素の位置として含むColPic上のブロックを時間候補ブロックHとする。ここで、>>は右方向のビットシフト、<<は左方向のビットシフトである。 The spatial candidate block group includes a block A positioned to the left of the lower left pixel of the prediction block, a block B positioned above the upper right pixel of the prediction block, a block C positioned diagonally to the upper right of the upper right pixel of the prediction block, It is assumed that a block E is located at the lower left corner of the lower left pixel of the prediction block, and a block D is located at the upper left corner of the upper left pixel of the prediction block. Thus, the space candidate block group is determined based on the position and size of the prediction block. There are two time candidate block groups, block H and block I, which are representative blocks of a predetermined area of ColPic. If the position of the upper left pixel of the prediction block to be processed is (x, y) and the width and height of the prediction block to be processed are PUW and PUH, respectively, ((((x + PUW) >> 4) << 4) , ((Y + PUH) >> 4) << 4)) is a block on ColPic including the position of the pixel on the upper left of the block as a time candidate block H. Here, >> is a bit shift in the right direction, and << is a bit shift in the left direction.
同様に、(x+(PUW>>1),y+(PUH>>1))となる画素の位置をブロックの左上の画素の位置として含むColPic上のブロックを時間候補ブロックIとする。このように、時間候補ブロック群は予測ブロックの位置と大きさに基づいて決定される。このように、時間候補ブロックをColPicの所定領域(ここでは16画素×16画素)の代表ブロックとすることで、ColPicが記憶すべき動きベクトルや参照インデックスを削減できる。1画像で記憶する動きベクトルと参照インデックスを削減することで、複数の復号済み画像をColPicの対象とすることが可能となるため、予測効率を向上させる効果がある。 Similarly, a block on ColPic including the position of the pixel at (x + (PUW >> 1), y + (PUH >> 1)) as the position of the upper left pixel of the block is set as a time candidate block I. Thus, the time candidate block group is determined based on the position and size of the prediction block. In this way, by setting the time candidate block as a representative block of a predetermined area of ColPic (16 pixels × 16 pixels in this case), it is possible to reduce motion vectors and reference indexes to be stored by ColPic. By reducing the motion vector and reference index stored in one image, a plurality of decoded images can be targeted for ColPic, which has the effect of improving prediction efficiency.
ここで、予測ブロックサイズタイプが2N×2Nである符号化ブロックは1個の予測ブロックで構成されているため、予測ブロックサイズタイプが2N×2Nである予測ブロックに対する候補ブロックの位置は符号化ブロックに対する候補ブロックの位置に等しくなり、候補ブロックの位置は符号化ブロックの外となる。 Here, since the coding block whose prediction block size type is 2N × 2N is configured by one prediction block, the position of the candidate block with respect to the prediction block whose prediction block size type is 2N × 2N is the coding block. Is equal to the position of the candidate block, and the position of the candidate block is outside the encoded block.
ここでは、ブロックAを予測ブロックの左下としたが、予測ブロックの左辺に接していればよく、これに限定されない。また、ブロックBを予測ブロックの右上としたが、予測ブロックの上辺に接していればよく、これに限定されない。また、時間候補ブロック群をブロックHとブロックIの2個としたが、これに限定されない。 Here, the block A is set to the lower left of the prediction block, but it is sufficient that the block A is in contact with the left side of the prediction block, and the present invention is not limited to this. Moreover, although the block B was made into the upper right of the prediction block, it should just touch the upper side of a prediction block, and is not limited to this. In addition, although the time candidate block group includes two blocks H and I, the present invention is not limited to this.
(2N×2N以外の候補ブロック群のへの2N×2Nと同じ位置関係の適用例)
次に、予測ブロックサイズタイプが2N×2Nではない符号化ブロックにおける予測ブロックについて、予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用した例について説明する。図13は予測ブロックサイズタイプが2N×2Nではない符号化ブロックにおける予測ブロックについて、予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用した場合の候補ブロック群を示す図である。図13では図12と同様、時間候補ブロックH及びIは、空間候補ブロックA〜Eが存在するピクチャとは別の復号済みのピクチャとは別のピクチャに存在するが、理解及び説明の容易のため、空間候補ブロックA〜Eとあわせて図示されている。図13(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の候補ブロック群を示す。図13では予測ブロックサイズが16画素×16画素である例を示す。なお、時間候補ブロック群は予測ブロックサイズタイプが2N×2Nの場合と同様に導出され、図13にブロックHの位置を示す。このように、予測ブロックサイズタイプが2N×2Nではない符号化ブロックに含まれる予測ブロックでは、予測ブロックごとに予測ブロックの位置と大きさに基づいて候補ブロック群が決定される。
(Application example of the same positional relationship as 2N × 2N to a candidate block group other than 2N × 2N)
Next, an example will be described in which the same positional relationship is applied to a prediction block in a coding block whose prediction block size type is not 2N × 2N as a prediction block of a coding block whose prediction block size type is 2N × 2N. FIG. 13 shows a candidate block group in the case where the same positional relationship as that of a prediction block of a coding block whose prediction block size type is 2N × 2N is applied to a prediction block in a coding block whose prediction block size type is not 2N × 2N. FIG. In FIG. 13, as in FIG. 12, the temporal candidate blocks H and I exist in a different picture from the decoded picture different from the picture in which the spatial candidate blocks A to E exist. Therefore, it is shown together with the space candidate blocks A to E. FIGS. 13A to 13H show a
ここで、予測ブロックサイズタイプがN×2Nの予測ブロック1の場合(図13(b))、ブロックAは同一の符号化ブロックの予測ブロック0の内部にあり、ブロックAの動き情報を得るためには予測ブロック1を処理する前に予測ブロック0の動き情報が確定している必要があるため、予測ブロック1の候補ブロックとしてブロックAを利用した場合、予測ブロック0と予測ブロック1を同時に処理することはできない。また、最大符号化ブロックがラスタースキャン順、符号化ブロックがジグザグスキャン順で行われるため、ブロックEは必ず未処理ブロックとなる。同様に、予測ブロックサイズタイプが2N×Nの予測ブロック1の場合(図13(d))、ブロックBは同一の符号化ブロックの予測ブロック0の内部にあり、ブロックCは必ず未処理ブロックとなる。予測ブロックサイズタイプがN×Nの予測ブロック1(図13(f))、予測ブロック2(図13(g))、予測ブロック3(図13(h))についても、同一の符号化ブロックの内部にあるブロックと必ず未処理となるブロックについて図13の中にそれぞれ示す。
Here, in the case of the
予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2については同一の符号化ブロック内になく且つ必ず未処理とならない候補ブロックの数が3となり、予測ブロックサイズタイプがN×Nの予測ブロック3については同一の符号化ブロック内になく且つ必ず未処理とならない候補ブロックの数が0となる。候補ブロックが減じることは予測効率の低下に繋がる。
(候補ブロックの位置関係)
図14は実施の形態1における予測ブロックサイズタイプが2N×2N以外の予測ブロックと空間候補ブロック群の位置関係の一例を説明する図である。時間候補ブロック群については図13と同じである。図14(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の空間候補ブロック群を示す。図14では予測ブロックサイズが16画素×16画素である例を示す。
(Positional block position relationship)
FIG. 14 is a diagram for explaining an example of a positional relationship between a prediction block and a spatial candidate block group whose prediction block size type is other than 2N × 2N in the first embodiment. The time candidate block group is the same as in FIG. 14 (a) to 14 (h) respectively show a
ここでは、同一の符号化ブロックの他の予測ブロックの内部にあるブロックを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックに置き換える。つまり、予測ブロックサイズタイプがN×2Nの予測ブロック1の場合(図14(b))、ブロックAを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックAとする。予測ブロックサイズタイプが2N×Nの予測ブロック1の場合(図14(d))、ブロックBを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックBとする。予測ブロックサイズタイプがN×Nの予測ブロック1の場合(図14(f))、ブロックAとブロックEを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックAとブロックEとする。予測ブロックサイズタイプがN×Nの予測ブロック2の場合(図14(g))、ブロックBとブロックCを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックBとブロックCとする。予測ブロックサイズタイプがN×Nの予測ブロック3の場合(図14(h))、ブロックA、ブロックBとブロックDを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックA、ブロックBとブロックDとする。
Here, a block inside another prediction block of the same encoded block is replaced with a prediction block candidate block having a prediction block size type of 2N × 2N. That is, in the case of the
予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3について有効な候補ブロックの数が5となる。
以上のように、同一の符号化ブロックの他の予測ブロックに含まれる候補ブロックを、符号化ブロックが有する予測ブロックサイズの中で予測ブロックサイズが最大となる予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックにすることで、符号化ブロックに含まれる予測ブロック間における動き情報の依存関係がなくなり、符号化ブロックに含まれる複数の予測ブロックを同時に処理することが可能となる。 As described above, a candidate block included in another prediction block of the same encoded block has a prediction block size type of 2N × 2N that maximizes the prediction block size among the prediction block sizes of the encoded block. By making a prediction block candidate block, there is no dependency relationship of motion information between prediction blocks included in the encoded block, and a plurality of predicted blocks included in the encoded block can be processed simultaneously.
(空間結合動き情報候補生成部160の詳細な動作)
続いて、空間結合動き情報候補生成部160の詳細な動作について説明する。図15は、空間結合動き情報候補生成部160の動作を説明するためのフローチャートである。空間結合動き情報候補生成部160は、候補ブロック群の空間候補ブロック群に含まれる候補ブロックであるブロックA、ブロックB、ブロックC、ブロックE、ブロックDの順に以下の処理を繰り返し行う(S110からS114)。
(Detailed operation of spatially coupled motion information candidate generation unit 160)
Next, a detailed operation of the spatially coupled motion information
最初に、候補ブロックが有効であるか検査する(S111)。候補ブロックが有効であるとは、候補ブロックのL0予測とL1予測の参照インデックスの少なくとも一方が0以上であることである。候補ブロックが有効であれば(S111のY)、候補ブロックの動き情報を空間結合動き情報候補として結合動き情報候補リストに追加する(S112)。候補ブロックが有効でなければ(S111のN)、次の候補ブロックを検査する(S114)。ステップS112に続いて、結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数であるか検査する(S113)。ここでは、空間結合動き情報候補最大数を4とする。結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数でなければ(S113のN)、次の候補ブロックを検査する(S114)。結合動き情報候補リストに追加された空間結合動き情報候補の数が空間結合動き情報候補最大数であれば(S113のY)、処理を終了する。 First, it is checked whether the candidate block is valid (S111). That the candidate block is valid means that at least one of the reference indexes of the L0 prediction and the L1 prediction of the candidate block is 0 or more. If the candidate block is valid (Y in S111), the motion information of the candidate block is added to the combined motion information candidate list as a spatially combined motion information candidate (S112). If the candidate block is not valid (N in S111), the next candidate block is inspected (S114). Following step S112, it is checked whether the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (S113). Here, the maximum number of spatially coupled motion information candidates is 4. If the number of spatially combined motion information candidates added to the combined motion information candidate list is not the maximum number of spatially combined motion information candidates (N in S113), the next candidate block is examined (S114). If the number of spatially combined motion information candidates added to the combined motion information candidate list is the maximum number of spatially combined motion information candidates (Y in S113), the process ends.
ここでは、処理対象ブロックとの接線の長く一般的に処理対象ブロックとの相関性の高いと考えられるブロックAとブロックBの動き情報を優先して結合動き情報候補リストに登録できるように処理の順序をブロックA、ブロックB、ブロックC、ブロックE、ブロックDとしたが、処理対象ブロックと相関性の高い順序または候補ブロックとして選択確率の高い順序で結合動き情報候補が結合動き情報候補リストに登録されればよく、これに限定されない。例えば、予測ブロックサイズタイプがN×2Nの予測ブロック1の場合は、ブロックB、ブロックC、ブロックE、ブロックD、ブロックAの順に、予測ブロックサイズタイプが2N×Nの予測ブロック1の場合は、ブロックA、ブロックC、ブロックE、ブロックD、ブロックBの順に、予測ブロックサイズタイプがN×Nの予測ブロック1の場合は、ブロックB、ブロックC、ブロックD、ブロックA、ブロックEの順に、予測ブロックサイズタイプがN×Nの予測ブロック2の場合は、ブロックA、ブロックE、ブロックD、ブロックB、ブロックCの順に、予測ブロックサイズタイプがN×Nの予測ブロック3の場合は、ブロックC、ブロックE、ブロックA、ブロックB、ブロックDの順にすることもできる。このように、処理対象の予測ブロックに近い順に結合動き情報候補リストに追加することで、処理対象の予測ブロックに近いブロックに大きなマージインデックスが割り当てられることを防止することができ、符号化効率を向上させることができる。また、空間結合動き情報候補最大数を4としたが、空間結合動き情報候補最大数は1以上でマージ候補最大数以下であればよく、これに限定されない。
Here, the processing information is processed so that the motion information of block A and block B, which are generally considered to have a long tangent to the processing target block and generally have a high correlation with the processing target block, can be preferentially registered in the combined motion information candidate list. Although the order is block A, block B, block C, block E, and block D, the combined motion information candidates are added to the combined motion information candidate list in the order of high correlation with the processing target block or as the candidate block. It only needs to be registered, and is not limited to this. For example, when the prediction block size type is N ×
(時間結合動き情報候補生成部161の詳細な動作)
続いて、時間結合動き情報候補生成部161の詳細な動作について説明する。図16は、時間結合動き情報候補生成部161の動作を説明するためのフローチャートである。L0予測とL1予測の各予測方向LXについて以下の処理を繰り返し行う(S120からS127)。ここで、Xは0または1である。また、候補ブロック群の時間候補ブロック群に含まれる候補ブロックであるブロックH、ブロックIの順に以下の処理を繰り返し行う(S121からS126)。
(Detailed operation of time combination motion information candidate generation unit 161)
Subsequently, a detailed operation of the time combination motion information
時間結合動き情報候補生成部161は、候補ブロックのLN予測が有効であるか検査する(S122)。ここで、Nは0または1である。ここでは、NはXと同じであるとする。候補ブロックのLN予測が有効であるとは、候補ブロックのLN予測の参照インデックスが0以上であることである。候補ブロックのLN予測が有効であれば(S122のY)、候補ブロックのLN予測の動きベクトルを基準動きベクトルとする(S123)。候補ブロックのLN予測が有効でなければ(S122のN)、ステップ123からステップ126をスキップして次の候補ブロックを検査する(S126)。
The temporal combination motion information
ステップS123に続いて、時間結合動き情報候補のLX予測の参照画像を決定する(S124)。ここでは、時間結合動き情報候補のLX予測の参照画像は、LX予測の参照インデックス0の参照画像とする。ここでは、時間結合動き情報候補のLX予測の参照画像をLX予測の参照インデックス0の参照画像としたが、符号化ブロック内の他の予測ブロックの値に依存しなければよく、これに限定されない。次に、基準動きベクトルを処理対象画像と時間結合動き情報候補のLX予測の参照画像の距離に合うようにスケーリングして時間結合動き情報候補のLX予測の動きベクトルを算出し(S125)、次の予測方向を処理する(S127)。時間結合動き情報候補のLX予測の動きベクトルの具体的な算出式については、後述する。L0予測とL1予測について処理が終了したステップS127に続いて、時間結合動き情報候補のL0予測とL1予測の少なくとも一方の予測が有効であるか検査する(S128)。時間結合動き情報候補のL0予測とL1予測の少なくとも一方の予測が有効であれば(S128のY)、時間結合動き情報候補のインター予測タイプを決定して、当該時間結合動き情報候補を結合動き情報候補リストに追加する(S129)。ここでは、インター予測タイプの決定は、L0予測だけが有効であれば、時間結合動き情報候補のインター予測タイプをPred_L0とし、L1予測だけが有効であれば、時間結合動き情報候補のインター予測タイプをPred_L1とし、L0予測とL1予測の両方が有効であれば、時間結合動き情報候補のインター予測タイプをPred_BIとする。
Subsequent to step S123, a reference image for LX prediction of a temporally combined motion information candidate is determined (S124). Here, the LX prediction reference image of the temporally combined motion information candidate is a reference image with a
続いて、時間結合動き情報候補のLX予測の動きベクトルの算出式について説明する。時間候補ブロックを有するColPicと時間候補ブロックがLX予測の動き補償予測で参照するピクチャであるColRefLXPicの画像間距離をtd、時間結合動き情報候補のLX予測の参照画像RefLXPicと処理対象画像CurPicの画像間距離をtb、LX予測の基準動きベクトルをmvLXとすると、時間結合動き情報候補のLX予測の動きベクトルmvLXColは式1より算出される。式1より時間結合動き情報候補のLX予測の動きベクトルの算出にはtbとtdを算出するための減算と、除算、及び乗算が必要となることがわかる。
mvLXCol = tb / td * mvLX; 式1
Next, a formula for calculating a motion vector for LX prediction of temporally combined motion information candidates will be described. The distance between images of ColPic having a temporal candidate block and ColRefLXPic which is a picture to which the temporal candidate block refers in motion compensated prediction of LX prediction is td, the reference image RefLXPic of the LX prediction of the temporal combined motion information candidate and the image of the processing target image CurPic When the inter-distance is tb and the reference motion vector for LX prediction is mvLX, the LX prediction motion vector mvLXCol of the temporally combined motion information candidate is calculated from
mvLXCol = tb / td * mvLX;
式1は浮動小数点演算の簡略化のために整数演算とする場合には、例えば、式2から式4のように展開して利用してもよい。Abs(v)は値vの絶対値を算出する関数、Clip3(uv,lv,v)は値vを下限lvから上限uvまでに制限する関数、Sign(v)は値vが0以上であれば1を値vが0より小さい場合は−1を返す関数である。
tx = (16384+Abs(td/2) ) / td; 式2
DistScaleFactor = Clip3( -1024, 1023, ( tb * tx + 32 ) >> 6 ); 式3
mvLXCol=Sign(DistScaleFactor*mvLX)*((Abs(DistScaleFactor*mvLX)+127)>>8); 式4
In the case where the
tx = (16384 + Abs (td / 2)) / td;
DistScaleFactor = Clip3 (-1024, 1023, (tb * tx + 32) >>6);
mvLXCol = Sign (DistScaleFactor * mvLX) * ((Abs (DistScaleFactor * mvLX) +127) >>8);
ここでは、結合動き情報候補リストに登録できる時間結合動き情報候の最大数である時間結合動き情報候補最大数を1とした。そのため、図16には空間結合動き情報候補生成部160の動作を説明するフローチャートである図14で示したステップS115に相当する処理を省略したが、時間結合動き情報候補最大数が2以上である場合にはステップS129の後にステップS115に相当する処理を追加することもできる。
Here, the maximum number of temporally combined motion information candidates that is the maximum number of temporally combined motion information candidates that can be registered in the combined motion information candidate list is 1. Therefore, FIG. 16 omits the processing corresponding to step S115 shown in FIG. 14 which is a flowchart for explaining the operation of the spatially coupled motion information
ここでは、NはXと同じであるとしたが、NはXと異なっていても良く、これに限定されない。 Here, N is the same as X, but N may be different from X and is not limited to this.
(第1結合動き情報候補補充部163の詳細な動作)
続いて、第1結合動き情報候補補充部163の詳細な動作について説明する。図17は、第1結合動き情報候補補充部163の動作を説明するためのフローチャートである。最初に、より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第1補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式5より算出する(S170)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; (NumCandList>1)
MaxNumGenCand=0; (NumCandList<=1) 式5
(Detailed operation of first combined motion information candidate supplementing unit 163)
Next, the detailed operation of the first combined motion information
MaxNumGenCand = MaxNumMergeCand-NumCandList; (NumCandList> 1)
MaxNumGenCand = 0; (NumCandList <= 1)
次に、MaxNumGenCandが0より大きいか検査する(S171)。MaxNumGenCandが0より大きくなければ(S171のN)、処理を終了する。MaxNumGenCandが0より大きければ(S171のY)、以下の処理を行う。まず、組み合わせ検査回数であるloopTimesを決定する。loopTimesはNumCandList×NumCandListに設定する。ただし、loopTimesが8を超える場合にはloopTimesは8に制限する(S172)。ここで、loopTimesは0から7までの整数となる。loopTimesだけ以下の処理を繰り返し行う(S172からS180)。結合動き情報候補Mと結合動き情報候補Nの組み合わせを決定する(S173)。ここで、組み合わせ検査回数と結合動き情報候補Mと結合動き情報候補Nの関係について説明する。図18は組み合わせ検査回数と結合動き情報候補Mと結合動き情報候補Nの関係を説明するための図である。図18のようにMとNは異なる値であって、MとNの合計値が小さくなる順に設定される。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効であるか検査する(S174)。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効であれば(S174のY)、結合動き情報候補MのL0予測の参照画像と動きベクトルが結合動き情報候補NのL1予測の参照画像と動きベクトルと異なるか検査する(S175)。結合動き情報候補MのL0予測が有効で且つ結合動き情報候補NのL1予測が有効でなければ(S174のN)、次の組み合わせを処理する。結合動き情報候補MのL0予測の参照画像と結合動き情報候補NのL1予測の参照画像が異なれば(S175のY)、結合動き情報候補MのL0予測の動きベクトルと参照画像を結合動き情報候補NのL1予測の動きベクトルと参照画像と組み合わせてインター予測タイプがPred_BIである双結合動き情報候補を生成する(S176)。ここでは、第1補充結合動き情報候補として、ある結合動き情報候補のL0予測とそれとは異なる結合動き情報候補のL1予測の動き情報を組み合わせた双結合動き情報を生成する。結合動き情報候補MのL0予測の参照画像と結合動き情報候補NのL1予測の参照画像が同じであれば(S175のN)、次の組み合わせを処理する。ステップS176に続いて、双結合動き情報候補を結合動き情報候補リストに追加する(S178)。ステップS178に続いて、生成した双結合動き情報の数がMaxNumGenCandであるか検査する(S179)。生成された双結合動き情報の数がMaxNumGenCandであれば(S179のY)、処理を終了する。生成された双結合動き情報の数がMaxNumGenCandでなければ(S179のN)、次の組み合わせを処理する。 Next, it is checked whether MaxNumGenCand is greater than 0 (S171). If MaxNumGenCand is not greater than 0 (N in S171), the process ends. If MaxNumGenCand is greater than 0 (Y in S171), the following processing is performed. First, loopTimes that is the number of combination inspections is determined. loopTimes is set to NumCandList × NumCandList. However, if loopTimes exceeds 8, loopTimes is limited to 8 (S172). Here, loopTimes is an integer from 0 to 7. The following processing is repeated for loopTimes (S172 to S180). A combination of the combined motion information candidate M and the combined motion information candidate N is determined (S173). Here, the relationship between the number of combination inspections, the combined motion information candidate M, and the combined motion information candidate N will be described. FIG. 18 is a diagram for explaining the relationship between the number of combination inspections, the combined motion information candidate M, and the combined motion information candidate N. As shown in FIG. 18, M and N are different values, and are set in order of decreasing total value of M and N. It is checked whether the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (S174). If the L0 prediction of the combined motion information candidate M is valid and the L1 prediction of the combined motion information candidate N is valid (Y in S174), the L0 prediction reference image of the combined motion information candidate M and the motion vector are combined motion information candidates. It is checked whether or not the reference image of the N L1 prediction is different from the motion vector (S175). If the L0 prediction of the combined motion information candidate M is not valid and the L1 prediction of the combined motion information candidate N is not valid (N in S174), the next combination is processed. If the reference image for L0 prediction of the combined motion information candidate M and the reference image for L1 prediction of the combined motion information candidate N are different (Y in S175), the motion vector of the combined motion information candidate M and the reference image for the L0 prediction are combined motion information. By combining the motion vector of L1 prediction of candidate N and the reference image, a bi-join motion information candidate having an inter prediction type of Pred_BI is generated (S176). Here, as the first supplemental combined motion information candidate, bi-coupled motion information is generated by combining the L0 prediction of a certain combined motion information candidate and the L1 prediction motion information of a different combined motion information candidate. If the reference image for L0 prediction of the combined motion information candidate M and the reference image for L1 prediction of the combined motion information candidate N are the same (N in S175), the next combination is processed. Subsequent to step S176, the bi-join motion information candidate is added to the joint motion information candidate list (S178). Subsequent to step S178, it is checked whether the number of generated double-coupled motion information is MaxNumGenCand (S179). If the number of generated double coupled motion information is MaxNumGenCand (Y in S179), the process ends. If the number of generated double coupled motion information is not MaxNumGenCand (N in S179), the next combination is processed.
ここでは、第1補充結合動き情報候補を、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルと参照画像を、別の結合動き情報候補のL1予測の動きベクトルと参照画像と組み合わせて、動き補償予測の方向が双方向である双結合動き情報候補としたが、これに限定されない。例えば、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルとL1予測の動きベクトルに+1などのオフセット値を加えた動き補償予測の方向が双方向である結合動き情報候補、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルまたはL1予測の動きベクトルに+1などのオフセット値を加えた動き補償予測の方向が単方向である結合動き情報候補としてもよい。第1補充結合動き情報候補の別の例として、結合動き情報候補リストに登録されたある結合動き情報候補のL0予測の動きベクトルを基準としてL1予測の動きベクトルをスケーリングにより求め、それらを組み合わせて動き補償予測の方向が双方向である新たな結合動き情報候補を生成してもよい。また、それらを任意に組み合わせてもよい。 Here, the first supplemental combined motion information candidate is set as an L0 prediction motion vector of a certain combined motion information candidate registered in the combined motion information candidate list and the reference image, and the L1 prediction motion vector of another combined motion information candidate. In combination with the reference image, a bi-coupled motion information candidate in which the direction of motion compensation prediction is bidirectional is used, but the present invention is not limited to this. For example, combined motion information in which the direction of motion compensated prediction in which an offset value such as +1 is added to the motion vector of L0 prediction and the motion vector of L1 prediction of a certain combined motion information candidate registered in the combined motion information candidate list is bidirectional. Combined motion information in which the direction of motion compensated prediction obtained by adding an offset value such as +1 to the motion vector of L0 prediction or the motion vector of L1 prediction of a certain combined motion information candidate registered in the candidate, combined motion information candidate list is unidirectional Can also be a candidate. As another example of the first supplemental combined motion information candidate, a motion vector of L1 prediction is obtained by scaling based on a motion vector of L0 prediction of a combined motion information candidate registered in the combined motion information candidate list, and these are combined. A new combined motion information candidate in which the direction of motion compensation prediction is bidirectional may be generated. Moreover, you may combine them arbitrarily.
ここで、第1補充結合動き情報候補は、結合動き情報候補リストに登録された結合動き情報候補の動き情報と処理対象の動き情報候補の動きに微妙にずれがある場合に、結合動き情報候補リストに登録された結合動き情報候補の動き情報を修正して新たな有効となる結合動き情報候補を生成することで、符号化効率を高めることができる。 Here, the first supplemental combined motion information candidate is a combined motion information candidate when there is a slight difference between the motion information of the combined motion information candidate registered in the combined motion information candidate list and the motion information candidate to be processed. By correcting the motion information of the combined motion information candidate registered in the list and generating a new effective combined motion information candidate, the encoding efficiency can be improved.
(第2結合動き情報候補補充部164の詳細な動作)
続いて、第2結合動き情報候補補充部164の詳細な動作について説明する。図19は、第2結合動き情報候補補充部164の動作を説明するためのフローチャートである。最初に、第1結合動き情報候補補充部163より供給される結合動き情報候補リストに登録された結合動き情報候補の数(NumCandList)とマージ候補最大数(MaxNumMergeCand)から、第1補充結合動き情報候補を生成する最大数であるMaxNumGenCandを式6より算出する(S190)。
MaxNumGenCand=MaxNumMergeCand-NumCandList; 式6
(Detailed operation of second combined motion information candidate supplementing unit 164)
Next, the detailed operation of the second combined motion information
MaxNumGenCand = MaxNumMergeCand-NumCandList;
次に、以下の処理をiについてMaxNumGenCand回繰り返し行う(S191からS195)。ここで、iは0からMaxNumGenCand−1の整数となる。L0予測の動きベクトルが(0,0)、参照インデックスがiであって、L1予測の動きベクトルが(0,0)、参照インデックスがiであるインター予測タイプがPred_BIである第2補充結合動き情報候補を生成する(S192)。第2補充結合動き情報候補を結合動き情報候補リストに追加する(S194)。次のiについて処理する(S195)。 Next, the following process is repeated MaxNumCand times for i (S191 to S195). Here, i is an integer from 0 to MaxNumGenCand-1. The second supplemental combined motion in which the motion vector for L0 prediction is (0,0), the reference index is i, the motion vector for L1 prediction is (0,0), and the inter prediction type for which the reference index is i is Pred_BI. Information candidates are generated (S192). The second supplementary combined motion information candidate is added to the combined motion information candidate list (S194). The next i is processed (S195).
ここでは、第2補充結合動き情報候補を、L0予測の動きベクトルが(0,0)、参照インデックスがiであって、L1予測の動きベクトルが(0,0)、参照インデックスがiであるインター予測タイプがPred_BIである結合動き情報候補とした。これは、一般的な動画像において、L0予測の動きベクトルとL1予測の動きベクトルが(0,0)である結合動き情報候補の発生頻度が統計的に高いためである。結合動き情報候補リストに登録された結合動き情報候補の動き情報に依存せず、統計的に利用頻度が高い結合動き情報候補であれば、これに限定されない。例えば、L0予測やL1予測の動きベクトルはそれぞれ(0,0)以外のベクトル値でもよく、L0予測とL1予測の参照インデックスが異なるように設定してもよい。また、第2補充結合動き情報候補を符号化済みの画像や符号化済みの画像の一部の発生頻度の高い動き情報とし、符号化ストリームに符号化して伝送して設定することもできる。なお、ここではBピクチャについて説明したが、Pピクチャの場合は、L0予測の動きベクトルが(0,0)で、インター予測タイプがPred_L0である第2補充結合動き情報候補を生成する。 Here, the second supplementary combined motion information candidate has a motion vector for L0 prediction of (0, 0), a reference index of i, a motion vector of L1 prediction of (0, 0), and a reference index of i. The combined motion information candidate whose inter prediction type is Pred_BI is used. This is because, in a general moving image, the frequency of occurrence of combined motion information candidates in which the motion vector for L0 prediction and the motion vector for L1 prediction are (0, 0) is statistically high. The present invention is not limited to this as long as it is a combined motion information candidate that is statistically frequently used without depending on the motion information of the combined motion information candidate registered in the combined motion information candidate list. For example, the motion vectors of L0 prediction and L1 prediction may be vector values other than (0, 0), respectively, and may be set so that the reference indexes of L0 prediction and L1 prediction are different. Alternatively, the second supplementary combined motion information candidate can be set as an encoded image or motion information with a high occurrence frequency of a part of the encoded image, encoded in an encoded stream, and transmitted. Although the B picture has been described here, in the case of the P picture, a second supplementary combined motion information candidate having an L0 prediction motion vector of (0, 0) and an inter prediction type of Pred_L0 is generated.
ここで、第2補充結合動き情報候補として結合動き情報候補リストに登録された結合動き情報候補に依存しない結合動き情報候補を設定することで、結合動き情報候補リストに登録された結合動き情報候補が0個である場合に、マージモードを利用することを可能とし、符号化効率を向上させることができる。また、結合動き情報候補リストに登録された結合動き情報候補の動き情報と処理対象の動き情報候補の動きが異なる場合に、新たな結合動き情報候補を生成して選択肢の幅を広げることで、符号化効率を向上させることができる。 Here, by setting a combined motion information candidate that does not depend on the combined motion information candidate registered in the combined motion information candidate list as the second supplemental combined motion information candidate, the combined motion information candidate registered in the combined motion information candidate list When the number is zero, it is possible to use the merge mode and improve the encoding efficiency. In addition, when the motion information of the combined motion information candidate registered in the combined motion information candidate list and the motion information candidate motion to be processed are different, by generating a new combined motion information candidate and expanding the range of options, Encoding efficiency can be improved.
(動画像復号装置200の構成)
次に、実施の形態1の動画像復号装置を説明する。図20は、実施の形態1に係る動画像復号装置200の構成を示す図である。動画像復号装置200は、動画像符号化装置100により符号化された符号列を復号して再生画像を生成する装置である。
(Configuration of moving picture decoding apparatus 200)
Next, the moving picture decoding apparatus according to the first embodiment will be described. FIG. 20 is a diagram showing a configuration of the
動画像復号装置200は、CPU(Central Processing Unit)、フレームメモリ、ハードディスクなどを備える情報処理装置などのハードウェアにより実現される。動画像復号装置200は、上記の構成要素が動作することにより、以下に説明する機能的な構成要素を実現する。符号化ブロックの分割、スキップモードの決定、予測ブロックサイズタイプの決定、予測ブロックサイズと予測ブロックの符号化ブロック内の位置(予測ブロックの位置情報)の決定、予測符号化モードがイントラであるかの決定は図示しない上位の制御部で決定されているものとし、ここでは予測符号化モードがイントラでない場合について説明する。なお、復号対象の予測ブロックの位置情報、予測ブロックサイズに関しては動画像復号装置200内で共有していることとし、図示しない。
The moving
実施の形態1の動画像復号装置200は、符号列解析部201、予測誤差復号部202、加算部203、動き情報再生部204、動き補償部205、フレームメモリ206および動き情報メモリ207を備える。
The moving
(動画像復号装置200の動作)
以下、各部の機能と動作について説明する。符号列解析部201は、端子30より供給された符号列を解析して予測誤差符号化データ、マージフラグ、マージインデックス、動き補償予測の予測方向(インター予測タイプ)、参照インデックス、差分ベクトル、および予測ベクトルインデックスをシンタックスに従ってエントロピー復号する。エントロピー復号は算術符号化やハフマン符号化などの可変長符号化を含む方法によって実施される。そして、当該予測誤差符号化データを予測誤差復号部202に、当該マージフラグ、当該マージインデックス、当該インター予測タイプ、当該参照インデックス、当該差分ベクトル、および当該予測ベクトルインデックスを動き情報再生部204に供給する。
(Operation of the video decoding device 200)
Hereinafter, the function and operation of each unit will be described. The code
また、符号列解析部201は、動画像復号装置200で利用される符号化ブロックの分割情報、予測ブロックサイズタイプ、及び予測符号化モードを、符号化ストリームの特性を決定するためのパラメータ群を定義したSPS(Sequence Parameter Set)、ピクチャの特性を決定するためのパラメータ群を定義したPPS(Picture Parameter Set)、やスライスの特性を決定するためのパラメータ群を定義したスライスヘッダなどと共に符号化ストリームから復号する。
In addition, the code
動き情報再生部204は、符号列解析部201より供給されるマージフラグ、マージインデックス、インター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスと、動き情報メモリ207より供給される候補ブロック群から、動き情報を再生し、当該動き情報を動き補償部205および動き情報メモリ207に供給する。動き情報再生部204の詳細な構成については後述する。
The motion
動き補償部205は、動き情報再生部204より供給される動き情報に基づいて、フレームメモリ206内の参照インデックスが示す参照画像を、動きベクトルに基づき動き補償して予測信号を生成する。予測方向が双予測であれば、L0予測とL1予測の予測信号を平均したものを予測信号として生成し、当該予測信号を加算部203に供給する。
Based on the motion information supplied from the motion
予測誤差復号部202は、符号列解析部201より供給される予測誤差符号化データに対して、逆量子化や逆直交変換などの処理を行って予測誤差信号を生成し、当該予測誤差信号を加算部203に供給する。
The prediction
加算部203は、予測誤差復号部202より供給される予測誤差信号と、動き補償部205より供給される予測信号とを加算して復号画像信号を生成し、当該復号画像信号をフレームメモリ206および端子31に供給する。
The adding
フレームメモリ206および動き情報メモリ207は、動画像符号化装置100のフレームメモリ110および動き情報メモリ111と同一の機能を有する。フレームメモリ206は、加算部203より供給される復号画像信号を記憶する。動き情報メモリ207は、動き情報再生部204より供給される動き情報を最小の予測ブロックサイズ単位で記憶する。
The
(動き情報再生部204の詳細な構成)
続いて、動き情報再生部204の詳細な構成について説明する。図21は、動き情報再生部204の構成を示す。動き情報再生部204は、符号化モード判定部210、動きベクトル再生部211および結合動き情報再生部212を含む。端子32は符号列解析部201に、端子33は動き情報メモリ207に、端子34は動き補償部205に、端子36は動き情報メモリ207にそれぞれ接続されている。
(Detailed configuration of the motion information playback unit 204)
Next, a detailed configuration of the motion
(動き情報再生部204の詳細な動作)
以下、各部の機能と動作について説明する。符号化モード判定部210は、符号列解析部201より供給されるマージフラグが「0」であるか「1」であるか判定する。マージフラグが「0」であれば、符号列解析部201より供給されるインター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスを動きベクトル再生部211に供給する。マージフラグが「1」であれば、符号列解析部201より供給されるマージインデックスを結合動き情報再生部212に供給する。
(Detailed operation of the motion information playback unit 204)
Hereinafter, the function and operation of each unit will be described. The encoding
動きベクトル再生部211は、符号化モード判定部210より供給されるインター予測タイプ、参照インデックス、差分ベクトル、および予測ベクトルインデックスと、端子33より供給される候補ブロック群から、動きベクトルを再生して動き情報を生成し、端子34及び端子36に供給する。
The motion
結合動き情報再生部212は、端子33より供給される候補ブロック群から結合動き情報候補リストを生成し、当該結合動き情報候補リストから符号化モード判定部210より供給されるマージインデックスによって示される結合動き情報候補の動き情報を選択して端子34及び端子36に供給する。
The combined motion
(結合動き情報再生部212の詳細な構成)
続いて、結合動き情報再生部212の詳細な構成について説明する。図22は、結合動き情報再生部212の構成を示す。結合動き情報再生部212は、結合動き情報候補リスト生成部230および結合動き情報選択部231を含む。端子35は符号化モード判定部210に接続されている。
(Detailed Configuration of Combined Motion Information Reproducing Unit 212)
Next, a detailed configuration of the combined motion
(結合動き情報再生部212の詳細な動作)
以下、各部の機能と動作について説明する。結合動き情報候補リスト生成部230は動画像符号化装置100の結合動き情報候補リスト生成部140と同一の機能を有し、動画像符号化装置100の結合動き情報候補リスト生成部140と同一の動作によって結合動き情報候補リストを生成し、当該結合動き情報候補リストを結合動き情報選択部231に供給する。
(Detailed operation of the combined motion information reproduction unit 212)
Hereinafter, the function and operation of each unit will be described. The combined motion information candidate
結合動き情報選択部231は、結合動き情報候補リスト生成部230より供給される結合動き情報候補リストの中から、端子35より供給されるマージインデックスで示される結合動き情報候補を選択して結合動き情報を決定し、当該結合動き情報の動き情報を端子34及び端子36に供給する。
The combined motion
以上のように、動画像復号装置200は、動画像符号化装置100により符号化された符号列を復号して再生画像を生成することができる。
As described above, the moving
[実施の形態2]
以下、実施の形態2について説明する。実施の形態1とは予測ブロックサイズタイプが2N×2N以外の予測ブロックについて空間結合動き情報候補生成部160において利用する空間候補ブロック群が異なる。以下、実施の形態2の予測ブロックサイズタイプが2N×2N以外の予測ブロックの空間候補ブロック群について説明する。
[Embodiment 2]
The second embodiment will be described below. The spatial candidate block group used in the spatially coupled motion information
図23は実施の形態2における予測ブロックサイズタイプが2N×2N以外の予測ブロックと空間候補ブロック群の位置関係を説明する図である。図23(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の空間候補ブロック群を示す。図23では予測ブロックサイズが16画素×16画素である例を示す。このように、予測ブロックサイズタイプが2N×2Nではない符号化ブロックに含まれる予測ブロックでは、予測ブロックごとに予測ブロックの位置と大きさに基づいて候補ブロック群が決定される。
FIG. 23 is a diagram for explaining the positional relationship between a prediction block other than the prediction block size type of 2N × 2N and a spatial candidate block group in the second embodiment. 23 (a) to (h) respectively show a
ここでは、前記の第1の例に加えて、必ず未処理となるブロックも予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックに置き換える。つまり、予測ブロックサイズタイプがN×2Nの予測ブロック1の場合(図23(b))、ブロックEを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックEとする。予測ブロックサイズタイプが2N×Nの予測ブロック1の場合(図23(d))、ブロックCを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックCとする。予測ブロックサイズタイプがN×Nの予測ブロック3の場合(図23(h))、ブロックCとブロックEを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックのブロックCとブロックEとする。
Here, in addition to the first example described above, blocks that are always unprocessed are also replaced with prediction block candidate blocks whose prediction block size type is 2N × 2N. That is, when the prediction block size type is the
以上のように、必ず未処理となる候補ブロックを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックにすることで、必ず未処理となる候補ブロックを有効となる可能性のある候補ブロックとすることができ、マージモードの選択肢を増加させることでマージモードの選択率が上がり、符号化効率を向上させることができる。入れ替えた候補ブロックの動き情報を他の結合動き情報候補の動き情報と組み合わせて新たな動き情報を生成したり、入れ替えた候補ブロックの動き情報を修正して、第2補充結合動き情報候補よりも相対的に選択率の高い第1補充結合動き情報候補を結合動き情報候補リストに追加することで、符号化効率を高めることができる。特に、双結合動き情報候補を利用する場合には少なくとも2つの結合動き情報候補が必要となるため、結合動き情報候補リストに入れ替えた候補ブロック以外の結合動き情報候補が1個しか登録されていない場合に、入れ替えた候補ブロックの動き情報が効果的に作用する。 As described above, a candidate block that is necessarily unprocessed may be enabled by making a candidate block that is always unprocessed a candidate block of a prediction block whose prediction block size type is 2N × 2N. By increasing the merge mode options, the merge mode selection rate can be increased and the encoding efficiency can be improved. The motion information of the replaced candidate block is combined with the motion information of the other combined motion information candidates to generate new motion information, or the motion information of the replaced candidate block is corrected so that the second supplementary combined motion information candidate By adding the first supplementary combined motion information candidate having a relatively high selection rate to the combined motion information candidate list, the encoding efficiency can be increased. In particular, since at least two combined motion information candidates are required when using a dual combined motion information candidate, only one combined motion information candidate other than the candidate block replaced with the combined motion information candidate list is registered. In this case, the motion information of the replaced candidate block works effectively.
また、空間結合動き情報候補生成部160の動作において、結合動き情報候補リストへの登録順序をブロックA、ブロックB、ブロックC、ブロックE、ブロックDとしたが、以下のように変形することもできる。
In addition, in the operation of the spatially coupled motion information
予測ブロックサイズタイプがN×2Nの予測ブロック1の場合は、ブロックB、ブロックC、ブロックD、ブロックA、ブロックEの順に、予測ブロックサイズタイプが2N×Nの予測ブロック1の場合は、ブロックA、ブロックE、ブロックD、ブロックB、ブロックCの順に、予測ブロックサイズタイプがN×Nの予測ブロック1の場合は、ブロックB、ブロックC、ブロックD、ブロックA、ブロックEの順に、予測ブロックサイズタイプがN×Nの予測ブロック2の場合は、ブロックA、ブロックE、ブロックD、ブロックB、ブロックCの順にすることもできる。このように、処理対象の予測ブロックに近い順に結合動き情報候補リストに追加することで、処理対象の予測ブロックに近いブロックに大きなマージインデックスが割り当てられることを防止することができ、符号化効率を向上させることができる。
When the prediction block size type is
[実施の形態3]
最初に、予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを共通とする一例について説明する。実施の形態1とは予測ブロックサイズタイプが2N×2N以外の予測ブロックと空間候補ブロック群と時間候補ブロック群が異なる。以下、予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを共通とする一例の予測ブロックサイズタイプが2N×2N以外の予測ブロックの空間候補ブロック群と時間候補ブロック群について説明する。本例では、予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを予測ブロックサイズタイプが2N×2Nである予測ブロックの候補ブロックとする。
[Embodiment 3]
First, an example in which the prediction block candidate blocks in the encoded block are made common without depending on the prediction block size type will be described. The prediction block size type is different from that of the first embodiment in the prediction block, the spatial candidate block group, and the temporal candidate block group other than 2N × 2N. Hereinafter, a spatial candidate block group and a temporal candidate block group of a prediction block whose prediction block size type is an example other than 2N × 2N, in which the prediction block size type in the encoded block is common without depending on the prediction block size type. explain. In this example, the prediction block candidate block in the encoded block is determined as a prediction block candidate block having a prediction block size type of 2N × 2N without depending on the prediction block size type.
図24は予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを共通とする一例における予測ブロックサイズタイプが2N×2N以外の予測ブロックと候補ブロック群の位置関係を説明する図である。図24では、時間候補ブロックH及びIは、空間候補ブロックA〜Eが存在するピクチャとは別の復号済みのピクチャとは別のピクチャに存在するが、理解及び説明の容易のため、空間候補ブロックA〜Eとあわせて図示されている。図24(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の空間候補ブロック群を示す。図24では予測ブロックサイズが16画素×16画素である例を示す。予測ブロックサイズタイプが2N×2N以外の予測ブロックの時間候補ブロック群として、図24に示すように予測ブロックサイズタイプが2N×2Nの予測ブロックとして導出した時間候補ブロック群を利用する。
FIG. 24 illustrates the positional relationship between a prediction block and a candidate block group whose prediction block size type is other than 2N × 2N in an example in which the prediction block size type in the coding block is common without depending on the prediction block size type. FIG. In FIG. 24, the temporal candidate blocks H and I exist in a picture different from the decoded picture different from the picture in which the spatial candidate blocks A to E exist, but for the sake of easy understanding and explanation, the spatial candidate blocks H and I exist. It is shown together with blocks A to E. 24 (a) to 24 (h) respectively show a
以上のように、予測ブロックサイズタイプに依存せず、候補ブロックが予測サイズタイプが2N×2Nである予測ブロックの候補ブロックとなる。換言すると、予測ブロックサイズタイプに依存せず、予測ブロックサイズタイプが2N×2Nである場合の候補ブロックが、符号化ブロックの全ての予測ブロックにおいて、共通に利用される。すなわち、結合動き情報候補リスト生成部140及び230によれば、候補ブロックが同一であれば同一の結合動き情報候補リストが生成されるため、予測ブロックサイズタイプに依存せず、予測ブロックサイズタイプが2N×2Nである場合に導出される結合動き情報候補リストを、符号化ブロックの全ての予測ブロックにおいて、共通に利用することができる。これにより、予測ブロックタイプサイズが確定する前に候補ブロックを確定し、結合動き情報候補リストを確定することができる。また、符号化ブロックが複数の予測ブロックに分割される場合、予測ブロック毎に候補ブロックを導出する必要がなくなるため、図11に示した結合動き情報候補リストを生成する回数を1/2(2分割の場合)または1/4(4分割の場合)に削減することができる。また、符号化ブロックの予測ブロックを並列に処理することができる。
As described above, regardless of the prediction block size type, the candidate block is a prediction block candidate block having a prediction size type of 2N × 2N. In other words, the candidate block when the prediction block size type is 2N × 2N does not depend on the prediction block size type, and is commonly used in all prediction blocks of the encoded block. That is, according to the combined motion information candidate
以下、実施の形態3の別の一例について説明する。実施の形態1とは予測ブロックサイズタイプが2N×2N以外の予測ブロックについて空間結合動き情報候補生成部160において利用する空間候補ブロック群と時間候補ブロック群と結合動き情報候補リスト生成部140の動作が異なる。以下、実施の形態3の予測ブロックサイズタイプが2N×2N以外の予測ブロックの空間候補ブロック群と時間候補ブロック群について説明する。
Hereinafter, another example of the third embodiment will be described. The operation of the spatial candidate block group, the temporal candidate block group, and the combined motion information candidate
ここでは、予測ブロックが複数に分割される場合は、符号化ブロック内の全ての予測ブロックの候補ブロックとして予測ブロック0の候補ブロックを利用する。
Here, when the prediction block is divided into a plurality of blocks, the candidate block of the
図25は実施の形態3における予測ブロックサイズタイプが2N×2N以外の予測ブロックと候補ブロック群の位置関係を説明する図である。図25では、時間候補ブロックH及びIは、空間候補ブロックA〜Eが存在するピクチャとは別の復号済みのピクチャとは別のピクチャに存在するが、理解及び説明の容易のため、空間候補ブロックA〜Eとあわせて図示されている。図25(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の空間候補ブロック群と時間候補ブロック群を示す。図25では予測ブロックサイズが16画素×16画素である例を示す。予測ブロックサイズタイプが2N×2N以外の予測ブロックの時間候補ブロック群として、図25に示すように予測ブロック0として導出した時間候補ブロック群を利用する。
FIG. 25 is a diagram for explaining the positional relationship between a prediction block and a candidate block group whose prediction block size type is other than 2N × 2N in the third embodiment. In FIG. 25, the temporal candidate blocks H and I exist in a picture different from the decoded picture different from the picture in which the spatial candidate blocks A to E exist, but for the sake of easy understanding and explanation, the spatial candidate blocks H and I exist. It is shown together with blocks A to E. 25 (a) to 25 (h) respectively show a
次に、結合動き情報候補リスト生成部140の動作について説明する。図26は実施の形態3の結合動き情報候補リスト生成部140の動作を説明するフローチャートである。実施の形態1の結合動き情報候補リスト生成部140の動作である図11とは、ステップS106及びステップS107が追加されていることが異なる。実施の形態1とは異なるステップS106とステップS107について説明する。予測ブロック0であるか検査する(S106)。予測ブロック0であれば(S106のY)、ステップS100からS105の処理を行って処理を終了する。予測ブロック0でなければ(S106のN)、処理対象の予測ブロックの結合動き情報候補リストとして予測ブロック0の結合動き情報候補リストを利用し(S107)、処理を終了する。
Next, the operation of the combined motion information candidate
以上のように、符号化ブロックが複数に分割される場合は、符号化ブロック内の全ての予測ブロックの候補ブロックとして予測ブロック0の候補ブロックを利用することで、符号化ブロックが複数の予測ブロックに分割される場合、予測ブロック0以外の予測ブロックの結合動き情報候補リストを生成する必要がなくなるため、図11に示した結合動き情報候補リストを生成する回数を1/2(2分割の場合)または1/4(4分割の場合)に削減することができる。すなわち、予測ブロック0で導出される結合動き情報候補リストを、符号化ブロックのいずれの予測ブロックにおいても、共通に利用することができる。また、結合動き情報候補リストを予測ブロックサイズタイプが確定すれば、予測ブロックの位置が確定する前に生成することができるため、回路設計やソフトウェア設計を柔軟にし、回路規模やソフトウェア規模を削減することが可能となる。また、符号化ブロックの予測ブロックを並列に処理することができる。
As described above, when the coding block is divided into a plurality of blocks, the
さらに、予測ブロックサイズタイプが2N×2N以外の予測ブロックの候補ブロックの位置を、予測ブロックサイズタイプが2N×2Nの予測ブロックとは異なる候補ブロックの位置とすることで、予測ブロックサイズタイプが2N×2N以外の予測ブロックとなる選択確率を高めることができ、上記の予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを共通とする一例よりも符号化効率を向上させることができる。さらに、予測ブロック0は同一の符号化ブロックの他の予測ブロックに含まれる候補ブロック及び必ず未処理となる候補ブロックが含まれないため、結合動き情報候補が有効となる確率を上げて予測効率を向上させることができる。なお、最も符号化効率の高いスキップモードは予測ブロックサイズタイプが2N×2Nと同等であるため、本実施の形態による影響を受けない。
Furthermore, the prediction block size type is set to 2N by setting the position of the prediction block candidate block other than the prediction block size type of 2N × 2N to a position of a candidate block different from the prediction block having the prediction block size type of 2N × 2N. The selection probability to be a prediction block other than × 2N can be increased, and the coding efficiency is improved compared to the example in which the prediction block candidate block in the coding block is shared without depending on the prediction block size type. be able to. Furthermore, since the
実施の形態3では符号化ブロックの代表ブロックとして符号化ブロック内の最初の予測ブロックである予測ブロック0を利用したが、それに限定されない。例えば、符号化ブロック内で最初にマージモードを利用する予測ブロックとすることもできる。この場合、S106とS107は以下のようになる。符号化ブロック内で結合動き情報候補リストが既に生成されていないか検査する(S106)。符号化ブロック内で結合動き情報候補リストが既に生成されていなければ(S106のY)、ステップS100からS105の処理を行って処理を終了する。符号化ブロック内で結合動き情報候補リストが既に生成されていれば(S106のN)、符号化ブロック内で結合動き情報候補リストが既に生成された結合動き情報候補リストを利用し(S107)、処理を終了する。
In
以上のように、符号化ブロック内で最初にマージモードを利用する予測ブロックの結合動き情報候補リストを符号化ブロック内の他の予測ブロックでも利用することで、少なくとも最初にマージモードを利用する予測ブロックの予測効率を向上させることができる。また、符号化ブロックの代表ブロックとして符号化ブロック内の最後の予測ブロック(2分割の場合は予測ブロック1、4分割の場合は予測ブロック3)を利用することもできる。この場合、時間候補ブロック群の位置を、予測ブロックサイズタイプが2N×2Nの予測ブロックとは異なる候補ブロックの位置とすることで、予測ブロックサイズタイプが2N×2N以外の予測ブロックとなる選択確率を高めることができ、予測効率を向上させることができる。
As described above, by using the combined motion information candidate list of the prediction block that first uses the merge mode in the coding block also in other prediction blocks in the coding block, at least the prediction using the merge mode first. The prediction efficiency of blocks can be improved. Further, the last prediction block in the encoding block (
また、実施の形態2のように、結合動き情報候補リストへの追加順を処理対象の予測ブロックに近い順とすることもできる。 Further, as in the second embodiment, the order of addition to the combined motion information candidate list may be the order close to the prediction block to be processed.
[実施の形態3の変形例1]
以下、実施の形態3の変形例1について説明する。実施の形態3とは最大符号化ブロック下限ラインで時間候補ブロック群が制限されることが異なる。最大符号化ブロック下限ラインでの時間候補ブロック群の制限について説明する。図27は最大符号化ブロック下限ラインと時間候補ブロック群を説明する図である。図27のように最大符号化ブロック下限ラインは最大符号化ブロックの最下部の画素が含まれるラインである。最大符号化ブロック下限ラインより下にあるブロックは利用しないように制限することで、動画像符号化装置100及び動画像復号装置200において、時間候補ブロック群のための一時記憶領域の容量を削減することができる。
[
Hereinafter,
予測ブロックサイズタイプが2N×2Nではない符号化ブロックにおける予測ブロックについて予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用した場合、最大符号化ブロック下限ラインが設置されている場合、図27の最大符号化ブロック下限ラインに接する予測ブロックサイズタイプが2N×Nの予測ブロック1の時間候補ブロック(H1)の位置は利用できなくなる。
When the same positional relationship as that of a prediction block of a coding block having a prediction block size type of 2N × 2N is applied to a prediction block in a coding block whose prediction block size type is not 2N × 2N, a maximum coding block lower limit line is provided. In this case, the position of the temporal candidate block (H1) of the
ところが、実施の形態3のように、予測ブロックが複数に分割される場合は符号化ブロック内の全ての予測ブロックの候補ブロックとして予測ブロック0の候補ブロックを利用することで、時間候補ブロック群として時間候補ブロック(H0)を利用することになるため、時間候補ブロックを有効とすることができ、予測効率を向上させることができる。これは、予測ブロックサイズタイプがN×Nの予測ブロック2と予測ブロック3についても同様である。
However, when the prediction block is divided into a plurality of blocks as in the third embodiment, the candidate block of the
[実施の形態4]
以下、実施の形態4について説明する。実施の形態1とは予測ブロックサイズタイプが2N×2N以外の予測ブロックの空間候補ブロック群と時間候補ブロック群と結合動き情報候補リスト生成部140の構成と動作が異なる。以下、実施の形態4の予測ブロックサイズタイプが2N×2N以外の予測ブロックと空間候補ブロック群と時間候補ブロック群について説明する。
[Embodiment 4]
Hereinafter, the fourth embodiment will be described. The configuration and operation of the spatial candidate block group, the temporal candidate block group, and the combined motion information candidate
ここでは、空間候補ブロック群を予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用したものとする。時間候補ブロック群として、予測ブロック0として導出した時間候補ブロック群を利用する。
Here, it is assumed that the same positional relationship is applied to the spatial candidate block group as the prediction block of the encoded block whose prediction block size type is 2N × 2N. The time candidate block group derived as the
図28は実施の形態4における予測ブロックサイズタイプが2N×2N以外の予測ブロックと候補ブロック群の位置関係を説明する図である。図28では、時間候補ブロックH及びIは、空間候補ブロックA〜Eが存在するピクチャとは別の復号済みのピクチャとは別のピクチャに存在するが、理解及び説明の容易のため、空間候補ブロックA〜Eとあわせて図示されている。図28(a)から(h)はそれぞれ予測ブロックサイズタイプがN×2Nの予測ブロック0、予測ブロックサイズタイプがN×2Nの予測ブロック1、予測ブロックサイズタイプが2N×Nの予測ブロック0、予測ブロックサイズタイプが2N×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック0、予測ブロックサイズタイプがN×Nの予測ブロック1、予測ブロックサイズタイプがN×Nの予測ブロック2、予測ブロックサイズタイプがN×Nの予測ブロック3の場合の空間候補ブロック群を示す。図28では予測ブロックサイズが16画素×16画素である例を示す。予測ブロックサイズタイプが2N×2N以外の予測ブロックの時間候補ブロック群として、図28に示すように予測ブロック0として導出した時間候補ブロック群を利用する。勿論、予測ブロックサイズタイプが2N×2N以外の予測ブロックの時間候補ブロック群として、予測ブロックサイズタイプが2N×2Nの予測ブロックとして導出した時間候補ブロック群を利用することもできる。
FIG. 28 is a diagram for explaining the positional relationship between a prediction block and a candidate block group whose prediction block size type is other than 2N × 2N in the fourth embodiment. In FIG. 28, the temporal candidate blocks H and I exist in a picture different from the decoded picture different from the picture in which the spatial candidate blocks A to E exist, but for the sake of easy understanding and explanation, the spatial candidate blocks H and I exist. It is shown together with blocks A to E. 28 (a) to 28 (h) respectively show a
次に、結合動き情報候補リスト生成部140の構成と動作について説明する。図29は実施の形態4の結合動き情報候補リスト生成部140の構成を説明する図である。実施の形態1とは時間結合動き情報候補生成部161の位置が第1結合動き情報候補補充部163の後段に設置されていることが異なる。図30は実施の形態4の結合動き情報候補リスト生成部140の動作を説明するフローチャートである。実施の形態1の結合動き情報候補リスト生成部140の動作である図11とは、ステップS106及びステップS108が追加されていること、ステップS102の位置が異なる。実施の形態1とは異なる点について説明する。
Next, the configuration and operation of the combined motion information candidate
空間結合動き情報候補生成部160は、端子12より供給される候補ブロック群から0個から空間結合動き情報候補最大数の空間結合動き情報候補を生成して結合動き情報候補リストに追加し(S101)、当該結合動き情報候補リストと候補ブロック群を冗長結合動き情報候補削除部162に供給する。
The spatially coupled motion information
次に、冗長結合動き情報候補削除部162は、空間結合動き情報候補生成部160より供給される結合動き情報候補リストに登録されている結合動き情報候補を検査し、同一の動き情報を有する結合動き情報候補が複数存在する場合には1つの結合動き情報候補を残してその他の結合動き情報候補を削除し(S103)、当該結合動き情報候補リストを第1結合動き情報候補補充部163に供給する。
Next, the redundant combined motion information
次に、第1結合動き情報候補補充部163は、冗長結合動き情報候補削除部162より供給される結合動き情報候補リストに登録された結合動き情報候補から0個から2個の第1補充結合動き情報候補を生成して結合動き情報候補リストに追加し(S104)、当該結合動き情報候補リストと候補ブロック群を時間結合動き情報候補生成部161に供給する。
Next, the first combined motion information
次に、時間結合動き情報候補生成部161は、処理対象の予測ブロックが予測ブロック0であるか検査する(S106)。処理対象の予測ブロックが予測ブロック0であれば(S106のY)、冗長結合動き情報候補削除部162より供給される候補ブロック群から0個から時間結合動き情報候補最大数の時間結合動き情報候補を生成して冗長結合動き情報候補削除部162より供給される結合動き情報候補リストに追加し(S102)、当該結合動き情報候補リストを第2結合動き情報候補補充部164に供給する。処理対象の予測ブロックが予測ブロック0でなければ(S106のN)、候補ブロック0の時間結合動き情報候補を結合動き情報候補リストに追加し(S108)、当該結合動き情報候補リストを第2結合動き情報候補補充部164に供給する。
Next, the time combination motion information
次に、第2結合動き情報候補補充部164は、時間結合動き情報候補生成部161より供給される結合動き情報候補リストに登録された結合動き情報候補の数がマージ候補最大数に達するまで第2補充結合動き情報候補を生成して当該結合動き情報候補リストに追加し(S105)、当該結合動き情報候補リストを端子19に供給する。
Next, the second combined motion information
以上のように、予測ブロックサイズタイプが2N×2N以外の予測ブロックの空間候補ブロック群を予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用したものとし、時間候補ブロック群を予測ブロック0の時間候補ブロック群とすることで、予測ブロックサイズタイプが確定すれば、時間候補ブロック群を確定することができる。すなわち、予測ブロック0で導出される時間結合動き情報候補を、符号化ブロックのいずれの予測ブロックにおいても、共通に利用するこができる。一方、空間候補ブロック群は、予測ブロックごとに予測ブロックの位置と大きさに基づいて決定される。空間結合動き情報候補の導出には候補ブロックの動き情報がそのまま利用されるため演算は不要であって処理時間は短いが、時間結合動き情報候補の導出には式1または式2から式4のようなベクトルを演算する処理が必要となること、インター予測タイプを決定する処理があることから処理時間が長くなる。
As described above, it is assumed that the same positional relationship as that of the prediction block of the encoded block having the prediction block size type of 2N × 2N is applied to the spatial candidate block group of the prediction block other than the prediction block size type of 2N × 2N, By setting the candidate block group as the time candidate block group of the
そこで、結合動き情報候補リストを生成するための処理において最も処理時間を要する時間結合動き情報候補の導出を符号化ブロックで1回とすることで、予測ブロックが複数に分割される場合の処理時間を短縮することができる。 Therefore, the processing time when the prediction block is divided into a plurality of times by deriving the time combination motion information candidate that requires the most processing time in the process for generating the combined motion information candidate list once in the coding block. Can be shortened.
さらに、空間結合動き情報候補として処理対象の予測ブロックに隣接したブロックを利用することで、予測ブロックサイズタイプが2N×2N以外の予測ブロックとなる選択確率を高めることができ、上記の予測ブロックサイズタイプに依存せずに符号化ブロック内の予測ブロックの候補ブロックを共通とする一例よりも符号化効率を向上させることができる。また、時間候補ブロック群としてColPicの所定領域の代表ブロックを利用していることから、空間候補ブロック群と比較して時間候補ブロック群の精度は相対的に低くなるため、時間候補ブロック群の精度を落としても予測効率の低下を抑制できる。 Furthermore, by using a block adjacent to the prediction block to be processed as a spatially coupled motion information candidate, the selection probability that the prediction block size type becomes a prediction block other than 2N × 2N can be increased. Coding efficiency can be improved compared to an example in which the prediction block candidate blocks in the coding block are shared without depending on the type. Moreover, since the representative block of the predetermined area of ColPic is used as the time candidate block group, the accuracy of the time candidate block group is relatively lower than that of the space candidate block group. Decrease in prediction efficiency can be suppressed even if the value is dropped.
ここでは、時間結合動き情報候補を導出する時間が空間結合動き情報候補の導出、冗長結合動き情報候補削除部162の動作、第1結合動き情報候補補充部163の動作よりも十分に長いとして、結合動き情報候補リスト生成部140の動作を図30としたが、例えば、予測効率を優先してS106、S102、及びS108をS101やS103の後段に移動させてもよく、処理効率を優先してS106、S102、及びS108をS105の後段に設置することもできる。S106、S102、及びS108をS105の後段に設置する場合には、第2結合動き情報候補補充部164から出力される結合動き情報候補リストに登録された結合動き情報候補の数がマージ候補最大数より1小さい数とする。
Here, it is assumed that the time for deriving the temporally combined motion information candidate is sufficiently longer than the derivation of the spatially combined motion information candidate, the operation of the redundant combined motion information
ここでは、予測効率を重視して空間候補ブロック群を予測ブロックサイズタイプが2N×2Nである符号化ブロックの予測ブロックと同じ位置関係を適用したものとしたが、符号化ブロック内の予測ブロックの並列処理を実現するために同一の符号化ブロックの他の予測ブロックに含まれる候補ブロックは候補ブロックとして利用しないとしたり、空間候補ブロック群を他の実施の形態と組み合わせたりして、時間候補ブロック群として予測ブロック0として導出した時間候補ブロック群を利用してもよい。
In this example, the spatial relationship block group is applied with the same positional relationship as the prediction block of the encoded block whose prediction block size type is 2N × 2N, with emphasis on prediction efficiency. Candidate blocks included in other prediction blocks of the same coding block to realize parallel processing are not used as candidate blocks, or a spatial candidate block group is combined with other embodiments to generate temporal candidate blocks You may utilize the time candidate block group derived | led-out as the
また、ここでは、予測ブロックサイズタイプが2N×2N以外の予測ブロックの時間候補ブロック群を、符号化ブロック内の最初の予測ブロックである予測ブロック0で導出した時間候補ブロック群であるとしたが、これに限定されない。例えば、予測ブロックサイズタイプが2N×2Nである場合の予測ブロックの時間候補ブロック群としてもよく、符号化ブロック内の最後の予測ブロック(2分割の場合は予測ブロック1、4分割の場合は予測ブロック3)の時間候補ブロック群としてもよい。予測ブロックサイズタイプが2N×2Nである場合の予測ブロックの時間候補ブロック群とした場合には、時間候補ブロック群を予測ブロックサイズタイプや予測ブロックの位置が確定する前に生成することができるため、回路設計やソフトウェア設計を柔軟にし、回路規模やソフトウェア規模を削減することが可能となる。
In addition, here, it is assumed that the time candidate block group of the prediction block whose prediction block size type is other than 2N × 2N is the time candidate block group derived from the
[実施の形態5]
以下、実施の形態5について説明する。実施の形態1とは結合動き情報候補リスト生成部140の構成と動作が異なり、符号列生成部104と符号列解析部201の動作が異なる。
[Embodiment 5]
The fifth embodiment will be described below. The configuration and operation of the combined motion information candidate
最初に、結合動き情報候補リスト生成部140の構成について説明する。図31は実施の形態5の結合動き情報候補リスト生成部140の構成を説明する図である。図10の実施の形態1の結合動き情報候補リスト生成部140とは、候補ブロック設定部165が空間結合動き情報候補生成部160の前段に追加されていることが異なる。ここでは、予測効率を優先した候補ブロック配置であるか並列処理や処理時間短縮などの処理効率を優先した候補ブロック配置であるかをフラグなどで切り替える。
First, the configuration of the combined motion information candidate
次に、結合動き情報候補リスト生成部140の動作について説明する。図32は実施の形態5の結合動き情報候補リスト生成部140の動作を説明するフローチャートである。図11の実施の形態1の結合動き情報候補リスト生成部140の動作とは、ステップS100の前段に、ステップS106からS108が追加されていることが異なる。ステップS106からステップS108について説明する。最初に、cu_dependent_flagが1であるか判定する(S106)。cu_dependent_flagが1であれば(S106のY)、予測効率を優先するブロック配置とする(S107)。予測効率を優先するブロック配置とは、例えば、予測ブロックサイズタイプが2N×2N以外の予測ブロックの候補ブロック群を予測ブロックサイズタイプが2N×2Nの予測ブロックと同じ位置関係を適用した図12のような処理対象の予測ブロックに隣接する候補ブロックだけからなるブロック配置となる。cu_dependent_flagが0であれば(S106のN)、処理効率を優先するブロック配置とする(S108)。処理効率を優先するブロック配置とは、例えば、図14、図23、図24、図25、または図28のような処理対象の予測ブロックに隣接しない候補ブロックを含むブロック配置となる。ステップS107またはステップS108に引き続いて、ステップS100以降の処理が実施される。ここで、本実施の形態では、例えば図12に示すような予測効率を優先するブロック配置に基づき、符号化ブロックの予測ブロックごとに、その位置と大きさに基づいて候補ブロック群の決定および結合動き情報候補リストの生成を行う、又は例えば図24若しくは図25に示すような処理効率を優先するブロック配置に基づき、符号化ブロックの全ての予測ブロックにおいて共通に利用される候補ブロックから結合動き情報候補リストの生成を行うかが切り替えられる。
Next, the operation of the combined motion information candidate
動画像符号化装置100では、enable_cu_parallel_flagが0であるか1であるかは動画像符号化装置100よりも上位で設定されているものとする。ここでは、図32に示す動作を結合動き情報候補リスト生成部140で実施するとしたが、動画像符号化装置100よりも上位で設定することもできる。
In the
符号列生成部104は、cu_dependent_flagをSPS、PPS、スライスヘッダなど符号化ブロック以外の位置に多重化する。符号列解析部201は、SPS、PPS、スライスヘッダなど符号化ブロック以外の位置に多重化されたcu_dependent_flagを復号して動き情報再生部204に供給する。
The code
cu_dependent_flagを符号化ストリーム中に多重化することで、予測効率を優先した符号化ストリームであるかどうかを容易に判断できる。また、予測効率を優先したブロック配置による符号化ストリームと処理効率を優先したブロック配置による符号化ストリームを共通の復号装置で復号できる。cu_dependent_flagが0または1のいずれかしか復号しない復号装置については、例えば、運用規定やMPEG−4AVCのような符号化ツールを分類したプロファイルなどでcu_dependent_flagを0または1のいずれかに固定して符号化ストリームを生成し、cu_dependent_flagを無視または暗示的に設定することで符号化ストリームを正しく復号することができる。また、cu_dependent_flagを符号化ブロックのより上位のヘッダに多重化することで、図32に示す動作を削減することができる。 By multiplexing cu_dependent_flag in the encoded stream, it is possible to easily determine whether the encoded stream prioritizes prediction efficiency. Also, a common decoding apparatus can decode an encoded stream based on block arrangement giving priority to prediction efficiency and an encoded stream based on block arrangement giving priority to processing efficiency. For a decoding device that only decodes cu_dependent_flag of 0 or 1, for example, encoding is performed by fixing cu_dependent_flag to either 0 or 1 in accordance with operation regulations or profiles classified with encoding tools such as MPEG-4AVC. A coded stream can be correctly decoded by generating a stream and setting cu_dependent_flag ignored or implicitly. Also, the operation shown in FIG. 32 can be reduced by multiplexing the cu_dependent_flag into a higher-order header of the encoded block.
ここでは、cu_dependent_flagによって予測効率を優先したブロック配置と処理効率を優先したブロック配置とを切り替えたが、例えば、符号化ブロックの分割回数が所定回数以上の場合には処理効率を優先したブロック配置とし、符号化ブロックが所定閾サイズ以上でない場合には予測効率を優先したブロック配置としたり、符号化ブロックが所定閾サイズ以下の場合には処理効率を優先したブロック配置とし、符号化ブロックが所定閾サイズ以下でない場合には予測効率を優先したブロック配置としたりすることもできる。また、所定閾サイズを最小の符号化ブロックサイズである8×8とすることで、最も処理量が増加する場合のみに適用することができ、処理量と予測効率を最適にバランスさせることができる。この場合、ステップS108において、符号化ブロックが所定閾サイズであるか判定することになる。符号化ブロックが符号化ブロックの分割回数が所定回数以上(または所定閾サイズ以下)の場合には処理効率を優先したブロック配置とし、符号化ブロックが符号化ブロックの分割回数が所定回数以上(または所定閾サイズ以下)でない場合には予測効率を優先したブロック配置とすることで、予測効率と処理量を容易に調節することが可能となる。なお、所定閾サイズまたは所定回数をSPS、PPS、スライスヘッダなど符号化ブロック以外の位置に多重化するもできる。また、enable_cu_parallel_flagが1である場合には所定閾サイズまたは所定回数を定義し、enable_cu_parallel_flagが0である場合には所定閾サイズまたは所定回数を定義しないような意味としてenable_cu_parallel_flagを利用して符号化ストリーム中に多重化することで、より柔軟に処理量と予測効率を調節することが可能となる。すなわち、enable_cu_parallel_flagを0とすることで、所定閾サイズまたは所定回数によらず、常に予測効率を優先したブロック配置とし、enable_cu_parallel_flagを1とすることで、所定閾サイズまたは所定回数によって、予測効率と処理効率を切り替えて、処理量と予測効率を最適にバランスさせることを可能とする。 Here, the block arrangement giving priority to the prediction efficiency and the block arrangement giving priority to the processing efficiency are switched by the cu_dependent_flag. For example, when the number of divisions of the encoded block is a predetermined number or more, the block arrangement giving priority to the processing efficiency is used. If the encoded block is not equal to or larger than the predetermined threshold size, the block arrangement is given priority to prediction efficiency. If the encoded block is smaller than the predetermined threshold size, the block arrangement is given priority to processing efficiency. If it is not smaller than the size, it is possible to make a block arrangement giving priority to prediction efficiency. In addition, by setting the predetermined threshold size to 8 × 8, which is the minimum coding block size, it can be applied only when the processing amount increases most, and the processing amount and the prediction efficiency can be optimally balanced. . In this case, in step S108, it is determined whether the encoded block has a predetermined threshold size. When the number of divisions of an encoded block is equal to or greater than a predetermined number (or less than a predetermined threshold size), the block arrangement is given priority to processing efficiency, and the number of divisions of the encoded block is equal to or greater than a predetermined number (or If it is not equal to or less than the predetermined threshold size, the prediction efficiency and the processing amount can be easily adjusted by setting the block arrangement with priority on the prediction efficiency. It should be noted that the predetermined threshold size or the predetermined number of times can be multiplexed at positions other than the encoded block such as SPS, PPS, and slice header. In addition, when enable_cu_parallel_flag is 1, a predetermined threshold size or a predetermined number of times is defined, and when enable_cu_parallel_flag is 0, the predetermined threshold size or the predetermined number of times is not defined, so that enable_cu_parallel_flag is used in an encoded stream. It is possible to adjust the processing amount and the prediction efficiency more flexibly by multiplexing. That is, by setting enable_cu_parallel_flag to 0, the block arrangement always gives priority to prediction efficiency regardless of the predetermined threshold size or the predetermined number of times, and by setting enable_cu_parallel_flag to 1, the prediction efficiency and processing are performed according to the predetermined threshold size or the predetermined number of times. By switching the efficiency, it is possible to optimally balance the processing amount and the prediction efficiency.
[実施の形態6]
以下、実施の形態6について説明する。実施の形態3の動画像符号化装置100の予測ベクトルモード決定部120の構成と動きベクトル再生部211の動作について詳細に説明する。以下、予測ベクトルモード決定部120の詳細な構成について説明する。
[Embodiment 6]
The sixth embodiment will be described below. The configuration of the prediction vector
(予測ベクトルモード決定部120の構成)
続いて、予測ベクトルモード決定部120の詳細な構成について説明する。図33は、予測ベクトルモード決定部120の構成を示す。予測ベクトルモード決定部120は、予測ベクトル候補リスト生成部130および予測ベクトル決定部131を含む。端子17は予測符号化モード決定部122に接続されている。
(Configuration of Predictive Vector Mode Determination Unit 120)
Subsequently, a detailed configuration of the prediction vector
予測ベクトル候補リスト生成部130は、実施の形態6に係る動画像符号化装置100により生成された符号列を復号する動画像復号装置200内の動きベクトル再生部211の中にも同様に設置されて、動画像符号化装置100と動画像復号装置200にて同一の予測ベクトル候補リストが生成される。
The prediction vector candidate
(予測ベクトルモード決定部120の動作)
以下、予測ベクトルモード決定部120の動作について説明する。
(Operation of prediction vector mode determination unit 120)
Hereinafter, the operation of the prediction vector
最初に、L0予測について以下の処理を行う。以下、Xは0とする。予測ベクトル候補リスト生成部130は、端子13より供給されるLX予測の参照インデックスを取得する。端子12より供給される候補ブロック群とLX予測の参照インデックスから予測ベクトル候補最大数の予測ベクトル候補を含むLX予測の予測ベクトル候補リストを生成する。予測ベクトル候補リスト生成部130は、当該LX予測の予測ベクトル候補リストを予測ベクトル決定部131に供給する。
First, the following processing is performed for L0 prediction. Hereinafter, X is assumed to be 0. The prediction vector candidate
予測ベクトル決定部131は、予測ベクトル候補リスト生成部130より供給されるLX予測の予測ベクトル候補リストから1つの予測ベクトル候補をLX予測の予測ベクトルとして選択して、当該LX予測の予測ベクトルインデックスを決定する。
The prediction
予測ベクトル決定部131は、端子13より供給されるLX予測の動きベクトルからLX予測の予測ベクトルを減算してLX予測の差分ベクトルを算出し、当該LX予測の差分ベクトルと当該LX予測の予測ベクトルインデックスを出力する。
The prediction
予測ベクトル決定部131は、端子15より供給される画像信号と、端子14より供給される参照画像を端子13より供給されるLX予測の動きベクトルおよびLX予測の参照インデックスに基づいて動き補償予測したLX予測の予測信号とから予測誤差量を算出し、当該予測誤差量と、LX予測の差分ベクトル、LX予測の参照インデックス、およびLX予測の予測ベクトルインデックスの符号量とからPred_LXのレート歪評価値を算出する。
The prediction
次に、Xを1としてL1予測についてL0予測と同じ処理を行う。 Next, X is set to 1 and the same processing as L0 prediction is performed for L1 prediction.
続いて、予測ベクトル決定部131は、端子15より供給される画像信号と、L0予測の予測信号およびL1予測の予測信号を平均したBI予測の予測信号とから予測誤差量を算出し、当該予測誤差量と、L0予測とL1予測の差分ベクトル、L0予測とL1予測の参照インデックス、およびL0予測とL1予測の予測ベクトルインデックスの符号量とからPred_BIのレート歪評価値を算出する。
Subsequently, the prediction
予測ベクトル決定部131は、Pred_L0のレート歪評価値、Pred_L1のレート歪評価値、およびPred_BIのレート歪評価値を比較して、最小のレート歪評価値である予測符号化モードを1つ選択する。そして、予測符号化モードに基づいた動き情報、差分ベクトル、予測ベクトルインデックス、およびレート歪み評価値を予測符号化モード決定部122に供給する。なお、予測符号化モードがPred_L0であれば、L1予測の動きベクトルは(0,0)、L1予測の参照インデックスは「−1」となり、予測符号化モードがPred_L1であれば、L0予測の動きベクトルは(0,0)、L0予測の参照インデックスは「−1」となる。
The prediction
(予測ベクトル候補リスト生成部130の構成)
続いて、予測ベクトル候補リスト生成部130の詳細な構成について説明する。図34は、予測ベクトル候補リスト生成部130の構成を説明するための図である。端子18は予測ベクトル決定部131に接続されている。予測ベクトル候補リスト生成部130は、空間予測ベクトル候補生成部150、時間予測ベクトル候補生成部151、冗長予測ベクトル候補削除部152、及び予測ベクトル候補補充部153を含む。
(Configuration of Predictive Vector Candidate List Generation Unit 130)
Next, a detailed configuration of the prediction vector candidate
(予測ベクトル候補リスト生成部130の動作)
以下、各部の機能と動作について説明する。予測ベクトル候補リスト生成部130は必要に応じてL0予測の予測ベクトル候補リストとL1予測の予測ベクトル候補リストを生成する。以下、LX予測として説明する。Xは0または1とする。図35は、予測ベクトル候補リスト生成部130の動作を説明するためのフローチャートである。
(Operation of prediction vector candidate list generation unit 130)
Hereinafter, the function and operation of each unit will be described. The prediction vector candidate
まず、予測ベクトル候補リスト生成部130は、LX予測の予測ベクトル報候補リストを初期化する(S200)。初期化されたLX予測の予測ベクトル候補リストには予測ベクトル候補は存在しない。
First, the prediction vector candidate
端子12より供給される空間候補ブロック群に含まれる候補ブロックを第1グループであるブロックEとブロックA、第2グループであるブロックC、ブロックB、及びブロックDの2グループに分け、第1グループ、第2グループの順に以下の処理を繰り返す(S201からS203)。 Candidate blocks included in the space candidate block group supplied from the terminal 12 are divided into two groups, block E and block A as the first group, block C, block B, and block D as the second group, and the first group The following processing is repeated in the order of the second group (S201 to S203).
ここで、端子12より供給される候補ブロック群は2N×2Nの候補ブロック群についてはマージモードと同一とし、2N×2N以外の候補ブロック群については2N×2Nと同じ位置関係の適用した候補ブロック群とする。また、端子13より供給されるLX予測の参照インデックス、端子12より供給される候補ブロック群、及びLX予測の予測ベクトル報候補リストは予測ベクトル候補リスト生成部130内部で共有されているものとして説明する。
Here, the candidate block group supplied from the terminal 12 is the same as the merge mode for the 2N × 2N candidate block group and the candidate block group other than 2N × 2N is applied with the same positional relationship as 2N × 2N. A group. In addition, it is assumed that the LX prediction reference index supplied from the terminal 13, the candidate block group supplied from the terminal 12, and the prediction vector information candidate list for LX prediction are shared in the prediction vector candidate
空間予測ベクトル候補生成部150は、第iグループ(iは1または2)の候補ブロック群からLX予測の空間予測ベクトル候補を0個または1個生成し、当該LX予測の空間予測ベクトル候補をLX予測の予測ベクトル候補リストに追加し(S202)、当該LX予測の予測ベクトル候補リストと候補ブロック群を時間予測ベクトル候補生成部151に供給する。
The spatial prediction vector
ここで、空間予測ベクトル候補の具体的な導出方法について説明する。第1グループ及び第2グループについて以下の処理を繰り返す。第1グループは候補ブロックとしてブロックE、ブロックAを順に検査し、第2グループは候補ブロックとしてブロックC、ブロックB、ブロックDの順に検査する。 Here, a specific method for deriving spatial prediction vector candidates will be described. The following processing is repeated for the first group and the second group. The first group inspects block E and block A in order as candidate blocks, and the second group inspects block C, block B and block D in order of candidate blocks.
各候補ブロックについて、L0予測、L1予測の順に以下の処理を行う。以降、各候補ブロックのL0予測、L1予測をLN予測として説明する。 For each candidate block, the following processing is performed in the order of L0 prediction and L1 prediction. Hereinafter, L0 prediction and L1 prediction of each candidate block will be described as LN prediction.
候補ブロックのLN予測の参照インデックスが示す参照画像が端子13より供給されるLX予測の参照インデックスが示す参照画像と同一であるか検査する。 It is checked whether the reference image indicated by the LN prediction reference index of the candidate block is the same as the reference image indicated by the LX prediction reference index supplied from the terminal 13.
候補ブロックのLN予測の参照インデックスが示す参照画像が端子13より供給されるLX予測の参照インデックスが示す参照画像と同一であれば、候補ブロックのLN予測の動きベクトルを空間予測ベクトル候補として処理を終了する。 If the reference image indicated by the LN prediction reference index of the candidate block is the same as the reference image indicated by the LX prediction reference index supplied from the terminal 13, the LN prediction motion vector of the candidate block is processed as a spatial prediction vector candidate. finish.
候補ブロックのLN予測の参照インデックスが示す参照画像が端子13より供給されるLX予測の参照インデックスが示す参照画像と同一でなければ、次のLN予測または次の候補ブロックを検査する。 If the reference image indicated by the LN prediction reference index of the candidate block is not the same as the reference image indicated by the LX prediction reference index supplied from the terminal 13, the next LN prediction or the next candidate block is examined.
全ての候補ブロックの検査が完了すれば、処理を終了する。 If the inspection of all candidate blocks is completed, the process is terminated.
以上のように、各グループから0個または1個の空間予測ベクトル候補が導出され、LX予測としては0個から2個の空間予測ベクトル候補が導出される。 As described above, 0 or 1 spatial prediction vector candidates are derived from each group, and 0 to 2 spatial prediction vector candidates are derived as LX prediction.
次に、時間予測ベクトル候補生成部151は、時間候補ブロック群からLX予測の時間予測ベクトル候補を0個または1個生成し、当該LX予測の時間予測ベクトル候補をLX予測の予測ベクトル候補リストに追加し(S204)、当該LX予測の予測ベクトル候補リストと候補ブロック群を予測ベクトル候補補充部153に供給する。
Next, the temporal prediction vector
ここで、時間予測ベクトル候補の具体的な導出方法について説明する。
時間候補ブロック群を候補ブロックとしてブロックH、ブロックIの順に検査する。
各候補ブロックについて、L0予測、L1予測の順に以下の処理を行う。以降、各候補ブロックのL0予測、L1予測をLN予測として説明する。
候補ブロックのLN予測が有効であるか検査する。候補ブロックのLN予測が有効であるとは参照インデックスが0以上であることである。
候補ブロックのLN予測が有効であれば、候補ブロックのLN予測の動きベクトルを基準動きベクトルとして時間予測ベクトル候補を導出して処理を終了する。時間予測ベクトル候補の導出方法については後述する。
候補ブロックのLN予測が有効でなければ、次の候補ブロックを検査する。
全ての候補ブロックの検査が完了すれば、処理を終了する。
Here, a specific method for deriving temporal prediction vector candidates will be described.
The time candidate block group is inspected in the order of block H and block I as candidate blocks.
For each candidate block, the following processing is performed in the order of L0 prediction and L1 prediction. Hereinafter, L0 prediction and L1 prediction of each candidate block will be described as LN prediction.
Check whether the candidate block's LN prediction is valid. The LN prediction of the candidate block is effective when the reference index is 0 or more.
If the LN prediction of the candidate block is valid, a temporal prediction vector candidate is derived using the motion vector of the LN prediction of the candidate block as a reference motion vector, and the process is terminated. A method for deriving temporal prediction vector candidates will be described later.
If the candidate block's LN prediction is not valid, the next candidate block is examined.
If the inspection of all candidate blocks is completed, the process is terminated.
ここで、時間予測ベクトル候補の導出方法について説明する。時間候補ブロックのあるColPicと時間候補ブロックがLN予測の動き補償予測で参照するピクチャであるColRefLXPicの画像間距離をtd、LX予測の参照インデックスが示す参照画像RefLXPicと処理対象画像CurPicの画像間距離をtb、LX予測の基準動きベクトルをmvLXとして、時間予測ベクトル候補mvLXColは式1より算出される。
Here, a method for deriving temporal prediction vector candidates will be described. The inter-image distance between ColPic having a temporal candidate block and ColRefLXPic, which is a picture that the temporal candidate block refers to in motion compensated prediction of LN prediction, is td, and the inter-image distance between the reference image RefLXPPic indicated by the reference index of LX prediction and the processing target image CurPic Tb, and the reference motion vector for LX prediction is mvLX, and the temporal prediction vector candidate mvLXCol is calculated from
冗長予測ベクトル候補削除部152は、時間予測ベクトル候補生成部151より供給されるLX予測の予測ベクトル候補リストに登録されている予測ベクトル候補を検査し、同一のベクトルを有する予測ベクトル候補が複数存在する場合には1つの予測ベクトル候補を残してその他の予測ベクトル候補を削除し、LX予測の予測ベクトル候補リストに登録されている予測ベクトル候補数が予測ベクトル候補最大数を超えている場合はLX予測の予測ベクトル候補リストに登録されている予測ベクトル候補数が予測ベクトル候補最大数以下となるようにLX予測の予測ベクトル候補リストの後方の予測ベクトル候補を削除して(S205)、当該LX予測の予測ベクトル候補リストを予測ベクトル候補補充部153に供給する。ここで、当該LX予測の予測ベクトル候補リストに登録されている結合動き情報候補は全てが異なる結合動き情報候補となる。
The redundant prediction vector
予測ベクトル候補補充部153は、予測ベクトル補充候補を生成し、冗長予測ベクトル候補削除部152より供給されるLX予測の予測ベクトル候補リストに登録された予測ベクトル候補数が予測ベクトル候補最大数になるように当該予測ベクトル補充候補をLX予測の予測ベクトル候補リストに追加し(S206)、端子18に供給する。予測ベクトル補充候補は動きベクトル(0,0)とする。ここでは、予測ベクトル補充候補を動きベクトル(0,0)としたが、(1,1)などの所定値でもよく、空間予測ベクトル候補の水平成分や垂直成分を+1や−1などした動きベクトルでもよい。
The prediction vector
ここでは、端子12より供給される空間候補ブロック群に含まれる候補ブロックを2グループに分けて、各グループから1個ずつ空間予測動きベクトル候補を選択できるようにしたが、1グループにして2個の空間予測動きベクトル候補を選択してもよい。 Here, the candidate blocks included in the spatial candidate block group supplied from the terminal 12 are divided into two groups so that one spatial prediction motion vector candidate can be selected from each group. The spatial prediction motion vector candidates may be selected.
以下、動きベクトル再生部211の詳細な構成について説明する。
Hereinafter, a detailed configuration of the motion
(動きベクトル再生部211の詳細な構成)
続いて、動きベクトル再生部211の詳細な構成について説明する。図36は、動きベクトル再生部211の構成を説明する図である。動きベクトル再生部211は、予測ベクトル候補リスト生成部220、予測ベクトル選択部221および加算部222を含む。端子35は符号化モード判定部210に接続されている。
(Detailed Configuration of Motion Vector Reproducing Unit 211)
Next, a detailed configuration of the motion
(動きベクトル再生部211の詳細な動作)
以下、各部の機能と動作について説明する。動きベクトル再生部211は、端子35より供給されるインター予測タイプがL0予測であれば、L0予測について動きベクトルの算出を行い、インター予測タイプがL1予測であれば、L1予測について動きベクトルの算出を行い、インター予測タイプがBI予測であれば、L0予測とL1予測について動きベクトルの算出を行う。各LX予測の動きベクトルの算出は以下のように行われる。
(Detailed operation of the motion vector reproduction unit 211)
Hereinafter, the function and operation of each unit will be described. The motion
動きベクトル再生部211は、端子35より供給されるLX予測の参照インデックス及び端子33より供給される候補ブロック群からLX予測の予測ベクトル候補リストを生成する。当該LX予測の予測ベクトルリストからLX予測の予測ベクトルインデックスによって示される予測ベクトル候補をLX予測の予測ベクトルとして選択し、LX予測の予測ベクトルとLX予測の差分ベクトルを加算してLX予測の動きベクトルを算出する。
The motion
当該LX予測の動きベクトルとインター予測タイプとが組み合わされて動き情報が生成され、端子34及び端子36に供給される。 Motion information is generated by combining the motion vector of the LX prediction and the inter prediction type, and is supplied to the terminal 34 and the terminal 36.
以上のように、マージ候補最大数が5であって相対的に候補数の多いマージモードでは、2N×2N以外の候補ブロック群については符号化ブロック内の全ての予測ブロックの候補ブロックとして予測ブロック0の候補ブロックを利用することで、結合動き情報候補リストを符号化ブロック内で共通化して候補選択に要する処理を並列化可能とし、予測ベクトル候補最大数が2であって相対的に候補数の少ない予測ベクトルモードでは、2N×2N以外の候補ブロック群については2N×2Nと同じ位置関係の適用した候補ブロックを利用し、予測効率を最適化することで、処理効率と予測効率を好適にすることができる。 As described above, in the merge mode in which the maximum number of merge candidates is 5 and the number of candidates is relatively large, a candidate block group other than 2N × 2N is predicted as a candidate block of all prediction blocks in the encoded block. By using a candidate block of 0, the combined motion information candidate list can be shared in the coding block so that the processing required for candidate selection can be parallelized, the maximum number of prediction vector candidates is 2, and the number of candidates is relatively In the prediction vector mode with a small number of candidates, for candidate block groups other than 2N × 2N, the candidate block to which the same positional relationship as 2N × 2N is applied is used, and the prediction efficiency is optimized, so that the processing efficiency and the prediction efficiency are preferably improved. can do.
以上述べた実施の形態の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有しており、動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。 The moving image encoded stream output from the moving image encoding apparatus of the embodiment described above has a specific data format so that it can be decoded according to the encoding method used in the embodiment. Therefore, the moving picture decoding apparatus corresponding to the moving picture encoding apparatus can decode the encoded stream of this specific data format.
動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。 When a wired or wireless network is used to exchange an encoded stream between a moving image encoding device and a moving image decoding device, the encoded stream is converted into a data format suitable for the transmission form of the communication path. It may be transmitted. In that case, a video transmission apparatus that converts the encoded stream output from the video encoding apparatus into encoded data in a data format suitable for the transmission form of the communication channel and transmits the encoded data to the network, and receives the encoded data from the network Then, a moving image receiving apparatus that restores the encoded stream and supplies the encoded stream to the moving image decoding apparatus is provided.
動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。 The moving image transmitting apparatus is a memory that buffers the encoded stream output from the moving image encoding apparatus, a packet processing unit that packetizes the encoded stream, and transmission that transmits the packetized encoded data via the network. Part. The moving image receiving apparatus generates a coded stream by packetizing the received data, a receiving unit that receives the packetized coded data via a network, a memory that buffers the received coded data, and packet processing. And a packet processing unit provided to the video decoding device.
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ROM(リード・オンリ・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。 The above processing relating to encoding and decoding can be realized as a transmission, storage, and reception device using hardware, and is stored in a ROM (Read Only Memory), a flash memory, or the like. It can also be realized by firmware or software such as a computer. The firmware program and software program can be recorded on a computer-readable recording medium, provided from a server through a wired or wireless network, or provided as a data broadcast of terrestrial or satellite digital broadcasting Is also possible.
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .
100 動画像符号化装置、 101 予測ブロック画像取得部、 102 減算部、 103 予測誤差符号化部、 104 符号列生成部、 105 予測誤差復号部、 106 動き補償部、 107 加算部、 108 動きベクトル検出部、 109 動き情報生成部、 110 フレームメモリ、 111 動き情報メモリ、 120 予測ベクトルモード決定部、 121 マージモード決定部、 122 予測符号化モード決定部、 130 予測ベクトル候補リスト生成部、 131 予測ベクトル決定部、 140 結合動き情報候補リスト生成部、 141 結合動き情報選択部、 150 空間予測ベクトル候補生成部、 151 時間予測ベクトル候補生成部、 152 冗長予測ベクトル候補削除部、 153 予測ベクトル候補補充部、 160 空間結合動き情報候補生成部、 161 時間結合動き情報候補生成部、 162 冗長結合動き情報候補削除部、 163 第1結合動き情報候補補充部、 164 第2結合動き情報候補補充部、 165 候補ブロック設定部、 166 代替結合動き情報候補補充部、 200 動画像復号装置、 201 符号列解析部、 202 予測誤差復号部、 203 加算部、 204 動き情報再生部、 205 動き補償部、 206 フレームメモリ、 207 動き情報メモリ、 210 符号化モード判定部、 211 動きベクトル再生部、 212 結合動き情報再生部、 230 結合動き情報候補リスト生成部、 231 結合動き情報選択部。 DESCRIPTION OF SYMBOLS 100 moving image encoder, 101 prediction block image acquisition part, 102 subtraction part, 103 prediction error encoding part, 104 code stream production | generation part, 105 prediction error decoding part, 106 motion compensation part, 107 addition part, 108 motion vector detection , 109 motion information generation unit, 110 frame memory, 111 motion information memory, 120 prediction vector mode determination unit, 121 merge mode determination unit, 122 prediction coding mode determination unit, 130 prediction vector candidate list generation unit, 131 prediction vector determination 140 combined motion information candidate list generation unit, 141 combined motion information selection unit, 150 spatial prediction vector candidate generation unit, 151 temporal prediction vector candidate generation unit, 152 redundant prediction vector candidate deletion unit, 153 prediction vector candidate supplement unit, 1 0 spatial combination motion information candidate generation unit, 161 temporal combination motion information candidate generation unit, 162 redundant combination motion information candidate deletion unit, 163 first combination motion information candidate supplement unit, 164 second combination motion information candidate supplement unit, 165 candidate block Setting unit, 166 alternative combined motion information candidate supplementing unit, 200 moving image decoding apparatus, 201 code string analyzing unit, 202 prediction error decoding unit, 203 adding unit, 204 motion information reproducing unit, 205 motion compensating unit, 206 frame memory, 207 A motion information memory; 210 an encoding mode determination unit; 211 a motion vector playback unit; 212 a combined motion information playback unit; 230 a combined motion information candidate list generation unit; and 231 a combined motion information selection unit.
Claims (6)
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成部と、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択部と、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化部とを備え、
前記結合動き情報候補生成部は、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする動画像符号化装置。 A video encoding device that encodes a coding block composed of one or more prediction blocks,
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation unit that derives a plurality of combined motion information candidates to be commonly used for all the prediction blocks in the encoded block;
A combined motion information selection unit that selects one combined motion information candidate from the plurality of combined motion information candidates and uses the selected combined motion information candidate in a prediction block to be encoded;
An encoding unit that encodes, as a candidate specifying index, an index for specifying the selected one combined motion information candidate ,
The combined motion information candidate generation unit includes information indicating whether to derive joint motion information candidates to be used in common for all the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. A video encoding device.
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、
前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする動画像符号化方法。 A moving picture coding method for coding a coding block including one or more prediction blocks,
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation step for deriving a plurality of combined motion information candidates to be commonly used for all of the prediction blocks in the encoded block;
A combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded;
An encoding step of encoding, as a candidate specifying index, an index for specifying the selected one combined motion information candidate ,
In the combined motion information candidate generation step, information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived is all of the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. A video encoding method.
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとをコンピュータに実行させ、
前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする動画像符号化プログラム。 A moving picture coding program for coding a coding block composed of one or more prediction blocks,
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation step for deriving a plurality of combined motion information candidates to be commonly used for all of the prediction blocks in the encoded block;
A combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded;
An encoding step of encoding an index for specifying the selected candidate combined motion information candidate as a candidate specifying index ;
In the combined motion information candidate generation step, information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived is all of the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. A video encoding program.
前記符号化ストリームをパケット化して符号化データを得るパケット処理部と、
パケット化された前記符号化データを送信する送信部とを備え、
前記動画像符号化方法は、
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、
前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする送信装置。 A transmission apparatus that transmits an encoded stream encoded by a moving image encoding method for encoding an encoded block including one or more prediction blocks,
A packet processing unit that packetizes the encoded stream to obtain encoded data;
A transmission unit for transmitting the packetized encoded data,
The moving image encoding method includes:
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation step for deriving a plurality of combined motion information candidates to be commonly used for all of the prediction blocks in the encoded block;
A combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded;
An encoding step of encoding, as a candidate specifying index, an index for specifying the selected one combined motion information candidate ,
In the combined motion information candidate generation step, information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived is all of the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. A transmitting device.
前記符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、
パケット化された前記符号化データを送信する送信ステップとを備え、
前記動画像符号化方法は、
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、
前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする送信方法。 A transmission method for transmitting an encoded stream encoded by a moving image encoding method for encoding an encoded block including one or more prediction blocks,
A packet processing step of packetizing the encoded stream to obtain encoded data;
Transmitting the packetized encoded data, and
The moving image encoding method includes:
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation step for deriving a plurality of combined motion information candidates to be commonly used for all of the prediction blocks in the encoded block;
A combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded;
An encoding step of encoding, as a candidate specifying index, an index for specifying the selected one combined motion information candidate ,
In the combined motion information candidate generation step, information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived is all of the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. And sending method.
前記符号化ストリームをパケット化して符号化データを得るパケット処理ステップと、
パケット化された前記符号化データを送信する送信ステップとをコンピュータに実行させ、
前記動画像符号化方法は、
前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出することを示す情報であった場合、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する複数の結合動き情報候補を導出する結合動き情報候補生成ステップと、
前記複数の結合動き情報候補から1つの結合動き情報候補を選択し、選択された前記1つの結合動き情報候補を符号化対象の予測ブロックで利用する結合動き情報選択ステップと、
選択された前記1つの結合動き情報候補を特定するためのインデックスを候補特定インデックスとして符号化する符号化ステップとを備え、
前記結合動き情報候補生成ステップは、前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出するか否かを示す情報が前記符号化ブロック内の予測ブロックの全てに対して共通に利用する結合動き情報候補を導出しないことを示す情報であった場合、前記符号化対象の予測ブロックの大きさと位置に基づいて前記複数の結合動き情報候補を導出することを特徴とする送信プログラム。 A transmission program for transmitting an encoded stream encoded by a moving image encoding method for encoding an encoded block composed of one or more prediction blocks,
A packet processing step of packetizing the encoded stream to obtain encoded data;
Transmitting the packetized encoded data to the computer, and
The moving image encoding method includes:
Information indicating whether or not a joint motion information candidate to be used in common for all the prediction blocks in the coding block is derived is used in common for all the prediction blocks in the coding block. When it is information indicating that an information candidate is derived, a combined motion information candidate generation step for deriving a plurality of combined motion information candidates to be commonly used for all of the prediction blocks in the encoded block;
A combined motion information selection step of selecting one combined motion information candidate from the plurality of combined motion information candidates and using the selected combined motion information candidate in a prediction block to be encoded;
An encoding step of encoding, as a candidate specifying index, an index for specifying the selected one combined motion information candidate ,
In the combined motion information candidate generation step, information indicating whether or not joint motion information candidates to be commonly used for all of the prediction blocks in the encoded block are derived is all of the prediction blocks in the encoded block. The plurality of combined motion information candidates are derived based on the size and position of the prediction block to be encoded. A sending program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015217367A JP6065088B2 (en) | 2011-12-28 | 2015-11-05 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011288984 | 2011-12-28 | ||
JP2011288984 | 2011-12-28 | ||
JP2015217367A JP6065088B2 (en) | 2011-12-28 | 2015-11-05 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012286856A Division JP5835208B2 (en) | 2011-12-28 | 2012-12-28 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016042727A JP2016042727A (en) | 2016-03-31 |
JP6065088B2 true JP6065088B2 (en) | 2017-01-25 |
Family
ID=49049412
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012286856A Active JP5835208B2 (en) | 2011-12-28 | 2012-12-28 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
JP2015179297A Active JP5835521B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179298A Active JP5835522B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179300A Active JP5835524B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179299A Active JP5835523B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015217367A Active JP6065088B2 (en) | 2011-12-28 | 2015-11-05 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012286856A Active JP5835208B2 (en) | 2011-12-28 | 2012-12-28 | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
JP2015179297A Active JP5835521B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179298A Active JP5835522B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179300A Active JP5835524B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
JP2015179299A Active JP5835523B1 (en) | 2011-12-28 | 2015-09-11 | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
Country Status (1)
Country | Link |
---|---|
JP (6) | JP5835208B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5835208B2 (en) * | 2011-12-28 | 2015-12-24 | 株式会社Jvcケンウッド | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
US10602180B2 (en) * | 2017-06-13 | 2020-03-24 | Qualcomm Incorporated | Motion vector prediction |
CN117812258A (en) | 2018-07-02 | 2024-04-02 | Lg电子株式会社 | Image decoding apparatus, image encoding apparatus, and transmitting apparatus |
CN118694921A (en) * | 2018-07-27 | 2024-09-24 | 三星电子株式会社 | Method and apparatus for encoding and decoding image |
GB2611323A (en) * | 2021-09-29 | 2023-04-05 | Canon Kk | Video coding and decoding |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9313494B2 (en) * | 2011-06-20 | 2016-04-12 | Qualcomm Incorporated | Parallelization friendly merge candidates for video coding |
KR102073405B1 (en) * | 2011-09-09 | 2020-02-04 | 엘지전자 주식회사 | Inter prediction method and apparatus therefor |
US9736489B2 (en) * | 2011-09-17 | 2017-08-15 | Qualcomm Incorporated | Motion vector determination for video coding |
ES2647622B1 (en) * | 2011-09-23 | 2018-11-07 | Kt Corporation | METHOD TO INDUCE A FUSION CANDIDATE BLOCK AND DEVICE USING THE SAME |
CN110446038B (en) * | 2011-11-08 | 2022-01-04 | 韩国电子通信研究院 | Method and apparatus for sharing a candidate list |
JP5835208B2 (en) * | 2011-12-28 | 2015-12-24 | 株式会社Jvcケンウッド | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program |
-
2012
- 2012-12-28 JP JP2012286856A patent/JP5835208B2/en active Active
-
2015
- 2015-09-11 JP JP2015179297A patent/JP5835521B1/en active Active
- 2015-09-11 JP JP2015179298A patent/JP5835522B1/en active Active
- 2015-09-11 JP JP2015179300A patent/JP5835524B1/en active Active
- 2015-09-11 JP JP2015179299A patent/JP5835523B1/en active Active
- 2015-11-05 JP JP2015217367A patent/JP6065088B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016027724A (en) | 2016-02-18 |
JP5835523B1 (en) | 2015-12-24 |
JP5835522B1 (en) | 2015-12-24 |
JP2016027726A (en) | 2016-02-18 |
JP5835521B1 (en) | 2015-12-24 |
JP2016027723A (en) | 2016-02-18 |
JP2016027725A (en) | 2016-02-18 |
JP2013153433A (en) | 2013-08-08 |
JP5835524B1 (en) | 2015-12-24 |
JP2016042727A (en) | 2016-03-31 |
JP5835208B2 (en) | 2015-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2013099285A1 (en) | Video encoding device, video encoding method and video encoding program, and video decoding device, video decoding method and video decoding program | |
WO2013099283A1 (en) | Video encoding device, video encoding method and video encoding program, and video decoding device, video decoding method and video decoding program | |
JP6065088B2 (en) | Moving picture coding apparatus, moving picture coding method, moving picture coding program, transmission apparatus, transmission method, and transmission program | |
JP5843032B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP5880758B2 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program | |
JP5843041B1 (en) | Moving picture decoding apparatus, moving picture decoding method, moving picture decoding program, receiving apparatus, receiving method, and receiving program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20160913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6065088 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |