WO2013070006A1 - 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 - Google Patents
스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 Download PDFInfo
- Publication number
- WO2013070006A1 WO2013070006A1 PCT/KR2012/009435 KR2012009435W WO2013070006A1 WO 2013070006 A1 WO2013070006 A1 WO 2013070006A1 KR 2012009435 W KR2012009435 W KR 2012009435W WO 2013070006 A1 WO2013070006 A1 WO 2013070006A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- block
- current block
- prediction
- encoding
- motion
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/109—Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Definitions
- the present invention relates to video encoding and decoding, and more particularly, to a method and apparatus for quickly determining a skip encoding mode in a video encoding process and encoding and decoding a video using the same.
- one picture is divided into a plurality of macroblocks.
- Macroblocks have a fixed size of 16x16 pixels.
- Each macroblock is encoded according to all possible encoding modes (inter prediction mode) using the inter prediction method and all possible encoding modes (intra prediction mode) using the intra prediction method, and then a predetermined criterion is selected.
- One optimal mode is determined, and video encoding and decoding are performed using the optimal mode.
- the H.264 / AVC standard uses R-D optimization criteria as a predetermined criterion. Therefore, one optimal mode is determined by considering both the bit rate required for each macroblock and the degree of distortion between the original macroblock and the reconstructed macroblock.
- Intra prediction mode does not refer to a reference picture to encode a macroblock of a current picture, but predicts a prediction value for a macroblock to be encoded using a pixel value spatially adjacent to the macroblock to be encoded, and then This mode is used for an intra prediction method of encoding a difference.
- the intra prediction mode has a plurality of modes according to the intra prediction direction. As shown in FIG. 1, the H.264 / AVC standard provides nine intra prediction modes (for 4 ⁇ 4 and 8 ⁇ 8 intra blocks in FIG. 1A) and four intra prediction modes (16 in FIG. 1B) with directionality. X16 intra block).
- the inter prediction mode is an inter encoding mode that encodes a difference between a pixel value and motion information (eg, a motion vector, a reference picture index, etc.) indicating positions of one or a plurality of blocks selected from a reference picture in order to encode a macroblock of a current picture.
- the mode used for the prediction method In the H.264 / AVC standard, it can have up to five reference pictures and can be past or future pictures based on the current picture.
- the inter prediction mode there are a plurality of modes according to how the macroblock is divided to perform motion prediction and compensation. As shown in FIG. 2, the H.264 / AVC standard uses five inter prediction modes (SKIP, P16 ⁇ 16, P16 ⁇ 8, P8 ⁇ 16, and P8 ⁇ 8).
- the P8x8 mode may be further divided into four lower blocks (P8x8, P8x4, P4x8, and P4x4).
- determining the optimal mode among the plurality of intra prediction modes and the inter prediction modes is a very important process for determining the video encoding performance.
- the conventional H.264 / AVC standard calculates each rate-distortion cost for every possible intra prediction mode and inter prediction mode and selects the mode with the lowest cost as the optimal mode.
- the optimal mode decision process requires very high complexity.
- the complexity of the optimal mode decision process is further increased.
- the skip mode of the encoding mode is used, the encoding and decoding process can be simplified more.
- the simple mode can be easily known whether it is appropriate to encode the given image data in the skip mode, It can reduce the coding performance. Therefore, encoding and decoding an image using a skip mode is a very important technical problem.
- the present invention can provide a method and apparatus for encoding and decoding an image using a skip mode, thereby reducing encoding complexity and reducing encoding efficiency.
- the present invention has a main purpose to quickly determine an encoding mode in a video encoding process, to encode a video using the same, and to efficiently decode the encoded video.
- the current block has a predetermined size, and as a result of motion estimation of the current block, the motion vector and the reference picture index of the current block are any one of the candidate blocks.
- the result of transforming and quantizing a surplus data block corresponding to a motion vector and a reference picture index of each block of the block and the difference between the current block and the prediction block is 0, or one of the candidate blocks composed of neighboring blocks of the current block
- the prediction mode of the current block is set to the skip mode.
- a video encoder for predicting and encoding the encoded video; And an image decoder for extracting information about a prediction mode from a bitstream and reconstructing a block indicated by a motion parameter generated by extracting motion parameter identification information when the extracted prediction information is a skip mode, into a current block.
- a video encoding / decoding apparatus is provided.
- the current block has a predetermined size, and as a result of motion estimation of the current block, the motion vector and the reference picture index of the current block are any one of the candidate blocks. If the result of transforming and quantizing a surplus data block corresponding to a motion vector and a reference picture index of 0 and the difference between the current block and the prediction block is 0, the prediction mode of the current block is set to a skip mode and predictive encoding is performed.
- a video encoding apparatus is provided.
- the predetermined size may be a coding unit size.
- the image encoding apparatus may transmit information indicating a skip mode and the motion parameter identification information to the image decoding apparatus.
- the video encoding apparatus The video encoding apparatus,
- the process of comparing encoding costs for the remaining prediction modes is omitted and the prediction mode of the current block is set to a skip mode. Can be predictively encoded.
- motion compensation is performed using a motion parameter for one block among candidate blocks having a predetermined size and configured as neighboring blocks of the current block.
- the present invention provides an image encoding apparatus characterized by predicting and encoding a current block in a skip mode by using a single motion parameter when a result of transforming and quantizing a surplus data block that is a difference between a current block and a prediction block is 0. do.
- the predetermined size may be a coding unit size.
- the video encoding apparatus The video encoding apparatus,
- Information indicating a skip mode and identification information about the one motion parameter may be transmitted to the image decoding apparatus.
- the motion parameter may include a motion vector and a reference picture index.
- the motion parameter may be information for identifying one of the candidate blocks composed of neighboring blocks of the current block, and may include a motion vector and a reference picture index.
- the motion parameter may be information for identifying one of candidate blocks composed of neighboring blocks of the current block.
- the current block may be predictively encoded in a skip mode using the one motion parameter.
- the motion parameter generated by extracting the motion parameter identification information is the present invention.
- the present invention provides a video decoding apparatus characterized by reconstructing an indicated block to a current block and generating a prediction block according to extracted prediction information when the skipped mode is not used and predictively decoding the current block.
- the motion parameter includes a motion vector and a reference picture index
- the motion parameter identification information may be information for identifying one of candidate blocks composed of neighboring blocks of the current block.
- the current block has a predetermined size, and as a result of motion estimation of the current block, the motion vector and the reference picture index of the current block are any one of the candidate blocks.
- the result of transforming and quantizing a surplus data block corresponding to a motion vector and a reference picture index of each block of the block and the difference between the current block and the prediction block is 0, or one of the candidate blocks composed of neighboring blocks of the current block
- the prediction mode of the current block is set to the skip mode.
- a video encoding step of predicting and encoding the encoded video And an image decoding step of extracting information on a prediction mode from a bitstream and reconstructing a block indicated by a motion parameter generated by extracting motion parameter identification information when the extracted prediction information is a skip mode, into a current block.
- a video encoding / decoding method is provided.
- the current block has a predetermined size, and as a result of motion estimation of the current block, the motion vector and the reference picture index of the current block are any one of the candidate blocks. If the result of transforming and quantizing a surplus data block corresponding to a motion vector and a reference picture index of 0 and the difference between the current block and the prediction block is 0, the prediction mode of the current block is set to a skip mode and predictive encoding is performed. It provides a video encoding method comprising the step of.
- motion compensation is performed using a motion parameter of one block among candidate blocks having a predetermined size and composed of neighboring blocks of the current block. Predicting encoding the current block in a skip mode using the one motion parameter when the result of transforming and quantizing the surplus data block that is the difference between the current block and the prediction block is 0 Provides an encoding method.
- a motion parameter generated by extracting motion parameter identification information is And restoring the indicated block to the current block, and predictively decoding the current block by generating a prediction block according to the extracted prediction information when it is not the skip mode.
- the video encoding process has an effect of encoding a video using the SKIP mode and efficiently decoding the encoded video.
- FIG. 1 illustrates nine intra prediction modes (for 4x4 and 8x8 intra blocks) and four intra prediction modes (for 16x16 intra blocks) with directionality in the H.264 / AVC standard. to be.
- FIG. 2 is a diagram illustrating a case where five inter prediction modes (SKIP, P16 ⁇ 16, P16 ⁇ 8, P8 ⁇ 16, and P8 ⁇ 8) are used in the H.264 / AVC standard.
- SKIP inter prediction modes
- FIG. 3 is a block diagram of a video encoding apparatus to which a fast mode determining apparatus according to an embodiment of the present invention is applied.
- FIG. 4 is a diagram illustrating a configuration of a prediction unit.
- FIG. 5 is a flowchart of a fast mode determining method according to an exemplary embodiment of the present invention described above.
- FIG. 6 is a flowchart of a fast mode determining method according to an exemplary embodiment of the present invention described above.
- FIG. 7 is a block diagram illustrating a video decoding apparatus according to an embodiment of the present invention.
- a video encoding apparatus (Video Encoding Apparatus), a video decoding apparatus (Video Decoding Apparatus) to be described below is a personal computer (PC), notebook computer, personal digital assistant (PDA), portable multimedia player (PMP) : User terminal such as Portable Multimedia Player (PSP), PlayStation Portable (PSP: PlayStation Portable), Wireless Terminal, Smart Phone, TV, etc., or Server terminal such as Application Server and Service Server.
- a communication device such as a communication modem for communicating with a wired / wireless communication network, a memory for storing various programs and data for encoding or decoding an image, inter or intra prediction for encoding or decoding, and executing and operating a program.
- Various devices including a microprocessor for the purpose of It can be beautiful.
- the image encoded in the bitstream by the video encoding apparatus is real-time or non-real-time through the wired or wireless communication network, such as the Internet, local area wireless communication network, wireless LAN network, WiBro network, mobile communication network, or the like, or a cable, universal serial bus (USB: Universal) It may be transmitted to an image decoding apparatus through various communication interfaces such as a serial bus, and may be decoded by the image decoding apparatus to restore and reproduce the image.
- wired or wireless communication network such as the Internet, local area wireless communication network, wireless LAN network, WiBro network, mobile communication network, or the like, or a cable, universal serial bus (USB: Universal) It may be transmitted to an image decoding apparatus through various communication interfaces such as a serial bus, and may be decoded by the image decoding apparatus to restore and reproduce the image.
- USB universal serial bus
- a video may be composed of a series of pictures, and each picture may be divided into a predetermined area such as a frame or a block.
- the divided blocks may be classified into intra blocks and inter blocks according to an encoding method.
- An intra block refers to a block that is encoded by using an intra prediction coding method.
- An intra prediction coding is performed by using pixels of blocks previously encoded, decoded, and reconstructed in a current picture that performs current encoding.
- a prediction block is generated by predicting pixels of a block and a difference value with pixels of the current block is encoded.
- An inter block refers to a block that is encoded using inter prediction coding.
- Inter prediction coding generates a prediction block by predicting a current block within a current picture by referring to one or more past or future pictures, and then generates a current block. This is a method of encoding the difference value with.
- a frame referred to for encoding or decoding the current picture is referred to as a reference frame.
- a video encoding apparatus to which a fast mode determining apparatus according to an embodiment of the present invention is applied includes a predictor 310, a redundant data encoder 320, a redundant data decoder 330, and an entropy encoder. 340, the encoded data generator 350, the in-loop filter unit 360, the subtractor 370, and the adder 380.
- the video to be encoded may be input in block units having a predetermined size.
- the video to be encoded may be a 16 ⁇ 16 macroblock.
- the block is defined in the form of 2N ⁇ 2N in the same manner as in the H.264 / AVC standard, but more generally, the block may be 2M ⁇ 2N, in particular, M and N may be respectively. It may be larger or smaller than 8 or 8, and M and N may be different integers or the same integer.
- an input block having a size of 2N ⁇ 2N may be divided into a lower input block having a size of N ⁇ N.
- the prediction unit 310 generates a prediction block of the current block having the predetermined size. That is, the prediction unit 310 predicts the current block by using intra prediction or inter prediction, thereby predicting the prediction block having a predicted pixel value as the pixel value of each pixel. Create The prediction block generated by using the intra or inter prediction is subtracted from the current block to generate a residual data block. That is, a surplus data block (residual block) having surplus data (residual data) generated by calculating a difference between an original pixel value of each pixel of the current block and a predicted pixel value of each pixel of the prediction block is calculated. It generates and provides it to the redundant data encoder 320.
- the predictor 310 may include an intra predictor 410, an inter predictor 420, and an optimal mode determiner 430 as shown in FIG. 4.
- the intra prediction unit 410 generates a prediction block in all intra prediction modes that the current block can have
- the inter prediction unit 420 generates a prediction block in all inter prediction modes that the current block can have.
- the best mode determiner 430 calculates the rate-distortion cost for each intra prediction mode and the inter prediction mode that can be generated by the intra predictor 410 and the inter predictor 420, and the cost is calculated. The smallest mode is determined as the best mode of the current block.
- the intra predictor 410 generates an intra prediction block of the current block by using pixel values of available neighboring blocks that are spatially located around the current block.
- nine intra prediction modes N / 2 ⁇ N / 2 and N ⁇ N intra blocks) having directionality in the same manner as in the H.264 / AVC standard.
- four intra prediction modes (when 2N ⁇ 2N intra block) are illustrated, but may be defined in more various ways.
- K intra prediction modes with directionality and L intra prediction modes without directionality may be used in combination.
- M and N may be larger or smaller than 8 or 8, respectively, and M and N may be different integers or the same integer.
- different K or L intra prediction modes may be used depending on the size of the intra block.
- the inter prediction unit 420 calculates error values of the current block and the inter prediction block, respectively, for all available reference pictures located in the temporal vicinity (past, present, or future) with the current picture, and has a minimum error value.
- An inter prediction block of the current block is generated through the inter prediction block of the reference picture.
- the motion vector is estimated based on the position of the inter prediction block having the minimum error value with the current block.
- the rate-distortion optimization criterion is applied to the motion estimation process, not only the error values of the current block and the inter prediction block but also the amount of bits required to encode motion information (motion vector, reference picture index, etc.)
- the prediction block can be determined.
- the conventional H.264 / AVC standard determines one predictive motion vector (PMV) using a median value among motion vectors of neighboring blocks, and Only differential motion vectors are transmitted or stored by using them as predicted values of the motion vectors.
- PMV predictive motion vector
- a method of determining an optimal predictive motion vector among a plurality of predictive motion vector candidates is illustrated for a more general example.
- the prediction motion vector index may be transmitted or stored together to express which prediction motion vector candidate is used.
- the optimal mode determiner 430 calculates respective rate-distortion costs for all intra prediction modes and inter prediction modes that the current block generated by the intra predictor 410 and the inter predictor 420 may have.
- the mode having the lowest cost is determined as the optimal mode of the current block.
- a predetermined optimal mode decision criterion is exemplified as a general rate-distortion optimization method, but more generally, various decision criteria may be applied. For example, in some embodiments, distortion may be applied as a determination criterion.
- the calculation of each rate-distortion cost for all intra prediction modes and / or inter prediction modes that the current block may have may be omitted, and the optimal mode of the current block may be determined. .
- calculating the rate-distortion cost for each intra prediction mode and inter prediction mode that the current block may have requires a lot of complexity, and according to an embodiment of the present invention, (a) Determining whether the block satisfies a condition corresponding to the first predetermined mode when determining an optimal mode of a block having a predetermined size that may have a plurality of intra prediction modes and an inter prediction mode; And (b) if the condition corresponding to the first predetermined mode is satisfied, determining the first mode as an optimal mode of the block and encoding the block using the optimal mode. ).
- the optimum mode determiner 430 may calculate the rate-distortion cost for all the intra prediction modes and the inter prediction modes that the current block may have, instead of calculating the predetermined first mode. First, it is determined whether or not the condition corresponding to the above is satisfied. If the current block satisfies a condition corresponding to the first mode, the optimum mode determiner 430 skips the calculation of the rate-distortion cost for all modes and sets the first mode to the optimal mode of the block. Decide If the current block does not satisfy the condition corresponding to the first mode, the optimum mode determiner 430 calculates the rate-distortion cost for all modes and selects a mode having the smallest rate-distortion cost. Determine the optimal mode of the block.
- the predetermined condition is (a) the block size for motion prediction and compensation is the coding unit size (e.g., 2N x 2N, i.e., P2N x 2N mode), ( b) the motion vector and the reference picture index of the current block coincide with the motion vector and the reference picture index of any one of the plurality of candidate blocks, and (c) convert the surplus data blocks of the predetermined input block and the prediction block.
- the result of quantization is preferably zero.
- the first mode is a skip mode for transmitting or storing only encoding mode information of the input block.
- the conventional skip mode transmits or stores only encoding mode information of an input block.
- candidate block index information for identifying the candidate block in which the prediction motion parameter is selected is further transmitted or stored.
- FIG. 5 is a flowchart of a fast mode determining method according to an exemplary embodiment of the present invention described above.
- the skip mode includes only the encoding mode information of the input current block (if necessary, the identification information on the motion parameter that makes the difference motion vector zero, including the index of the neighboring block as one candidate block).
- This mode transmits or stores the video decoding device. That is, in a background part of a video, a given block of the current picture has a high probability that the pixel value is the same as a corresponding reference block of the reference picture, and in this case, transmission or storage of separate coded information such as surplus data or motion vector information. This is because it is not necessary to transmit or store only the encoding mode information (and / or the index of the neighboring block).
- motion prediction is performed on the P2N ⁇ 2N mode of the current block, and a motion vector, a predicted motion vector index, a reference picture index, etc. are determined ( S501).
- a rate-distortion optimization process as in Equation 1.
- Equation 1 J and D mean a rate-distortion optimization function and a distortion function, respectively.
- R dmv is a bit amount measurement function required to encode the candidate differential motion vector dmv i included in the predetermined motion prediction range SR (Search Range), and R pmv is included in the candidate candidate motion vector set CS (Candidate Set).
- Bit amount measurement function required to encode the candidate candidate motion vector pmv j That is, as in Equation 1, for the P2N ⁇ 2N mode of the current block, the differential motion vector dmv and the predicted motion vector pmv that minimize the rate-distortion optimization function J are selected and the rate-distortion cost is calculated.
- the current block it is determined whether the current block can be determined to the skip mode early through a predetermined condition (S502). If the current block satisfies the condition corresponding to the skip mode, the process of calculating the rate-distortion cost for all other modes is omitted, and the skip mode is determined as the optimal mode of the current block (S503). If the current block does not satisfy the condition corresponding to the skip mode, the process of calculating the rate-distortion cost for the encoding of all modes is performed (S504 to S507), and the mode having the smallest rate-distortion cost is selected for the current block. Determine the optimal mode of (S508).
- the predetermined condition is (a) the block size for motion prediction and compensation is 2N ⁇ 2N, (b) the predetermined data block and the redundant data block of the prediction block It is preferable that the result of transforming and quantizing is equal to zero.
- the first mode is a skip mode for transmitting or storing only encoding mode information of the input block.
- the skip mode transmits or stores only encoding mode information of an input block.
- the skip mode uses a method of selecting an optimal predictive motion parameter from motion parameters of temporal and spatial neighboring blocks, as in an embodiment of the present invention,
- the predicted motion vector index information for identifying the predicted motion vector candidate is further transmitted or stored to the image decoding apparatus.
- FIG. 6 is a flowchart illustrating a fast mode determination method according to another exemplary embodiment of the present invention described above.
- the candidate prediction motion vector means a motion vector of neighboring neighboring blocks temporally and spatially
- the spatial neighboring block refers to neighboring blocks of the current block
- the temporal neighboring block refers to a block similar to the position of the current block in the past picture. do.
- a block at a position similar to that of the current block may be a block at the same position or may be another block adjacent to the same position.
- the candidate prediction motion vector is not limited thereto, and various blocks may be used according to embodiments.
- the differential motion vector since the candidate prediction motion parameter is used for motion estimation as it is, the differential motion vector may be assumed to be (0,0). Accordingly, the motion estimation is performed using each of the predicted motion parameters of the candidate block, and the rate-distortion cost is calculated by applying only the rate-distortion optimization process to determine only the optimal predicted motion parameter (S601). Thereafter, it is determined whether the current block can be determined as the skip mode early through the predetermined condition (S602). In this embodiment, since the differential motion vector is assumed to be (0,0) early, only the two predetermined conditions need to be confirmed.
- a prediction block generated by using 2N ⁇ 2N encoding and a motion parameter selected from selected candidate blocks is generated to transform and quantize a residual block (surplus block), which is a difference between a current block and a prediction block. This means that the result is all zeros.
- the process of calculating the rate-distortion cost for all other modes is omitted, and the skip mode is determined as an optimal mode of the current block (S603). If the current block does not satisfy the condition corresponding to the skip mode, the process of calculating the rate-distortion cost for the encoding of all modes is performed (S604 to S608), and the mode having the smallest rate-distortion cost is selected for the current block. Determine the optimal mode of (S609).
- the subtraction unit 370 subtracts the prediction block from the current block to generate a residual block (surplus block).
- the redundant data encoder 320 transforms and quantizes the redundant data block, and then generates a transform quantized redundant data block.
- a variety of methods for transforming a spatial domain signal such as a Hadamard transform, a discrete cosine transform, and the like, may be used.
- Various quantization techniques such as uniform quantization including a dead zone, a quantization matrix, and the like may be used.
- the size of the transform block to be transformed and quantized may be applied in various sizes and shapes within a range not exceeding the size of the input current block.
- the size of the current block is 2N ⁇ 2N and the size of the prediction block is N ⁇ N, 2N ⁇ 2N, 2N ⁇ N, N ⁇ 2N, N ⁇ N, N ⁇ that do not exceed 2N ⁇ 2N units.
- Conversion blocks such as N / 2, N / 2 ⁇ N, N / 2 ⁇ N / 2 units, and the like may be used.
- the size of the transform block may be selected as a rate-distortion optimization criterion. That is, various sizes and shapes may be selected based on a predetermined criterion within the range of the size of the transform block to be transformed and quantized without exceeding the size of the input current block.
- the redundant data decoder 330 inversely quantizes and inversely transforms the residual block transformed and quantized by the redundant data encoder 320 to restore the residual block.
- Inverse quantization and inverse transformation may be configured in various ways by inversely performing a transformation process and a quantization process performed by the redundant data encoder 320. For example, instead of using the same process of transformation and inverse transformation or quantization and inverse quantization shared by the redundant data encoder 320 and the redundant data decoder 330 in advance, the redundant data decoder 330 may be configured as described above.
- the redundant data encoder uses information on the transform and quantization processes generated and transmitted by the transform and quantization processes of the redundant data encoder 320 (for example, information on a transform size, a transform shape, and a quantization type). By performing the inverse transformation and quantization process of 320, inverse quantization and inverse transformation may be performed.
- the residual block output by the redundant data decoder 330 is combined with the predicted value reconstructed by the predictor 310 to generate a reconstructed image.
- the entropy encoder 340 entropy codes and outputs the excess data blocks output from the redundant data encoder 320.
- the entropy encoder 340 may encode not only the excess data block but also various pieces of information necessary to decode the encoded bit string.
- the various pieces of information necessary to decode the coded bit stream include information about a block type, information about an intra prediction mode when the prediction mode is an intra prediction mode, and information about a motion vector when the prediction mode is an inter prediction mode.
- Information, information on transform and quantization types, and the like may be various pieces of information.
- the entropy coding method used in the entropy encoder 340 may be various methods such as context adaptive variable length coding and context adaptive binary arithmetic coding. have.
- the encoded data generation unit 350 may refer to the entropy-encoded surplus data, the macroblock mode, and the encoded prediction information (for example, the intra prediction mode in the case of intra coding, the motion vector in the case of inter coding, the candidate motion vector index, and the reference). Information such as a picture index) and the like to output a bitstream.
- the filter unit 360 filters the reconstructed current block to reduce the distortion effect caused by the prediction and quantization.
- the filter unit 360 may include information about prediction in units of blocks transmitted together with the reconstructed current block (for example, intra prediction mode for intra coding and reference for inter coding). Adaptive filtering may be performed using information such as a picture index and a motion vector) or information on transform and quantization (for example, information on a size and shape of a transform block and information on a quantization parameter).
- the information about the prediction or the quantization may be directly transmitted to the filter unit 360 of the encoding apparatus, or may be generated as a bitstream by the encoded data generator 350 and transmitted to the decoding apparatus.
- the filter 360 compensates the difference between the input current block and the reconstructed current block, thereby minimizing distortion effects caused by prediction and quantization, and converts the corresponding difference into the encoded data generator 350.
- a bitstream may be generated and delivered to the decoding apparatus.
- the adder 380 reconstructs the current block by adding the residual block reconstructed in the redundant data after decoding 330 and the prediction block generated in the predictor 310.
- FIG. 7 is a block diagram illustrating an image decoding apparatus 700 according to an embodiment of the present invention.
- the image decoding apparatus 700 may include a bitstream decoder 710, a redundant data decoder 720, a predictor 730, an adder 740, and a filter 750. Can be.
- the bitstream decoder 710 may decode or extract not only the quantized frequency transform block but also information necessary for decoding by decoding the bitstream.
- Information necessary for decoding refers to information required for decoding the coded bit string in the coded data (ie, the bitstream). For example, the size of the coding unit (CU), the prediction unit (PU), and the transformation unit (TU) Information about the coded coding type cbp, information about the coded coding flag cbf, information about a motion vector, information about transform and quantization types, and the like, and various other information.
- the bitstream decoder 710 extracts a quantized frequency transform block including pixel information of the current block of the image by decoding the bitstream, which is data encoded by the image encoding apparatus 300, and extracts the extracted quantized frequency transform block.
- the information necessary for the prediction is transferred to the prediction unit 730.
- the predictor 730 may predict the current block in the same manner as the predictor 310 of the image encoding apparatus 300 by using the information necessary for the prediction transmitted from the bitstream decoder 710.
- the redundant data decoder 720 inversely quantizes and inverse transforms the quantized frequency transform block extracted from the bitstream by the bitstream decoder 710 to restore the residual block.
- the adder 740 restores the original pixel value of the current block by adding the residual signal reconstructed by the redundant data decoder 720 and the predicted pixel value generated by the predictor 730.
- the filter 750 performs the same operation as that performed by the image encoding apparatus 300 on the reconstructed current block with respect to the reconstructed current block.
- the bitstream decoder 710 extracts information about the prediction mode from the bitstream and checks whether the extracted prediction information is a skip mode or not.
- the skip mode the block indicated by the motion parameter generated by extracting the motion parameter identification information from the bitstream is restored to the current block.
- the prediction block is predicted and decoded by generating the prediction block according to the prediction information extracted by the prediction unit 730.
- An image encoding / decoding apparatus may be configured by connecting a bitstream output terminal of the image encoding apparatus 300 of FIG. 3 to a bitstream input terminal of the image decoding apparatus 700 of FIG. 7.
- the current block has a predetermined size, and as a result of the motion estimation of the current block, the motion vector and the reference picture index of the current block are the motions of any one of the candidate blocks.
- the prediction mode of the current block is set to a skip mode to predictive encoding.
- the image encoder may be implemented by the image encoding apparatus 300 according to an embodiment of the present invention
- the image decoder may be implemented by the image decoding apparatus 700 according to the embodiment of the present invention.
- the current block has a predetermined size, and as a result of the motion estimation of the current block, the motion vector and the reference picture index of the current block are the motion vectors of any one of the candidate blocks; Predicting encoding by setting a prediction mode of the current block to a skip mode when a result of transforming and quantizing an excess data block corresponding to a reference picture index and a difference value between the current block and the prediction block is 0 do.
- the image encoding method compares the encoding cost for the remaining prediction modes when the result of transforming and quantizing a redundant data block that is a difference between the current block and the prediction block is 0.
- the process may be omitted by skipping the procedure and setting the prediction mode of the current block to the skip mode.
- motion compensation is performed using a motion parameter of one block among candidate blocks of a current block having a predetermined size and configured as neighboring blocks of the current block, and the prediction is performed with the current block. Predicting encoding the current block in a skip mode using the one motion parameter when the result of transforming and quantizing the surplus data block, which is a difference from the block, is zero.
- a skip mode is performed using the one motion parameter.
- the current block can be predictively encoded.
- the image decoding method extracts the information on the prediction mode from the bitstream to extract a block indicated by the motion parameter generated by extracting the motion parameter identification information when the extracted prediction information is the skip mode. Restoring to the current block, and if not in the skip mode, generating a prediction block according to the extracted prediction information and predictively decoding the current block.
- An image encoding / decoding method may be realized by combining the image encoding method according to an embodiment of the present invention and the image decoding method according to an embodiment of the present invention.
- the current block has a predetermined size, and as a result of the motion estimation of the current block, the motion vector and the reference picture index of the current block are the motions of any one of the candidate blocks.
- the prediction mode of the current block is set to a skip mode to predictive encoding.
- all the components constituting the embodiment of the present invention may be implemented in one independent hardware, each of some or all of the components are selectively combined to some or all of the functions combined in one or a plurality of hardware. It may be implemented as a computer program having a program module for performing the operation. Codes and code segments constituting the computer program may be easily inferred by those skilled in the art. Such a computer program may be stored in a computer readable storage medium and read and executed by a computer, thereby implementing embodiments of the present invention.
- the storage medium of the computer program may include a magnetic recording medium, an optical recording medium, a carrier wave medium, and the like.
- the skip encoding mode is used in the video encoding process, the video encoding is performed, and the effect of efficiently decoding the encoded video is generated.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은, 현재 블록을 인터 및 인트라 예측방법으로 예측하여 예측 블록을 생성하는 예측부; 현재 블록과 상기 예측 블록을 감산하여 생성된 잔여 블록을 변환 및 양자화하는 잉여데이터 부호화부; 상기 변환 및 양자화된 잔여 블록을 역 양자화 및 역 변환하여 잔여 블록을 복호하는 잉여데이터 복호화부; 상기 복호된 잔여 블록에 상기 예측 블록을 가산하여 생성된 복원 블록을 필터링하는 필터부 등을 포함하는 것을 특징으로 하는 영상 부호화 장치, 이를 복호화하는 영상 복호화 장치 및 방법을 제공한다.
Description
본 발명은 동영상 부호화 및 복호화에 관한 것으로서, 더욱 상세하게는 동영상 부호화 과정에서 스킵 부호화 모드를 빠르게 결정하고, 이를 이용해 동영상을 부호화하고 복호화하는 방법 및 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 발명의 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
동영상 부호화 및 복호화에 관한 종래의 표준인 H.264/AVC 표준에 따라 동영상을 부호화 및 복호화하기 위해서는 하나의 픽춰를 다수의 매크로블록으로 분할한다. 매크로블록은 16x16 화소의 고정된 크기를 가지고 있다. 각각의 매크로블록을 인터 예측 방법을 사용하는 가능한 모든 부호화 모드(인터 예측 모드) 및 인트라 예측 방법을 사용하는 가능한 모든 부호화 모드(인트라 예측 모드)에 따라 부호화를 진행한 후, 이들 중에서 소정의 기준을 만족하는 하나의 최적 모드를 결정하고, 이를 이용해 동영상 부호화 및 복호화를 수행한다. 이 경우, H.264/AVC 표준은 소정의 기준으로 율-왜곡 최적 (R-D optimization) 기준을 사용한다. 따라서 각각의 매크로블록에 소요되는 비트율과 원본 매크로블록과 복원 매크로블록 간의 왜곡 정도를 함께 고려함으로써, 하나의 최적 모드를 결정한다.
인트라 예측모드는 현재 픽춰의 매크로블록을 부호화하기 위해서 참조 픽춰를 참조하는 것이 아니라, 부호화하고자 하는 매크로블록과 공간적으로 인접한 화소값을 이용해 부호화하고자 하는 매크로블록에 대한 예측값을 예측한 후, 화소값의 차이를 부호화하는 인트라 예측 방법에 사용되는 모드이다. 인트라 예측 모드는 인트라 예측 방향에 따라 다수의 모드가 존재한다. 도 1에 도시한 바와 같이, H.264/AVC 표준은 방향성을 가진 9 개의 인트라 예측 모드(도 1a의 4×4, 8×8 인트라 블록인 경우) 및 4 개의 인트라 예측 모드(도 1b의 16×16 인트라 블록인 경우)를 사용한다.
인터 예측모드는 현재 픽춰의 매크로블록을 부호화하기 위해서 참조 픽춰에서 선택된 하나 또는 복수 개의 블록들의 위치를 나타내는 움직임 정보(예를 들어, 움직임 벡터, 참조픽춰 인덱스 등)와 화소값의 차이를 부호화하는 인터 예측 방법에 사용되는 모드이다. H.264/AVC 표준에서는 참조픽춰를 최대 5개까지 가질 수 있고 현재픽춰를 기준으로 과거픽춰 또는 미래픽춰가 될 수 있다. 인터 예측 모드는 매크로블록을 어떻게 분할하여 움직임 예측 및 보상을 수행하는가에 따라 다수의 모드가 존재한다. 도 2에 도시한 바와 같이, H.264/AVC 표준은 5개의 인터 예측 모드(SKIP, P16×16, P16×8, P8×16, P8×8)를 사용한다. P8×8 모드는 다시 4개의 하위 블록(P8×8, P8×4, P4×8, P4×4)으로 분할될 수 있다.
따라서 상기 다수의 인트라 예측 모드 및 인터 예측 모드 중에서 최적모드를 결정하는 것은 동영상 부호화 성능을 결정하는 매우 중요한 과정이다. 전술한 바와 같이, 종래의 H.264/AVC 표준은 가능한 모든 인트라 예측 모드 및 인터 예측 모드에 대해 각각의 율-왜곡 비용을 계산하고 그 비용이 가장 작은 모드를 최적모드로 선택한다. 그러나 상기의 최적모드 결정과정은 매우 높은 복잡도를 요구한다. 또한, 보다 높은 부호화 성능을 달성하기 위해서 보다 많은 인트라 예측 모드 및 인터 예측 모드를 사용할 경우, 최적모드 결정과정의 복잡도는 더욱 증가하게 된다. 그러나, 부호화 모드중 스킵모드를 사용할 경우, 부호화 및 복호화 과정을 좀 더 간략하게 할 수 있을 수 있으며, 또한, 주어진 영상 데이터를 스킵모드로 부호화 하는 것이 적절한 지 여부를 간단히 알 수 있다면, 게산량도 줄이면서 부호화 성능도 떨어지지 않게 할 수 있다. 따라서, 스킵모드를 사용하여 영상을 부호화 하고 복호화 하는 것은 매우 중요한 기술적 과제이다.
본 발명은 스킵모드를 사용하여 영상을 부호화 하고 복호화 하는 방법과 장치를 제공함으로써 부호화 복잡도를 감소시키면서, 부호화 효율도 떨어지지 않게 할 수 있다.
전술한 문제점을 해결하기 위해 본 발명은 동영상 부호화 과정에서 부호화 모드를 빠르게 결정하고, 이를 이용해 동영상을 부호화하고 부호화된 영상을 효율적으로 복호화하는 데에 주된 목적이 있다.
본 발명의 일 실시예에 따르면, 영상을 부호화/복호화하는 장치에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조 픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화기; 및 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화기를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치를 제공한다.
본 발명의 다른 실시예에 따르면, 영상을 부호화하는 장치에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조 픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 것을 특징으로 하는 영상 부호화 장치를 제공한다.
상기 소정의 크기는 코딩유닛 사이즈일 수 있다.
상기 영상 부호화 장치는, 스킵모드를 의미하는 정보와 상기 움직임 파라미터 식별 정보를 영상 복호화 장치로 전송할 수 있다.
상기 영상 부호화 장치는,
상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 나머지 예측모드에 대한 부호화비용을 비교하는 과정을 생략하고 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화할 수 있다.
본 발명의 다른 실시예에 따르면, 영상을 부호화하는 장치에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 것을 특징으로 하는 영상 부호화 장치를 제공한다.
상기 소정의 크기는 코딩유닛 사이즈일 수 있다.
상기 영상 부호화 장치는,
스킵모드를 의미하는 정보와 상기 하나의 움직임 파라미터에 대한 식별 정보를 영상 복호화 장치로 전송할 수 있다.
상기 움직임 파라미터는 움직임 벡터 및 참조픽처 인덱스를 포함할 수 있다.
또한, 상기 움직임 파라미터는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나를 식별하는 정보일 수 있으며, 움직임 벡터 및 참조픽처 인덱스를 포함할 수도 있다.
상기 움직임 파라미터는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나를 식별하는 정보일 수 있다.
상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화할 수도 있다.
본 발명의 다른 실시예에 따르면, 영상을 복호화하는 장치에 있어서, 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하고, 스킵모드가 아닌 경우 추출된 예측정보에 따라 예측블록을 생성하여 상기 현재블록을 예측 복호화하는 것을 특징으로 하는 영상 복호화 장치를 제공한다.
상기 움직임 파라미터는 움직임벡터 및 참조픽처 인덱스를 포함하며, 상기 움직임 파라미터 식별 정보는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나를 식별하는 정보일 수 있다.
본 발명의 다른 실시예에 따르면, 영상을 부호화/복호화하는 방법에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조 픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화단계; 및 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화단계를 포함하는 것을 특징으로 하는 영상 부호화/복호화 방법을 제공한다.
본 발명의 다른 실시예에 따르면, 영상을 부호화하는 방법에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
본 발명의 다른 실시예에 따르면, 영상을 부호화하는 방법에 있어서, 현재블록이 소정의 크기를 갖고 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법을 제공한다.
본 발명의 다른 실시예에 따르면, 영상을 복호화하는 방법에 있어서, 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하고, 스킵모드가 아닌 경우 추출된 예측정보에 따라 예측블록을 생성하여 상기 현재블록을 예측 복호화하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법을 제공한다.
이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 동영상 부호화 과정에서 SKIP 모드를 사용하여 동영상을 부호화하고 부호화된 영상을 효율적으로 복호화하는 효과가 있다.
도 1은 H.264/AVC 표준에서 방향성을 가진 9 개의 인트라 예측 모드(4×4, 8×8 인트라 블록인 경우) 및 4 개의 인트라 예측 모드(16×16 인트라 블록인 경우)를 도시한 도면이다.
도 2는 H.264/AVC 표준에서 5개의 인터 예측 모드(SKIP, P16×16, P16×8, P8×16, P8×8)를 사용하는 경우를 도시한 도면이다.
도 3은 본 발명의 일 실시 예에 따른 고속 모드 결정 장치가 적용되는 동영상 부호화 장치의 블록도이다.
도 4는 예측부의 구성을 예시한 도면이다.
도 5는 전술한 본 발명의 바람직한 일 실시 예에 따른, 고속 모드 결정 방법의 흐름도이다.
도 6은 전술한 본 발명의 바람직한 일 실시 예에 따른, 고속 모드 결정 방법의 흐름도이다.
도 7은 본 발명의 일 실시 예에 따른 동영상 복호화 장치를 나타낸 블록도이다.
이하 첨부한 도면을 참조하여 본 발명의 바람직한 실시 예를 설명함으로써 본 발명에 대해 상세히 설명한다.
이하에서 후술할 영상 부호화 장치(Video Encoding Apparatus), 영상 복호화 장치(Video Decoding Apparatus)는 개인용 컴퓨터(PC: Personal Computer), 노트북 컴퓨터, 개인 휴대 단말기(PDA: Personal Digital Assistant), 휴대형 멀티미디어 플레이어(PMP: Portable Multimedia Player), 플레이스테이션 포터블(PSP: PlayStation Portable), 무선 단말기(Wireless Terminal), 스마트폰(Smart Phone), TV 등과 같은 사용자 단말기이거나 응용 서버와 서비스 서버 등 서버 단말기일 수 있으며, 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신 장치, 영상을 부호화하거나 복호화하거나 부호화 또는 복호화를 위해 인터 또는 인트라 예측하기 위한 각종 프로그램과 데이터를 저장하기 위한 메모리, 프로그램을 실행하여 연산 및 제어하기 위한 마이크로프로세서 등을 구비하는 다양한 장치를 의미할 수 있다.
또한, 영상 부호화 장치에 의해 비트스트림으로 부호화된 영상은 실시간 또는 비실시간으로 인터넷, 근거리 무선 통신망, 무선랜망, 와이브로망, 이동통신망 등의 유무선 통신망 등을 통하거나 케이블, 범용 직렬 버스(USB: Universal Serial Bus) 등과 같은 다양한 통신 인터페이스를 통해 영상 복호화 장치로 전송되어 영상 복호화 장치에서 복호화되어 영상으로 복원되고 재생될 수 있다.
통상적으로 동영상은 일련의 픽처(Picture)로 구성될 수 있으며, 각 픽처들은 프레임 또는 블록(Block)과 같은 소정의 영역으로 분할될 수 있다. 영상의 영역이 블록으로 분할되는 경우에는 분할된 블록은 부호화 방법에 따라 크게 인트라 블록(Intra Block), 인터 블록(Inter Block)으로 분류될 수 있다. 인트라 블록은 인트라 예측 부호화(Intra Prediction Coding) 방식을 사용하여 부호화되는 블록을 뜻하는데, 인트라 예측 부호화란 현재 부호화를 수행하는 현재 픽처 내에서 이전에 부호화되고 복호화되어 복원된 블록들의 화소를 이용하여 현재 블록의 화소를 예측함으로써 예측 블록을 생성하고 현재 블록의 화소와의 차분값을 부호화하는 방식이다. 인터 블록은 인터 예측 부호화(Inter Prediction Coding)를 사용하여 부호화되는 블록을 뜻하는데, 인터 예측 부호화란 하나 이상의 과거 픽처 또는 미래 픽처를 참조하여 현재 픽처 내의 현재 블록을 예측함으로써 예측 블록을 생성하고 현재 블록과의 차분값을 부호화하는 방식이다. 여기서, 현재 픽처를 부호화하거나 복호화하는데 참조되는 프레임을 참조 프레임(Reference Frame)이라고 한다.
도 3은 본 발명의 일 실시 예에 따른 고속 모드 결정 장치가 적용되는 동영상 부호화 장치의 블록도이다. 도 3을 참조하면, 본 발명의 일 실시예에 따른 고속 모드 결정 장치가 적용되는 동영상 부호화 장치는 예측부(310), 잉여데이터 부호화부(320), 잉여데이터 복호화부(330), 엔트로피 부호화부(340), 부호화 데이터 생성부(350), 인루프 필터부(360), 감산부(370) 및 가산부(380)를 포함한다.
부호화하고자 하는 동영상은 소정의 크기를 가진 블록 단위로 입력될 수 있는데, 종래의 H.264/AVC 표준의 경우에는 16×16 형태의 매크로블록이 될 수 있다. 본 발명의 일 실시 예에서는, 편의를 위해 H.264/AVC 표준과 동일하게 블록을 2N×2N 형태로 정의하였으나, 보다 일반적으로 블록의 형태는 2M×2N 일 수 있으며, 특히 M과 N은 각각 8 또는 8보다 크거나 작을 수 있으며, M과 N은 서로 다른 정수 혹은 동일한 정수일 수 있다. 또한 2N×2N 크기의 입력 블록은 다시 N×N 크기의 하위 입력 블록으로 분할될 수 있다.
예측부(310)는 상기 소정의 크기를 가진 현재 블록의 예측 블록을 생성한다. 즉, 예측부(310)는 인트라 예측(Intra Prediction) 또는 인터 예측(Inter Prediction) 등을 이용하여 현재 블록을 예측함으로써, 예측 화소값(Predicted Pixel Value)을 각 화소의 화소값으로 가지는 예측 블록을 생성한다. 상기 인트라 또는 인터 예측 등을 이용하여 생성된 예측 블록은 현재 블록과 감산하여 잉여데이터(Residual Data) 블록을 생성한다. 즉, 현재 블록의 각 화소의 원 화소값 (Original Pixel Value)과 예측 블록의 각 화소의 예측 화소값의 차이값을 계산하여 생성된 잉여데이터(잔차 데이터)를 가지는 잉여데이터 블록(잔차 블록)을 생성하여 잉여데이터 부호화부(320)에 제공한다.
이를 위해 예측부(310)는 도 4와 같이 인트라 예측부(410), 인터 예측부(420), 최적모드 결정부(430)로 구성될 수 있다. 인트라 예측부(410)는 현재 블록이 가질 수 있는 모든 인트라 예측모드로 예측블록을 생성하고, 인터 예측부(420)는 현재 블록이 가질 수 있는 모든 인터 예측모드로 예측블록을 생성한다. 최적모드 결정부(430)는 인트라 예측부(410) 및 인터 예측부(420)를 통해 생성될 수 있는 모든 인트라 예측모드 및 인터 예측모드에 대해, 각각의 율-왜곡 비용을 계산하고 그 비용이 가장 작은 모드를 현재 블록의 최적모드로 결정한다.
인트라 예측부(410)는 현재 블록과 공간적으로 주변에 위치하는 사용 가능한 주변 블록의 화소값을 이용해 현재 블록의 인트라 예측 블록을 생성한다. 본 발명의 일 실시 예에서는, 도 1에 도시한 바와 같이, H.264/AVC 표준과 동일한 방법으로 방향성을 가진 9 개의 인트라 예측 모드(N/2×N/2, N×N 인트라 블록인 경우) 및 4 개의 인트라 예측 모드(2N×2N 인트라 블록인 경우)를 예시하였으나, 보다 다양한 방법으로 정의될 수 있다. 예를 들어, 2M×2N 형태의 인트라 예측 블록에서 방향성을 가진 K 개의 인트라 예측 모드 및 방향성이 없는 L 개의 인트라 예측 모드를 조합하여 사용할 수 있다. 특히, M과 N은 각각 8 또는 8보다 크거나 작을 수 있으며, M과 N은 서로 다른 정수 혹은 동일한 정수일 수 있다. 또한, 인트라 블록의 크기에 따라 서로 다른 K 또는 L 개의 인트라 예측 모드를 사용할 수 있다.
인터 예측부(420)는 현재 픽춰와 시간적으로 주변에 위치하는 (과거 또는 현재 또는 미래) 사용 가능한 모든 참조 픽춰에 대해 각각 현재 블록과 인터 예측 블록의 에러값을 연산하고, 최소의 에러값을 갖는 참조 픽춰의 인터 예측 블록을 통해 현재 블록의 인터 예측 블록을 생성한다. 이 경우, 현재 블록과 최소의 에러값을 갖는 인터 예측 블록의 위치를 기준으로 움직임 벡터를 추정한다. 특히, 움직임 추정 과정에 율-왜곡 최적화 기준이 적용된 경우, 현재 블록과 인터 예측 블록의 에러값 뿐만 아니라, 움직임 정보(움직임 벡터, 참조 픽춰 인덱스 등)를 부호화하는데 소요되는 비트량을 함께 고려하여 인터 예측 블록을 결정할 수 있다.
특히, 종래의 H.264/AVC 표준은 움직임 정보에 소요되는 비트량을 최소화하기 위해서 주변블록의 움직임벡터 중에서 중간값을 이용해 하나의 예측 움직임 벡터(PMV: Predictive Motion Vector)를 결정하고, 이를 현재 움직임 벡터의 예측값으로 사용함으로써 차분 움직임 벡터만을 전송 또는 저장한다. 즉, 움직임 정보(차분 움직임 벡터, 참조 픽춰 인덱스 등)의 양을 감소시킴으로써, 효율적인 부호화 효율을 달성한다. 본 발명의 일 실시 예에서는, 보다 일반적인 예시를 위해 다수의 예측 움직임 벡터 후보 중에서 최적인 하나의 예측 움직임 벡터를 결정하는 방법을 예시한다. 이 경우, 어떤 예측 움직임 벡터 후보가 사용되었는지를 표현하기 위해 예측 움직임 벡터 인덱스가 함께 전송 또는 저장될 수 있다. 즉, 움직임 추정 과정에서 현재 블록과 인터 예측 블록의 에러값과 함께, 움직임 정보(예측 움직임 벡터 인덱스, 차분 움직임 벡터, 참조 픽춰 인덱스 등)를 부호화하는데 소요되는 비트량이 고려된다. 본 발명의 일 실시 예에서는, 도 2에 도시한 바와 같이, H.264/AVC 표준과 동일한 방법으로 5개의 인터 예측 모드(SKIP, P2N×2N, P2N×N, PN×2N, PN×N)를 예시하였으나, 보다 다양한 방법으로 정의될 수 있다. 예를 들어, 2M×N/2, M/2×2N 등의 다양한 인터 예측 모드를 추가적으로 사용할 수 있다.
최적모드 결정부(430)는 인트라 예측부(410) 및 인터 예측부(420)를 통해 생성된 현재 블록이 가질 수 있는 모든 인트라 예측 모드 및 인터 예측 모드에 대해, 각각의 율-왜곡 비용을 계산하고, 그 비용이 가장 작은 모드를 현재 블록의 최적모드로 결정한다. 본 발명의 일 실시 예에서는 소정의 최적모드 결정기준을 일반적인 율-왜곡 최적화 방법으로 예시하였으나, 보다 일반적으로는 다양한 결정기준을 적용할 수 있다. 예를 들어, 실시예에 따라서는 왜곡을 결정기준으로 적용할 수도 있다. 또한, 일부 실시예에 따라서는 현재 블록이 가질 수 있는 모든 인트라 예측 모드 혹은/및 인터 예측 모드에 대해 각각의 율-왜곡 비용을 계산하는 과정을 생략하고 현재 블록의 최적모드를 결정하도록 할 수도 있다.
그러나 상기와 같이, 현재 블록이 가질 수 있는 모든 인트라 예측 모드 및 인터 예측 모드에 대해 각각의 율-왜곡 비용을 계산하는 과정은 매우 많은 복잡도를 요구하므로, 본 발명의 일 실시 예에서는, (a) 복수개의 인트라 예측 모드 및 인터 예측 모드를 가질 수 있는 소정의 크기를 가진 블록의 최적모드를 결정하고자 하는 경우, 해당 블록이 소정의 제1모드에 대응되는 조건을 만족하는가를 판단하는 단계; 및 (b) 상기 소정의 제1모드에 대응되는 조건을 만족하는 경우, 상기 제1모드를 상기 블록의 최적모드로 결정하고, 이를 이용해 상기 블록을 부호화하는 단계를 포함하는 최적모드 결정부(430)를 예시한다. 즉, 본 발명의 일 실시 예에 따른 최적모드 결정부(430)는 현재 블록이 가질 수 있는 모든 인트라 예측 모드 및 인터 예측 모드에 대해 각각의 율-왜곡 비용을 계산하는 대신, 소정의 제1모드에 대응되는 조건을 만족하는지 여부를 우선 판단한다. 만약 현재 블록이 제1모드에 대응되는 조건을 만족하는 경우, 최적모드 결정부(430)는 모든 모드에 대한 율-왜곡 비용의 계산 과정을 생략하고, 상기 제1모드를 상기 블록의 최적모드로 결정한다. 만약 현재 블록이 제1모드에 대응되는 조건을 만족하지 않는 경우, 최적모드 결정부(430)는 모든 모드에 대한 율-왜곡 비용의 계산 과정을 수행하고, 가장 작은 율-왜곡 비용을 갖는 모드를 상기 블록의 최적모드로 결정한다.
본 발명의 바람직한 일 실시 예에 따르면, 상기 소정의 조건은, (a) 움직임 예측 및 보상을 위한 블록 크기가 코딩유닛 사이즈(예컨대, 2N×2N, 즉, P2N×2N 모드인 경우)이고, (b) 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 다수의 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고, (c) 상기 소정의 입력 블록과 예측 블록의 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 것을 특징으로 하는 것이 바람직하다.
상기 제1모드는, 상기 입력 블록의 부호화 모드 정보만을 전송 또는 저장하는 스킵(SKIP) 모드인 것이 바람직하다. 일반적으로 종래의 스킵 모드는 입력 블록의 부호화 모드 정보만을 전송 또는 저장하지만, 본 발명의 일 실시 예와 같이, 시간적 및 공간적으로 인접하는 다수의 주변블록의 움직임 파라미터(움직임 벡터 및 참조픽처 인덱스) 중에서 하나를 예측 움직임 파라미터로 선택하는 경우에는 예측 움직임 파라미터가 선택된 후보블록을 식별할 수 있는 후보블록 인덱스 정보를 추가로 전송 또는 저장한다.
도 5는 전술한 본 발명의 바람직한 일 실시 예에 따른, 고속 모드 결정 방법의 흐름도이다.
도 5와 같이, 2N×2N 형태의 현재 블록을 입력받으면, 입력된 현재 블록을 상기 소정의 조건을 통해 스킵 모드로 조기에 결정할 수 있는지 여부를 우선적으로 확인한다. 전술한 바와 같이, 스킵 모드는 입력된 현재 블록의 부호화 모드 정보만(필요에 따라서는 차분움직임 벡터를 0으로 만드는 움직임 파라미터에 대한 식별정보로서 어느 하나의 후보블록으로서 주변블록의 인덱스도 포함)을 영상복호화 장치로 전송 또는 저장하는 모드이다. 즉, 동영상의 배경부분 등에서는 현재 픽춰의 주어진 블록이 참조 픽춰의 해당 참조 블록과 화소값이 동일할 확률이 높고, 이 경우에는 잉여데이터나 움직임 벡터 정보와 같이 별도의 부호화된 정보의 전송 또는 저장이 불필요하므로 부호화 모드 정보(및/또는 주변블록의 인덱스)만을 전송 또는 저장하면 되기 때문이다.
본 실시 예에서는, 조기에 스킵 모드로 결정할 수 있는지 여부를 확인하기 위해, 현재 블록의 P2N×2N 모드에 대해 움직임 예측을 수행하고, 움직임 벡터, 예측 움직임 벡터 인덱스, 참조 픽춰 인덱스 등을 결정한다(S501). 상기 움직임 추정 과정에서는 수학식 1과 같이, 율-왜곡 최적화 과정을 적용하는 것이 바람직하다.
수학식 1에서 J와 D는 각각 율-왜곡 최적화 함수와 왜곡 함수를 의미한다. Rdmv는 소정의 움직임 예측 범위 SR(Search Range)에 포함된 후보 차분 움직임 벡터 dmvi를 부호화하는데 소요되는 비트량 측정 함수이고, Rpmv는 소정의 후보 예측 움직임 벡터 집합 CS(Candidate Set)에 포함된 후보 예측 움직임 벡터 pmvj를 부호화하는데 소요되는 비트량 측정 함수이다. 즉, 수학식 1과 같이, 현재 블록의 P2N×2N 모드에 대해, 율-왜곡 최적화 함수 J를 최소로 만드는 차분 움직임 벡터 dmv와 예측 움직임 벡터 pmv를 선택하고 율-왜곡 비용을 계산한다. 이후, 소정의 조건을 통해, 현재 블록을 조기에 스킵 모드로 결정할 수 있는지 여부를 확인한다(S502). 만약 현재 블록이 스킵 모드에 대응되는 조건을 만족하는 경우, 다른 모든 모드에 대한 율-왜곡 비용의 계산 과정을 생략하고, 상기 스킵 모드를 현재 블록의 최적 모드로 결정한다(S503). 만약 현재 블록이 스킵 모드에 대응되는 조건을 만족하지 않는 경우, 모든 모드의 부호화에 대한 율-왜곡 비용의 계산 과정을 수행하고(S504~S507), 가장 작은 율-왜곡 비용을 갖는 모드를 현재 블록의 최적 모드로 결정한다(S508).
본 발명의 또 다른 바람직한 일 실시 예에 따르면, 상기 소정의 조건은, (a) 움직임 예측 및 보상을 위한 블록 크기가 2N×2N이고, (b) 상기 소정의 입력 블록과 예측 블록의 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 것을 특징으로 하는 것이 바람직하다.
상기 제1모드는, 상기 입력 블록의 부호화 모드 정보만을 전송 또는 저장하는 스킵(SKIP) 모드인 것이 바람직하다. 일반적으로 스킵 모드는 입력 블록의 부호화 모드 정보만을 전송 또는 저장하지만, 본 발명의 일 실시 예와 같이, 시간적 및 공간적 주변블록의 움직임 파라미터로부터 최적의 예측움직임 파라미터를 선택하는 방법을 사용하기 때문에 다수의 예측 움직임 벡터 후보를 식별하는 예측 움직임 벡터 인덱스 정보를 추가로 영상 복호화 장치로 전송 또는 저장한다.
도 6은 전술한 본 발명의 바람직한 다른 실시예에 따른, 고속 모드 결정 방법을 나타낸 흐름도이다.
도 6과 같이, 2N×2N 형태의 현재 블록을 입력받으면, 조기에 스킵 모드로 결정할 수 있는지 여부를 확인하기 위해, P2N×2N 모드에 대한 움직임 예측 과정을 모두 수행하는 대신, 다수의 후보 예측 움직임 벡터 각각에 대해서만 율-왜곡 최적화 과정을 적용한다. 여기서 후보 예측 움직임 벡터란 시간적 및 공간적으로 인접한 주변블록의 움직임벡터를 의미하며, 공간적 인접블록이란 현재블록의 주변블록을 의미하고 시간적 인접블록이란 과거픽처 내의 현재블록의 위치와 유사한 위치의 블록을 의미한다. 현재블록의 위치와 유사한 위치의 블록이란 동일위치의 블록일 수도 있고, 동일위치와 인접하는 다른 블록일 수도 있다. 또한, 후보 예측 움직임 벡터는 이에 한정되지 않고 실시예에 따라서 다양한 블록을 사용할 수 있다.
본 실시예에서는 후보 예측 움직임 파라미터를 그대로 움직임 추정에 사용하므로 차분 움직임 벡터는 (0,0)로 가정할 수 있다. 따라서, 후보블록의 예측 움직임 파라미터 각각을 이용하여 움직임 추정을 수행하고, 율-왜곡 최적화 과정을 적용하여 이 중에서 최적인 예측 움직임 파라미터만을 결정해서 율-왜곡 비용을 계산한다(S601). 이후, 상기 소정의 조건을 통해, 현재 블록을 조기에 스킵 모드로 결정할 수 있는지 여부를 확인한다(S602). 본 실시 예에서는 차분 움직임 벡터를 조기에 (0,0)으로 가정하였기 때문에 상기 소정의 2가지 조건만을 확인하면 된다. 즉, 2N×2N으로 부호화를 하는지 여부와, 선택된 후보 블록들 중에서 선택된 움직임 파라미터를 이용하여 생성된 예측블록을 생성하여 현재블록과 예측블록과의 차이인 잔차블록(잉여블록)을 변환 및 양자화한 결과가 모두 0인 경우를 의미한다.
만약 현재 블록이 스킵 모드에 대응되는 조건을 만족하는 경우, 다른 모든 모드에 대한 율-왜곡 비용의 계산 과정을 생략하고, 상기 스킵 모드를 현재 블록의 최적 모드로 결정한다(S603). 만약 현재 블록이 스킵 모드에 대응되는 조건을 만족하지 않는 경우, 모든 모드의 부호화에 대한 율-왜곡 비용의 계산 과정을 수행하고(S604~S608), 가장 작은 율-왜곡 비용을 갖는 모드를 현재 블록의 최적 모드로 결정한다(S609).
감산부(370)는 현재블록에서 예측블록을 감산하여 잔차블록(잉여블록)을 생성한다.
잉여데이터 부호화부(320)는 잉여데이터 블록을 변환 및 양자화 연산한 후, 변환 양자화된 잉여데이터 블록을 생성한다. 이 경우, 변환 방식은 하다마드 변환(Hadamard Transform), 이산 코사인 변환 (Discrete Cosine Transform) 등과 같은 공간 영역의 신호를 주파수 영역의 신호로 변환하는 다양한 방법이 이용될 수 있으며, 양자화 방식은 데드존(Dead Zone)을 포함하는 균일 양자화(Uniform Quantization), 양자화 매트릭스(Quantization Matrix) 등과 같은 다양한 양자화 기법이 이용될 수 있다. 이 경우, 변환 및 양자화의 대상이 되는 변환 블록의 크기는 입력된 현재 블록의 크기를 초과하지 않는 범위에서 다양한 크기 및 모양으로 적용될 수 있다. 예를 들어, 현재 블록의 크기는 2N×2N 이고, 예측 블록의 크기가 N×N 이라면, 2N×2N 단위를 초과하지 않는 2N×2N, 2N×N, N×2N, N×N, N×N/2, N/2×N, N/2×N/2 단위 등의 변환 블록이 사용될 수 있다. 또한, 상기 변환 블록의 크기는 율-왜곡(Rate-Distortion) 최적화 기준으로 선택될 수 있다. 즉, 변환 및 양자화의 대상이 되는 변환 블록의 크기는 입력된 현재 블록의 크기를 초과하지 않는 범위 내에서 소정의 기준에 의해 다양한 크기 및 모양이 선택될 수 있다.
잉여데이터 복호화부(330)는 상기 잉여데이터 부호화부(320)에 의해 변환 및 양자화 된 잔여 블록을 역 양자화 및 역 변환하여 잔여 블록을 복원한다. 역 양자화와 역 변환은 상기 잉여데이터 부호화기(320)가 수행한 변환 과정과 양자화 과정을 역으로 수행함으로써 다양한 방법으로 구성될 수 있다. 예를 들어, 잉여데이터 부호화부(320)와 잉여데이터 복호화부(330)가 사전에 공유하는 동일한 과정의 변환 및 역 변환 또는 양자화 및 역 양자화를 사용하는 대신, 잉여데이터 복호화부(330)는 상기 잉여데이터 부호화부(320)의 변환 및 양자화 과정에 의해 발생되어 전달되는 변환 및 양자화 과정에 관한 정보(예를 들어, 변환 크기, 변환 모양, 양자화 타입 등의 정보)를 이용하여 상기 잉여데이터 부호화부(320)의 변환 및 양자화 과정을 역으로 수행함으로써, 역 양자화 및 역 변환을 수행할 수 있다. 상기 잉여데이터 복호화부(330)를 통해 출력된 잔여 블록을 예측부(310)를 통해 복원된 예측값과 결합하여 복원된 영상을 생성한다.
엔트로피 부호화부(340)는 잉여데이터 부호화부(320)로부터 출력되는 잉여데이터 블록을 엔트로피 부호화하여 출력한다. 본 발명의 일 실시 예에는 도시하지 않았으나, 필요에 따라 엔트로피 부호화부(340)는 잉여데이터 블록뿐만 아니라, 부호화된 비트열을 복호화하는데 필요한 다양한 정보들을 부호화 할 수 있다. 이 경우, 부호화된 비트열을 복호화하는데 필요한 다양한 정보들이란 블록 타입에 대한 정보, 예측 모드가 인트라 예측 모드인 경우에는 인트라 예측 모드에 대한 정보, 예측 모드가 인터 예측 모드인 경우에는 움직임 벡터에 대한 정보, 변환 및 양자화 타입에 대한 정보 등이 다양한 정보들이 될 수도 있다.
또한, 엔트로피 부호화부(340)에 사용되는 엔트로피 부호화 방법은 문맥 적응형 가변장 길이 부호화(Context Adaptive Variable Length Coding), 문맥 적응형 이진 산술 부호화 (Context Adaptive Binary Arithmetic Coding) 등의 다양한 방법이 될 수 있다.
부호화 데이터 생성부(350)는 엔트로피 부호화된 잉여데이터, 매크로블록 모드 및 부호화된 예측 정보(예를 들어, 인트라 부호화의 경우에는 인트라 예측 모드, 인터 부호화의 경우에는 움직임 벡터, 후보 움직임 벡터 인덱스, 참조 픽춰 인덱스 등의 정보)를 정렬하여 비트스트림을 출력한다.
필터부(360)는 예측 및 양자화에 의해 발생하는 왜곡 효과를 감소시키기 위해 복원된 현재 블록을 필터링한다. 본 발명의 일 실시 예에 따르면, 필터부(360)는 복원된 현재 블록과 함께 전송되는 블록 단위의 예측에 관한 정보(예를 들어, 인트라 부호화의 경우에는 인트라 예측 모드, 인터 부호화의 경우에는 참조픽춰 인덱스 및 움직임 벡터 등의 정보) 또는 변환 및 양자화에 관한 정보(예를 들어, 변환 블록의 크기 및 형태, 양자화 파라미터 등의 정보) 등을 이용하여 적응적인 필터링을 수행할 수 있다. 이 경우, 상기 예측 또는 양자화 등에 관한 정보는 부호화 장치의 필터부(360)에 직접 전달되거나, 상기 부호화 데이터 생성부(350)에 의해 비트스트림으로 생성되어 복호화 장치로 전달될 수 있다. 또한, 필터부(360)는 입력된 현재 블록과 복원된 현재 블록과의 차이를 보상함으로써, 예측 및 양자화에 의해 발생하는 왜곡 효과를 최소화하고, 이에 해당하는 차이를 상기 부호화 데이터 생성부(350)에 의해 비트스트림으로 생성되어 복호화 장치로 전달될 수 있다.
가산부(380)는 잉여데이터 복호후(330)에서 복원된 잔차 블록과 예측부(310)에서 생성된 예측블록을 가산하여 현재블록을 복원한다.
도 7은 본 발명의 일 실시예에 따른 영상 복호화 장치(700)를 도시한 블록도이다.
본 발명의 일 실시예에 따른 영상 복호화 장치(700)는 비트스트림 복호부(710), 잉여데이터 복호화부(720), 예측부(730), 가산부(740) 및 필터(750)를 포함할 수 있다.
비트스트림 복호부(710)는 비트스트림을 복호화하여 양자화된 주파수변환블록뿐만 아니라 복호화에 필요한 정보들을 복호화하거나 추출할 수 있다. 복호화에 필요한 정보들은 부호화 데이터(즉, 비트스트림) 내의 부호화된 비트열을 복호화하는 데 필요한 정보들을 말하며, 예를 들어 코딩단위(CU), 예측단위(PU), 변환단위(TU)의 크기에 대한 정보, 부호화된 코딩 형태(cbp), 부호화된 코딩 플래그(cbf)에 대한 정보, 움직임 벡터에 대한 정보, 변환 및 양자화 타입에 대한 정보 등이 될 수 있으며, 이외의 다양한 정보들이 될 수 있다.
즉, 비트스트림 복호부(710)는 영상 부호화 장치(300)에 의해 부호화된 데이터인 비트스트림을 복호화하여 영상의 현재 블록에 대한 화소 정보를 포함하고 있는 양자화된 주파수변환 블록을 추출하고, 추출된 예측에 필요한 정보를 예측부(730)로 전달한다.
예측부(730)는 비트스트림 복호부(710)로부터 전달된 예측에 필요한 정보를 이용하여 영상 부호화 장치(300)의 예측부(310)와 동일한 방식으로 현재 블록을 예측할 수 있다.
잉여데이터 복호화부(720)는 비트스트림 복호부(710)에 의해 비트스트림으로부터 추출된 양자화된 주파수변환 블록을 역 양자화하고 역변환하여 잔차블록을 복원한다.
가산부(740)는 잉여데이터 복호화부(720)에 의해 복원된 잔차신호와 예측부(730)에 의해 생성된 예측 화소값을 더하여 현재 블록의 원 화소값을 복원한다.
필터(750)는 복원된 현재블록에 대하여 영상 부호화 장치(300)가 복원된 현재블록에 대하여 수행하는 동작과 동일한 동작을 수행한다.
한편, 비트스트림 복호부(710)는 비트스트림으로부터 예측모드에 대한 정보를 추출하여 추출된 예측정보가 스킵모드인지 아닌지 여부를 확인한다. 만일 스킵모드인 경우에는, 비트스트림으로부터 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원한다.
만일 스킵모드가 아닌 경우에, 예측부(730)에 의해 추출된 예측정보에 따라 예측블록을 생성함으로써 현재블록을 예측 복호화하게 된다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 장치는 도 3의 영상 부호화 장치(300)의 비트스트림 출력단을 도 7의 영상 복호화 장치(700)의 비트스트림 입력단에 연결하여 구성될 수 있다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 장치는, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화기; 및 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화기를 포함한다.
여기서 영상 부호화기는 본 발명의 일 실시예에 따른 영상 부호화 장치(300)로 구현 가능하며, 영상 복호화기는 본 발명의 일 실시예에 따른 영상 복호화 장치(700)로 구현 가능하다.
본 발명의 일 실시예에 따른 영상 부호화 방법은, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 단계를 포함한다.
여기서, 본 발명의 일 실시예에 따른 영상 부호화 방법은, 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 나머지 예측모드에 대한 부호화비용을 비교하는 과정을 생략하고 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화할 수 있다.
본 발명의 다른 실시예에 따른 영상 부호화 방법은, 현재블록이 소정의 크기를 갖고 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 단계를 포함한다.
여기서, 본 발명의 다른 실시예에 따른 영상 부호화 방법은, 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화할 수 있다.
여기서 설명하는 영상 부호화 방법은 영상 부호화 장치(300)의 동작에 대응되므로 상세한 설명은 생략한다.
본 발명의 일 실시예에 따른 영상 복호화 방법은, 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하고, 스킵모드가 아닌 경우 추출된 예측정보에 따라 예측블록을 생성하여 상기 현재블록을 예측 복호화하는 단계를 포함한다.
여기서 설명하는 영상 복호화 방법은 영상 복호화 장치(700)의 동작에 대응되므로 상세한 설명은 생략한다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 방법은, 본 발명의 일 실시예에 따른 영상 부호화 방법과 본 발명의 일 실시예에 따른 영상 복호화 방법을 결합하여 구현함으로써 실현할 수 있다.
본 발명의 일 실시예에 따른 영상 부호화/복호화 방법은, 현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화단계; 및 비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화단계를 포함한다.
본 발명의 실시예를 구성하는 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이 본 발명의 실시예에 의하면, 동영상 부호화 과정에서 스킵 부호화 모드를 사용하고 동영상을 부호화하고 부호화된 영상을 효율적으로 복호화하는 효과를 발생하는 매우 유용한 발명이다.
CROSS-REFERENCE TO RELATED APPLICATION
본 특허출원은 2011년 11월 09일 한국에 출원한 특허출원번호 제 10-2011-0116686 호에 대해 미국 특허법 119(a)조(35 U.S.C § 119(a))에 따라 우선권을 주장하면, 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다. 아울러, 본 특허출원은 미국 이외에 국가에 대해서도 위와 동일한 이유로 우선권을 주장하면 그 모든 내용은 참고문헌으로 본 특허출원에 병합된다.
Claims (17)
- 영상을 부호화/복호화하는 장치에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화기; 및비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화기를 포함하는 것을 특징으로 하는 영상 부호화/복호화 장치.
- 영상을 부호화하는 장치에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 것을 특징으로 하는 영상 부호화 장치.
- 제 2항에 있어서,상기 소정의 크기는 코딩유닛 사이즈인 것을 특징으로 하는 영상 부호화 장치.
- 제 2항에 있어서,상기 영상 부호화 장치는,스킵모드를 의미하는 정보와 상기 움직임 파라미터 식별 정보를 영상 복호화 장치로 전송하는 것을 특징으로 하는 영상 부호화 장치.
- 제 2항에 있어서,상기 영상 부호화 장치는,상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 나머지 예측모드에 대한 부호화비용을 비교하는 과정을 생략하고 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 것을 특징으로 하는 영상 부호화 장치.
- 영상을 부호화하는 장치에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 것을 특징으로 하는 영상 부호화 장치.
- 제 6항에 있어서,상기 소정의 크기는 코딩유닛 사이즈인 것을 특징으로 하는 영상 부호화 장치.
- 제 6항에 있어서,상기 영상 부호화 장치는,스킵모드를 의미하는 정보와 상기 하나의 움직임 파라미터에 대한 식별 정보를 영상 복호화 장치로 전송하는 것을 특징으로 하는 영상 부호화 장치.
- 제 6항에 있어서,상기 움직임 파라미터는 움직임 벡터 및 참조픽처 인덱스를 포함하는 것을 특징으로 하는 영상 부호화 장치.
- 제 6항에 있어서,상기 움직임 파라미터는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나를 식별하는 정보인 것을 특징으로 하는 영상 부호화 장치.
- 제 6항에 있어서,상기 영상 부호화 장치는,상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 것을 특징으로 하는 영상 부호화 장치.
- 영상을 복호화하는 장치에 있어서,비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하고, 스킵모드가 아닌 경우 추출된 예측정보에 따라 예측블록을 생성하여 상기 현재블록을 예측 복호화하는 것을 특징으로 하는 영상 복호화 장치.
- 제 12항에 있어서,상기 움직임 파라미터는 움직임벡터 및 참조픽처 인덱스를 포함하며,상기 움직임 파라미터 식별 정보는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나를 식별하는 정보인 것을 특징으로 하는 영상 복호화 장치.
- 영상을 부호화/복호화하는 방법에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 또는 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우에 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 영상 부호화단계; 및비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하는 영상 복호화단계를 포함하는 것을 특징으로 하는 영상 부호화/복호화 방법.
- 영상을 부호화하는 방법에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 움직임 추정의 결과, 현재 블록의 움직임 벡터 및 참조픽처 인덱스가 후보블록 중 어느 하나의 블록의 움직임 벡터 및 참조픽처 인덱스와 각각 일치하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환 및 양자화한 결과가 모두 0인 경우 상기 현재블록의 예측모드를 스킵모드로 설정하여 예측부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 영상을 부호화하는 방법에 있어서,현재블록이 소정의 크기를 갖고 현재블록의 주변블록으로 구성된 후보블록 중에서 하나의 블록에 대한 움직임파라미터를 이용하여 움직임 보상을 하고 상기 현재 블록과 예측 블록과의 차이값인 잉여데이터 블록을 변환하여 양자화한 결과가 모두 0인 경우 상기 하나의 움직임 파라미터를 이용하여 스킵모드로 현재블록을 예측부호화하는 단계를 포함하는 것을 특징으로 하는 영상 부호화 방법.
- 영상을 복호화하는 방법에 있어서,비트스트림으로부터 예측모드에 대한 정보를 추출하여 상기 추출된 예측정보가 스킵모드인 경우 움직임 파라미터 식별 정보를 추출하여 생성한 움직임 파라미터가 지시하는 블록을 현재블록으로 복원하고, 스킵모드가 아닌 경우 추출된 예측정보에 따라 예측블록을 생성하여 상기 현재블록을 예측 복호화하는 단계를 포함하는 것을 특징으로 하는 영상 복호화 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201280066088.6A CN104041048B (zh) | 2011-11-09 | 2012-11-09 | 利用跳过模式进行视频编码和解码的方法和设备 |
US14/273,957 US10939119B2 (en) | 2011-11-09 | 2014-05-09 | Method and apparatus for encoding and decoding video using skip mode |
US17/161,761 US11425392B2 (en) | 2011-11-09 | 2021-01-29 | Method and apparatus for encoding and decoding video using skip mode |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2011-0116686 | 2011-11-09 | ||
KR1020110116686A KR101830352B1 (ko) | 2011-11-09 | 2011-11-09 | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US14/273,957 Continuation US10939119B2 (en) | 2011-11-09 | 2014-05-09 | Method and apparatus for encoding and decoding video using skip mode |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013070006A1 true WO2013070006A1 (ko) | 2013-05-16 |
Family
ID=48290301
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2012/009435 WO2013070006A1 (ko) | 2011-11-09 | 2012-11-09 | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10939119B2 (ko) |
KR (1) | KR101830352B1 (ko) |
CN (1) | CN104041048B (ko) |
WO (1) | WO2013070006A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104581158A (zh) * | 2013-10-16 | 2015-04-29 | 中兴通讯股份有限公司 | 量化表、图像压缩处理方法、装置、终端及图像搜索系统 |
WO2015188297A1 (zh) * | 2014-06-08 | 2015-12-17 | 北京大学深圳研究生院 | 加权跳过模式的视频图像块压缩算术编解码方法及装置 |
CN110139097A (zh) * | 2019-04-19 | 2019-08-16 | 中南大学 | 视频编码中自适应模式顺序调整的方法 |
CN113301337A (zh) * | 2020-02-24 | 2021-08-24 | 北京三星通信技术研究有限公司 | 编解码方法和装置 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101830352B1 (ko) * | 2011-11-09 | 2018-02-21 | 에스케이 텔레콤주식회사 | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 |
JP6422011B2 (ja) * | 2012-05-11 | 2018-11-14 | サン パテント トラスト | 動画像符号化方法、動画像復号化方法、動画像符号化装置および動画像復号化装置 |
US10334245B2 (en) * | 2013-05-31 | 2019-06-25 | Intel Corporation | Adjustment of intra-frame encoding distortion metrics for video encoding |
US20150055697A1 (en) * | 2013-08-20 | 2015-02-26 | Media Tek Inc. | Method and Apparatus of Transform Process for Video Coding |
KR20220162877A (ko) * | 2014-10-31 | 2022-12-08 | 삼성전자주식회사 | 고정밀 스킵 부호화를 이용한 비디오 부호화 장치 및 비디오 복호화 장치 및 그 방법 |
FR3029055B1 (fr) * | 2014-11-24 | 2017-01-13 | Ateme | Procede d'encodage d'image et equipement pour la mise en oeuvre du procede |
KR102365685B1 (ko) | 2015-01-05 | 2022-02-21 | 삼성전자주식회사 | 인코더의 작동 방법과 상기 인코더를 포함하는 장치들 |
CN115460408A (zh) * | 2016-01-27 | 2022-12-09 | 韩国电子通信研究院 | 通过使用预测对视频进行编码和解码的方法和装置 |
CN113810701B (zh) * | 2016-04-29 | 2024-04-19 | 世宗大学校产学协力团 | 用于对图像信号进行编码和解码的方法和装置 |
CN114422796A (zh) * | 2016-06-24 | 2022-04-29 | 韩国电子通信研究院 | 用于基于变换的图像编码/解码的方法和设备 |
CN109479138B (zh) * | 2016-07-13 | 2023-11-03 | 韩国电子通信研究院 | 图像编码/解码方法和装置 |
CN117201808A (zh) * | 2016-08-01 | 2023-12-08 | 韩国电子通信研究院 | 图像编码/解码方法和装置以及存储比特流的记录介质 |
EP3627838B1 (en) * | 2017-06-26 | 2024-10-09 | Panasonic Intellectual Property Corporation of America | Encoding device, decoding device, encoding method and decoding method |
WO2019076138A1 (en) * | 2017-10-16 | 2019-04-25 | Huawei Technologies Co., Ltd. | METHOD AND APPARATUS FOR ENCODING |
US10798402B2 (en) * | 2017-10-24 | 2020-10-06 | Google Llc | Same frame motion estimation and compensation |
KR102483331B1 (ko) * | 2017-11-09 | 2022-12-30 | 삼성전자주식회사 | 움직임 정보의 부호화 장치 및 방법, 및 복호화 장치 및 방법 |
EP3982631A1 (en) * | 2017-11-13 | 2022-04-13 | MediaTek Singapore Pte. Ltd. | Method and apparatus for intra prediction fusion in image and video coding |
US10694205B2 (en) * | 2017-12-18 | 2020-06-23 | Google Llc | Entropy coding of motion vectors using categories of transform blocks |
CN109089116A (zh) * | 2018-09-26 | 2018-12-25 | 深圳市网心科技有限公司 | 一种Skip类型宏块的判定方法、装置、设备及介质 |
GB2579824B (en) * | 2018-12-14 | 2022-05-18 | British Broadcasting Corp | Video encoding and video decoding |
BR112021012366B1 (pt) | 2019-01-15 | 2022-03-22 | Lg Electronics Inc | Método de decodificação de uma imagem realizado por um aparelho de decodificação, método de codificação de uma imagem realizado por um aparelho de codificação e mídia de armazenamento digital legível por computador não transitória |
CN113906753B (zh) | 2019-04-24 | 2023-12-01 | 字节跳动有限公司 | 编解码视频的量化残差差分脉冲编解码调制表示的约束 |
WO2020223612A1 (en) * | 2019-05-02 | 2020-11-05 | Bytedance Inc. | Signaling in transform skip mode |
US11381847B2 (en) * | 2019-05-31 | 2022-07-05 | Qualcomm Incorporated | Coefficient coding for transform skip mode in video coding |
US11575896B2 (en) * | 2019-12-16 | 2023-02-07 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
CN113613008A (zh) * | 2021-08-20 | 2021-11-05 | 百果园技术(新加坡)有限公司 | 一种视频编解码的方法、装置、电子设备及存储介质 |
US11695944B2 (en) * | 2021-09-08 | 2023-07-04 | Omnivision Technologies, Inc. | Video coding device and method |
CN116800956A (zh) * | 2022-01-07 | 2023-09-22 | 杭州海康威视数字技术股份有限公司 | 图像编解码方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040095398A (ko) * | 2003-04-28 | 2004-11-15 | 삼성전자주식회사 | 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치 |
KR20110054592A (ko) * | 2009-11-18 | 2011-05-25 | 에스케이 텔레콤주식회사 | 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
KR20110066888A (ko) * | 2009-12-11 | 2011-06-17 | 에스케이 텔레콤주식회사 | 움직임 보상 프레임의 선택적 필터링을 이용한 영상 부호화/복호화 방법 및 장치와 그를 위한 인터 예측 방법 및 장치 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100627329B1 (ko) * | 2004-08-19 | 2006-09-25 | 전자부품연구원 | H.264 비디오 코덱을 위한 적응형 움직임 예측 및 모드결정 장치 및 그 방법 |
US8649436B2 (en) * | 2004-08-20 | 2014-02-11 | Sigma Designs Inc. | Methods for efficient implementation of skip/direct modes in digital video compression algorithms |
JP5036559B2 (ja) * | 2005-01-18 | 2012-09-26 | トムソン ライセンシング | チャネルによって引き起こされる歪みを推定する方法及び装置 |
US8428136B2 (en) * | 2006-03-09 | 2013-04-23 | Nec Corporation | Dynamic image encoding method and device and program using the same |
US20080002770A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Methods, apparatus, and a computer program product for providing a fast inter mode decision for video encoding in resource constrained devices |
JP2010503264A (ja) * | 2006-08-28 | 2010-01-28 | トムソン ライセンシング | デコードされたビデオブロック内の予期される歪みを判定する方法および装置 |
JP4990927B2 (ja) * | 2008-03-28 | 2012-08-01 | 三星電子株式会社 | 動きベクトル情報の符号化/復号化方法及び装置 |
US8300696B2 (en) * | 2008-07-25 | 2012-10-30 | Cisco Technology, Inc. | Transcoding for systems operating under plural video coding specifications |
KR20100027384A (ko) * | 2008-09-02 | 2010-03-11 | 삼성전자주식회사 | 예측 모드 결정 방법 및 장치 |
WO2010041855A2 (en) * | 2008-10-06 | 2010-04-15 | Lg Electronics Inc. | A method and an apparatus for processing a video signal |
KR101742992B1 (ko) | 2009-05-12 | 2017-06-02 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
US9113168B2 (en) | 2009-05-12 | 2015-08-18 | Lg Electronics Inc. | Method and apparatus of processing a video signal |
KR101675118B1 (ko) * | 2010-01-14 | 2016-11-10 | 삼성전자 주식회사 | 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치 |
PL2924995T3 (pl) * | 2010-07-09 | 2018-11-30 | Samsung Electronics Co., Ltd | Sposób dekodowania wideo wykorzystujący łączenie bloków |
KR20120118780A (ko) * | 2011-04-19 | 2012-10-29 | 삼성전자주식회사 | 다시점 비디오의 움직임 벡터 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
US9131239B2 (en) * | 2011-06-20 | 2015-09-08 | Qualcomm Incorporated | Unified merge mode and adaptive motion vector prediction mode candidates selection |
GB2495990A (en) * | 2011-10-28 | 2013-05-01 | Canon Kk | Motion compensated image coding with omission of coding mode cost calculation for a motion predictor in a set. |
KR101830352B1 (ko) * | 2011-11-09 | 2018-02-21 | 에스케이 텔레콤주식회사 | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 |
-
2011
- 2011-11-09 KR KR1020110116686A patent/KR101830352B1/ko active IP Right Grant
-
2012
- 2012-11-09 CN CN201280066088.6A patent/CN104041048B/zh active Active
- 2012-11-09 WO PCT/KR2012/009435 patent/WO2013070006A1/ko active Application Filing
-
2014
- 2014-05-09 US US14/273,957 patent/US10939119B2/en active Active
-
2021
- 2021-01-29 US US17/161,761 patent/US11425392B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040095398A (ko) * | 2003-04-28 | 2004-11-15 | 삼성전자주식회사 | 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치 |
KR20110054592A (ko) * | 2009-11-18 | 2011-05-25 | 에스케이 텔레콤주식회사 | 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
KR20110066888A (ko) * | 2009-12-11 | 2011-06-17 | 에스케이 텔레콤주식회사 | 움직임 보상 프레임의 선택적 필터링을 이용한 영상 부호화/복호화 방법 및 장치와 그를 위한 인터 예측 방법 및 장치 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104581158A (zh) * | 2013-10-16 | 2015-04-29 | 中兴通讯股份有限公司 | 量化表、图像压缩处理方法、装置、终端及图像搜索系统 |
WO2015188297A1 (zh) * | 2014-06-08 | 2015-12-17 | 北京大学深圳研究生院 | 加权跳过模式的视频图像块压缩算术编解码方法及装置 |
CN110139097A (zh) * | 2019-04-19 | 2019-08-16 | 中南大学 | 视频编码中自适应模式顺序调整的方法 |
CN110139097B (zh) * | 2019-04-19 | 2023-01-06 | 中南大学 | 视频编码中自适应模式顺序调整的方法 |
CN113301337A (zh) * | 2020-02-24 | 2021-08-24 | 北京三星通信技术研究有限公司 | 编解码方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US11425392B2 (en) | 2022-08-23 |
KR20130051384A (ko) | 2013-05-20 |
US20210160508A1 (en) | 2021-05-27 |
US20140307788A1 (en) | 2014-10-16 |
CN104041048A (zh) | 2014-09-10 |
US10939119B2 (en) | 2021-03-02 |
CN104041048B (zh) | 2017-10-27 |
KR101830352B1 (ko) | 2018-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2013070006A1 (ko) | 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치 | |
WO2013002549A2 (ko) | 영상 부호화/복호화 방법 및 장치 | |
WO2011062392A2 (ko) | 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012033344A2 (ko) | 효과적인 화면내 예측모드 집합 선택을 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012015275A2 (ko) | 블록 분할예측을 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012077960A2 (ko) | 임의의 형태의 블록을 이용한 인터예측에 의한 영상의 부호화/복호화 방법 및 장치 | |
WO2013002550A2 (ko) | 고속 코딩 단위(Coding Unit) 모드 결정을 통한 부호화/복호화 방법 및 장치 | |
WO2012096550A2 (ko) | 양방향 인트라 예측을 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2013005941A2 (ko) | 영상 부호화 및 복호화 방법과 장치 | |
WO2012091461A2 (ko) | 주변블록의 특징벡터를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2009157669A2 (ko) | 인트라 예측 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2011004986A2 (ko) | 영상 부호화/복호화 방법 및 장치 | |
WO2011052897A2 (ko) | 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012057528A2 (ko) | 적응적 화면내 예측 부호화 및 복호화 방법 | |
WO2010087620A2 (ko) | 보간 필터를 적응적으로 사용하여 영상을 부호화 및 복호화하는 방법 및 장치 | |
WO2012093854A2 (ko) | 코딩 유닛 단위 병렬 인트라예측을 이용한 부호화/복호화 방법 및 장치 | |
WO2012099440A2 (ko) | 예측 움직임벡터 색인부호화에 기반한 움직임정보 생성/복원 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법 | |
WO2013141671A1 (ko) | 인터 레이어 인트라 예측 방법 및 장치 | |
WO2012011672A2 (ko) | 확장된 스킵모드를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2011037337A2 (ko) | 저주파수 성분을 고려한 영상 부호화/복호화 방법 및 장치 | |
WO2010044569A2 (ko) | 참조 프레임 생성 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012077959A2 (ko) | 노이즈성분을 위한 공간영역에서의 영상 부호화/복호화 방법 및 장치 | |
WO2011111954A2 (ko) | 움직임 벡터 해상도 조합을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 | |
WO2012021040A2 (ko) | 필터링모드 생략가능한 영상 부호화/복호화 방법 및 장치 | |
WO2012081917A2 (ko) | 움직임정보 병합을 이용한 부호움직임정보생성/움직임정보복원 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12846887 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12846887 Country of ref document: EP Kind code of ref document: A1 |