[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2005076629A1 - 画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置 - Google Patents

画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置 Download PDF

Info

Publication number
WO2005076629A1
WO2005076629A1 PCT/JP2005/001137 JP2005001137W WO2005076629A1 WO 2005076629 A1 WO2005076629 A1 WO 2005076629A1 JP 2005001137 W JP2005001137 W JP 2005001137W WO 2005076629 A1 WO2005076629 A1 WO 2005076629A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
coding
mode
image
encoding
Prior art date
Application number
PCT/JP2005/001137
Other languages
English (en)
French (fr)
Inventor
Mitsuru Suzuki
Shigeyuki Okada
Shinichiro Okada
Original Assignee
Sanyo Electric Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co., Ltd filed Critical Sanyo Electric Co., Ltd
Priority to JP2005517655A priority Critical patent/JPWO2005076629A1/ja
Priority to US10/588,791 priority patent/US20070291131A1/en
Publication of WO2005076629A1 publication Critical patent/WO2005076629A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • Image encoding apparatus and method image decoding apparatus and method, and imaging apparatus
  • the present invention relates to an image coding apparatus and an imaging apparatus, and more particularly to a technique for controlling a coding method.
  • the present invention also relates to image compression technology, and more particularly to an image coding apparatus and method for coding a moving image according to an image coding method including an interframe bidirectional prediction mode.
  • moving pictures are one of the main contents handled by various information terminals.
  • code technology is essential.
  • the core technology is MPEG (Moving Picture Expert Group).
  • Intraframe coding and interframe coding ⁇ are mainly used as coding techniques in MPEG.
  • interframe coding a forward reference that refers to a past picture to encode a picture at a certain point in time, and a bidirectional reference that references a past and future pictures to encode a picture at a certain point in time There is.
  • An intra-frame coded picture is called an I-picture (Intra-Picture)
  • a picture referred to in the forward direction is a P-picture (Predictive-Picture)
  • a picture referenced bi-directionally is called an SB-picture (Bidirectionally Predictive-Picture).
  • Patent Document 1 JP-A-8-154250 Disclosure of the invention
  • the present invention has been made under the above-mentioned background, and an object of the present invention is to provide an apparatus capable of executing coding in an appropriate manner according to the coding execution environment.
  • an image coding apparatus is characterized in that the image signal to be coded is at least one of an intraframe code and an interframe code.
  • a reference mode selection circuit which selectively sets one of the reference modes not using encoding in accordance with the encoding execution environment in the apparatus.
  • the encoding execution environment in the device includes, for example, resolution setting for a captured image, image quality setting, shooting mode, various parameters such as a frame rate, free space of a recording medium, and recording medium capacity. It includes information that indicates the environment at the time of encoding processing, such as the type, processing capacity of the image transfer destination, congestion level of the communication path, special reproduction support mode, power consumption and remaining battery power.
  • the inter-frame coding method includes, for example, the force with forward coding other than the above-mentioned bi-directional coding. Although bi-directional reference has a high data compression rate compared to forward reference, the processing load is large. , Re, there is a nature.
  • Another aspect of the present invention is an imaging device.
  • This apparatus encodes an image input unit for capturing an image of a subject and acquiring the image signal, and encoding the acquired image signal in a method using at least one of intra-frame encoding and inter-frame encoding. Circuit and sign Depending on the execution environment of coding in the device, either mode using bi-directional inter-frame code ⁇ referring to past and future frames as inter-frame compression coding in coding system is used.
  • a reference mode selection circuit that selectively sets, and a data storage unit that stores code data generated by encoding.
  • a reference mode is selected that is suitable according to the execution environment when encoding an image captured by the device. This makes it possible to improve the compression rate or the image quality of the captured image as compared to the case of using a single reference mode.
  • the image coding apparatus includes a prediction mode selection unit that outputs information indicating a prediction mode when coding a frame that constitutes the moving image when coding the moving image, and the prediction mode selection unit. And a coding unit for coding the frame based on the output information indicating the prediction mode, wherein the moving image is coded including an interframe bidirectional prediction mode,
  • the prediction mode selection unit may output information indicating that global motion compensation is to be used as information indicating a prediction mode when encoding a backward reference frame of a frame encoded in the interframe bidirectional prediction mode.
  • frame refers to individual images that constitute a moving image, and may be rephrased as “picture”, “plane” or the like.
  • the coding unit When the information that the global motion compensation is to be used is output from the prediction mode selection unit, the coding unit performs global motion when the motion vector in the interframe forward prediction mode is zero vector. It may be encoded as a vector. When the information that the global motion compensation is to be used is output from the prediction mode selection unit, the coding unit determines that the motion vector in the inter-frame forward prediction mode is a zero vector and the motion vector with the reference frame. Global motion compensation may be used to encode difference data that is substantially zero. Prior to the coding of a frame to be encoded by the interframe bidirectional prediction mode, when the backward reference frame is coded, if there is a macroblock whose motion vector is a zero vector, the motion vector is selected. Treat as a global motion vector.
  • the motion vector is a zero vector, and the difference data between the forward reference frame is substantially zero, the macro as encoded using the "no T_coded" flag
  • the macroblock is coded using global motion compensation.
  • the fact that the difference data is substantially zero means that the difference between the encoding target frame and the reference frame is all zero, or small enough to be regarded as zero, for example, the difference after quantization This may include the case where all the data become zero or the case where the difference data is smaller than a predetermined threshold.
  • the predetermined threshold may be determined according to the size or image quality of the image or macroblock, and may be, for example, the number of pixels of the macroblock XI (2, 3,).
  • the prediction mode selection unit acquires a profile when encoding the moving image, and refers to the profile to determine whether to include an inter-frame bidirectional prediction mode or not by referring to the profile. It is also good.
  • the prediction mode selection unit indicates a prediction mode for encoding a frame when the backward reference frame of a frame encoded in the interframe bidirectional prediction mode is a P frame.
  • P frame may be “picture” in MPEG-2 or “P_VOP” in MPEG-4.
  • S-frame may be "S-V ⁇ P” in MPEG-4.
  • the prediction mode selection unit refers to the profile to determine whether the P-frame is back-referenced from the B-frame, and if it is back-referenced, The P-frame may be switched to the S-frame in advance. As a result, it is possible to solve the problem of image loss that does not cause problems such as an increase in the amount of computation and a decrease in processing speed.
  • the prediction mode selection unit substitutes the P frame for information indicating the prediction mode when coding the frame for all frames that should be encoded as the P frame. , And may output information to be encoded as an S frame containing a global motion vector.
  • the prediction mode selection unit may switch the P-frame to the S-frame in advance if the profile includes the B-frame. This increases the amount of computation and It is possible to solve the image loss problem that does not cause problems such as a decrease in processing speed.
  • Yet another aspect of the present invention relates to an image coding method.
  • This image coding method comprises the steps of, when coding a moving image, outputting information indicating a prediction mode when coding a frame constituting the moving image, and based on the information indicating the prediction mode.
  • Yet another aspect of the present invention relates to an image coding apparatus.
  • this image coding apparatus When coding a moving image, this image coding apparatus performs an intra-frame coding mode, an inter-frame unidirectional prediction coding mode, an inter-frame bidirectional prediction coding for each of the frames constituting the moving image.
  • the moving image In the image coding apparatus for coding based on any one of the modes to generate a coded data string of the moving image, the moving image is an inter-frame unidirectional prediction coding mode and an inter-frame bidirectional prediction code.
  • a frame encoded in the inter-frame one-way predictive coding mode when it is encoded including the quantization mode, a certain block force S constituting the frame is present in the reference frame which is the basis of the prediction.
  • a motion vector between the reference frame and the reference frame instead of a flag indicating that fact.
  • Information added to the encoded data string of the block characterized in that encoding.
  • a block to which motion vector information is added when coding a frame existing between the interframe unidirectional prediction coding mode and the reference frame in the interframe bidirectional prediction coding mode Even in the block at the same position, even coding is performed, and coding parameters may be added to the coded data sequence.
  • frame refers to individual images constituting a moving image, and includes concepts such as “picture” and “plane”.
  • inter-frame one-way prediction code mode refers to “inter-frame forward prediction coding mode” or “inter-frame backward prediction coding mode”.
  • substantially identical means that the block of the encoding target frame and the block of the reference frame are When the difference data for each pixel is determined between the two pixels, the difference data is all zero or small enough to be regarded as zero. For example, when the difference data is subjected to quantization processing, If the post-conversion data is all zero, or if the difference data is less than a predetermined value, the value may be included.
  • the motion vector is added and encoded instead of the flag.
  • Coding parameters can also be added to corresponding blocks of frames coded in the interframe bi-directional predictive coding mode. This makes it possible to completely decode the coding parameters, prevent loss of the image, and improve the quality of the decoded image.
  • the frame coded in the interframe unidirectional prediction coding mode may be a backward reference frame of a frame coded in the interframe bi-directional prediction coding mode.
  • the code amount of motion vector information is large compared to the flag indicating that the block is substantially identical to the block of the reference frame, according to this, it is encoded in the inter-frame one-way predictive coding mode.
  • the motion vector information is added to at least the frame that is the reference frame of the frame encoded in the inter-frame bidirectional prediction code mode among the frames, so the inter-frame bidirectional prediction coding mode is It is possible to suppress the increase of the code amount while preventing the loss of the image which becomes a problem when decoding the encoded frame.
  • the motion vector information may be coded as a zero vector.
  • Yet another aspect of the present invention relates to an image coding apparatus.
  • the image coding apparatus When coding a moving image, the image coding apparatus outputs, for each frame constituting the moving image, information indicating a coding mode for coding the frame.
  • a coding unit that codes the frame based on the information indicating the coding mode output by the coding mode control unit, the coding unit further comprising: an interframe bidirectional prediction mode
  • the blocks present in the reference frame which is the basis of the prediction may be It is determined whether or not the block is substantially the same as the block at the same position, and the number of blocks determined to be substantially the same is counted, and the coding mode control unit
  • the number of blocks determined to be substantially the same is equal to or greater than a predetermined threshold value as information indicating encoding mode when encoding a backward reference frame of a frame to be encoded in a prediction mode And outputting information indicating that the blocks determined
  • the back reference frame is automatically copied as a copy of the forward reference frame, even if the back reference frame is copied.
  • the forward reference frame for example, it is possible to have differential data from the reference frame. This makes it possible to prevent the loss of the image and improve the quality of the decoded image.
  • motion vector information between the reference frame and the encoded data stream of the blocks is encoded.
  • the code amount is smaller.
  • the code amount becomes smaller in the latter case.
  • this block is encoded using global motion compensation, and it is determined that the blocks are substantially the same. If the number of blocks obtained is less than a predetermined threshold, motion vector information with respect to the reference frame is added to the coded data string of that block to perform coding, resulting in high coding efficiency. Have the effect.
  • This image coding apparatus is an image coding apparatus that codes a moving image to generate a coded data sequence, and an encoding unit that encodes a frame that constitutes the moving image, and the encoding unit Between frames When coding the target frame in the forward prediction mode, it indicates that the target frame is a block force of the rear reference frame to which the target frame is back referenced The copy of the predetermined block of the front reference frame to which the rear reference frame is the source If encoded using a flag, it is determined whether or not the block in the target frame corresponding to the block of the backward reference frame is to be a copy of a predetermined block of the forward reference frame. A determination unit, and an addition unit that adds flag information indicating the determination result of the determination unit to a coded data string.
  • the back reference frame is automatically copied even if it is a copy of the forward reference frame.
  • the forward reference frame instead of making a copy of the forward reference frame, for example, it is possible to have differential data from the reference frame. This makes it possible to prevent the loss of the image and improve the quality of the decoded image.
  • the coding method determination unit determines that the block of the target frame is not a copy of a predetermined block of the forward reference frame
  • the coding unit determines the target block of the forward reference frame and the target
  • the difference data with the block of the frame may be encoded.
  • the coding method determination unit may make the determination based on difference data between a block of the target frame and a predetermined block of the forward reference frame. For example, when the data amount of the differential data is larger than a predetermined threshold value, the differential data may be encoded and included in the encoded data string instead of copying the predetermined block of the forward reference frame. As a result, whether or not copying is to be made can be switched according to the data amount of differential data and the like, so that the image quality can be improved while suppressing an increase in the code amount.
  • the addition unit may add the flag information to encoded data of the target frame or a block of the target frame.
  • the addition unit may add the flag information to encoded data of a block of the backward reference frame or the backward reference frame.
  • the addition unit may attach the flag information to a sequence header of the encoded data string. The position to which flag information is added is determined adaptively according to the amount of code, image quality, etc. You may
  • Yet another aspect of the present invention relates to an image decoding apparatus.
  • This image decoding apparatus is provided with a decoding unit that acquires and decodes a coded data string obtained by coding a moving image, and is added to a predetermined position in the coded data string, in the interframe bidirectional prediction mode.
  • the flag information indicating whether or not the block of the encoded target frame is to be a copy of a predetermined block of the forward reference frame to which the target frame is forward referenced is acquired, and the decoding method is determined.
  • the decoding method determination unit determines that the block of the target frame is a copy of a predetermined block of the forward reference frame
  • the decoding unit determines the block of the target frame as the block.
  • a predetermined block of the forward reference frame is copied, and the decoding method determination unit does not copy the block of the target frame as the copy of the predetermined block of the forward reference frame.
  • the decoding method determination unit does not copy the block of the target frame as the copy of the predetermined block of the forward reference frame.
  • This image coding method is an image coding method for coding a moving image to generate a coded data sequence, wherein the steps of coding a frame constituting the moving image and the coding are
  • a target frame is coded using the inter-frame bi-directional prediction mode
  • a block force with a rear reference frame to which the target frame back refers is a copy of a predetermined block of a front reference frame to which the rear reference frame refers to the front.
  • a flag indicating that the block in the target frame corresponding to the block of the backward reference frame is to be a copy of a predetermined block of the forward reference frame.
  • a step of adding flag information indicating a determination result to the encoded data string.
  • Yet another aspect of the present invention relates to an image decoding method.
  • This image decoding method comprises the steps of: acquiring and decoding a coded data sequence obtained by coding a moving image; It is determined whether the block of the target frame added to the predetermined position in the data string and encoded in the interframe bidirectional prediction mode is a copy of the predetermined block of the forward reference frame to which the target frame is forward referenced. Obtaining the flag information to indicate and determining a decoding method, wherein the decoding step determines that the block of the target frame is a copy of the predetermined block of the forward reference frame in the determining step.
  • the predetermined block of the forward reference frame is copied to the block of the target frame and the block of the target frame is not to be copied of the predetermined block of the forward reference frame in the determination step.
  • the difference between the block of the target frame and the predetermined block of the forward reference frame Characterized by decoding the data.
  • Yet another aspect of the present invention relates to the data structure of a coded data string.
  • This data structure is a data structure of a coded data sequence obtained by coding a moving image, and the first frame of the first frame coded in the interframe bidirectional prediction mode at a predetermined position of the coded data sequence.
  • Flag information indicating whether the block is a copy of a predetermined block of the second frame to which the first frame forward-references, or whether differential data between the block of the first frame and the predetermined block of the second frame is decoded It is characterized by including.
  • the compression ratio or the image quality of an image can be improved as compared to the case where a single reference mode is not used or used.
  • FIG. 1 is a view schematically showing two types of encoding processing in the imaging device of Example 1 of the first embodiment.
  • FIG. 2 is a functional block diagram showing a basic structure of an imaging device.
  • FIG. 3 is a functional block diagram showing a detailed configuration of an image coding unit.
  • FIG. 4 is a view schematically showing a table in which the relationship between resolution setting and reference mode is stored. Ru.
  • FIG. 5 is a view schematically showing a table in which the relationship between the frame rate setting of an image and the reference mode is stored.
  • FIG. 14 is a flowchart showing the procedure of the image coding method according to the embodiment.
  • FIG. 15 is a flowchart showing the procedure of the image coding method according to the embodiment.
  • FIG. 16 is a flowchart showing the procedure of the image coding method according to the embodiment.
  • Garden 17 A diagram showing an entire configuration of an image code device according to an embodiment.
  • FIG. 18 is a diagram showing an example of a coded data string according to the embodiment.
  • FIG. 20 is a diagram showing yet another example of a coded data string according to the embodiment.
  • FIG. 21 is a diagram showing still another example of a coded data string according to the embodiment.
  • FIG. 22 is a diagram showing an overall configuration of an image decoding apparatus according to an embodiment.
  • FIG. 23 is a flowchart showing the procedure of the image coding method of the embodiment.
  • FIG. 24 is a flow chart showing the procedure of the image decoding method of the embodiment. BEST MODE FOR CARRYING OUT THE INVENTION
  • the image coding apparatus and the imaging apparatus in the present embodiment are realized as a circuit for coding and a digital camera including the circuit.
  • the circuit for encoding selects a reference mode of image encoding in accordance with the resolution setting of the image captured by the digital camera. Specifically, in high resolution imaging, a reference mode with a smaller processing load is selected, and in high resolution imaging, a reference mode with a higher processing load is selected. If this is configured to use only a single reference mode, the choice of reference mode must be designed to suit high-resolution shooting, and compression ratio and image quality should be prioritized even in high-resolution shooting. Can not. In the present embodiment, high compression rate and image quality can be realized except during high resolution imaging.
  • FIG. 1 schematically shows two types of encoding processing in the imaging device of the first embodiment.
  • the imaging apparatus of the present embodiment has at least a first mode 10 and a second mode 12 as reference modes in encoding processing, and selects one of the reference modes in accordance with the resolution setting at the time of photographing.
  • the first mode 10 encode the image using only I-picture or I-I V o P and P-picture or P- VOP, and do not use B-picture or B-V o P.
  • the second mode 12 the image is encoded using the I picture or I-V o P, the P picture or P-VOP, and the B picture or B-VOP.
  • the first mode 10 and the second mode 12 have a difference as to whether or not to generate a B picture.
  • the second mode 12 which generates B pictures although the data compression rate and the image quality are higher than those in the first mode 10, the load due to the encoding process is large.
  • the first mode 10 in which the B picture is not generated at the time of high resolution photographing is selected as the reference mode.
  • the B-VOP is not generated in the case of the MPEG4 system.
  • the B-VOP is generated in the second mode 12 in which the MPEG4 SP (Simple Profile) may be used. You can use Advanced Simple Profile).
  • the MPEG4 SP Simple Profile
  • frame it may indicate the field when a frame consists of two fields.
  • FIG. 2 is a functional block diagram showing the basic structure of the imaging device.
  • the imaging device 14 is a digital camera capable of capturing a moving image.
  • the imaging device 14 includes an image input unit 16, an image coding device 18, a control unit 20, a display unit 21, and a recording unit 22.
  • the image input unit 16 optically acquires an image of a subject, converts it into an electrical image signal, and sends it to the image coding device 18.
  • the image encoding device 18 encodes the image signal received from the image input unit 16 and sends it to the control unit 20.
  • the control unit 20 sends the image encoded by the image encoding device 18 to the recording unit 22 and sends it to the display unit 21 based on the user's instruction.
  • the display unit 21 displays the image sent from the control unit 20 on the liquid crystal screen.
  • the recording unit 22 stores the image received from the control unit 20 in the recording medium 23 mounted on the recording unit 22.
  • the recording medium 23 is, for example, a card type small hard disk or a non-volatile memory.
  • FIG. 3 is a functional block diagram showing a detailed configuration of the image coding apparatus.
  • the image code device 18 includes a motion vector detection circuit 24, a motion compensation circuit 26, a frame memory 28, a code circuit 30, a decoding circuit 32, an output buffer 34, a code amount control circuit 36, and a reference mode selection circuit 38. including.
  • An image (hereinafter referred to as “current frame”) input from the image input unit 16 is sent to the motion vector detection circuit 24.
  • the motion vector detection circuit 24 detects motion vectors between an image (hereinafter referred to as “reference frame”) which is stored in the frame memory 28 and is to be referred to in advance.
  • the motion compensation circuit 26 obtains the value of the quantization step used for quantization from the code amount control circuit 36, and determines the coefficient of the quantization and the reference mode of the macro block.
  • the motion vector detected by the motion vector detection circuit 24 and the quantization coefficient and the macroblock reference mode determined by the motion compensation circuit 26 are sent to the coding circuit 30. Also, the motion compensation circuit 26 sends the difference between the reference value for the macroblock and the actual value to the encoding circuit 30 as a reference error.
  • the encoding circuit 30 encodes the reference error using the quantization coefficient and sends it to the output buffer 34.
  • the coding circuit 30 sends the quantized reference error and the quantized coefficients to the decoding circuit 32.
  • the decoding circuit 32 decodes and decodes the quantized reference error based on the quantization coefficient.
  • the sum of the reference error and the reference value of the motion compensation circuit 26 is sent to the frame memory 28 as a decoded image. This decoded image is sent to the motion vector detection circuit 24 as a reference frame when it is referred to in the subsequent image coding process.
  • the code amount control circuit 36 obtains the state of the storage amount of the output buffer 34, and generates the value of the quantization step to be used for the next quantization according to the state of the storage amount.
  • Reference mode selection circuit 38 determines whether or not to use bi-directional coding as inter-frame coding, according to the image coding execution environment in imaging device 14, in this case according to the resolution setting of the captured image. Do. That is, reference mode selection circuit 38 selects a frame reference mode from intraframe coding, forward coding, and bidirectional coding, and transmits the frame to each circuit constituting image coding unit 18. Sends information indicating the reference mode. When bi-directional encoding is not used, the reference mode selection circuit 38 sends information indicating that global motion compensation is not used to the encoding circuit 30 as information indicating the frame reference mode.
  • the reference mode selection circuit 38 sends, to the coding circuit 30, information indicating that global motion compensation is to be used as information indicating the frame reference mode.
  • the coding circuit 30 acquires information that uses global motion compensation, the motion vector in the forward coding mode for which the vertical vector is zero and the horizontal vector is zero Code as a global motion vector.
  • reference mode selection circuit 38 may be configured of an LSI for determining a reference mode based on a parameter indicating an execution environment of encoding, and information used for such determination is stored. It may be composed of the combination of the system register and the CPU.
  • FIG. 4 schematically shows a table in which the relationship between the resolution setting and the reference mode is stored.
  • the mode table 40 has a resolution setting field 42 and a reference mode field 44.
  • the reference mode selection circuit 38 in this embodiment selects the reference mode according to the mode in which the resolution setting is set as the execution environment of the image coding. Information indicating which mode the resolution setting is set to is obtained from the control unit 20.
  • a relatively low resolution of 320 x 240 dots S is set as mail mode 46, and a standard resolution of 640 x 480 dots is set as standard mode 48.
  • the second mode 12 is defined in correspondence with the mail mode 46 and the standard mode 48, and the first mode 10 is defined in correspondence with the HD mode 50. That is, in the mail mode 46 and the standard mode 48, the second mode 12 is used in favor of the compression rate and the image quality.
  • the first mode 10 in which the processing load is relatively small is used.
  • the situation where the arithmetic processing can not be performed according to the execution environment of the coding processing can be avoided, and the image coding unit 18 can execute the coding processing in an appropriate processing time for any resolution setting. it can.
  • the image coding apparatus and the imaging apparatus according to the present embodiment are different from those according to the first embodiment in that a reference mode of image coding is selected according to the frame rate setting of a captured image as an execution environment of coding processing. Specifically, at the time of high frame rate imaging, the reference mode using bi-directional encoding is selected with priority given to the compression rate and the image quality. On the other hand, if the frame rate is too low, the interval between the previous and next frames may be too wide to detect the motion vector, so the bidirectional reference may cause deterioration in the image quality. Therefore, when the frame rate is low, select the reference mode that does not use bidirectional coding.
  • the selection of the reference mode has to be designed according to the low frame rate shooting, and the compression rate and the image quality decrease until the high frame rate shooting. Invite you.
  • high compression rate and image quality can be realized at least at high frame rates.
  • FIG. 5 schematically shows a table in which the relationship between the frame rate setting of an image and the reference mode is stored.
  • the mode table 60 has a frame rate setting field 62 and a reference mode field 64.
  • the reference mode selection circuit 38 in the present embodiment selects the reference mode in accordance with which mode the frame rate setting is set as the execution environment of the image coding. Information indicating which mode the frame rate setting is set to is obtained from the control unit 20.
  • relatively low frame rate lO fps mode 66, medium frame rate 15 fps mode 68, and standard high frame rate are used.
  • the 30 fps mode 70 is defined in the frame rate setting field 62.
  • the first mode 10 is defined in correspondence with the lO fps mode 66 and the 15 fps mode 68
  • the second mode 12 is defined in correspondence with the 30 fps mode 70. That is, in the 30 fps mode 70, the second mode 12 is selected with priority given to the compression rate and the image quality.
  • the image coding unit 18 can execute the coding process with an appropriate image quality and compression rate at any frame rate setting.
  • the image coding apparatus and the imaging apparatus in the present embodiment are the same as those in the first embodiment in that the reference mode of the image coding is selected according to the resolution setting of the photographed image as the execution environment of the coding process.
  • the reference mode using bi-directional coding is selected with priority given to compression ratio and image quality, but when low resolution shooting is used bi-directional coding is required a level that requires compression ratio and image quality. There is a possibility that it will be as high as possible. Therefore, at the time of low-resolution imaging, the reference mode not using the bidirectional code is selected with priority given to processing speed and load reduction.
  • the reference mode has to be designed for either high resolution shooting or low resolution shooting environment, and the compression rate and It is difficult to optimize the image quality.
  • FIG. 6 schematically shows a table in which the relationship between the resolution setting of the image and the reference mode is stored.
  • the mode table 80 has a resolution setting field 82 and a reference mode field 84.
  • the reference mode selection circuit 38 in this embodiment selects the reference mode in accordance with the mode in which the resolution setting is set as the execution environment of the image coding. Information indicating which mode the resolution setting is set to is obtained from the control unit 20.
  • the mail mode 86, the standard mode 88, and the HD mode 50 are defined in the resolution setting field 82 as in the first embodiment.
  • the first mode 10 is defined in correspondence with the mail mode 86, and the correspondence with the standard mode 88 and the HD mode 90
  • the second mode 12 is defined. That is, in the standard mode 88 and the HD mode 90, the second mode 12 is used with priority given to the compression ratio and the image quality.
  • the processing load is increased and the bidirectional code is used. Is not found. Therefore, in the mail mode 86, the first mode 10 in which the processing load is relatively small is used.
  • the image coding unit 18 can execute coding processing with an appropriate compression rate and image quality at any resolution setting.
  • the image encoding apparatus and the imaging apparatus select the image encoding reference mode according to the setting of the image quality or the compression rate of the captured image as the execution environment of the encoding process. It is different from one three. Specifically, at the time of shooting with high image quality or high compression, the reference mode using bi-directional encoding is selected with priority given to the compression ratio and high image quality, but low image quality or low compression is set. When shooting, select the reference mode that does not use bi-directional coding, giving priority to processing speed and load reduction.
  • the selection of the reference mode must be designed according to any environment of high image quality / high compression shooting or low image quality / low compression shooting. It is difficult to optimize the compression rate and image quality according to the environment. In this embodiment, it is possible to realize the compression rate and the image quality suitable for the execution environment of the encoding process.
  • FIG. 7 schematically shows a table in which the relationship between the setting of the image quality and compression ratio of the image and the reference mode is stored.
  • the mode table 100 has an image quality mode setting field 102 and a reference mode field 104.
  • the reference mode selection circuit 38 in the present embodiment selects the reference mode in accordance with the mode in which the setting of the image quality and the compression rate is set as the execution environment of the image coding. Information indicating which mode the image quality and compression rate settings are set to is set is set is acquired from the control unit 20.
  • normal mode 106 having relatively low image quality and compression rate and HQ mode 108 having relatively high image quality and compression rate are defined in image quality mode setting section 102.
  • the first mode 10 is defined in correspondence with the normal mode 106
  • the second mode 12 is defined in correspondence with the HQ mode 108. That is In the HQ mode 108, the second mode 12 is used in favor of high compression rate and high image quality, but in the normal mode 106, the processing load is increased and the bi-directional code is used. Is not found, so use the first mode 10.
  • the image coding unit 18 can execute the optimum coding process at any setting of image quality and compression rate.
  • the image coding apparatus and the imaging apparatus according to the present embodiment are different from those according to the first to fourth embodiments in that a reference mode of image coding is selected according to the characteristics of a captured image as an execution environment of coding processing. Specifically, in the normal mode shooting, the reference mode using bi-directional encoding is selected with priority given to the compression ratio and the image quality, but in the sport mode shooting, the motion of the subject is too large and the motion vector is not detected. Since there is a possibility, select the reference mode without bidirectional code.
  • the selection of the reference mode must be designed according to the environment during shooting in the normal mode shooting or sports mode shooting, depending on the environment. It is difficult to optimize the appropriate compression rate and image quality. In this embodiment, it is possible to realize the compression rate and the image quality suitable for the execution environment of the encoding process.
  • FIG. 8 schematically shows a table in which the relationship between the shooting mode setting and the reference mode is stored.
  • the mode table 110 has a shooting mode setting field 112 and a reference mode field 114.
  • the reference mode selection circuit 38 in the present embodiment selects the reference mode in accordance with the mode in which the photographing mode setting is set as the execution environment of the image coding. Information indicating which mode the shooting mode setting is set to is acquired from the control unit 20.
  • the normal mode 116 and the sport mode 118 are defined in the shooting mode setting field 112.
  • the second mode 12 is defined in correspondence with the normal mode 116
  • the first mode 10 is defined in correspondence with the sport mode 118. That is, in the normal mode 116, the second mode 12 is selected with priority given to the compression rate and the image quality.
  • the sport mode 118 there is a possibility that the image quality may be degraded if the bi-directional coding is used when the motion is not detected because the motion of the subject is too large. Therefore, in the sport mode 118, the first mode 10 which does not use the bidirectional code is performed. select. As a result, the image encoding unit 18 can execute the optimum encoding process in any imaging mode.
  • the image encoding apparatus and the imaging apparatus select the image encoding reference mode according to the free space of the recording medium for storing the captured image as the execution environment of the encoding process. It is different from one five. Specifically, if the free space of the recording medium is smaller than a predetermined amount, the reference mode using bi-directional encoding, which is a mode with a relatively high compression rate, is selected, but if the free space of the recording medium is larger than a predetermined amount Select a reference mode that does not use bi-directional coding, which is a mode with a relatively low compression ratio.
  • the reference mode should not be designed according to the environment where the free space of the recording medium is more, less or less, less than or equal to the predetermined value. It is difficult to optimize the compression rate according to the environment. In this embodiment, a compression ratio suitable for the execution environment of the encoding process can be realized.
  • FIG. 9 schematically shows a table in which the relationship between the free space of the recording medium and the reference mode is stored.
  • the mode table 120 has a free space field 122 and a reference mode field 124.
  • the reference mode selection circuit 38 in this embodiment selects the reference mode according to how much free space of the recording medium is as an execution environment of image coding.
  • Information indicating the free space of the recording medium is acquired from the recording unit 22.
  • a free space column 122 defines a first state 126 in which the free space is 50% or more and a second state 128 in which the free space is less than 50%.
  • the first mode 10 is defined in correspondence with the first state 126
  • the second mode 12 is defined in correspondence with the second state 128. That is, in the first state 126, since the recording medium has sufficient free space, the first mode 10 having a lower compression rate is selected. On the other hand, since the free space of the recording medium is small in the second state 128, the second mode 12 is selected with priority given to the height of the compression rate. As a result, the image encoding unit 18 can execute the optimum encoding process regardless of the free space of the recording medium.
  • the image encoding device and the imaging device in the present embodiment have a coding processing execution environment and
  • the second embodiment differs from the first to sixth embodiments in that the reference mode of image coding is selected according to the type of recording medium for storing a captured image. Specifically, since the bit rate, which is the data transfer rate to the recording medium, varies depending on the type of recording medium, when a high bit rate recording medium is loaded, the mode with a relatively low compression ratio is used. Select a reference mode that does not use a certain bidirectional coding, and select a reference mode that uses a bidirectional code that is a mode with a relatively high compression rate when a low bit rate recording medium is installed.
  • the reference mode must be designed for a high bit rate or low bit rate recording medium, or one of the recording media, and the compression rate according to the environment. Optimization is difficult. In this embodiment, it is possible to realize a compression rate suitable for the execution environment of the encoding process.
  • FIG. 10 schematically shows a table in which the relationship between the free capacity of the recording medium and the reference mode is stored.
  • the mode table 130 has a recording medium type field 132 and a reference mode field 134.
  • the reference mode selection circuit 38 in the present embodiment selects the reference mode according to the type of recording medium as an execution environment of image coding. Information indicating the type of recording medium is acquired from the recording unit 22.
  • a small hard disk 136 having a high bit rate, a memory card 138 having a low bit rate, and an internal memory 140 having a high bit rate are defined in a type field 132 of the recording medium.
  • the first mode 10 is defined in correspondence with the small hard disk 136 and the internal memory 140
  • the second mode 12 is defined in correspondence with the memory card 138. That is, in the case of the small hard disk 136 and the internal memory 140, since the bit rate is high, the first mode 10 having a low compression ratio and a relatively large data size is selected.
  • the memory card 138 has a low bit rate, the second mode 12 having a high compression rate and a relatively small data size is selected.
  • the image coding unit 18 can execute optimum coding processing regardless of the type of recording medium.
  • the image encoding apparatus and the imaging apparatus select the image encoding reference mode in accordance with whether or not the imaging mode supports special reproduction as an execution environment of the encoding process.
  • One is different from seven. Specifically, it supports special playback such as 2x speed playback
  • each frame can be coded in the order of I picture, B picture, P picture, and B picture, and B pictures can be inserted every other frame.
  • double-speed playback can be realized simply by skipping B-pictures at the time of playback. Therefore, using bidirectional coding to generate B-pictures is a great advantage in terms of specifications.
  • the first mode 10 is selected because a great advantage in terms of generation is not found in generating a B picture.
  • the selection of the reference mode must be designed to match either the shooting corresponding to special playback or the shooting not corresponding, and the code according to the environment Optimization is difficult.
  • FIG. 11 schematically shows a table in which the relationship between the shooting mode and the reference mode is stored.
  • the mode table 150 has a shooting mode field 152 and a reference mode field 154.
  • the reference mode selection circuit 38 in the present embodiment selects the reference mode in accordance with whether or not the shooting mode supports special reproduction as an execution environment of image coding.
  • a shooting mode 156 corresponding to special playback such as double speed playback and a shooting mode 158 not corresponding to special playback are defined in the shooting mode field 152.
  • the second mode 12 is defined in correspondence with the photographing mode 156 corresponding to special reproduction
  • the first mode 10 is defined in correspondence with the photographing mode 158 not corresponding to special reproduction.
  • the image coding unit 18 can execute the optimum coding processing according to the photographing mode.
  • the configuration has been described in which the reference mode is selected according to each parameter such as resolution setting, frame rate setting, and image quality setting as an execution environment of the encoding process.
  • select the reference mode according to the line speed at the time of image transmission transfer, the congestion degree of the line, the processing capacity of the transfer destination, etc. May be At this time, if the line speed is high, if the degree of congestion on the line is low, if the processing capacity of the transfer destination is high, select the first mode 10 with a small compression ratio, and otherwise select the second mode.
  • the mode 12 may be selected.
  • the imaging is performed.
  • the reference mode may be selected according to the power consumption of the image device 14 and the remaining capacity of the battery. At this time, when the power consumption is high, the first mode 10 having a smaller load may be selected when the remaining amount of the battery is low, and the second mode 12 may be selected otherwise.
  • the reference mode selection circuit 38 may select according to at least two or more of these various parameters.
  • the combination of each parameter and the reference mode optimum for the combination are associated with each other and stored in the mode table.
  • MPEG-4 which is a standard for compression encoding of moving pictures
  • a macroblock having a target image to be encoded and a reference image to be referenced when the target image is encoded. If the difference data of the macro block corresponding to the macro block is substantially zero, the code amount is calculated by coding using the "not_coded" flag indicating that it is a copy of the reference image.
  • a macroblock in the P-VOP which is a backward reference image of the target image
  • a corresponding macroblock in the forward reference image of the target image When encoding is performed using the “not_coded” flag indicating that the image is a copy of the image, the corresponding macroblock in the target image is also a copy of the corresponding macroblock in the forward reference image (eg, 154250). This makes it possible to reduce the code amount significantly.
  • FIG. 12 shows an example of encoding a moving image according to the MPEG-4 system.
  • the example shown in FIG. 1 shows an example in which three continuous images 190a, 190b and 190c are encoded as P ⁇ V VP, B-VOP and P-V ⁇ P, respectively.
  • compression coding is performed in the interframe forward prediction mode with the image 1 90a force S, the previous I 1 V V P or P-VOP as a reference image.
  • the image 190c is compressed and encoded in the forward prediction mode, using the image 190a that is the immediately preceding P-V ⁇ P as a reference image.
  • the macroblock 192 c is substantially the same as the macroblock 192 a of the forward reference image 190 a, and the difference is substantially zero. Because it is a mouth, it is encoded using the "not_coded" flag.
  • the image of the macroblock 192a is copied to the macroblock 192c.
  • the image 190b is compressed and encoded in the bi-prediction mode with the force image 190a as a forward reference image and the image 190c as a backward reference image.
  • the macro block 192 c of the back reference image 190 c corresponding to the macro block 192 b of the image 190 b to be encoded is encoded using the “not_coded” flag, and thus the macro block 192 c of the image 190 b Macroblock 192b is similarly encoded using the "not_coded” flag.
  • the image of the macro block 192a is copied to the macro block 192b.
  • an object of the second to fifth embodiments is to provide a technique for reducing deterioration in image quality when coding a moving image.
  • the configuration of the image coding device 18 of the present embodiment is the same as the configuration of the image coding device 18 of the first embodiment shown in FIG.
  • the image coding device 18 according to the present embodiment performs moving image coding based on M PEG-4.
  • the P-V VP back-references with "not_coded" flag in P-V ⁇ P If a coded macroblock is present, it is also treated as a copy of the forward reference frame in BV OP. As described above, this may cause the image to be lost, so in this embodiment, forward reference is made to B-V VP. Change the coding scheme of the back reference frame so that it does not become a copy of the frame.
  • B-VOP is made to have difference data by treating it as a global motion vector. This can avoid the problems described above and improve the quality of compressed images within the scope of the current M PEG-4 standard.
  • points different from the first embodiment will be mainly described.
  • the reference mode selection circuit 38 switches the frame prediction mode between intraframe coding, interframe forward prediction coding, and interframe bi-directional prediction coding.
  • the prediction mode information of the frame is output.
  • the reference mode selection circuit 38 first obtains a profile when coding a moving image, and determines whether or not the inter-frame bidirectional prediction mode is included.
  • Profiles in MPEG-4 include SP (Simple Profile), ASP (Advanced Simple Profile), etc. Among them, SP is encoded by intraframe coding, and it is an interframe forward direction It is a profile combining P-VOP encoded by prediction mode, and B-VOP not included, which is encoded by inter-frame bidirectional prediction mode.
  • ASP is a profile that can use B-VOP in addition to I-VOP and P-VOP.
  • the reference mode selection circuit 38 determines from the information such as the profile and the type of moving image whether or not the inter-frame bidirectional prediction mode is included.
  • the reference mode selection circuit 38 determines that the moving image to be encoded is to be encoded including the interframe bidirectional prediction mode, it is encoded in the interframe bidirectional prediction mode.
  • B Output information indicating that global motion compensation is to be used as information indicating the frame prediction mode when encoding the backward reference frame of the VOP.
  • the encoding circuit 30 encodes one in which the motion vector tone in the interframe forward prediction mode is zero vector and the global motion vector is zero vector.
  • the coding circuit 30 may be a macroblock in which the motion vector threshold in the interframe forward prediction mode is zero vector and the difference data from the forward reference frame is substantially zero, that is, Macroblocks encoded with the "not_coded" flag are encoded using global motion compensation.
  • the encoding circuit 30 sets the frame as an S-VOP including global motion vector. Encode.
  • the reference image to the corresponding macroblock of B-VOP Can have difference data with Thereby, it is possible to prevent the loss of the image and to improve the image quality of the decoded image.
  • the reference mode selection circuit 38 can switch only P- VOP to which B- V o P back-references to S- V o P with a global motion vector, or B-V o P If it is an existing profile, switch all P PP to S— V with global motion vector.
  • the reference mode selection circuit 38 may also switch the P-VOP to an S-VOP with a global motion vector when a macro block of "not_coded" appears during P-VPP encoding. And, when "not_coded" macroblock appears more than a predetermined number, it is possible to switch the P-VOP to the S-VOP with global motion vector.
  • FIG. 14 is a flowchart showing the procedure of the image coding method of the present embodiment.
  • the reference mode selection circuit 38 acquires a profile for encoding a moving image, and determines whether or not a B-VOP appears (S10). If the B-VOP does not appear (N in S10), the image encoding device 18 encodes the moving image in the normal manner without performing special processing (S14). If the B-VOP is a profile in which the VOP appears (Y in S10), the reference mode selection circuit 38 predicts forward with the global motion vector (0, 0) added when the P-VOP is coded. The frame prediction mode information to the effect of coding is output using the mode (S12). The coding circuit 30, in response to an instruction from the reference mode selection circuit 38, codes the image to be coded as an S-VOP having a global motion vector (0, 0).
  • the image coding device 18 performs moving image coding in accordance with MPEG-4.
  • MPEG-4 When encoding according to the MPEG-4 standard, when encoding with a profile that includes B-VOP, it is encoded with "not_coded" flag in P- VOP to which B-V ⁇ P back-references If a macro block exists, it will be treated as a copy of the forward reference frame even if it is in B-V ⁇ P. As described above, this may cause the image to be lost. In this embodiment, therefore, the B-VoP does not become a copy of the forward reference frame. Change the coding scheme of the backward reference frame.
  • the configuration of the image coding apparatus 18 of the present embodiment is the same as that of the image coding apparatus 18 of the first embodiment shown in FIG. The following mainly describes differences from the first embodiment.
  • reference mode selection circuit 38 first obtains a profile for encoding a moving image from a control circuit (not shown) that controls the entire image encoding device 18 or the like. , It is determined whether an interframe bidirectional prediction mode is included.
  • the profile may be set by the control circuit according to an instruction from the outside, or may be set automatically by the control circuit according to the use environment of the image encoding device 18.
  • Profiles in MPEG-4 include SP (Simple Profile) and ASP (Advanced Simple Profile). Of these, SP is an I VOP encoded by intraframe coding and an interframe forward prediction mode. It is a profile combining P-VOP encoded by B-VOP not included, which is encoded by inter-frame bidirectional prediction mode.
  • ASP is a profile that can use B-VOP in addition to IVOP and P-VOP.
  • the reference mode selection circuit 38 determines whether the inter-frame bi-directional prediction mode is included or not from the information such as the profile and the type of moving image.
  • the reference mode selection circuit 38 determines that the moving image to be encoded is to be encoded including the inter-frame forward prediction mode and the inter-frame bi-directional prediction mode
  • the forward prediction mode a certain P-V ⁇ P is coded in a forward prediction mode, and a certain macroblock force S that constitutes P-V ⁇ P is present in the forward reference frame and is the same as a P-VOP's macroblock
  • the reference numeral I spoon in data sequence Ugokibesotoru information between forward reference frame instead of Caro with a "no t_ CO ded" flag Appends information to the effect of encoding.
  • the coding circuit 30 receives this information and Macroblocks that can be encoded with the not_coded flag are coded by adding motion vector information, which is a mouth vector, without using the "not_coded" flag.
  • This causes the B-VOP to reference a corresponding macroblock of the B-VPP even if it is substantially identical to the corresponding macroblock of a frame to which the B-VOP is back-referenced. It is possible to have coding parameters including motion vector information between the images and prediction errors. Therefore, the loss of the image can be prevented, and the image quality of the decoded image can be improved.
  • the reference mode selection circuit 38 switches the block that can be encoded using the "not_coded” flag with only the P-VOP to which the B-V ⁇ P back-references to be encoded with motion vector information added. If it is a profile in which B-VOP exists, it is possible to encode blocks that can be encoded using the "not_coded” flag, with motion vector information, for all P-V ⁇ P. You may switch. In addition, when the “not_coded” macro block appears more than a predetermined number, the reference mode selection circuit 38 selects a block that can be coded by using the “not_coded” flag in the P-VOP, and the motion vector information It may be switched to add and encode.
  • FIG. 15 is a flowchart showing the procedure of the image coding method of the present embodiment.
  • the reference mode selection circuit 38 acquires a profile when encoding a moving image, and determines whether or not a B-VOP appears (S20). B— If the VOP does not appear (N in S20), the image coding device 18 permits the use of the “not_coded” flag when coding with the P-VOP. (S24). If the B-VOP is a profile where it appears (Y in S20), the reference mode selection circuit 38 is a block that can be encoded using the "not_coded” flag when encoding the P-VOP.
  • the encoding circuit 30 receives the instruction from the reference mode selection circuit 38, and encodes the image to be encoded.
  • a method using a global motion vector has been shown as a method of encoding P-VOP, which is a backward reference frame of B-V ⁇ P.
  • P-VOP which is a backward reference frame of B-V ⁇ P.
  • zero vector no Shows a method of adding motion vector information indicating. In either case, however, the amount of code increases in comparison with encoding using the "not_coded" flag.
  • a flag indicating whether or not to use a global motion vector is added to all the macroblocks, and the code amount is increased accordingly.
  • motion vector information indicating a zero vector motion vector information is also added to all macro blocks that can be encoded using the "not_coded" flag, so the code amount increases accordingly.
  • the image coding apparatus 18 of the present embodiment is coded using a global motion vector as in the second embodiment. It is possible to switch between a mode to be performed and a mode in which motion vector information indicating zero vector is added and encoded as in the third embodiment.
  • the overall configuration of the image coding apparatus 18 according to the present embodiment is the same as the image coding apparatus 18 according to the first embodiment, and the coding circuit 30, the output buffer 34 and the reference mode selection circuit The operation of 38 is partially different.
  • the coding circuit 30, the output buffer 34 and the reference mode selection circuit The operation of 38 is partially different.
  • reference mode selection circuit 38 determines that the moving image to be encoded is to be encoded including the inter-frame forward prediction mode and the inter-frame bi-directional prediction mode
  • a certain P-V ⁇ P is coded in a forward prediction mode
  • a certain macroblock force S that constitutes P-V ⁇ P is present in the forward reference frame and is the same as a P-VOP's macroblock
  • the reference numeral I spoon in data sequence Ugokibesotoru information between forward reference frame instead of Caro with a "no t_ CO ded" flag Attached It outputs information to the effect that it is to be encoded.
  • the coding circuit 30 codes the macro blocks that can be coded with the "not_coded” flag, adding motion vector information which is a mouth vector, without using the "not_coded” flag, It is stored in the output buffer 34.
  • coding circuit 30 corresponds to a backward reference frame of B-Vp P, which is a backward reference frame, in which the motion vector in the interframe forward prediction mode is a zero vector
  • the motion vector threshold is encoded as a zero vector, which is also stored in the output buffer 34.
  • the encoding circuit 30 counts the number of macroblocks that can be encoded with the "not_coded" flag while encoding P- V P P, which is a backward reference frame of B-VOP, and The number is notified to the reference mode selection circuit 38.
  • the reference mode selection circuit 38 detects the number of macroblocks that can be encoded with the "not_coded" flag notified from the encoding circuit 30. When the number exceeds a predetermined threshold, the B-VOP It switches to the information to the effect that global motion compensation is to be used as the information indicating the code mode when encoding the backward reference frame P-VOP.
  • This threshold may be a value determined in advance internally or may be designated by the user from the outside.
  • Coding circuit 30 adds motion vector information that is a zero vector when coding mode output from reference mode selection circuit 38 is switched to information indicating that global motion compensation is to be used. Continue to encode the motion vector in the interframe forward prediction mode with a zero motion vector using global motion compensation, and continue to send this encoded data to the output buffer 34. Remember. Then, after completion of the coding of P 1 VOP, the output buffer 34 outputs a coded data string coded using the global motion vector.
  • the number S of the macroblocks that can be encoded with the “not_coded” flag, and the P- VOP, which is a backward reference frame of B—V ⁇ P that does not reach a predetermined threshold value, is completed.
  • the coding mode output from the reference mode selection circuit 38 is not switched, and the method of coding by adding motion vector information that is zero vector is continued until the end.
  • P-VOP encoding is completed, the encoded data string encoded by adding motion vector information which is a zero vector is output from the output buffer 34.
  • reference mode selection circuit 38 adds a motion vector information that is a zero vector and adds a motion vector information that is a zero vector only to P-VOP to which B-VOP back-references, or uses a global motion vector.
  • encoding may be performed by adding motion vector information which is a zero vector at all P-V ⁇ P, or Alternatively, coding may be performed using a global motion vector.
  • FIG. 16 is a flowchart showing the procedure of the image coding method according to the present embodiment.
  • the reference mode selection circuit 38 acquires a profile at the time of encoding a moving image, and determines whether B-V ⁇ P appears (S30). B— If the VOP does not appear (N in S30), the image coding device 18 permits the use of the “not_coded” flag when coding with the P-VOP. (S38). If the B-V ⁇ P is a profile in which it appears (Y in S30), the reference mode selection circuit 38 uses the "not_coded” flag to encode the block when encoding P_V ⁇ P. It is determined whether the number is equal to or greater than a predetermined number (S32).
  • the reference mode selection circuit 38 If the number is less than the predetermined number (N in S32), the reference mode selection circuit 38 outputs frame prediction mode information indicating that the motion vector is to be added with motion vector information that is (0, 0) and encoded ( S34). If more than the predetermined number (Y in S32), the reference mode selection circuit 38 uses the forward prediction mode in which the global motion vector (0, 0) is given at the sign of P1 VOP. Frame code / mode information indicating that the code is to be output is output (S36). The image coding device 18 outputs a coded data sequence based on the frame code / mode information output from the reference mode selection circuit 38.
  • the image coding apparatus 18 can obtain the following effects S.
  • B-V P P Back reference frame P-VOP either a coding mode using a global motion vector or a coding mode adding motion vector information a zero vector
  • B-VOP a certain macroblock force of the back-referenced frame
  • the corresponding macroblock of B-V ⁇ P Can have coding parameters including motion vector information between the reference image and prediction errors. Therefore
  • the encoding mode of the P- VOP is determined according to the number of macroblocks that can be encoded using the "not_coded" flag.
  • the coding mode can be switched to either a coding mode using a global motion vector or a coding mode to add motion vector information that is a zero vector. This makes it possible to select a coding mode with good coding efficiency depending on the number of code-capable macroblocks using the "not_coded” flag, and minimizes the increase in code amount. It is possible to do S.
  • the reference mode selection circuit 38 may provide two thresholds TH1 and TH2 (TH1 ⁇ TH2) with respect to the number of “not_coded” macroblocks. In this case, if the number of macroblocks of not.codedj is less than TH1, use of the "not_coded” flag in P-VOP is permitted, and if the number of macroblocks of "not_coded” is greater than STH1 and less than TH2, In P— V P P, switch the blocks that can be encoded using the “not_coded” flag to be encoded by adding motion vector information, and when the number of macroblocks of “not_coded” is T H 2 or more, You may switch to encoding using the global motion vector.
  • a mode for coding a macro block that can be coded using the “not_coded” flag using a global motion vector and the selection of the mode for coding by adding a motion vector representing the zero vector may be performed from outside Nag simply by determining the number of macroblocks "not_ CO ded". That is, the image encoding device 18 may be provided with an input unit, and may be selected by an instruction of the user via the input unit. Also, it may be selected in accordance with the specifications of the decoding device to which the encoded data sequence is to be sent. For example, the decoding device at the transmission destination may support global motion compensation, in which case it may be possible to select a mode for encoding by adding a motion vector representing a zero vector.
  • encoding circuit 30 encodes a macroblock that can be encoded using the “not_coded” flag with encoding using global motion vector and a motion vector representing zero vector.
  • the macro block that can be coded using the “not_coded” flag is zeroed. Only coding for adding a motion vector representing a turtle may be performed and stored in the output buffer 34. In this case, the frame coding mode information output from the reference mode selection circuit 38 adds a motion vector representing a zero vector when the coding of the frame to be coded is completed.
  • the encoded data string stored in the output buffer 34 is output as it is. If the frame coding mode information S output from the reference mode selection circuit 38 represents a coding mode using a global motion vector, the coded data string stored in the output buffer 34 is It converts the vector data into a coded data string and outputs it.
  • the coding mode using the global motion vector and the zero vector are used. Not only this, but switching may be performed according to the number of macroblocks that can be encoded using a "not_coded” flag included in a frame encoded in the past. .
  • the “not_coded” flag is used if the difference with the macro block of the forward reference frame is small. If the difference is large, the difference data is encoded. Then, a force to copy the macro block of the forward reference frame and a flag indicating whether to decode differential data from the reference frame (hereinafter simply referred to as “decision flag”) are inserted into the encoded data string.
  • the image decoding apparatus refers to the determination flag to determine whether the corresponding macroblock is to be a copy of the forward reference frame or to decode differential data, and the determination flag is a copy.
  • the difference data is decoded and referred to. Add to the picture of the frame. As a result, it is possible to avoid the above-mentioned problems and to improve the image quality of the compressed image while suppressing an increase in the code amount.
  • FIG. 17 shows the configuration of the image coding apparatus 18 according to the present embodiment.
  • the configuration of the image coding device 18 according to the present embodiment is the same as the image coding device 18 according to the first embodiment shown in FIG.
  • the encoding method determination circuit 240 and the determination flag attached color circuit 242 are provided.
  • the other configuration and operation are similar to those of the first embodiment. The differences from the first embodiment will mainly be described below.
  • Coding method determination circuit 240 back-references the coded macro block using the "not_coded" flag. When coding a macro block of B—P, the corresponding macro block is referred to. It is determined whether or not it may be treated as a copy of the corresponding macroblock in the forward reference frame.
  • the coding method determination circuit 240 obtains difference data between the current frame and the reference frame output from the motion compensation circuit 26, and if the amount of difference data is smaller than a predetermined threshold value, It is permitted to make a copy, and when it is large, the encoding circuit 30 is made to encode difference data.
  • the coding method determination circuit 240 transmits the determination result to the determination flag addition circuit 242.
  • the coding method determination circuit 240 determines the code amount required for the coded data sequence, the image quality of the decoded image, the application of the decoded image, the capacity of the medium for recording the image, the state of the communication path for transmitting and receiving the image, etc. In accordance with, it may be determined whether or not to copy the forward reference frame. Such determination criteria may be supplied to the encoding method determination circuit 240 as control information from a device on which the image encoding device 18 is mounted. For example, when priority is given to the image quality of the decoded image, even if the difference data is small, the difference data may be encoded and included in the encoded data sequence, and copying of the forward reference frame may be prohibited. When an image is recorded on a mobile phone or the like and transmitted, the threshold value for determination may be increased, and the amount of code may be reduced by not including differential data as much as possible.
  • the determination flag addition circuit 242 acquires the determination result by the encoding method determination circuit 240, and adds a determination flag to a predetermined position of the encoded data stream.
  • the determination flag may be added to each macroblock of B-VOP, may be added to each B-VOP, or is added to each macroblock of a frame to which B-V ⁇ P is to refer back. B-VOP may be added for each frame to which back reference is made.
  • the determination flag may be added to the macroblock encoded using the “not_coded” flag of the frame to which the B-VOP refers backward, It may be added to a frame containing a macroblock encoded using the "not_coded” flag.
  • the judgment flag is It may be added to the sequence header of the encoded data stream.
  • the judgment flag attached color circuit 242 is based on the number of macro blocks to be processed as a copy of the forward reference frame among the macroblocks included in the B- VOP. Also, determine the judgment flag to be added. For example, when the number of macroblocks to be processed as a copy exceeds half, a value to permit copying of the forward reference frame is added as a determination flag, and all the macroblocks included in the B-VoP are forward. It may be processed as a copy of the reference frame. Similarly, when adding the determination flag to the sequence header, the determination flag adding circuit 242 may determine the determination flag according to the number of macroblocks or frames processed as a copy of the forward reference frame.
  • the determination flag addition circuit 242 determines the code amount required for the encoded data string, the quality of the decoded image, the application of the decoded image, the capacity of the medium for recording the image, the state of the communication path for transmitting and receiving the image, etc.
  • the position to which the determination flag is to be added may be determined according to Such determination criteria may be supplied to the encoding method determination circuit 240 as control information of the device power on which the image code device 18 is mounted. For example, when priority is given to the image quality of the decoded image, a determination flag may be added to each macro block. If you want to reduce the code amount, you may add a judgment flag to each frame or to the sequence header.
  • FIGS. 18 to 21 show examples of the data structure of the coded data sequence generated by the image coding device 18 according to the present embodiment.
  • the encoded data string has a function of making the block of the first frame coded in the interframe bi-prediction mode in its predetermined position as a copy of the predetermined block of the second frame to which the first frame refers to the first frame. And a determination flag indicating whether to decode differential data between the block of the first frame and the predetermined block of the second frame.
  • FIG. 18 shows an example in which the determination flag is added to the sequence header.
  • the encoded data string 300 corresponds to "Video Object Layer J in MPEG-4 and includes a sequence header 302 and a plurality of frames 310.
  • Frame 310 corresponds to" Video Object Plane "in MPEG-4 and is a frame header. 312 and a plurality of macroblocks 320.
  • the macroblock 320 corresponds to “Macroblock” in MPEG-4, and includes a macroblock header 322 and code data 324 obtained by encoding motion vectors and difference data.
  • the sequence Data 304 indicating the type of the profile of the encoded data string 300 is stored at a predetermined position of the header 302. Then, if the profile of the encoded data string 300 is a profile that can use B-VOP and the encoded data string 300 includes a B-VOP, the judgment flag 306 is placed at a predetermined position of the sequence header 302. It is added.
  • FIG. 19 shows an example in which the determination flag is added to the frame header.
  • the frame header 312 of the frame to which B-V OP or B-V ⁇ P back-references indicates data 314 indicating the type of V ⁇ P and whether this VOP has difference data or not.
  • Flag information 316 is stored. Then, in the case of having differential data, the determination flag 318 is added to a predetermined position of the frame header.
  • FIG. 20 shows an example in which the determination flag is added to the macroblock header of the frame to which B-V ⁇ P back-references.
  • the “not_coded” flag 326 is stored in the frame to which the B-V ⁇ P back-references, for example, the macroblock header 322 of the P-V OP. Then, it is added to a predetermined position of the header 322, for example, immediately after the “not_coded” flag 326.
  • FIG. 21 shows an example in which the determination flag is added to the macroblock header of the B-VOP.
  • the judgment flag 130 is added to a predetermined position of the macroblock header 322, for example, the beginning.
  • the macroblock force with a frame to which B- VOP back-references is almost the same as the corresponding macroblock of the frame to which forward-reference is made, and is encoded with the "not_coded” flag. Even if it exists, the corresponding macroblock of B-VOP can have difference data with the reference image. This makes it possible to prevent the loss of the image and improve the quality of the decoded image. Also, when the difference between the macro block of B-VPP and the macro block of the forward reference frame is small, encoding is performed using the "not_coded" flag, so the code amount can be suppressed.
  • FIG. 22 shows an entire configuration of an image decoding apparatus 350 according to an embodiment of the present invention.
  • This image decoding apparatus 350 receives a data from the buffer 362 that stores an encoded data string compressed and encoded by the MPEG-4 system, and the data from the buffer 362, and receives a variable length code such as a motion vector.
  • a variable length code such as a motion vector.
  • the transform coefficient obtained by the variable length decoding circuit 364 and the inverse quantization circuit 366 which converts the transformation coefficient obtained by the variable length decoding circuit 364 into DCT coefficients, and the inverse quantization circuit 3 66.
  • inverse DCT circuit 368 which converts the generated DCT coefficient sequence into DCT coefficients of the 8 ⁇ 8 block unit and performs inverse DCT to output difference data, a reference address based on the motion vector, and the difference data.
  • a motion compensation unit 376 that generates output image data after decoding the image from the image data and storing the image in an internal memory.
  • a motion compensation unit 376 adds a frame memory 372 for storing image data, a motion compensation circuit 370 for reading out reference image data from the frame memory 372 based on a motion vector, and adds reference image data and difference data. And an addition circuit 374 for outputting the decoded image data to a frame memory 372.
  • the frame memory 372 outputs output image data.
  • the decoding method determination circuit 380 acquires a determination flag at a predetermined position in the encoded data stream, and determines a B-V ⁇ P decoding method.
  • the position of the judgment flag may be the header of a macro block, a frame header, a sequence header or the like, or any other position may be shared between the image encoding device 18 and the image decoding device 350.
  • the recognition power of S is good.
  • Decoding method determination circuit 380 determination flag, when the B-VOP macroblock you back reference has been coded in the "no T_coded" flag, B- macroblock lock VOP as a copy of the forward reference frame If the value indicates processing, the motion compensation circuit 370 is notified to perform copying.
  • the motion compensation circuit 370 reads the macro block of the forward reference frame from the frame memory 372 and copies it to the macro block of the B-VOP.
  • the decoding method determination circuit 380 causes the inverse quantization circuit 366 and the inverse DCT circuit 368 to decode the difference data if the determination flag indicates that the difference data is to be decoded without permitting copying, and the decoding is performed. Converted difference data is added to the forward reference frame macroblock to obtain a B-V ⁇ P macroblock. Thereby, the encoded data sequence encoded by the image encoding device 18 according to the present embodiment can be appropriately decoded.
  • FIG. 23 is a flowchart showing the procedure of the image coding method according to the present embodiment.
  • FIG. 23 shows a procedure in which the image coding device 18 codes a target frame in the interframe bidirectional prediction mode.
  • the encoding method determination circuit 24 0 force Enforcement target macroblock force Macros encoded with “not_coded” flag It is checked whether or not the block is back-referenced (S 110). Macro block of the backward reference frame is not "not _ co ded" (S110 of N), performs a normal encoding process.
  • the coding method determination circuit 240 copy the macroblock to be encoded also into the macroblock of the forward reference frame? It is determined whether or not (S 112).
  • the decision flag attached flag circuit 242 inserts the copy of the forward reference frame into the predetermined position of the encoded data sequence. A determination flag is added (S 114).
  • the encoding circuit 30 encodes the difference data (S 116), and the color determination circuit with the determination flag A determination flag indicating that the data 242 includes difference data is added (S118).
  • FIG. 24 is a flowchart showing the procedure of the image decoding method according to the present embodiment.
  • FIG. 24 shows a procedure in which the image decoding device 350 decodes a frame coded in the interframe bi-prediction mode.
  • the decoding method determination circuit 380 acquires the determination flag added to the predetermined position of the encoded data sequence (S130), and confirms the type of the determination flag (S132). If the determination flag is a value indicating that the macroblock of the B- VOP's backward reference frame is "not_coded" and the macroblock of the B- VOP is also a copy of the forward reference frame's macroblock.
  • the decoding method determination circuit 3 80 instructs other circuits to insert a copy of the macro block of the forward reference frame into the macro block of the B-VOP (S134).
  • the determination flag is a value indicating that the macro block of B-VOP contains difference data (N in S132)
  • the decoding judgment circuit 380 decodes the difference data and outputs the macro of B-VOP. Instruct other circuits to generate an image of the block (S136).
  • the present invention is applicable to an image coding apparatus for coding a moving image.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 情報端末の構成が多様化した結果、データ形式への要求も多様化し、そうした要求に端末を適合させる必要が生じていた。本発明の画像符号化装置は、画像を符号化する方式としてMPEGに準拠した方式を用い、特にフレーム内符号化およびフレーム間符号化を用いる。フレーム間符号化の方式としては、双方向符号化を用いる参照モードである第1モードと、双方向符号化を用いない参照モードである第2モードとを選択的に設定できる。第1モードの場合、双方向符号化を用いないので、Bピクチャは生成されず、IピクチャおよびPピクチャのみで画像が符号化される。

Description

明 細 書
画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置 技術分野
[0001] 本発明は、画像符号化装置および撮像装置に関し、特に符号化の方法を制御す る技術に関する。また、本発明は、画像圧縮技術に関し、特に、フレーム間双方向予 測モードを含む画像符号化方式により動画像を符号化する画像符号化装置及び方 法に関する。
背景技術
[0002] 近年、画像処理技術や回路の集積技術が向上し、また通信技術に関してはいわゆ るブロードバンド通信や無線 LAN通信等の多様な通信手段が急速に普及したことか ら、様々な端末や機器にマルチメディアを扱う機能が標準的に搭載されるようになつ た。例えば、多くの携帯電話にインターネット機能や静止画 ·動画撮影機能が当然の ように搭載されており、テレビ電話機能や各種放送受信機能が標準搭載される日も 近レ、。デジタルカメラの場合、ビデオカメラに迫るほどの画質での動画録再機能が備 わることも珍しくなぐ楽曲再生機能や通信機能までもが備わるようになりつつある。こ のように、各情報端末がもつ本来の機能とは別に、他の端末でそれまで実現されてき た機能が搭載されるなど情報端末の多用途化は留まるところを知らない。
[0003] ここで、各種情報端末で扱われる主要なコンテンツの一つに動画がある。動画を扱 うためには符号ィ匕技術が欠かせなレ、。その中心的な技術とされているのが、 MPEG ( Moving Picture Expert Group)方式である。 MPEGにおける符号化技術としては主 にフレーム内符号化およびフレーム間符号ィ匕が用いられる。フレーム間符号化として は、ある時点のピクチャを符号ィ匕するために過去のピクチャを参照する順方向参照と 、ある時点のピクチャを符号化するために過去および未来のピクチャを参照する双方 向参照とがある。フレーム内符号化したピクチャは Iピクチャ(Intra-Picture)と呼ばれ 、順方向参照したピクチャが Pピクチャ(Predictive-Picture)、双方向参照したピクチャ 力 SBピクチャ (Bidirectionally predictive-Picture)と呼ばれる。
特許文献 1 :特開平 8 - 154250号公報 発明の開示
発明が解決しょうとする課題
[0004] 上述の通り、情報端末が多用途化した結果、それぞれのハードウェア構成やソフト ウェア構成も多様化し、動画を符号化する上でその実行環境に応じた様々な制約が 情報端末ごとに生じるようになった。そうした制約の解消は情報端末の多様化をより 促進するために不可欠である。
[0005] 本発明は上記背景の下でなされたものであり、本発明の目的は、符号化の実行環 境に応じた適切な方式で符号ィヒを実行できる機器を提供することにある。
課題を解決するための手段
[0006] 上記課題を解決するために、本発明のある態様の画像符号化装置は、符号化の対 象となる画像信号を、フレーム内符号ィ匕およびフレーム間符号ィ匕のうち少なくともい ずれ力、を用いた方式にて画像信号を符号ィヒする符号化回路と、フレーム間符号化 の方式として、過去および未来のフレームを参照する双方向符号ィヒを用いる参照モ ードおよび双方向符号化を用いない参照モードのうちいずれかを、当該装置におけ る符号化の実行環境に応じて選択的に設定する参照モード選択回路と、を備える。
[0007] ここで、「当該装置における符号化の実行環境」には、例えば撮影画像に関する解 像度設定、画質設定、撮影モード、フレームレート等の各種パラメータ、記録媒体の 空き容量、記録媒体の種類、画像転送先の処理能力や通信路の混雑度、特殊再生 の対応の態様、消費電力や電池残量といった、符号化処理時の環境を示す情報が 含まれる。フレーム間符号化の方式には、例えば上記の双方向符号化の他にも順方 向符号化がある力 双方向参照は順方向参照と比べて、データ圧縮率は高いものの 処理負荷が大きレ、とレ、う性質がある。
[0008] この態様によると、符号化処理を実行するときの様々な環境に応じてその環境に適 した性質の参照モードを選択することにより、最適な符号化処理を実行することがで きる。
[0009] 本発明の別の態様は、撮像装置である。この装置は、被写体を撮像して画像信号 を取得する画像入力部と、取得された画像信号をフレーム内符号化およびフレーム 間符号化のうち少なくともいずれかを用いた方式にて符号化する符号化回路と、符 号化方式におけるフレーム間圧縮符号化として過去および未来のフレームを参照す る双方向フレーム間符号ィ匕を用いるモードと用いないモードのいずれかを、当該装 置における符号化の実行環境に応じて選択的に設定する参照モード選択回路と、 符号化により生成された符号ィヒデータを保存するデータ格納部と、を備える。
[0010] この態様によると、動画を撮影可能なデジタルカメラ等の撮像装置において、その 装置によって撮影された画像を符号化するときの実行環境に応じて適合する参照モ ードを選択する。これにより、単一の参照モードを使用する場合と比べて撮影画像の 圧縮率または画質を向上させることができる。
[0011] 本発明のさらに別の態様は、画像符号化装置に関する。この画像符号化装置は、 動画像を符号ィ匕する際に、前記動画像を構成するフレームを符号化するときの予測 モードを示す情報を出力する予測モード選択部と、前記予測モード選択部により出 力された前記予測モードを示す情報に基づいて前記フレームを符号化する符号ィ匕 部と、を備え、前記動画像がフレーム間双方向予測モードを含んで符号化されるとき には、前記予測モード選択部は、フレーム間双方向予測モードで符号化されるフレ ームの後方参照フレームを符号化するときの予測モードを示す情報として、グローバ ル動き補償を用いる旨の情報を出力することを特徴とする。ここで、 「フレーム」は、動 画像を構成する個々の画像を指し、「ピクチャ」、 「プレーン」などと言い換えてもよい。
[0012] 前記符号化部は、前記予測モード選択部からグローバル動き補償を用いる旨の情 報が出力されたとき、フレーム間前方向予測モードにおける動きベクトルがゼロべタト ルであるものをグローバル動きベクトルとして符号化してもよい。前記符号化部は、前 記予測モード選択部からグローバル動き補償を用いる旨の情報が出力されたとき、フ レーム間前方向予測モードにおける動きベクトルがゼロベクトルであり、かつ、参照フ レームとの差分データが実質的にゼロであるものを、グローバル動き補償を用いて符 号化してもよい。フレーム間双方向予測モードにより符号化されるフレームの符号ィ匕 に先立って、その後方参照フレームを符号ィ匕するときに、動きベクトルがゼロベクトル であるマクロブロックが存在するとき、その動きベクトルをグローバル動きベクトルとし て扱う。また、動きベクトルがゼロベクトルであって、かつ、前方参照フレームとの差分 データが実質的にゼロであり、「not_coded」フラグを用いて符号化されるようなマクロ ブロックが存在するとき、そのマクロブロックをグローバル動き補償を用いて符号ィ匕す る。これにより、フレーム間双方向予測モードによりフレームを符号化する際に、前方 参照フレームのコピーではなぐ参照画像との差分データを持たせることができる。こ れにより、画像の欠落を防止し、復号画像の画質を向上させることができる。ここで、 差分データが実質的にゼロであるとは、符号化対象フレームと参照フレームとの差分 が全てゼロである力、、ゼロとみなせる程度に小さい場合を指し、例えば、量子化後の 差分データが全てゼロになる場合や、差分データが所定のしきい値よりも小さい場合 を含んでもよレ、。所定のしきい値は、画像又はマクロブロックのサイズや画質などに応 じて定められてもよぐ例えば、マクロブロックの画素数 X I (2、 3、 · ·)をしきい値とし てもよい。
[0013] 前記予測モード選択部は、前記動画像を符号化するときのプロファイルを取得して 、前記プロファイルを参照することにより、フレーム間双方向予測モードを含むか否か を半 IJ定してもよい。
[0014] 前記予測モード選択部は、前記フレーム間双方向予測モードで符号化されるフレ ームの後方参照フレームが Pフレームであった場合に、そのフレームを符号化すると きの予測モードを示す情報として、 Pフレームに代えて、グローバル動きベクトルを含 む Sフレームとして符号化する旨の情報を出力してもよレ、。ここで、「Pフレーム」は、 MPEG—2における「 ピクチャ」であってもよぐ MPEG—4における「P_VOP」であ つてもよレ、。また、「Sフレーム」は、 MPEG—4における「S-V〇P」であってもよレ、。予 測モード選択部は、 Pフレームを符号ィ匕する際に、プロファイルを参照して、その Pフ レームが B—フレームから後方参照されるか否かを判断し、後方参照される場合は、 予め P—フレームを S—フレームに切り替えてもよい。これにより、演算量の増加や、処 理速度の低下などの問題を生じることなぐ画像欠落の問題を解消することができる。
[0015] 前記予測モード選択部は、 Pフレームとして符号化されるべきであった全てのフレ ームについて、そのフレームを符号ィ匕するときの予測モードを示す情報として、 Pフレ ームに代えて、グローバル動きベクトルを含む Sフレームとして符号化する旨の情報 を出力してもよレ、。予測モード選択部は、 B—フレームを含むプロファイルである場合 は、予め P—フレームを S—フレームに切り替えてもよレ、。これにより、演算量の増加や 、処理速度の低下などの問題を生じることなぐ画像欠落の問題を解消することがで きる。
[0016] 本発明のさらに別の態様は、画像符号化方法に関する。この画像符号化方法は、 動画像を符号ィ匕する際に、前記動画像を構成するフレームを符号化するときの予測 モードを示す情報を出力するステップと、前記予測モードを示す情報に基づいて前 記フレームを符号化するステップと、を含み、前記動画像がフレーム間双方向予測モ ードを含んで符号化されるときには、前記出力するステップは、フレーム間双方向予 測モードで符号ィ匕されるフレームの後方参照フレームを符号ィ匕するときの予測モード を示す情報として、グローバル動き補償を用いる旨の情報を出力することを特徴とす る。
[0017] 本発明のさらに別の態様は、画像符号化装置に関する。この画像符号化装置は、 動画像を符号ィ匕する際に、前記動画像を構成するフレーム毎に、フレーム内符号ィ匕 モード、フレーム間一方向予測符号化モード、フレーム間双方向予測符号化モード のいずれかのモードに基づいて符号化して、前記動画像の符号化データ列を生成 する画像符号ィヒ装置において、前記動画像がフレーム間一方向予測符号化モード とフレーム間双方向予測符号化モードを含んで符号化されるときに、フレーム間一方 向予測符号化モードで符号化されるフレームにおいて、当該フレームを構成する或 るブロック力 S、予測の基になる参照フレーム中に存在する前記或るブロックと同じ位 置のブロックと実質的に同一であると判断された場合、その旨を示すフラグの代わり に前記参照フレームとの間の動きベクトル情報をそのブロックの符号化データ列中に 付加して符号化することを特徴とする。更に、前記フレーム間一方向予測符号化モ ードと前記参照フレームの間に在るフレームをフレーム間双方向予測符号化モード にて符号ィ匕する時に、記動きベクトル情報が付加されたブロックと同じ位置のブロック につレ、ても符号化を行い、符号化パラメータを符号ィ匕データ列中に付加してもよレ、。
[0018] ここで、「フレーム」は、動画像を構成する個々の画像を指し、「ピクチャ」、「プレー ン」といった概念を含む。また、「フレーム間一方向予測符号ィ匕モード」は、「フレーム 間前方予測符号化モード」や「フレーム間後方予測符号化モード」のことを指す。ま た、実質的に同一であるとは、符号化対象フレームのブロックと参照フレームのブロッ クとの間で各画素毎の差分データを求めた時に、その差分データが全てゼロである か、ゼロとみなせる程度に小さい場合を指し、例えば、差分データに量子化処理を施 した場合に量子化後のデータが全てゼロとなる場合や、差分データが所定のしきレ、 値よりも小さレ、場合を含んでもょレ、。
[0019] この態様によれば、フレーム間一方向予測符号化モード中に参照フレームのデー タに置き換えられるブロックが存在しても、フラグの代わりに動きベクトルを付加して符 号化するので、フレーム間双方向予測符号化モードで符号ィヒされたフレームの対応 するブロックについても符号化パラメータを付加することができる。これにより、符号化 パラメータに完全に復号することができ、画像の欠落を防止し、復号画像の画質を向 上させることができる。
[0020] 前記フレーム間一方向予測符号化モードで符号ィ匕されたフレームは、前記フレー ム間双方向予測符号化モードで符号ィヒされるフレームの後方参照フレームであって もよレ、。参照フレームのブロックと実質的に同一である旨を示すフラグと比較して、動 きべクトノレ情報の符号量は大きいが、これによると、フレーム間一方向予測符号化モ ードで符号化されるフレームのうち、少なくともフレーム間双方向予測符号ィ匕モード にて符号化されたフレームの参照フレームであるものに対しては動きべクトノレ情報を 付加するので、フレーム間双方向予測符号化モードにて符号化されたフレームを復 号する時に問題となる画像の欠落を防止しつつ、符号量の増大を抑えることができる
[0021] また、この態様において、前記動きベクトル情報はゼロベクトルとして符号ィ匕してもよ レ、。
[0022] 本発明のさらに別の態様は、画像符号化装置に関する。この画像符号化装置は、 動画像を符号ィ匕する際に、前記動画像を構成するフレーム毎に、このフレームを符 号化するときの符号化モードを示す情報を出力する符号化モード制御部と、前記符 号化モード制御部により出力された前記符号化モードを示す情報に基づいて前記フ レームを符号化する符号化部と、を備え、前記符号化部は、フレーム間双方向予測 モードで符号化されるフレームの後方参照フレームを符号化するとき、このフレーム を構成するブロック毎に、予測の基になる参照フレーム中に存在する前記ブロックと 同じ位置のブロックと実質的に同一であるか否かを判断して、この実質的に同一であ ると判断されたブロックの数をカウントし、前記符号化モード制御部は、フレーム間双 方向予測モードで符号化されるフレームの後方参照フレームを符号ィ匕するときの符 号化モードを示す情報として、前記実質的に同一であると判断されたブロックの数が 所定の閾値以上であった場合、前記実質的に同一であると判断されたブロックをグロ 一バル動き補償を用いて符号化する旨の情報を出力し、前記実質的に同一であると 判断されたブロックの数が前記所定の閾値未満であった場合、前記実質的に同一で あると判断されたブロックに対して前記参照フレームとの間の動きベクトル情報をその ブロックの符号化データ列中に付加して符号ィ匕する旨の情報を出力することを特徴 とする。
[0023] このような構成によれば、フレーム間双方向予測モードにより対象フレームを符号 化する際に、後方参照フレームが前方参照フレームのコピーとなってレ、る場合であつ ても、自動的に前方参照フレームのコピーとするのではなぐ例えば参照フレームと の差分データを持たせることができる。これにより、画像の欠落を防止し、復号画像の 画質を向上させることができる。
[0024] また、実質的に同一であると判断されたブロックを、グローバル動き補償を用いて符 号化する場合と、参照フレームとの間の動きベクトル情報をそのブロックの符号化デ ータ列中に付加して符号ィ匕する場合とを比較した場合、実質的に同一であると判断 されたブロックの数が多いときは、前者の場合のほうが符号量が小さぐ実質的に同 一であると判断されたブロックの数が少ないときは、後者の場合のほうが符号量が小 さくなる。この態様によれば、実質的に同一であると判断されたブロックの数が所定の 閾値以上の場合は、このブロックをグローバル動き補償を用いて符号ィ匕し、実質的に 同一であると判断されたブロックの数が所定の閾値未満の場合は、参照フレームとの 間の動きベクトル情報をそのブロックの符号化データ列中に付加して符号ィ匕するの で、符号化効率が高くなる、という効果を有する。
[0025] 本発明のさらに別の態様は、画像符号化装置に関する。この画像符号化装置は、 動画像を符号ィヒして符号ィヒデータ列を生成する画像符号化装置であって、前記動 画像を構成するフレームを符号化する符号化部と、前記符号化部がフレーム間双方 向予測モードにより対象フレームを符号ィ匕するときに、前記対象フレームが後方参照 する後方参照フレームのあるブロック力 前記後方参照フレームが前方参照する前 方参照フレームの所定ブロックのコピーであることを示すフラグを用いて符号化され ている場合、前記後方参照フレームのブロックに対応する前記対象フレーム中のブ ロックを、前記前方参照フレームの所定ブロックのコピーとするか否かを判定する符 号化方法判定部と、前記判定部の判定結果を示すフラグ情報を符号化データ列中 に付加する付加部と、を備えることを特徴とする。
[0026] このような構成によれば、フレーム間双方向予測モードにより対象フレームを符号 化する際に、後方参照フレームが前方参照フレームのコピーとなってレ、る場合であつ ても、自動的に前方参照フレームのコピーとするのではなぐ例えば参照フレームと の差分データを持たせることができる。これにより、画像の欠落を防止し、復号画像の 画質を向上させることができる。
[0027] 前記符号化方法判定部が、前記対象フレームのブロックを前記前方参照フレーム の所定ブロックのコピーとしないと判定したときに、前記符号化部は、前記前方参照 フレームの所定ブロックと前記対象フレームのブロックとの差分データを符号化しても よい。これにより、復号時には差分データを復号して対象フレームの画像を得ることが できるので、画像の欠落を防ぎ、画質を向上させることができる。
[0028] 前記符号化方法判定部は、前記対象フレームのブロックと前記前方参照フレーム の所定ブロックとの差分データに基づいて判定を行ってもよい。例えば、差分データ のデータ量が所定のしきい値よりも大きいときには、前方参照フレームの所定ブロック のコピーとせずに、差分データを符号化して符号化データ列に含ませてもよい。これ により、差分データのデータ量などに応じて、コピーとするか否かを切り替えることが できるので、符号量の増大を抑えつつ、画質の向上を図ることができる。
[0029] 前記付加部は、前記対象フレーム又は前記対象フレームのブロックの符号化デー タに前記フラグ情報を付加してもよい。前記付加部は、前記後方参照フレーム又は 前記後方参照フレームのブロックの符号化データに前記フラグ情報を付加してもよい 。前記付加部は、前記符号化データ列のシーケンスヘッダに前記フラグ情報を付カロ してもよレ、。フラグ情報を付加する位置は、符号量や画質などに応じて適応的に決定 してもよい。
[0030] 本発明のさらに別の態様は、画像復号化装置に関する。この画像復号化装置は、 動画像を符号化した符号化データ列を取得して復号する復号化部と、前記符号ィ匕 データ列中の所定位置に付加され、フレーム間双方向予測モードで符号化された対 象フレームのブロックを、前記対象フレームが前方参照する前方参照フレームの所 定ブロックのコピーとするか否かを示すフラグ情報を取得し、復号の方法を判定する 複号化方法判定部と、を備え、前記複号化部は、前記復号化方法判定部が前記対 象フレームのブロックを前記前方参照フレームの所定ブロックのコピーとすると判定を したときには、前記対象フレームのブロックに前記前方参照フレームの所定ブロックを コピーし、前記復号化方法判定部が前記対象フレームのブロックを前記前方参照フ レームの所定ブロックのコピーとしないと判定したときには、前記対象フレームのブロ ックと前記前方参照フレームの所定ブロックとの差分データを復号することを特徴と する。
[0031] このような構成によれば、上述した画像符号化装置によりフレーム間双方向予測モ ードで符号ィ匕されたフレームを適切に復号することができるので、画質を向上させる こと力 Sできる。
[0032] 本発明のさらに別の態様は、画像符号化方法に関する。この画像符号化方法は、 動画像を符号ィヒして符号ィヒデータ列を生成する画像符号化方法であって、前記動 画像を構成するフレームを符号化するステップと、前記符号化するステップがフレー ム間双方向予測モードにより対象フレームを符号ィ匕するときに、前記対象フレームが 後方参照する後方参照フレームのあるブロック力 前記後方参照フレームが前方参 照する前方参照フレームの所定ブロックのコピーであることを示すフラグを用いて符 号化されている場合、前記後方参照フレームのブロックに対応する前記対象フレー ム中のブロックを、前記前方参照フレームの所定ブロックのコピーとするか否かを判 定するステップと、判定結果を示すフラグ情報を符号化データ列中に付加するステツ プと、を含むことを特徴とする。
[0033] 本発明のさらに別の態様は、画像複号化方法に関する。この画像複号化方法は、 動画像を符号ィヒした符号化データ列を取得して復号するステップと、前記符号化デ ータ列中の所定位置に付加され、フレーム間双方向予測モードで符号化された対象 フレームのブロックを、前記対象フレームが前方参照する前方参照フレームの所定ブ ロックのコピーとするか否力を示すフラグ情報を取得し、復号の方法を判定するステツ プと、を含み、前記復号するステップは、前記判定するステップにおいて前記対象フ レームのブロックを前記前方参照フレームの所定ブロックのコピーとすると判定をした ときには、前記対象フレームのブロックに前記前方参照フレームの所定ブロックをコピ 一し、前記判定するステップにおいて前記対象フレームのブロックを前記前方参照フ レームの所定ブロックのコピーとしないと判定したときには、前記対象フレームのブロ ックと前記前方参照フレームの所定ブロックとの差分データを復号することを特徴と する。
[0034] 本発明のさらに別の態様は、符号化データ列のデータ構造に関する。このデータ 構造は、動画像を符号化した符号化データ列のデータ構造であって、前記符号化デ ータ列の所定位置に、フレーム間双方向予測モードで符号ィ匕された第 1フレームの ブロックを、前記第 1フレームが前方参照する第 2フレームの所定ブロックのコピーと するか、前記第 1フレームのブロックと前記第 2フレームの所定ブロックとの差分デー タを復号するかを示すフラグ情報を含むことを特徴とする。
[0035] なお、以上の構成要素の任意の組合せや、本発明の構成要素や表現を方法、装 置、システム、コンピュータプログラム、プログラムを格納した記録媒体、データ構造な どの間で相互に置換したものもまた、本発明の態様として有効である。
発明の効果
[0036] 本発明によれば、単一の参照モードし力、使用しない場合と比べて、画像の圧縮率 または画質を向上させることができる。
図面の簡単な説明
[0037] [図 1]第 1の実施の形態の実施例 1の撮像装置における二種類の符号化処理を模式 的に示す図である。
[図 2]撮像装置の基本構造を示す機能ブロック図である。
[図 3]画像符号化部の詳細な構成を示す機能ブロック図である。
[図 4]解像度設定と参照モードの関係が格納されたテーブルを模式的に示す図であ る。
[図 5]画像のフレームレート設定と参照モードの関係が格納されたテーブルを模式的 に示す図である。
園 6]画像の解像度設定と参照モードの関係が格納されたテーブルを模式的に示す 図である。
園 7]画像の画質および圧縮率の設定と参照モードの関係が格納されたテーブルを 模式的に示す図である。
園 8]撮影モード設定と参照モードの関係が格納されたテーブルを模式的に示す図 である。
園 9]記録媒体の空き容量と参照モードの関係が格納されたテーブルを模式的に示 す図である。
園 10]記録媒体の空き容量と参照モードの関係が格納されたテーブルを模式的に示 す図である。
園 11]撮影モードと参照モードの関係が格納されたテーブルを模式的に示す図であ る。
園 12]動画像を MPEG-4により符号ィ匕する例を示す図である。
園 13]図 12に示した動画像を復号した画像の例を示す図である。
[図 14]実施の形態に係る画像符号化方法の手順を示すフローチャートである。
[図 15]実施の形態に係る画像符号化方法の手順を示すフローチャートである。
[図 16]実施の形態に係る画像符号化方法の手順を示すフローチャートである。 園 17]実施の形態に係る画像符号ィ匕装置の全体構成を示す図である。
[図 18]実施の形態に係る符号化データ列の例を示す図である。
園 19]実施の形態に係る符号ィ匕データ列の別の例を示す図である。
[図 20]実施の形態に係る符号化データ列の更に別の例を示す図である。
[図 21]実施の形態に係る符号化データ列の更に別の例を示す図である。
[図 22]実施の形態に係る画像復号化装置の全体構成を示す図である。
[図 23]実施の形態の画像符号化方法の手順を示すフローチャートである。
[図 24]実施の形態の画像複号化方法の手順を示すフローチャートである。 発明を実施するための最良の形態
[0038] (第 1の実施の形態)
(実施例 1)
本実施例における画像符号化装置および撮像装置は、符号化のための回路と、そ の回路を含むデジタルカメラとして実現される。この符号化のための回路は、デジタ ルカメラで撮影される画像の解像度設定に応じて、画像符号化の参照モードを選択 する。具体的には、高解像度撮影時には、処理負荷がより小さい参照モードを選択 し、高解像度撮影でないときは、処理負荷がより高い参照モードを選択する。これを 単一の参照モードしか使用しない構成とした場合、参照モードの選択は高解像度撮 影時に合わせて設計せざるを得ず、高解像度撮影でないときまで圧縮率や画質を優 先することができない。本実施例においては、高解像度撮影時以外には高い圧縮率 と画質を実現することができる。
[0039] 図 1は、実施例 1の撮像装置における二種類の符号化処理を模式的に示す。本実 施例の撮像装置は、符号化処理における参照モードとして少なくとも第 1モード 10と 第 2モード 12を有し、撮影時の解像度設定に応じていずれかの参照モードを選択す る。第 1モード 10においては、 Iピクチャまたは I一 V〇Pと Pピクチヤまたは P— VOPの みを用いて画像を符号化し、 Bピクチャまたは B— V〇Pは用いなレ、。一方、第 2モード 12においては、 Iピクチャまたは I一 V〇Pと、 Pピクチャまたは P— VOPと、 Bピクチャま たは B—VOPとを用いて画像を符号化する。このように、第 1モード 10と第 2モード 12 は、 Bピクチャを生成するか否かの差異を有する。 Bピクチャを生成する第 2モード 12 の場合、第 1モード 10よりデータ圧縮率や画質が高いものの、符号化処理による負 荷は大きい。高解像度撮影時には、 Bピクチャを生成する双方向符号化の処理に必 要な演算を実行しきれなくなる場合がある。そこで、本実施例においては、参照モー ドとして高解像度撮影時には Bピクチャを生成しない第 1モード 10が選択される。
[0040] 例えば MPEG4方式の場合、第 1モード 10では、 B— VOPを生成しない MPEG4— SP (Simple Profile)を用いてもよぐ第 2モード 12では、 B— VOPを生成する MPEG4 -ASP (Advanced Simple Profile)を用いてもよレ、。なお、以下「Iピクチャ」 ピクチャ」 「8ピクチャ」と記載するときは、それぞれ「I一 VOP」「P— VOP」「B— VOP」も含むもの とする。また、「フレーム」と記載するときは 2枚のフィールドでフレームが構成される場 合のフィールドを示してもょレ、。
[0041] 図 2は、撮像装置の基本構造を示す機能ブロック図である。撮像装置 14は、動画 像を撮影可能なデジタルカメラである。撮像装置 14は、画像入力部 16、画像符号化 装置 18、制御部 20、表示部 21、および記録部 22を備える。画像入力部 16は、被写 体の画像を光学的に取得して電気的な画像信号に変換し、画像符号化装置 18へ 送る。画像符号化装置 18は、画像入力部 16から受け取った画像信号を符号化して 制御部 20へ送る。制御部 20は、画像符号化装置 18により符号化された画像を記録 部 22へ送るとともに、ユーザの指示に基づいて表示部 21へ送る。表示部 21は、制 御部 20から送られた画像を液晶画面に表示させる。記録部 22は、制御部 20から受 け取った画像を、記録部 22に装着された記録媒体 23へ格納する。記録媒体 23は、 例えばカードタイプの小型ハードディスクや不揮発性メモリである。
[0042] 図 3は、画像符号ィヒ装置の詳細な構成を示す機能ブロック図である。画像符号ィ匕 装置 18は、動きベクトル検出回路 24、動き補償回路 26、フレームメモリ 28、符号ィ匕 回路 30、復号化回路 32、出力バッファ 34、符号量制御回路 36、および参照モード 選択回路 38を含む。
[0043] 画像入力部 16から入力された画像(以下、「現フレーム」という)は、動きベクトル検 出回路 24に送られる。動きベクトル検出回路 24は、あら力じめフレームメモリ 28に格 納されて参照の対象となる画像(以下、「参照フレーム」という)と現フレームとの間で 動きべクトノレを検出する。動き補償回路 26は、符号量制御回路 36から量子化に用い る量子化ステップの値を取得し、その量子化の係数とマクロブロックの参照モードを 決定する。動きべ外ル検出回路 24により検出された動きベクトルと、動き補償回路 2 6により決定された量子化係数およびマクロブロック参照モードが、符号化回路 30へ 送られる。また、動き補償回路 26は、マクロブロックについての参照値と実際の値と の差分を参照誤差として符号化回路 30に送る。
[0044] 符号化回路 30は、参照誤差を量子化係数を用いて符号化して出力バッファ 34へ 送る。符号化回路 30は、量子化した参照誤差と量子化係数を復号化回路 32へ送る 。複号化回路 32は、量子化された参照誤差を量子化係数に基づいて復号し、復号 した参照誤差と動き補償回路 26による参照値との和を復号画像としてフレームメモリ 28に送る。この復号画像は、後続の画像の符号化処理において参照される場合に、 参照フレームとして動きべクトノレ検出回路 24へ送られる。符号量制御回路 36は、出 力バッファ 34の蓄積量の状態を取得し、その蓄積量の状態に応じて次の量子化に 用いる量子化ステップの値を生成する。
[0045] 参照モード選択回路 38は、撮像装置 14における画像符号化の実行環境、ここで は撮影画像の解像度設定に応じて、フレーム間符号化として双方向符号ィヒを用いる か否かを決定する。すなわち、参照モード選択回路 38は、フレーム内符号化、順方 向符号化、および双方向符号化の中からフレームの参照モードを選択し、画像符号 化部 18を構成する各回路に対してフレーム参照モードを示す情報を送る。双方向符 号化を用いない場合、参照モード選択回路 38はフレーム参照モードを示す情報とし て、グローバル動き補償を用いないことを内容とする情報を符号化回路 30に送る。双 方向符号化を用いる場合、参照モード選択回路 38はフレーム参照モードを示す情 報として、グローバル動き補償を用いることを内容とする情報を符号化回路 30に送る 。符号化回路 30は、グローバル動き補償を用いることを内容とする情報を取得した場 合、順方向符号化モードにおける動きベクトルで、縦方向のベクトルがゼロ、横方向 のベクトルがゼロのものについてはグローバル動きベクトルとして符号化する。
[0046] なお、参照モード選択回路 38は、符号処理化の実行環境を示すパラメータに基づ いて参照モードを判定するための LSIで構成されてもよいし、そうした判定に用いら れる情報が格納されたシステムレジスタと CPUの組合せで構成されてもよい。
[0047] 図 4は、解像度設定と参照モードの関係が格納されたテーブルを模式的に示す。
モードテーブル 40は、解像度設定欄 42と参照モード欄 44を有する。本実施例にお ける参照モード選択回路 38は、画像符号化の実行環境として解像度設定がどのモ ードに設定されてレ、るかに応じて参照モードを選択する。解像度設定がどのモードに 設定されているかを示す情報は、制御部 20から取得する。
[0048] 画像の解像度設定としては、比較的低解像度である 320 X 240ドット力 S設定される メールモード 46と、標準的な解像度である 640 X 480ドットが設定される標準モード 4 8と、比較的高解像度である 1280 X 720ドットが設定される HDモード 50とが解像度 設定欄 42に定められている。参照モードとしては、メールモード 46および標準モード 48との対応で第 2モード 12が定められ、 HDモード 50との対応で第 1モード 10が定 められている。すなわち、メールモード 46と標準モード 48では、圧縮率および画質の 高さを優先して第 2モード 12を用いる。一方、 HDモード 50ではドット数の多さから B ピクチャを生成するときの双方向符号ィ匕による演算処理の負荷が過大となるため、処 理の負荷が比較的小さい第 1モード 10を用いる。これにより、符号化処理の実行環 境に応じて演算処理しきれなくなる事態が回避され、画像符号ィ匕部 18はどの解像度 設定においても適切な処理時間にて符号ィヒ処理を実行することができる。
[0049] (実施例 2)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像のフレームレート設定に応じて画像符号化の参照モードを選択する 点で実施例 1と異なる。具体的には、高フレームレート撮影時には、圧縮率と画質の 高さを優先して双方向符号化を用いる参照モードを選択する。一方、フレームレート が低すぎる場合、前後のフレームとの間隔が広すぎて動きベクトルが検出できない場 合があるので、双方向参照によって却って画質の低下を招くおそれがある。そこで、 低フレームレート時には、双方向符号化を用いない参照モードを選択する。ここで、 単一の参照モードしか使用しない構成とした場合、参照モードの選択は低フレームレ ート撮影時に合わせて設計せざるを得ず、高フレームレート撮影時まで圧縮率や画 質の低下を招いてしまう。本実施例においては、少なくとも高フレームレート時には高 レ、圧縮率と画質を実現することができる。
[0050] 図 5は、画像のフレームレート設定と参照モードの関係が格納されたテーブルを模 式的に示す。モードテーブル 60は、フレームレート設定欄 62と参照モード欄 64を有 する。本実施例における参照モード選択回路 38は、画像符号化の実行環境としてフ レームレート設定がどのモードに設定されているかに応じて参照モードを選択する。 フレームレート設定がどのモードに設定されているかを示す情報は、制御部 20から 取得する。
[0051] 画像のフレームレート設定としては、比較的低フレームレートである lOfpsモード 66 と、中程度のフレームレートである 15fpsモード 68と、標準的な高フレームレートであ る 30fpsモード 70とがフレームレート設定欄 62に定められている。参照モードとして は、 lOfpsモード 66および 15fpsモード 68との対応で第 1モード 10が定められ、 30f psモード 70との対応で第 2モード 12が定められている。すなわち、 30fpsモード 70で は圧縮率および画質の高さを優先して第 2モード 12を選択する。一方、 lOfpsモード 66や 15fpsモード 68では、フレームレートが低すぎるので、前後のフレームとの間で 動きべタトノレが検出できなくなる事態を回避するために双方向符号化を用いない第 1 モード 10を選択する。これにより、画像符号ィ匕部 18はどのフレームレート設定におい ても適切な画質および圧縮率にて符号ィヒ処理を実行することができる。
[0052] (実施例 3)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像の解像度設定に応じて画像符号化の参照モードを選択する点で実 施例 1と共通する。ただし、高解像度撮影時には、圧縮率と画質の高さを優先して双 方向符号化を用いる参照モードを選択するが、低解像度撮影時に双方向符号化を 用いると圧縮率や画質が必要なレベル以上にまで高くなつてしまう可能性がある。そ こで、低解像度撮影時には処理速度や負荷低減を優先して双方向符号ィヒを用いな い参照モードを選択する。ここで、単一の参照モードしか使用しない構成とした場合 、参照モードは高解像度撮影時または低解像度撮影時のいずれかの環境に合わせ て設計せざるを得ず、環境に応じた圧縮率および画質の最適化が困難である。本実 施例においては、符号化処理の実行環境に適した圧縮率と画質を実現することがで きる。
[0053] 図 6は、画像の解像度設定と参照モードの関係が格納されたテーブルを模式的に 示す。モードテーブル 80は、解像度設定欄 82と参照モード欄 84を有する。本実施 例における参照モード選択回路 38は、画像符号化の実行環境として解像度設定が どのモードに設定されてレ、るかに応じて参照モードを選択する。解像度設定がどの モードに設定されているかを示す情報は、制御部 20から取得する。
[0054] 画像の解像度設定としては、実施例 1と同様にメールモード 86、標準モード 88、 H Dモード 50が解像度設定欄 82に定められている。参照モードとしては、メールモード 86との対応で第 1モード 10が定められ、標準モード 88および HDモード 90との対応 で第 2モード 12が定められている。すなわち、標準モード 88と HDモード 90では、圧 縮率および画質の高さを優先して第 2モード 12を用いる。一方、メールモード 86では 、撮影画像のドット数が元々少なぐ圧縮率や画質を高める要求が小さいので、処理 負荷を高めてまで双方向符号ィ匕を用レ、ることに仕様上の大きな利点は見出されない 。そこで、メールモード 86では処理負荷が比較的小さい第 1モード 10を用いる。これ により、画像符号化部 18はどの解像度設定においても適切な圧縮率および画質に て符号化処理を実行することができる。
[0055] (実施例 4)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像の画質または圧縮率の設定に応じて画像符号化の参照モードを選 択する点で実施例 1一 3と異なる。具体的には、高画質または高圧縮が設定された撮 影時には、圧縮率と画質の高さを優先して双方向符号化を用いる参照モードを選択 するが、低画質または低圧縮が設定された撮影時には処理速度や負荷低減を優先 して双方向符号化を用いない参照モードを選択する。ここで、単一の参照モードしか 使用しない構成とした場合、参照モードの選択は高画質 ·高圧縮撮影時または低画 質'低圧縮撮影時のいずれかの環境に合わせて設計せざるを得ず、環境に応じた圧 縮率や画質の最適化が困難である。本実施例においては、符号化処理の実行環境 に適した圧縮率と画質を実現することができる。
[0056] 図 7は、画像の画質および圧縮率の設定と参照モードの関係が格納されたテープ ルを模式的に示す。モードテーブル 100は、画質モード設定欄 102と参照モード欄 1 04を有する。本実施例における参照モード選択回路 38は、画像符号化の実行環境 として画質および圧縮率の設定がどのモードに設定されているかに応じて参照モー ドを選択する。画質および圧縮率の設定がどのモードに設定されてレ、るかを示す情 報は、制御部 20から取得する。
[0057] 画像の画質および圧縮率の設定としては、画質および圧縮率が比較的低い通常 モード 106と、画質および圧縮率が比較的高い HQモード 108が、画質モード設定 欄 102に定められている。参照モードとしては、通常モード 106との対応で第 1モード 10が定められ、 HQモード 108との対応で第 2モード 12が定められている。すなわち 、 HQモード 108では、圧縮率および画質の高さを優先して第 2モード 12を用いるが 、通常モード 106では、処理負荷を上げてまで双方向符号ィ匕を用いることに仕様上 の大きな利点は見出されないので第 1モード 10を用いる。これにより、画像符号化部 18はどの画質および圧縮率の設定においても最適な符号化処理を実行することが できる。
[0058] (実施例 5)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像の特性に応じて画像符号化の参照モードを選択する点で実施例 1一 4と異なる。具体的には、通常モード撮影時には、圧縮率と画質の高さを優先して双 方向符号化を用いる参照モードを選択するが、スポーツモード撮影時には被写体の 動きが大きすぎて動きベクトルが検出されない可能性があるので、双方向符号ィ匕を 用いない参照モードを選択する。ここで、単一の参照モードしか使用しない構成とし た場合、参照モードの選択は通常モード撮影時またはスポーツモード撮影時のレ、ず れかの環境に合わせて設計せざるを得ず、環境に応じた圧縮率や画質の最適化が 困難である。本実施例においては、符号化処理の実行環境に適した圧縮率と画質を 実現すること力できる。
[0059] 図 8は、撮影モード設定と参照モードの関係が格納されたテーブルを模式的に示 す。モードテーブル 110は、撮影モード設定欄 112と参照モード欄 114を有する。本 実施例における参照モード選択回路 38は、画像符号化の実行環境として撮影モー ド設定がどのモードに設定されているかに応じて参照モードを選択する。撮影モード 設定がどのモードに設定されているかを示す情報は、制御部 20から取得する。
[0060] 撮影モードの設定としては、通常モード 116とスポーツモード 118が撮影モード設 定欄 112に定められている。参照モードとしては、通常モード 116との対応で第 2モ ード 12が定められ、スポーツモード 118との対応で第 1モード 10が定められている。 すなわち、通常モード 116では、圧縮率および画質の高さを優先して第 2モード 12を 選択する。一方、スポーツモード 118では、被写体の動きが大きすぎるために動きべ 外ルが検出されない場合に双方向符号化を用いると却って画質の低下を招くおそ れがある。そこで、スポーツモード 118では双方向符号ィ匕を用いない第 1モード 10を 選択する。これにより、画像符号化部 18はどの撮影モードにおいても最適な符号化 処理を実行することができる。
[0061] (実施例 6)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像を保存する記録媒体の空き容量に応じて画像符号化の参照モードを 選択する点で実施例 1一 5と異なる。具体的には、記録媒体の空き容量が所定量より 少なければ、圧縮率が比較的高いモードである双方向符号化を用いる参照モードを 選択するが、記録媒体の空き容量が所定量より多ければ比較的圧縮率の低いモー ドである双方向符号化を用いない参照モードを選択する。ここで、単一の参照モード しか使用しない構成とした場合、参照モードは記録媒体の空き容量が所定値より多 レ、場合と少なレ、場合のレ、ずれかの環境に合わせて設計せざるを得ず、環境に応じた 圧縮率の最適化が困難である。本実施例においては、符号化処理の実行環境に適 した圧縮率を実現することができる。
[0062] 図 9は、記録媒体の空き容量と参照モードの関係が格納されたテーブルを模式的 に示す。モードテーブル 120は、空き容量欄 122と参照モード欄 124を有する。本実 施例における参照モード選択回路 38は、画像符号化の実行環境として記録媒体の 空き容量がどの程度かに応じて参照モードを選択する。記録媒体の空き容量を示す 情報は、記録部 22から取得する。
[0063] 記録媒体の空き容量としては、空き容量が 50%以上である第 1状態 126と、空き容 量が 50%未満である第 2状態 128が空き容量欄 122に定められている。参照モード としては、第 1状態 126との対応で第 1モード 10が定められ、第 2状態 128との対応 で第 2モード 12が定められている。すなわち、第 1状態 126では記録媒体の空き容 量が十分に残っているため、より圧縮率の低い第 1モード 10を選択する。一方、第 2 状態 128では記録媒体の空き容量が少ないので、圧縮率の高さを優先して第 2モー ド 12を選択する。これにより、画像符号ィ匕部 18は記録媒体の空き容量の如何に関わ らず最適な符号化処理を実行することができる。
[0064] (実施例 7)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、撮影画像を保存する記録媒体の種類に応じて画像符号化の参照モードを選 択する点で実施例 1一 6と異なる。具体的には、記録媒体へのデータ転送速度であ るビットレートの高低が記録媒体の種類によって異なるので、高ビットレートの記録媒 体が装着されているときは圧縮率が比較的低いモードである双方向符号化を用いな い参照モードを選択し、低ビットレートの記録媒体が装着されているときは圧縮率が 比較的高いモードである双方向符号ィ匕を用いる参照モードを選択する。ここで、単一 の参照モードしか使用しない構成とした場合、参照モードは高ビットレートまたは低ビ ットレートのレ、ずれかの記録媒体に合わせて設計せざるを得ず、環境に応じた圧縮 率の最適化が困難である。本実施例においては、符号化処理の実行環境に適した 圧縮率を実現することができる。
[0065] 図 10は、記録媒体の空き容量と参照モードの関係が格納されたテーブルを模式的 に示す。モードテーブル 130は、記録媒体の種類欄 132と参照モード欄 134を有す る。本実施例における参照モード選択回路 38は、画像符号化の実行環境として記 録媒体の種類に応じて参照モードを選択する。記録媒体の種類を示す情報は、記 録部 22から取得する。
[0066] 記録媒体の種類としては、高ビットレートである小型ハードディスク 136と、低ビット レートであるメモリカード 138と、高ビットレートである内部メモリ 140が記録媒体の種 類欄 132に定められている。参照モードとしては、小型ハードディスク 136および内 部メモリ 140との対応で第 1モード 10が定められ、メモリカード 138との対応で第 2モ ード 12が定められている。すなわち、小型ハードディスク 136および内部メモリ 140の 場合は高ビットレートであるため圧縮率が低くデータサイズが比較的大きい第 1モー ド 10を選択する。一方、メモリカード 138の場合は低ビットレートであるため、圧縮率 が高くデータサイズが比較的小さい第 2モード 12を選択する。これにより、画像符号 化部 18は記録媒体の種類に関わらず最適な符号化処理を実行することができる。
[0067] (実施例 8)
本実施例における画像符号化装置および撮像装置は、符号化処理の実行環境と して、特殊再生に対応した撮影モードか否かに応じて画像符号化の参照モードを選 択する点で実施例 1一 7と異なる。具体的には、 2倍速再生のような特殊再生に対応 した撮影モードで撮影する場合、各フレームを Iピクチャ、 Bピクチャ、 Pピクチャ、 Bピ クチャという順序で符号ィ匕し、 1枚おきに Bピクチャが入る構成とすることができる。こ の場合、再生時に Bピクチャをスキップするだけで 2倍速再生を実現できるため、 Bピ クチャを生成する双方向符号化を用いれば仕様上大きな利点となる。一方、 2倍速 再生等の特殊再生に対応しない撮影モードの場合、 Bピクチャを生成することに仕様 上の大きな利点は見出されないので、第 1モード 10を選択する。ここで、単一の参照 モードしか使用しない構成とした場合、参照モードの選択は特殊再生へ対応する撮 影と対応しない撮影のいずれかに合わせて設計せざるを得ず、環境に応じた符号化 方式の最適化が困難である。本実施例においては、符号化処理の実行環境に適し た符号化方式を実現することができる。
[0068] 図 11は、撮影モードと参照モードの関係が格納されたテーブルを模式的に示す。
モードテーブル 150は、撮影モード欄 152と参照モード欄 154を有する。本実施例に おける参照モード選択回路 38は、画像符号化の実行環境として特殊再生へ対応し た撮影モードか否かに応じて参照モードを選択する。
[0069] 撮影モードの種類としては、 2倍速再生等の特殊再生に対応した撮影モード 156と 、特殊再生に対応していない撮影モード 158が撮影モード欄 152に定められている 。参照モードとしては、特殊再生に対応した撮影モード 156との対応で第 2モード 12 が定められ、特殊再生に対応していない撮影モード 158との対応で第 1モード 10が 定められている。これにより、画像符号化部 18は撮影モードに応じた最適な符号化 処理を実行することができる。
[0070] 各実施例においては、符号化処理の実行環境として、解像度設定、フレームレート 設定、画質設定等の各パラメータに応じて参照モードを選択する構成を説明した。変 形例においては、符号ィ匕処理の実行環境における他のパラメータとして、画像を通 信で転送するときの回線速度、回線の混雑度、転送先の処理能力等に応じて参照 モードを選択してもよい。このとき、回線速度が高い場合、回線の混雑度が小さい場 合、転送先の処理能力が高い場合には、圧縮率が小さい第 1モード 10を選択し、こ れら以外の場合に第 2モード 12を選択する構成としてもよい。
[0071] 別の変形例においては、符号ィ匕処理の実行環境における他のパラメータとして、撮 像装置 14の消費電力の大きさや電池の残り容量に応じて参照モードを選択してもよ レ、。このとき、消費電力が高い場合、電池の残量が少ない場合には、より負荷の小さ い第 1モード 10を選択し、これら以外の場合に第 2モード 12を選択する構成としても よい。
[0072] 各実施例および各変形例において、参照モード選択回路 38が参照する符号化処 理の実行環境に関するパラメータを種々例示した。さらなる変形例としては、これら種 々のパラメータのうち少なくとも 2つ以上に応じて参照モードを選択してもよい。この場 合、各パラメータの組合せと、その組合せに最適な参照モードとが対応づけられてモ ードテーブルに格納されてレ、てもよレ、。
[0073] (第 2—第 5の実施の形態の背景技術)
動画の圧縮符号化方式の規格である MPEG (Motion Picture Experts Group) -4 では、符号化の対象となる対象画像のあるマクロブロックと、その対象画像を符号化 するときに参照される参照画像内の、そのマクロブロックに対応するマクロブロックと の差分データが実質的にゼロであった場合、参照画像のコピーであることを示す「 not_coded」フラグを用いて符号ィ匕することにより、符号量の削減を図る。また、対象画 像をフレーム間双方向予測モードにより符号ィヒする際に、その対象画像の後方参照 画像である P— VOP内のあるマクロブロック力 対象画像の前方参照画像内の対応 するマクロブロックのコピーであることを示す「not_coded」フラグを用いて符号化されて いる場合、対象画像内の対応するマクロブロックも前方参照画像内の対応するマクロ ブロックのコピーとする(例えば、特開平 8— 154250号公報参照)。これにより、大幅 に符号量を削減することができる。
[0074] 上述した技術を、具体例を用いて説明する。図 12は、動画像を MPEG— 4方式で 符号化する例を示す。図 1に示した例では、 3枚の連続画像 190a、 190b,及び 190 cを、それぞれ P— V〇P、 B— VOP、 P— V〇Pとして符号化する例を示す。まず、画像 1 90a力 S、直前の I一 V〇P又は P— VOPを参照画像としてフレーム間前方向予測モード で圧縮符号化される。次に、画像 190cが、直前の P— V〇Pである画像 190aを参照 画像として前方向予測モードで圧縮符号化される。このとき、マクロブロック 192cは、 前方参照画像 190aのマクロブロック 192aとほぼ同じ画像であり、差分が実質的にゼ 口であるので、「not_coded」フラグを用いて符号化される。復号時には、マクロブロック 192cには、マクロブロック 192aの画像がコピーされる。つづいて、画像 190b力 画 像 190aを前方参照画像として、画像 190cを後方参照画像として、双方向予測モー ドで圧縮符号化される。このとき、符号化の対象となっている画像 190bのマクロプロ ック 192bに対応する後方参照画像 190cのマクロブロック 192cは、「not_coded」フラ グを用いて符号化されているため、画像 190bのマクロブロック 192bも同様に「 not_coded」フラグを用いて符号化される。復号時には、マクロブロック 192bには、マク ロブロック 192aの画像がコピーされる。
[0075] (第 2—第 5の実施の形態が解決しょうとする課題)
このように、現行の MPEG— 4規格では、 B— V〇Pの後方参照画像である P— VOP に「not_coded」フラグを用いて符号化されたマクロブロックが存在する場合、そのマク ロブロックに対応する B— VOPのマクロブロックも、前方参照画像のコピーとして処理 され、参照画像との差分データは符号化されない。
[0076] し力 ながら、画像 190bが撮像された瞬間に、フラッシュが焚かれたり、物体が通 過したりして、画像 190bのマクロブロック 192b力 マクロブロック 192a及び 192cとは 異なる画像である場合もある。このような場合、復号時に、マクロブロック 192bにマク ロブロック 192aがコピーされる結果、図 13に示すように、画像が欠落して画質が劣化 する恐れがある。
[0077] 上述した状況に鑑み、第 2—第 5の実施の形態の目的は、動画像を符号化する際 の画質の劣化を低減する技術を提供することにある。
[0078] (第 2の実施の形態)
本実施の形態の画像符号化装置 18の構成は、図 3に示した第 1の実施の形態の 画像符号化装置 18の構成と同様である。本実施の形態の画像符号化装置 18は、 M PEG— 4に準拠した動画像の符号化を行う。 MPEG— 4の規格に則って符号化を行う 際、 B— V〇Pを含むプロファイルで符号化する場合に、 B— V〇Pが後方参照する P— V〇Pにおいて、「not_coded」フラグで符号化されたマクロブロックが存在すると、 B-V OPにおいても前方参照フレームのコピーとして扱われる。上述したように、これにより 、画像が欠落する場合があるので、本実施の形態では、 B— V〇Pにおいて前方参照 フレームのコピーとならないように、後方参照フレームの符号化方式を変更する。具 体的には、動きベクトルがゼロベクトルであっても、それをグローバル動きベクトルとし て扱うことにより、 B— VOPに差分データを持たせるようにする。これにより、現行の M PEG— 4の規格の範囲内で、上述した問題を回避し、圧縮画像の画質を向上させる こと力 Sできる。以下、主に、第 1の実施の形態と異なる点について説明する。
[0079] 参照モード選択回路 38は、フレーム内符号化、フレーム間前方向予測符号化、フ レーム間双方向予測符号化、の間でフレーム予測モードの切り替えを行レ、、他の回 路に対してフレームの予測モード情報を出力する。本実施の形態では、参照モード 選択回路 38は、まず、動画像を符号ィ匕するときのプロファイルを取得して、フレーム 間双方向予測モードを含むか否かを判定する。 MPEG— 4におけるプロファイルには 、 SP (Simple Profile)、 ASP (Advanced Simple Profile)などがあり、このうち、 SPは、 フレーム内符号化により符号ィ匕される I一 V〇Pとフレーム間前方向予測モードにより 符号化される P— VOPを組み合わせたプロファイルであり、フレーム間双方向予測モ ードにより符号化される B— VOPは含まなレ、。これに対し、 ASPは、 I一 VOP及び P— V OPに加え、 B— VOPを用いることが可能なプロファイルである。参照モード選択回路 38は、プロファイルや、動画像の種別などの情報から、フレーム間双方向予測モード を含むか否力を判断する。
[0080] 参照モード選択回路 38は、符号化の対象となる動画像が、フレーム間双方向予測 モードを含んで符号化されると判定したときには、フレーム間双方向予測モードで符 号化される B— VOPの後方参照フレームを符号化するときのフレーム予測モードを示 す情報として、グローバル動き補償を用いる旨の情報を出力する。このとき、符号化 回路 30は、フレーム間前方向予測モードにおける動きべタトノレがゼロべクトノレである ものを、グローバル動きベクトルがゼロべクトノレであるとして符号化する。または、符号 化回路 30は、フレーム間前方向予測モードにおける動きべタトノレがゼロべクトノレであ り、かつ、前方参照フレームとの差分データが実質的にゼロであるマクロブロック、す なわち、「not_coded」フラグで符号化されるマクロブロックを、グローバル動き補償を用 いて符号化する。より具体的には、符号化回路 30は、 B— VOPの後方参照フレーム を符号化するときに、そのフレームをグローバル動きべクトノレを含んだ S— VOPとして 符号化する。こうすることで、 B— VOPが後方参照するフレームのあるマクロブロックが 、前方参照するフレームの対応するマクロブロックと実質的に同一であった場合でも 、 B— VOPの対応するマクロブロックに参照画像との差分データを持たせることができ る。これにより、画像の欠落を防ぎ、復号画像の画質を向上させることができる。
[0081] 参照モード選択回路 38は、 B— V〇Pが後方参照する P— VOPのみを、グローバル 動きベクトル付きの S— V〇Pに切り替えてもよレ、し、 B— V〇Pが存在するプロファイル である場合は、全ての P— V〇Pをグローバル動きベクトル付きの S— V〇Pに切り替え てもよレ、。また、参照モード選択回路 38は、 P— V〇Pの符号化中に「not_coded」のマ クロブロックが出現したときに、その P—VOPをグローバル動きベクトル付きの S—VOP に切り替えてもよいし、「not_coded」のマクロブロックが所定数以上出現したときに、そ の P—VOPをグローバル動きベクトル付きの S—VOPに切り替えてもよレ、。
[0082] 図 14は、本実施の形態の画像符号化方法の手順を示すフローチャートである。ま ず、参照モード選択回路 38は、動画像を符号化する際のプロファイルを取得し、 B- VOPが出現するか否かを判断する(S10)。 B— VOPが出現しないプロファイルであ る場合は(S10の N)、画像符号化装置 18は、特殊な処理を行わず、通常の方式で 動画像を符号化する(S14)。 B— VOPが出現するプロファイルである場合は(S10の Y)、参照モード選択回路 38は、 P— VOPの符号ィ匕の際に、グローバル動きベクトル( 0, 0)を持たせた前方向予測モードを使用して符号ィヒする旨のフレーム予測モード 情報を出力する(S12)。符号化回路 30は、参照モード選択回路 38からの指示を受 けて、符号化対象画像を、グローバル動きベクトル(0, 0)を持たせた S— VOPとして 符号化する。
[0083] (第 3の実施の形態)
本実施の形態の画像符号化装置 18は、 MPEG— 4に準拠した動画像の符号化を 行う。 MPEG—4の規格に則って符号化を行う際、 B— VOPを含むプロファイルで符 号化する場合に、 B— V〇Pが後方参照する P— VOPにおいて、「not_coded」フラグで 符号化されたマクロブロックが存在すると、 B— V〇Pにおレ、ても前方参照フレームのコ ピーとして扱われる。上述したように、これにより、画像が欠落する場合があるので、 本実施の形態では、 B— V〇Pにおいて前方参照フレームのコピーとならないように、 後方参照フレームの符号化方式を変更する。具体的には、 P— VOPに「not_coded」フ ラグで符号ィ匕できるマクロブロックが存在しても、動きベクトルがゼロベクトルとなる動 きベクトル情報を付加して符号化する。そして、対応する B— VOPのマクロブロックに 動きべクトノレゃ予測誤差を含む符号化パラメータを持たせるようにする。これにより、 現行の MPEG— 4の規格の範囲内で、上述した問題を回避し、圧縮画像の画質を向 上させることができる。
[0084] 本実施の形態の画像符号化装置 18の構成は、図 3に示した第 1の実施の形態の 画像符号化装置 18と同様である。以下、主に、第 1の実施の形態と異なる点につい て説明する。
[0085] 本実施の形態では、参照モード選択回路 38は、まず、動画像を符号化するときの プロファイルを画像符号化装置 18全体を制御する制御回路(図示せず)などから取 得して、フレーム間双方向予測モードを含むか否かを判定する。プロフアイノレは、外 部からの指示によって制御回路で設定される他、画像符号化装置 18の使用環境に 応じて制御回路が自動的に設定するような構成であってもよい。 MPEG— 4における プロファイルには、 SP (Simple Profile)、 ASP (Advanced Simple Profile)などがあり、 このうち、 SPは、フレーム内符号化により符号ィ匕される I VOPとフレーム間前方向予 測モードにより符号化される P— VOPを組み合わせたプロファイルであり、フレーム間 双方向予測モードにより符号化される B— VOPは含まなレ、。これに対し、 ASPは、 I VOP及び P— VOPに加え、 B— VOPを用いることが可能なプロファイルである。参照 モード選択回路 38は、プロファイルや、動画像の種別などの情報から、フレーム間双 方向予測モードを含むか否かを判断する。
[0086] 参照モード選択回路 38は、符号化の対象となる動画像が、フレーム間前方予測モ ードとフレーム間双方向予測モードを含んで符号化されると判定したときには、フレ ーム間前方予測モードで符号ィ匕される P— V〇Pにおレ、て、 P— V〇Pを構成する或る マクロブロック力 S、前方参照フレーム中に存在し P— VOPのマクロブロックと同じ位置 のマクロブロックと実質的に同一であると判断された場合、「not_COded」フラグを付カロ する代わりに前方参照フレームとの間の動きべ外ル情報を符号ィ匕データ列中に付 カロして符号化する旨の情報を出力する。符号化回路 30は、この情報を受けて、「 not_coded」フラグで符号化できるマクロブロックを、「not_coded」フラグを用いずに、ゼ 口ベクトルである動きベクトル情報を付カ卩して符号ィ匕する。これにより、 B— VOPが後 方参照するフレームの或るマクロブロック力 前方参照するフレームの対応するマクロ ブロックと実質的に同一であった場合でも、 B— V〇Pの対応するマクロブロックに参照 画像との間の動きベクトル情報や予測誤差を含む符号化パラメータを持たせることが できる。したがって、画像の欠落を防ぎ、復号画像の画質を向上させることができる。
[0087] 参照モード選択回路 38は、 B— V〇Pが後方参照する P—VOPのみで、「not_coded」 フラグを用いて符号化できるブロックを、動きベクトル情報を付加して符号化するよう 切り替えてもよいし、 B— VOPが存在するプロファイルである場合は、全ての P— V〇P で、「not_coded」フラグを用いて符号化できるブロックを、動きベクトル情報を付加して 符号化するよう切り替えてもよい。また、参照モード選択回路 38は、「not_coded」のマ クロブロックが所定数以上出現したときに、その P— VOPで、「not_coded」フラグを用 レヽて符号ィ匕できるブロックを、動きベクトル情報を付加して符号化するように切り替え てもよい。
[0088] 図 15は、本実施の形態の画像符号化方法の手順を示すフローチャートである。ま ず、参照モード選択回路 38は、動画像を符号化する際のプロファイルを取得し、 B- VOPが出現するか否かを判断する(S20)。 B— VOPが出現しないプロファイルであ る場合は(S20の N)、画像符号化装置 18は、 P— VOPで符号ィ匕する際、「not_coded 」フラグの使用を許可する。 (S24)。 B— VOPが出現するプロファイルである場合は( S20の Y)、参照モード選択回路 38は、 P— VOPの符号化の際に、「not_coded」フラ グを用いて符号化できるブロックであっても、動きベクトルを(0, 0)である動きベクトル 情報を付加して符号ィ匕する旨のフレーム予測モード情報を出力する(S22)。符号化 回路 30は、参照モード選択回路 38からの指示を受けて、符号化対象画像を符号ィ匕 する。
[0089] (第 4の実施の形態)
B— V〇Pの後方参照フレームである P— VOPを符号化する方式として、第 2の実施 の形態では、グローバル動きベクトルを用いる方式を示した。また、第 3の実施の形 態では、「not_coded」フラグで符号化できるマクロブロックが存在しても、ゼロべクトノレ を示す動きベクトル情報を付加する方式を示した。し力しながら、このどちらの方式に おいても、「not_coded」フラグを用いて符号化する場合と比較して、符号量が増加す る。
[0090] すなわち、グローバル動きベクトルを用いる場合は、グローバル動きベクトルを用い るか否かを示すフラグ力 すべてのマクロブロックに付加されるため、その分だけ符号 量が増える。また、ゼロベクトルを示す動きべクトノレ情報を付加する場合、「not_coded 」フラグを用いて符号化できるマクロブロックすべてに対しても、動きベクトル情報を付 加するので、その分符号量が増加する。
[0091] したがって、グローバル動きベクトルを用いる場合とゼロベクトルを示す動きべクトノレ 情報を付加する場合とを比較した場合、 rnot_codedjフラグを用いて符号化可能なマ クロブロックの数が少なレ、場合は、ゼロベクトルを示す動きベクトル情報を付加する場 合のほうが符号量は少なくてすむ力 「not_coded」フラグを用いて符号化可能なマク ロブロックの数が多い場合は、グローバル動きべクトノレを用いる場合のほうが符号量 は少ない。
[0092] そこで、このような符号量の増加を最小限に抑制するために、本実施の形態の画像 符号化装置 18は、第 2の実施の形態のようなグローバル動きベクトルを用いて符号 化するモードと、第 3の実施の形態のようなゼロべクトノレを示す動きベクトル情報を付 カロして符号化するモードとを切り替えることができる。
[0093] 本実施の形態に係る画像符号化装置 18の全体構成は、第 1の実施の形態に係る 画像符号化装置 18と同一であり、符号化回路 30、出力バッファ 34及び参照モード 選択回路 38の動作が一部異なる。以下、本実施の形態に特徴的な点のみ説明し、 それ以外の説明は割愛する。
[0094] 参照モード選択回路 38は、符号化の対象となる動画像が、フレーム間前方予測モ ードとフレーム間双方向予測モードを含んで符号化されると判定したときには、フレ ーム間前方予測モードで符号ィ匕される P— V〇Pにおレ、て、 P— V〇Pを構成する或る マクロブロック力 S、前方参照フレーム中に存在し P— VOPのマクロブロックと同じ位置 のマクロブロックと実質的に同一であると判断された場合、「not_COded」フラグを付カロ する代わりに前方参照フレームとの間の動きべ外ル情報を符号ィ匕データ列中に付 カロして符号化する旨の情報を出力する。符号化回路 30は、この情報を受けて、「 not_coded」フラグで符号化できるマクロブロックを、「not_coded」フラグを用いずに、ゼ 口ベクトルである動きベクトル情報を付加して符号ィ匕し、出力バッファ 34に記憶させて おく。
[0095] 一方で符号化回路 30は、 B— V〇Pの後方参照フレームである P— V〇Pに対し、フレ ーム間前方向予測モードにおける動きベクトルがゼロベクトルであるものを、グローバ ル動きべタトノレがゼロベクトルであるとして符号化し、こちらも出力バッファ 34に記憶さ せておく。また、符号化回路 30は、 B— VOPの後方参照フレームである P— V〇Pを符 号化している時に、「not_coded」フラグで符号化可能なマクロブロックの数をカウントし ておき、その数を参照モード選択回路 38に通知する。
[0096] 参照モード選択回路 38は、符号化回路 30から通知された「not_coded」フラグで符 号化可能なマクロブロックの数力 予め定められた閾値以上になったときに、 B-VO Pの後方参照フレームである P— VOPを符号化するときの符号ィヒモードを示す情報と して、グローバル動き補償を用いる旨の情報に切り替える。この閾値は、予め内部で 決められた値であっても良いし、外部からユーザによって指定してもよい。
[0097] 符号化回路 30は、参照モード選択回路 38が出力する符号化モードがグローバル 動き補償を用いる旨の情報に切り替えられた場合、ゼロベクトルである動きベクトル情 報を付加して符号ィ匕する方法を中止する一方、フレーム間前方向予測モードにおけ る動きベクトルがゼロベクトルであるものを、グローバル動き補償を用いて符号化する 方法を継続し、この符号化データを出力バッファ 34に引き続き記憶させる。そして、 P 一 VOPの符号ィ匕が完了した後に、グローバル動きベクトルを用いて符号化した符号 化データ列を、出力バッファ 34から出力する。
[0098] 一方、「not_coded」フラグで符号化可能なマクロブロックの数力 S、予め定められた閾 値に達することなぐ B— V〇Pの後方参照フレームである P— VOPの符号化が完了し たとき、参照モード選択回路 38が出力する符号ィ匕モードは切り替わらず、ゼロべタト ルである動きベクトル情報を付加して符号ィ匕する方法が最後まで継続される。そして 、 P— VOPの符号化が完了した後に、ゼロベクトルである動きベクトル情報を付カ卩して 符号化した符号化データ列を、出力バッファ 34から出力する。 [0099] なお、参照モード選択回路 38は、 B— VOPが後方参照する P— VOPのみで、ゼロ ベクトルである動きベクトル情報を付加して符号ィ匕する力、若しくは、グローバル動き ベクトルを用いて符号化するようにしてもよいし、 B— VOPが存在するプロファイルで ある場合は、全ての P— V〇Pで、ゼロベクトルである動きベクトル情報を付カ卩して符号 化するか、若しくは、グローバル動きベクトルを用いて符号ィ匕するようにしてもよい。
[0100] 図 16は、本実施の形態の画像符号化方法の手順を示すフローチャートである。ま ず、参照モード選択回路 38は、動画像を符号化する際のプロファイルを取得し、 B- V〇Pが出現するか否かを判断する(S30)。 B— VOPが出現しないプロファイルであ る場合は(S30の N)、画像符号化装置 18は、 P— VOPで符号ィ匕する際、「not_coded 」フラグの使用を許可する。 (S38)。 B— V〇Pが出現するプロファイルである場合は( S30の Y)、参照モード選択回路 38は、 P_V〇Pの符号化の際に、「not_coded」フラ グを用いて符号ィ匕できるブロックの数が所定の数以上であるか否かを判断する(S32 )。所定の数未満の場合は(S32の N)、参照モード選択回路 38は、動きベクトルを( 0, 0)である動きベクトル情報を付加して符号化する旨のフレーム予測モード情報を 出力する(S34)。所定の数以上の場合は(S32の Y)、参照モード選択回路 38は、 P 一 VOPの符号ィ匕の際にグローバル動きベクトル(0, 0)を持たせた前方向予測モード を使用して符号ィ匕する旨のフレーム符号ィ匕モード情報を出力する(S36)。画像符号 化装置 18は、参照モード選択回路 38から出力されたフレーム符号ィ匕モード情報に 基づいた、符号化データ列を出力する。
[0101] 以上のように、本実施の形態に係る画像符号化装置 18は、以下のような効果を得 ること力 Sできる。
1) B— V〇Pの後方参照フレームである P— VOPを、グローバル動きベクトルを用い た符号化モード、もしくは、ゼロベクトルである動きベクトル情報を付加する符号化モ ードのどちらかのモードによって符号化するため、 B— VOPが後方参照するフレーム の或るマクロブロック力 前方参照するフレームの対応するマクロブロックと実質的に 同一であった場合でも、 B— V〇Pの対応するマクロブロックに参照画像との間の動き ベクトル情報や予測誤差を含む符号化パラメータを持たせることができる。したがって
、画像の欠落を防ぎ、復号画像の画質を向上させることができる。 [0102] 2) B— VOPの後方参照フレームである P— VOPを符号化する際、「not_coded」フラ グを用いて符号化可能なマクロブロックの数によって、その P— VOPの符号化モード を、グローバル動きベクトルを用いた符号化モード、もしくは、ゼロベクトルである動き ベクトル情報を付加する符号化モードのどちらかに切り替えることができる。これによ り、「not_coded」フラグを用いて符号ィ匕可能なマクロブロックの数によって、符号化効 率のよい符号化モードを選択することが可能になり、符号量の増大を最小限に抑え ること力 Sできる。
[0103] 本実施の形態において、参照モード選択回路 38は、「not_coded」のマクロブロック 数に対する 2つの閾値 TH1、TH2 (TH1 <TH2)を設けてもよレ、。この場合、「 not.codedjのマクロブロック数が TH1未満のときは、 P—VOPにおける「not_coded」フ ラグの使用を許可し、「not_coded」のマクロブロック数力 STH1以上 TH2未満のときは 、その P— V〇Pで、「not_coded」フラグを用いて符号化できるブロックを、動きベクトル 情報を付加して符号化するように切り替え、さらに「not_coded」のマクロブロック数が T H2以上のときは、グローバル動きベクトルを用いて符号ィ匕するように切り替えてもよ レ、。
[0104] また、本実施の形態において、 B— VOPの後方参照フレームを符号ィ匕する際、「 not_coded」フラグを用いて符号化できるマクロブロックを、グローバル動きベクトルを 用いて符号化するモードと、ゼロベクトルを表す動きベクトルを付加して符号化するモ ードの選択を、「not_COded」のマクロブロックの数で判断するだけでなぐ外部からも 行えるようにしてもよい。すなわち、画像符号化装置 18に入力部を設け、入力部を介 してユーザの指示によって選択してもよい。また、符号化データ列の送信先である復 号装置の仕様に合わせて選択してもよい。例えば、送信先の復号装置がグローバル 動き補償をサポートしてなレ、場合は、ゼロベクトルを表す動きベクトルを付加して符号 化するモードを選択できるようにしてもょレ、。
[0105] また、本実施の形態では、符号化回路 30は、「not_coded」フラグを用いて符号化で きるマクロブロックを、グローバル動きべクトノレを用いる符号する符号化とゼロべクトノレ を表す動きベクトルを付加する符号ィ匕を並列に行う方法を示したが、これに限らず、 符号化回路 30は、「not_coded」フラグを用いて符号化できるマクロブロックを、ゼロべ タトルを表す動きベクトルを付加する符号化だけを行って、出力バッファ 34に記憶さ せておいてもよい。この場合、符号化対象のフレームの符号ィヒが完了した時点で、参 照モード選択回路 38から出力されたフレーム符号化モード情報が、ゼロベクトルを表 す動きべクトノレを付加する符号ィ匕モードを表している場合は、出力バッファ 34に記憶 された符号化データ列をそのまま出力する。また、参照モード選択回路 38から出力 されたフレーム符号化モード情報力 S、グローバル動きベクトルを用いる符号ィ匕モード を表している場合は、出力バッファ 34に記憶された符号化データ列を、グローバル 動きべクトノレを用レ、た符号化データ列に変換して出力する。
[0106] また、本実施の形態では、符号化中のフレームに含まれる「not_coded」フラグを用 いて符号ィ匕できるマクロブロックの数によって、グローバル動きベクトルを用いた符号 化モードとゼロベクトルである動きベクトル情報を付カ卩する符号ィ匕モードとを切り替え た力 これに限らず、過去に符号化したフレームに含まれる「not_coded」フラグを用い て符号化できるマクロブロックの数によって切り替えてもよい。
[0107] (第 5の実施の形態)
本実施の形態では、「not_coded」フラグで符号化されたマクロブロックを後方参照す る B— VOPのマクロブロックを符号化する際、前方参照フレームのマクロブロックとの 差分が小さければ「not_coded」フラグを用いて符号ィ匕し、差分が大きければ、差分デ ータを符号化する。そして、前方参照フレームのマクロブロックのコピーとする力、参 照フレームとの差分データを復号するかを示すフラグ(以下、単に「判定フラグ」と呼 ぶ)を符号化データ列に挿入する。画像復号装置は、 B - VOPを復号する際に、判 定フラグを参照して、該当するマクロブロックを前方参照フレームのコピーとするか、 差分データを復号するかを判定し、判定フラグがコピーを許可することを示す値であ れば前方参照フレームから画像をコピーし、判定フラグがコピーを許可せず差分デ 一タを復号すべきことを示す値であれば差分データを復号して参照フレームの画像 に加える。これにより、符号量の増大を抑えつつ、上述した問題を回避し、圧縮画像 の画質を向上させることができる。
[0108] 図 17は、本実施の形態に係る画像符号化装置 18の構成を示す。本実施の形態の 画像符号化装置 18の構成は、図 3に示した第 1の実施の形態の画像符号化装置 18 の構成に加えて、符号化方法判定回路 240及び判定フラグ付カ卩回路 242を備える。 その他の構成及び動作は、第 1の実施の形態と同様である。以下、主に、第 1の実施 の形態と異なる点について説明する。
[0109] 符号化方法判定回路 240は、「not_coded」フラグを用いて符号ィ匕されたマクロブロ ックを後方参照する B— V〇Pのマクロブロックを符号化する際に、該当するマクロブロ ックを、前方参照フレーム中の対応するマクロブロックのコピーとして処理してよい力 否かを判定する。符号化方法判定回路 240は、動き補償回路 26から出力される、現 フレームと参照フレームの間の差分データを取得し、差分データの量が所定のしきい 値より小さい場合は、前方参照フレームのコピーとすることを許可し、大きい場合は、 符号化回路 30に差分データを符号化させる。符号化方法判定回路 240は、判定結 果を判定フラグ付加回路 242に伝達する。
[0110] 符号化方法判定回路 240は、符号化データ列に要求される符号量、復号画像の 画質、復号画像の用途、画像を記録する媒体の容量、画像を送受信する通信経路 の状況、などに応じて、前方参照フレームのコピーとするか否かを判定してもよい。こ のような判定基準は、画像符号化装置 18が搭載された機器からの制御情報として符 号化方法判定回路 240に供給されてもよい。例えば、復号画像の画質を優先する場 合は、差分データが小さい場合でも差分データを符号ィ匕して符号ィ匕データ列に含ま せ、前方参照フレームのコピーを禁止してもよい。また、画像を携帯電話などに記録 し、伝送する場合は、判定のしきい値を大きくし、できるだけ差分データを含ませない ようにして、符号量を抑えてもよい。
[0111] 判定フラグ付加回路 242は、符号化方法判定回路 240による判定結果を取得し、 符号化データストリームの所定位置に判定フラグを付加する。判定フラグは、 B-VO Pのマクロブロックごとに付加されてもよいし、 B-VOPごとに付加されてもよいし、 B- V〇Pが後方参照するフレームのマクロブロックごとに付加されてもよいし、 B— VOPが 後方参照するフレームごとに付加されてもよい。また、判定フラグは、 B-VOPが後方 参照するフレームの「not_coded」フラグを用いて符号化されたマクロブロックに付加さ れてもよいし、 B— V〇Pが後方参照するフレームのうち「not_coded」フラグを用いて符 号化されたマクロブロックを含むフレームに付加されてもよい。また、判定フラグは、 符号化データストリームのシーケンスヘッダに付加されてもよい。
[0112] 判定フラグ付カ卩回路 242は、 B— VOPごとに判定フラグを付加する場合、 B— VOP に含まれるマクロブロックのうち、前方参照フレームのコピーとして処理されるマクロブ ロックの数に基づいて、付加する判定フラグを決定してもよレ、。例えば、コピーとして 処理されるマクロブロックが半数を超える場合は、判定フラグとして、前方参照フレー ムのコピーを許可する値を付加し、その B— V〇Pに含まれるマクロブロックの全てが、 前方参照フレームのコピーとして処理されるようにしてもよい。同様に、判定フラグ付 加回路 242は、シーケンスヘッダに判定フラグを付加する場合、前方参照フレームの コピーとして処理されるマクロブロック又はフレームの数に応じて、判定フラグを決定 してもよい。
[0113] 判定フラグ付加回路 242は、符号化データ列に要求される符号量、復号画像の画 質、復号画像の用途、画像を記録する媒体の容量、画像を送受信する通信経路の 状況、などに応じて、判定フラグを付加する位置を決定してもよい。このような判定基 準は、画像符号ィ匕装置 18が搭載された機器力 の制御情報として符号化方法判定 回路 240に供給されてもよい。例えば、復号画像の画質を優先する場合は、判定フ ラグをマクロブロックごとに付加してもよい。また、符号量を抑えたい場合は、判定フラ グをフレームごとに又はシーケンスヘッダに付加してもよい。
[0114] 図 18から図 21は、本実施の形態に係る画像符号化装置 18により生成される符号 化データ列のデータ構造の例を示す。符号化データ列は、その所定位置に、フレー ム間双方向予測モードで符号ィ匕された第 1フレームのブロックを、第 1フレームが前 方参照する第 2フレームの所定ブロックのコピーとする力、第 1フレームのブロックと第 2フレームの所定ブロックとの差分データを復号するかを示す判定フラグを含む。
[0115] 図 18は、判定フラグをシーケンスヘッダに付加した例を示す。符号化データ列 300 は、 MPEG—4では「Video Object LayerJに対応し、シーケンスヘッダ 302と、複数の フレーム 310を含む。フレーム 310は、 MPEG—4では「Video Object Plane」に対応 し、フレームヘッダ 312と、複数のマクロブロック 320を含む。マクロブロック 320は、 MPEG—4では「Macroblock」に対応し、マクロブロックヘッダ 322と、動きベクトル及 び差分データを符号化した符号データ 324を含む。図 18の例では、シーケンスへッ ダ 302の所定位置に、符号化データ列 300のプロファイルの種別を示すデータ 304 が格納されている。そして、符号化データ列 300のプロファイルが B-VOPを利用可 能なプロファイルであり、かつ、符号化データ列 300に B— VOPが含まれる場合は、 判定フラグ 306がシーケンスヘッダ 302の所定位置に付加される。
[0116] 図 19は、判定フラグをフレームヘッダに付加した例を示す。図 19の例では、 B— V OP又は B— V〇Pが後方参照するフレームのフレームヘッダ 312に、 V〇Pの種類を 示すデータ 314と、この VOPが差分データを持つか否かを示すフラグ情報 316が格 納されている。そして、差分データを持つ場合は、判定フラグ 318がフレームヘッダ の所定位置に付加される。
[0117] 図 20は、判定フラグを、 B— V〇Pが後方参照するフレームのマクロブロックヘッダに 付加した例を示す。図 20の例では、 B— V〇Pが後方参照するフレーム、例えば P— V OPのマクロブロックヘッダ 322に、「not_coded」フラグ 326が格納されている。そして、 ッダ 322の所定位置、例えば「not_coded」フラグ 326の直後に付加される。
[0118] 図 21は、判定フラグを B— VOPのマクロブロックヘッダに付加した例を示す。図 21 の例では、 B— VOPが後方参照するフレームの対応するマクロブロックが「not_coded」 であった場合に、マクロブロックヘッダ 322の所定位置、例えば先頭に判定フラグ 13 0が付加される。
[0119] 以上のような構成により、 B— VOPが後方参照するフレームのあるマクロブロック力 前方参照するフレームの対応するマクロブロックとほぼ同一であり、「not_coded」フラ グで符号化された場合であっても、 B— VOPの対応するマクロブロックに参照画像と の差分データを持たせることができる。これにより、画像の欠落を防ぎ、復号画像の 画質を向上させることができる。また、 B— V〇Pのマクロブロックと前方参照フレームの マクロブロックとの差分が小さい場合には、「not_coded」フラグで符号化するので、符 号量を抑えることができる。
[0120] 図 22は、本発明の実施の形態に係る画像復号化装置 350の全体構成を示す。こ の画像復号化装置 350は、 MPEG - 4方式で圧縮符号化された符号化データ列を 格納するバッファ 362と、バッファ 362からデータを受け、動きベクトル等の可変長符 号を復号化する可変長復号化回路 364と、可変長復号化回路 364により得られた変 換係数を逆量子化して DCT係数に変換する逆量子化回路 366と、逆量子化回路 3 66で生成された DCT係数列を 8 X 8のブロック単位の DCT係数に戻して逆 DCTを 行い差分データを出力する逆 DCT回路 368と、動きベクトルに基づく参照アドレスと 差分データとをもとに、参照画像データから画像を復号して内部のメモリに保存した 後に、出力画像データを発生する動き補償部 376と、を含む。
[0121] 動き補償部 376は、画像データを格納するフレームメモリ 372と、動きベクトルをもと にフレームメモリ 372から参照画像データを読み出す動き補償回路 370と、参照画像 データと差分データとを加算して復号画像データをフレームメモリ 372に出力する加 算回路 374とを含む。フレームメモリ 372からは、出力画像データが出力される。
[0122] 複号化方法判定回路 380は、符号化データストリーム中の所定位置にある判定フ ラグを取得して、 B— V〇Pの復号方法を判定する。判定フラグの位置は、マクロブロッ クのヘッダ、フレームヘッダ、シーケンスヘッダなどであってもよいし、その他任意の 位置であってもよぐ画像符号化装置 18と画像復号化装置 350の間で共通の認識 力 Sあればよい。復号化方法判定回路 380は、判定フラグが、 B-VOPが後方参照す るマクロブロックが「not_coded」フラグで符号化されていたときに、 B— VOPのマクロブ ロックも前方参照フレームのコピーとして処理することを示す値であれば、動き補償回 路 370にコピーを行うよう伝達する。動き補償回路 370は、前方参照フレームのマク ロブロックをフレームメモリ 372から読み出し、 B— VOPのマクロブロックにコピーする。 復号化方法判定回路 380は、判定フラグが、コピーを許可せず差分データを復号す べきことを示す値であれば、逆量子化回路 366及び逆 DCT回路 368に差分データ を復号化させ、復号化された差分データを前方参照フレームのマクロブロックに加算 させて、 B— V〇Pのマクロブロックを得る。これにより、本実施の形態の画像符号化装 置 18により符号化された符号化データ列を適切に復号することができる。
[0123] 図 23は、本実施の形態の画像符号化方法の手順を示すフローチャートである。図 23は、画像符号化装置 18がフレーム間双方向予測モードで対象フレームを符号化 する手順を示している。まず、 B— V〇Pを符号化する際に、符号化方法判定回路 24 0力 符号化対象となるマクロブロック力 「not_coded」フラグで符号化されているマク ロブロックを後方参照してレ、るか否かを確認する(S 110)。後方参照フレームのマク ロブロックが「not_coded」でなければ(S110の N)、通常の符号化処理を行う。後方参 照フレームのマクロブロックが「not_coded」であれば(S 110の Y)、符号化方法判定回 路 240は、符号化対象となるマクロブロックも前方参照フレームのマクロブロックのコ ピーとするか否かを判定する(S 112)。符号化方法判定回路 240が、コピーとすると 判定したときは(S112の Y)、判定フラグ付カ卩回路 242が符号化データ列の所定位 置に、前方参照フレームのコピーを揷入することを示す判定フラグを付加する(S 114 )。符号化方法判定回路 240が、コピーではなく差分データを持たせると判定したとき は(S 112の N)、符号化回路 30が差分データを符号ィ匕し (S 116)、判定フラグ付カロ 回路 242が差分データを含むことを示す判定フラグを付加する(S 118)。
[0124] 図 24は、本実施の形態の画像復号化方法の手順を示すフローチャートである。図 24は、画像復号ィ匕装置 350がフレーム間双方向予測モードで符号ィ匕されたフレー ムを復号化する手順を示している。まず、復号化方法判定回路 380が、符号化デー タ列の所定位置に付加された判定フラグを取得し (S 130)、判定フラグの種別を確認 する(S 132)。判定フラグが、 B— VOPの後方参照フレームのマクロブロックが「 not_coded」であったときに B— VOPのマクロブロックも前方参照フレームのマクロブロ ックのコピーとすることを示す値であったときは(S132の Y)、復号ィ匕方法判定回路 3 80は、 B— VOPのマクロブロックに前方参照フレームのマクロブロックのコピーを挿入 するよう他の回路に指示する(S134)。判定フラグが、 B— VOPのマクロブロックが差 分データを含むことを示す値であったときは(S132の N)、復号ィ匕判定回路 380は、 差分データを復号して B— VOPのマクロブロックの画像を生成するよう他の回路に指 示する(S136)。
[0125] 以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それ らの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、また そうした変形例も本発明の範囲にあることは当業者に理解されるところである。
産業上の利用可能性
[0126] 本発明は、動画像を符号化する画像符号化装置に利用可能である。

Claims

請求の範囲
[1] 符号化の対象となる画像信号を、フレーム内符号化およびフレーム間符号ィ匕のうち 少なくともいずれかを用いた方式にて画像信号を符号化する符号化回路と、 前記フレーム間符号化の方式として、過去および未来のフレームを参照する双方 向符号化を用いる参照モードおよび前記双方向符号化を用いない参照モードのうち いずれかを、当該装置における符号ィヒの実行環境に応じて選択的に設定する参照 モード選択回路と、
を備えることを特徴とする画像符号化装置。
[2] 前記参照モード選択回路は、前記符号化の圧縮率の高低を基準として前記双方 向符号化を用いる参照モードおよび前記双方向符号化を用いない参照モードのうち いずれが当該装置における符号化の実行環境に適合するかに応じて前記参照モー ドを設定することを特徴とする請求項 1に記載の画像符号化装置。
[3] 前記参照モード選択回路は、前記符号化の処理により生ずる負荷の大小を基準と して前記双方向符号化を用いる参照モードおよび前記双方向符号ィヒを用いない参 照モードのうちいずれが当該装置における符号ィヒの実行環境に適合するかに応じて 前記参照モードを設定することを特徴とする請求項 1に記載の画像符号化装置。
[4] 前記参照モード選択回路は、前記画像信号について双方向符号化を実行する場 合における仕様上の利点の大小を基準として前記双方向符号化を用いる参照モー ドおよび前記双方向符号ィヒを用いない参照モードのうちいずれが当該装置における 符号化の実行環境に適合するかに応じて前記参照モードを設定することを特徴とす る請求項 1に記載の画像符号化装置。
[5] 前記符号化回路は、前記符号化の方式として MPEGに準拠した方式にて前記画 像信号を符号化するとともに、前記双方向符号化を用いる参照モードでは Iピクチャ、 Pピクチャ、および Bピクチャを用いて符号ィ匕し、前記双方向符号化を用いない参照 モードでは Iピクチャおよび Pピクチャを用いることを特徴とする請求項 1から 4のいず れかに記載の画像符号化装置。
[6] 被写体を撮像して画像信号を取得する画像入力部と、
前記取得された画像信号をフレーム内符号化およびフレーム間符号化のうち少な くともいずれ力を用いた方式にて符号ィ匕する符号化回路と、
前記符号化方式におけるフレーム間圧縮符号化として過去および未来のフレーム を参照する双方向フレーム間符号化を用いるモードと用いないモードのいずれかを、 当該装置における符号ィヒの実行環境に応じて選択的に設定する参照モード選択回 路と、
前記符号化により生成された符号化データを保存するデータ格納部と、 を備えることを特徴とする撮像装置。
[7] 動画像を符号化する際に、前記動画像を構成するフレームを符号化するときの予 測モードを示す情報を出力する予測モード選択部と、
前記予測モード選択部により出力された前記予測モードを示す情報に基づいて前 記フレームを符号化する符号化部と、を備え、
前記動画像がフレーム間双方向予測モードを含んで符号化されるときには、前記 予測モード選択部は、フレーム間双方向予測モードで符号化されるフレームの後方 参照フレームを符号ィ匕するときの予測モードを示す情報として、グローバル動き補償 を用いる旨の情報を出力することを特徴とする画像符号化装置。
[8] 前記予測モード選択部は、前記動画像を符号化するときのプロファイルを取得して 、前記プロファイルを参照することにより、フレーム間双方向予測モードを含むか否か を判定することを特徴とする請求項 7に記載の画像符号化装置。
[9] 前記符号化部は、前記予測モード選択部からグローバル動き補償を用いる旨の情 報が出力されたとき、フレーム間前方向予測モードにおける動きベクトルがゼロべタト ルであるものをグローバル動きベクトルとして符号化することを特徴とする請求項 7又 は 8に記載の画像符号化装置。
[10] 前記符号化部は、前記予測モード選択部からグローバル動き補償を用いる旨の情 報が出力されたとき、フレーム間前方向予測モードにおける動きベクトルがゼロべタト ルであり、かつ、参照フレームとの差分データが実質的にゼロであるものを、グローバ ル動き補償を用いて符号化することを特徴とする請求項 7又は 8に記載の画像符号 化装置。
[11] 前記予測モード選択部は、前記フレーム間双方向予測モードで符号化されるフレ ームの後方参照フレームが Pフレームであった場合に、そのフレームを符号化すると きの予測モードを示す情報として、 Pフレームに代えて、グローバル動きベクトルを含 む Sフレームとして符号化する旨の情報を出力することを特徴とする請求項 7から 10 のレ、ずれかに記載の画像符号化装置。
[12] 前記予測モード選択部は、 Pフレームとして符号化されるべきであった全てのフレ ームについて、そのフレームを符号ィ匕するときの予測モードを示す情報として、 Pフレ ームに代えて、グローバル動きベクトルを含む Sフレームとして符号化する旨の情報 を出力することを特徴とする請求項 7から 11のいずれかに記載の画像符号ィ匕装置。
[13] 動画像を符号化する際に、前記動画像を構成するフレームを符号化するときの予 測モードを示す情報を出力するステップと、
前記予測モードを示す情報に基づいて前記フレームを符号化するステップと、を含 み、
前記動画像がフレーム間双方向予測モードを含んで符号化されるときには、前記 出力するステップは、フレーム間双方向予測モードで符号ィ匕されるフレームの後方 参照フレームを符号ィ匕するときの予測モードを示す情報として、グローバル動き補償 を用いる旨の情報を出力することを特徴とする画像符号化方法。
[14] 動画像を符号化する際に、前記動画像を構成するフレーム毎に、フレーム内符号 化モード、フレーム間一方向予測符号ィヒモード、フレーム間双方向予測符号化モー ドのいずれかのモードに基づいて符号化して、前記動画像の符号化データ列を生成 する画像符号化装置において、
前記動画像がフレーム間一方向予測符号化モードとフレーム間双方向予測符号 化モードを含んで符号化されるときに、フレーム間一方向予測符号化モードで符号 化されるフレームにおいて、当該フレームを構成する或るブロック力 予測の基になる 参照フレーム中に存在する前記或るブロックと同じ位置のブロックと実質的に同一で あると判断された場合、その旨を示すフラグの代わりに前記参照フレームとの間の動 きべクトノレ情報をそのブロックの符号ィヒデータ列中に付加して符号化することを特徴 とする画像符号化装置。
[15] 前記フレーム間一方向予測符号化モードと前記参照フレームの間に存在するフレ ームをフレーム間双方向予測符号ィ匕モードにて符号ィ匕する時に、前記動きべクトノレ 情報が付加されたブロックと同じ位置のブロックについても符号化を行い、符号化パ ラメータを符号化データ列中に付加することを特徴とする請求項 14に記載の画像符 号化装置。
[16] 前記フレーム間一方向予測符号化モードで符号ィ匕されたフレームは、前記フレー ム間双方向予測符号化モードで符号化されるフレームの参照フレームであることを特 徴とする請求項 14又は 15に記載の画像符号化装置。
[17] 前記動きベクトル情報はゼロベクトルとして符号化することを特徴とする請求項 14か ら 16のいずれかに記載の画像符号化装置。
[18] 動画像を符号化する際に、前記動画像を構成するフレーム毎に、このフレームを符 号化するときの符号化モードを示す情報を出力する符号化モード制御部と、 前記符号化モード制御部により出力された前記符号化モードを示す情報に基づい て前記フレームを符号化する符号化部と、を備え、
前記符号化部は、フレーム間双方向予測モードで符号化されるフレームの後方参 照フレームを符号ィ匕するとき、このフレームを構成するブロック毎に、予測の基になる 参照フレーム中に存在する前記ブロックと同じ位置のブロックと実質的に同一である か否かを判断して、この実質的に同一であると判断されたブロックの数をカウントし、 前記符号化モード制御部は、フレーム間双方向予測モードで符号化されるフレー ムの後方参照フレームを符号化するときの符号化モードを示す情報として、前記実 質的に同一であると判断されたブロックの数が所定の閾値以上であった場合、前記 実質的に同一であると判断されたブロックをグローバル動き補償を用いて符号化する 旨の情報を出力し、前記実質的に同一であると判断されたブロックの数が前記所定 の閾値未満であった場合、前記実質的に同一であると判断されたブロックに対して前 記参照フレームとの間の動きベクトル情報をそのブロックの符号ィ匕データ列中に付加 して符号化する旨の情報を出力することを特徴とする画像符号化装置。
[19] 動画像を符号化して符号化データ列を生成する画像符号化装置であって、
前記動画像を構成するフレームを符号化する符号ィヒ部と、
前記符号化部がフレーム間双方向予測モードにより対象フレームを符号化するとき に、前記対象フレームが後方参照する後方参照フレームのあるブロックが、前記後方 参照フレームが前方参照する前方参照フレームの所定ブロックのコピーであることを 示すフラグを用いて符号化されている場合、前記後方参照フレームのブロックに対応 する前記対象フレーム中のブロックを、前記前方参照フレームの所定ブロックのコピ 一とするか否かを判定する符号化方法判定部と、
前記符号化方法判定部の判定結果を示すフラグ情報を符号化データ列中に付加 する付加部と、
を備えることを特徴とする画像符号化装置。
[20] 前記符号化方法判定部が、前記対象フレームのブロックを前記前方参照フレーム の所定ブロックのコピーとしないと判定したときに、前記符号化部は、前記前方参照 フレームの所定ブロックと前記対象フレームのブロックとの差分データを符号化するこ とを特徴とする請求項 19に記載の画像符号化装置。
[21] 前記符号化方法判定部は、前記対象フレームのブロックと前記前方参照フレーム の所定ブロックとの差分データに基づいて判定を行うことを特徴とする請求項 19又は
20に記載の画像符号化装置。
[22] 前記付加部は、前記対象フレーム又は前記対象フレームのブロックの符号化デー タに前記フラグ情報を付加することを特徴とする請求項 19から 21のいずれかに記載 の画像符号化装置。
[23] 前記付加部は、前記後方参照フレーム又は前記後方参照フレームのブロックの符 号化データに前記フラグ情報を付加することを特徴とする請求項 19から 21のいずれ かに記載の画像符号化装置。
[24] 前記付加部は、前記符号ィヒデータ列のシーケンスヘッダに前記フラグ情報を付カロ することを特徴とする請求項 19から 21のいずれかに記載の画像符号化装置。
[25] 動画像を符号化した符号化データ列を取得して復号する復号化部と、
前記符号化データ列中の所定位置に付加され、フレーム間双方向予測モードで符 号化された対象フレームのブロックを、前記対象フレームが前方参照する前方参照 フレームの所定ブロックのコピーとするか否力、を示すフラグ情報を取得し、復号の方 法を判定する複号化方法判定部と、を備え、 前記復号化部は、前記復号化方法判定部が前記対象フレームのブロックを前記前 方参照フレームの所定ブロックのコピーとすると判定をしたときには、前記対象フレー ムのブロックに前記前方参照フレームの所定ブロックをコピーし、前記復号化方法判 定部が前記対象フレームのブロックを前記前方参照フレームの所定ブロックのコピー としないと判定したときには、前記対象フレームのブロックと前記前方参照フレームの 所定ブロックとの差分データを復号することを特徴とする画像複号化装置。
[26] 動画像を符号化して符号化データ列を生成する画像符号化方法であって、
前記動画像を構成するフレームを符号化するステップと、
前記符号化するステップがフレーム間双方向予測モードにより対象フレームを符号 化するときに、前記対象フレームが後方参照する後方参照フレームのあるブロックが 、前記後方参照フレームが前方参照する前方参照フレームの所定ブロックのコピー であることを示すフラグを用いて符号化されている場合、前記後方参照フレームのブ ロックに対応する前記対象フレーム中のブロックを、前記前方参照フレームの所定ブ ロックのコピーとするか否かを判定するステップと、
判定結果を示すフラグ情報を符号化データ列中に付加するステップと、 を含むことを特徴とする画像符号化方法。
[27] 動画像を符号化した符号化データ列を取得して復号するステップと、
前記符号化データ列中の所定位置に付加され、フレーム間双方向予測モードで符 号化された対象フレームのブロックを、前記対象フレームが前方参照する前方参照 フレームの所定ブロックのコピーとするか否力を示すフラグ情報を取得し、復号の方 法を判定するステップと、を含み、
前記復号するステップは、前記判定するステップにおレ、て前記対象フレームのブロ ックを前記前方参照フレームの所定ブロックのコピーとすると判定をしたときには、前 記対象フレームのブロックに前記前方参照フレームの所定ブロックをコピーし、前記 判定するステップにおいて前記対象フレームのブロックを前記前方参照フレームの 所定ブロックのコピーとしないと判定したときには、前記対象フレームのブロックと前 記前方参照フレームの所定ブロックとの差分データを復号する
ことを特徴とする画像復号ィヒ方法。 動画像を符号化した符号化データ列のデータ構造であって、 前記符号化データ列の所定位置に、フレーム間双方向予測モードで符号化された 第 1フレームのブロックを、前記第 1フレームが前方参照する第 2フレームの所定プロ ックのコピーとする力、、前記第 1フレームのブロックと前記第 2フレームの所定ブロック との差分データを復号するかを示すフラグ情報を含む
ことを特徴とするデータ構造。
PCT/JP2005/001137 2004-02-09 2005-01-27 画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置 WO2005076629A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005517655A JPWO2005076629A1 (ja) 2004-02-09 2005-01-27 画像符号化装置及び撮像装置
US10/588,791 US20070291131A1 (en) 2004-02-09 2005-01-27 Apparatus and Method for Controlling Image Coding Mode

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
JP2004032366 2004-02-09
JP2004-032366 2004-02-09
JP2004046399 2004-02-23
JP2004046400 2004-02-23
JP2004-046400 2004-02-23
JP2004-046399 2004-02-23
JP2004103678 2004-03-31
JP2004-103678 2004-03-31
JP2004369604 2004-12-21
JP2004-369604 2004-12-21

Publications (1)

Publication Number Publication Date
WO2005076629A1 true WO2005076629A1 (ja) 2005-08-18

Family

ID=34841999

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/001137 WO2005076629A1 (ja) 2004-02-09 2005-01-27 画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置

Country Status (4)

Country Link
US (1) US20070291131A1 (ja)
JP (1) JPWO2005076629A1 (ja)
TW (1) TWI258990B (ja)
WO (1) WO2005076629A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009055560A (ja) * 2007-08-29 2009-03-12 Sony Ericsson Mobilecommunications Japan Inc 携帯機器および撮像画像データの記録方法
KR20110106387A (ko) * 2008-12-19 2011-09-28 톰슨 라이센싱 전역 움직임 보상에 기초하는 비디오 코딩
US8488892B2 (en) 2010-03-17 2013-07-16 Panasonic Corporation Image encoder and camera system
JP2015518698A (ja) * 2013-04-03 2015-07-02 ▲ホア▼▲ウェイ▼技術有限公司 マルチレベル両方向動き推定方法およびマルチレベル両方向動き推定デバイス
WO2016158401A1 (ja) * 2015-03-30 2016-10-06 ソニー株式会社 画像符号化装置および方法
JP2018166306A (ja) * 2017-03-28 2018-10-25 キヤノン株式会社 符号化装置、撮像装置、符号化方法、及びプログラム
US10453380B2 (en) 2015-12-28 2019-10-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and transmission system
WO2020161969A1 (ja) * 2019-02-06 2020-08-13 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783781B1 (en) 2005-08-05 2010-08-24 F5 Networks, Inc. Adaptive compression
US8275909B1 (en) * 2005-12-07 2012-09-25 F5 Networks, Inc. Adaptive compression
JP4396712B2 (ja) * 2006-09-15 2010-01-13 カシオ計算機株式会社 カメラ装置、撮影制御プログラム、及び、撮影制御方法
JP4901460B2 (ja) * 2006-12-26 2012-03-21 富士フイルム株式会社 撮影装置、方法およびプログラム
US20090180701A1 (en) * 2008-01-10 2009-07-16 Seungyeob Choi Video Data Encoding System
US20100008419A1 (en) * 2008-07-10 2010-01-14 Apple Inc. Hierarchical Bi-Directional P Frames
US9357229B2 (en) 2010-07-28 2016-05-31 Qualcomm Incorporated Coding motion vectors in video coding
US9066102B2 (en) 2010-11-17 2015-06-23 Qualcomm Incorporated Reference picture list construction for generalized P/B frames in video coding
JPWO2012081246A1 (ja) * 2010-12-17 2014-05-22 パナソニック株式会社 画像符号化方法および画像復号化方法
US20120195364A1 (en) * 2011-01-31 2012-08-02 Apple Inc. Dynamic mode search order control for a video encoder
US20130208992A1 (en) * 2012-02-13 2013-08-15 Shu Lin System and method for difference frame threshold encoding and decoding
JP6000670B2 (ja) * 2012-06-11 2016-10-05 キヤノン株式会社 画像処理装置、画像処理方法
JP6135072B2 (ja) * 2012-08-30 2017-05-31 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
US20150181208A1 (en) * 2013-12-20 2015-06-25 Qualcomm Incorporated Thermal and power management with video coding
JP2017224939A (ja) * 2016-06-14 2017-12-21 キヤノン株式会社 撮像装置
JP6875821B2 (ja) * 2016-10-19 2021-05-26 キヤノン株式会社 画像符号化装置、撮像装置、画像符号化方法およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08154250A (ja) * 1994-11-25 1996-06-11 Victor Co Of Japan Ltd 動画像符号化装置
JPH1169325A (ja) * 1997-08-11 1999-03-09 Ando Electric Co Ltd 動画通信管理装置
JP2002369209A (ja) * 2001-05-21 2002-12-20 Thomson Licensing Sa Mpeg4標準を用いたビデオ符号化の方法及び装置
JP2004166183A (ja) * 2002-09-26 2004-06-10 Toshiba Corp 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6507672B1 (en) * 1997-09-10 2003-01-14 Lsi Logic Corporation Video encoder for digital video displays
ES2259827T3 (es) * 1998-10-13 2006-10-16 Matsushita Electric Industrial Co., Ltd. Regulacion de los requisitos de calculo y de memoria de un tren de bits comprimido en un decodificador de video.
JP4365941B2 (ja) * 1999-07-09 2009-11-18 キヤノン株式会社 符号化装置、画像処理装置、カメラ一体型画像記録装置、画像処理システム、符号化方法、及び記憶媒体
US6493392B1 (en) * 1999-12-27 2002-12-10 Hyundai Electronics Industries Co., Ltd. Method for coding digital interlaced moving video
WO2001058170A1 (en) * 2000-02-01 2001-08-09 Koninklijke Philips Electronics N.V. Video encoding and decoding with selectable image resolution
JP4416341B2 (ja) * 2001-02-28 2010-02-17 株式会社日立製作所 ディジタル監視システムおよび監視カメラ

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08154250A (ja) * 1994-11-25 1996-06-11 Victor Co Of Japan Ltd 動画像符号化装置
JPH1169325A (ja) * 1997-08-11 1999-03-09 Ando Electric Co Ltd 動画通信管理装置
JP2002369209A (ja) * 2001-05-21 2002-12-20 Thomson Licensing Sa Mpeg4標準を用いたビデオ符号化の方法及び装置
JP2004166183A (ja) * 2002-09-26 2004-06-10 Toshiba Corp 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009055560A (ja) * 2007-08-29 2009-03-12 Sony Ericsson Mobilecommunications Japan Inc 携帯機器および撮像画像データの記録方法
KR20110106387A (ko) * 2008-12-19 2011-09-28 톰슨 라이센싱 전역 움직임 보상에 기초하는 비디오 코딩
KR101638211B1 (ko) 2008-12-19 2016-07-20 톰슨 라이센싱 전역 움직임 보상에 기초하는 비디오 코딩
US8488892B2 (en) 2010-03-17 2013-07-16 Panasonic Corporation Image encoder and camera system
JP2015518698A (ja) * 2013-04-03 2015-07-02 ▲ホア▼▲ウェイ▼技術有限公司 マルチレベル両方向動き推定方法およびマルチレベル両方向動き推定デバイス
WO2016158401A1 (ja) * 2015-03-30 2016-10-06 ソニー株式会社 画像符号化装置および方法
JPWO2016158401A1 (ja) * 2015-03-30 2018-01-25 ソニー株式会社 画像符号化装置および方法
US10453380B2 (en) 2015-12-28 2019-10-22 Semiconductor Energy Laboratory Co., Ltd. Semiconductor device and transmission system
JP2018166306A (ja) * 2017-03-28 2018-10-25 キヤノン株式会社 符号化装置、撮像装置、符号化方法、及びプログラム
WO2020161969A1 (ja) * 2019-02-06 2020-08-13 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JPWO2020161969A1 (ja) * 2019-02-06 2021-11-25 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム
JP7110408B2 (ja) 2019-02-06 2022-08-01 富士フイルム株式会社 画像処理装置、撮影装置、画像処理方法及び画像処理プログラム

Also Published As

Publication number Publication date
US20070291131A1 (en) 2007-12-20
TW200534715A (en) 2005-10-16
JPWO2005076629A1 (ja) 2007-10-18
TWI258990B (en) 2006-07-21

Similar Documents

Publication Publication Date Title
WO2005076629A1 (ja) 画像符号化装置及び方法、画像復号化装置及び方法、及び撮像装置
JP5108078B2 (ja) 時間スケーラビリティを可能にするハイブリッド映像圧縮におけるフレーム予測の方法および装置
US9055301B2 (en) Changing motion estimation precision to maintain encoding within desired time
JP2001346215A (ja) 符号化装置
JP2013524740A (ja) ビデオ符号化におけるレート制御
WO2003067896A1 (en) Image information coding device and method and image information decoding device and method
JP2009267689A (ja) 動画像符号化装置、及び動画像符号化方法
JPH0595545A (ja) 画像信号の高能率符号化及び復号化装置
JP4820559B2 (ja) 映像データ符号化及び復号化方法及び装置
WO1993003578A1 (en) Apparatus for coding and decoding picture signal with high efficiency
JPWO2006082690A1 (ja) 画像符号化方法および画像符号化装置
EP0878967A2 (en) Signal coding apparatus and method
JPH0818979A (ja) 画像処理装置
US7613351B2 (en) Video decoder with deblocker within decoding loop
KR101606931B1 (ko) 키프레임 정지영상 저장 및 재생 장치 및 그 동작 방법
JPH06350995A (ja) 動画像処理方法
US20080219571A1 (en) Moving Image Coding Apparatus, Moving Image Decoding Apparatus, Control Method Therefor, Computer Program, and Computer-Readable Storage Medium
JP3947316B2 (ja) 動きベクトル検出装置及びこれを用いた動画像符号化装置
JP4708821B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
JP3690259B2 (ja) 動画像高速符号化装置及び動画像高速符号化方法
JPH0984024A (ja) 動画像信号の符号化装置
JPH05308628A (ja) 動画像符号化装置
JP2006246277A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JPH0698311A (ja) 画像信号の高能率符号化及び復号化装置
JP4100067B2 (ja) 画像情報変換方法及び画像情報変換装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005517655

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

122 Ep: pct application non-entry in european phase
WWE Wipo information: entry into national phase

Ref document number: 10588791

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 10588791

Country of ref document: US