[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2011037049A1 - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
WO2011037049A1
WO2011037049A1 PCT/JP2010/065862 JP2010065862W WO2011037049A1 WO 2011037049 A1 WO2011037049 A1 WO 2011037049A1 JP 2010065862 W JP2010065862 W JP 2010065862W WO 2011037049 A1 WO2011037049 A1 WO 2011037049A1
Authority
WO
WIPO (PCT)
Prior art keywords
line
coefficient
unit
order
data
Prior art date
Application number
PCT/JP2010/065862
Other languages
English (en)
French (fr)
Inventor
福原 隆浩
和寿 保坂
浩志 秋永
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to IN2393DEN2012 priority Critical patent/IN2012DN02393A/en
Priority to RU2012111256/08A priority patent/RU2012111256A/ru
Priority to US13/496,748 priority patent/US8634665B2/en
Priority to EP10818724.6A priority patent/EP2482540A4/en
Priority to CN2010800412266A priority patent/CN102511161A/zh
Priority to BR112012006071A priority patent/BR112012006071A2/pt
Publication of WO2011037049A1 publication Critical patent/WO2011037049A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Definitions

  • the present invention relates to an image processing apparatus and method, and more particularly, to an image processing apparatus and method capable of improving the processing performance per unit time of image encoding and decoding.
  • Typical conventional image compression methods include JPEG (Joint Photographic Experts Group) and JPEG2000 standardized by ISO (International Standards Organization).
  • JPEG2000 whose international standardization was completed in January 2001, uses a method that combines this wavelet transform with highly efficient entropy coding (bit modeling and arithmetic coding for each bit plane), compared to JPEG. Significant improvement in coding efficiency.
  • This JPEG2000 has been selected as a standard codec for the digital cinema standard (DCI (Digital Cinema Initiative) standard), and is beginning to be used for compression of moving images such as movies.
  • DCI Digital Cinema Initiative
  • manufacturers have begun to produce products that apply JPEG2000 to surveillance cameras, coverage cameras for broadcast stations, security recorders, and so on.
  • JPEG2000 basically encodes and decodes in units of pictures. Therefore, when low delay is to be realized for use in real-time transmission / reception, at least one picture in encoding (encoding) and at least in decoding (decoding) A delay of one picture occurs.
  • the present invention has been proposed in view of such a situation, and an object thereof is to improve the processing performance per unit time of image encoding and decoding.
  • a line block including image data corresponding to the number of lines necessary to generate coefficient data for one line of at least the subband of the lowest frequency component by hierarchically performing analysis filter processing, Analysis filter means for converting into coefficient data decomposed for each band, encoding means for encoding the coefficient data generated by the analysis filter means, and the coefficient data encoded by the encoding means
  • the encoded data is arranged in a predetermined order different from the order of the synthesis filter processing from the output order of the analysis filter processing by the analysis filter means, and in the order of transmission that improves the resistance to instability of the transmission path.
  • An image processing apparatus including encoded data rearranging means for rearranging.
  • the encoded data rearranging means can rearrange the encoded data of each division level in the order from the low frequency component to the high frequency component as the transmission order.
  • the arrangement of the coefficient data generated by the analysis filter means is in a predetermined order different from the order of the synthesis filter processing and the transmission order from the output order of the analysis filter processing by the analysis filter means.
  • Coefficient data rearranging means for rearranging in order of encoding that facilitates rate control of the encoded data;
  • Quantization means for quantizing the coefficient data rearranged by the coefficient data rearranging means;
  • Rate control means for controlling the rate of the encoded data by controlling the quantization step size of the quantization by the quantization means based on the encoding result by the encoding means; and
  • the encoding means can encode the coefficient data quantized by the quantization means.
  • the coefficient data rearranging means can rearrange the coefficient data of each division level in the order from the high frequency component to the low frequency component as the transmission order.
  • the analysis filter means can perform the analysis filter processing using a lifting operation.
  • the analysis filter means performs the lifting calculation after performing the necessary symmetric expansion of the pixel block in the initial state, and uses the previous lifting calculation result for the line block in the steady state. Thus, the lifting operation can be performed.
  • the analysis filter means can perform the lifting operation in the vertical direction after performing the lifting operation in the horizontal direction on the coefficient data.
  • the number of lines necessary for the analysis filter unit of the image processing apparatus to perform analysis filter processing hierarchically and generate coefficient data for at least one line of the subband of the lowest frequency component.
  • a line block including image data for each minute is converted into coefficient data decomposed for each frequency band, and the encoding means of the image processing apparatus encodes the coefficient data generated by the analysis filter processing,
  • the encoded data rearranging means of the processing device changes the sequence of the encoded data obtained by encoding the coefficient data in a predetermined order different from the order of the synthesis filter processing from the output order of the analysis filter processing.
  • image data of a predetermined number of lines is decomposed for each frequency band by hierarchical analysis filter processing, and includes at least one line of coefficient data of at least the lowest frequency component subband.
  • an image processing apparatus including a synthesis filter means for converting the image data into image data.
  • the synthesizing filter means can preferentially execute the synthesizing filter process on the subband coefficient data in the lower hierarchy, while being executable.
  • the encoded data is divided and extracted for each encoded data corresponding to one line of the coefficient data of each layer Extraction means, and the decoding means can decode the encoded data extracted by the extraction means.
  • the coefficient data rearranging means can determine the order of the coefficient data based on the result of decoding by the decoding means, and can change the determined order of the order of synthesis filter processing.
  • the synthesis filter means can perform the synthesis filter process using a lifting operation.
  • the synthesizing filter means performs the lifting calculation after symmetrically extending necessary coefficient data for the initial state line block, and the previous lifting calculation result for the steady state line block. Utilizing this, the lifting operation can be performed.
  • the synthesis filter means can perform the lifting operation in the vertical direction after performing the lifting operation in the horizontal direction on the coefficient data.
  • the decoding means of the image processing apparatus further comprises: coefficient data of subbands of at least the lowest frequency component, in which a predetermined number of lines of image data are decomposed for each frequency band by hierarchical analysis filter processing Is encoded and generated by encoding a line block including a coefficient data group of each subband including at least one line, and the coefficient data rearranging means of the image processing device is obtained by decoding.
  • the arrangement of the coefficient data is rearranged from the decoded order to the order of the synthesis filter processing, and the synthesis filter means of the image processing device performs the synthesis filter processing in a hierarchical manner, An image processing method for converting the coefficient data of a band into the image data.
  • a line block including image data corresponding to the number of lines necessary to generate analysis data for at least one line of subbands of at least the lowest frequency component is subjected to hierarchical analysis filtering.
  • the coefficient data generated by the analysis filter process is encoded, and the sequence of encoded data obtained by encoding the coefficient data is the output order of the analysis filter process.
  • they are rearranged in a predetermined order that is different from the order in which the synthesis filter processing is performed, and in the order of transmission that improves the resistance to instability of the transmission path.
  • each subband includes at least one line of coefficient data of at least the lowest-frequency component subband, in which image data of a predetermined number of lines is decomposed for each frequency band by hierarchical analysis filtering.
  • the encoded data generated by encoding the line block consisting of the coefficient data group is decoded, and the sequence of the coefficient data obtained by the decoding is changed from the decoded order to the synthesis filter processing order. Rearrangement and hierarchical synthesis filter processing are performed, and the rearranged coefficient data of each subband is converted into image data.
  • an image can be encoded or decoded.
  • it is possible to further improve the processing capacity per unit time of processing for encoding and decoding an image.
  • FIG. 1 shows a configuration of an embodiment of an image encoding apparatus as an image processing apparatus to which the present invention is applied.
  • an image encoding apparatus 100 is an apparatus that encodes image data.
  • the image encoding device 100 includes an image line input unit 101, a line buffer unit 102, a wavelet transform unit 103, a coefficient line rearrangement unit 104, a quantization unit 105, an entropy encoding unit 106, an addition unit 107, and a code line rearrangement unit. 108.
  • the image encoding device 100 further includes a rate control unit 109.
  • the image line input unit 101 supplies the input image data (arrow D10) to the line buffer unit 102 for each line (arrow D11) and accumulates it in the line buffer unit 102.
  • the line buffer unit 102 holds the image data supplied from the image line input unit 101 and the coefficient data supplied from the wavelet transform unit 103, and supplies the image data and coefficient data to the wavelet transform unit 103 at a predetermined timing. (Arrow D12).
  • the wavelet transform unit 103 performs wavelet transform on the image data and coefficient data supplied from the line buffer unit 102, and generates coefficient data of a low frequency component and a high frequency component of the next layer. Details of the wavelet transform will be described later.
  • the wavelet transform unit 103 supplies the low-frequency component of the generated coefficient data in the vertical direction and the horizontal direction to the line buffer unit 102 (arrow D13), and supplies the other components to the coefficient line rearrangement unit 104. (Arrow D14). When the generated coefficient data is the highest layer, the wavelet transform unit 103 also supplies the coefficient line rearrangement unit 104 with a low-frequency component in the vertical direction and the horizontal direction.
  • Coefficient data (coefficient line) is supplied from the wavelet transform unit 103 to the coefficient line rearrangement unit 104 (arrow D14).
  • the coefficient line rearrangement unit 104 rearranges the order of the coefficient data (coefficient lines) into an order for encoding processing that is a predetermined order different from the order of wavelet inverse transform processing and the order at the time of transmission.
  • the coefficient line rearranging unit 104 includes a coefficient line rearranging buffer 111 and a coefficient line reading unit 112.
  • the coefficient line rearrangement buffer 111 holds the coefficient lines supplied from the wavelet transform unit 103.
  • the coefficient line reading unit 112 performs rearrangement by reading the coefficient lines held in the coefficient line rearrangement buffer 111 in the order for encoding processing (arrow D15). Details of the rearrangement will be described later.
  • the coefficient line rearranging unit 104 (coefficient line reading unit 112) supplies the coefficient data rearranged in order to the quantization unit 105 (arrow D16).
  • the quantization unit 105 quantizes the coefficient data supplied from the coefficient line rearrangement unit 104. Any quantization method may be used. For example, general means, that is, coefficient data W as shown in the following equation (1) is divided by the quantization step size Q. A technique may be used.
  • the quantization step size Q is designated by the rate control unit 109.
  • the quantization unit 105 supplies the quantized coefficient data to the entropy encoding unit 106 (arrow D17).
  • the entropy encoding unit 106 encodes the coefficient data supplied from the quantization unit 105 by a predetermined entropy encoding method such as Huffman encoding or arithmetic encoding.
  • a predetermined entropy encoding method such as Huffman encoding or arithmetic encoding.
  • the entropy encoding unit 106 supplies one code line, which is encoded data generated from the one coefficient line, to the adding unit 107 (arrow D18).
  • the entropy encoding unit 106 further supplies the code amount of the one code line to the adding unit 107 (dotted arrow D24).
  • the addition unit 107 adds the code amount of the one code line supplied from the entropy encoding unit 106 to the one code line supplied from the entropy encoding unit 106 as header information. Details of adding the header information will be described later. When the header information is added, the adding unit 107 supplies the encoded data (code line) to the code line rearranging unit 108 (arrow D19).
  • the code line rearrangement unit 108 rearranges the order of the code lines into a transmission order that is a predetermined order different from the order of the wavelet inverse transform processing.
  • the code line rearrangement unit 108 includes a code line rearrangement buffer 121 and a code line reading unit 122.
  • the code line rearrangement buffer 121 holds a code line (including header information) supplied from the adding unit 107.
  • the code line reading unit 122 performs rearrangement by reading the code lines held in the code line rearrangement buffer 121 in the order for transmission (arrow D20). Details of the rearrangement will be described later.
  • the code line rearrangement unit 108 (code line reading unit 122) outputs the encoded data whose order has been rearranged to the outside of the image encoding device 100 (arrow D21).
  • the encoded data output to the outside of the image encoding device 100 is supplied to an image decoding device, which will be described later, via a network or the like, for example.
  • the encoded data is rearranged by the code line rearrangement unit 108 in the order suitable for transmission. Thereby, the tolerance with respect to the instability of a transmittable rate can be improved, for example.
  • the entropy encoding unit 106 also supplies the code amount of each code line to the rate control unit 109 (dotted arrow D22).
  • the rate control unit 109 estimates the encoding difficulty level of the image based on the code amount for each code line supplied from the entropy encoding unit 106, and is used by the quantization unit 105 according to the encoding difficulty level.
  • the quantization step size Q is designated (dotted line arrow D23). That is, the rate control unit 109 controls the rate of encoded data by specifying the quantization step size Q.
  • the coefficient lines are rearranged by the coefficient line rearrangement unit 104 in such an order that the rate control unit 109 can estimate the encoding difficulty earlier. That is, the coefficient lines are rearranged in the order that the entropy encoding unit 106 encodes the coefficient lines that have more features of the image.
  • the code amount that more strongly reflects the feature of the image is supplied to the rate control unit 109 earlier, so the rate control unit 109 sets the quantization step size Q earlier.
  • the value can be set according to the degree of difficulty in encoding the image (appropriate rate control is performed earlier).
  • wavelet transform image data is hierarchically constructed by recursively repeating analysis filtering that divides image data into high spatial frequency components (high frequency components) and low frequency components (low frequency components). This is a process of converting into coefficient data for each frequency component.
  • the division level is lower in the higher-frequency component hierarchy and higher in the lower-frequency component hierarchy.
  • analysis filtering is performed both in the horizontal direction and in the vertical direction.
  • horizontal analysis filtering is performed, and then vertical analysis filtering is performed. Therefore, coefficient data (image data) of one layer is divided into four subbands (LL, LH, HL, and HH) by analysis filtering for one layer.
  • the analysis filtering of the next layer is performed on the low frequency component (LL) in both the horizontal direction and the vertical direction among the generated four subbands.
  • FIG. 2 is a diagram for explaining the configuration of coefficient data generated by repeating analysis filtering four times.
  • the image data is converted into four subbands (1LL, 1LH, 1HL, and 1HH) at division level 1.
  • the division level 2 analysis filtering is performed on the subband 1LL of the low-frequency component in both the horizontal direction and the vertical direction at the division level 1, and four subbands (2LL, 2LH,. 2HL, and 2HH).
  • the division level 3 analysis filtering is performed on the subband 2LL of the low frequency component in both the horizontal direction and the vertical direction at the division level 2, and the four subbands (3LL, 3LH, 3HL and 3HH).
  • the division level 4 analysis filtering is performed on the subband 3LL of the low frequency component in both the horizontal direction and the vertical direction at the division level 3, and the four subbands (4LL, 4LH,. 4HL, and 4HH).
  • FIG. 2 shows the configuration of coefficient data divided into 13 subbands in this way.
  • coefficient data of four subbands on one layer is generated line by line from the image data or coefficient data of two lines to be processed. Therefore, as indicated by the hatched portion in FIG. 2, subline 3LL requires 2 lines and subband 2LL requires 4 lines in order to generate the division level 4 subband coefficient data line by line. Yes, subband 1LL requires 8 lines. That is, 16 lines of image data are required.
  • the image data of the number of lines necessary to generate the coefficient data for one line of the subband of the lowest frequency component is called a line block (or precinct).
  • the line block also indicates a set of coefficient data of each subband obtained by wavelet transforming the image data of the one line block.
  • 16 lines of image data form one line block.
  • the line block is generated from the 16 lines of image data, the coefficient data of 8 lines of each subband of division level 1, the coefficient data of 4 lines of each subband of division level 2, and each of the data of division level 3
  • coefficient data of two lines of subbands and coefficient data of one line of each subband of division level 4 may be indicated.
  • the wavelet transform unit 103 performs the wavelet transform for each line block.
  • a line indicates one line formed in a picture or field corresponding to image data before wavelet transform, in each division level, or in each subband.
  • This coefficient data (image data) for one line is also called a coefficient line.
  • a certain line of a certain subband is referred to as a “coefficient line of a certain subband”, and all subbands (LH, HL) of a certain hierarchy (division level) generated from the same two coefficient lines of the hierarchy one level lower.
  • And HH are called “coefficient lines of a certain division level (or hierarchy)”.
  • “division level 4 (highest layer) coefficient line” is generated from subbands 4LL, 4LH, 4HL, and 4HH that correspond to each other (the same coefficient line at the lower division level). One line).
  • the “division level 3 coefficient line” indicates one line corresponding to each other of the subbands 3LH, 3HL, and 3HH. Further, the “coefficient line of subband 2HH” indicates one line with subband 2HH.
  • encoded data for one line obtained by encoding one coefficient line is also referred to as a code line.
  • division level 4 wavelet transform has been described.
  • wavelet transformation is basically performed up to division level 4, but in practice, the number of wavelet transformation layers (division level) is arbitrary.
  • the wavelet transform unit 103 normally performs the above-described processing using a filter bank composed of a low-pass filter and a high-pass filter. Since a digital filter usually has an impulse response having a plurality of taps, that is, a filter coefficient, it is necessary to buffer in advance input image data or coefficient data that can be filtered. Similarly, when wavelet transform is performed in multiple stages, it is necessary to buffer the wavelet transform coefficients generated in the previous stage as many times as can be filtered.
  • a method using a 5 ⁇ 3 filter will be described as a specific example of this wavelet transform.
  • the method using this 5 ⁇ 3 filter is also adopted in the JPEG (Joint Photographic Experts2000Group) 2000 standard already described in the prior art, and is an excellent method in that wavelet transform can be performed with a small number of filter taps. is there.
  • the impulse response (Z conversion expression) of the 5 ⁇ 3 filter is obtained from the low-pass filter H 0 (z) and the high-pass filter H 1 (z) as shown in the following equations (2) and (3). Composed. From the equations (2) and (3), it can be seen that the low-pass filter H 0 (z) is 5 taps and the high-pass filter H 1 (z) is 3 taps.
  • the coefficients of the low frequency component and the high frequency component can be directly calculated.
  • the calculation of filter processing can be reduced by using a lifting technique.
  • FIG. 3 is a lifting representation of a 5 ⁇ 3 filter.
  • the uppermost row is an input signal row.
  • Data processing flows downward from the top of the screen, and the coefficient of the high frequency component (high frequency coefficient) and the coefficient of the low frequency component (low frequency coefficient) are output by the following equations (4) and (5).
  • the equations (4) and (5) are output by the following equations (4) and (5).
  • FIG. 4 is a diagram when filtering is performed on a vertical line using a 5 ⁇ 3 analysis filter.
  • the horizontal direction shows the calculation process and the low-frequency and high-frequency coefficients generated thereby.
  • FIG. 3 it can be seen that only the horizontal has changed to vertical, and the calculation method is exactly the same.
  • the top line is symmetrically expanded from Line-1 like a dotted line, and one line is filled.
  • a lifting operation is performed using this, a total of three lines of Line-0 and Line-1, and a coefficient a is generated by the operation of Step-1. This is a high frequency coefficient (H0).
  • the next high frequency coefficient a is calculated using these three lines.
  • This is a high frequency coefficient (H1).
  • the coefficient b is generated by calculating according to Equation 2.
  • the This is a low frequency coefficient (L1). That is, as indicated by a frame 153, the low-frequency coefficient (L1) and the high-frequency coefficient (H1) using the three lines Line-1, Line-2, and Line-3 and the high-frequency coefficient (H0). Is generated.
  • FIG. 4 shows an example in which the filtering is performed on the vertical line, but it is obvious that the same can be considered in the case of the horizontal filtering.
  • each subband (2LL, 2LH, 2HL, 2HH) at the division level 2 is generated line by line.
  • a lifting operation is performed every time two 1LL coefficient lines are generated, and one coefficient line of each subband at the division level 2 is generated.
  • the baseband image data is from 11 lines, and as shown on the right of FIG. Five coefficient lines are generated for each of the 1LH, 1HL, and 1HH subbands.
  • the analysis filtering requires three lines of image data or coefficient data as input in the initial state at the upper end of the image. However, in the steady state of the other portions, analysis filtering is performed every time two lines of image data or coefficient data are input.
  • the lifting operation proceeds in the above procedure.
  • FIG. 9 is a diagram illustrating data output from the wavelet transform unit 103 in time series in the initial state.
  • the data output from the wavelet transform unit 103 are arranged in time series in the direction from the top to the bottom in the figure.
  • the wavelet transform unit 103 performs analysis filtering according to the procedure described above, in the initial state, the first coefficient line (line 1) from the top of the division level 1 (subbands 1HH, 1HL, and 1LH) is the wavelet transform.
  • the data is output from the unit 103 and supplied to the coefficient line rearrangement unit 104.
  • the line 1 of the subband 1LL is supplied to the line buffer unit 102 and held.
  • line 2 (second coefficient line from the top) and line 3 (third coefficient line from the top) at division level 1 are sequentially supplied to the coefficient line rearrangement unit 104 as soon as they are generated.
  • Lines 2 and 3 of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the wavelet transform unit 103 performs division level 1 analysis filtering on the coefficient lines. .
  • line 1 at division level 2 (subbands 2HH, 2HL, and 2LH) is output from wavelet transform section 103 and supplied to coefficient line rearrangement section 104.
  • the line 1 of the subband 2LL is supplied to the line buffer unit 102 and held.
  • line 4 (fourth coefficient line from the top) and line 5 (fifth coefficient line from the top) at the division level 1 are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the lines 4 and 5 of the subband 1LL are supplied to the line buffer unit 102 and held.
  • the line buffer unit 102 holds two coefficient lines of the subband 1LL, division level 1 analysis filtering is performed on them, and the division level 2 line 2 is output from the wavelet transform unit 103 to obtain coefficient lines.
  • the data is supplied to the sorting unit 104.
  • the line 2 of the subband 2LL is supplied to the line buffer unit 102 and held.
  • line 6 (sixth coefficient line from the top) and line 7 (seventh coefficient line from the top) at division level 1 are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the lines 6 and 7 of the subband 1LL are supplied to the line buffer unit 102 and held.
  • the division level 1 line 8 (the eighth coefficient line from the top) and the line 9 (the ninth coefficient line from the top) are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the lines 8 and 9 of the subband 1LL are supplied to the line buffer unit 102 and held.
  • the division level 1 line 10 (the tenth coefficient line from the top) and the line 11 (the eleventh coefficient line from the top) are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the lines 10 and 11 of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the division level 1 line 12 (the 12th coefficient line from the top) and the line 13 (the 13th coefficient line from the top) are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the line 12 and the line 13 of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the division level 1 line 14 (the 14th coefficient line from the top) and the line 15 (the 15th coefficient line from the top) are generated in this order, and are sequentially supplied to the coefficient line rearrangement unit 104.
  • the line 14 and the line 15 of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the above is the coefficient line group for one line block output from the wavelet transform unit 103 in the initial state.
  • the process shifts to a steady state where two lines are processed.
  • FIG. 10 is a diagram showing data output from the wavelet transform unit 103 in time series in a steady state.
  • the data output from the wavelet transform unit 103 are arranged in time series in the direction from top to bottom in the figure.
  • the wavelet transform unit 103 Since the wavelet transform unit 103 performs analysis filtering in the above-described procedure, at a certain timing in the steady state, the division level 1 line L (Lth coefficient line from the top) and line (L + 1) (from the top (L + 1) As soon as the (th) coefficient line) is generated, it is sequentially output from the wavelet transform unit 103 and supplied to the coefficient line rearrangement unit 104. The line L and the line (L + 1) of the subband 1LL are supplied to the line buffer unit 102 and held.
  • the division level 1 analysis filtering is performed on them, and the division level 2 line M (the Mth coefficient line from the top) is the wavelet. It is output from the conversion unit 103 and supplied to the coefficient line rearrangement unit 104.
  • the line M of the subband 2LL is supplied to the line buffer unit 102 and held.
  • a division level 1 line (L + 2) (the (L + 2) th coefficient line from the top) and a line (L + 3) (the (L + 3) th coefficient line from the top) are generated in this order, and the coefficient lines are sequentially arranged. It is supplied to the replacement unit 104.
  • the line (L + 2) and the line (L + 3) of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the division level 3 line N (the Nth coefficient line from the top) is the wavelet. It is output from the conversion unit 103 and supplied to the coefficient line rearrangement unit 104. Further, the line N of the subband 3LL is supplied to the line buffer unit 102 and held.
  • a division level 1 line (L + 4) ((L + 4) th coefficient line from the top) and a line (L + 5) ((L + 5) th coefficient line from the top) are generated in this order, and the coefficient lines are sequentially arranged. It is supplied to the replacement unit 104.
  • the line (L + 4) and the line (L + 5) of the subband 1LL are supplied to and held in the line buffer unit 102.
  • the division level 1 line (L + 6) (the (L + 6) th coefficient line from the top) and the line (L + 7) (the (L + 7) th coefficient line from the top) are generated in this order, and the coefficient lines are sequentially arranged. It is supplied to the replacement unit 104.
  • the line (L + 6) and the line (L + 7) of the subband 1LL are supplied to and held in the line buffer unit 102.
  • line P at division level 4 (Pth coefficient line from the top) is wavelet. It is output from the conversion unit 103 and supplied to the coefficient line rearrangement unit 104.
  • the processing order of the coefficient lines of the wavelet transform unit 103 that is, the output order of the coefficient lines from the wavelet transform unit 103 is arbitrary, and may be an order other than those described above. However, by performing analysis filtering according to the procedure described above, the wavelet transform unit 103 can efficiently generate each coefficient line, and can perform transform processing with low delay.
  • the coefficient lines of each division level output from the wavelet transform unit 103 in the order described with reference to FIGS. 9 and 10 are held in the coefficient line rearrangement buffer 111 of the coefficient line rearrangement unit 104.
  • the coefficient line reading unit 112 sets the coefficient lines in the order for encoding processing, which is a predetermined order different from the order of wavelet inverse transform processing and the order at the time of transmission. By reading, the coefficient lines are rearranged.
  • the order of wavelet transform processing and the order at the time of transmission will be described later.
  • the order for encoding processing is such an order that the rate control unit 109 can estimate the encoding difficulty level earlier. .
  • the coefficient line reading unit 112 preferentially reads coefficient lines that include more image features.
  • the high-frequency component reflects an edge or noise component that is difficult to detect due to human visual characteristics.
  • the high-frequency component originally has few coefficients, by making the high-frequency component coefficient encoded earlier, the degree of difficulty in encoding the image can be determined earlier. .
  • the coefficient line reading unit 112 reads the coefficient lines in order from the high frequency component to the low frequency component as shown in FIG.
  • each coefficient line shown in FIG. 11 is processed in order from the top in the figure.
  • each coefficient line output from the wavelet transform unit 103 in the order shown on the left side of FIG. 11 (wavelet transform output order) is converted to a high level as shown on the right side of FIG. They are rearranged in the order from the band component to the low band component (coding order).
  • the coefficient line reading unit 112 reads each coefficient line of the division level 1, reads each coefficient line of the division level 2, reads each coefficient line of the division level 3, and finally, the coefficient of the division level 4
  • the lines are read, and the read coefficient lines are supplied to the quantization unit 105 in the order of reading.
  • the quantization unit 105 processes each coefficient line in the supplied order and supplies it to the entropy coding unit 106, the entropy coding unit 106 also processes each coefficient line in the order shown on the left in FIG. Will do. That is, the order read by the coefficient line reading unit 112 is the encoding order.
  • the rate control unit 109 sets the quantization step size to be small if the coefficient value is small to promote code amount generation, and sets the step size to be large if the coefficient value is large to generate the code amount. Control such as suppression. When such control is performed based on the code amount of the high frequency component, the rate control unit 109 can estimate the degree of difficulty in encoding the image more accurately.
  • the rate control unit 109 sets the number of quantization steps to an appropriate value earlier. Can do. That is, rate control becomes easy.
  • the image In the case of the image encoding device 100, the image must be encoded with low delay, and the rate control unit 109 performs parallel to the entropy encoding process based on very limited information (code amount for each coefficient line). Thus, rate control must be performed in a very limited time.
  • this rate control cannot be performed properly, unnecessary image quality may be deteriorated, and the image encoding device 100 may not be realized as a realistic device. Therefore, it is very important to perform appropriate rate control in a short time based on limited information. And the difficulty of this rate control becomes high, so that the throughput of the image coding apparatus 100 improves.
  • the coefficient line rearranging unit 104 rearranges the coefficient lines, so that the number of quantization steps can be set to an appropriate value earlier and the rate control becomes easy. 109 can cope with further improvement in throughput. That is, the image encoding device 100 can further improve the throughput of image encoding.
  • the coding order of the coefficient lines rearranged by the coefficient line rearrangement unit 104 may be other than the order described above. However, for the reasons described above, it is generally desirable that the order from the high frequency component to the low frequency component is the encoding order.
  • the rearrangement of the coefficient lines may be performed before entropy encoding, or may be performed after the quantization process. That is, the coefficient line rearrangement unit 104 may be provided between the quantization unit 105 and the entropy encoding unit 106. In this case, the coefficient lines output from the wavelet transform unit 103 are quantized by the quantization unit 105 and then supplied to the coefficient line rearrangement buffer 111 to be held.
  • the adding unit 107 adds the code amount of the code line as header information to each code line.
  • FIG. 12 shows an example of such a situation.
  • the adding unit 107 adds the code amount as header information (Code_info) to the code line (code word) of each division level. For example, when the code amount of the code line (line L) at the division level 1 is 100 bytes, information indicating “100 bytes” at the head of the code line (line L) is header information (Code_info (L)). Added as.
  • each unit of the image encoding device 100 handles coefficient data for each coefficient line. That is, each unit can grasp the boundary of the coefficient line. However, since each code line is continuously supplied to the image decoding apparatus that decodes the encoded data generated by the image encoding apparatus 100, the boundary between the code lines cannot be grasped.
  • the adding unit 107 adds the code amount of each code line to the encoded data, so that the image decoding apparatus divides the encoded data (stream) for each code line based on the code amount and processes it. Will be able to.
  • the order of wavelet inverse transform processing is an order suitable for transmission of encoded data (code stream), for example, to improve tolerance to instability of the transmittable rate.
  • the order is such that
  • the transmission rate is unstable, such as the Internet or wireless communication, and data loss or transmission may occur.
  • encoded data is transmitted via a transmission line with a high occurrence frequency of errors such as errors, it is necessary to consider measures for such problems in order to construct a practical system.
  • the code line reading unit 122 reads the code lines in order from the low frequency component to the high frequency component as shown in FIG.
  • each code line shown in FIG. 13 is processed in order from the top in the figure.
  • the code line reading unit 122 reads the code line at the division level 4, reads each code line at the division level 3, reads each code line at the division level 2, and finally reads each code at the division level 1.
  • the lines are read out, and the read code lines are output to the outside of the image coding apparatus 100 in the order of reading. That is, each code line is transmitted in this transmission order (in order from the low frequency component to the high frequency component).
  • the code line of the lower frequency component has a greater influence on the image quality. That is, since the code line of the low frequency component that is important for the image quality is more important, it is transmitted earlier in time.
  • retransmission processing of the lost data is performed.
  • the process of encoding and transmitting an image and decoding the transmitted encoded data is performed with a lower delay (substantially in real time)
  • the time allowed for the retransmission process is finite and very short. The shorter the processing time is, the shorter the time is.
  • the code lines are not rearranged and are transmitted in the coding order, that is, in the order from the high frequency component to the low frequency component, the time allowed for the retransmission processing of the low frequency component code line is very large. Since the success rate of the retransmission process is reduced, the risk that the image quality of the decoded image is reduced increases as a result. In particular, when an unstable network is used as a transmission path, it is presumed that such an error occurs to some extent, and it can be said that the image quality of the decoded image is degraded accordingly.
  • the code line buffer amount during transmission increases and overflow occurs.
  • Such control not only can avoid buffer overflow, but also can maintain low-delay transmission.
  • the code line of the low-frequency component must be discarded, and the image quality of the decoded image may be greatly degraded.
  • the transmission rate control is performed, the effect on the image quality of the decoded image is affected. Can be further reduced.
  • the code line rearrangement unit 108 rearranges the order of the code lines in the order for transmission (for example, the order from the low frequency component toward the high frequency component), so that the image coding apparatus 100 transmits
  • the tolerance to road instability can be increased. If this tolerance is weak and the image quality of the decoded image greatly deteriorates due to an error or the like during transmission, it cannot be said to be a realistic system.
  • the image encoding device 100 can cope with further improvement in throughput. That is, the image encoding device 100 can further improve the throughput of image encoding.
  • the code line rearrangement unit 108 rearranges the code lines in the order in which the wavelet inverse transform processing is performed in order to reduce delay. .
  • the coefficient line rearrangement unit 104 sets the coefficient lines in the transmission order or wavelet inverse. It is desirable to rearrange in the order of conversion processing.
  • the image encoding apparatus 100 can realize the improvement of the throughput realistically by appropriately rearranging the coefficient lines and the code lines.
  • step S101 the image line input unit 101 receives the image data input for each line (while holding it in the line buffer unit 102), and the wavelet transform unit 103 executes the line buffer. Using the coefficient lines held in the unit 102, wavelet transformation is performed for one line block.
  • step S102 the wavelet transform unit 103 determines whether or not processing for one line block has been performed. If it is determined that the processing for one line block has not been performed, the process returns to step S101 to continue the wavelet transform process.
  • step S103 If it is determined that the wavelet transform process has been performed for one line block, the process proceeds to step S103.
  • step S103 the coefficient line rearranging unit 104 rearranges the wavelet transformed coefficient data in the order of encoding processing.
  • step S ⁇ b> 104 the quantization unit 105 quantizes the coefficient data with a quantization step size specified by the rate control unit 109.
  • step S105 the entropy encoding unit 106 performs entropy encoding on the coefficient data.
  • the adding unit 107 adds the code amount to each code line as header information.
  • the code line rearrangement unit 108 rearranges the encoded data (code lines) in the order of transmission.
  • step S108 the code line rearrangement unit 108 outputs the encoded data rearranged in the transmission order.
  • step S109 the rate control unit 109 performs rate control based on the entropy encoding information in the entropy encoding unit 106.
  • step S110 the wavelet transform unit 103 determines whether or not processing has been performed up to the last line block (for example, the bottom line block) of the processing target picture. If it is determined that processing is not performed, the process returns to step S101, and the subsequent processing is repeated for the next line block. If it is determined in step S110 that the process has been completed up to the last line block, the encoding process for the processing target picture is ended.
  • the last line block for example, the bottom line block
  • the image encoding device 100 can improve the throughput of image encoding.
  • header information including the code amount is added to the code line of each division level so that the image decoding apparatus can identify the code line break of each division level in the code stream.
  • a dedicated marker may be added as shown in FIG. By detecting this marker, the image decoding apparatus can specify the boundary of the code line at each division level.
  • the image decoding apparatus can distinguish the code line of each division level based on the marker, but cannot determine the code amount of the code line. That is, the arrangement order of the code lines at each division level cannot be specified immediately from the marker. Therefore, the image decoding apparatus needs to grasp the arrangement order by some other means.
  • FIG. 16 is a block diagram illustrating a configuration example of an embodiment of an image decoding device as an image processing device to which the present invention has been applied.
  • the image decoding apparatus 200 decodes the encoded data output from the image encoding apparatus 100 and generates a decoded image.
  • the image decoding apparatus 200 includes a codeword decoding unit 201, a line extraction unit 202, an entropy decoding unit 203, an inverse quantization unit 204, a coefficient line rearrangement unit 205, a wavelet inverse transformation unit 206, and a buffer unit 207.
  • the codeword decoding unit 201 decodes the input encoded data (codeword) (arrow D51) and extracts related information relating to the data and the encoding process. Any information may be included in this related information. For example, image resolution (horizontal / vertical size), quantization step size, number of wavelet transform decomposition, and coefficient line (code line) arrangement order Information about
  • the information regarding the arrangement order of the coefficient lines may be any information indicating the arrangement order of the code lines of each division level or information necessary for obtaining the arrangement order. Good. For example, header information including the code amount of the code line of each division level as shown in FIG. 12, a marker detection result as shown in FIG.
  • the codeword decoding unit 201 supplies the input encoded data (code stream) to the line extraction unit 202 (arrow D52). Further, the codeword decoding unit 201 supplies information necessary for distinguishing the code lines of the respective division levels in the code stream to the line extraction unit 202 (dotted arrow D61). For example, the codeword decoding unit 201 supplies the code amount of the code line at each division level, the marker detection result, and the like to the line extraction unit 202.
  • the codeword decoding unit 201 supplies information indicating the quantization step size to the inverse quantization unit 204 (dotted line arrow D62).
  • the codeword decoding unit 201 supplies information necessary for rearranging the coefficient lines at each division level to the coefficient line reading unit 212 (dotted arrow D63).
  • the coefficient line reading unit 212 grasps in advance the wavelet inverse transformation processing order by the wavelet inverse transformation unit 206, which is the arrangement order after the rearrangement.
  • the coefficient line reading unit 212 needs to grasp the arrangement order of the code lines at the time of transmission, which is the arrangement order before the rearrangement, in order to rearrange the coefficient lines. Therefore, the codeword decoding unit 201 provides the coefficient line reading unit 212 with information indicating the arrangement order of the code lines at the time of transmission or information necessary for obtaining the arrangement order.
  • the codeword decoding unit 201 may specify the order of arrangement of the code lines at the time of transmission by decoding the codeword and provide the coefficient line reading unit 212 with information indicating the arrangement order.
  • the codeword decoding unit 201 may sequentially provide information indicating the code amount of the code line of each division level extracted from the code stream to the coefficient line reading unit 212.
  • the coefficient line reading unit 212 grasps the arrangement order of the coefficient lines based on the order of the code amounts supplied from the codeword decoding unit 201.
  • the coefficient line rearrangement buffer 211 stores the coefficient lines at each division level in a distinguishable state. Therefore, the coefficient line reading unit 212 obtains the data amount of the coefficient line at each division level held in the coefficient line rearrangement buffer 211, and grasps the arrangement order of the coefficient lines from the arrangement order of the data amount. Also good. In this case, provision of information from the codeword decoding unit 201 can be omitted.
  • the codeword decoding unit 201 further supplies the wavelet inverse transform unit 206 with information necessary for the wavelet inverse transform process, such as the resolution of the image and the number of wavelet transform decompositions (dotted arrow D64).
  • the line extraction unit 202 generates code for each division level from the code stream supplied from the codeword decoding unit 201 based on information necessary for distinguishing the code lines of each division level supplied from the codeword decoding unit 201. Extract lines. That is, the line extraction unit 202 divides the encoded data (code stream) for each code line at the division level. The line extraction unit 202 supplies the extracted code lines at each division level to the entropy decoding unit 203 (arrow D53).
  • the entropy decoding unit 203 entropy-decodes the code lines of each division level by a method corresponding to the entropy encoding of the entropy encoding unit 106 (FIG. 1), and generates coefficient data (quantized coefficients). That is, the entropy decoding unit 203 decodes the code lines of the respective division levels divided by the line extraction unit 202 in the order of supply, and converts them into coefficient lines of the division level. The entropy decoding unit 203 supplies the coefficient line (quantization coefficient) at the division level to the inverse quantization unit 204 (arrow D54).
  • the inverse quantization unit 204 converts the coefficient lines (quantization coefficients) supplied from the entropy decoding unit 203 according to the quantization step size determined based on the information supplied from the codeword decoding unit 201. Inverse quantization.
  • the inverse quantization unit 204 supplies the inversely quantized coefficient lines (wavelet transform coefficients) at each division level to the coefficient line rearrangement unit 205 (arrow D55).
  • the coefficient line rearrangement unit 205 rearranges the order of the coefficient data (coefficient lines) (the order at the time of transmission) to the order of the wavelet inverse transform processing.
  • the coefficient line rearranging unit 205 includes a coefficient line rearranging buffer 211 and a coefficient line reading unit 212.
  • the coefficient line rearrangement buffer 211 holds coefficient lines for each division level supplied from the inverse quantization unit 204.
  • the coefficient line reading unit 212 performs the rearrangement by reading the coefficient lines of the respective division levels held in the coefficient line rearrangement buffer 211 in the order for the wavelet inverse transform processing (arrow D56). Details of the rearrangement will be described later.
  • the coefficient line rearranging unit 205 (coefficient line reading unit 212) supplies the coefficient data rearranged in order to the wavelet inverse transform unit 206 (arrow D57).
  • the wavelet inverse transform unit 206 performs the inverse process of the wavelet transform performed in the wavelet transform unit 103 (FIG. 1) based on the information supplied from the codeword decrypting unit 201 to generate a decoded image. Details of the inverse wavelet transform will be described later.
  • the wavelet inverse transformation unit 206 performs wavelet inverse transformation by repeating synthesis filtering for synthesizing the low frequency component and the high frequency component of the coefficient data. At this time, the wavelet inverse transformation unit 206 supplies the coefficient data of the next lower layer generated by performing the synthesis filtering to the buffer unit 207 (arrow D58), and uses it for the next synthesis filtering. That is, the wavelet inverse transform unit 206 uses the coefficient data (arrow D59) read from the buffer unit 207 as necessary in addition to the coefficient data (arrow D57) supplied from the coefficient line reading unit 212. Perform synthetic filtering.
  • the wavelet inverse transform unit 206 When the synthesis filtering is repeatedly performed as described above to restore the decoded image, the wavelet inverse transform unit 206 outputs the image data to the outside of the image decoding device 200 (arrow D60).
  • the code lines of the respective division levels are transmitted in a predetermined transmission order (for example, the order from the low frequency component to the high frequency component).
  • the coefficient line rearrangement unit 205 rearranges the coefficient lines of each division level from this transmission order to the wavelet inverse transform processing order.
  • the coefficient lines at each division level are held in the coefficient line rearrangement buffer 211 of the coefficient line rearrangement unit 205.
  • the coefficient line reading unit 212 rearranges the coefficient lines by reading each coefficient line in the order of wavelet transform processing.
  • two lines of low-frequency sub-band coefficient lines in the horizontal and vertical directions in the hierarchy one level lower than the coefficient line of each sub-band of a certain hierarchy are generated by one synthesis filtering.
  • such synthesis filtering is repeated in a predetermined order.
  • the order is arbitrary, but in order to perform with lower delay, it is desirable to preferentially execute the synthesis filtering for the lower layer among the feasible ones.
  • the coefficient line rearrangement unit 205 can perform the wavelet inverse transformation processing on the coefficient lines of the respective division levels in such an order without requiring an unnecessary waiting time or the like. Rearrange in a predetermined order.
  • FIG. 17 shows an example of the rearrangement.
  • the coefficient lines are arranged in the processing order.
  • a time series is shown from the top to the bottom in the figure. That is, each coefficient line shown in FIG. 17 is processed in order from the top in the figure.
  • the coefficient lines of the respective division levels output from the inverse quantization unit 204 in the order shown in the left side of FIG. 17 are converted into the order shown in the right side of FIG. Rearranged in the order of wavelet inverse transform.
  • the coefficient line rearrangement buffer 211 stores the coefficient lines of each division level in the order shown on the left side of FIG.
  • the coefficient line reading unit 212 reads the coefficient lines of each division level from the coefficient line rearrangement buffer 211 in the order shown on the right side of FIG.
  • the coefficient line reading unit 212 reads the coefficient line of the division level 4 line P, reads the coefficient line of the division level 3 line N, reads the coefficient line of the division level 2 line M, and divides it.
  • the coefficient line of the level 1 line L is read, and the coefficient line of the division level 1 line (L + 1) is read.
  • the coefficient line reading unit 212 reads the division level 2 line (M + 1) coefficient line, reads the division level 1 line (L + 2) coefficient line, and reads the division level 1 line (L + 3) coefficient line. read out.
  • the coefficient line reading unit 212 reads the division level 3 line (N + 1) coefficient line, reads the division level 2 line (M + 2) coefficient line, and reads the division level 1 line (L + 4) coefficient line. Read, read coefficient line of division level 1 line (L + 5).
  • the coefficient line reading unit 212 reads the coefficient line of the division level 2 line (M + 3), reads the coefficient line of the division level 1 line (L + 6), and reads the coefficient line of the division level 1 line (L + 7). read out.
  • the wavelet inverse transform unit 206 performs synthesis filtering using the coefficient lines supplied in this order in the order of supply.
  • the coefficient line rearrangement unit 205 rearranges the coefficient lines of the respective division levels supplied in the transmission order different from the wavelet inverse transformation processing order, in the order of the wavelet inverse transformation processing for each line block. Management of coefficient data in the inverse transform process becomes easy, and the wavelet inverse transform unit 206 can perform the wavelet inverse transform process with a lower delay.
  • the image decoding apparatus 200 can decode the encoded data with lower delay even when the code lines of the respective division levels are transmitted in a transmission order different from the order of the wavelet transform processing. it can. That is, the image decoding apparatus 200 can improve the decoding throughput of encoded data.
  • FIG. 17 rearrangement of one line block in a steady state is shown.
  • the rearrangement method of the initial state corresponding to the example of FIG. 17 is easily based on the example of FIG. Since it can identify, the description is abbreviate
  • the wavelet inverse transformation unit 206 performs wavelet inverse transformation by a method corresponding to the wavelet transformation processing by the wavelet transformation unit 103. For example, as described above, when the wavelet transform unit 103 performs analysis filtering using a 5 ⁇ 3 filter, the wavelet inverse transform unit 206 also performs synthesis filtering using a 5 ⁇ 3 filter.
  • the process is basically the same as in the case of analysis filtering. That is, also in the case of synthesis filtering, the calculation of the filter processing can be reduced by using a lifting technique as shown in FIG.
  • FIG. 18 is a diagram in the case where filtering is performed on vertical lines using a 5 ⁇ 3 synthesis filter.
  • the horizontal direction illustrates the calculation process and the low-order coefficients generated thereby.
  • horizontal processing is performed in the same manner as vertical processing.
  • the division level 2 coefficient line is N / 4.
  • N / 2 lines of the division level 1 subband 1LL are generated.
  • FIG. 20 is a diagram showing data processed by the wavelet inverse transform unit 206 in time series in a steady state.
  • the data processed by the wavelet inverse transform unit 206 are arranged in time series in the direction from top to bottom in the figure.
  • the wavelet inverse transform unit 206 When wavelet transforming one line block in a steady state, the wavelet inverse transform unit 206 first converts one coefficient line (line P) of each subband (subbands 4HH, 4HL, 4LH, and 4LL) of division level 4 into one. Then, synthesis filtering is performed to generate two coefficient lines (line N and line (N + 1)) of subband 3LL at division level 3. Among these, the coefficient line of the line (N + 1) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transform unit 206 performs synthesis filtering on the division level 3 subband 3LL (line N) and one coefficient line (line N) of each of the other subbands (subbands 3HH, 3HL, and 3LH).
  • Two coefficient lines (line M and line (M + 1)) are generated from the subband 2LL at the division level 2. Among these, the coefficient line of the line (M + 1) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transform unit 206 synthesizes and filters the division level 2 subband 2LL (line M) and one coefficient line (line M) of each of the other subbands (subbands 2HH, 2HL, and 2LH), Two coefficient lines (line L and line (L + 1)) are generated from the division level 1 subband 1LL. Among these, the coefficient line of the line (L + 1) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transformation unit 206 performs synthesis filtering on the subband 1LL (line L) at the division level 1 and one coefficient line (line L) of each of the other subbands (subbands 1HH, 1HL, and 1LH), Two lines (line K and line (K + 1)) of the baseband image data are generated. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transform unit 206 reads the division level 1 subband 1LL (line (L + 1)) from the buffer unit 207, and 1 coefficient line (subbands 1HH, 1HL, and 1LH) of each subband (subband 1HH, 1HL, and 1LH).
  • Line (L + 1)) is combined and filtered to generate two lines (line (K + 2) and line (K + 3)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transformation unit 206 reads the division level 2 subband 2LL (line (M + 1)) from the buffer unit 207, and 1 coefficient line (subbands 2HH, 2HL, and 2LH) of one coefficient line (subband 2HH, 2HL, and 2LH).
  • Line (M + 1)) is combined and filtered to generate two coefficient lines (line (L + 2) and line (L + 3)) from subband 1LL at division level 1.
  • the coefficient line of the line (L + 3) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transform unit 206 performs division level 1 subband 1LL (line (L + 2)) and one coefficient line (line (L + 2)) of each of the other subbands (subbands 1HH, 1HL, and 1LH). Synthetic filtering is performed to generate two lines (line (K + 4) and line (K + 5)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transform unit 206 reads the division level 1 subband 1LL (line (L + 3)) from the buffer unit 207, and 1 coefficient line (subbands 1HH, 1HL, and 1LH) of one coefficient line (subband 1HH, 1HL, and 1LH).
  • Line (L + 3)) is combined and filtered to generate two lines (line (K + 6) and line (K + 7)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transformation unit 206 reads the subband 3LL (line (N + 1)) at the division level 3 from the buffer unit 207, and 1 coefficient line (subbands 3HH, 3HL, and 3LH) of each subband (subband 3HH, 3HL, and 3LH).
  • Line (N + 1)) is combined and filtered to generate 2 coefficient lines (line (M + 2) and line (M + 3)) from subband 2LL at division level 2.
  • the coefficient line of the line (M + 3) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transformation unit 206 performs division level 2 subband 2LL (line (M + 2)) and one coefficient line (line (M + 2)) of each of the other subbands (subbands 2HH, 2HL, and 2LH). Synthetic filtering is performed to generate two coefficient lines (line (L + 4) and line (L + 5)) from the subband 1LL at the division level 1. Among these, the coefficient line of the line (L + 5) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transform unit 206 performs division level 1 subband 1LL (line (L + 4)) and one coefficient line (line (L + 4)) of each of the other subbands (subbands 1HH, 1HL, and 1LH). Synthetic filtering is performed to generate two lines (line (K + 8) and line (K + 9)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transform unit 206 reads the division level 1 subband 1LL (line (L + 5)) from the buffer unit 207, and 1 coefficient line (subband 1HH, 1HL, and 1LH) of one coefficient line (subband 1HH, 1HL, and 1LH).
  • Line (L + 5)) is combined and filtered to generate two lines (line (K + 10) and line (K + 11)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transformation unit 206 reads the sub-band 2LL (line (M + 3)) at the division level 2 from the buffer unit 207, and 1 coefficient line (sub-band 2HH, 2HL, and 2LH) of one coefficient line ( Line (M + 3)) is combined and filtered to generate 2 coefficient lines (line (L + 6) and line (L + 7)) from subband 1LL of division level 1. Among these, the coefficient line of the line (L + 7) is supplied to the buffer unit 207 and held.
  • the wavelet inverse transformation unit 206 performs division level 1 subband 1LL (line (L + 6)) and one coefficient line (line (L + 6)) of each of the other subbands (subbands 1HH, 1HL, and 1LH). Synthetic filtering is performed to generate two lines (line (K + 12) and line (K + 13)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transform unit 206 reads the division level 1 subband 1LL (line (L + 7)) from the buffer unit 207, and 1 coefficient line (subbands 1HH, 1HL, and 1LH) of one coefficient line (subband 1HH, 1HL, and 1LH).
  • Line (L + 7)) and synthetic filtering are performed to generate two lines (line (K + 14) and line (K + 15)) of the baseband image data. These two lines are output to the outside of the image decoding apparatus 200.
  • the wavelet inverse transformation unit 206 performs synthesis filtering in the above-described procedure, inversely wavelet transforms the coefficient lines for one line block, and generates 16 lines of baseband image data.
  • the coefficient line rearrangement unit 205 performs rearrangement as shown in FIG. 17 in accordance with the order of such wavelet inverse transformation processing.
  • each coefficient line is supplied to the wavelet inverse transform unit 206 in the order required for repeated synthesis filtering. Therefore, the wavelet inverse transform unit 206 does not need unnecessary waiting time and the like, and the wavelet has a low delay. Inverse conversion processing can be performed.
  • the order after the coefficient lines are rearranged by the coefficient line rearrangement unit 205 can be easily obtained by reflecting the difference shown in FIGS. 9 and 10 in the example of FIG.
  • image data (and encoded data) is subjected to wavelet transform / wavelet inverse transform processing (encoding / decoding processing) in units of line blocks by the image encoding device 100 and the image decoding device 200.
  • one line block composed of 16 lines of baseband image data is wavelet transformed by the image encoding device 100, and as shown in FIG. Division level 1 coefficient lines, 4 division level 2 coefficient lines, 2 division level 3 coefficient lines, and 1 division level 4 coefficient line.
  • each coefficient line is inversely wavelet transformed by the image decoding apparatus 200, and converted to 16 lines of baseband image data (decoded image) as shown in C of FIG.
  • step S201 the codeword decoding unit 201 receives input of encoded data for one line block.
  • step S202 the codeword decoding unit 201 decodes the codeword of the input encoded data and extracts related information.
  • the codeword decoding unit 201 provides necessary information to each processing unit based on the extracted related information.
  • step S203 the line extraction unit 202 extracts a processing target line based on information (for example, a code amount) provided from the codeword decoding unit 201.
  • step S204 the entropy decoding unit 203 performs entropy decoding on the processing target line supplied from the line extraction unit 202.
  • step S205 the inverse quantization unit 204 inversely quantizes the processing target line.
  • step S206 the coefficient line rearrangement buffer 211 holds the processing target line.
  • step S207 the line extraction unit 202 determines whether one line block has been processed. If it is determined that there is an unprocessed coefficient line, the process returns to step S203, and the subsequent processing is repeated. If it is determined in step S207 that processing for one line block has been performed, the process proceeds to step S208.
  • step S208 the coefficient line reading unit 212 reads the coefficient data from the coefficient line rearrangement buffer 211, thereby rearranging the coefficient data in the wavelet inverse transformation order.
  • step S209 the wavelet inverse transformation unit 206 inversely transforms the coefficient data.
  • step S210 the wavelet inverse transform unit 206 determines whether one line block has been processed. If it is determined that there is an unprocessed coefficient line, the process returns to step S209, and the subsequent processing is repeated. If it is determined in step S210 that one line block has been processed, the process proceeds to step S211.
  • step S211 the codeword decoding unit 201 determines whether or not processing has been performed up to the last line block (for example, the bottom line block) of the processing target picture. If it is determined that processing is not performed, the process returns to step S201, and the subsequent processing is repeated for the next line block. If it is determined in step S211 that the processing has been completed up to the last line block, the decoding processing for the processing target picture is ended.
  • the last line block for example, the bottom line block
  • the image decoding apparatus 200 can improve the decoding throughput of the encoded data.
  • the coefficient line rearrangement unit 205 has been described so that the coefficient lines arranged in the transmission order are rearranged in the wavelet inverse transformation order.
  • This transmission order means the order in which encoded data is transmitted. .
  • the coefficient line rearrangement unit 205 rearranges the coefficient lines arranged in the coding order in the wavelet inverse transformation order.
  • the coefficient line rearrangement unit 205 rearranges the coefficient lines in the wavelet transform order in the wavelet inverse transform order.
  • the coefficient line rearrangement unit 205 outputs the coefficient lines in the wavelet inverse transformation order.
  • the coefficient line rearrangement unit 205 can determine the arrangement order of such input coefficient lines based on the information supplied from the codeword decoding unit 201, so that the arrangement according to the arrangement order can be easily performed. It can be performed. That is, regardless of the order of the input coefficient lines, the coefficient line rearrangement unit 205 can easily arrange them in the wavelet inverse transformation order based on the information supplied from the codeword decoding unit 201. Can be replaced.
  • FIG. 23 is a diagram illustrating a configuration example of an image transmission system that encodes and transmits an input image, decodes the encoded data at a transmission destination, and outputs the obtained decoded image.
  • the image transmission system 300 is a system that transmits an image with lower delay.
  • the image transmission system 300 includes a transmission device 301 and a reception device 303 that are connected via a network 302.
  • the transmission device 301 is a device that transmits an input image to the reception device 303 via the network 302.
  • the transmission device 301 encodes image data and transmits the encoded data to the reception device 303 in order to efficiently transmit an image.
  • the transmission device 301 includes an encoding unit 311, a packetizing processing unit 312, and a transmission unit 313.
  • the encoding unit 311 encodes an input image and outputs encoded data.
  • the image encoding device 100 described in the first embodiment is applied to the encoding unit 311. That is, the encoding unit 311 has the same configuration as that of the image encoding device 100 and performs the same processing.
  • the packetization processing unit 312 packetizes the encoded data (code stream) output from the encoding unit 311.
  • the transmission unit 313 transmits the packet generated by the packetization processing unit 312 to the reception unit 321 via the network 302.
  • the network 302 is an unstable transmission path in which the communicable bandwidth is not constant and packet loss and transmission / reception errors may occur, such as the Internet and wireless LAN.
  • the configuration of the network 302 is arbitrary as long as it is a transmission line having unstable characteristics as a whole.
  • the reception device 303 is a device that receives a packet supplied from the transmission device 301 via the network 302, decodes encoded data included in the packet, generates a decoded image, and outputs the decoded image.
  • the reception device 303 includes a reception unit 321, a depacketization processing unit 322, and a decoding unit 323.
  • the reception unit 321 performs processing corresponding to the transmission unit 313 of the transmission device 301 and performs processing of receiving a packet supplied from the transmission unit 313 via the network.
  • the depacketizing processing unit 322 depacketizes the packet received by the receiving unit 321 and extracts encoded data.
  • the decoding unit 323 decodes the encoded data extracted by the depacketization processing unit 322 and outputs a decoded image.
  • the image decoding apparatus 200 described in the second embodiment is applied to the decoding unit 323. That is, the decoding unit 323 has the same configuration as the image decoding device 200 and performs the same processing.
  • the transmission device 301 can easily perform rate control and improve resistance to instability of the transmission path. Further, by applying the image decoding apparatus 200 as the decoding unit 323, the receiving apparatus 303 can facilitate data management at the time of wavelet inverse transformation, and the transmitting apparatus 301 can easily perform rate control, Even when control is performed to improve the tolerance to instability, the decoding can be performed with low delay.
  • the reception unit 321 requests the transmission unit 313 to retransmit the lost packet.
  • the encoding unit 311 outputs the code lines of the respective division levels in order from the low range to the high range.
  • the transmission part 313 will transmit the low frequency component which has a big influence on an image quality previously. That is, when an error occurs and the receiving unit 321 performs a retransmission request, a longer time for the retransmission process can be secured for a low frequency component that greatly affects image quality.
  • the transmission unit 313 can cope with the rapid rate change by interrupting and omitting packet transmission in the middle. At this time, it is possible to reduce the influence of such transmission control on the image quality as much as possible by transmitting the low-frequency component that greatly affects the image quality first.
  • the image transmission system 300 can improve the throughput of the entire image data transmission process.
  • the CPU 401 of the personal computer 400 executes various processes in accordance with a program stored in a ROM (Read Only Memory) 402 or a program loaded from a storage unit 413 to a RAM (Random Access Memory) 403.
  • the RAM 403 also appropriately stores data necessary for the CPU 401 to execute various processes.
  • the CPU 401, the ROM 402, and the RAM 403 are connected to each other via a bus 404.
  • An input / output interface 410 is also connected to the bus 404.
  • the input / output interface 410 includes an input unit 411 including a keyboard and a mouse, a display including a CRT (Cathode Ray Tube) and an LCD (Liquid Crystal Display), an output unit 412 including a speaker, a hard disk, and the like.
  • a communication unit 414 including a storage unit 413 and a modem is connected. The communication unit 414 performs communication processing via a network including the Internet.
  • a drive 415 is connected to the input / output interface 410 as necessary, and a removable medium 421 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately mounted, and a computer program read from these is loaded. It is installed in the storage unit 413 as necessary.
  • a program constituting the software is installed from a network or a recording medium.
  • the recording medium is distributed to distribute the program to the user separately from the apparatus main body, and includes a magnetic disk (including a flexible disk) on which the program is recorded, an optical disk ( It only consists of removable media 421 consisting of CD-ROM (compact disc-read only memory), DVD (including digital versatile disc), magneto-optical disc (including MD (mini disc)), or semiconductor memory. Rather, it is composed of a ROM 402 on which a program is recorded and a hard disk included in the storage unit 413, which is distributed to the user in a state of being incorporated in the apparatus main body in advance.
  • a magnetic disk including a flexible disk
  • an optical disk It only consists of removable media 421 consisting of CD-ROM (compact disc-read only memory), DVD (including digital versatile disc), magneto-optical disc (including MD (mini disc)), or semiconductor memory. Rather, it is composed of a ROM 402 on which a program is recorded and a hard disk included in the storage unit 413, which is distributed to the user in a
  • the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
  • the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but may be performed in parallel or It also includes processes that are executed individually.
  • system represents the entire apparatus composed of a plurality of devices (apparatuses).
  • the configuration described as one device (or processing unit) may be divided and configured as a plurality of devices (or processing units).
  • the configurations described above as a plurality of devices (or processing units) may be combined into a single device (or processing unit).
  • a configuration other than that described above may be added to the configuration of each device (or each processing unit).
  • a part of the configuration of a certain device (or processing unit) may be included in the configuration of another device (or other processing unit). . That is, the embodiment of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the gist of the present invention.
  • 100 image encoding device 101 image line input unit, 102 line buffer unit, 103 wavelet transform unit, 104 coefficient line rearrangement unit, 105 quantization unit, 106 entropy encoding unit, 107 addition unit, 108 code line rearrangement unit , 109 rate control unit, 111 coefficient line rearrangement buffer, 112 coefficient line readout unit, 121 code line rearrangement buffer, 122 code line readout unit, 200 image decoding device, 201 codeword decoding unit, 202 line extraction unit, 203 entropy Decoding unit, 204 Inverse quantization unit, 205 Coefficient line rearrangement unit, 206 Wavelet inverse transformation unit, 207 Buffer unit, 211 Coefficient line rearrangement buffer, 212 Coefficient line reading block

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 本発明は、画像の符号化や復号の単位時間当たりの処理能力を向上させることができる画像処理装置および方法に関する。 係数ライン並び替え部104は、係数ラインの順序を、ウェーブレット逆変換処理の順序とも、伝送時の順序とも異なる、レート制御部109が符号化難易度をより早期に推定することができるような順序である符号化処理用の順序に並び替える。符号ライン並び替え部108は、符号ラインの順序を、ウェーブレット逆変換処理の順序とは異なる、伝送可能レートの不安定さに対する耐性を向上させることができるような順序である伝送用の順序に並び替える。本発明は、例えば、画像処理装置に適用することができる。

Description

画像処理装置および方法
 本発明は、画像処理装置および方法に関し、特に、画像の符号化や復号の単位時間当たりの処理能力を向上させることができるようにした画像処理装置および方法に関する。
 従来の代表的な画像圧縮方式として、ISO(International Standards Organization)によって標準化されたJPEG(Joint Photographic Experts Group)やJPEG2000がある。
 近年では画像をフィルタバンクと呼ばれるハイパス・フィルタとローパス・フィルタとを組み合わせたフィルタによって複数の帯域に分割し、帯域毎に符号化を行う方式の研究が盛んになっている。その中でも、ウェーブレット変換符号化は、DCT(Discrete Cosine Transform)変換で問題になる高圧縮でのブロック歪みが無いことから、DCTに代わる新たな技術として有力視されている。
 2001年1月に国際標準化が完了したJPEG2000は、このウェーブレット変換に高能率なエントロピー符号化(ビットプレーン単位のビット・モデリングと算術符号化)を組み合わせた方式を採用しており、JPEGに比べて符号化効率の大きな改善を実現している。
 このJPEG2000はデジタルシネマ規格(DCI(Digital Cinema Initiative)規格)用の標準コーデックとしても選定されており、映画の様な動画像用の圧縮にも使われ始めている。また各メーカからJPEG2000を監視カメラや放送局用の取材カメラ、セキュリティ・レコーダなどに応用した製品も出始めている。
 しかしながら、JPEG2000は基本的にピクチャ単位の符号化・復号を行うため、リアルタイム送受信に使うために低遅延を実現しようとした場合、エンコード(符号化)で最低1ピクチャ分、デコード(復号)でも最低1ピクチャ分の遅延が生じる。
 これはJPEG2000のみならず、AVC(Advanced Video Coding)イントラ、JPEG等どのコーデックについても同様である。但し、最近になって、画面を幾つかの矩形スライスまたはタイルに分けて、それらを独立にエンコード・デコードを行うことで遅延時間を短縮する手段が提案されている(例えば、特許文献1参照)。
特開2007-311924号公報
 しかしながら、近年においては、取り扱う画像の解像度、フレームレート、および階調等の値がさらに大きくなり、画像データのデータ量が増大している。
 このような画像をより低遅延で(略リアルタイムに)符号化し復号するために、結果として、スループット(単位時間当たりの処理能力)の更なる向上が求められている。そのスループットの更なる向上のために、画像の符号化、符号化データの伝送、および符号化データの復号等、各処理の更なる効率化が求められる。
 本発明は、このような状況に鑑みて提案されたものであり、画像の符号化や復号の単位時間当たりの処理能力を向上させることを目的とする。
 本発明の一側面は、階層的に分析フィルタ処理を行い、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロックを、周波数帯域毎に分解された係数データに変換する分析フィルタ手段と、前記分析フィルタ手段により生成された前記係数データを符号化する符号化手段と、前記符号化手段により前記係数データが符号化されて得られる符号化データの並びを、前記分析フィルタ手段による前記分析フィルタ処理の出力順から、合成フィルタ処理される順とは異なる所定の順であり、伝送路の不安定さに対する耐性を向上させる伝送順に並び替える符号化データ並び替え手段とを備える画像処理装置である。
 前記符号化データ並び替え手段は、各分割レベルの前記符号化データを、前記伝送順として、低域成分から高域成分に向かう順に並び替えることができる。
 前記分析フィルタ手段により生成された前記係数データの並びを、前記分析フィルタ手段による前記分析フィルタ処理の出力順から、前記合成フィルタ処理される順および前記伝送順と異なる所定の順であり、前記符号化データのレート制御を容易にする符号化順に並び替える係数データ並び替え手段と、
 前記係数データ並び替え手段により並び替えられた前記係数データを量子化する量子化手段と、
 前記符号化手段による符号化結果に基づいて、前記量子化手段による量子化の量子化ステップサイズを制御することにより前記符号化データのレートを制御するレート制御手段と
 をさらに備え、
 前記符号化手段は、前記量子化手段により量子化された前記係数データを符号化することができる。
 前記係数データ並び替え手段は、各分割レベルの前記係数データを、前記伝送順として、高域成分から低域成分に向かう順に並び替えることができる。
 前記分析フィルタ手段は、前記分析フィルタ処理を、リフティング演算を用いて行うことができる。
 前記分析フィルタ手段は、初期状態のラインブロックに対しては、必要な画素の対称拡張を行ってから前記リフティング演算を行い、定常状態のラインブロックに対しては、前回の前記リフティング演算結果を利用して、前記リフティング演算を行うことができる。
 前記分析フィルタ手段は、前記係数データに対して、水平方向に前記リフティング演算を行ってから、垂直方向に前記リフティング演算を行うことができる。
 本発明の一側面は、また、画像処理装置の分析フィルタ手段が、階層的に分析フィルタ処理を行い、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロックを、周波数帯域毎に分解された係数データに変換し、前記画像処理装置の符号化手段が、前記分析フィルタ処理により生成された前記係数データを符号化し、前記画像処理装置の符号化データ並び替え手段が、前記係数データが符号化されて得られる符号化データの並びを、前記分析フィルタ処理の出力順から、合成フィルタ処理される順とは異なる所定の順であり、伝送路の不安定さに対する耐性を向上させる伝送順に並び替える画像処理方法である。
 本発明の他の側面は、階層的な分析フィルタ処理により所定ライン数の画像データが周波数帯域毎に分解された、少なくとも最低域成分のサブバンドの係数データを1ライン以上含む、各サブバンドの係数データ群からなるラインブロックが符号化されて生成された符号化データを、復号する復号手段と、前記復号手段により復号されて得られた前記係数データの並びを、前記復号手段により復号された順から、合成フィルタ処理される順に並び替える係数データ並び替え手段と、階層的に前記合成フィルタ処理を行い、前記係数データ並び替え手段により並び替えられた各サブバンドの前記係数データを前記画像データに変換する合成フィルタ手段とを備える画像処理装置である。
 前記合成フィルタ手段は、実行可能な中で、より下位の階層のサブバンドの係数データに対する前記合成フィルタ処理を優先的に実行することができる。
 前記符号化データを解読する解読手段と、前記解読手段による解読結果に基づいて、前記符号化データを、各階層の前記係数データの1ライン分に対応する符号化データ毎に分割し、抽出する抽出手段とをさらに備え、前記復号手段は、前記抽出手段により抽出された前記符号化データを復号することができる。
 前記係数データ並び替え手段は、前記解読手段による解読結果に基づいて、前記係数データの並び順を判別し、判別された並び順を、合成フィルタ処理される順に替えることができる。
 前記合成フィルタ手段は、前記合成フィルタ処理を、リフティング演算を用いて行うことができる。
 前記合成フィルタ手段は、初期状態のラインブロックに対しては、必要な係数データの対称拡張を行ってから前記リフティング演算を行い、定常状態のラインブロックに対しては、前回の前記リフティング演算結果を利用して、前記リフティング演算を行うことができる。
 前記合成フィルタ手段は、前記係数データに対して、水平方向に前記リフティング演算を行ってから、垂直方向に前記リフティング演算を行うことができる。
 本発明の他の側面は、また、画像処理装置の復号手段は、階層的な分析フィルタ処理により所定ライン数の画像データが周波数帯域毎に分解された、少なくとも最低域成分のサブバンドの係数データを1ライン以上含む、各サブバンドの係数データ群からなるラインブロックが符号化されて生成された符号化データを、復号し、前記画像処理装置の係数データ並び替え手段は、復号されて得られた前記係数データの並びを、その復号された順から、合成フィルタ処理される順に並び替え、前記画像処理装置の合成フィルタ手段は、階層的に前記合成フィルタ処理を行い、並び替えられた各サブバンドの前記係数データを前記画像データに変換する画像処理方法である。
 本発明の一側面においては、階層的に分析フィルタ処理が行われ、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロックが、周波数帯域毎に分解された係数データに変換され、分析フィルタ処理により生成された係数データが符号化され、係数データが符号化されて得られる符号化データの並びが、分析フィルタ処理の出力順から、合成フィルタ処理される順とは異なる所定の順であり、伝送路の不安定さに対する耐性を向上させる伝送順に並び替えられる。
 本発明の他の側面においては、階層的な分析フィルタ処理により所定ライン数の画像データが周波数帯域毎に分解された、少なくとも最低域成分のサブバンドの係数データを1ライン以上含む、各サブバンドの係数データ群からなるラインブロックが符号化されて生成された符号化データが、復号され、その復号されて得られた係数データの並びが、その復号された順から、合成フィルタ処理される順に並び替えられ、階層的に合成フィルタ処理が行われ、並び替えられた各サブバンドの係数データが画像データに変換される。
 本発明によれば、画像を符号化または復号することができる。特に、画像を符号化し、復号する処理の単位時間当たりの処理能力をより向上させることができる。
本発明を適用した画像符号化装置の主な構成例を示すブロック図である。 サブバンドおよびラインブロックを説明する図である。 5×3フィルタの例を示す図である。 リフティング演算例を説明する図である。 分析フィルタリングの処理の様子を説明する図である。 分析フィルタリングの処理の様子を説明する図である。 分析フィルタリングの処理の様子を説明する図である。 分析フィルタリングの処理の様子を説明する図である。 係数データの出力順の例を説明する図である。 係数データの出力順を説明する図である。 符号化前の係数データの並び替えを説明する図である。 ヘッダ情報の付加の例を説明する図である。 符号化後の符号化データの並び替えを説明する図である。 符号化処理の流れの例を説明するフローチャートである。 マーカの付加の例を説明する図である。 本発明を適用した画像復号装置の主な構成例を示すブロック図である。 復号後の係数データの並び替えを説明する図である。 リフティング演算例を説明する図である。 合成フィルタリングの処理の様子を説明する図である。 係数データの処理順の例を説明する図である。 ラインブロックの変換処理の様子の例を説明する図である。 復号処理の流れの例を説明するフローチャートである。 本発明を適用した画像伝送システムの主な構成例を示すブロック図である。 本発明を適用したパーソナルコンピュータの主な構成例を示すブロック図である。
 以下、発明を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(画像符号化装置)
2.第2の実施の形態(画像復号装置)
3.第3の実施の形態(伝送システム)
4.第4の実施の形態(パーソナルコンピュータ)
<1.第1の実施の形態>
[デバイスの構成]
 図1は、本発明を適用した画像処理装置としての画像符号化装置の一実施の形態の構成を表している。
 図1において、画像符号化装置100は、画像データを符号化する装置である。画像符号化装置100は、画像ライン入力部101、ラインバッファ部102、ウェーブレット変換部103、係数ライン並び替え部104、量子化部105、エントロピ符号化部106、付加部107、符号ライン並び替え部108を有する。画像符号化装置100は、さらにレート制御部109を有する。
 画像ライン入力部101は、入力される画像データ(矢印D10)を、ライン毎にラインバッファ部102に供給し(矢印D11)、ラインバッファ部102に蓄積させる。ラインバッファ部102は、画像ライン入力部101から供給される画像データや、ウェーブレット変換部103から供給される係数データを保持し、所定のタイミングにおいてその画像データや係数データをウェーブレット変換部103に供給する(矢印D12)。
 ウェーブレット変換部103は、ラインバッファ部102から供給される画像データや係数データに対してウェーブレット変換を行い、次の階層の低域成分と高域成分の係数データを生成する。ウェーブレット変換の詳細については後述する。
 ウェーブレット変換部103は、生成した係数データの、垂直方向および水平方向に低域な成分をラインバッファ部102に供給して保持させ(矢印D13)、その他の成分を係数ライン並び替え部104に供給する(矢印D14)。なお、ウェーブレット変換部103は、生成した係数データが最上位層である場合、垂直方向および水平方向に低域な成分も係数ライン並び替え部104に供給する。
 係数ライン並び替え部104には、ウェーブレット変換部103から係数データ(係数ライン)が供給される(矢印D14)。係数ライン並び替え部104は、その係数データ(係数ライン)の順序を、ウェーブレット逆変換処理の順序とも、伝送時の順序とも異なる所定の順序である符号化処理用の順序に並び替える。
 図1に示されるように、係数ライン並び替え部104は、係数ライン並び替えバッファ111および係数ライン読み出し部112を有する。係数ライン並び替えバッファ111は、ウェーブレット変換部103から供給される係数ラインを保持する。係数ライン読み出し部112は、係数ライン並び替えバッファ111に保持された係数ラインを、符号化処理用の順序で読み出す(矢印D15)ことにより、並び替えを行う。この並び替えの詳細については後述する。
 係数ライン並び替え部104(係数ライン読み出し部112)は、順序を並び替えた係数データを量子化部105に供給する(矢印D16)。
 量子化部105は、係数ライン並び替え部104から供給された係数データに対して、量子化を行う。この量子化の方法としてはどのようなものを用いても良く、例えば、一般的な手段、つまり、以下の式(1)に示されるような、係数データWを量子化ステップサイズQで除算する手法を用いれば良い。
 量子化係数=W/Q ・・・(1)
 なお、この量子化ステップサイズQは、レート制御部109により指定される。量子化部105は、量子化された係数データをエントロピ符号化部106に供給する(矢印D17)。
 エントロピ符号化部106は、量子化部105から供給される係数データを、例えばハフマン符号化や算術符号化といった所定のエントロピ符号化方式で符号化する。エントロピ符号化部106は、1係数ラインを符号化すると、その1係数ラインから生成された符号化データである1符号ラインを付加部107に供給する(矢印D18)。エントロピ符号化部106は、さらに、その1符号ラインの符号量を付加部107に供給する(点線矢印D24)。
 付加部107は、エントロピ符号化部106から供給された1符号ラインに対して、同じくエントロピ符号化部106から供給されたその1符号ラインの符号量を、ヘッダ情報として付加する。ヘッダ情報の付加の詳細については後述する。ヘッダ情報を付加すると、付加部107は、その符号化データ(符号ライン)を符号ライン並び替え部108に供給する(矢印D19)。
 符号ライン並び替え部108は、その符号ラインの順序を、ウェーブレット逆変換処理の順序とは異なる所定の順序である伝送用の順序に並び替える。
 図1に示されるように、符号ライン並び替え部108は、符号ライン並び替えバッファ121および符号ライン読み出し部122を有する。符号ライン並び替えバッファ121は、付加部107から供給される符号ライン(ヘッダ情報を含む)を保持する。符号ライン読み出し部122は、符号ライン並び替えバッファ121に保持される符号ラインを、伝送用の順序で読み出す(矢印D20)ことにより、並び替えを行う。この並び替えの詳細については後述する。
 符号ライン並び替え部108(符号ライン読み出し部122)は、順序を並び替えた符号化データを画像符号化装置100の外部に出力する(矢印D21)。画像符号化装置100の外部に出力された符号化データは、例えばネットワーク等を介して、後述する画像復号装置に供給される。
 この符号化データは、符号ライン並び替え部108により、伝送に適した順に並び替えられている。これにより、例えば、伝送可能レートの不安定さに対する耐性を向上させることができる。
 なお、エントロピ符号化部106は、各符号ラインの符号量を、レート制御部109にも供給する(点線矢印D22)。
 レート制御部109は、エントロピ符号化部106から供給される符号ライン毎の符号量に基づいて、画像の符号化難易度を推定し、その符号化難易度に応じて量子化部105により用いられる量子化ステップサイズQを指定する(点線矢印D23)。つまり、レート制御部109は、量子化ステップサイズQを指定することにより、符号化データのレート制御を行う。
 係数ラインは、係数ライン並び替え部104により、レート制御部109が符号化難易度をより早期に推定することができるような順序に並び替えられる。つまり、係数ラインは、その画像の特徴を多く含むものほど先にエントロピ符号化部106によって符号化されるような順に並び替えられる。
 このようにすることにより、画像の特徴をより強く反映する符号量がより先にレート制御部109に供給されることになるので、レート制御部109は、より早期に、量子化ステップサイズQを、画像の符号化難易度に応じた値にする(より早期に適切なレート制御を行う)ことができる。
[サブバンドの説明]
 次に、ウェーブレット変換について説明する。ウェーブレット変換は、画像データを空間周波数の高い成分(高域成分)と低い成分(低域成分)とに分割する分析フィルタリングを、再帰的に繰り返すことにより、画像データを、階層的に構成される周波数成分毎の係数データに変換する処理である。なお、以下において、分割レベルは、高域成分の階層ほど下位とし、低域成分の階層ほど上位とする。
 1つの階層(分割レベル)において、分析フィルタリングは、水平方向と垂直方向の両方について行われる。最初に水平方向の分析フィルタリングが行われ、次に垂直方向の分析フィルタリングが行われる。したがって、1つの階層の係数データ(画像データ)は、1階層分の分析フィルタリングにより4つのサブバンド(LL、LH、HL、およびHH)に分割される。そして、次の階層の分析フィルタリングは、生成された4つのサブバンドのうち、水平方向および垂直方向の両方について低域な成分(LL)に対して行われる。
 このように分析フィルタリングを再帰的に繰り返すことにより、空間周波数の低い帯域の係数データをより小さな領域に追い込むことができる。したがって、このようにウェーブレット変換された係数データを符号化するようにすることにより、効率的な符号化が可能となる。
 図2は、分析フィルタリングを4回繰り返して生成される係数データの構成について説明する図である。
 ベースバンドの画像データに対して分割レベル1の分析フィルタリングが行われると、画像データは、分割レベル1の4つのサブバンド(1LL、1LH、1HL、および1HH)に変換される。この分割レベル1の、水平方向および垂直方向の両方に対して低域成分のサブバンド1LLに対して、分割レベル2の分析フィルタリングが行われ、分割レベル2の4つのサブバンド(2LL、2LH、2HL、および2HH)に変換される。この分割レベル2の、水平方向および垂直方向の両方に対して低域成分のサブバンド2LLに対して、分割レベル3の分析フィルタリングが行われ、分割レベル3の4つのサブバンド(3LL、3LH、3HL、および3HH)に変換される。この分割レベル3の、水平方向および垂直方向の両方に対して低域成分のサブバンド3LLに対して、分割レベル4の分析フィルタリングが行われ、分割レベル4の4つのサブバンド(4LL、4LH、4HL、および4HH)に変換される。
 図2は、このようにして、13個のサブバンドに分割された係数データの構成を示している。
 以上のような分析フィルタリングにより、処理対象となる2ラインの画像データまたは係数データから、1階層上の4つのサブバンドの係数データが1ラインずつ生成される。したがって、図2の斜線部分で示されるように、分割レベル4のサブバンドの係数データが1ラインずつ生成されるのに、サブバンド3LLは2ライン必要であり、サブバンド2LLは4ライン必要であり、サブバンド1LLは8ライン必要である。つまり、16ラインの画像データが必要になる。
 このような最低域成分のサブバンドの1ライン分の係数データを生成するために必要なライン数の画像データをラインブロック(またはプレシンクト)と称する。また、ラインブロックは、その1ラインブロックの画像データをウェーブレット変換して得られる各サブバンドの係数データの集合のことも示す。
 例えば、図2の例の場合、図示せぬ16ラインの画像データが1ラインブロックとなる。また、ラインブロックは、その16ラインの画像データから生成される、分割レベル1の各サブバンドの8ラインの係数データ、分割レベル2の各サブバンドの4ラインの係数データ、分割レベル3の各サブバンドの2ラインの係数データ、および分割レベル4の各サブバンドの1ラインの係数データのことを示す場合もある。
 ウェーブレット変換部103は、ウェーブレット変換をこのようなラインブロック毎に行うとも言える。
 ここでラインとは、ウェーブレット変換前の画像データに対応するピクチャ若しくはフィールド内、各分割レベル内、または各サブバンド内において形成される1行のことを示す。
 この1ライン分の係数データ(画像データ)を係数ラインとも称する。より詳細に区別して説明する必要がある場合、適宜表現を変える。例えば、あるサブバンドのある1ラインを「あるサブバンドの係数ライン」と称し、1つ下位の階層の同じ2係数ラインから生成された、ある階層(分割レベル)の全サブバンド(LH,HL、およびHH(最上位層の場合LLも含む))の1ラインを「ある分割レベル(または階層)の係数ライン」と称する。
 図2の例の場合、「分割レベル4(最上位層)の係数ライン」は、サブバンド4LL,4LH,4HL、および4HHの、互いに対応する(1つ下位の分割レベルの同じ係数ラインから生成された)ある1ラインを示す。また、「分割レベル3の係数ライン」は、サブバンド3LH,3HL、および3HHの、互いに対応するある1ラインを示す。さらに、「サブバンド2HHの係数ライン」は、サブバンド2HHのある1ラインを示す。
 なお、1係数ライン(1ライン分の係数データ)が符号化された1ライン分の符号化データを符号ラインとも称する。
 図2においては、分割レベル4のウェーブレット変換について説明した。以下においても、基本的に、ウェーブレット変換は分割レベル4まで行われるものとして説明するが、実際には、ウェーブレット変換の階層数(分割レベル)は任意である。
[リフティング演算]
 ウェーブレット変換部103は、通常、低域フィルタと高域フィルタとから構成されるフィルタバンクを用いて、上述のような処理を行う。なお、デジタルフィルタは、通常、複数タップ長のインパルス応答すなわちフィルタ係数を持っているため、フィルタ処理を行えるだけの入力画像データまたは係数データを予めバッファリングしておく必要がある。また、ウェーブレット変換を多段にわたって行う場合も同様に、前段で生成したウェーブレット変換係数を、フィルタ処理が行える数だけバッファリングしておく必要がある。
 このウェーブレット変換の具体的な例として、5×3フィルタを用いる方法について説明する。この5×3フィルタを用いる方法は、従来技術で既に説明したJPEG(Joint Photographic Experts Group)2000規格でも採用されており、少ないフィルタタップ数でウェーブレット変換を行うことができる点で、優れた方法である。
 5×3フィルタのインパルス応答(Z変換表現)は、次の式(2)および式(3)に示すように、低域フィルタH 0 (z)と、高域フィルタH1(z)とから構成される。式(2)および式(3)から、低域フィルタH0(z)は、5タップで、高域フィルタH1(z)は、3タップであることが分かる。
 H0(z)=(-1+2z-1+6z-2+2z-3-z-4)/8・・・(2)
 H1(z)=(-1+2z-1-z-2)/2      ・・・(3)
 これら式(2)および式(3)によれば、低域成分および高域成分の係数を、直接的に算出することができる。ここで、リフティング(Lifting)技術を用いることで、フィルタ処理の計算を減らすことができる。
 図3は、5×3フィルタをリフティング表現した図である。図中、最上部の一列が入力信号列である。データ処理は画面上から下方向に流れ、以下の式(4)および式(5)により、高域成分の係数(高域係数)と、低域成分の係数(低域係数)とが出力される。
 di 1=di 0-1/2(si 0+si+1 0) ・・・(4)
 si 1=si 0+1/4(di-1 1+di 1) ・・・(5)
 図4は、5x3分析フィルタを用いて、縦方向のラインに対してフィルタリングを行った場合の図である。横方向は、演算過程とそれによって生成される低域・高域係数を図示したものである。図3の場合と照らし合わせて見れば水平が垂直に変わっただけであり、演算の方法は全く同様であることがわかる。
 画像の上端においては、矢印151に示されるように、Line-1から最上位ラインが点線の様に対称拡張され、1ラインが補填される。枠152で示されるように、これとLine-0、Line-1の合計3ラインを用いてリフティング演算が行われ、Step-1の演算で係数aが生成される。これは高域係数(H0)である。
 Line-1,Line-2,Line-3が入力されると、この3ラインを用いて次の高域係数aが算出される。これは高域係数(H1)である。そして、上記の1番目の高域係数a(H0)と2番目高域係数a(H1)、及びLine-1の係数の合計3つの係数を用いて、式2に従い計算すると係数bが生成される。これは低域係数(L1)である。つまり、枠153で示されるように、Line-1,Line-2,Line-3の3ラインと、高域係数(H0)とを用いて、低域係数(L1)および高域係数(H1)が生成される。
 その後、2ラインが入力される毎に、上記のリフティング演算が後続のラインに対しても同様に繰り返され、低域係数と高域係数とが出力される。そして、枠154に示されるように、低域係数(L(N-1))および高域係数(H(N-1))が生成されると、高域係数(H(N-1))が矢印155のように対称拡張され、枠156のように演算が行われ、低域成分(L(N))が生成される。
 以上のリフティング演算は、各階層について再帰的に行われる。
 また図4は垂直方向のラインに対してフィルタリングを行った例であるが、水平方向のフィルタリングの場合でも全く同様に考えることができることは自明である。
[分析フィルタリングの手順]
 以上のような分析フィルタリングは、図5乃至図8のように進められる。
 すなわち、図5の左に示されるようにベースバンドの画像データが3ライン入力されると、図4を参照して説明したようにリフティング演算が行われ、図5の右に示されるように、分割レベル1の各サブバンド(1LL,1LH,1HL,1HH)が1ラインずつ生成される。
 その後、ベースバンドの画像データが2ライン入力される毎に、同様のリフティング演算が行われるので、図6の左に示されるように、ベースバンドの画像データ7ラインから、図6の右に示されるように、分割レベル1の各サブバンドの係数ラインが3ラインずつ生成される。
 図7の左(図6の右)に示されるように、1LLの係数ラインが3ライン生成されると、図4を参照して説明したようにリフティング演算が行われ、図7の右に示されるように、分割レベル2の各サブバンド(2LL,2LH,2HL,2HH)が1ラインずつ生成される。分割レベル1においてもベースバンドのときと同様に、その後は1LLの係数ラインが2ラインずつ生成される毎にリフティング演算が行われ、分割レベル2の各サブバンドの係数ラインが1ラインずつ生成される。
 したがって、図8の左に示されるように、ベースバンドの画像データが11ラインから、図8の右に示されるように、分割レベル2の各サブバンドの係数ラインが2ラインと、分割レベル1の1LH,1HL、および1HHの各サブバンドの係数ラインが5ラインずつ生成される。
 つまり、その時点で実行可能な、もっとも上位の階層のリフティング演算が実行される。換言すれば、より上位の階層のリフティング演算が優先的に実行される。また、分析フィルタリングは、画像上端の初期状態においては、3ラインの画像データ若しくは係数データが入力として必要である。ただし、それ以外の部分の定常状態においては、2ラインの画像データ若しくは係数データが入力される毎に分析フィルタリングが行われる。
 以上のような手順でリフティング演算は進行される。
[ウェーブレット変換部103の出力]
 次に、以上のような手順で分析フィルタリングを行うウェーブレット変換部103から出力されるデータについて説明する。図9は、初期状態において、ウェーブレット変換部103から出力されるデータを時系列順に示す図である。図9においては、ウェーブレット変換部103から出力されるデータが、図中、上から下に向かう方向に時系列順に並べられている。
 ウェーブレット変換部103が上述したような手順で分析フィルタリングを行うので、初期状態において、分割レベル1(サブバンド1HH,1HL、および1LH)の上から1番目の係数ライン(ライン1)が、ウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。サブバンド1LLのライン1は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン2(上から2番目の係数ライン)およびライン3(上から3番目の係数ライン)が、生成され次第、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン2とライン3は、ラインバッファ部102に供給され保持される。
 上述したように、ウェーブレット変換部103は、ラインバッファ部102にサブバンド1LLの係数ラインが3ライン(2回目以降は2ライン)保持されると、それらに対して分割レベル1の分析フィルタリングを行う。
 したがって、分割レベル1のライン3が出力された後、分割レベル2(サブバンド2HH,2HL、および2LH)のライン1がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン1は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン4(上から4番目の係数ライン)およびライン5(上から5番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン4とライン5は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されたので、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン2がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン2は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン6(上から6番目の係数ライン)およびライン7(上から7番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン6とライン7は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されたので、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン3がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン3は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド2LLの係数ラインが3ライン(2回目以降は2ライン)保持されたので、それらに対して分割レベル2の分析フィルタリングが行われ、分割レベル3(サブバンド3HH,3HL、および3LH)のライン1がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド3LLのライン1は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン8(上から8番目の係数ライン)およびライン9(上から9番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン8とライン9は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン4がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン4は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン10(上から10番目の係数ライン)およびライン11(上から11番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン10とライン11は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン5がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン5は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド2LLの係数ラインが2ライン保持されると、それらに対して分割レベル2の分析フィルタリングが行われ、分割レベル3のライン2がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド3LLのライン2は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン12(上から12番目の係数ライン)およびライン13(上から13番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン12とライン13は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン6がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン6は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン14(上から14番目の係数ライン)およびライン15(上から15番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン14とライン15は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン7がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン7は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド2LLの係数ラインが2ライン保持されると、それらに対して分割レベル2の分析フィルタリングが行われ、分割レベル3のライン3がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド3LLのライン3は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド3LLの係数ラインが3ライン(2回目以降は2ライン)保持されると、それらに対して分割レベル3の分析フィルタリングが行われ、分割レベル4(4HH,4HL,4LH、および4HH)のライン1がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。
 以上が、初期状態においてウェーブレット変換部103から出力される1ラインブロック分の係数ライン群である。初期状態が終了すると、2ラインずつ処理される定常状態に移行する。
 図10は、定常状態において、ウェーブレット変換部103から出力されるデータを時系列順に示す図である。図10においては、図9と同様に、ウェーブレット変換部103から出力されるデータが、図中、上から下に向かう方向に時系列順に並べられている。
 ウェーブレット変換部103が上述したような手順で分析フィルタリングを行うので、定常状態のあるタイミングにおいて、分割レベル1のラインL(上からL番目の係数ライン)およびライン(L+1)(上から(L+1)番目の係数ライン)が、生成され次第、順次、ウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。サブバンド1LLのラインLおよびライン(L+1)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のラインM(上からM番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのラインMは、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン(L+2)(上から(L+2)番目の係数ライン)およびライン(L+3)(上から(L+3)番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン(L+2)とライン(L+3)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン(M+1)(上から(M+1)番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン(M+1)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド2LLの係数ラインが2ライン保持されると、それらに対して分割レベル2の分析フィルタリングが行われ、分割レベル3のラインN(上からN番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド3LLのラインNは、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン(L+4)(上から(L+4)番目の係数ライン)およびライン(L+5)(上から(L+5)番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン(L+4)とライン(L+5)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン(M+2)(上から(M+2)番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン(M+2)は、ラインバッファ部102に供給され保持される。
 続いて、分割レベル1のライン(L+6)(上から(L+6)番目の係数ライン)およびライン(L+7)(上から(L+7)番目の係数ライン)が、この順に生成され、順次、係数ライン並び替え部104に供給される。サブバンド1LLのライン(L+6)とライン(L+7)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド1LLの係数ラインが2ライン保持されると、それらに対して分割レベル1の分析フィルタリングが行われ、分割レベル2のライン(M+3)(上から(M+3)番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド2LLのライン(M+3)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド2LLの係数ラインが2ライン保持されると、それらに対して分割レベル2の分析フィルタリングが行われ、分割レベル3のライン(N+1)(上から(N+1)番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。また、サブバンド3LLのライン(N+1)は、ラインバッファ部102に供給され保持される。
 ラインバッファ部102にサブバンド3LLの係数ラインが2ライン保持されると、それらに対して分割レベル3の分析フィルタリングが行われ、分割レベル4のラインP(上からP番目の係数ライン)がウェーブレット変換部103から出力され、係数ライン並び替え部104に供給される。
 以上のような定常状態において、一番下のラインまで処理される。
 なお、ウェーブレット変換部103の各係数ラインの処理順、すなわち、ウェーブレット変換部103からの各係数ラインの出力順は、任意であり、上述した以外の順序であってもよい。ただし、上述したような手順で分析フィルタリングを行うことにより、ウェーブレット変換部103は、効率よく各係数ラインを生成することができ、低遅延に変換処理を行うことができる。
[係数ライン並び替え]
 図9および図10を参照して説明したような順でウェーブレット変換部103から出力された各分割レベルの係数ラインは、係数ライン並び替え部104の係数ライン並び替えバッファ111に保持される。係数ラインが1ラインブロック分蓄積されると、係数ライン読み出し部112は、各係数ラインを、ウェーブレット逆変換処理の順序とも、伝送時の順序とも異なる所定の順序である符号化処理用の順序で読み出すことにより、係数ラインの並び替えを行う。
 ウェーブレット変換処理の順序や伝送時の順序については後述するが、符号化処理用の順序とは、レート制御部109が符号化難易度をより早期に推定することができるような順序のことである。換言するに、係数ライン読み出し部112は、画像の特徴をより多く含む係数ラインほど優先的に読み出す。
 一般的に画像信号は、より低域な成分ほど、エネルギーが集中しており、逆に高域成分には人間の視覚特性的に検知しにくいエッジやノイズ成分が反映される。つまり高域成分には係数が元々少ないので、その高域成分の係数がより先に符号化されるようにすることによって、その画像の符号化難易度がより早く判明するようにすることができる。
 したがって、係数ライン読み出し部112は、例えば、係数ラインを、図11に示されるように高域成分から低域成分に向かう順に読み出す。
 図11において、各係数ラインは、その処理順に並べられている。図中上から下に向かう向きに時系列が示されている。つまり、図11に示される各係数ラインは、図中上から順に処理される。
 つまり、図11の左側に示されるような順序(ウェーブレット変換出力順)でウェーブレット変換部103から出力された各係数ラインは、係数ライン並び替え部104により、図11の右側に示されるような高域成分から低域成分に向かう順(符号化順)に並び替えられる。
 より具体的には、係数ライン読み出し部112は、分割レベル1の各係数ラインを読み出し、分割レベル2の各係数ラインを読み出し、分割レベル3の各係数ラインを読み出し、最後に分割レベル4の係数ラインを読み出し、読み出した各係数ラインを、その読み出し順に量子化部105に供給する。
 量子化部105は、各係数ラインを、供給された順に処理し、エントロピ符号化部106に供給するので、エントロピ符号化部106も、この図11の左に示される順に、各係数ラインを処理することになる。つまり、係数ライン読み出し部112が読み出した順序が、符号化順となる。
 レート制御部109は、係数値が小さければ量子化ステップサイズを小さくするように設定して符号量発生を促進し、係数値が大きければステップサイズを大きくするように設定して符号量の発生を抑制するなどの制御を行う。このような制御を高域成分の符号量に基づいて行うほうが、レート制御部109は、画像の符号化難易度をより正確に推定することができる。
 つまり、このように並び替えを行うことにより、画像の符号化難易度をより早期に把握することができるので、レート制御部109は、より早期に量子化ステップ数を適切な値に設定することができる。すなわち、レート制御が容易になる。
 画像符号化装置100の場合、低遅延に画像を符号化しなければならず、レート制御部109は、非常に限られた情報(係数ライン毎の符号量)に基づいて、エントロピ符号化処理と並行して、非常に限られた時間でレート制御を行わなければならない。
 仮に、このレート制御を適切に行うことができない場合、不要な画質の劣化を招く恐れがあり、画像符号化装置100が現実的な装置として成立しない恐れがある。したがって、限られた情報に基づいて短時間で適切なレート制御を行うことは大変重要な意味を持つ。そして、画像符号化装置100のスループットが向上するほど、このレート制御の難易度は高くなる。
 上述したように係数ライン並び替え部104が係数ラインの並び替えを行うことにより、より早期に量子化ステップ数を適切な値に設定することができ、レート制御が容易になるので、レート制御部109は、スループットの更なる向上に対応することができるようになる。すなわち、画像符号化装置100は、画像の符号化のスループットをさらに向上させることができる。
 なお、係数ライン並び替え部104により並び替えられた係数ラインの符号化順は、上述した以外の順であってももちろんよい。ただし、上述した理由から、一般的には、高域成分から低域成分に向かう順を符号化順とするのが望ましい。
 また、この係数ラインの並び替えは、エントロピ符号化の前に行われればよく、量子化処理の後に行うようにしてもよい。つまり、係数ライン並び替え部104は、量子化部105とエントロピ符号化部106との間に設けるようにしてもよい。この場合、ウェーブレット変換部103から出力される係数ラインは、量子化部105において量子化された後、係数ライン並び替えバッファ111に供給され、保持される。
[符号量の付加]
 上述したように、付加部107は、各符号ラインに対して、その符号ラインの符号量を、ヘッダ情報として付加する。図12にその様子の例を示す。
 図12の例において、付加部107は、各分割レベルの符号ライン(符号語)に対して、その符号量をヘッダ情報(Code_info)として付加している。例えば、分割レベル1の符号ライン(ラインL)の符号量が100バイトの場合、その符号ライン(ラインL)の例えば先頭に、「100バイト」を示す情報が、ヘッダ情報(Code_info(L))として付加される。
 上述したように、画像符号化装置100の各部は、係数データを係数ライン毎に取り扱う。すなわち、各部は、係数ラインの境界を把握することができる。しかしながら、画像符号化装置100により生成された符号化データを復号する画像復号装置には、各符号ラインが連続して供給されるので、その符号ラインの境界を把握することができない。
 そこで、付加部107が各符号ラインの符号量を符号化データに付加することにより、画像復号装置は、その符号量に基づいて、符号化データ(ストリーム)を符号ライン毎に分割し、処理することができるようになる。
[符号ラインの並び替え]
 図11を参照して説明したような順で符号化された(付加部107から出力された)各分割レベルの符号ラインは、符号ライン並び替え部108の符号ライン並び替えバッファ121に保持される。符号ラインが1ラインブロック分蓄積されると、符号ライン読み出し部122は、各符号ラインを、符号化処理用の順序から、ウェーブレット逆変換処理の順序とは異なる所定の順序である伝送用の順序で読み出すことにより、符号ラインの並び替えを行う。
 ウェーブレット逆変換処理の順序については後述するが、伝送用の順序とは、符号化データ(コードストリーム)の伝送に適した順であり、例えば、伝送可能レートの不安定さに対する耐性を向上させることができるような順である。
 符号化データを画像符号化装置100から画像復号装置まで伝送する経路は、様々なものが考えられるが、例えば、インターネットや無線通信等のような、伝送可能レートが不安定で、データロスや伝送エラー等の不具合の発生頻度が高い伝送路を介して符号化データを伝送する場合、実用的なシステムを構築するためには、そのような不具合に対する対処も考慮する必要がある。
 したがって、符号ライン読み出し部122は、例えば、符号ラインを、図13に示されるように低域成分から高域成分に向かう順に読み出す。
 図13において、各符号ラインは、その処理順に並べられている。図中上から下に向かう向きに時系列が示されている。つまり、図13に示される各符号ラインは、図中上から順に処理される。
 つまり、図13の左側に示されるような高域成分から低域成分に向かう順(符号化順)で付加部107から出力された各符号ラインは、符号ライン並び替え部108により、図13の右側に示されるような低域成分から高域成分に向かう順(伝送順)に並び替えられる。
 より具体的には、符号ライン読み出し部122は、分割レベル4の符号ラインを読み出し、分割レベル3の各符号ラインを読み出し、分割レベル2の各符号ラインを読み出し、最後に分割レベル1の各符号ラインを読み出し、読み出した各符号ラインを、その読み出し順に画像符号化装置100の外部に出力する。つまり、各符号ラインは、この伝送順(低域成分から高域成分に向かう順)に伝送される。
 上述したように、より低域な成分ほど、画像のエネルギーが集中している。すなわち、より低域成分の符号ラインほど、画質に大きな影響を持つ。つまり、この画質に重要な低域成分の符号ラインほど、重要であるので、時間的に先に伝送するようにする。
 仮に、符号ラインの伝送時にデータロスが発生すると、そのロスしたデータの再送処理が行われる。画像を符号化して伝送し、その伝送された符号化データを復号する処理をより低遅延に(略リアルタイムに)行う場合、その再送処理に許される時間は、有限であり、非常に短い。より低遅延に処理しなければならない場合ほど、その時間は短くなる。
 したがって、このような場合、少しでも再送処理に許される時間を長くすることにより、再送処理が成功する可能性を向上させることができ、大変大きな意味を持つ。
 仮に、各符号ラインを並び替えず、符号化順のまま、すなわち、高域成分から低域成分に向かう順に伝送させるようにすると、低域成分の符号ラインの再送処理に許される時間は非常に短いものとなり、再送処理の成功率が低減するので、結果として復号画像の画質が低減する恐れが大きくなる。特に、不安定なネットワークを伝送路とする場合、このようなエラーのある程度の発生は、前提となるので、その分、復号画像の画質が劣化してしまうと言える。
 また、例えば、無線伝送路等において、伝送可能レートが急激に低下し、画像符号化装置100のビットレートがそれに追従できなかった場合、送信時の符号ラインのバッファ量が増大し、オーバフローが発生したり、遅延時間が増大したりする恐れがあるが、後から送信する高域成分の符号ラインを切り捨て、送信しないようにして送信レートを低下させることができる。つまり、符号ラインの送信を途中で打ち切り、次のラインブロックの送信に移ることができる。
 このような制御により、バッファのオーバフローを回避することができるだけでなく、低遅延な伝送を維持することができる。このとき、高域成分の伝送を先に行っていると、低域成分の符号ラインを切り捨てなければならず、復号画像の画質が大きく劣化してしまう恐れがある。上述したように低域成分を先に送信することにより、高域成分の符号ラインの切り捨てで対応することができるので、このような送信レートの制御を行っても、復号画像の画質に与える影響をより低減させることができる。
 なお、スループットがより向上するほど、以上のような伝送時の不具合の発生の可能性は高くなる。
 以上のように、符号ライン並び替え部108が、符号ラインの順序を、伝送用の順序(例えば低域成分から高域成分に向かう順)に並び替えることにより、画像符号化装置100は、伝送路の不安定さに対する耐性を強くすることができる。この耐性が弱く、伝送時にエラー等によって復号画像の画質が大きく劣化してしまうと、現実的なシステムであるとは言えない。
 つまり、伝送路の不安定さに対する耐性を強くすることにより、画像符号化装置100は、スループットの更なる向上に対応することができるようになる。すなわち、画像符号化装置100は、画像の符号化のスループットをさらに向上させることができる。
 例えば、伝送時において不具合が発生しないことが保証される状況であれば、符号ライン並び替え部108は、低遅延化のために、符号ラインを、ウェーブレット逆変換処理される順に並び替える方が望ましい。
 また、例えば、レート制御の応答性が十分であれば(十分に適切なレート制御を行うことができるのであれば)、係数ライン並び替え部104は、係数ラインを、伝送順、若しくは、ウェーブレット逆変換処理順に並び替える方が望ましい。
 しかしながら、以上のように、例えば、単純に動作クロック速度を上げる等して、符号化や復号のスループットを向上させようとしても、レート制御の応答性や伝送路の不安定さに対する耐性が十分でないと、現実的な処理を行うことができない場合がある。
 画像符号化装置100は、上述したように係数ラインや符号ラインの並び替えを適宜行うことにより、スループットの向上を現実的に実現させることができる。
[処理の流れ]
 以上のような画像符号化装置100の各部により実行される符号化処理の流れの例を、図14のフローチャートを参照して説明する。なお、この符号化処理は、入力画像のピクチャ毎に実行される。
 符号化処理が開始されると、ステップS101において、画像ライン入力部101が、ライン毎に入力される画像データを受け付けながら(ラインバッファ部102に保持させながら)、ウェーブレット変換部103が、ラインバッファ部102に保持されている係数ラインを用いて、ウェーブレット変換を1ラインブロック分行う。
 ステップS102において、ウェーブレット変換部103は、1ラインブロック分の処理を行ったか否かを判定する。1ラインブロック分の処理を行っていないと判定された場合、ステップS101に戻り、ウェーブレット変換処理を継続する。
 1ラインブロック分ウェーブレット変換処理を行ったと判定された場合、ステップS103に進む。
 ステップS103において、係数ライン並び替え部104は、ウェーブレット変換された係数データを、符号化処理順に並び替える。ステップS104において、量子化部105は、その係数データを、レート制御部109に指定される量子化ステップサイズで量子化する。
 ステップS105において、エントロピ符号化部106は、係数データをエントロピ符号化する。ステップS106において、付加部107は、各符号ラインにその符号量をヘッダ情報として付加する。ステップS107において、符号ライン並び替え部108は、符号化データ(符号ライン)を伝送順に並び替える。ステップS108において、符号ライン並び替え部108は、伝送順に並び替えた符号化データを出力する。
 ステップS109において、レート制御部109は、エントロピ符号化部106におけるエントロピ符号化の情報に基づいて、レート制御を行う。
 ステップS110において、ウェーブレット変換部103は、処理対象ピクチャの最終ラインブロック(例えば最下段のラインブロック)まで処理したか否かを判定する。処理していないと判定された場合、ステップS101に戻り、次のラインブロックに対して、それ以降の処理が繰り返される。また、ステップS110において、最終ラインブロックまで、処理が終了したと判定された場合、その処理対象ピクチャに対する符号化処理が終了される。
 以上のように、符号化処理を実行することにより、画像符号化装置100は、画像の符号化のスループットを向上させることができる。
[符号ライン区切りのその他の例]
 なお、図12においては、画像復号装置がコードストリームにおいて各分割レベルの符号ラインの区切りを識別することができるように、各分割レベルの符号ラインにその符号量を含むヘッダ情報を付加するように説明した。しかしながら、この区切りを示す方法としては、これ以外にも、例えば、図15に示されるように専用のマーカを付加するようにしてもよい。画像復号装置は、このマーカを検出することにより、各分割レベルの符号ラインの境界を特定することができる。ただし、この場合、画像復号装置は、このマーカに基づいて、各分割レベルの符号ラインを区別することはできるが、その符号ラインの符号量を判別することはできない。つまり、マーカからすぐに各分割レベルの符号ラインの並び順を特定することはできない。したがって、画像復号装置は、何らかの別の手段により、その並び順を把握する必要がある。
<2.第2の実施の形態>
[デバイスの構成]
 次に、第1の実施の形態において説明した画像符号化装置100に対応する画像復号装置について説明する。図16は、本発明を適用した画像処理装置としての画像復号装置の一実施の形態の構成例を示すブロック図である。
 画像復号装置200は、画像符号化装置100より出力される符号化データを復号し、復号画像を生成する。
 画像復号装置200は、符号語解読部201、ライン抽出部202、エントロピ復号部203、逆量子化部204、係数ライン並び替え部205、ウェーブレット逆変換部206、およびバッファ部207を有する。
 符号語解読部201は、入力された符号化データ(符号語)(矢印D51)を解読して、データや符号化処理に関する関連情報を抽出する。この関連情報にどのような情報が含まれていてもよいが、例えば、画像の解像度(水平・垂直サイズ)、量子化ステップサイズ、ウェーブレット変換の分解数、および係数ライン(符号ライン)の並び順に関する情報等が含まれる。
 係数ライン(符号ライン)の並び順に関する情報としては、各分割レベルの符号ラインの並び順を示す情報、若しくは、その並び順を求めるのに必要な情報であればどのようなものであってもよい。例えば、図12に示されるような、各分割レベルの符号ラインの符号量を含むヘッダ情報や、図15に示されるようなマーカの検出結果等であってもよい。
 符号語解読部201は、入力された符号化データ(コードストリーム)をライン抽出部202に供給する(矢印D52)。また、符号語解読部201は、コードストリームにおいて各分割レベルの符号ラインを区別するために必要な情報をライン抽出部202に供給する(点線矢印D61)。例えば、符号語解読部201は、各分割レベルの符号ラインの符号量や、マーカの検出結果等をライン抽出部202に供給する。
 また、符号語解読部201は、量子化ステップサイズを示す情報を逆量子化部204に供給する(点線矢印D62)。
 さらに、符号語解読部201は、各分割レベルの係数ラインの並び替えに必要な情報を係数ライン読み出し部212に供給する(点線矢印D63)。係数ライン読み出し部212は、並び替え後の並び順となる、ウェーブレット逆変換部206によるウェーブレット逆変換処理順を予め把握している。係数ライン読み出し部212は、係数ライン並び替えのために、並び替え前の並び順となる、伝送時の符号ラインの並び順を把握する必要がある。そこで、符号語解読部201は、伝送時の符号ラインの並び順を示す情報、若しくは、その並び順を求めるのに必要な情報を係数ライン読み出し部212に提供する。
 例えば、符号語解読部201は、符号語を解読することにより、伝送時の符号ラインの並び順を特定し、その並び順を示す情報を係数ライン読み出し部212に提供するようにしてもよい。また、例えば、符号語解読部201は、コードストリームより抽出した、各分割レベルの符号ラインの符号量を示す情報を、係数ライン読み出し部212に順次提供するようにしてもよい。この場合、係数ライン読み出し部212は、符号語解読部201より供給される符号量の順に基づいて、係数ラインの並び順を把握する。
 なお、係数ライン並び替えバッファ211には、各分割レベルの係数ラインが区別可能な状態で記憶される。そこで係数ライン読み出し部212は、その係数ライン並び替えバッファ211に保持されている各分割レベルの係数ラインのデータ量を求め、そのデータ量の並び順から係数ラインの並び順を把握するようにしてもよい。この場合、符号語解読部201からの情報提供は省略することができる。
 符号語解読部201は、さらに、例えば画像の解像度やウェーブレット変換の分解数等の、ウェーブレット逆変換処理に必要な情報をウェーブレット逆変換部206に供給する(点線矢印D64)。
 ライン抽出部202は、符号語解読部201から供給される各分割レベルの符号ラインを区別するために必要な情報に基づいて、符号語解読部201から供給されるコードストリームから各分割レベルの符号ラインを抽出する。つまり、ライン抽出部202は、符号化データ(コードストリーム)を分割レベルの符号ライン毎に分割する。ライン抽出部202は、抽出した、各分割レベルの符号ラインをエントロピ復号部203に供給する(矢印D53)。
 エントロピ復号部203は、各分割レベルの符号ラインを、エントロピ符号化部106(図1)のエントロピ符号化に対応する方法で、エントロピ復号し、係数データ(量子化係数)を生成する。つまり、エントロピ復号部203は、ライン抽出部202により分けられた各分割レベルの符号ラインを、供給される順に復号し、分割レベルの係数ラインに変換する。エントロピ復号部203は、その分割レベルの係数ライン(量子化係数)を逆量子化部204に供給する(矢印D54)。
 逆量子化部204は、エントロピ復号部203から供給される、各分割レベルの係数ライン(量子化係数)を、符号語解読部201から供給される情報に基づいて決定される量子化ステップサイズにより逆量子化する。逆量子化部204は、逆量子化した各分割レベルの係数ライン(ウェーブレット変換係数)を係数ライン並び替え部205に供給する(矢印D55)。
 係数ライン並び替え部205は、その係数データ(係数ライン)の順序(伝送時の順序)を、ウェーブレット逆変換処理の順序に並び替える。
 図16に示されるように、係数ライン並び替え部205は、係数ライン並び替えバッファ211および係数ライン読み出し部212を有する。係数ライン並び替えバッファ211は、逆量子化部204から供給される各分割レベルの係数ラインを保持する。係数ライン読み出し部212は、係数ライン並び替えバッファ211に保持された各分割レベルの係数ラインを、ウェーブレット逆変換処理用の順序で読み出す(矢印D56)ことにより、並び替えを行う。この並び替えの詳細については後述する。
 係数ライン並び替え部205(係数ライン読み出し部212)は、順序を並び替えた係数データをウェーブレット逆変換部206に供給する(矢印D57)。
 ウェーブレット逆変換部206は、符号語解読部201から供給される情報に基づいて、ウェーブレット変換部103(図1)において行われたウェーブレット変換の逆処理を行い、復号画像を生成する。ウェーブレット逆変換の詳細については後述する。
 ウェーブレット逆変換部206は、係数データの低域成分と高域成分を合成する合成フィルタリングを繰り返すことにより、ウェーブレット逆変換を行う。このとき、ウェーブレット逆変換部206は、合成フィルタリングを行って生成された1つ下位の階層の係数データを、バッファ部207に供給して保持させ(矢印D58)、次の合成フィルタリングに利用する。つまり、ウェーブレット逆変換部206は、係数ライン読み出し部212から供給される係数データ(矢印D57)の他に、必要に応じて、バッファ部207から読みだされた係数データ(矢印D59)も用いて合成フィルタリングを行う。
 以上のように合成フィルタリングを繰り返し行い、復号画像を復元すると、ウェーブレット逆変換部206は、その画像データを画像復号装置200の外部に出力する(矢印D60)。
[係数ライン並び替え]
 図13を参照して上述したように、各分割レベルの符号ラインは、所定の伝送順(例えば、低域成分から高域成分に向かう順)で伝送される。
 係数ライン並び替え部205は、各分割レベルの係数ラインを、この伝送順から、ウェーブレット逆変換処理の順に並び替える。各分割レベルの係数ラインは、係数ライン並び替え部205の係数ライン並び替えバッファ211に保持される。係数ラインが1ラインブロック分蓄積されると、係数ライン読み出し部212は、各係数ラインを、ウェーブレット変換処理の順序で読み出すことにより、係数ラインの並び替えを行う。
 詳細については後述するが、1回の合成フィルタリングにより、ある階層の各サブバンドの係数ラインから1つ下位の階層の、水平方向および垂直方向に低域なサブバンドの係数ラインが2ライン生成される。
 ウェーブレット逆変換処理においては、このような合成フィルタリングが所定の順序で繰り返される。その順序は任意であるが、より低遅延に行うためには、実行可能な中で、より下位の階層に対する合成フィルタリングが優先的に実行されるようにするのが望ましい。
 そこで、係数ライン並び替え部205は、各分割レベルの係数ラインを、ウェーブレット逆変換部206がそのような順序でウェーブレット逆変換処理を不要な待機時間等を必要とせずに行うことができるような所定の順序に並び替える。
 例えば、図17にその並び替えの例を示す。図17において、各係数ラインは、その処理順に並べられている。図中上から下に向かう向きに時系列が示されている。つまり、図17に示される各係数ラインは、図中上から順に処理される。
 図17の左側に示されるような順序(伝送順)で逆量子化部204から出力された各分割レベルの係数ラインは、係数ライン並び替え部205により、図17の右側に示されるような順(ウェーブレット逆変換順)に並び替えられる。
 つまり、係数ライン並び替えバッファ211には、各分割レベルの係数ラインが、図17の左側に示されるような順序で記憶される。これに対して、係数ライン読み出し部212は、係数ライン並び替えバッファ211から、各分割レベルの係数ラインを、図17の右側に示されるような順序で読み出す。
 より具体的には、係数ライン読み出し部212は、分割レベル4のラインPの係数ラインを読み出し、分割レベル3のラインNの係数ラインを読み出し、分割レベル2のラインMの係数ラインを読み出し、分割レベル1のラインLの係数ラインを読み出し、分割レベル1のライン(L+1)の係数ラインを読み出す。
 次に、係数ライン読み出し部212は、分割レベル2のライン(M+1)の係数ラインを読み出し、分割レベル1のライン(L+2)の係数ラインを読み出し、分割レベル1のライン(L+3)の係数ラインを読み出す。
 次に、係数ライン読み出し部212は、分割レベル3のライン(N+1)の係数ラインを読み出し、分割レベル2のライン(M+2)の係数ラインを読み出し、分割レベル1のライン(L+4)の係数ラインを読み出し、分割レベル1のライン(L+5)の係数ラインを読み出す。
 次に、係数ライン読み出し部212は、分割レベル2のライン(M+3)の係数ラインを読み出し、分割レベル1のライン(L+6)の係数ラインを読み出し、分割レベル1のライン(L+7)の係数ラインを読み出す。
 ウェーブレット逆変換部206は、このような順で供給される各係数ラインを、供給された順に用いて合成フィルタリングする。
 このように、係数ライン並び替え部205が、ウェーブレット逆変換処理順とは異なる伝送順で供給される各分割レベルの係数ラインを、ラインブロック毎に、ウェーブレット逆変換処理順に並び替えることにより、ウェーブレット逆変換処理における係数データの管理が容易になり、ウェーブレット逆変換部206は、ウェーブレット逆変換処理をより低遅延に行うことができる。
 つまり、上述したようにウェーブレット変換処理の順序とは異なる伝送順で各分割レベルの符号ラインを伝送した場合であっても、画像復号装置200は、より低遅延に符号化データを復号することができる。すなわち、画像復号装置200は、符号化データの復号のスループットを向上させることができる。
 なお、図17においては定常状態における1ラインブロックの並び替えを示している。図9と図10に示される初期状態と定常状態の並び順の違いを参考にすることにより、図17の例に対応する初期状態の並び替え方法については、図17の例を基に容易に特定することができるので、その説明は省略する。
[リフティング演算]
 ウェーブレット逆変換部206は、ウェーブレット変換部103によるウェーブレット変換処理に対応する方法でウェーブレット逆変換を行う。例えば、上述したように、ウェーブレット変換部103が5×3フィルタを用いて分析フィルタリングを行った場合、ウェーブレット逆変換部206も、5×3フィルタを用いて合成フィルタリングを行う。
 合成フィルタリングの場合も、逆処理になるだけで、基本的に分析フィルタリングの場合と同様に処理が行われる。つまり、合成フィルタリングの場合も、図3に示されるような、リフティング(Lifting)技術を用いることで、フィルタ処理の計算を減らすことができる。
 図18は、5×3合成フィルタを用いて、縦方向のラインに対してフィルタリングを行った場合の図である。横方向は、演算過程とそれによって生成される下位の係数を図示したものである。分析フィルタリングの場合と同様に、水平方向の処理も垂直方向の処理と同様に行われる。
 画像の上端においては、枠251に示されるように、高域係数(H0)、低域係数(L1)、および高域係数(H1)が入力された時点で、リフティング演算が行われる。このとき、矢印252に示されるように、係数aが対称拡張される。このようにして、1つ下位の階層のLine-0とLine-1が生成される。
 次に、2係数ライン(低域成分L2と高域成分H2)が入力されると、枠253に示されるように、1つ下位の階層のLine-2とLine-3が生成される。
 その後、2係数ラインが入力される毎に、枠254に示されるように、上記のリフティング演算が後続のラインに対しても同様に繰り返され、下位の係数ラインが2ライン出力される。そして、枠255に示されるように、入力された低域係数(L(N))および高域係数(H(N))に対してLine-2(N)-2とLine-2(N)-1が生成されると、高域係数(H(N))が矢印256のように対称拡張され、枠257のように演算が行われ、Line-2(N+1)-2とLine-2(N+1)-1が生成される。
[ラインブロック単位の合成フィルタリング]
 以上の合成フィルタリング(リフティング)は、各階層について再帰的に行われる。したがって、階層が1つ下位になる毎にライン数は2倍になる。
 例えば、図19に示されるように、分割レベル2の係数ラインがN/4であるとする。この分割レベル2のサブバンド2LL,2LH,2HL、および2HHに対して合成フィルタリングを行うと、分割レベル1のサブバンド1LLがN/2ライン生成される。
[係数ラインの処理順]
 以上のようなウェーブレット逆変換部206による合成フィルタリングの処理手順の例について、より具体的に説明する。
 図20は、定常状態において、ウェーブレット逆変換部206により処理されるデータを時系列順に示す図である。図20においては、ウェーブレット逆変換部206により処理されるデータが、図中、上から下に向かう方向に時系列順に並べられている。
 定常状態の1ラインブロックをウェーブレット変換する際、ウェーブレット逆変換部206は、最初に、分割レベル4の各サブバンド(サブバンド4HH,4HL,4LH、および4LL)の1係数ライン(ラインP)を、合成フィルタリングし、分割レベル3のサブバンド3LLを2係数ライン(ラインNおよびライン(N+1))を生成する。このうちライン(N+1)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル3のサブバンド3LL(ラインN)と他の各サブバンド(サブバンド3HH,3HL、および3LH)の1係数ライン(ラインN)を合成フィルタリングし、分割レベル2のサブバンド2LLを2係数ライン(ラインMおよびライン(M+1))を生成する。このうちライン(M+1)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル2のサブバンド2LL(ラインM)と他の各サブバンド(サブバンド2HH,2HL、および2LH)の1係数ライン(ラインM)を合成フィルタリングし、分割レベル1のサブバンド1LLを2係数ライン(ラインLおよびライン(L+1))を生成する。このうちライン(L+1)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ラインL)と他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ラインL)を合成フィルタリングし、ベースバンドの画像データを2ライン(ラインKおよびライン(K+1))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+1))をバッファ部207から読み出し、他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+1))と合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+2)およびライン(K+3))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル2のサブバンド2LL(ライン(M+1))をバッファ部207から読み出し、他の各サブバンド(サブバンド2HH,2HL、および2LH)の1係数ライン(ライン(M+1))と合成フィルタリングし、分割レベル1のサブバンド1LLを2係数ライン(ライン(L+2)およびライン(L+3))を生成する。このうちライン(L+3)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+2))と他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+2))を合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+4)およびライン(K+5))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+3))をバッファ部207から読み出し、他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+3))と合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+6)およびライン(K+7))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル3のサブバンド3LL(ライン(N+1))をバッファ部207から読み出し、他の各サブバンド(サブバンド3HH,3HL、および3LH)の1係数ライン(ライン(N+1))と合成フィルタリングし、分割レベル2のサブバンド2LLを2係数ライン(ライン(M+2)およびライン(M+3))を生成する。このうちライン(M+3)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル2のサブバンド2LL(ライン(M+2))と他の各サブバンド(サブバンド2HH,2HL、および2LH)の1係数ライン(ライン(M+2))を合成フィルタリングし、分割レベル1のサブバンド1LLを2係数ライン(ライン(L+4)およびライン(L+5))を生成する。このうちライン(L+5)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+4))と他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+4))を合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+8)およびライン(K+9))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+5))をバッファ部207から読み出し、他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+5))と合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+10)およびライン(K+11))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル2のサブバンド2LL(ライン(M+3))をバッファ部207から読み出し、他の各サブバンド(サブバンド2HH,2HL、および2LH)の1係数ライン(ライン(M+3))と合成フィルタリングし、分割レベル1のサブバンド1LLを2係数ライン(ライン(L+6)およびライン(L+7))を生成する。このうちライン(L+7)の係数ラインは、バッファ部207に供給され、保持される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+6))と他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+6))を合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+12)およびライン(K+13))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 次に、ウェーブレット逆変換部206は、分割レベル1のサブバンド1LL(ライン(L+7))をバッファ部207から読み出し、他の各サブバンド(サブバンド1HH,1HL、および1LH)の1係数ライン(ライン(L+7))と合成フィルタリングし、ベースバンドの画像データを2ライン(ライン(K+14)およびライン(K+15))を生成する。この2ラインは、画像復号装置200の外部に出力される。
 ウェーブレット逆変換部206は、以上のような手順で合成フィルタリングを行い、1ラインブロック分の係数ラインをウェーブレット逆変換し、ベースバンドの画像データを16ライン生成する。
 したがって、係数ライン並び替え部205は、このようなウェーブレット逆変換処理の順序に合わせて、図17に示されるような並び替えを行う。これにより、各係数ラインが、繰り返される合成フィルタリングに必要な順に、ウェーブレット逆変換部206に供給されるので、ウェーブレット逆変換部206は、不要な待機時間などを必要とせずに、低遅延にウェーブレット逆変換処理を行うことができる。
 なお、初期状態と定常状態の係数ラインの並びの違いは、図9および図10に示されるとおりである。したがって、初期状態のラインブロックの場合の、ウェーブレット逆変換処理の手順は、図20の例に、図9および図10に示される違いを反映させることにより容易に求めることができるので、その説明は省略する。
 もちろん、係数ライン並び替え部205による係数ラインの並び替え後の順序も、同様に、図13の例に、図9および図10に示される違いを反映させることにより容易に求めることができる。
[ラインブロックの変換]
 以上のようにして、画像符号化装置100および画像復号装置200により画像データ(および符号化データ)は、ラインブロック単位でウェーブレット変換・ウェーブレット逆変換処理(符号化・復号処理)される。
 したがって、例えば、図21のAに示されるように、ベースバンドの画像データ16ラインからなる1ラインブロックは、画像符号化装置100によりウェーブレット変換され、図21のBに示されるように、8ラインの分割レベル1の係数ライン、4ラインの分割レベル2の係数ライン、2ラインの分割レベル3の係数ライン、および1ラインの分割レベル4の係数ラインに変換される。
 また、その各係数ラインは、画像復号装置200によりウェーブレット逆変換され、図21のCに示されるように、ベースバンドの画像データ(復号画像)16ラインに変換される。
[処理の流れ]
 以上のような画像復号装置200の各部により実行される復号処理の流れの例を、図22のフローチャートを参照して説明する。なお、この復号処理は、1ピクチャ分の画像に対応する符号化データ毎に実行される。
 復号処理が開始されると、ステップS201において、符号語解読部201は、1ラインブロック分の符号化データの入力を受け付ける。ステップS202において、符号語解読部201は、入力された符号化データの符号語を解読し、関連情報を抽出する。符号語解読部201は、抽出した関連情報に基づいて、必要な情報を各処理部に提供する。
 ステップS203において、ライン抽出部202は、符号語解読部201から提供される情報(例えば符号量)に基づいて処理対象ラインを抽出する。
 ステップS204において、エントロピ復号部203は、ライン抽出部202より供給される処理対象ラインをエントロピ復号する。ステップS205において、逆量子化部204は、処理対象ラインを逆量子化する。ステップS206において、係数ライン並び替えバッファ211は、処理対象ラインを保持する。
 ステップS207において、ライン抽出部202は、1ラインブロック分処理したか否かを判定する。未処理の係数ラインが存在すると判定された場合、ステップS203に戻り、それ以降の処理が繰り返される。また、ステップS207において、1ラインブロック分処理したと判定された場合、ステップS208に進む。
 ステップS208において、係数ライン読み出し部212は、係数データを係数ライン並び替えバッファ211から読み出すことにより、係数データをウェーブレット逆変換順に並び替える。ステップS209において、ウェーブレット逆変換部206は、係数データをウェーブレット逆変換する。
 ステップS210において、ウェーブレット逆変換部206は、1ラインブロック分処理したか否かを判定する。未処理の係数ラインが存在すると判定された場合、ステップS209に戻り、それ以降の処理が繰り返される。また、ステップS210において、1ラインブロック分処理されたと判定された場合、ステップS211に進む。
 ステップS211において、符号語解読部201は、処理対象ピクチャの最終ラインブロック(例えば最下段のラインブロック)まで処理したか否かを判定する。処理していないと判定された場合、ステップS201に戻り、次のラインブロックに対して、それ以降の処理が繰り返される。また、ステップS211において、最終ラインブロックまで、処理が終了したと判定された場合、その処理対象ピクチャに対する復号処理が終了される。
 以上のように、復号処理を実行することにより、画像復号装置200は、符号化データの復号のスループットを向上させることができる。
 なお、以上においては、係数ライン並び替え部205が、伝送順に並べられた係数ラインをウェーブレット逆変換順に並び替えるように説明したが、この伝送順は、符号化データ伝送時の順序という意味である。例えば、画像符号化装置100が符号ラインを符号化順のまま伝送する場合、係数ライン並び替え部205は、その符号化順に並べられた係数ラインをウェーブレット逆変換順に並び替える。また、例えば、画像符号化装置100が符号ラインをウェーブレット変換順のまま伝送する場合、係数ライン並び替え部205は、そのウェーブレット変換順の係数ラインをウェーブレット逆変換順に並び替える。さらに、例えば、画像符号化装置100が符号ラインをウェーブレット逆変換順に並び替えて伝送する場合、係数ライン並び替え部205は、そのウェーブレット逆変換順のまま係数ラインを出力する。
 係数ライン並び替え部205は、符号語解読部201から供給される情報に基づいて、このような入力される係数ラインの並び順を判別することができるので、容易にその並び順に応じた並び替えを行うことができる。つまり、入力される係数ラインの並び順がどのような順序であっても、係数ライン並び替え部205は、符号語解読部201から供給される情報に基づいて、容易に、ウェーブレット逆変換順に並び替えることができる。
<3.第3の実施の形態>
[システムの構成]
 第1の実施の形態で説明した画像符号化装置100および第2の実施の形態で説明した画像復号装置200の適用例について説明する。図23は、入力画像を符号化して伝送し、その符号化データを伝送先で復号し、得られた復号画像を出力する画像伝送システムの構成例を示す図である。
 画像伝送システム300は、画像をより低遅延に伝送するシステムである。画像伝送システム300は、ネットワーク302を介して接続される送信装置301および受信装置303を有する。
 送信装置301は、入力画像を、ネットワーク302を介して受信装置303に送信する装置である。送信装置301は、効率よく画像を伝送するために、画像データを符号化し、その符号化データを受信装置303に送信する。
 送信装置301は、符号化部311、パケタイズ処理部312、および送信部313を有する。
 符号化部311は、入力画像を符号化し、符号化データを出力する。符号化部311には、第1の実施の形態において説明した画像符号化装置100が適用される。つまり、符号化部311は、画像符号化装置100と同様の構成を有し、同様の処理を行う。
 パケタイズ処理部312は、符号化部311から出力される符号化データ(コードストリーム)をパケット化する。送信部313は、パケタイズ処理部312により生成されたパケットを、ネットワーク302を介して受信部321に送信する。
 ネットワーク302は、例えばインターネットや無線LANのように、通信可能帯域が一定でなく、パケットロスや送受信エラーが発生する可能性のある不安定な伝送路である。ネットワーク302は、全体として不安定な特性を有する伝送路であれば、その構成は任意である。
 受信装置303は、ネットワーク302を介して送信装置301から供給されるパケットを受信し、そのパケットに含まれる符号化データを復号し、復号画像を生成し、出力する装置である。
 受信装置303は、受信部321、デパケタイズ処理部322、および復号部323を有する。
 受信部321は、送信装置301の送信部313に対応する処理を行い、送信部313からネットワークを介して供給されるパケットを受信する処理を行う。
 デパケタイズ処理部322は、受信部321において受信されたパケットをデパケタイズし、符号化データを抽出する。
 復号部323は、デパケタイズ処理部322により抽出された符号化データを復号し、復号画像を出力する。復号部323には、第2の実施の形態において説明した画像復号装置200が適用される。つまり、復号部323は、画像復号装置200と同様の構成を有し、同様の処理を行う。
 このように、符号化部311として画像符号化装置100を適用することにより、送信装置301は、レート制御が容易になり、伝送路の不安定さに対する耐性を向上させることができる。また、復号部323として画像復号装置200を適用することにより、受信装置303は、ウェーブレット逆変換時のデータ管理を容易にすることができ、送信装置301が、レート制御を容易にしたり、伝送路の不安定さに対する耐性を向上させたりするような制御を行った場合でも、低遅延に復号を行うことができる。
 例えば、送信部313と受信部321との間の通信においてパケットロス等が発生した場合、受信部321は、送信部313に対してロスしたパケットの再送要求を行う。符号化部311は、上述したように、各分割レベルの符号ラインを低域から高域に向かう順に出力する。このようにすることにより、送信部313は、画質に大きな影響を与える低域成分程、先に送信することになる。つまり、エラーが発生し、受信部321再送要求を行う場合、画質に大きな影響を与える低域成分程、その再送処理のための時間を長く確保することができる。
 また、ネットワーク302の帯域が急激に低下した場合、送信部313は、パケットの送信を途中で中断して省略することにより、その急激なレート変化に対応することができる。このとき、画質に大きな影響を与える低域成分が先に送信されるようにすることにより、このような送信制御が画質に与える影響をできるだけ小さくすることができる。
 つまり、画像伝送システム300は、画像データ伝送処理全体のスループットを向上させることができる。
<4.第4の実施の形態>
[パーソナルコンピュータ]
 上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。この場合、例えば、図24に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。
 図24において、パーソナルコンピュータ400のCPU401は、ROM(Read Only Memory)402に記憶されているプログラム、または記憶部413からRAM(Random Access Memory)403にロードされたプログラムに従って各種の処理を実行する。RAM403にはまた、CPU401が各種の処理を実行する上において必要なデータなども適宜記憶される。
 CPU401、ROM402、およびRAM403は、バス404を介して相互に接続されている。このバス404にはまた、入出力インタフェース410も接続されている。
 入出力インタフェース410には、キーボード、マウスなどよりなる入力部411、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部412、ハードディスクなどより構成される記憶部413、モデムなどより構成される通信部414が接続されている。通信部414は、インターネットを含むネットワークを介しての通信処理を行う。
 入出力インタフェース410にはまた、必要に応じてドライブ415が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア421が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部413にインストールされる。
 上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
 この記録媒体は、例えば、図24に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc - Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア421により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM402や、記憶部413に含まれるハードディスクなどで構成される。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
 また、本明細書において、システムとは、複数のデバイス(装置)により構成される装置全体を表すものである。
 また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
 100 画像符号化装置, 101 画像ライン入力部, 102 ラインバッファ部, 103 ウェーブレット変換部, 104 係数ライン並び替え部, 105 量子化部, 106 エントロピ符号化部, 107 付加部, 108 符号ライン並び替え部, 109 レート制御部, 111 係数ライン並び替えバッファ, 112 係数ライン読み出し部, 121 符号ライン並び替えバッファ, 122 符号ライン読み出し部, 200 画像復号装置, 201 符号語解読部, 202 ライン抽出部, 203 エントロピ復号部, 204 逆量子化部, 205 係数ライン並び替え部, 206 ウェーブレット逆変換部, 207 バッファ部, 211 係数ライン並び替えバッファ, 212 係数ライン読み出し部

Claims (16)

  1.  階層的に分析フィルタ処理を行い、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロックを、周波数帯域毎に分解された係数データに変換する分析フィルタ手段と、
     前記分析フィルタ手段により生成された前記係数データを符号化する符号化手段と、
     前記符号化手段により前記係数データが符号化されて得られる符号化データの並びを、前記分析フィルタ手段による前記分析フィルタ処理の出力順から、合成フィルタ処理される順とは異なる所定の順であり、伝送路の不安定さに対する耐性を向上させる伝送順に並び替える符号化データ並び替え手段と
     を備える画像処理装置。
  2.  前記符号化データ並び替え手段は、各分割レベルの前記符号化データを、前記伝送順として、低域成分から高域成分に向かう順に並び替える
     請求項1に記載の画像処理装置。
  3.  前記分析フィルタ手段により生成された前記係数データの並びを、前記分析フィルタ手段による前記分析フィルタ処理の出力順から、前記合成フィルタ処理される順および前記伝送順と異なる所定の順であり、前記符号化データのレート制御を容易にする符号化順に並び替える係数データ並び替え手段と、
     前記係数データ並び替え手段により並び替えられた前記係数データを量子化する量子化手段と、
     前記符号化手段による符号化結果に基づいて、前記量子化手段による量子化の量子化ステップサイズを制御することにより前記符号化データのレートを制御するレート制御手段と
     をさらに備え、
     前記符号化手段は、前記量子化手段により量子化された前記係数データを符号化する
     請求項1に記載の画像処理装置。
  4.  前記係数データ並び替え手段は、各分割レベルの前記係数データを、前記伝送順として、高域成分から低域成分に向かう順に並び替える
     請求項3に記載の画像処理装置。
  5.  前記分析フィルタ手段は、前記分析フィルタ処理を、リフティング演算を用いて行う
     請求項1に記載の画像処理装置。
  6.  前記分析フィルタ手段は、初期状態のラインブロックに対しては、必要な画素の対称拡張を行ってから前記リフティング演算を行い、定常状態のラインブロックに対しては、前回の前記リフティング演算結果を利用して、前記リフティング演算を行う
     請求項5に記載の画像処理装置。
  7.  前記分析フィルタ手段は、前記係数データに対して、水平方向に前記リフティング演算を行ってから、垂直方向に前記リフティング演算を行う
     請求項5に記載の画像処理装置。
  8.  画像処理装置の分析フィルタ手段が、階層的に分析フィルタ処理を行い、少なくとも最低域成分のサブバンドの1ライン分の係数データを生成するのに必要なライン数分の画像データを含むラインブロックを、周波数帯域毎に分解された係数データに変換し、
     前記画像処理装置の符号化手段が、前記分析フィルタ処理により生成された前記係数データを符号化し、
     前記画像処理装置の符号化データ並び替え手段が、前記係数データが符号化されて得られる符号化データの並びを、前記分析フィルタ処理の出力順から、合成フィルタ処理される順とは異なる所定の順であり、伝送路の不安定さに対する耐性を向上させる伝送順に並び替える
     画像処理方法。
  9.  階層的な分析フィルタ処理により所定ライン数の画像データが周波数帯域毎に分解された、少なくとも最低域成分のサブバンドの係数データを1ライン以上含む、各サブバンドの係数データ群からなるラインブロックが符号化されて生成された符号化データを、復号する復号手段と、
     前記復号手段により復号されて得られた前記係数データの並びを、前記復号手段により復号された順から、合成フィルタ処理される順に並び替える係数データ並び替え手段と、 階層的に前記合成フィルタ処理を行い、前記係数データ並び替え手段により並び替えられた各サブバンドの前記係数データを前記画像データに変換する合成フィルタ手段と
     を備える画像処理装置。
  10.  前記合成フィルタ手段は、実行可能な中で、より下位の階層のサブバンドの係数データに対する前記合成フィルタ処理を優先的に実行する
     請求項9に記載の画像処理装置。
  11.  前記符号化データを解読する解読手段と、
     前記解読手段による解読結果に基づいて、前記符号化データを、各階層の前記係数データの1ライン分に対応する符号化データ毎に分割し、抽出する抽出手段と
     をさらに備え、
     前記復号手段は、前記抽出手段により抽出された前記符号化データを復号する
     請求項9に記載の画像処理装置。
  12.  前記係数データ並び替え手段は、前記解読手段による解読結果に基づいて、前記係数データの並び順を判別し、判別された並び順を、合成フィルタ処理される順に替える
     請求項11に記載の画像処理装置。
  13.  前記合成フィルタ手段は、前記合成フィルタ処理を、リフティング演算を用いて行う
     請求項9に記載の画像処理装置。
  14.  前記合成フィルタ手段は、初期状態のラインブロックに対しては、必要な係数データの対称拡張を行ってから前記リフティング演算を行い、定常状態のラインブロックに対しては、前回の前記リフティング演算結果を利用して、前記リフティング演算を行う
     請求項13に記載の画像処理装置。
  15.  前記合成フィルタ手段は、前記係数データに対して、水平方向に前記リフティング演算を行ってから、垂直方向に前記リフティング演算を行う
     請求項13に記載の画像処理装置。
  16.  画像処理装置の復号手段は、階層的な分析フィルタ処理により所定ライン数の画像データが周波数帯域毎に分解された、少なくとも最低域成分のサブバンドの係数データを1ライン以上含む、各サブバンドの係数データ群からなるラインブロックが符号化されて生成された符号化データを、復号し、
     前記画像処理装置の係数データ並び替え手段は、復号されて得られた前記係数データの並びを、その復号された順から、合成フィルタ処理される順に並び替え、
     前記画像処理装置の合成フィルタ手段は、階層的に前記合成フィルタ処理を行い、並び替えられた各サブバンドの前記係数データを前記画像データに変換する
     画像処理方法。
PCT/JP2010/065862 2009-09-24 2010-09-14 画像処理装置および方法 WO2011037049A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
IN2393DEN2012 IN2012DN02393A (ja) 2009-09-24 2010-09-14
RU2012111256/08A RU2012111256A (ru) 2009-09-24 2010-09-14 Устройство обработки изображений и способ обработки изображений
US13/496,748 US8634665B2 (en) 2009-09-24 2010-09-14 Image processing apparatus and image processing method
EP10818724.6A EP2482540A4 (en) 2009-09-24 2010-09-14 IMAGE PROCESSOR AND IMAGE PROCESSING METHOD
CN2010800412266A CN102511161A (zh) 2009-09-24 2010-09-14 图像处理设备和图像处理方法
BR112012006071A BR112012006071A2 (pt) 2009-09-24 2010-09-14 aparelho de processamento de imagem, e, método de processamento de imagem para uso com um aparelho de processamento de imagem

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-219627 2009-09-24
JP2009219627A JP5263621B2 (ja) 2009-09-24 2009-09-24 画像処理装置および方法

Publications (1)

Publication Number Publication Date
WO2011037049A1 true WO2011037049A1 (ja) 2011-03-31

Family

ID=43795799

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/065862 WO2011037049A1 (ja) 2009-09-24 2010-09-14 画像処理装置および方法

Country Status (8)

Country Link
US (1) US8634665B2 (ja)
EP (1) EP2482540A4 (ja)
JP (1) JP5263621B2 (ja)
CN (1) CN102511161A (ja)
BR (1) BR112012006071A2 (ja)
IN (1) IN2012DN02393A (ja)
RU (1) RU2012111256A (ja)
WO (1) WO2011037049A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112012003260T5 (de) 2011-08-05 2014-05-15 Sumitomo Electric Industries, Ltd. Substrat, Halbleitervorrichtung und Verfahren zur Herstellung derselben
US20150078674A1 (en) * 2012-02-20 2015-03-19 Wenfei Jiang Component sorting based encoding for 3d mesh compression
EP2866439B1 (en) 2012-06-26 2020-11-04 LG Electronics Inc. Video decoding method and video encoding method
US20140072027A1 (en) * 2012-09-12 2014-03-13 Ati Technologies Ulc System for video compression
CN105491392B (zh) * 2015-11-24 2019-03-29 北京优素科技有限公司 多级idwt并行处理方法及系统
CN110397578B (zh) * 2019-04-11 2020-08-14 岳阳县辉通物联网科技有限公司 智能化动作执行装置
CN111567042B (zh) * 2019-04-29 2022-05-17 深圳市大疆创新科技有限公司 小波逆变换电路和方法
GB202019160D0 (en) 2020-02-05 2021-01-20 Iconx Ltd Key scanning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005117156A (ja) * 2003-10-03 2005-04-28 Sanyo Electric Co Ltd データ処理装置
JP2005184086A (ja) * 2003-12-16 2005-07-07 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2007311924A (ja) 2006-05-16 2007-11-29 Sony Corp 帯域分析装置及び方法、帯域合成装置及び方法、画像符号化装置及び方法、画像復号装置及び方法、並びにプログラム及び記録媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
JP2000184204A (ja) * 1998-12-11 2000-06-30 Canon Inc 画像処理装置及び方法及び記憶媒体
US6898323B2 (en) * 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing
JP2002315000A (ja) * 2001-04-12 2002-10-25 Megafusion Corp データ伝送装置
JP4665898B2 (ja) * 2004-02-23 2011-04-06 日本電気株式会社 2次元信号の符号化/復号方法および装置
TW200746655A (en) * 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system
JP4254866B2 (ja) * 2007-01-31 2009-04-15 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
CN101543077B (zh) * 2007-01-31 2011-01-19 索尼株式会社 信息处理装置和方法
JP5162939B2 (ja) * 2007-03-30 2013-03-13 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4356028B2 (ja) * 2007-05-17 2009-11-04 ソニー株式会社 情報処理装置および方法
JP4356033B2 (ja) * 2007-05-17 2009-11-04 ソニー株式会社 画像データ処理装置および方法
CN101569170B (zh) * 2007-05-17 2011-11-16 索尼株式会社 编码设备和编码方法以及解码设备和解码方法
JP4488027B2 (ja) * 2007-05-17 2010-06-23 ソニー株式会社 情報処理装置および方法、並びに、情報処理システム
KR101442273B1 (ko) * 2007-05-17 2014-09-23 소니 주식회사 정보 처리 장치 및 방법
JP4793320B2 (ja) * 2007-05-17 2011-10-12 ソニー株式会社 情報処理装置および方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005117156A (ja) * 2003-10-03 2005-04-28 Sanyo Electric Co Ltd データ処理装置
JP2005184086A (ja) * 2003-12-16 2005-07-07 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2007311924A (ja) 2006-05-16 2007-11-29 Sony Corp 帯域分析装置及び方法、帯域合成装置及び方法、画像符号化装置及び方法、画像復号装置及び方法、並びにプログラム及び記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2482540A4

Also Published As

Publication number Publication date
EP2482540A1 (en) 2012-08-01
US20120230598A1 (en) 2012-09-13
RU2012111256A (ru) 2013-09-27
BR112012006071A2 (pt) 2016-05-31
IN2012DN02393A (ja) 2015-08-21
EP2482540A4 (en) 2014-07-02
CN102511161A (zh) 2012-06-20
JP5263621B2 (ja) 2013-08-14
US8634665B2 (en) 2014-01-21
JP2011071648A (ja) 2011-04-07

Similar Documents

Publication Publication Date Title
JP5263621B2 (ja) 画像処理装置および方法
JP4883076B2 (ja) 情報処理装置および方法
EP2337306B1 (en) Transmitting apparatus and method, and receiving apparatus and method
CN101309417B (zh) 用于处理图像数据的方法和设备
TWI379593B (en) Image processing apparatus and image processing method
US8391616B2 (en) Information processor and method therefor
CN101854556B (zh) 信息处理设备和方法
JP2012060261A (ja) 画像処理装置および方法
JP5469127B2 (ja) 画像データ符号化装置ならびにその動作制御方法およびそのプログラム
JP2009302638A (ja) 情報処理装置および方法
JP4086196B2 (ja) 画像符号化装置、プログラム及び記憶媒体
JP2011071649A (ja) 画像処理装置および方法
EP1993041A2 (en) Apparatus and method for processing information
JP2007142614A (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2004166254A (ja) 画像符号化装置及び方法、並びにプログラム及び記録媒体
JP2011147050A (ja) 画像処理装置および方法
JP2011160075A (ja) 画像処理装置および方法
WO2010064569A1 (ja) 動画像データの圧縮方法
JP2011239066A (ja) 画像処理装置および方法
JP4114144B2 (ja) 画像符号化装置、画像符号化プログラム、及び画像復号化プログラム
JP2004166132A (ja) 画像送信装置、ネットワークシステム、プログラム及び記憶媒体
JP2004166156A (ja) 画像送信装置、ネットワークシステム、プログラム及び記憶媒体
JP2005086723A (ja) 画像送信装置、画像転送方法、画像処理システム、プログラム、及び、情報記録媒体
JP2006303669A (ja) 符号化データ処理装置及び符号化データ処理プログラム
JP2011114592A (ja) 情報処理装置および方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080041226.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10818724

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010818724

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2393/DELNP/2012

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2012111256

Country of ref document: RU

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13496748

Country of ref document: US

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112012006071

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112012006071

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20120316