JP2012023514A - Encoding device and decoding device adaptively determining scan order of orthogonal transform coefficient - Google Patents
Encoding device and decoding device adaptively determining scan order of orthogonal transform coefficient Download PDFInfo
- Publication number
- JP2012023514A JP2012023514A JP2010159287A JP2010159287A JP2012023514A JP 2012023514 A JP2012023514 A JP 2012023514A JP 2010159287 A JP2010159287 A JP 2010159287A JP 2010159287 A JP2010159287 A JP 2010159287A JP 2012023514 A JP2012023514 A JP 2012023514A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- dimensional
- prediction
- adjacent
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、直交変換を使用して多次元の信号を符号化する方式に関連し、直交変換した信号を伝送する際の走査順序(スキャニングオーダー)を適応的に決定し、効率的な符号化を実現するための符号化装置及び復号装置に関する。 The present invention relates to a method of encoding a multidimensional signal using orthogonal transform, and adaptively determines a scanning order (scanning order) when transmitting a signal subjected to orthogonal transform, and performs efficient coding. The present invention relates to an encoding device and a decoding device for realizing the above.
多次元の信号を符号化する代表的な方式として、映像の符号化を行うMPEG−2やMPEG−4 AVC/H.264などがある。これらの符号化方式では、入力信号を直交変換(例えば、DCT)により周波数成分のエネルギーによる表現に変換する。例えば、2次元DCTの場合、周波数の低い信号成分は2次元配列で表すと左上に、周波数の高い信号成分は右下に配置される。一般的に、DCTが用いられるような信号では、エネルギーが低周波成分に偏り、また、例えば映像信号の場合、人間の視覚特性として周波数の低い信号に対する感度が高いことが知られており、低い周波数成分の信号が重要視される。 As typical systems for encoding multidimensional signals, MPEG-2 and MPEG-4 AVC / H. H.264. In these encoding methods, an input signal is converted into an expression by frequency component energy by orthogonal transform (for example, DCT). For example, in the case of a two-dimensional DCT, a signal component having a low frequency is arranged on the upper left and a signal component having a high frequency is arranged on the lower right when represented in a two-dimensional array. In general, in a signal in which DCT is used, energy is biased toward a low-frequency component. For example, in the case of a video signal, it is known that the sensitivity to a low-frequency signal is high as a human visual characteristic. The signal of the frequency component is regarded as important.
このような性質から、信号を伝送するために1次元信号に並べ替える際に低周波数成分からジグザグに係数を並べ替えるジグザグスキャンが使用される。 Because of this property, zigzag scanning that rearranges coefficients from low frequency components to zigzag when rearranging to a one-dimensional signal for signal transmission is used.
また、このような1次元信号への並び替えによると、信号列は降順に整列されることになることが期待され、先頭から幾つかの係数を伝送し、以降の係数を打ち切ることで、信号の持つ情報の大部分を伝送でき、且つ、伝送するデータ量を減らすことができる。 Further, according to such rearrangement to a one-dimensional signal, it is expected that the signal sequence will be arranged in descending order, and by transmitting some coefficients from the top and cutting off the subsequent coefficients, Most of the information can be transmitted, and the amount of data to be transmitted can be reduced.
このような走査順序の変更によって符号化性能を改善する技法として、信号に含まれる特徴に応じて直交変換係数の分布が特定の偏りを持つことを利用して、信号分析により予め定めた複数の走査順序から適切なものを選択し、符号化効率を改善する技術が知られている(例えば、特許文献1参照)。 As a technique for improving the coding performance by changing the scanning order as described above, the distribution of the orthogonal transform coefficients has a specific bias according to the characteristics included in the signal, and a plurality of predetermined values obtained by signal analysis are used. A technique for improving the coding efficiency by selecting an appropriate scanning order is known (see, for example, Patent Document 1).
また、符号化方式で予め定められた予測方式(画像の性質に依存して選択される)に依存する走査順序を選択的に切り換え、符号化効率を改善する技術が知られている(例えば、特許文献2参照)。 In addition, a technique is known that selectively switches the scanning order depending on a prediction method (selected depending on the property of the image) predetermined in the encoding method to improve the encoding efficiency (for example, Patent Document 2).
映像の符号化を行うMPEG−2やMPEG−4 AVC/H.264などの符号化方式では、より信号を少ない表現にするためにさまざまな信号予測技術(例えば、動き補償予測、イントラ予測)が採用されている。信号予測技術を使用し、実際に直交変換される信号は、信号源そのものではなく、予測された信号と実際の信号との差分信号である。この予測差分信号の直交変換結果は必ずしもエネルギーが低い周波成分に集中せず、しばしば符号化効率が好適とはならない。 MPEG-2 and MPEG-4 AVC / H. In an encoding method such as H.264, various signal prediction techniques (for example, motion compensation prediction and intra prediction) are employed to express a signal with less number. The signal that is actually orthogonally transformed using the signal prediction technique is not a signal source itself but a difference signal between the predicted signal and the actual signal. The orthogonal transformation result of the prediction difference signal does not necessarily concentrate on the frequency component having low energy, and often the coding efficiency is not suitable.
また、走査順序の変更によって符号化性能を改善する技法を開示する特許文献1,2の技術では、走査順序を決定する際に、予め設計した順序のパターンを複数用意して選択的に切り換える必要があり、この予め設計した順序のパターン数に利得が依存することとなり、これを防止するには多数のパターンを予め用意しておかなければならず、さらに、この多数のパターンのうちのいずれを用いたかを示す多数ビットの制御フラグを伝送しなければならない。
Further, in the techniques of
本発明の目的は、上述の問題に鑑みて、事前に用意された複数のパターンを用いることなく、直交変換した信号を伝送する際の走査順序(スキャニングオーダー)を適応的に決定し、効率的な符号化を実現するための符号化装置及び復号装置を提供することにある。
また、本発明の目的は、上述の問題に鑑みて、事前に用意された複数パターンのスキャニングオーダーが用意されている場合でも少ない切り替え情報でパターンの切り替えを行うことが可能な符号化装置及び復号装置を提供することにある。
An object of the present invention is to efficiently determine a scanning order (scanning order) when transmitting an orthogonally transformed signal without using a plurality of patterns prepared in advance, in view of the above-described problem, and efficiently. It is an object to provide an encoding device and a decoding device for realizing proper encoding.
Another object of the present invention is to provide an encoding device and a decoding device that can perform pattern switching with a small amount of switching information even when a plurality of patterns of scanning orders prepared in advance are prepared. To provide an apparatus.
映像信号や音声信号は、時間あるいは空間的に隣接する信号の相関が高い信号である。このような信号では、例えばMPEGなどの映像符号化方式では動き補償予測やイントラ予測などの信号予測技術が使用される。例えば、動き補償予測では、異なるフレームに含まれる符号化領域に類似した信号を検出し、予測に用いる。異なる時間のフレーム信号との相関の高さを利用しているが、一方で、同じフレーム内の隣接する領域間の相関を利用していない。 Video signals and audio signals are signals having high correlation between signals that are temporally or spatially adjacent. For such signals, signal prediction techniques such as motion compensation prediction and intra prediction are used in video coding schemes such as MPEG. For example, in motion compensation prediction, a signal similar to a coding region included in a different frame is detected and used for prediction. While the high correlation between the frame signals at different times is used, the correlation between adjacent regions in the same frame is not used.
そこで、本発明では、信号の並び替えにおいて、係数の持つエネルギーをより適切に降順になるように並べ替えるようにする。 Therefore, according to the present invention, in rearranging the signals, the energy of the coefficients is rearranged more appropriately in descending order.
より具体的には、本発明に係る符号化装置は、復号済の信号から符号化対象の信号を予測する符号化装置において、符号化対象の信号と予測信号の差分信号(予測差分信号)を2次元直交変換処理し、予測信号と処理領域周囲の既復号信号の隣接する信号間の差分信号に基づいて、適応的に2次元信号を1次元信号に並べ替え、この1次元信号を符号化するように構成される。この2次元信号を1次元信号に並べ替える走査手段は、予測信号と処理領域周囲の既復号信号の隣接する信号間の差分信号を1次元直交変換し、直交変換係数のエネルギー分布を基に直交変換した信号の並べ替え順序を決定する。 More specifically, the encoding device according to the present invention is a coding device that predicts a signal to be encoded from a decoded signal, and calculates a difference signal (prediction difference signal) between the signal to be encoded and the prediction signal. Performs two-dimensional orthogonal transform processing, adaptively rearranges the two-dimensional signal into a one-dimensional signal based on the difference signal between adjacent signals of the prediction signal and the decoded signal around the processing region, and encodes the one-dimensional signal Configured to do. The scanning means for rearranging the two-dimensional signal into the one-dimensional signal performs a one-dimensional orthogonal transform on a difference signal between adjacent signals of the prediction signal and a decoded signal around the processing region, and orthogonalizes based on the energy distribution of the orthogonal transform coefficient. The rearrangement order of the converted signals is determined.
一方、本発明に係る復号装置は、復号対象の信号を復号済みの信号から予測し、予測信号と処理領域範囲の既復号信号の隣接する信号間の差分信号に基づいて適応的に1次元信号を2次元信号に並べ替え、逆直交変換によって復号された予測差分信号と予測信号とを加算することで画像を復号する。復号装置側においても、この2次元信号を1次元信号に並べ替える走査手段は、予測信号と処理領域周囲の既復号信号の隣接する信号間の差分信号を1次元直交変換し、直交変換係数のエネルギー分布を基に直交変換した信号の並べ替え順序を決定する。 On the other hand, the decoding apparatus according to the present invention predicts a signal to be decoded from a decoded signal and adaptively uses a one-dimensional signal based on a difference signal between adjacent signals of the prediction signal and a decoded signal in the processing region range. Are rearranged into a two-dimensional signal, and the prediction difference signal decoded by inverse orthogonal transform and the prediction signal are added to decode the image. Also on the decoding device side, the scanning means for rearranging the two-dimensional signal into the one-dimensional signal performs one-dimensional orthogonal transformation on the difference signal between adjacent signals of the prediction signal and the decoded signal around the processing region, and calculates the orthogonal transformation coefficient. The rearrangement order of signals orthogonally transformed based on the energy distribution is determined.
即ち、本発明の符号化装置は、動画像の符号化を行う符号化装置であって、動画像における符号化対象のブロック信号について、局部復号したブロック信号から予測した予測信号を生成する信号予測手段と、前記符号化対象のブロック信号と前記予測信号の差分からなる予測差分信号に対して2次元直交変換を施し、2次元配列の直交変換係数に基づく2次元信号を生成する直交変換手段と、前記予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて前記2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するエネルギー順位予測手段と、該制御信号に基づいて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替える走査手段と、前記1次元信号に対して符号化を施す符号化手段と、を備えることを特徴とする。この符号化処理は、適応的に直交変換係数の走査順序を決定することに相当する。尚、予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号とは、例えば、予測信号に対して上側、下側、左側、及び右側に隣接する既に復号済みのブロック信号を云うものであり、符号化方式に応じて先に復号するブロック信号の順序が定められているため、その符号化方式に応じた順序に従う隣接するブロック信号を選択するのが好適である。 That is, the encoding apparatus of the present invention is an encoding apparatus that encodes a moving image, and generates a prediction signal predicted from a locally decoded block signal for a block signal to be encoded in the moving image. Means, and orthogonal transform means for performing two-dimensional orthogonal transformation on a prediction difference signal composed of a difference between the block signal to be encoded and the prediction signal, and generating a two-dimensional signal based on an orthogonal transformation coefficient of a two-dimensional array; A pixel group that constitutes the prediction signal, and a pixel group that constitutes a decoded block signal that is adjacent to any one or more of up, down, left, and right of the prediction signal. A difference in a processing target area having a predetermined number of pixels from the position where the pixels constituting the decoding block signal are adjacent to each other, and the already decoded block adjacent to any one or more of the upper, lower, left, and right. A neighboring pixel difference signal is generated for each of the neighboring signals, and a one-dimensional orthogonal transformation is performed on each neighboring pixel difference signal to calculate an energy distribution. Based on the calculated energy value, the two-dimensional array column and / or Energy rank predicting means for determining a row rearrangement order and generating a control signal representing the rearrangement order, and based on the control signal, a signal component of the two-dimensional signal based on the orthogonal transform coefficient of the two-dimensional array Scanning means for rearranging into a one-dimensional signal, and encoding means for encoding the one-dimensional signal. This encoding process corresponds to adaptively determining the scan order of orthogonal transform coefficients. The decoded block signal that is adjacent to any one or more of the predicted signal in the upper, lower, left, and right directions is, for example, an already decoded block that is adjacent to the predicted signal on the upper, lower, left, and right sides. Since the order of the block signals to be decoded first is determined according to the encoding method, it is preferable to select adjacent block signals according to the order according to the encoding method.
また、本発明の符号化装置において、前記エネルギー順位予測手段は、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号をそれぞれ生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値について周波数成分別に重み付けを施した上で、最も大きいものから降順となるよう前記2次元配列の列及び/又は行の並べ替え順序をそれぞれ決定し、該並べ替え順序を表す制御信号を生成する手段を有することを特徴とする。 Further, in the encoding device of the present invention, the energy rank prediction unit generates an adjacent pixel difference signal for a decoded block signal adjacent to any one or more of the upper, lower, left and right, and each adjacent pixel difference signal. The one-dimensional orthogonal transformation is applied to the energy distribution to calculate the energy distribution, the calculated energy values are weighted according to frequency components, and the columns and / or rows of the two-dimensional array are arranged in descending order from the largest. The rearrangement order is determined, and a control signal representing the rearrangement order is generated.
また、本発明の符号化装置において、前記エネルギー順位予測手段は、前記左側及び上側に隣接する既復号のブロック信号に対する隣接画素差分信号をそれぞれ生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値が最も大きいものから降順となるよう前記2次元配列の列及び/又は行の並べ替え順序をそれぞれ決定し、該並べ替え順序を表す制御信号を生成する手段を有することを特徴とする。 Further, in the encoding device of the present invention, the energy rank prediction means generates adjacent pixel difference signals for the decoded block signals adjacent to the left side and the upper side, respectively, and performs one-dimensional processing on each adjacent pixel difference signal. The energy distribution is calculated by performing orthogonal transformation, and the rearrangement order of the columns and / or rows of the two-dimensional array is determined so that the calculated energy value is in descending order, and the rearrangement order is expressed. It has a means for generating a control signal.
また、本発明の符号化装置において、前記処理対象領域は、互いに隣接する前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素を含む複数の画素数からなることを特徴とする。 In the encoding device according to the present invention, the processing target region includes a plurality of pixels including pixels that constitute the prediction signal adjacent to each other and pixels that constitute the decoded block signal. .
また、本発明の符号化装置において、前記2次元信号の信号成分を1次元信号に並べ替えるパターンが、事前に用意された複数パターンからなり、前記走査手段は、前記エネルギー順位予測手段からの制御信号によって前記複数パターンの切り替えを行う手段を有することを特徴とする。 In the encoding device of the present invention, the pattern for rearranging the signal components of the two-dimensional signal into a one-dimensional signal is composed of a plurality of patterns prepared in advance, and the scanning unit is controlled by the energy rank prediction unit. It has a means for switching the plurality of patterns by a signal.
また、本発明の符号化装置において、前記走査手段は、前記2次元配列の直交変換係数に基づく2次元信号のうち、行についてエネルギー分布を算出して決定された当該制御信号に基づいて行について並べ替えを行う第1の走査手段、前記2次元配列の直交変換係数に基づく2次元信号のうち、列についてエネルギー分布を算出して決定された当該制御信号に基づいて列について並べ替えを行う第2の走査手段、前記2次元配列の直交変換係数に基づく2次元信号のうち、行及び/又は列についてエネルギー分布を算出して決定された当該制御信号に基づいて行及び/又は列について並べ替えを行う第3の走査手段、及び、前記2次元配列の直交変換係数に基づく2次元信号のうち、該予め定めた並べ替え順序で走査する第4の走査手段を切り替えて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替える切り替え手段を有し、該並べ替えの切り替えについて前記符号化手段による符号化効率を比較するよう前記切り換え手段を制御し、当該行又は列、或いはその双方の並べ替えを利用した場合と、当該並べ替えについて非利用の場合における符号化効率を比較して、最も符号化効率の高いほうを選択する出力判定手段を更に備えることを特徴とする。 In the encoding device according to the present invention, the scanning unit may perform a row operation based on the control signal determined by calculating an energy distribution for the row out of the two-dimensional signal based on the orthogonal transform coefficient of the two-dimensional array. First scanning means for performing rearrangement, among the two-dimensional signals based on the orthogonal transform coefficients of the two-dimensional array, the first scanning unit performs rearrangement for the columns based on the control signal determined by calculating the energy distribution for the columns. Among the two-dimensional signals based on the orthogonal transform coefficients of the two-dimensional array and the two-dimensional array, the rows and / or columns are rearranged based on the control signals determined by calculating the energy distribution for the rows and / or columns. A third scanning unit that performs scanning, and a fourth scanning unit that scans in the predetermined rearrangement order among the two-dimensional signals based on the orthogonal transformation coefficients of the two-dimensional array. Instead, it has switching means for rearranging the signal components of the two-dimensional signal based on the orthogonal transform coefficients of the two-dimensional array into a one-dimensional signal, and the coding efficiency of the coding means is compared for the switching of the rearrangement. Control the switching means and compare the coding efficiency when using the rearrangement of the row and / or column and when not using the rearrangement, and select the one with the highest coding efficiency The apparatus further comprises output judging means for performing the above.
さらに、本発明の復号装置は、動画像について符号化された信号を復号する復号装置であって、動画像について符号化されたビットストリームを入力して、前記1次元信号を復号する復号手段と、既に復号したブロック信号から予測信号を生成する信号予測手段と、該予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて逆直交変換処理で用いる2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するエネルギー順位予測手段と、該制御信号に基づいて、前記1次元信号の信号成分を前記2次元配列の直交変換係数に基づく2次元信号に並べ替える走査手段と、前記2次元信号に対して逆直交変換を施す逆直交変換手段と、前記逆直交変換を施して得られる信号と前記予測信号と加算して、当該動画像におけるブロック信号を復元する加算手段と、を備えることを特徴とする。この復号処理は、適応的に直交変換係数の走査順序を決定することに相当する。 Further, the decoding device of the present invention is a decoding device for decoding a signal encoded for a moving image, and a decoding means for inputting the bit stream encoded for the moving image and decoding the one-dimensional signal. A signal prediction unit that generates a prediction signal from a block signal that has already been decoded, a pixel group that constitutes the prediction signal, and a decoded block signal that is adjacent to the prediction signal in any one of the upper, lower, left, and right directions With respect to the constituent pixel group, any one of the upper, lower, left, and right sides is subtracted within a processing target area having a predetermined number of pixels from a position where the pixel constituting the prediction signal and the pixel constituting the decoded block signal are adjacent to each other. Generate an adjacent pixel difference signal for a decoded block signal adjacent to one or more, and perform one-dimensional orthogonal transformation on each adjacent pixel difference signal to calculate the energy distribution Energy order predicting means for determining a rearrangement order of the columns and / or rows of the two-dimensional array used in the inverse orthogonal transform process based on the calculated energy value, and generating a control signal representing the rearrangement order; Based on the control signal, scanning means for rearranging the signal component of the one-dimensional signal into a two-dimensional signal based on the orthogonal transform coefficient of the two-dimensional array, and an inverse orthogonal transform that performs inverse orthogonal transformation on the two-dimensional signal Means, and addition means for adding the signal obtained by performing the inverse orthogonal transform and the prediction signal to restore a block signal in the moving image. This decoding process corresponds to adaptively determining the scan order of orthogonal transform coefficients.
また、本発明のプログラムは、動画像の符号化を行う符号化装置として構成するコンピュータに、動画像における符号化対象のブロック信号について、局部復号したブロック信号から予測した予測信号を生成するステップと、前記符号化対象のブロック信号と前記予測信号の差分からなる予測差分信号に対して2次元直交変換を施し、2次元配列の直交変換係数に基づく2次元信号を生成するステップと、前記予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて前記2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するステップと、該制御信号に基づいて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替えるステップと、前記1次元信号に対して符号化を施すステップと、を実行させるためのプログラムである。 Further, the program of the present invention generates a prediction signal predicted from a locally decoded block signal for a block signal to be encoded in a moving image in a computer configured as an encoding device for encoding a moving image; Performing a two-dimensional orthogonal transformation on a prediction differential signal composed of a difference between the block signal to be encoded and the prediction signal to generate a two-dimensional signal based on an orthogonal transformation coefficient of a two-dimensional array; And the pixel group constituting the decoded block signal adjacent to any one or more of the prediction signal in the vertical and horizontal directions with respect to the prediction signal, and the pixel signal constituting the prediction signal and the decoded block signal Adjacent to one or more of the top, bottom, left, and right by making a difference within a processing target region having a predetermined number of pixels from the position where the pixels constituting the An adjacent pixel difference signal for the decoded block signal is generated, and one-dimensional orthogonal transformation is performed on each adjacent pixel difference signal to calculate an energy distribution. Based on the calculated energy value, the two-dimensional array sequence and And / or determining a row rearrangement order and generating a control signal representing the rearrangement order; and based on the control signal, the signal component of the two-dimensional signal based on the orthogonal transformation coefficient of the two-dimensional array is 1 It is a program for executing a step of rearranging to a one-dimensional signal and a step of encoding the one-dimensional signal.
また、本発明のプログラムは、動画像について符号化された信号を復号する復号装置として構成するコンピュータに、動画像について符号化されたビットストリームを入力して、前記1次元信号を復号するステップと、既に復号したブロック信号から予測信号を生成するステップと、該予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて逆直交変換処理で用いる2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するステップと、該制御信号に基づいて、前記1次元信号の信号成分を前記2次元配列の直交変換係数に基づく2次元信号に並べ替えるステップと、前記2次元信号に対して逆直交変換を施すステップと、前記逆直交変換を施して得られる信号と前記予測信号と加算して、当該動画像におけるブロック信号を復元するステップと、を実行させるためのプログラムである。 The program of the present invention includes a step of inputting a bit stream encoded for a moving image to a computer configured as a decoding device for decoding a signal encoded for the moving image, and decoding the one-dimensional signal; Generating a prediction signal from a block signal that has already been decoded, a group of pixels that form the prediction signal, and a block signal that has already been decoded and is adjacent to at least one of the top, bottom, left, and right of the prediction signal With respect to a pixel group, any one of the top, bottom, left, and right is obtained by making a difference within a processing target area having a predetermined number of pixels from a position where a pixel constituting the prediction signal and a pixel constituting the decoded block signal are adjacent to each other. The adjacent pixel difference signal for the already decoded block signal adjacent to the above is generated, and one-dimensional orthogonal transformation is performed on each adjacent pixel difference signal to obtain the error. Calculating a ruby distribution, determining a rearrangement order of columns and / or rows of a two-dimensional array used in inverse orthogonal transform processing based on the calculated energy value, and generating a control signal representing the rearrangement order; Rearranging the signal component of the one-dimensional signal based on the control signal into a two-dimensional signal based on the orthogonal transformation coefficient of the two-dimensional array; and performing inverse orthogonal transformation on the two-dimensional signal; A program for adding a signal obtained by performing the inverse orthogonal transform and the prediction signal to restore a block signal in the moving image.
本発明によれば、符号化対象の信号を少ない係数列に並べ替えることより効率的な伝送が可能となり、符号化効率を向上させることができる。 According to the present invention, it is possible to perform efficient transmission by rearranging signals to be encoded into a small number of coefficient sequences, thereby improving encoding efficiency.
まず、本発明による一実施例の符号化装置について説明する。 First, an encoding apparatus according to an embodiment of the present invention will be described.
[符号化装置]
図1は、本発明による一実施例の符号化装置のブロック図である。一般的に動画像の符号化では動き補償予測、直交変換、量子化、エントロピー符号化によって画像を符号化する。動き補償予測や画面内予測を用いる符号化方式の場合、復号された画像を予測に用いるため符号化装置内に復号装置(ローカルデコーダ)を内包している。本実施例では、入力信号に対し、信号予測を伴う符号化方式で予測信号と入力信号の差分を直交変換し、量子化処理を行った上で直交変換係数の並べ替えを行い、エントロピー符号化を行う場合を例としている。
[Encoding device]
FIG. 1 is a block diagram of an encoding apparatus according to an embodiment of the present invention. In general, in encoding a moving image, an image is encoded by motion compensation prediction, orthogonal transformation, quantization, and entropy encoding. In the case of an encoding method using motion compensation prediction or intra prediction, a decoding device (local decoder) is included in the encoding device in order to use a decoded image for prediction. In this embodiment, the input signal is subjected to orthogonal transformation of the difference between the prediction signal and the input signal by an encoding method that involves signal prediction, and after quantization processing, the orthogonal transformation coefficients are rearranged to perform entropy coding. An example of performing
本実施例の符号化装置1は、前処理部10と、減算部11と、直交変換部12と、量子化部13と、2次元信号から1次元信号に並べ替える係数並べ替え部14と、エントロピー符号化部15と、1次元信号から2次元信号に並べ替える係数逆並べ替え部16と、逆量子化部17と、逆直交変換部18と、加算部19と、メモリ20と、信号予測部21と、エネルギー順位予測部22とを備える。
The
前処理部10は、フレーム並べ替えやフォーマット変換など符号化処理に必要な前処理を行う機能部であり、より具体的な例として、フレーム画像を入力してバッファ(図示せず)に保持し、このバッファから例えば16×16画素のマクロブロックに分割し、このマクロブロックを8×8画素に分割して予め定めた順で減算部11に送出する。尚、ブロックサイズやその分割は、適宜決定して採用することができ、以下では、8×8画素に分割した小領域の画素ブロック単位で処理する例を代表的に説明する。尚、符号化対象のマクロブロックは、信号予測部21にも送出される。
The preprocessing
また、信号予測部21は、信号予測部は参照信号として用いられる信号を入力とし、符号化方式で予め定めた予測方法のうち最適な予測を与える方法を選択し、予測信号を出力する機能部であり、より具体例としては、イントラ予測及び動き補償予測の双方を総括して、符号化対象のマクロブロックを予測する予測画像を生成する機能部であり、動き補償予測の場合、前処理部10から供給される符号化対象ブロックに対して、メモリ20から取得する参照画像を用いて動きベクトル検出を行い、得られた動きベクトルを用いて動き補償を行い、その結果得られた予測画像を減算部11及び加算部19に出力する。動きベクトルの情報は、エントロピー符号化部15に送出される。イントラ予測の場合、信号予測部21は、メモリ20から取得する参照画像を用いて外挿補間を行って、その結果得られた予測画像を減算部11及びエネルギー順位予測部22に出力する。尚、信号予測方法としてはMPEGなどで広く用いられている動き補償予測やAVC/H.264で用いられているイントラ予測などがあるが予測方法に制限されるものではない。
In addition, the
以下、イントラ予測及び動き補償予測のいずれも同様の処理が施されるため、動き補償予測の場合を説明する。 Hereinafter, since the same processing is performed for both intra prediction and motion compensation prediction, the case of motion compensation prediction will be described.
減算部11は、前処理部10からの符号化対象ブロックと、信号予測部21からの予測画像との差分信号を生成して直交変換部12に送出する。
The
直交変換部12は、減算部11から供給される8×8ブロックの差分信号に対して直交変換を施し、量子化部13に送出する。
The
量子化部13は、直交変換部12から供給される8×8ブロックの差分信号の直交変換係数に対応する配列で量子化を行うための量子化マトリクスを用いて、8×8ブロックの差分信号の直交変換係数に対して量子化処理を行い、得られた量子化ブロックを係数並べ替え部14に送出する。
The
係数並べ替え部14は、量子化部13によって量子化される直交変換行列の並べ替え順序について、エネルギー順位予測部22からの制御信号に応じて適応的に量子化ブロックの読出しを行い、即ち直交変換行列に対応する量子化ブロックの2次元信号を、エントロピー符号化を行うための1次元信号に並べ替えを行い、エントロピー符号化部15に送出する。
The
エントロピー符号化部15は、量子化部13から供給される1次元信号の量子化ブロックについてエントロピー符号化処理(適応的な可変長符号化処理や算術符号化処理を選択可能)を施しビットストリームを生成するとともに、信号予測部21から供給される動きベクトルの情報もエントロピー符号化処理を施して出力する。
The
係数逆並べ替え部16は、エネルギー順位予測部22からの制御信号で指定される並べ替え順序で適応的に量子化ブロックの読出し、即ちエントロピー符号化を行うための1次元信号を、直交変換行列に対応する量子化ブロックの2次元信号に並べ替えを行い、逆量子化部17に送出する。つまり、係数逆並べ替え部16は、係数並べ替え部14で並べ替えられた1次元信号を、元の直交変換係数の2次元配列の列及び/又は行の順序となるよう、2次元信号に並べ替える。
The coefficient
逆量子化部17は、係数逆並べ替え部16から供給される量子化ブロックについて逆量子化処理を行って逆直交変換部18に出力する。
The
逆直交変換部18は、逆量子化部17から供給される直交変換係数に対して逆直交変換を施し、加算部19に出力する。
The inverse
加算部19では、逆直交変換部18から得られる逆直交変換した信号と、信号予測部21を経て得られる予測画像とを加算処理して復号画像を生成し、メモリ20に格納する。メモリ20に格納された画像は、動き補償予測における参照画像(ただし、イントラ予測の場合、フレーム内の参照画像)として用いられる。
The adding
映像符号化方式における本実施例では、映像信号の符号化では多くの場合、2次元の画像情報を直交変換により符号化する例である。非可逆な符号化処理では直交変換係数を量子化処理により符号量の削減を行うことができる。信号予測を備える符号化方式では符号化装置内に復号装置(ローカルデコーダ)を備え、復号処理により復号済み隣接信号及び信号予測に用いる参照信号を供給することになる。本実施例では、AVC/H.264などで用いられるループフィルタ(デブロッキングフィルタ)などは図示しないが、ループフィルタを備えていてもよい。 In this embodiment of the video encoding system, in many cases, video signal encoding is an example in which two-dimensional image information is encoded by orthogonal transform. In the irreversible encoding process, the code amount can be reduced by quantizing the orthogonal transform coefficient. In an encoding method including signal prediction, a decoding device (local decoder) is provided in the encoding device, and a decoded adjacent signal and a reference signal used for signal prediction are supplied by decoding processing. In this embodiment, AVC / H. Although a loop filter (deblocking filter) used in H.264 and the like is not shown, a loop filter may be provided.
エネルギー順位予測部22は、信号予測部21からの予測画像と、メモリ20に格納された参照画像のうち、この予測画像に隣接する復号済みの画素群(以下、「隣接既復号信号」と称する)とを用いて、隣接既復号信号の画素群と、この画素群に近傍する予測画像の画素群とを水平方向及び垂直方向に差分演算を行い、それぞれ水平方向及び垂直方向に差分して得られる差分信号に対して、それぞれ水平方向及び垂直方向における1次元直交変換(例えば、DCT)を施し、直交変換係数の2次元配列の行ごとのエネルギー分布(例えば、振幅の絶対値)を算出し、直交変換係数の2次元配列の行ごとの信号列の絶対値について降順ソートするとともに、直交変換係数の2次元配列の列ごとの信号列の絶対値について降順ソートし、エネルギーの高いものから低いものの順に順位付けした直交変換係数の2次元配列の列及び/又は行の並べ替え順序を表す制御信号を生成して、係数並べ替え部14及び係数逆並べ替え部16に送出する。
Of the predicted image from the
従って、係数並べ替え部14では、この制御信号を用いることにより、エネルギーの高いものから低いものの順に順位付けした直交変換係数の2次元配列の列及び/又は行の並べ替え順序で、2次元信号を1次元信号に並べ替えることができ、係数逆並べ替え部16では、この制御信号を用いることにより、係数並べ替え部14で並べ替えられた1次元信号を、元の直交変換係数の2次元配列の列及び/又は行の順序となるよう、2次元信号を1次元信号に並べ替えることができる。
Therefore, the
尚、2次元信号から1次元信号に並べ替える際に低周波数成分からジグザグに係数を並べ替えるジグザグスキャン、あるいは信号特性に応じて変化させた垂直優先スキャンや水平優先スキャンなどが使用される(図2(a),(b),(c)参照)。 Note that when rearranging from a two-dimensional signal to a one-dimensional signal, a zigzag scan in which coefficients are rearranged from a low frequency component to a zigzag, or a vertical priority scan or a horizontal priority scan changed according to signal characteristics is used (see FIG. 2 (a), (b), (c)).
例えば、図3に示す例では、従来技術の低域優先によるジグザグ走査で100,50,42,32,45,30,20,14,36,9,20,15,20,12,0,8,0,0,13,5,0,0,0,0,0,0,0,6,(以下、37係数は伝送せず)であった場合に、本実施例によれば、5行目と6行目を入れ替えた状態にすることによって伝送すべき係数列は、100,50,42,32,45,30,20,14,36,9,20,15,20,12,8,0,6,0,13,5(以下、44係数は伝送せず)となりより短くすることができ、且つ符号化効率は改善する。 For example, in the example shown in FIG. 3, 100, 50, 42, 32, 45, 30, 20, 14, 36, 9, 20, 15, 20, 12, 0, 8 in the conventional zigzag scanning with low-frequency priority. , 0, 0, 13, 5, 0, 0, 0, 0, 0, 0, 0, 6, (hereinafter 37 coefficients are not transmitted), according to this embodiment, Coefficient sequences to be transmitted by switching the eyes and the sixth row are 100, 50, 42, 32, 45, 30, 20, 14, 36, 9, 20, 15, 20, 12, 8, 0, 6, 0, 13, 5 (hereinafter, 44 coefficients are not transmitted), which can be shortened, and the coding efficiency is improved.
エネルギー順位予測部22、係数並べ替え部14及び係数逆並べ替え部16の動作について、より詳細に説明する。
The operations of the energy
図4に、動き補償予測によって予測された予測画像の信号と、隣接既復号信号の関係を示す。動き補償予測では、異なるフレームに含まれる符号化領域に類似した信号を検出し、予測に用いる。異なる時間のフレーム信号との相関の高さを利用しているが、一方で、同じフレーム内の隣接する領域間の相関を利用していない。 FIG. 4 shows a relationship between a predicted image signal predicted by motion compensation prediction and an adjacent decoded signal. In motion compensation prediction, a signal similar to a coding region included in a different frame is detected and used for prediction. While the high correlation between the frame signals at different times is used, the correlation between adjacent regions in the same frame is not used.
一般に画像信号は空間方向に高い相関を持つことから、予測差分信号を加えて復号された予測画像の信号もまた隣接領域と高い相関を持つ。別の見方をすれば、予測差分信号は、空間方向の相関を用いないで予測された動き補償予測の予測画像の信号に対して、符号化領域の予測信号と隣接領域の相関を高める成分といえる。 In general, since an image signal has a high correlation in the spatial direction, a predicted image signal decoded by adding a prediction difference signal also has a high correlation with an adjacent region. From another viewpoint, the prediction difference signal is a component that increases the correlation between the prediction signal of the coding region and the adjacent region with respect to the prediction image signal of the motion compensation prediction that is predicted without using the correlation in the spatial direction. I can say that.
隣接画素間の相関が極めて高いと仮定すると、符号化対象領域の隣接領域近傍画素における予測差分信号は、符号化対象領域の予測信号の隣接領域近傍画素と、隣接領域の符号化対象近傍画素の差分で近似できる。このことから、例えば図5(a)を参照するに、符号化対象領域(予測信号の領域)に対して左側隣接領域の隣接画素差分信号Rと、符号化対処領域に対して上側隣接領域の隣接画素差分信号Qを予測差分信号の隣接領域近傍の近似値として用いる。これらの近傍信号を周波数分析することにより、予測差分信号の周波数分析の近似を行うことができ、これを利用してスキャニングの最適化を図る(図6参照)。 Assuming that the correlation between adjacent pixels is extremely high, the prediction difference signal in the adjacent region neighboring pixels of the encoding target region is the difference between the adjacent region neighboring pixels of the prediction signal of the encoding target region and the encoding target neighboring pixels of the adjacent region. Can be approximated by difference. For this reason, for example, referring to FIG. 5A, the adjacent pixel difference signal R in the left adjacent area with respect to the encoding target area (predicted signal area) and the upper adjacent area with respect to the encoding coping area. The adjacent pixel difference signal Q is used as an approximate value near the adjacent region of the prediction difference signal. By performing frequency analysis on these neighboring signals, it is possible to approximate the frequency analysis of the prediction difference signal, and use this to optimize scanning (see FIG. 6).
尚、例えば図5(a)の例では、隣接する画素間の差分を算出する例を示すものであるが、図5(b)に示すように、符号化対象領域(予測信号の領域)の各行における複数画素の単純平均又は2乗平均等を含む平均値と、当該左側隣接領域の画素との隣接画素差分信号Rを生成し、あるいは符号化対象領域(予測信号の領域)の各列における複数画素の単純平均又は2乗平均等を含む平均値と、当該上側隣接領域の画素との隣接画素差分信号Qを生成するように構成することができる。或いは又、符号化対象領域(予測信号の領域)に対して、当該左側隣接領域の各行における複数画素の単純平均又は2乗平均等を含む平均値による隣接画素差分信号Rを生成し、あるいは符号化対象領域(予測信号の領域)に対して、当該左側隣接領域の各列における複数画素の単純平均又は2乗平均等を含む平均値による隣接画素差分信号Qを生成するように構成することができる。 For example, the example of FIG. 5A shows an example of calculating a difference between adjacent pixels. As shown in FIG. 5B, the encoding target area (predicted signal area) is shown. Generate an adjacent pixel difference signal R between an average value including a simple average or a square average of a plurality of pixels in each row and a pixel in the left adjacent region, or in each column of an encoding target region (predicted signal region) It can be configured to generate an adjacent pixel difference signal Q between an average value including a simple average or a square average of a plurality of pixels and a pixel in the upper adjacent region. Alternatively, an adjacent pixel difference signal R having an average value including a simple average or a square average of a plurality of pixels in each row of the left adjacent region is generated for the encoding target region (prediction signal region), or It may be configured to generate an adjacent pixel difference signal Q based on an average value including a simple average or a square average of a plurality of pixels in each column of the left adjacent region for the conversion target region (prediction signal region). it can.
また、図5(c)に示すように、隣接ブロック間の近傍領域の画素群を用いる例として、符号化対象領域(予測信号の領域)の各行における複数画素の単純平均又は2乗平均等を含む平均値と、当該左側隣接領域の各行における複数画素の単純平均又は2乗平均等を含む平均値との隣接画素差分信号Rを生成し、あるいは符号化対象領域(予測信号の領域)の各列における複数画素の単純平均又は2乗平均等を含む平均値と、当該上側隣接領域の各列における複数画素の単純平均又は2乗平均等を含む平均値との隣接画素差分信号Qを生成するように構成することができる。或いは又、符号化対象領域における列及び/又は行の画素列にフィルタ処理を施し、また、左側領域及び/又は上側領域にフィルタ処理を行い、各差分信号Q,Rを生成するように構成することができる。この場合、入れ替えを行う処理対象の隣接画素の列及び/又は行の1次元画素列に対してローパス処理を施すことになるので、高域成分に対する感度を抑制する効果がある。 Further, as shown in FIG. 5C, as an example of using a pixel group in a neighboring region between adjacent blocks, a simple average or a square average of a plurality of pixels in each row of an encoding target region (predicted signal region) is used. The adjacent pixel difference signal R between the average value including the average value including the simple average or the square average of a plurality of pixels in each row of the left adjacent region, or each of the encoding target regions (predicted signal regions) An adjacent pixel difference signal Q is generated between an average value including a simple average or a square average of a plurality of pixels in a column and an average value including a simple average or a square average of a plurality of pixels in each column of the upper adjacent region. It can be constituted as follows. Alternatively, it is configured such that a column process and / or a row of pixel columns in the encoding target area are subjected to filtering, and a filtering process is performed on the left side area and / or the upper side area to generate the respective difference signals Q and R. be able to. In this case, since the low-pass process is performed on the column of adjacent pixels to be processed and / or the one-dimensional pixel column in the row, there is an effect of suppressing the sensitivity to the high frequency component.
つまり、エネルギー順位予測部22における具体的な処理手順を説明するに、垂直方向の既復号信号と予測信号の隣接差分信号をQ、水平方向の既復号信号と予測信号の隣接差分信号をRとして、Q及びRを1次元直交変換することにより、信号相関を高める信号の周波数成分を求める。
That is, a specific processing procedure in the energy
水平方向又は垂直方向の1次元直交変換係数Q’,R’の周波数成分のエネルギー(例えば、係数の絶対値)を比較し、エネルギーが降順となるように周波数成分のインデックスを入れ替える。 The energy (for example, the absolute value of the coefficient) of the frequency components of the one-dimensional orthogonal transform coefficients Q ′ and R ′ in the horizontal direction or the vertical direction is compared, and the frequency component index is switched so that the energy is in descending order.
例えば、Q’[0]=12,Q’[1]=−30,Q’[2]=4,Q’[3]=−7のとき、インデックスを1,0,3,2に入れ替える。 For example, when Q ′ [0] = 12, Q ′ [1] = − 30, Q ′ [2] = 4, Q ′ [3] = − 7, the index is changed to 1, 0, 3, 2.
例えば、R’[0]=8,R’[1]=−2,R’[2]=−4,R’[3]=0のとき、インデックスを0,2,1,3に入れ替える。 For example, when R ′ [0] = 8, R ′ [1] = − 2, R ′ [2] = − 4, and R ′ [3] = 0, the indexes are switched to 0, 2, 1, and 3.
入れ替えたインデックスを用いて2次元直交変換係数を入れ替え、ジグザグスキャンを行う(図6参照)。 Using the replaced index, the two-dimensional orthogonal transform coefficient is replaced, and zigzag scanning is performed (see FIG. 6).
同様の読み出し順の予測は、復号装置側でも実施可能であり、1次元で伝送された係数情報はジグザグスキャンを逆に適用することにより2次元配列に配置し、推定される差分信号のエネルギー順に行い、列及び/又は行を入れ替え、正しい順に係数を配置しなおすことで正しく情報を復元できる。 The prediction of the same readout order can also be performed on the decoding device side, and coefficient information transmitted in one dimension is arranged in a two-dimensional array by reversely applying a zigzag scan, and the energy order of the estimated difference signal is in order. The information can be correctly restored by replacing the columns and / or rows and rearranging the coefficients in the correct order.
動き補償予測を例に説明したが、本発明による信号のエネルギー順の予測は、イントラ予測においても同様に実施することができる。イントラ予測の場合、幾つかのモードで隣接画素差分信号が0となる場合がある。この場合は当該行や当該列の入れ替えは行わない。 Although motion compensated prediction has been described as an example, prediction of signal energy order according to the present invention can be similarly performed in intra prediction. In the case of intra prediction, the adjacent pixel difference signal may be 0 in some modes. In this case, the row and the column are not replaced.
エネルギー順位予測部22の処理例についてさらに説明する。もっとも広く採用されているMPEGによる映像符号化方式を例に説明する。MPEGの映像符号化方式では画面をブロック単位に分割し、順次符号化処理を行う。そのため上側及び左側のブロックは既に符号化処理が終了し、デコーダで利用できる信号として符号化装置で復号処理が直ちに行われ、次のブロックの符号化のために利用する。このような信号を隣接既復号信号とする。
A processing example of the energy
信号予測方法として例えばMPEG−4 AVC/H.264の場合、イントラ予測と動き補償予測がある。イントラ予測は画面内の既復号済み隣接ブロックの信号を用いて信号を予測する方法であり、既復号済み隣接ブロックの信号は信号予測部21への入力信号である参照信号と時間的に同一のフレームである。一方、動き補償予測の場合、時間的に異なるフレームの映像信号が参照信号として信号予測部21へ入力される。
For example, MPEG-4 AVC / H. In the case of H.264, there are intra prediction and motion compensation prediction. Intra prediction is a method of predicting a signal using a signal of an already decoded adjacent block in the screen, and the signal of the already decoded adjacent block is temporally identical to a reference signal that is an input signal to the
図7に、垂直方向の隣接する上側既復号信号の下端画素A[x]と、水平方向の隣接する左側既復号信号の右端画素B[y]と、イントラ予測又は動き補償予測によって生成された予測信号P[y][x]の関係を示す。 In FIG. 7, the lower end pixel A [x] of the adjacent upper decoded signal in the vertical direction and the right end pixel B [y] of the adjacent left decoded signal in the horizontal direction are generated by intra prediction or motion compensation prediction. The relationship of the prediction signal P [y] [x] is shown.
隣接する既復号画素A及びBと、予測画素Pの上端及び左端信号の差分信号を1次元直交変換し、エネルギー順に各次数のインデックスを入れ替える。ここで、Q[x]を上側既復号信号の下側画素と予測画像の上側画素の差とすると、
Q[x]=A[x]−P[0][x],
x=0,1,2,・・・,N−1
ここで、当該ブロックの直交変換符号化にDCTを用いる場合、Q[x]に1次元DCTを行う。直交変換として、DCT以外、例えばDSTなどが採用される場合は直交変換として1次元のDSTにより変換する。
The difference signals between the adjacent decoded pixels A and B and the upper end and left end signals of the prediction pixel P are subjected to one-dimensional orthogonal transformation, and the indices of the respective orders are switched in order of energy. Here, when Q [x] is the difference between the lower pixel of the upper decoded signal and the upper pixel of the predicted image,
Q [x] = A [x] −P [0] [x],
x = 0, 1, 2,..., N−1
Here, when DCT is used for orthogonal transform coding of the block, one-dimensional DCT is performed on Q [x]. When orthogonal transform, other than DCT, such as DST, for example, is adopted, the transform is performed by a one-dimensional DST as the orthogonal transform.
本実施例では、DCTを用いる場合を例として説明を行う。信号Qの1次元DCTの係数Q’[m]は以下となる。 In the present embodiment, a case where DCT is used will be described as an example. The coefficient Q ′ [m] of the one-dimensional DCT of the signal Q is as follows.
ここに、m=0,1,2,・・・,N−1である。 Here, m = 0, 1, 2,..., N−1.
Sort()を、信号列の絶対値について降順ソートしてインデックス列を返す関数として、Q’をソートしたインデックス列をIhor[m]に保存する。 Sort () is stored in I hor [m] as a function that sorts Q ′ in descending order with respect to the absolute value of the signal string and returns an index string.
Ihor=Sort(Q’)
m=0,1,2,・・・,N−1
I hor = Sort (Q ')
m = 0, 1, 2,..., N−1
例えば、N=4でQ’が以下の係数列であった場合、
Q’=12,−30,4,−7
Ihor[m]は、
Ihor=1,0,3,2
となる。
For example, if N = 4 and Q ′ is the following coefficient sequence:
Q '= 12, -30, 4, -7
I hor [m] is
I hor = 1,0,3,2
It becomes.
同様に、R[y]を左側既復号信号の右端画素と予測画像の左端画素の差とすると、
R[y]=B[y]−P[y][0]
Similarly, if R [y] is the difference between the rightmost pixel of the left decoded signal and the leftmost pixel of the predicted image,
R [y] = B [y] -P [y] [0]
ここに、y=0,1,2,・・・,N−1である。 Here, y = 0, 1, 2,..., N−1.
信号列Rの1次元DCTの係数R’[n]は以下となる。 The coefficient R ′ [n] of the one-dimensional DCT of the signal sequence R is as follows.
ここに、n=0,1,2,・・・,N−1である。 Here, n = 0, 1, 2,..., N−1.
係数R’をソートしたインデックス列をIvert[n]に保存する。
Ivert=Sort(R’)
n=0,1,2,・・・,N−1
An index string in which the coefficient R ′ is sorted is stored in I vert [n].
I vert = Sort (R ′)
n = 0, 1, 2,..., N−1
例えば、N=4で係数R’が以下の係数列であった場合、
R’=8,−2,−4,0
Ivert[n]は、
Ivert=0,2,1,3
となる。
For example, when N = 4 and the coefficient R ′ is the following coefficient sequence,
R ′ = 8, −2, −4, 0
I vert [n] is
I vert = 0, 2, 1, 3
It becomes.
映像信号は、隣接する信号間の相関が極めて高い信号であることが知られており、予測画像と復号済み隣接信号の差分信号の直交変換係数分布は予測誤差信号の持つ隣接画素間の相関を高める成分であることが期待できる。得られた水平成分及び垂直成分の直交変換係数のエネルギー分布もまた予測差分信号のエネルギー分布を反映していることが期待できる。そこで、得られたインデックス列Ihor,Ivertを予測差分信号の水平成分及び垂直成分のエネルギー順位として利用する。 The video signal is known to have a very high correlation between adjacent signals, and the orthogonal transform coefficient distribution of the difference signal between the predicted image and the decoded adjacent signal indicates the correlation between adjacent pixels of the prediction error signal. It can be expected to be a component that enhances. It can be expected that the obtained energy distribution of the orthogonal transformation coefficient of the horizontal component and the vertical component also reflects the energy distribution of the prediction difference signal. Therefore, the obtained index string I hor , I vert is used as the energy rank of the horizontal component and the vertical component of the prediction difference signal.
ここで、実際の信号と予測信号Pの差分信号の直交変換係数をE[n][m]とする。E[n][m]は、符号化方式の必要に応じて量子化を行う。インデックスを入れ替えた直交変換係数E’[n][m]は、Ihor[m],Ivert[n]を用いて以下で実現する。
E’[n][m]=E[Ivert[[n]][Ihor[m]]
n,m=0,1,2,・・・,N−1
Here, the orthogonal transformation coefficient of the difference signal between the actual signal and the prediction signal P is E [n] [m]. E [n] [m] performs quantization according to the necessity of the encoding method. The orthogonal transformation coefficient E ′ [n] [m] with the exchanged index is realized as follows using I hor [m], I vert [n].
E ′ [n] [m] = E [I vert [[n]] [I hor [m]]
n, m = 0, 1, 2,..., N−1
たとえばN=4でIhor=1,0,3,2,Ivert=0,2,1,3であるならばE’[n]「m」はE[n][m]によって図8のように構成される。 For example, if N = 4 and I hor = 1, 0, 3, 2, Ivert = 0, 2, 1, 3, E ′ [n] “m” is represented by E [n] [m] as shown in FIG. Configured.
インデックスを入れ替えた直交変換係数E’[n][m]はジグザグスキャンによって係数列を1次元信号に変換する。 The orthogonal transform coefficient E ′ [n] [m] with the replaced index is converted into a one-dimensional signal by a zigzag scan.
例えば、図8に示すように、1次元信号列への変換例として、E[0][1],E[0][0],E[2][1],E[1][1],E[2][0],E[0][3],E[0][2],E[2][3],E[1][0],E[3][1],E[3][0],E[1][3],E[2][2],E[1][2],E[3][3],E[3][2]となる。 For example, as shown in FIG. 8, as an example of conversion to a one-dimensional signal sequence, E [0] [1], E [0] [0], E [2] [1], E [1] [1] , E [2] [0], E [0] [3], E [0] [2], E [2] [3], E [1] [0], E [3] [1], E [3] [0], E [1] [3], E [2] [2], E [1] [2], E [3] [3], E [3] [2].
このように、本実施例の符号化装置1は、復号済の信号から符号化対象の信号を予測する際に、符号化対象の信号と予測信号の差分信号(予測差分信号)を2次元直交変換処理し、予測信号と処理領域周囲の既復号信号の隣接する信号間の差分信号を1次元直交変換し、直交変換係数のエネルギー分布を基に直交変換した信号の並べ替え順序を決定することにより、適応的に2次元信号を1次元信号に並べ替え、この1次元信号をエントロピー符号化するように構成したため、符号化対象の信号を少ない係数列に並べ替えることができ、効率的な伝送が可能となり、符号化効率を向上させることができる。
As described above, when the
尚、エネルギー順位予測部22は、上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号をそれぞれ生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値について周波数成分別に重み付けを施した上で、最も大きいものから降順となるよう2次元配列の列及び/又は行の並べ替え順序をそれぞれ決定し、該並べ替え順序を表す制御信号を生成するように構成することができる。この重み付けには、低周波成分ほど先にスキャニングを行うような重み付けを行うことが好ましい。例えば、一例として、信号Qの1次元DCTの係数Q’[m](m=0,1,2,・・・,N−1)のとき、m=0からm=N−1に向かって順に小さくなる重み係数を振幅の絶対値に乗じた後、エネルギー分布を算出する。
The energy
次に、本発明による一実施例の復号装置について説明する。 Next, a decoding apparatus according to an embodiment of the present invention will be described.
[復号装置]
図9は、本発明による一実施例の復号装置のブロック図を示す。本実施例の復号装置5は、エントロピー復号部51と、係数逆並べ替え部52と、逆量子化部53と、逆直交変換部54と、加算部55と、後処理部56と、メモリ57と、信号予測部58と、エネルギー順位予測部59とを備える。本実施例の復号装置5は、図1に示す符号化装置によって符号化された信号を復号する装置である。
[Decoding device]
FIG. 9 shows a block diagram of a decoding apparatus according to an embodiment of the present invention. The
エントロピー復号部51は、符号化されたビットストリームを入力して、エントロピー復号処理(符号化装置側で指定される適応的な可変長復号処理や算術符号化の復号処理)を施し、係数逆並べ替え部52に送出する。
The
係数逆並べ替え部52は、エネルギー順位予測部59からの制御信号で指定される並べ替え順序で量子化ブロックを読み出し、逆量子化部53に送出する。動きベクトルの情報は、信号予測部58に送出される。つまり、係数逆並べ替え部52は、符号化側で並べ替えられた1次元信号を、元の直交変換係数の2次元配列の列及び/又は行の順序となるよう、2次元信号に並べ替える。
The coefficient
逆量子化部53は、エントロピー復号部51から供給される量子化ブロックの量子化信号に対して逆量子化処理を施して8×8ブロックの差分信号の直交変換係数を取得し、逆直交変換部54に送出する。
The
逆直交変換54は、逆量子化部53から供給される8×8ブロックの差分信号の直交変換係数に対して、逆直交変換を施し、得られる当該8×8ブロックの差分信号を加算部55に送出する。
The inverse
信号予測部58は、メモリ57から得られる参照画像とエントロピー復号部51から得られる動きベクトルとを用いて予測画像を生成し、加算部55に出力する。
The
加算部55は、逆直交変換部54から得られる当該差分信号と、信号予測部58から供給される予測画像とを加算して8×8画素ブロックの画像信号を復元し、復元した画像信号を後処理部56に送出するとともに、メモリ57に格納する。
The
エネルギー順位予測部59は、信号予測部58からの予測画像と、メモリ57に格納された参照画像のうち、この予測画像に隣接する復号済みの画素群(つまり、「隣接既復号信号」)とを用いて、隣接既復号信号の画素群と、この画素群に近傍する予測画像の画素群とを水平方向及び垂直方向に差分演算を行い、それぞれ水平方向及び垂直方向に差分して得られる差分信号に対して、それぞれ水平方向及び垂直方向における1次元直交変換(例えば、DCT)を施し、直交変換係数の2次元配列の行ごとのエネルギー分布(振幅の絶対値)を算出し、直交変換係数の2次元配列の行ごとの信号列の絶対値について降順ソートするとともに、直交変換係数の2次元配列の列ごとの信号列の絶対値について降順ソートし、エネルギーの高いものから低いものの順に順位付けした直交変換係数の2次元配列の列及び/又は行の並べ替え順序を表す制御信号を生成して、係数逆並べ替え部52に送出する。
The energy
このように、復号処理は、受信された符号化信号をエントロピー復号部において復号し、エネルギー順位予測部59からの制御信号に従い復号処理が制御される。復号された1次元直交変換係数にジグザグスキャンを逆に処理することにより2次元信号に変換し、E’[n][m]が取得される。隣接する上側及び下側の既復号済み隣接信号と予測信号から求められるIhor[m],Ivert[n]によって得られるインデックス列による並べ替えによりE[n][m]が復号される。得られたE[n][m]は、逆量子化後に、逆直交変換部54により逆変換され、予測信号と加算され復号信号が再現される。
Thus, in the decoding process, the received encoded signal is decoded by the entropy decoding unit, and the decoding process is controlled according to the control signal from the energy
本実施例の復号装置5は、既存の一般的なブロックベース符号化(例えばMPEG−1,2,4、AVC/H.264)などで信号を上及び左の領域から順次符号化処理を行う場合を例に説明したため、既符号化済ブロックを該符号化ブロックの上側及び下側ブロックとしたが、符号化順序を右又は下を先に処理する符号化方式の場合でも同様に隣接する信号を用いてスキャニングの順序を決定することができる。
The
上述した実施例の応用例として、事前に用意された複数パターンのスキャニングオーダーが用意されている場合に、エネルギー順位予測部22の制御信号によってパターンの切り替えを行うように構成することができる。例えば、図10に示すように、係数並べ替え部14を、複数パターンに基づいてスキャニングオーダーを切り換える際に、水平方向か、垂直方向の有意な係数列を比較して、この係数列が長いほうを優先的に走査するように構成する。図10の例では、エネルギー順位予測部22の制御信号が、垂直方向の有意な係数列が水平方向の有意な係数列よりも長い旨を示す場合には、垂直優先用係数並べ替え部14eのパターンを用いるよう選択し、水平方向の有意な係数列が垂直方向の有意な係数列よりも長い旨を示す場合には、水平優先用係数並べ替え部14fのパターンを用いるよう選択し、上記以外は、ジグザグスキャン用係数並べ替え部14gを用いるよう選択する切り替え手段を、係数並べ替え部14に設けることができる。尚、スキャニングオーダーのパターンを予め符号化側及び復号側で規定しておくことで、符号化装置1によって、この切り替えに関する特別な制御フラグを別途伝送することなしに、復号装置5によって復号処理を行うことができる。例えば、復号装置5の係数逆並べ替え部52を、図10に示すように構成することによって、エネルギー順位予測部59によって生成される制御信号に応じて切り替えを行うことができる。
As an application example of the above-described embodiment, when a plurality of patterns of scanning orders prepared in advance are prepared, the pattern can be switched by a control signal of the energy
上述した実施例の応用例として、図11に示すように、係数並べ替え部14は、2次元配列の直交変換係数に基づく信号のうち、行についてエネルギー分布を算出して決定された当該制御信号に基づいて行について並べ替えを行う係数並べ替え部14aと、列についてエネルギー分布を算出して決定された当該制御信号に基づいて列について並べ替えを行う係数並べ替え部14bと、行及び/又は列についてエネルギー分布を算出して決定された当該制御信号に基づいて行及び/又は列について並べ替えを行う係数並べ替え部14cと、予め定めた並べ替え順序(例えば、エネルギー分布に基づかないデフォルトの順序)で走査する係数並べ替え部14dとを並列配置した構成とすることができ、それぞれの並べ替えについてエントロピー符号化部15の符号化結果を比較し、最も符号化効率のよいものを選択する出力判定手段をエントロピー符号化部15に設けるように構成することができる。この場合には、上記4種類のうちいずれを選択したかを示す制御フラグ(2ビットあればよい)を復号側に送出する。復号装置5は、係数逆並べ替え部52において、この制御フラグを取得して、この制御フラグに応じた係数並べ替えを行うことで、正しく復号することができる。
As an application example of the embodiment described above, as shown in FIG. 11, the
更に、本発明の一態様として、符号化装置1及び復号装置5をコンピュータとして構成させることができる。コンピュータに、前述した符号化装置1及び復号装置5の各構成要素を実現させるためのプログラムは、コンピュータの内部又は外部に備えられる記憶部に記憶される。そのような記憶部は、外付けハードディスクなどの外部記憶装置、或いはROM又はRAMなどの内部記憶装置で実現することができる。コンピュータに備えられる制御部は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現しても良い。
Furthermore, as one aspect of the present invention, the
また、この処理内容を記述したプログラムを、例えばDVD又はCD−ROMなどの可搬型記録媒体の販売、譲渡、貸与等により流通させることができるほか、そのようなプログラムを、例えばネットワーク上にあるサーバの記憶部に記憶しておき、ネットワークを介してサーバから他のコンピュータにそのプログラムを転送することにより、流通させることができる。 In addition, the program describing the processing contents can be distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM, and such a program can be distributed on a server on a network, for example. Can be distributed by transferring the program from the server to another computer via the network.
また、そのようなプログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム又はサーバから転送されたプログラムを、一旦、自己の記憶部に記憶することができる。また、このプログラムの別の実施態様として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、更に、このコンピュータにサーバからプログラムが転送される度に、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。 In addition, a computer that executes such a program can temporarily store, for example, a program recorded on a portable recording medium or a program transferred from a server in its own storage unit. As another embodiment of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and each time the program is transferred from the server to the computer. In addition, the processing according to the received program may be executed sequentially.
以上、具体例を挙げて本発明の実施例を詳細に説明したが、本発明の特許請求の範囲から逸脱しない限りにおいて、あらゆる変形や変更が可能であることは当業者に明らかである。 While the embodiments of the present invention have been described in detail with specific examples, it will be apparent to those skilled in the art that various modifications and changes can be made without departing from the scope of the claims of the present invention.
本発明によれば、映像を直交変換によって表現し、直交変換係数を必要に応じて量子化、可変長符号化することによって少ない信号表現で品質を損なわずに、或いは最小限の品質の低下によって信号を伝送する映像符号化技術に有用であり、映像の符号化分野などで利用することができる。 According to the present invention, an image is represented by orthogonal transformation, and the orthogonal transformation coefficient is quantized and variable-length encoded as necessary, so that the quality is reduced with a small signal representation, or the quality is reduced to a minimum. This is useful for video encoding technology for transmitting signals, and can be used in the field of video encoding.
1 符号化装置
5 復号装置
10 前処理部
11 減算部
12 直交変換部
13 量子化部
14,14a,14b,14c,14d,14e,14f,14g 係数並べ替え部
15 エントロピー符号化部
16 係数逆並べ替え部
17 逆量子化部
18 逆直交変換部
19 加算部
20 メモリ
21 信号予測部
22 エネルギー順位予測部
51 エントロピー復号部
52 係数逆並べ替え部
53 逆量子化部
54 逆直交変換部
55 加算部
56 後処理部
57 メモリ
58 信号予測部
59 エネルギー順位予測部
DESCRIPTION OF
Claims (9)
動画像における符号化対象のブロック信号について、局部復号したブロック信号から予測した予測信号を生成する信号予測手段と、
前記符号化対象のブロック信号と前記予測信号の差分からなる予測差分信号に対して2次元直交変換を施し、2次元配列の直交変換係数に基づく2次元信号を生成する直交変換手段と、
前記予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて前記2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するエネルギー順位予測手段と、
該制御信号に基づいて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替える走査手段と、
前記1次元信号に対して符号化を施す符号化手段と、
を備えることを特徴とする、符号化装置。 An encoding device for encoding a moving image,
Signal prediction means for generating a prediction signal predicted from a locally decoded block signal for a block signal to be encoded in a moving image;
Orthogonal transformation means for performing a two-dimensional orthogonal transformation on a prediction difference signal composed of a difference between the block signal to be encoded and the prediction signal, and generating a two-dimensional signal based on an orthogonal transformation coefficient of a two-dimensional array;
A pixel group constituting the prediction signal, and a pixel group constituting a decoded block signal adjacent to any one or more of the prediction signal in the vertical and horizontal directions, and the decoded signal and the decoded pixel The pixel constituting the block signal is differentiated within a processing target area having a predetermined number of pixels from the position adjacent to the pixel, and an adjacent pixel difference signal with respect to the already-decoded block signal adjacent to any one of the upper, lower, left and right is obtained. Generate and calculate a one-dimensional orthogonal transformation for each adjacent pixel difference signal to calculate an energy distribution, and determine a column and / or row rearrangement order of the two-dimensional array based on the calculated energy value. Energy rank predicting means for generating a control signal representing the rearrangement order;
Scanning means for rearranging signal components of the two-dimensional signal based on the orthogonal transformation coefficient of the two-dimensional array into a one-dimensional signal based on the control signal;
Encoding means for encoding the one-dimensional signal;
An encoding device comprising:
前記走査手段は、前記エネルギー順位予測手段からの制御信号によって前記複数パターンの切り替えを行う手段を有することを特徴とする、請求項1〜4のいずれか一項に記載の符号化装置。 The pattern for rearranging the signal components of the two-dimensional signal into a one-dimensional signal is composed of a plurality of patterns prepared in advance.
5. The encoding apparatus according to claim 1, wherein the scanning unit includes a unit that switches the plurality of patterns in accordance with a control signal from the energy rank prediction unit.
前記2次元配列の直交変換係数に基づく2次元信号のうち、行についてエネルギー分布を算出して決定された当該制御信号に基づいて行について並べ替えを行う第1の走査手段、
前記2次元配列の直交変換係数に基づく2次元信号のうち、列についてエネルギー分布を算出して決定された当該制御信号に基づいて列について並べ替えを行う第2の走査手段、
前記2次元配列の直交変換係数に基づく2次元信号のうち、行及び/又は列についてエネルギー分布を算出して決定された当該制御信号に基づいて行及び/又は列について並べ替えを行う第3の走査手段、及び、
前記2次元配列の直交変換係数に基づく2次元信号のうち、該予め定めた並べ替え順序で走査する第4の走査手段を切り替えて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替える切り替え手段を有し、
該並べ替えの切り替えについて前記符号化手段による符号化効率を比較するよう前記切り換え手段を制御し、当該行又は列、或いはその双方の並べ替えを利用した場合と、当該並べ替えについて非利用の場合における符号化効率を比較して、最も符号化効率の高いほうを選択する出力判定手段を更に備えることを特徴とする、請求項1〜4のいずれか一項に記載の符号化装置。 The scanning means includes
A first scanning means for rearranging the rows based on the control signal determined by calculating an energy distribution for the rows among the two-dimensional signals based on the orthogonal transformation coefficients of the two-dimensional array;
Second scanning means for rearranging the columns based on the control signal determined by calculating the energy distribution for the columns among the two-dimensional signals based on the orthogonal transformation coefficients of the two-dimensional array;
A second one of rearranging the rows and / or columns based on the control signal determined by calculating the energy distribution for the rows and / or columns of the two-dimensional signals based on the orthogonal transform coefficients of the two-dimensional array; Scanning means, and
Of the two-dimensional signals based on the orthogonal transformation coefficients of the two-dimensional array, the fourth scanning means for scanning in the predetermined rearrangement order is switched, and the signal of the two-dimensional signal based on the orthogonal transformation coefficients of the two-dimensional array Switching means for rearranging the components into a one-dimensional signal;
When the switching means is controlled so as to compare the encoding efficiency of the encoding means for the switching of the rearrangement, and the rearrangement of the row and / or the column is used, and the rearrangement is not used 5. The encoding apparatus according to claim 1, further comprising: an output determination unit that compares the encoding efficiencies in and selects the one with the highest encoding efficiency. 6.
動画像について符号化されたビットストリームを入力して、前記1次元信号を復号する復号手段と、
既に復号したブロック信号から予測信号を生成する信号予測手段と、
該予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて逆直交変換処理で用いる2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するエネルギー順位予測手段と、
該制御信号に基づいて、前記1次元信号の信号成分を前記2次元配列の直交変換係数に基づく2次元信号に並べ替える走査手段と、
前記2次元信号に対して逆直交変換を施す逆直交変換手段と、
前記逆直交変換を施して得られる信号と前記予測信号と加算して、当該動画像におけるブロック信号を復元する加算手段と、
を備えることを特徴とする、復号装置。 A decoding device for decoding a signal encoded for a moving image,
Decoding means for inputting a bitstream encoded for a moving image and decoding the one-dimensional signal;
Signal prediction means for generating a prediction signal from the already decoded block signal;
The pixel constituting the prediction signal and the pixel group constituting the decoded block signal adjacent to any one or more of up, down, left and right with respect to the prediction signal and the pixel constituting the prediction signal and the already decoded The pixel constituting the block signal is differentiated within a processing target area having a predetermined number of pixels from the position adjacent to the pixel, and an adjacent pixel difference signal with respect to the already-decoded block signal adjacent to any one of the upper, lower, left and right is obtained. Generate an energy distribution by performing one-dimensional orthogonal transformation on each adjacent pixel difference signal, and arrange columns and / or rows of a two-dimensional array used in inverse orthogonal transformation processing based on the calculated energy value Energy rank predicting means for determining a rearrangement order and generating a control signal representing the rearrangement order;
Scanning means for rearranging the signal component of the one-dimensional signal into a two-dimensional signal based on the orthogonal transformation coefficient of the two-dimensional array based on the control signal;
Inverse orthogonal transform means for performing inverse orthogonal transform on the two-dimensional signal;
Adding means for adding a signal obtained by performing the inverse orthogonal transform and the prediction signal to restore a block signal in the moving image;
A decoding apparatus comprising:
動画像における符号化対象のブロック信号について、局部復号したブロック信号から予測した予測信号を生成するステップと、
前記符号化対象のブロック信号と前記予測信号の差分からなる予測差分信号に対して2次元直交変換を施し、2次元配列の直交変換係数に基づく2次元信号を生成するステップと、
前記予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて前記2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するステップと、
該制御信号に基づいて、前記2次元配列の直交変換係数に基づく2次元信号の信号成分を1次元信号に並べ替えるステップと、
前記1次元信号に対して符号化を施すステップと、
を実行させるためのプログラム。 In a computer configured as an encoding device for encoding a moving image,
Generating a predicted signal predicted from a locally decoded block signal for a block signal to be encoded in a moving image;
Performing two-dimensional orthogonal transformation on a prediction difference signal composed of a difference between the block signal to be encoded and the prediction signal, and generating a two-dimensional signal based on an orthogonal transformation coefficient of a two-dimensional array;
A pixel group constituting the prediction signal, and a pixel group constituting a decoded block signal adjacent to any one or more of the prediction signal in the vertical and horizontal directions, and the decoded signal and the decoded pixel The pixel constituting the block signal is differentiated within a processing target area having a predetermined number of pixels from the position adjacent to the pixel, and an adjacent pixel difference signal with respect to the already-decoded block signal adjacent to any one of the upper, lower, left and right is obtained. Generate and calculate a one-dimensional orthogonal transformation for each adjacent pixel difference signal to calculate an energy distribution, and determine a column and / or row rearrangement order of the two-dimensional array based on the calculated energy value. Generating a control signal representing the rearrangement order;
Rearranging a signal component of a two-dimensional signal based on the orthogonal transformation coefficient of the two-dimensional array into a one-dimensional signal based on the control signal;
Encoding the one-dimensional signal;
A program for running
動画像について符号化されたビットストリームを入力して、前記1次元信号を復号するステップと、
既に復号したブロック信号から予測信号を生成するステップと、
該予測信号を構成する画素群と、該予測信号に対して上下左右のいずれか1つ以上に隣接する既復号のブロック信号を構成する画素群について、前記予測信号を構成する画素と前記既復号のブロック信号を構成する画素が隣接する位置から所定の画素数からなる処理対象領域内で差分して、前記上下左右のいずれか1つ以上に隣接する既復号のブロック信号に対する隣接画素差分信号を生成し、それぞれの隣接画素差分信号に対して1次元直交変換を施してエネルギー分布を算出し、算出したエネルギーの値に基づいて逆直交変換処理で用いる2次元配列の列及び/又は行の並べ替え順序を決定し、該並べ替え順序を表す制御信号を生成するステップと、
該制御信号に基づいて、前記1次元信号の信号成分を前記2次元配列の直交変換係数に基づく2次元信号に並べ替えるステップと、
前記2次元信号に対して逆直交変換を施すステップと、
前記逆直交変換を施して得られる信号と前記予測信号と加算して、当該動画像におけるブロック信号を復元するステップと、
を実行させるためのプログラム。 A computer configured as a decoding device for decoding a signal encoded for a moving image;
Inputting a bitstream encoded for a moving image and decoding the one-dimensional signal;
Generating a prediction signal from an already decoded block signal;
The pixel constituting the prediction signal and the pixel group constituting the decoded block signal adjacent to any one or more of up, down, left and right with respect to the prediction signal and the pixel constituting the prediction signal and the already decoded The pixel constituting the block signal is differentiated within a processing target area having a predetermined number of pixels from the position adjacent to the pixel, and an adjacent pixel difference signal with respect to the already-decoded block signal adjacent to any one of the upper, lower, left and right is obtained. Generate an energy distribution by performing one-dimensional orthogonal transformation on each adjacent pixel difference signal, and arrange columns and / or rows of a two-dimensional array used in inverse orthogonal transformation processing based on the calculated energy value Determining a rearrangement order and generating a control signal representing the rearrangement order;
Rearranging the signal component of the one-dimensional signal into a two-dimensional signal based on the orthogonal transform coefficient of the two-dimensional array based on the control signal;
Applying an inverse orthogonal transform to the two-dimensional signal;
Adding the signal obtained by performing the inverse orthogonal transform and the prediction signal to restore a block signal in the moving image;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010159287A JP5298082B2 (en) | 2010-07-14 | 2010-07-14 | Encoding apparatus and decoding apparatus for adaptively determining scan order of orthogonal transform coefficients |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010159287A JP5298082B2 (en) | 2010-07-14 | 2010-07-14 | Encoding apparatus and decoding apparatus for adaptively determining scan order of orthogonal transform coefficients |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012023514A true JP2012023514A (en) | 2012-02-02 |
JP5298082B2 JP5298082B2 (en) | 2013-09-25 |
Family
ID=45777412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010159287A Expired - Fee Related JP5298082B2 (en) | 2010-07-14 | 2010-07-14 | Encoding apparatus and decoding apparatus for adaptively determining scan order of orthogonal transform coefficients |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5298082B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02250581A (en) * | 1989-03-24 | 1990-10-08 | Matsushita Electric Ind Co Ltd | Highly efficient encoding method for video signal |
JPH07162859A (en) * | 1993-12-08 | 1995-06-23 | Matsushita Electric Ind Co Ltd | Image encoder and image decoder |
JP2000050267A (en) * | 1997-07-25 | 2000-02-18 | Matsushita Electric Ind Co Ltd | Image processing method, image processing unit and data storage medium |
JP2009027541A (en) * | 2007-07-20 | 2009-02-05 | Ntt Docomo Inc | Image encoding device and its method and program, and image decoding device and its method and program |
-
2010
- 2010-07-14 JP JP2010159287A patent/JP5298082B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02250581A (en) * | 1989-03-24 | 1990-10-08 | Matsushita Electric Ind Co Ltd | Highly efficient encoding method for video signal |
JPH07162859A (en) * | 1993-12-08 | 1995-06-23 | Matsushita Electric Ind Co Ltd | Image encoder and image decoder |
JP2000050267A (en) * | 1997-07-25 | 2000-02-18 | Matsushita Electric Ind Co Ltd | Image processing method, image processing unit and data storage medium |
JP2009027541A (en) * | 2007-07-20 | 2009-02-05 | Ntt Docomo Inc | Image encoding device and its method and program, and image decoding device and its method and program |
Also Published As
Publication number | Publication date |
---|---|
JP5298082B2 (en) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102398644B1 (en) | Method and apparatus for encoding intra prediction information | |
US10136158B2 (en) | Intra prediction method and apparatus using the method | |
JP6163595B2 (en) | Video encoding device | |
RU2696237C2 (en) | Video decoding method | |
KR100716999B1 (en) | Method for intra prediction using the symmetry of video, method and apparatus for encoding and decoding video using the same | |
JP5027936B2 (en) | Method, recording medium, program and processing device for adaptive scan ordering. | |
RU2600534C2 (en) | Method and apparatus for encoding video and method and apparatus for decoding video through pixel value compensation in accordance with pixel groups | |
JP4610195B2 (en) | Skip macroblock coding | |
EP3448038B1 (en) | Decoding method for intra predicting a block by first predicting the pixels at the boundary | |
JP4317814B2 (en) | Encoding apparatus and encoding method for moving picture information | |
KR20170108367A (en) | Method and apparatus for processing a video signal based on intra prediction | |
KR20130088125A (en) | Low-complexity intra prediction for video coding | |
KR20130128441A (en) | Enhanced intra-prediction coding using planar representations | |
KR20110114524A (en) | Device, method and program for image prediction encoding, device, method and program for image prediction decoding, and encoding/decoding system and method | |
KR101108681B1 (en) | Frequency transform coefficient prediction method and apparatus in video codec, and video encoder and decoder therewith | |
KR101615643B1 (en) | Compression of pictures | |
JP2021500818A (en) | Image data coding and decoding | |
JP5298082B2 (en) | Encoding apparatus and decoding apparatus for adaptively determining scan order of orthogonal transform coefficients | |
JP2009027762A (en) | Movement compensation image encoding device and encoding method | |
KR20200004749A (en) | Method for rearranging residual and apparatus | |
JP5202558B2 (en) | Intra prediction apparatus, encoder, decoder, and program | |
KR20140129424A (en) | Method for intra-prediction, and apparatus thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130617 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |