JP2010239333A - Compressed image noise removing device, and reproducing device - Google Patents
Compressed image noise removing device, and reproducing device Download PDFInfo
- Publication number
- JP2010239333A JP2010239333A JP2009083962A JP2009083962A JP2010239333A JP 2010239333 A JP2010239333 A JP 2010239333A JP 2009083962 A JP2009083962 A JP 2009083962A JP 2009083962 A JP2009083962 A JP 2009083962A JP 2010239333 A JP2010239333 A JP 2010239333A
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- image
- noise
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 claims abstract description 183
- 238000007906 compression Methods 0.000 claims abstract description 48
- 230000006835 compression Effects 0.000 claims abstract description 46
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 238000012937 correction Methods 0.000 claims description 16
- 230000002093 peripheral effect Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000013144 data compression Methods 0.000 description 4
- 241000255925 Diptera Species 0.000 description 3
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 3
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000003079 width control Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本特許は,デジタル圧縮画像の再生を行うデジタル映像機器が対象である。 This patent is directed to digital video equipment that reproduces digitally compressed images.
本技術分野の背景技術として、例えば、特開平6-70173(特許文献1)がある。該公報には「[目的]再生画像におけるリンギングの発生を防止する。[構成]ブロック毎の符号化画像を複合して得た画像の状態からエッジ判定部22でエッジが存在するかを判定する。エッジを有するブロックについては、平面近似部32でエッジの両側の領域について平面近似して、近似画像を作成する。そして、この近似画像をDCTして、周波数領域に変換する。そして、これを演算部38に供給し、周波数領域の復号画像に所定の内分比で加算する。すなわち、演算部において、量子化処理によって失われる高周波領域を付加する。この高周波領域の欠如がリンギングの原因であるため、演算器における処理によって、再生画像におけるリンギングを防止できる。」と記載されている。
As background art in this technical field, for example, there is JP-A-6-70173 (Patent Document 1). According to the publication, “[Purpose] Prevents ringing from occurring in a reproduced image. [Configuration] The
近年,デジタル放送の普及が進んでおり家庭で手軽にハイビジョンの画像を扱えるようになった。このデジタル画像は多くの情報量を有しており、通常は、動画像圧縮の国際標準方式であるMPEG2, H.264等で圧縮される。この圧縮では、画像情報を周波数変換し、高周波成分を量子化によりカットする事で、データ量の削減を行っている。この量子化によるデータ量の削減によって、圧縮画像では、高周波成分の欠落により画像のボケやモスキートノイズが発生する。 In recent years, the spread of digital broadcasting has made it possible to easily handle high-definition images at home. This digital image has a large amount of information, and is usually compressed by MPEG2, H.264 or the like, which is an international standard system for moving image compression. In this compression, the amount of data is reduced by frequency-converting image information and cutting high-frequency components by quantization. By reducing the amount of data due to this quantization, in the compressed image, blurring of the image and mosquito noise occur due to lack of high-frequency components.
これらのノイズの除去に関して、削減された周波数成分を予測する手法が提案されている(特開平6-70173)。しかし、該特許では、対象ブロックの画像情報のみを用いて、近似画像を作成して、その高周波成分を付加する事でノイズ削減を行っている。この近似画像の精度によっては、画像圧縮を行う元の画像(原画像)と異なる画像となってしまい、補正画像と周辺画像と異なってしまい再生画像の品質が低下してしまう場合が考えられる。 With respect to the removal of these noises, a method for predicting reduced frequency components has been proposed (Japanese Patent Laid-Open No. 6-70173). However, in this patent, noise is reduced by creating an approximate image using only the image information of the target block and adding the high-frequency component thereof. Depending on the accuracy of the approximate image, the image may be different from the original image (original image) on which image compression is performed, and may be different from the corrected image and the peripheral image, thereby reducing the quality of the reproduced image.
特に、通常の動画像圧縮における、量子化幅の制御は、人間の視覚特性に基づいてエッジ部分に対しては、量子化幅を広く設けるため、よりこの近似画像の精度は低くなり、最終的な補正画像の質も低下すると考えられる。 In particular, in the normal video compression, the quantization width control provides a wider quantization width for the edge portion based on human visual characteristics. It is considered that the quality of the corrected image is also lowered.
デジタル圧縮画像を再生する際に、量子化により失われた成分を精度良く予測して高画質な再生画像が望まれる。本発明は、圧縮画像を高画質に再生することを目的とする。 When a digital compressed image is reproduced, a high-quality reproduced image is desired by accurately predicting a component lost due to quantization. An object of the present invention is to reproduce a compressed image with high image quality.
上記目的を達成するために、特許請求の範囲に記載の構成を採用する。 In order to achieve the above object, the configuration described in the claims is adopted.
本発明によれば、圧縮画像を高画質に再生することが出来る。 According to the present invention, a compressed image can be reproduced with high image quality.
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.
以下、本発明の実施形態を図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図を用いて第1の実施例について説明する。本実施例は、本発明の基本概念の一面を説明するものである。図1は、本発明の基本概念の一面を示す図である。図1の(1)は元係数101を表しており、ある成分(値)をもった係数を示している。図1の(2)は、元係数をある量子化幅102で量子化する例を示している。量子化とは、アナログデータなどの連続量を、デジタルデータなどを離散的な値に近似する事である。元係数をある量子化幅で量子化を行うと、元係数の成分が量子化幅により近似され、量子化後係数107となる。
The first embodiment will be described with reference to the drawings. This example illustrates one aspect of the basic concept of the present invention. FIG. 1 is a diagram showing one aspect of the basic concept of the present invention. (1) in FIG. 1 represents an
デジタルデータ圧縮の際にも、元係数をそのまま用いるのではなく、この量子化幅と量子化後係数を用いることで、大幅なデータ量の圧縮処理を実現している。 Even in digital data compression, rather than using the original coefficients as they are, compression processing of a large amount of data is realized by using the quantization width and the quantized coefficients.
次にこの量子化により圧縮されたデジタルデータの復元方法の説明を行う。復元には、量子化幅と量子化後係数より復元係数105を復元する。この処理は逆量子化と呼ばれる場合もある。この処理は、量子化幅の領域において、中央値に値を復元する例である。この量子化幅のどの位置に復元するかは、量子化側と逆量子化側双方で定義しておく。
Next, a method for restoring the digital data compressed by this quantization will be described. For restoration, the
この復元した成分である復元係数と復元前の元係数の値の差分を量子化誤差104という。これは、デジタルデータ圧縮により生じたノイズである。この量子化幅と圧縮比の関係については一般的に、量子化幅を大きくするとデータの圧縮比は高くなるが量子化誤差が多くなり、量子化幅を小さくすると量子化誤差が少なくなるがデータ圧縮比は小さくなる。
The difference between the restored coefficient, which is the restored component, and the value of the original coefficient before restoration is referred to as a
ここまでの処理の具体例を示す。例えば、元成分が55という値を持っていた場合に、量子化幅20で量子化を行う事を考える。その場合には、圧縮に用いるのは量子化後係数2、量子化幅20という情報となる。この情報を元に逆量子化を行うと量子化幅の中間値に値を復元する場合、復元係数は50となり、量子化誤差として、
(元係数)55−(復元係数)50=5
が発生してしまう。
A specific example of the processing so far will be shown. For example, consider that quantization is performed with a quantization width of 20 when the original component has a value of 55. In this case, the information used for compression is the
(Original coefficient) 55-(Restoration coefficient) 50 = 5
Will occur.
この量子化誤差の除去については、復元係数について周辺情報やその成分の性質によりノイズの除去を行うが、ノイズ除去のために復元係数の成分を修正する場合には、106に示す様に逆量子化に用いた量子化幅領域内での成分の修正が必要となる。もし量子化誤差の除去のための処理により、復元係数の成分が106に示す逆量子化に用いた量子化幅領域を越えてしまった場合、それは元係数(原画像)と異なる係数(画像)になってしまったことを意味するからである。よって、ノイズ除去を行い忠実に元係数復元するには、この原理のノイズ除去、すなわち、量子化幅領域を越えない範囲でのノイズ除去を行うことが重要となる。 As for the removal of this quantization error, noise is removed from the restoration coefficient based on the peripheral information and the nature of its components. However, when the restoration coefficient component is corrected for noise removal, as shown in 106, the inverse quantum is removed. It is necessary to correct the components in the quantization width region used for the quantization. If the reconstruction coefficient component exceeds the quantization width region used for inverse quantization shown in 106 by the process for removing the quantization error, it is a coefficient (image) that is different from the original coefficient (original image). It means that it has become. Therefore, in order to remove noise and faithfully restore the original coefficient, it is important to perform noise removal based on this principle, that is, noise removal within a range not exceeding the quantization width region.
本実施例は、画像圧縮方式としてMPEG2(ISO/IEC 13813-2)方式を用いた例とする。しかし本発明では、MPEG2方式に限定せず、その他の圧縮方式(例えば, H.264, MPEG1, MPEG4、JPEG, VC1)等でも実現可能である。 In this embodiment, an MPEG2 (ISO / IEC 13813-2) system is used as an image compression system. However, the present invention is not limited to the MPEG2 system, and can be realized by other compression systems (for example, H.264, MPEG1, MPEG4, JPEG, VC1).
まず本実施例の概要を説明する。画像の圧縮時(エンコーダ側)において、画像情報は周波数成分に分解され量子化される。その際の量子化幅は、量子化値と量子化マトリックスとイントラDCの量子化幅でストリームに保存される。デコーダ側では、量子化後の係数と量子化幅の情報を取得する事が出来るので、エンコード時にその係数が量子化時にどの値の範囲にあったかを推測する事は可能である。デコード側でノイズ除去を行う際には、逆量子化後の係数に対して、その量子化幅の範囲に収まる様に値の補正を行う。 First, an outline of the present embodiment will be described. At the time of image compression (encoder side), image information is decomposed into frequency components and quantized. The quantization width at that time is stored in the stream with the quantization value, the quantization matrix, and the quantization width of the intra DC. On the decoder side, information on the quantized coefficient and the quantization width can be acquired, so it is possible to infer which value range the coefficient was in at the time of encoding. When noise removal is performed on the decoding side, values are corrected so that the coefficient after inverse quantization falls within the quantization width range.
図5は、画像信号を仮定した信号を周波数変換した場合のそれぞれの信号成分(503〜510)を示している。本図5では、簡単化のために8次元の成分に変換した例を示す。MPEG2では、この変換に8x8毎に変換を行うDCT(Discrete Cosine Transform)といわれる周波数変換を用いて、64次元への変換を行う。図5の横軸501は、周波数を示し、右方向に行くにつれて高周波成分である事を表している。図5の縦軸502は、それぞれの周波数成分の値を示し、絶対値が大きいほどその周波数成分が多く存在する事を示している。次に、画像圧縮ではこの周波数成分に対して量子化の処理を行う。
FIG. 5 shows respective signal components (503 to 510) when the frequency of a signal assuming an image signal is converted. FIG. 5 shows an example of conversion into 8-dimensional components for simplification. In MPEG2, the conversion to 64 dimensions is performed by using a frequency conversion called DCT (Discrete Cosine Transform) for performing this conversion every 8 × 8. The horizontal axis 501 in FIG. 5 indicates the frequency, and indicates that it is a high frequency component as it goes to the right. The
図6に、図5に示した信号成分を量子化するイメージを示す。量子化は、それぞれの信号に対して個別に量子化幅601を算出して成分毎に量子化を行う。量子化幅601は、符号化を行う処理単位であるマクロブロック毎に与えられた量子化値と、ピクチャ毎に与えられる量子化マトリックスにより決定される。一般的には、高周波成分ほど量子化幅を大きくすることが画像圧縮では好ましい。この量子化幅で成分毎に個別に量子化を行い、量子化後係数と量子化幅をストリームにする事で画像圧縮を実現している。
FIG. 6 shows an image for quantizing the signal component shown in FIG. In the quantization, the
このストリームのデコード(復元、伸張)については、量子化係数と量子化幅より周波数成分を復元し、その周波数成分を逆周波数変換する事で画像情報に復元する。因みに、量子化に必要な情報としては、MPEG2規格では、量子化値(quantizer_scale)、量子化マトリックス(non_intra/intra_quantizer_matrix)、イントラDC量子化幅(intra_dc_precision)とIntra/Inter切り替え情報(macroblock_intra)とで表記されている。他規格においても、量子化を行うために必要な情報が対象となる。 For decoding (restoration and expansion) of this stream, the frequency component is restored from the quantization coefficient and the quantization width, and the frequency component is restored to the image information by performing inverse frequency conversion. Incidentally, in the MPEG2 standard, information necessary for quantization includes a quantization value (quantizer_scale), a quantization matrix (non_intra / intra_quantizer_matrix), an intra DC quantization width (intra_dc_precision), and intra / inter switching information (macroblock_intra). It is written. Also in other standards, information necessary for performing quantization is targeted.
この画像圧縮前画像と画像復元後画像では、実施例1で説明した様な量子化誤差によりノイズが発生する。このノイズは一般的に、モスキートノイズやブロックノイズと呼ばれている。これらのノイズの除去に関しては、復元画像に各種フィルタを施すことで実現可能である。しかし、ノイズ除去を行う復元画像の修正には、圧縮に用いた量子化幅の範囲内で行わないと圧縮前の画像とは異なる画像になってしまう。ノイズの除去を行い圧縮前の画像を忠実に復元するためには、この原理のノイズ除去を行う必要がある。 In the pre-compression image and the post-image restoration image, noise is generated due to the quantization error as described in the first embodiment. This noise is generally called mosquito noise or block noise. The removal of these noises can be realized by applying various filters to the restored image. However, the restoration of the restored image for which noise removal is performed must be performed within the range of the quantization width used for compression, resulting in an image different from the image before compression. In order to remove noise and faithfully restore an image before compression, it is necessary to remove noise based on this principle.
図2に本実施例の構成を示す。図2の左部分はMPEG2のデコーダ手段201を示している。MPEG2のVideoストリームは、VLD(Variable Length Decoding)ブロック202に入力され可変長逆符号化によりストリームから、量子化後係数208や量子化幅209を算出するための量子化情報205と、動きベクトル等の動き情報206との変換を行う。量子化後係数は、逆量子化部203にて逆量子化され、逆周波数変換部で逆周波数変換が行われる。量子化幅となる量子化情報205は、VLD部から逆量子化部や情報保持部に出力される。動き情報206は、動き補償部207に出力される。動き補償部では、動き情報により以前の復号画像から予測画像を生成して、逆周波数変換部の情報と加算する事で、表示を行う復号画像210を生成する。この復号画像は、次のピクチャのための参照画像として使用するため動き補償部で保持を行う。以上がデコーダ手段の説明である。これは、通常のMPEG2のデコーダと同様の動作となる。このMPEG2でデコードした画像は、量子化ノイズであるモスキートノイズやブロックノイズを含んでいるので、右側のブロックでノイズ除去を行う。本ノイズ除去は、MPEGのデコード処理のDCTの単位である8x8ブロック毎に行う。
FIG. 2 shows the configuration of this embodiment. The left part of FIG. 2 shows the MPEG2 decoder means 201. An MPEG2 Video stream is input to a VLD (Variable Length Decoding) block 202,
ノイズ判断部250について説明する。デコーダにより生成された復号画像は、ノイズ判断部に入力される。ここでは、デコードを行うブロック単位(MPEG2では8x8画素単位)に復号画像の情報や、量子化情報や、ピクチャ情報や、周辺画像情報より対象ブロックがノイズ除去を行うべきかの判断を行う。圧縮画像のノイズは、エッジ画像を含んでいる場合に多く発生する。これは、エッジには多くの高周波成分が含まれており、この高周波成分が量子化により欠落するために発生する。よって、本ブロックでは、デコーダ手段により生成した復号画像に対してエッジ情報が存在するかの解析を行う。解析方法としては、画素間の差分を取り、差分値がある閾値より大きい場合にはエッジとするなどとして検出を行う。また、エッジ検出用のフィルタを用いても良い。また、対象ブロックの量子化値を解析する事でノイズの判定を行う手法も考えられる。これは、動画像の符号化において人間の視覚特性により高周波のノイズは目立ち難いという特性があり、急峻なエッジを含んだブロックは量子化値を大きくするという傾向がある。よって、本ブロックの量子化値が大きい場合には、その部分にはエッジ情報を含んでいると判断してもよい。更に、両者(画像の情報と量子化の情報を)を用いて総合的に判断する事でより高精度のエッジ検出も可能である。
The
また、動画像では画像の動きが激しい部分でのノイズは目立ち辛いという特徴がある。よって、動きが激しい部分においては、ノイズ除去を行わない判断をしても良い。 In addition, a moving image has a feature that noise at a portion where the motion of the image is intense is not noticeable. Therefore, it may be determined not to remove noise in a portion where movement is intense.
また、ユーザの好みによりノイズ所を行わないモードが存在する場合もある。そのようなユーザ指定によりノイズ除去を行わない判断をしても良い。 There may be a mode in which no noise is performed depending on the user's preference. It may be determined not to perform noise removal based on such user designation.
ノイズ除去部251について説明する。本ブロックは、ノイズ判断部によりノイズ削除を行うと判断したブロックのみに対してノイズ除去を行う。ノイズ除去の方法としては、画像圧縮時の周波数領域での量子化により欠落したデータを予測する事で行う。本手法の基本的な考え方を下記に示す。復号画像について、周辺画像からの絵柄の推測や、エッジとノイズの切り分けにより、エッジはよりエッジらしく、ノイズは除去する処理を行う。この操作によりノイズ除去を行った予測画像を作成する。周辺画像からの情報利用については後述する。
The
周波数変換部252について説明する。本ブロックでは、ノイズ除去を行った画像に対して周波数変換を行う。周波数変換の方式としては、逆周波数変換と対応した方式とする。MPEGの場合にはDCTを用いる。
The
量子化幅チェック部253について説明する。本ブロックでは、量子化後係数と量子化幅からノイズ除去後の画像が、量子化幅内の領域に存在しているかのチェックを行う。
The quantization
この量子化幅チェックにより、すべての係数が量子化幅に収まる場合には、修正は妥当と判断してその画像を表示画像として表示画保持部254に転送する。量子化幅チェックで量子化幅外になってしまった場合には、その情報を共に再度のノイズ除去部に転送してノイズ除去を行っても良いし、ノイズ除去前の画像を表示画像として表示画像保持部に転送しても良い。
If all the coefficients fall within the quantization width by this quantization width check, it is determined that the correction is appropriate, and the image is transferred to the display
次に、図4を用いて周辺ブロックデータの使用について説明する。図4はデコードが終了した復号画像401を表している。デコードは矩形のマクロブロック402単位に行う。量子化値もこのマクロブロック単位に値を設定する事ができる。図4の左側の図は、背景404とある物体403とが撮影されているシーンであり、量子化ノイズ405は物体と背景を両方含んでいるマクロブロックで多く発生する。この際の量子化値407のきざみ406の例を図4の右側の図に示す。これは、エンコード時に設定した量子化値であり、人間の視覚特性により平坦な部分でより細かく、エッジの部分で荒く量子化されるのが一般的である。このような場合には、あるブロックのノイズ除去を行うための周辺ブロックの情報利用は、量子化値の小さいブロックからの情報を利用した方が、有効な情報を取得できる可能性が高い。これは、この量子化値が小さいブロックでは、高周波データの欠落は少なく、再生画像の品質も良いと考えられる。また、左の図において、物体と背景を含んだブロックについて、背景は背景情報408、物体は物体情報409を用いてノイズ除去を行った方がより効率よくノイズ除去が可能となる。具体的には、この周辺情報をノイズ除去部の予測画像を作成する際の情報として用いる。また、この周辺情報を用いる手法のほかに、過去や未来のフレームの情報を用いる、輝度や色差の情報を用いる等が有効である。
Next, the use of peripheral block data will be described with reference to FIG. FIG. 4 shows a decoded
図7に、この周辺ブロックの使用を行うための構成を示す。図2の構成に加えて新たにメモリ部701を追加することで、量子化値と復号画像を保持しておき、ノイズ除去部で用いる。 FIG. 7 shows a configuration for using this peripheral block. By adding a memory unit 701 in addition to the configuration of FIG. 2, the quantized value and the decoded image are held and used in the noise removing unit.
このメモリ部では、ノイズ除去後のフレームを保持しておき次のフレーム以降のノイズ除去に使用しても良い。この場合には、ノイズ除去後の画像に対して動き情報を用いて動き補償を行い、予測画像としてノイズ除去を行う。 In this memory unit, a frame after noise removal may be held and used for noise removal after the next frame. In this case, motion compensation is performed on the image after noise removal using motion information, and noise is removed as a predicted image.
また、メモリ部にて量子化値を保持しておき、その量子化値を用いてノイズ除去に使用しても良い。これは、I-ピクチャとP/B-ピクチャでは量子化の大きさが異なるため、I-ピクチャでの量子化値を継続的に用いてノイズ除去することで、ピクチャごとのノイズ除去を均等に処理する事が可能となり、動画での高画質なノイズ除去を実現できる。 Alternatively, the quantized value may be held in the memory unit and used for noise removal using the quantized value. This is because the quantization magnitude differs between I-pictures and P / B-pictures, and noise removal for each picture is evenly performed by removing noise using the quantized values in I-pictures continuously. It is possible to process, and it is possible to realize high-quality noise removal in moving images.
第2の実施例のノイズ除去は、復号画像にノイズ除去を施し、そのノイズ除去後の画像が量子化幅に収まっているかをチェックする構成であったが、第3の実施例では、デコーダ途中の周波数成分上で修正する実施例について説明する。 The noise removal in the second embodiment is configured to perform noise removal on the decoded image and check whether the image after the noise removal is within the quantization width. In the third embodiment, in the middle of the decoder An embodiment for correcting the frequency component will be described.
図3に、本実施例の構成を示す。図内のデコーダ手段201については、第2の実施例と同様のものである。 FIG. 3 shows the configuration of this embodiment. The decoder means 201 in the figure is the same as in the second embodiment.
周波数変換部301について説明する。周波数変換部は、動き補償部から出力された予測画像に対して周波数変換を行う。周波数変換方法については、逆周波数変換部204に対応した手法とする。MPEGの場合にはDCTとする。
The
そして、周波数変換部と逆量子化部203の出力の加算302を行う。これにより、復号画像をDCTしたものと同様の情報を作成する。301と302の操作は、復号画像の周波数変換情報を取得するための操作であり、デコーダ手段で作成した復号画像に対してDCTを施す方式であっても構わない。
Then, the
修正幅算出部303について説明する。デコーダ手段より量子化後係数と量子化幅の情報を取得して、復号画像の周波数成分に対して量子化幅の領域を超えない周波数成分の修正幅の計算を行う。 The correction width calculation unit 303 will be described. The information on the quantized coefficient and the quantization width is obtained from the decoder means, and the correction width of the frequency component that does not exceed the quantization width region is calculated for the frequency component of the decoded image.
逆周波数変換部305について説明する。本ブロックは、ノイズ除去を行った周波数成分を逆周波数変換して表示画像を作成するブロックである。
The inverse
表示画像保持部254は、表示画像を保持しておくブロックである。
The display
ノイズ判断部306について説明する。加算機302により生成された復号画像にDCTをかけた情報を入力として、対象ブロックに対してノイズ除去を行うかの判断を行う。基本的には、図のノイズ除去部250と同様の機能を有する。しかし、入力が周波数成分であるため、周波数成分での判断となる。
The noise determination unit 306 will be described. The information obtained by applying DCT to the decoded image generated by the
本ブロックでは、逆周波数変換を行い画像領域でノイズ判断を行ってもよい。また、周辺ブロック、過去、未来のブロックを用いて判断を行ってもかまわない。ただし、その場合には、メモリを用いて判断を行う情報の保持を行っておく必要が生じる。 In this block, noise determination may be performed in the image area by performing inverse frequency conversion. Further, the determination may be made using the peripheral block, the past, and the future block. However, in that case, it is necessary to hold information to be determined using a memory.
ノイズ除去部304の説明を行う。ノイズ除去部は、302の加算部より出力された復号画像の周波数成分の情報に対してノイズ除去を行う。この周波数成分でのノイズ除去による値の修正の幅は、修正幅算出部で計算された幅内で修正を行う。この際、修正の方法は以下の方法が考えられる。
・自然画像等の原画像の成分をパターン化し、復号画像の周波数成分に近いパターンとする。
・図8に示す方法(後述する)
前者の方法について、詳しく説明する。これは、周波数成分上でノイズ除去を行う方法である。自然画像や人工画像はノイズが少なくくっきりとした画像であるのが一般的である。それらの画像をDCT等の周波数変換を用いて周波数変換すると特徴的な変換結果となる。自然画像、人工画像色々なパターンを周波数変換した係数をテーブル化しておく。そして、量子化後の係数に対して一番近いパターンをテーブルから探して量子化後の係数を修正する。
The noise removal unit 304 will be described. The noise removing unit performs noise removal on the frequency component information of the decoded image output from the adding
-Pattern the components of the original image such as a natural image so that the pattern is close to the frequency component of the decoded image.
・ Method shown in FIG. 8 (described later)
The former method will be described in detail. This is a method of removing noise on frequency components. Natural images and artificial images are generally clear images with little noise. When these images are frequency-converted using frequency conversion such as DCT, a characteristic conversion result is obtained. Coefficients obtained by frequency conversion of various patterns of natural images and artificial images are tabulated. Then, the pattern closest to the quantized coefficient is searched from the table, and the quantized coefficient is corrected.
図9に、係数のテーブル化と係数修正の具体例を示す。901は、周波数変換係数を表しており、本例では8x8のDCTを用いた場合を想定しているので64係数存在する。左上の係数を直流分成分904(DC成分)として、右方向は横方向成分の低周波成分から高周波成分を表し、下方向は縦方向成分の低周波成分から高周波成分を表している。テーブル化する際には、自然画像や人工画像に対してDCTを施し、低周波のある塊である低域成分郡902(図の斜線ブロック)の組み合わせにより、高域成分郡903(図の無地ブロック)の成分をテーブル化しておく。これは、量子化後係数は、量子化により高域成分は多く削られており、低域成分は情報が多く残っている場合が多いのでそのような構成にしておくことが望ましい。また、この低域成分郡と高域成分郡との切り分けは、確保できるテーブルのメモリ量により決めることができる。多くのテーブルを確保できる場合には、低域領域郡は広めに、逆の場合には狭めにする必要がある。低域領域郡を広くした方が係数の修正をより正しくできる。
FIG. 9 shows a specific example of coefficient table formation and coefficient correction.
次に、そのテーブルを用いての量子化後係数の修正方法について説明する。デコード時の逆量子化後の係数の低域成分郡係数で上記のテーブルを参照して、高域成分郡を引き出し逆量子化後の係数の高域成分郡の値を修正する。これは、特に逆量子化後の係数の高域成分郡が0であった場合に、テーブルの値を参照して値を入れ替えるのが効果的である。この際には、各広域成分郡について実施例1で説明した量子化幅の確認も行うことが望ましい。 Next, a method for correcting the quantized coefficient using the table will be described. With reference to the above table with the low-frequency component group coefficient of the coefficient after inverse quantization at the time of decoding, the high-frequency component group is extracted and the value of the high-frequency component group of the coefficient after inverse quantization is corrected. In particular, when the high frequency component group of the coefficient after inverse quantization is 0, it is effective to replace the value with reference to the value of the table. At this time, it is desirable to check the quantization width described in the first embodiment for each wide-area component group.
また、図4に示すような周辺のブロックや過去、未来の画像の周波数成分から類似したブロックの情報を参照することで、逆量子化後の係数の修正を行っても良い。 Also, the coefficient after inverse quantization may be corrected by referring to information on similar blocks from the peripheral blocks as shown in FIG. 4 and the frequency components of past and future images.
次に後者の説明を行う。図8に、原画像評価算出を用いたノイズ除去の構成を示す。図3の構成に加えて原画像評価算出802ブロックを新たに追加する。 Next, the latter will be described. FIG. 8 shows the configuration of noise removal using the original image evaluation calculation. In addition to the configuration of FIG. 3, an original image evaluation calculation 802 block is newly added.
原画像評価算出部は、逆周波数変換部より入力した表示画像に対して、評価関数により、評価値を算出する。この評価関数は、自然画像や人工画像等でより特徴的な数値を示す評価関数が望ましい。また、評価関数の算出にあたっては、処理対象ブロック内部の情報のみを使用するのではなく、周辺ブロックや過去・未来のフレーム内の情報を用いて算出しても良い。その場合には、別途メモリを用いて評価値算出に利用するデータの保持を行っておく。 The original image evaluation calculation unit calculates an evaluation value for the display image input from the inverse frequency conversion unit using an evaluation function. This evaluation function is preferably an evaluation function that shows a more characteristic numerical value in a natural image, an artificial image, or the like. In calculating the evaluation function, the information in the processing target block is not used alone, but may be calculated by using information in the peripheral block and past / future frames. In that case, the data used for the evaluation value calculation is held using a separate memory.
ノイズ除去部801は、修正幅算出部で算出したノイズ除去部で周波数成分を変更する修正幅内で、加算部302で生成した復号画像の周波数成分情報を修正する。そして、逆周波数変換を行い、現画評価値算出部にて評価値を算出する。その値を再度ノイズ除去部にフィードバックする。その操作を復号画像の周波数成分を修正するたびに行う。そして、評価値が一番原画らしさを示す周波数成分を修正後の成分として採用する。
The noise removing unit 801 corrects the frequency component information of the decoded image generated by the adding
次に、予測画作成の際の、周辺ブロック情報の使用について説明する。動画像符号化では、量子化値を画像内部のブロック単位で切り替える。例えばMPEG2では、16x16画素のブロック単位で切り替える事で、フレーム内の画像の傾向に合わせて画像圧縮を可能としている。この量子化値が小さいブロックでは、高周波データの欠落は少なく、再生画像の品質も良いと考えられる。よって、処理対象ブロックの隣接ブロックを調査し、量子化値が小さいブロックがある場合には、そのブロックの情報を積極的に使用する。具体的には、予測画像生成において、量子化値が小さい隣接ブロックの隣接画素を、本ブロックの予測画像の値とする。こうする事で、ブロック間に生じるブロック歪についても低減する効果が期待できる。この周辺ブロックの量子化情報は、情報保持部により実現する。図3に例を示す。復号画像に対して量子化値のきざみを考慮して周辺ブロックの画像データを利用する。 Next, the use of surrounding block information when creating a predicted image will be described. In moving picture coding, the quantization value is switched in units of blocks inside the picture. For example, in MPEG2, image compression can be performed in accordance with the tendency of an image in a frame by switching in block units of 16 × 16 pixels. In a block with a small quantized value, high-frequency data is hardly lost and the quality of the reproduced image is considered good. Therefore, the adjacent block of the block to be processed is investigated, and if there is a block with a small quantized value, the information of that block is actively used. Specifically, in predictive image generation, an adjacent pixel of an adjacent block having a small quantized value is set as a predicted image value of the main block. By doing so, an effect of reducing the block distortion generated between the blocks can be expected. The quantization information of the peripheral blocks is realized by the information holding unit. An example is shown in FIG. The image data of the surrounding blocks is used for the decoded image in consideration of the quantization value increment.
本実施例では、H.264(ITU-T H.264)/MPEG4 AVC(ISO/IEC 14496-10)やVC1(マイクロソフトが開発した動画像圧縮方式でありWindows(登録商標) Media Video 9を規格化したもの)の場合の構成について示す。これらの動画像符号化の規格においても、実施例1の原理の元ノイズ除去を行う。また、本実施例は、実施例2の方式とほぼ同様の考え方となるが、取り扱う符号化規格が異なるため符号化ツールが異なり、実施例2の方式をそのまま適用できない。よって、実施例2との差分の部分について特に詳しく説明する。 In this embodiment, H.264 (ITU-T H.264) / MPEG4 AVC (ISO / IEC 14496-10) and VC1 (moving image compression methods developed by Microsoft and standardized on Windows (registered trademark) Media Video 9 The configuration in the case of ( Also in these video coding standards, the original noise removal based on the principle of the first embodiment is performed. Further, the present embodiment has almost the same concept as the system of the second embodiment, but the encoding tool is different because the encoding standards to be handled are different, and the system of the second embodiment cannot be applied as it is. Therefore, the difference part from Example 2 is demonstrated in detail especially.
これらの規格では、復号画像に対してループ内フィルタ(デブロッキングフィルタ)と呼ばれるフィルタリングの処理が実施される。 In these standards, a filtering process called an in-loop filter (deblocking filter) is performed on the decoded image.
図10に本実施例の構成図を示す。Videoのストリームは、VLD部1002にて可変長符号化のデコードを行い、画像データと、量子化値やマトリックスの情報など量子化幅を算出するための量子化情報1005や動き情報1006やブロックモード情報等のサブ情報に分けられる。画像データは、逆量子化部1003で逆量子化の処理を行い、逆周波数変換部1004にて逆周波数変換が行われる。この際、逆量子化ブロックには量子化情報が供給される。なお、H.264やVC1では、ブロックの分割サイズが4x4〜8x8で可変サイズとなる。それらの情報は、VLDブロックから各ブロックに供給さえるものとする。
FIG. 10 shows a configuration diagram of this embodiment. The video stream is decoded by variable length coding in the VLD unit 1002, and the
一方、動き情報1006は動き補償部1007に供給され動き補償を行う。この動き補償されたデータと逆周波数変換部を加えることで復号画像1010が生成される。 On the other hand, the motion information 1006 is supplied to the motion compensation unit 1007 to perform motion compensation. The decoded image 1010 is generated by adding the motion compensated data and the inverse frequency transform unit.
また、本実施例の規格では、Intra予測というデコードフレーム内の情報のみを用いて予測符号化するモードもあるが、本実施例では、この動き補償部でIntra予測の処理も行う例としている。そして、この復号画像は、デブロッキングフィルタを行うDF部1011にて、ブロックノイズ除去が行われる。これらの処理は、H.264/VC1の通常のデコーダをイメージしておりデコーダ手段1001とする。 In addition, in the standard of this embodiment, there is a mode of predictive encoding using only information in a decoded frame called intra prediction, but in this embodiment, this motion compensation unit also performs an intra prediction process. The decoded image is subjected to block noise removal by a DF unit 1011 that performs a deblocking filter. These processes are based on the image of a normal H.264 / VC1 decoder, and are referred to as decoder means 1001.
復号画像1010は、ノイズ判断部1050に入力され、ノイズ除去を行うかの判定を行う。そして、ノイズ除去部1051にてノイズ除去を行う。そして、周波数変換部1052で周波数変換を行い、量子化幅チェック部1053にて量子化幅のチェックを行う。そして、DF2部1055にて デブロッキングフィルタを施し、表示画像保持部1054に保持され表示される。
The decoded image 1010 is input to the
ノイズ判断部、ノイズ除去部、量子化幅チェック部について説明する。本ブロックは、基本的には図2のノイズ判断部、ノイズ除去部、量子化幅チェック部と同様の機能を有する。しかし、本実施例の規格では、周波数変換サイズが4x4〜8x8まで可変サイズであるので、その周波数変換サイズに合わせて処理を行う。ブロック分割サイズについては、VLDブロックでのサブ情報からDCTのサイズを取得することで知ることができる。 The noise determination unit, noise removal unit, and quantization width check unit will be described. This block basically has the same functions as the noise determination unit, noise removal unit, and quantization width check unit in FIG. However, in the standard of this embodiment, since the frequency conversion size is variable from 4x4 to 8x8, processing is performed according to the frequency conversion size. The block division size can be known by acquiring the DCT size from the sub-information in the VLD block.
DF2部について説明する。本ブロックでは、ノイズ除去部でノイズ除去した画像か、ノイズ判断部でノイズ判断が必要ないと判断されたブロックについて、デブロッキングフィルタを施す。但し、ノイズ除去部でノイズ除去を行った画像については、すでにノイズ除去がされているため、本ブロックでデブロッキングフィルタを施さなくても良い。 The DF2 part will be described. In this block, a deblocking filter is applied to an image from which noise has been removed by the noise removal unit, or a block that has been judged to be unnecessary for noise judgment by the noise judgment unit. However, the image from which noise has been removed by the noise removing unit has already been subjected to noise removal, and therefore it is not necessary to apply a deblocking filter in this block.
また、すでにノイズ除去を行った場合でも、その結果に応じてデブロッキングフィルタを行うか、行わないかを切り替えても良い。 Further, even when noise removal has already been performed, whether to perform the deblocking filter or not may be switched depending on the result.
また、DF2部は、ノイズ除去部でノイズ除去を行った場合にデブロッキングフィルタを施すか否かの判定を行う以外は、DF部と同様の機能を有するブロックであり、同じ回路を使用しても良い。 The DF2 unit is a block that has the same function as the DF unit except that it determines whether or not to apply a deblocking filter when noise removal is performed by the noise removal unit. Also good.
実施例4は、復号画像に対してノイズ除去を行う例であったが、周波数ドメインでノイズ除去を行う例を本実施例に記す。基本的な考え方は、実施例3と同様であるが、取り扱う規格が異なるため符号化ツールが異なりそのままでは適用できない。本実施例では、H.264, VC1の時の差分について詳しく説明する。 The fourth embodiment is an example in which noise is removed from a decoded image, but an example in which noise is removed in the frequency domain is described in the present embodiment. The basic idea is the same as that of the third embodiment, but since the handling standards are different, the encoding tools are different and cannot be applied as they are. In this embodiment, the difference between H.264 and VC1 will be described in detail.
図11は、H.264, VC1等の規格の際の周波数ドメイン上でノイズ除去を行う構成を示している。デコーダ手段1101は、図10のデコーダ手段1001と同様の構成である。 FIG. 11 shows a configuration for performing noise removal on the frequency domain in the case of standards such as H.264 and VC1. The decoder unit 1101 has the same configuration as the decoder unit 1001 of FIG.
周波数変換部1151は、デコーダ装置内で作成した動き補償後のデータを周波数変換するブロックである。周波数変換する際には、DCTのブロックサイズに合わせて周波数変換を行う必要ある。これらのDCTブロックの情報は、VLDブロックから取得することができる。 The frequency conversion unit 1151 is a block that converts the frequency of the motion-compensated data created in the decoder device. When performing frequency conversion, it is necessary to perform frequency conversion in accordance with the DCT block size. Information on these DCT blocks can be obtained from the VLD block.
加算機1152、周波数変換部1151、ノイズ判断部1160、ノイズ除去部1155、修正幅算出部1153、逆周波数変換部1154、表示画像保持部1157については、図3の構成とほぼ同様の機能を有している。しかし、本実施例の規格ではDCTのブロックサイズが4x4〜8x8までの可変ブロック分割であり、量子化についても同ブロックサイズで実行されるため、このブロックサイズを意識しての処理となる。 The adder 1152, the frequency conversion unit 1151, the noise determination unit 1160, the noise removal unit 1155, the correction width calculation unit 1153, the inverse frequency conversion unit 1154, and the display image holding unit 1157 have substantially the same functions as the configuration in FIG. is doing. However, in the standard of the present embodiment, the DCT block size is variable block division of 4 × 4 to 8 × 8, and the quantization is also executed with the same block size. Therefore, the processing is performed in consideration of this block size.
DF2部1156について説明する。本ブロックは、図10のDF2とほぼ同様の機能を有する。 The DF2 unit 1156 will be described. This block has substantially the same function as DF2 in FIG.
図12を用いて、本実施例の基本概念の説明を一次元の信号を例に行う。本実施例は、デジタルデータのノイズ除去を行う際に、ノイズ除去対象データをその後の予測圧縮後のデータを利用してノイズ除去を行う方法である。 The basic concept of the present embodiment will be described using a one-dimensional signal as an example with reference to FIG. The present embodiment is a method of performing noise removal using noise prediction target data after subsequent noise reduction when performing noise removal of digital data.
まず、基本概念を説明するために、圧縮時1201の説明行う。一番上段の図は、圧縮を行う前の原信号を表しており、横軸1202は時間方向を示しており、原信号は、時間順にn番目信号1203とn+1番目信号1204を表している。本例では、n番目の信号を先頭の信号として説明する。
First, in order to explain the basic concept, the
これらの原信号を圧縮する場合に、量子化と予測を用いて圧縮する例を次の段圧縮方式1205に示す。先頭信号nは、その前の時間に信号が存在しないため、n番目信号のみで量子化1206を行い、圧縮を行うものとする。そして、次にn+1の圧縮を行うが、その際に、このn番目のデータを用いてn+1番目のデータの予測1207を行う。この予測を行う場合には、n番目の量子化を行い、データ圧縮を行った量子化後n 1206を用いて予測を行う必要がある。これは、量子化により発生する誤差を考慮して予測を行わないと、原信号と量子化後の差である量子化誤差1208が予測により次の信号に伝播してしまうためである。
An example of compressing these original signals using quantization and prediction is shown in the next stage compression method 1205. Since the head signal n does not exist at the previous time,
そして、この量子化後のデータを用いて予測を行ったn+1用の予測データ1208と原画像n+1(1204と同様のもの)との差が予測誤差n+1 1209となる。この予測誤差に対しても量子化1210を行い予測誤差の量子化データn+1 1211を作成する。このような、予測と量子化を行いながら圧縮を行う方式が一般的である。
The difference between the n + 1
これらの圧縮方法により、作成された圧縮後データの例を1212に示す。圧縮後データとしては、量子化後データ1206のデータ1213、予測1207の際のデータ1214、予測誤差の量子化データn+1 1215の順に構成する。その後は、本図には無いが、次の信号情報の予測のデータ、予測誤差のデータの順に構成されるのが一般的である。
An example of post-compression data created by these compression methods is shown in 1212. The post-compression data is configured in the order of data 1213 of
ここで、予測1207の際のデータは、量子化後のデータをどの様に予測データとして用いるかの情報であり、例えば、大きさを変える場合には、拡大・縮小率等が考えられる。2次元データの場合には、ベクトル情報等がこの情報に当てはまる。 Here, the data in the prediction 1207 is information on how the quantized data is used as the prediction data. For example, when the size is changed, an enlargement / reduction ratio or the like can be considered. In the case of two-dimensional data, vector information or the like applies to this information.
そして、この圧縮データを用いて、伸張処理、ノイズ除去の処理を行う。伸張1216は、圧縮後データ1212を元に、データの復元を行う。量子化後nのデータ1213のデータを下に逆量子化を行う事で、伸張データn 1217を作成する。次に、伸張データn+1 1218を予測のデータ1214を用いて、伸張データ1217より予測を行い、そのデータに予測誤差のデータ1215を逆量子化したデータを加算する事で作成する。
Then, decompression processing and noise removal processing are performed using the compressed data. The decompression 1216 performs data restoration based on the
この様に伸張したデータに対して、ノイズ除去を行う。伸張データn 1217に対してノイズ除去を行う際には、その伸張データ1217を予測として用いている伸張データ1218を用いてノイズ除去データn 1219を作成する。
Noise removal is performed on the expanded data. When noise removal is performed on the expanded
これは、原信号に変化が少ない信号を圧縮する場合に、初めの信号や量子化の幅が大きめであった量子化後データ(ノイズの多い信号)が、次の圧縮データの予測誤差として圧縮データに存在している可能性があるため、その予測誤差信号を用いて、ノイズの多い信号のノイズを除去する事が可能となる。 This is because when a signal with little change in the original signal is compressed, the first signal and the quantized data (a signal with a lot of quantization) with a large quantization width are compressed as a prediction error of the next compressed data. Since it may exist in the data, it is possible to remove noise from a noisy signal using the prediction error signal.
次に、本概念を画像圧縮に応用する。画像圧縮においても、画像圧縮の国際標準方式では、殆どの方式が、予測と量子化を組み合わせた方式となっており、本概念を適用可能である。ただし、画像は2次元で構成さており、量子化は、2次元の小ブロックを定義して周波数領域への変換を行い、予測については、2次元の動きベクトルを定義して、時間的に過去、未来で既に圧縮済みの画像を用いて予測される。国際標準方式としては、定義されていないが、予測に関しては、どう時間に構成された画像の既に圧縮済みの空間方向に予測しても良い。 Next, this concept is applied to image compression. Also in image compression, most of the international standard methods of image compression are methods combining prediction and quantization, and this concept can be applied. However, the image is configured in two dimensions, and quantization is performed by defining a two-dimensional small block and performing conversion to the frequency domain, and for prediction, a two-dimensional motion vector is defined and the past Predicted using images already compressed in the future. Although it is not defined as an international standard system, prediction may be performed in a spatial direction in which an image formed in time is already compressed.
ノイズ除去を行う際には、その対象画像を、予測としているデータの予測誤差を適用する際には、以下の点を考慮する必要がある。それは、ノイズ除去を行う対象画像の原画像と、それを予測として用いている画像の原画像が大きく異なり、それにより予測誤差が発生している可能性があるということである。その場合には、予測誤差をノイズ対象画像に付加してしまうと所望のノイズ除去ができなくなってしまう。下記のいずれか、または全てを確認することが望ましい。
1.予測に用いる動きベクトルの動きが無い(動きベクトルが0値)、もしくは周辺の動きベクトルと値が類似している
2.予測誤差を量子化した量子化の値と、ノイズ除去対象ブロックの量子化値が同じか前者の方が小さい
3.予測誤差の適用の時に、実施例1で説明したような量子化幅の確認を行う
それぞれについて詳細を説明する。
When performing noise removal, it is necessary to consider the following points when applying a prediction error of data that is predicted to the target image. That is, the original image of the target image for which noise removal is performed and the original image of the image using it as a prediction are greatly different, which may cause a prediction error. In that case, if a prediction error is added to the noise target image, the desired noise cannot be removed. It is desirable to confirm any or all of the following:
1. 1. There is no motion vector used for prediction (motion vector is 0 value), or the value is similar to surrounding motion vectors. 2. The quantization value obtained by quantizing the prediction error and the quantization value of the noise removal target block are the same or the former is smaller. Details of each of the confirmation of the quantization width as described in the first embodiment when applying the prediction error will be described.
1.は、原画像が大幅に変化してしまった場合には、動き検出のベクトルも色々な方向を指し示す傾向があるため、その場合には、本概念のノイズ除去を行うのは望ましくない。本ノイズ除去では、類似している原画像がある程度の空間的な大きさで、時間的に続く場合を想定している。同じ原画像が静止して連続して続いている場合には、ある程度の領域で動きベクトル値は0となり、平行移動している場合には、その方向を指し示すのが一般的である。ここで、ある程度の領域とは、少なくてもベクトル探索を行うブロックサイズの2倍以上である。 2.について説明する。原画像に大きな変化がなかった場合を仮定する。あるピクチャを圧縮した際に発生した量子化誤差(N1)は、それを予測に用いて生じた予測誤差(Y1)に現れる。その予測誤差を、量子化により圧縮を行うが、N1に用いた量子化値の幅より、小さな幅で無いと、予測誤差は量子化により欠如してしまう。量子化により予測誤差が欠如してしまうと、本実施例で行おうとしているN1の誤差の補填(ノイズ除去)に用いる事が出来ない。 1. If the original image has changed significantly, the motion detection vector also tends to point in various directions. In this case, it is not desirable to perform noise removal of the present concept. In this noise removal, it is assumed that similar original images have a certain spatial size and continue in time. When the same original image continues still and continuously, the motion vector value is 0 in a certain area, and when the image is moving in parallel, the direction is generally indicated. Here, the certain area is at least twice the block size for performing vector search. 2. Will be described. Assume that there is no significant change in the original image. A quantization error (N1) generated when a certain picture is compressed appears in a prediction error (Y1) generated by using it for prediction. The prediction error is compressed by quantization, but if the width is not smaller than the width of the quantization value used for N1, the prediction error is lost due to quantization. If a prediction error is lost due to quantization, it cannot be used to compensate for N1 error (noise removal) to be performed in this embodiment.
3.について説明する。実施例1でも説明した様に、ノイズ除去を行う際には、量子化幅ないで成分の調整を行う事が望ましい。N1の誤差を補填するために、そのデータを参照しているY1をノイズ除去のデータとして利用するが、利用する際には、N1を量子化した量子化幅に収まるかの確認をする事が望ましい。 3. Will be described. As described in the first embodiment, when removing noise, it is desirable to adjust components without a quantization width. In order to compensate for the error of N1, Y1 referring to the data is used as noise removal data. However, when it is used, it is possible to confirm whether N1 falls within the quantized quantization width. desirable.
次に、ノイズ除去を行う領域と予測に用いる領域の位置の違いについて図14を用いて説明する。画像圧縮を行う際には、あるブロックに分割して量子化等の圧縮を行う。ここで、画像n(1401)は、圧縮順番的にn+1(1402)の前に圧縮を行ったフレームで、その画像nを用いて画像n+1を予測に用いた圧縮を行う例とする。画像nは、あるブロック(1403)に分割されて量子化が行われたとする。ちなみに、この量子化を行うブロックサイズは例えば、MPEG1, MPEG2,MPPEG4では8x8、H.264では8x8か4x4, VC1では、8x8, 8x4, 4x8, 4x4画素単位となっている。 Next, the difference in position between the area where noise is removed and the area used for prediction will be described with reference to FIG. When image compression is performed, the image is divided into certain blocks and compression such as quantization is performed. Here, the image n (1401) is a frame that is compressed before n + 1 (1402) in the compression order, and the image n + 1 is used to perform compression using the image n + 1 for prediction. To do. Assume that the image n is divided into a certain block (1403) and quantized. Incidentally, the block size to be quantized is, for example, 8 × 8 for MPEG1, MPEG2 and MPPEG4, 8 × 8 or 4 × 4 for H.264, and 8 × 8, 8 × 4, 4 × 8 and 4 × 4 pixel units for VC1.
今、画像nのあるブロック(1404)に着目して説明する。このブロックのノイズ除去を行う際には、このブロックを画像n+1で予測に用いている領域を、画像n+1の予測ベクトルを用いて算出する。次に同図の下部に画像n+1の予測単位を示す。画像n+1を予測圧縮する場合には、画像をある大きさのブロックに分割してその単位で予測ベクトルの算出を行う。例えば、ある2つのブロック(1405, 1406)に着目すると、予測は、それぞれ画像nの1407, 1408の位置となる。これより、ノイズ除去対象のブロック1404は、色々なブロックの予測が重なることが考えられる。
Now, a description will be given focusing on a block (1404) having an image n. When performing noise removal on this block, an area in which this block is used for prediction in the image n + 1 is calculated using the prediction vector of the
また、位置によっては、どこからも予測されない位置がある。これについては、以下の方式をとることが望ましい。1404のブロック内の画素について、予測されている部分については、単独であれば、そのデータの予測誤差を対照部分のみに適用する。どこからも参照されていない場合には、その画素のノイズ除去は行なわない。または、その周辺ブロックの予測で用いられている部分の相対位置の画素をノイズ除去に用いる。次に、複数の予測がされている場合を考える。 Some positions are not predicted from anywhere. For this, it is desirable to take the following scheme. For the pixel in the 1404 block, if the portion being predicted is alone, the prediction error of the data is applied only to the control portion. If no reference is made from anywhere, the noise of the pixel is not removed. Alternatively, the pixels at the relative positions of the portions used in the prediction of the surrounding blocks are used for noise removal. Next, consider a case where a plurality of predictions are made.
予測については、図15に画像圧縮の予測フレームの例を示す。本例ではMPEG2の予測関係を例にとる。図の上段は、圧縮を行う場合の入力フレーム順番(1501)を示す。時間の順にB0->B1->I2->B3->B4->P5の順に入力されたと仮定する。下段に圧縮を行う際の圧縮順番(1502)を示す。この際に、I2を予測として用いるフレームは、B0(1503), B1(1504), P5(1505)となる。同様にP5を予測として予測圧縮を行うのは、B3, B4, P8となる。これより、I2やP5では、複数のピクチャから参照される可能性がある。また、この際には、I2は入力画像の順番から考えると、時間的に近くにあるのはB1, B0, P5の順となる。 As for prediction, FIG. 15 shows an example of a prediction frame for image compression. In this example, the MPEG2 prediction relationship is taken as an example. The upper part of the figure shows the input frame order (1501) when compression is performed. Assume that B0-> B1-> I2-> B3-> B4-> P5 are input in order of time. The lower part shows the compression order (1502) when compression is performed. At this time, frames using I2 as a prediction are B0 (1503), B1 (1504), and P5 (1505). Similarly, B3, B4, and P8 perform predictive compression using P5 as a prediction. Thus, there is a possibility that a plurality of pictures are referred to in I2 and P5. In this case, when I2 is considered from the order of the input images, B1, B0, and P5 are in order in time.
これを踏まえて、図14の複数から予測されている場合にどの予測を採用するかは、以下とするのが望ましい。
・それぞれ予測されているブロックの量子化値を確認して一番小さい量子化値のもの
・再生する場合に時間的に近いフレームのもの
・周辺の予測関係の相関を見て、同じ傾向を示すもの
これらのどちらかまたは両方を確認して最適な予測を採用する。本処理により予測データの選定を行い、上記の予測誤差の選定について実行してノイズ除去を行う。
Based on this, it is desirable that which prediction is adopted when prediction is made from a plurality of FIG. 14 as follows.
・ Check the quantized value of each predicted block and the one with the smallest quantized value. ・ The frame that is close in time to playback. Things Confirm either or both of these to adopt the best prediction. Prediction data is selected by this process, and the above-described prediction error selection is executed to remove noise.
次に、本方式を画像処理に適用した場合の構成を示す。図16に構成を示す。本適用の例は図7を例に説明する。図16の各ブロックは、図7と同様の機能を有するが、本実施例のノイズ除去は、ノイズ除去部(251)の機能として付け加える。また、本実施例の量子化幅のチェックに関しては、量子化チェック部253で行う。
Next, a configuration when the present method is applied to image processing is shown. FIG. 16 shows the configuration. An example of this application will be described with reference to FIG. Each block in FIG. 16 has the same function as in FIG. 7, but the noise removal of this embodiment is added as a function of the noise removal unit (251). Also, the
次に、メモリ部(1601)について説明する。メモリ部において、デコードの情報(VLD情報、量子化情報、復号画像、予測画像等)を保持しておき、予測されていると考えるフレーム分終了した時点で、その情報をメモリ部から読み出して除去を行う。この予測されていると考えられるフレーム分とは、MPEG1/2/4では、IPB構成、H.264では、ref_frameやDPBの構成情報等ストリーム解析で判明することができる。しかし、メモリの構成サイズの増大を防ぐために、例えば、I,Pピクチャのみの予測データを用いる等の簡略化をすることも可能である。 Next, the memory unit (1601) will be described. In the memory unit, decode information (VLD information, quantization information, decoded image, predicted image, etc.) is held, and when the frame is considered to be predicted, the information is read from the memory unit and removed. I do. The frames that are considered to be predicted can be determined by stream analysis such as IPB configuration in MPEG1 / 2/4 and ref_frame and DPB configuration information in H.264. However, in order to prevent an increase in the configuration size of the memory, for example, it is possible to simplify such as using prediction data of only I and P pictures.
また別の構成として、保持する情報も再度読み出し後に復元する構成も考えられる。これは、例えば、図17において、ストリーム振り分け部(1702)において、ノイズ除去の対象のフレームをデコードする前に先行して、そのフレームを予測している可能性のあるフレームのデコードを行う。例えば、図15の例であれば、ノイズ除去対象のI2のデコードを行う前に、B0, B1,P5を先行してデコードしておき、その際に、量子化情報や動き情報や誤差画像等の情報をメモリ部(1701)に格納しておく。そして、ノイズ除去対象フレームであるI2のデコードを行い、その際にメモリから必要情報を読み出しノイズ除去部でノイズ除去を行う。 As another configuration, a configuration in which the retained information is restored after being read again can be considered. For example, in FIG. 17, the stream distribution unit (1702) decodes a frame that may have predicted the frame prior to decoding the noise-removed frame. For example, in the example of FIG. 15, B0, B1, and P5 are decoded in advance before decoding I2 to be denoised, and at that time, quantization information, motion information, error image, etc. Is stored in the memory unit (1701). Then, I2 which is a noise removal target frame is decoded, and necessary information is read from the memory at that time, and noise removal is performed by the noise removal unit.
以上、添付図面を参照しながら本発明にかかる好適な実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。当業者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment concerning this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to this example. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. It is obvious for those skilled in the art that various changes or modifications can be conceived within the scope of the technical idea described in the claims. It is understood that it belongs to.
201 デコーダ手段
202 VLD(Variable Length Decoding)ブロック
208 量子化後係数
209 量子化幅
205 量子化情報
206 動き情報
203 逆量子化部
207 動き補償部
210 復号画像
250 ノイズ判断部
252 周波数変換部
253 量子化幅チェック部
201 Decoder means
202 VLD (Variable Length Decoding) block
208 Post-quantization coefficient
209 Quantization width
205 Quantization information
206 Motion information
203 Inverse quantization section
207 Motion compensation unit
210 Decoded image
250 Noise judgment part
252 Frequency converter
253 Quantization width check part
Claims (13)
VLD部によりデコードされた画像データを逆量子化する逆量子化部と、
逆量子化されたデータを逆周波数変換する逆周波数変換部と、
VLD部によりデコードされたサブ情報を元に動き補償を行う動き補償部と、を備えたデコーダ手段と、
VLD部がデコードしたサブ情報を複数ブロック分保持しておく情報保持部と、
デコーダ手段より生成された表示画像と、情報保持部に対してノイズ除去判定を行うノイズ判断部と、
ノイズ判断部によりノイズ除去を行うと判定されたブロックに対して、逆量子化部から出力された画像データと、動き補償部から出力された動き補償データと、情報保持部に保持されたサブ情報と、を用いてノイズ除去を行うノイズ除去部と
ノイズ判断部によりノイズ除去を行うと判定した場合にはノイズ除去部の出力画像を、ノイズ除去を行わないと判定した場合には、デコード手段の出力を表示画像として保持する表示画像保持部と、
を有する事を特徴とする圧縮画像ノイズ除去装置。 A VLD unit for decoding a digital image compressed stream into image data and sub-information;
An inverse quantization unit that inversely quantizes the image data decoded by the VLD unit;
An inverse frequency transform unit for inverse frequency transforming the inversely quantized data;
A motion compensation unit that performs motion compensation based on the sub-information decoded by the VLD unit;
An information holding unit for holding a plurality of blocks of sub-information decoded by the VLD unit;
A display image generated by the decoder means, a noise determination unit that performs noise removal determination on the information holding unit, and
The image data output from the inverse quantization unit, the motion compensation data output from the motion compensation unit, and the sub information held in the information holding unit for the block determined to be subjected to noise removal by the noise determination unit When the noise removal unit and the noise determination unit determine that noise removal is performed, the output image of the noise removal unit is determined. A display image holding unit for holding output as a display image;
A compressed image noise removing apparatus characterized by comprising:
その補正された係数値は、VLD部から出力されたサブ情報より算出した量子化幅で再量子化した際に、逆量子化部出力の係数値となる範囲内での補正を行う事を特徴とする圧縮画像ノイズ除去装置。 In the compressed image noise removal apparatus according to claim 1, noise removal is performed by correcting a coefficient with respect to an inverse quantization unit output coefficient,
The corrected coefficient value is corrected within the range that is the coefficient value of the inverse quantization unit output when requantized with the quantization width calculated from the sub-information output from the VLD unit. Compressed image noise removing device.
該入力手段に入力された圧縮画像ストリームに対し、該量子化情報が示す量子化幅を用いて逆量子化し、復元係数にする逆量子化手段と、
該逆量子化手段で逆量子化された復元係数を補正する補正手段と、
該補正手段が補正する範囲を、該量子化情報が示す量子化幅を用いて制限する補正範囲制限手段と、
該補正手段で補正された復元係数を逆周波数変換する逆周波数変換手段と、
該逆周波数変換手段で逆周波数変換された画像データを出力する出力手段と、
を備える再生装置。 Input means for inputting a compressed image stream to which image data is frequency converted into coefficients, the coefficients are quantized with a predetermined quantization width, and quantization information indicating the quantization width is added;
Dequantization means for dequantizing the compressed image stream input to the input means using a quantization width indicated by the quantization information to obtain a restoration coefficient;
Correction means for correcting the restoration coefficient inversely quantized by the inverse quantization means;
Correction range limiting means for limiting the range corrected by the correction means using the quantization width indicated by the quantization information;
Reverse frequency conversion means for performing reverse frequency conversion on the restoration coefficient corrected by the correction means;
Output means for outputting the image data subjected to inverse frequency conversion by the inverse frequency conversion means;
A playback device comprising:
量子化の情報を用いて量子化ノイズの除去を行う事を特徴とする圧縮画像ノイズ除去装置。 In a compressed image noise removing apparatus that decompresses digital compressed data that has been compressed using quantization, and further removes noise generated by quantization,
A compressed image noise removing apparatus that removes quantization noise using quantization information.
ノイズの除去対象データを、圧縮時の予測として用いているデータを用いて、ノイズ除去を行う事を特徴とする圧縮画像ノイズ除去装置。 In a compressed image noise removing apparatus that decompresses digital compressed data that has been compressed using predictions of quantization and temporally or spatially different data, and further removes noise generated by quantization.
A compressed image denoising device, wherein denoising is performed on data to be used for noise removal using data used for prediction at the time of compression.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009083962A JP5256095B2 (en) | 2009-03-31 | 2009-03-31 | Compressed image noise removal device and playback device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009083962A JP5256095B2 (en) | 2009-03-31 | 2009-03-31 | Compressed image noise removal device and playback device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010239333A true JP2010239333A (en) | 2010-10-21 |
JP5256095B2 JP5256095B2 (en) | 2013-08-07 |
Family
ID=43093298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009083962A Active JP5256095B2 (en) | 2009-03-31 | 2009-03-31 | Compressed image noise removal device and playback device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5256095B2 (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08265761A (en) * | 1995-02-28 | 1996-10-11 | Daewoo Electron Co Ltd | Image data post-processing |
JP2001045335A (en) * | 1999-07-29 | 2001-02-16 | Sony Corp | Signal processor and signal processing method |
JP2003023640A (en) * | 2001-04-24 | 2003-01-24 | Koninkl Philips Electronics Nv | Method of detecting noise in a coded video data flow |
JP2003244701A (en) * | 2002-02-21 | 2003-08-29 | Matsushita Electric Ind Co Ltd | Image processor apparatus and image processing method |
JP2006032999A (en) * | 2004-07-12 | 2006-02-02 | Sharp Corp | Image decoding device and image decoding method |
JP2007027980A (en) * | 2005-07-13 | 2007-02-01 | Mitsubishi Electric Corp | Decoding apparatus and coding apparatus |
JP2007281542A (en) * | 2006-04-03 | 2007-10-25 | Hitachi Ltd | Digital broadcasting receiving device |
JP2008109642A (en) * | 2006-09-28 | 2008-05-08 | Matsushita Electric Ind Co Ltd | Video decoding apparatus and method |
-
2009
- 2009-03-31 JP JP2009083962A patent/JP5256095B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08265761A (en) * | 1995-02-28 | 1996-10-11 | Daewoo Electron Co Ltd | Image data post-processing |
JP2001045335A (en) * | 1999-07-29 | 2001-02-16 | Sony Corp | Signal processor and signal processing method |
JP2003023640A (en) * | 2001-04-24 | 2003-01-24 | Koninkl Philips Electronics Nv | Method of detecting noise in a coded video data flow |
JP2003244701A (en) * | 2002-02-21 | 2003-08-29 | Matsushita Electric Ind Co Ltd | Image processor apparatus and image processing method |
JP2006032999A (en) * | 2004-07-12 | 2006-02-02 | Sharp Corp | Image decoding device and image decoding method |
JP2007027980A (en) * | 2005-07-13 | 2007-02-01 | Mitsubishi Electric Corp | Decoding apparatus and coding apparatus |
JP2007281542A (en) * | 2006-04-03 | 2007-10-25 | Hitachi Ltd | Digital broadcasting receiving device |
JP2008109642A (en) * | 2006-09-28 | 2008-05-08 | Matsushita Electric Ind Co Ltd | Video decoding apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP5256095B2 (en) | 2013-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4455487B2 (en) | Decoding device, decoding method, and program | |
WO2009133844A1 (en) | Video encoding and decoding method and device equipped with edge-referenced filtering function | |
WO2010001999A1 (en) | Dynamic image encoding/decoding method and device | |
US20100322303A1 (en) | Video encoding/decoding method and apparatus | |
JP5454584B2 (en) | Video encoding device and video decoding device | |
TWI521947B (en) | Image processing apparatus, method and program, image coding apparatus, method and program, image decoding apparatus, method and program, and encoding and decoding system and method | |
JP2006157481A (en) | Image coding apparatus and method thereof | |
US7760964B2 (en) | Method and architecture for temporal-spatial deblocking and deflickering with expanded frequency filtering in compressed domain | |
JP2008167456A (en) | Image encoding device and image decoding device | |
WO2011064944A1 (en) | Video coding device and video decoding device | |
JP5362723B2 (en) | Compressed image noise removal device and playback device | |
WO2009133845A1 (en) | Video encoding/decoding device and method | |
US9930352B2 (en) | Reducing noise in an intraframe appearance cycle | |
JP4784618B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, moving picture encoding program, and moving picture decoding program | |
KR20070029849A (en) | Apparatus and method for encoding and decoding image | |
JP5256095B2 (en) | Compressed image noise removal device and playback device | |
JP2007020216A (en) | Encoding apparatus, encoding method, filtering apparatus and filtering method | |
JP2005260989A (en) | Image processing apparatus and image processing method | |
JP2006081066A (en) | Image producing apparatus and image production program | |
Choi et al. | Macroblock-level adaptive dynamic resolution conversion technique | |
JP2006166104A (en) | Moving picture encoder, method thereof, program thereof, and storage medium thereof | |
JP2004172944A (en) | Image processing method, image processor and program for image processing | |
JP2006166103A (en) | Moving picture encoder, method thereof, program thereof, and storage medium thereof | |
JP2007006533A (en) | Encoding apparatus, encoding method, filter processing apparatus and filter processing method | |
JP2008061122A (en) | Control device, control method, encoder, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110826 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130422 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5256095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |