JP2012151751A - Image reduction apparatus, image enlargement apparatus and program of the same - Google Patents
Image reduction apparatus, image enlargement apparatus and program of the same Download PDFInfo
- Publication number
- JP2012151751A JP2012151751A JP2011009975A JP2011009975A JP2012151751A JP 2012151751 A JP2012151751 A JP 2012151751A JP 2011009975 A JP2011009975 A JP 2011009975A JP 2011009975 A JP2011009975 A JP 2011009975A JP 2012151751 A JP2012151751 A JP 2012151751A
- Authority
- JP
- Japan
- Prior art keywords
- image
- information
- alignment
- alignment information
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 101
- 230000033001 locomotion Effects 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 39
- 230000003044 adaptive effect Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 abstract description 5
- 238000000354 decomposition reaction Methods 0.000 description 32
- 238000004364 calculation method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 20
- 238000004519 manufacturing process Methods 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012615 high-resolution technique Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Television Systems (AREA)
Abstract
Description
本発明は、送信側で原画像に対して画像縮小を施して伝送し、受信側で画像拡大を行なって復元する技術に関し、特に、複数の原画像フレームからなる原画像列を縮小して縮小画像列を生成する画像縮小装置、縮小画像列を拡大して復元する画像拡大装置、及びこれらのプログラムに関する。 The present invention relates to a technique for performing image reduction on an original image on a transmission side and transmitting the image, and performing image enlargement on a reception side to restore the image, and in particular, reducing and reducing an original image sequence composed of a plurality of original image frames. The present invention relates to an image reduction device for generating an image sequence, an image enlargement device for enlarging and restoring a reduced image sequence, and a program thereof.
近年、撮像装置及び表示装置の高精細化が進んでおり、超解像(Super−Resolution)と称される動画像の高解像化技術が研究されている(例えば、特許文献1参照)。いわゆる8Kシステムと呼ばれるスーパーハイビジョン(SHV)のような超高精細映像、又は4Kシステムと呼ばれるデジタルシネマのような高精細映像は、従来のハイビジョン(HV)映像の4倍ないし16倍の高解像度を有するに至っている。 2. Description of the Related Art In recent years, high-definition imaging devices and display devices have been advanced, and a moving image high-resolution technique called super-resolution has been studied (for example, see Patent Document 1). Ultra-high definition video such as Super Hi-Vision (SHV) called 8K system, or high-definition video like Digital Cinema called 4K system has a resolution that is 4 to 16 times higher than that of conventional Hi-Vision (HV) video. It has come to have.
そこで、2枚の画像を利用して超解像を行う際、シーンチェンジ検出や画素位置合わせに適さない画素領域のマスク処理などの前処理を行った後、画素再構成処理により超解像画像を作成する技法が知られている(例えば、特許文献2参照)。 Therefore, when performing super-resolution using two images, after pre-processing such as scene change detection and pixel area mask processing that is not suitable for pixel alignment, super-resolution images are obtained by pixel reconstruction processing. Is known (see, for example, Patent Document 2).
一方、送信側で原画像に対して画像縮小(低解像度化)を施して伝送し、受信側で画像拡大(高解像度化)を行なって復元する技術が知られており、特に、画像縮小を行う際に、受信側で高解像度の画像を作成する際の補助情報として、色調を利用して縮小画像と元の原画像の色調が似ている箇所では高解像度画像を作成するように指示する補助情報を生成する技法がある(例えば、特許文献3参照)。 On the other hand, a technique is known in which an original image is reduced (reduced in resolution) and transmitted on the transmitting side, and a restoration is performed on the receiving side by enlarging (higher resolution). When performing, as auxiliary information when creating a high-resolution image on the receiving side, it is instructed to create a high-resolution image at a location where the color tone of the reduced image and the original original image is similar using color tone There is a technique for generating auxiliary information (see, for example, Patent Document 3).
また、画像を解像度の低い表示装置に表示させる際、画像をブロックに分割し、各ブロックの空間高周波成分を検出してブロック毎の代表値を決定して画像縮小を行い、先に検出した空間高周波成分を補助情報として例えばエッジ領域表示に利用する技法が知られている(例えば、特許文献4参照)。 When displaying an image on a display device with a low resolution, the image is divided into blocks, the spatial high frequency components of each block are detected, the representative value for each block is determined, the image is reduced, and the previously detected space A technique is known in which a high-frequency component is used as auxiliary information for edge region display, for example (see, for example, Patent Document 4).
また、送信側で原画像に対して画像縮小(低解像度化)を施して伝送し、受信側で画像拡大(高解像度化)を行なって復元する技術において、低解像度した画像を最適に符号化する際の符号化パラメータと、この符号化パラメータを高解像度画像に適用するためにスケール変換した補助情報を生成する技法が知られている(例えば、特許文献5参照)。 In addition, the technology that optimally encodes the low-resolution image in the technology that performs image reduction (reduction in resolution) on the transmission side for transmission and transmission and enlargement (higher resolution) on the reception side for restoration. There is known a technique for generating an encoding parameter used for generating ancillary information and auxiliary information obtained by scaling the encoding parameter in order to apply the encoding parameter to a high-resolution image (see, for example, Patent Document 5).
従来技術のように、補助情報は原画像が持つ空間高周波成分をパラメータとして、画像超解像、符号化、エッジ表示などに用いられる。そこで、複数の原画像フレームからなる原画像列を縮小して縮小画像列を生成する場合にも、このような補助情報を用いることは縮小画像列に対して画像拡大を実行する処理(以下、「複数フレーム超解像処理」と称する)に有効であると考えられる。 As in the prior art, the auxiliary information is used for image super-resolution, encoding, edge display, and the like using the spatial high-frequency component of the original image as a parameter. Therefore, also when generating a reduced image sequence by reducing an original image sequence composed of a plurality of original image frames, using such auxiliary information is a process for executing image enlargement on the reduced image sequence (hereinafter, referred to as “reduced image sequence”). This is considered effective for “multi-frame super-resolution processing”.
一般に、複数フレーム超解像処理では、このような補助情報を用いることなく、縮小画像列のうちの1つの被処理フレームからその前後フレームへの位置合わせ(例えば、動き推定に基づく動き補償)による画素補完を行なって画像拡大を行う。したがって、補助情報を用いない複数フレーム超解像処理では、縮小画像列のみを用いて位置合わせを行うため、位置合わせ精度が低いという問題があった。 In general, in the multi-frame super-resolution processing, such auxiliary information is not used, and alignment (for example, motion compensation based on motion estimation) from one processed frame in the reduced image sequence to its preceding and subsequent frames is performed. Perform pixel enlargement with pixel interpolation. Therefore, in the multi-frame super-resolution processing that does not use auxiliary information, since alignment is performed using only the reduced image sequence, there is a problem that alignment accuracy is low.
そこで、原画像列に対する位置合わせを行うことで、高精度の位置合わせ情報を取得することができ、この位置合わせ情報を補助情報とすることが考えられる。この場合、複数フレーム超解像処理時には、所定の点広がり関数による復元過程を経て画像拡大が行われる。ただし、この位置合わせ情報は、当該所定の点広がり関数による復元過程を考慮したものではないため、複数フレーム超解像処理後の画質について更なる改善の余地がある。 Therefore, it is conceivable that highly accurate alignment information can be acquired by performing alignment on the original image sequence, and this alignment information can be used as auxiliary information. In this case, at the time of multi-frame super-resolution processing, image enlargement is performed through a restoration process using a predetermined point spread function. However, since this alignment information does not consider the restoration process by the predetermined point spread function, there is room for further improvement in the image quality after the multi-frame super-resolution processing.
本発明は、上述の問題を鑑みて為されたものであり、複数の原画像フレームからなる原画像列を縮小して縮小画像列を生成する画像縮小装置、縮小画像列を拡大して復元する画像拡大装置、及びこれらのプログラムを提供することを目的とする。 The present invention has been made in view of the above-described problems, and an image reduction device that reduces an original image sequence composed of a plurality of original image frames to generate a reduced image sequence, and enlarges and restores the reduced image sequence. An object of the present invention is to provide an image enlargement apparatus and a program thereof.
本発明の画像縮小装置は、複数の原画像フレームからなる原画像列を縮小して縮小画像列を生成するとともに、複数フレーム超解像処理に用いる補助情報を生成する装置である。従来の補助情報を用いない一般的な複数フレーム超解像処理では、縮小画像列を用いて位置合わせを行うものであったのに対して、本発明の画像縮小装置は、原画像列を用いて位置合わせを行なって、縮小画像列を用いて生成するよりも高精度の位置合わせ情報を生成しておき、さらに、複数フレーム超解像時の点広がり関数による復元過程を考慮して、この位置合わせ情報を修正し、複数フレーム超解像処理に適した修正後位置合わせ情報を生成する。 The image reduction apparatus of the present invention is an apparatus that generates a reduced image sequence by reducing an original image sequence composed of a plurality of original image frames, and generates auxiliary information used for a multi-frame super-resolution process. In the conventional multi-frame super-resolution processing that does not use conventional auxiliary information, alignment is performed using a reduced image sequence, whereas the image reduction device of the present invention uses an original image sequence. This method is used to generate registration information with higher accuracy than that generated by using a reduced image sequence, and in consideration of the restoration process using a point spread function during multi-frame super-resolution. The alignment information is corrected, and corrected alignment information suitable for multi-frame super-resolution processing is generated.
つまり、本発明に係る画像縮小装置は、原画像列を用いて被処理フレームからその前後フレームへの位置合わせ情報を生成するとともに、原画像列を所定の画像縮小率で縮小した縮小画像列を生成する。さらに、本発明に係る画像縮小装置は、生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の被処理フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なうことで拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を点広がり関数幅を超えない範囲でシフトしながら当該差分値が最小となるシフト量を算出し、このシフト量を当該位置合わせ情報の値に加算することにより原画像列を用いて生成した位置合わせ情報を修正し、この修正後位置合わせ情報を補助情報とする。本発明に係る画像拡大装置は、この修正後位置合わせ情報を補助情報として縮小画像列とともに取得し、画像縮小装置で利用した点広がり関数を用いて画素補完を行って当該縮小画像列を拡大する。これにより、従来技術よりもさらに高画質な複数フレーム超解像処理の画像を生成することができる。 In other words, the image reduction device according to the present invention generates alignment information from the processing frame to the preceding and succeeding frames using the original image sequence, and reduces the reduced image sequence obtained by reducing the original image sequence at a predetermined image reduction rate. Generate. Furthermore, the image reduction apparatus according to the present invention uses the generated registration information and the reduced image sequence to enlarge the processed sample of the reduced image sequence at an enlargement rate corresponding to the image reduction rate. Generates an enlarged image by performing pixel interpolation using a point spread function for the position, calculates a difference value between the generated enlarged image pixel and the original image pixel, and spreads the value of the alignment information as a point spread Alignment information generated using the original image sequence is calculated by calculating a shift amount that minimizes the difference value while shifting within a range not exceeding the function width, and adding this shift amount to the value of the alignment information. The corrected alignment information is used as auxiliary information. The image enlargement apparatus according to the present invention acquires the corrected alignment information together with the reduced image sequence as auxiliary information, and performs pixel interpolation using the point spread function used in the image reduction device to enlarge the reduced image sequence. . As a result, it is possible to generate a multi-frame super-resolution image with higher image quality than in the prior art.
即ち、本発明の画像縮小装置は、原画像列を縮小して縮小画像列を生成する画像縮小装置であって、連続する複数の原画像フレームからなる原画像列を入力して、処理対象の原画像フレームから連続する少なくとも1つの原画像フレームへの位置合わせ情報を生成する位置合わせ情報生成部と、原画像列を所定の画像縮小率で縮小した縮小画像列を生成する画像縮小部と、生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の処理対象の縮小画像フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なって拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を前記点広がり関数の処理範囲内でシフトしながら当該差分値が最小となるシフト量を算出し、該シフト量を当該位置合わせ情報の値に加算することにより前記位置合わせ情報を修正した情報を補助情報として生成する位置合わせ情報修正部と、を備えることを特徴とする。 In other words, the image reduction device of the present invention is an image reduction device that generates a reduced image sequence by reducing an original image sequence, and inputs an original image sequence consisting of a plurality of continuous original image frames, An alignment information generating unit that generates alignment information from the original image frame to at least one continuous original image frame, an image reducing unit that generates a reduced image sequence obtained by reducing the original image sequence at a predetermined image reduction rate, Using the generated alignment information and the reduced image sequence, when expanding the reduced image frame to be processed in the reduced image sequence at an enlargement rate corresponding to the image reduction rate, a point spread function is applied to the enlarged sample position. The enlarged image is generated by performing the pixel interpolation used, the difference value between the generated enlarged image pixel and the original image pixel is calculated, and the value of the alignment information is shifted within the processing range of the point spread function. Naga A positioning information correction unit that calculates a shift amount that minimizes the difference value, and adds the shift amount to a value of the positioning information to generate information obtained by correcting the positioning information as auxiliary information; It is characterized by providing.
また、本発明の画像縮小装置において、前記位置合わせ情報生成部は、原画像列の時間方向スペクトルパワーを算出して空間方向の周波数分解階層数を決定し、前記周波数分解階層数に応じた空間解像度で原画像の空間解像度となるまで階層的に位置合わせを行なった情報を前記位置合わせ情報として生成することを特徴とする。 In the image reduction device of the present invention, the alignment information generation unit calculates the time-direction spectral power of the original image sequence to determine the number of frequency decomposition layers in the spatial direction, and the space corresponding to the number of frequency decomposition layers Information that is hierarchically aligned until the spatial resolution of the original image is achieved as the alignment information is generated.
また、本発明の画像縮小装置において、前記位置合わせ情報生成部は、前記原画像フレームをブロック分割したブロック単位で位置合わせ情報を生成する第1位置合わせ処理部と、各ブロック内の小領域のサブブロック単位で位置合わせ情報を生成する第2位置合わせ処理部と、サブブロック単位で検出した位置合わせ情報が、対応するブロック位置のブロック単位の動き量に対して所定の閾値以上、及び/又は一致度評価関数値が所定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする確度判定を行う位置合わせ情報確度判定部と、有効と判断したサブブロック単位の位置合わせ情報を、対応するブロック単位の位置合わせ情報にベクトル加算して補正することにより、前記位置合わせ情報修正部で用いる位置合わせ情報を生成する補正位置合わせ情報生成部と、を備えることを特徴とする。 In the image reduction device of the present invention, the alignment information generation unit includes a first alignment processing unit that generates alignment information in units of blocks obtained by dividing the original image frame into blocks, and small areas in each block. A second alignment processing unit that generates alignment information in units of sub-blocks, and the alignment information detected in units of sub-blocks is greater than or equal to a predetermined threshold with respect to the amount of motion in units of blocks at the corresponding block positions, and / or When the coincidence evaluation function value is equal to or greater than a predetermined threshold, the accuracy is low if the accuracy is low, and the alignment information accuracy determination unit that performs accuracy determination that is effective if the accuracy is high otherwise, and the sub that is determined to be effective By correcting the alignment information in block units by adding the vector to the corresponding alignment information in block units, the alignment information is corrected. And correcting the positioning information generation unit that generates positioning information used in parts, characterized in that it comprises a.
また、本発明の画像縮小装置において、前記位置合わせ情報修正部は、前記位置合わせ情報生成部によって生成した位置合わせ情報に応じて点広がり関数の幅が変化する動き量適応型点広がり関数を用いて、前記位置合わせ情報を修正した情報を補助情報として生成することを特徴とする。 In the image reduction device of the present invention, the alignment information correction unit uses a motion amount adaptive point spread function in which the width of the point spread function changes according to the alignment information generated by the alignment information generation unit. Then, information obtained by correcting the alignment information is generated as auxiliary information.
さらに、本発明の画像拡大装置は、本発明の画像縮小装置によって生成された縮小画像列に対して、前記補助情報を用いて当該画像縮小率に対応する拡大率で位置合わせを行う位置合わせ処理部と、当該位置合わせを行った拡大後の標本点を画素補完する画素補完部と、画素補完後の拡大画像を用いて前記原画像列に対応する拡大画像列を生成する拡大画像生成部と、を備えることを特徴とする。 Furthermore, the image enlarging apparatus of the present invention uses the auxiliary information to align the reduced image sequence generated by the image reducing apparatus of the present invention at an enlargement ratio corresponding to the image reduction ratio. A pixel complementing unit that pixel-complements the enlarged sample point after the alignment, and an enlarged image generation unit that generates an enlarged image sequence corresponding to the original image sequence using the enlarged image after pixel complementation, It is characterized by providing.
本発明のプログラムは、原画像列を縮小して縮小画像列を生成する画像縮小装置として機能するコンピュータに、連続する複数の原画像フレームからなる原画像列を入力して、処理対象の原画像フレームから連続する少なくとも1つの原画像フレームへの位置合わせ情報を生成するステップと、原画像列を所定の画像縮小率で縮小した縮小画像列を生成するステップと、生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の処理対象の縮小画像フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なって拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を前記点広がり関数の処理範囲内でシフトしながら当該差分値が最小となるシフト量を算出し、該シフト量を当該位置合わせ情報の値に加算することにより前記位置合わせ情報を修正した情報を補助情報として生成するステップと、を実行させるためのプログラムである。 The program of the present invention inputs an original image sequence composed of a plurality of continuous original image frames to a computer that functions as an image reduction device that reduces the original image sequence to generate a reduced image sequence. Generating alignment information from the frame to at least one original image frame continuous; generating a reduced image sequence obtained by reducing the original image sequence at a predetermined image reduction ratio; and the generated alignment information and reduced image When enlarging a reduced image frame to be processed in a reduced image sequence at an enlargement rate corresponding to the image reduction rate using the sequence, enlargement is performed by performing pixel interpolation using a point spread function on the enlarged sample position An image is generated, a difference value between the generated enlarged image pixel and the original image pixel is calculated, and the value of the alignment information is shifted within the processing range of the point spread function. Calculating a shift amount that minimizes the difference value, and adding the shift amount to the value of the alignment information to generate information obtained by correcting the alignment information as auxiliary information. It is a program.
また、本発明のプログラムは、コンピュータに、本発明の画像縮小装置によって生成された縮小画像列に対して、前記補助情報を用いて当該画像縮小率に対応する拡大率で位置合わせを行うステップと、当該位置合わせを行った拡大後の標本点を画素補完するステップと、画素補完後の拡大画像を用いて前記原画像列に対応する拡大画像列を生成するステップと、を実行させるためのプログラムである。 The program of the present invention includes a step of aligning a reduced image sequence generated by the image reducing apparatus of the present invention with a magnification ratio corresponding to the image reduction ratio using the auxiliary information. , A program for performing pixel interpolation on the enlarged sample point subjected to the alignment, and generating an enlarged image sequence corresponding to the original image sequence using the enlarged image after pixel interpolation It is.
本発明によれば、複数フレーム超解像処理のために、原画像精度のみならず点広がり関数による復元過程の誤差を修正した修正後位置合わせ情報を用いることができるようになるので、従来よりも高画質な超解像処理の画像を得ることができるようになる。 According to the present invention, for the multi-frame super-resolution processing, it becomes possible to use post-correction alignment information that corrects not only the original image accuracy but also the restoration process error due to the point spread function. In addition, a high-resolution super-resolution image can be obtained.
また、原画像精度の位置合わせ情報に応じて点広がり関数の幅が変化する動き量適応型点広がり関数を用いることにより、より高精度の修正後位置合わせ情報を生成することができる。 Further, by using a motion amount adaptive point spread function in which the width of the point spread function changes according to the alignment information of the original image accuracy, it is possible to generate more accurate corrected alignment information.
以下、図面を参照して、本発明による一実施例の画像縮小装置及び画像拡大装置を順に説明する。 Hereinafter, an image reduction apparatus and an image enlargement apparatus according to an embodiment of the present invention will be described in order with reference to the drawings.
〔画像縮小装置〕
図1は、本発明による一実施例の画像縮小装置のブロック図である。本実施例の画像縮小装置10は、制御部20と、記憶部30とを備える。制御部20は、位置合わせ情報生成部201と、画像縮小部202と、位置合わせ情報修正部203とを備える。本実施例の画像縮小装置10をコンピュータとして構成させることができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられる記憶部30に記憶される。コンピュータに備えられる制御部20は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部30から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。ここで、各構成要素の機能をハードウェアの一部で実現してもよい。尚、後述の説明で明らかとなるが、記憶部30には、「ブロック分割サイズ情報」、「画像縮小率情報」、「マザーウェーブレット情報」、及び「点広がり関数情報」が格納されている。
(Image reduction device)
FIG. 1 is a block diagram of an image reducing apparatus according to an embodiment of the present invention. The
位置合わせ情報生成部201は、連続する複数の原画像フレームからなる原画像列を入力して、処理対象の原画像フレームから連続する少なくとも1つの原画像フレームへの位置合わせ情報を生成し、位置合わせ情報修正部203に送出する。位置合わせ情報生成部201の詳細は、図2を参照して後述する。
The alignment
画像縮小部202は、原画像列を所定の画像縮小率で縮小した縮小画像列を生成し、外部に送出するとともに、位置合わせ情報修正部203に送出する。画像縮小部202の詳細は、図3を参照して後述する。
The
位置合わせ情報修正部203は、生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の処理対象の縮小画像フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なって拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を前記点広がり関数の処理範囲内でシフトしながら当該差分値が最小となるシフト量を算出し、該シフト量を当該位置合わせ情報の値に加算することにより前記位置合わせ情報を修正した情報を補助情報として生成し、外部に送出する。位置合わせ情報修正部203の詳細は、図4を参照して後述する。
The registration
図2は、本発明による一実施例の画像縮小装置における位置合わせ情報生成部のブロック図である。位置合わせ情報生成部201は、ブロック分割部2011と、ブロックマッチング処理部2012とを備える。
FIG. 2 is a block diagram of an alignment information generation unit in the image reduction device according to the embodiment of the present invention. The alignment
ブロック分割部2011は、入力される原画像列のうちの被処理フレーム位置の原画像を基準フレーム画像として、記憶部30に格納されるブロック分割サイズ情報を読み出し、ブロック分割サイズ情報で指定されるBx×Byサイズのブロックに分割する。
The
ブロックマッチング処理部2012は、ブロック分割した基準フレーム画像に対して、その前後フレーム位置の原画像を参照フレーム画像として小数画素精度ブロックマッチングを行い、ブロック毎の位置合わせ情報(つまり、ブロックマッチングによる動き情報に対応する情報)を出力する。代表的な小数画素精度ブロックマッチングとして、パラボラフィッティング法などがある。また、後述するように、階層型位置合わせ処理により位置合わせ情報を生成することもできる。
The block
図3は、本発明による一実施例の画像縮小装置における画像縮小部のブロック図である。画像縮小部202は、ウェーブレット分解部2021と、空間低周波成分抽出部2022と、縮小画像生成部2023とを備える。
FIG. 3 is a block diagram of the image reducing unit in the image reducing apparatus according to the embodiment of the present invention. The
ウェーブレット分解部2021は、n階空間ウェーブレット分解法を用いて画像縮小を行う例である(nは、0を含む自然数)。ウェーブレット分解部2021は、記憶部30に予め格納されているマザーウェーブレット情報(つまり、マザーウェーブレットの分解係数を表すフィルタ係数の情報)と、画像縮小率の情報を読み出し、当該被処理フレーム位置の原画像を基準フレーム画像としてマザーウェーブレット情報を用いて当該画像縮小率に対応する分解能でウェーブレット分解を行ない、ウェーブレット分解した画像を空間低周波成分抽出部2022に送出する。
The
空間低周波成分抽出部2022は、ウェーブレット分解した画像の低周波成分(例えば、n=1として、1階空間ウェーブレット分解を行なった場合には、水平・垂直方向に低周波成分の画像)を抽出して縮小画像生成部2023に送出する。
The spatial low-frequency
縮小画像生成部2023は、抽出した低周波成分に対応する縮小画像を生成する。これにより、画像縮小部202に入力される原画像列は、縮小画像列に変換される。尚、マザーウェーブレットを可変として、マザーウェーブレットを変化させることで縮小画像列に含まれる折り返し歪量を制御することもできるため、この場合、可変するマザーウェーブレットの情報をマザーウェーブレット情報として記憶部30に格納する。
The reduced
図4は、本発明による一実施例の画像縮小装置における位置合わせ情報修正部のブロック図である。位置合わせ情報修正部203は、全画素比較処理部2031と、加算部2034と、補助情報生成部2035とを備えており、全画素比較処理部2031は、画素補完処理部2032と補完誤差算出部2033からなる。
FIG. 4 is a block diagram of an alignment information correction unit in the image reduction device of one embodiment according to the present invention. The alignment
画素補完処理部2032は、生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の被処理フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なうことで拡大画像を生成し、当該縮小画像列の被処理フレームに対応する原画像とともに、補完誤差算出部2033に送出する。
The pixel
補完誤差算出部2033は、生成した拡大画像の画素と原画像の画素との差分値を算出し、画素補完処理部2032に対して当該位置合わせ情報の値を点広がり関数幅を超えない範囲でシフトしながら当該差分値が最小となるシフト量を算出し、加算部2034に送出する。生成した拡大画像の画素と原画像の画素との差分値の算出は、生成した拡大画像の全画素について行うことにより、画素毎に当該最小となるシフト量が算出される。
The complementary
加算部2034は、画素毎に算出した当該最小となるシフト量を、当該位置合わせ情報の各画素に対する値(同一ブロック内では、各画素に同じ値が付与されている)に加算することにより、画素単位で修正した修正後位置合わせ情報として補助情報生成部2035に送出する。
The adding
補助情報生成部2035は、生成した修正後位置合わせ情報と、記憶部30に格納されるブロック分割サイズ情報、画像縮小率情報及び点広がり関数情報とを含めて、補助情報として生成し、外部に送出する。これにより、原画像列を用いて生成した位置合わせ情報を、画素補完における点広がり関数を考慮した位置合わせ情報に修正した補助情報を生成することができる。尚、画像拡大装置側でウェーブレット再構成を用いた拡大処理を行う用途に対しては、マザーウェーブレット情報を補助情報に含めることができる。ただし、後述する一実施例の画像拡大装置50では、マザーウェーブレット情報を使用しない例について説明する。
The auxiliary
次に、本発明による一実施例の画像拡大装置について説明する。 Next, an image enlarging apparatus according to an embodiment of the present invention will be described.
〔画像拡大装置〕
図5は、本発明による一実施例の画像拡大装置のブロック図である。本実施例の画像拡大装置50は、縮小画像列に対して、補助情報を用いて当該画像縮小率に対応する拡大率で位置合わせを行ない、当該位置合わせを行った拡大後の標本点を画素補完し、画素補完後の拡大画像を用いて原画像列に対応する拡大画像列を生成する装置であり、制御部60と、記憶部70とを備える。制御部60は、位置合わせ処理部601と、画素補完処理部602と、拡大画像生成部603とを備える。本実施例の画像拡大装置50をコンピュータとして構成させることができ、当該コンピュータに、本発明に係る各構成要素を実現させるためのプログラムは、当該コンピュータの内部又は外部に備えられる記憶部70に記憶される。コンピュータに備えられる制御部70は、中央演算処理装置(CPU)などの制御で実現することができる。即ち、CPUが、各構成要素の機能を実現するための処理内容が記述されたプログラムを、適宜、記憶部70から読み込んで、各構成要素の機能をコンピュータ上で実現させることができる。
[Image enlargement device]
FIG. 5 is a block diagram of an image enlargement apparatus according to an embodiment of the present invention. The
位置合わせ処理部601は、画像縮小装置10から、縮小画像列と、修正後位置合わせ情報、ブロック分割サイズ情報、画像縮小率情報及び点広がり関数情報を含む補助情報とを入力し、まず、縮小画像列における被処理フレーム位置の縮小画像について、入力される画像縮小率情報を用いて当該画像縮小率に対応する拡大率で、縮小画像列に対応する拡大画像列(ただし、補完を要する標本点が存在する拡大画像列)を生成し、さらに、この拡大画像列における各拡大画像について、ブロック分割サイズ情報に基づく個々のブロックにおける画素値を修正後位置合わせ情報に基づいて各縮小画像列からの画素の対応付けを示す情報を生成して、画素補完処理部602に送出する。
The
画素補完処理部602は、各縮小画像列からの画素の対応付けを示す情報と、点広がり関数情報を用いて、生成した拡大画像列における各拡大画像について画素補完を施し、順次、拡大画像生成部603に送出する。
The pixel
拡大画像生成部603は、画素補完を施した各拡大画像からなる拡大画像列を構成して外部に送出する。これにより、原画像列に相当する拡大画像列を高精度に復元することができるようになる。
The enlarged
次に、図6〜図16を参照して、位置合わせ情報生成部の別例を説明する。 Next, another example of the alignment information generation unit will be described with reference to FIGS.
(位置合わせ情報の生成)
位置合わせ情報生成部201bとして、時間方向及び空間方向の周波数解析にウェーブレット変換を用いる場合について説明する。尚、時間方向及び空間方向の周波数解析には、ウェーブレット変換を用いる場合以外に、他の直交変換又はFFT(Fast Fourier transform)を用いることができる。
(Generation of alignment information)
The case where the wavelet transform is used for frequency analysis in the time direction and the spatial direction as the alignment information generation unit 201b will be described. For the frequency analysis in the time direction and the space direction, other orthogonal transforms or FFT (Fast Fourier transform) can be used besides the case of using the wavelet transform.
[装置構成]
図6は、本発明による一実施例の画像縮小装置における別例の位置合わせ情報生成部のブロック図である。本例の位置合わせ情報生成部201bは、原画像列の時間方向スペクトルパワーを算出して空間方向の周波数分解階層数を決定し、周波数分解階層数に応じた空間解像度で原画像の空間解像度となるまで階層的に位置合わせを行なった情報を位置合わせ情報として生成する機能を有し、具体的には、時間方向高周波領域パワー算出部2011bと、空間分解階数決定部2012bと、空間方向低周波領域パワー算出部2013bと、位置合わせ開始分解能決定部2014bと、階層型位置合わせ処理部2015bとを備える。
[Device configuration]
FIG. 6 is a block diagram of another example of the alignment information generation unit in the image reduction apparatus according to the embodiment of the present invention. The alignment information generation unit 201b of this example calculates the time direction spectral power of the original image sequence to determine the number of frequency resolution layers in the spatial direction, and the spatial resolution of the original image with the spatial resolution according to the number of frequency resolution layers. It has the function to generate the information that has been hierarchically aligned until the position information, specifically, the time direction high frequency region power calculation unit 2011b, the spatial resolution
時間方向高周波領域パワー算出部2011bは、位置合わせ処理を行う基準フレームF(tC)及び位置合わせ情報の探索に用いる参照フレームF(tR)を含む、時刻t=t0・・・tmにおける複数フレームのフレーム画像列F(t0),・・・,F(tC),・・・,F(tR),・・・,F(tm)を入力し、基準フレームF(tC)における全画素について、この複数フレームを時間方向に予め規定した最大階数の周波領域に分解した後、全画素における時間方向の周波数帯域毎のパワーを算出し、算出した全画素における時間方向の周波数帯域別のパワーから時間方向の高周波領域のパワーの割合を算出して空間分解階数決定部2012bに送出する。
The time-direction high-frequency domain power calculation unit 2011b includes a reference frame F (t C ) for performing alignment processing and a reference frame F (t R ) used for searching for alignment information at time t = t 0 ... T m frame image sequence F (t 0) of a plurality of frames in, ···, F (t C) , ···, F (t R), ···, enter the F (t m), the reference frame F ( For all the pixels at t C ), after decomposing the plurality of frames into a frequency region of the maximum rank defined in advance in the time direction, the power for each frequency band in the time direction in all pixels is calculated, and the calculated time direction in all the pixels The ratio of the power in the high-frequency region in the time direction is calculated from the power for each frequency band and sent to the spatial resolution
例えば、図7に示すように、時間方向高周波領域パワー算出部2011bは、基準フレームF(tC)及び参照フレームF(tR)を含む、時刻t=t0・・・tmにおけるフレーム画像列F(t0),・・・,F(tC),・・・,F(tR),・・・,F(tm)を入力し、基準フレームF(tC)の全画素について時間方向に予め規定したNmax階(例えば、4階)の離散ウェーブレット分解を行う時間方向1次元Nmax階離散ウェーブレット分解処理部2111bと、基準フレームF(tC)の全画素における時間方向の周波数帯域毎のパワーを算出し、算出した全画素における時間方向の周波数帯域別のパワーから時間方向の高周波領域のパワーの割合を算出して空間分解階数決定部2012bに送出する時間方向周波数帯域別パワー算出部2112bから構成することができる。
For example, as illustrated in FIG. 7, the time-direction high-frequency domain power calculation unit 2011b includes a frame image at time t = t 0 ... T m including a base frame F (t C ) and a reference frame F (t R ). column F (t 0), ···, F (t C), ···, F (t R), ···, all the pixels of the F (t m) enter the reference frame F (t C) Time-direction one-dimensional Nmax-order discrete wavelet
空間分解階数決定部2012は、時間方向高周波領域パワー算出部2011bによって算出した時間方向の高周波領域のパワーの割合から、時間方向の高周波領域のパワーの割合が大きいほど、動領域面積が大きく、且つ動き量が大きいと判断し、時間方向の高周波領域のパワーの割合に応じて空間周波数の分解階数Ns(即ち、空間方向の分解能)を決定し、決定した空間周波数の分解階数Nsの情報を空間方向低周波領域パワー算出部2013bに送出する。
The spatial resolution
空間方向低周波領域パワー算出部2013bは、基準フレームF(tC)及び参照フレームF(tR)と空間周波数の分解階数Nsの情報を入力し、空間周波数の分解階数Nsに基づいて、基準フレームF(tC)及び/又は参照フレームF(tR)に対して空間Ns階離散ウェーブレット分解を実行し、当該フレームにおける空間周波数帯域毎のパワーを算出し、算出した空間周波数帯域毎のパワーから当該フレームにおける空間方向の低周波領域のパワーの割合を算出し、算出した空間方向の低周波領域のパワーの割合と空間Ns階離散ウェーブレット分解したデータを位置合わせ開始分解能決定部2014bに送出する。
The spatial direction low frequency domain
尚、基準フレームF(tC)及び参照フレームF(tR)の双方に対して空間Ns階離散ウェーブレット分解を実行することは、後の処理として、固定のブロックサイズ及び探索範囲の大きさで階層型位置合わせ処理を行う際のウェーブレット再構成を階層的に行うことにより、元画像に対して可変のブロックサイズ及び探索範囲の大きさとする階層型位置合わせ処理を行うことができる点で有利であり、特に、位置合わせ処理を階層的に行うための分解能の決定のためには、基準フレームF(tC)及び参照フレームF(tR)のうちの空間方向の低周波領域のパワーの割合が大きいほうを選定するのが好適となる。以下の説明では、基準フレームF(tC)及び参照フレームF(tR)の双方について空間Ns階離散ウェーブレット分解を行う例を説明する。 It should be noted that performing the spatial Ns-order discrete wavelet decomposition on both the base frame F (t C ) and the reference frame F (t R ) requires a fixed block size and a search range size as later processing. By hierarchically performing wavelet reconstruction when performing hierarchical alignment processing, it is advantageous in that hierarchical alignment processing with variable block size and search range size can be performed on the original image. In particular, in order to determine the resolution for performing the alignment processing hierarchically, the ratio of the power in the low frequency region in the spatial direction of the base frame F (t C ) and the reference frame F (t R ) It is preferable to select the larger one. In the following description, an example will be described in which spatial Ns-order discrete wavelet decomposition is performed on both the base frame F (t C ) and the reference frame F (t R ).
例えば、図8に示すように、空間方向低周波領域パワー算出部2013bは、基準フレームF(tC)及び参照フレームF(tR)を入力し、空間分解階数決定部2012bによって決定した空間周波数の分解階数Nsに基づいて、基準フレームF(tC)及び参照フレームF(tR)の各々の全画素に対して空間Ns階離散ウェーブレット分解を行う空間方向2次元Ns階離散ウェーブレット分解処理部2131bと、基準フレームF(tC)及び参照フレームF(tR)の各々における空間周波数帯域毎のパワーを算出し、算出した空間周波数帯域毎のパワーから基準フレームF(tC)及び参照フレームF(tR)の各々における空間方向の低周波領域のパワーの割合を算出し、算出した基準フレームF(tC)及び参照フレームF(tR)の各々における空間方向の低周波領域のパワーの割合の大きいほうの情報を位置合わせ開始分解能決定部2014bに送出する空間方向周波数帯域別パワー算出部2132bから構成することができる。
For example, as illustrated in FIG. 8, the spatial direction low frequency region
位置合わせ開始分解能決定部2014bは、空間方向低周波領域パワー算出部2013bによって算出した空間方向の低周波領域のパワーの割合の情報から、空間方向の低周波領域のパワーの割合が大きいほど(空間方向の高周波領域のパワーの割合が小さいほど)、動領域面積が大きく、且つ動き量が大きいと判断し、位置合わせ処理を階層的に開始するための分解能(以下、「位置合わせ開始分解能」と称する)が小さい値(即ち、低解像度画像)となるように、空間方向の低周波領域のパワーの割合に応じて位置合わせ開始分解能を決定し、決定した階層的な位置合わせ開始分解能の情報を階層型位置合わせ処理部2015bに送出する。
The alignment start
例えば、図9に示すように、位置合わせ開始分解能決定部2014bは、空間方向低周波領域パワー算出部2013bによって算出した空間方向の低周波領域のパワーの割合から、空間方向の低周波領域のパワーの割合が大きいほど(空間方向の高周波領域のパワーの割合が小さいほど)動領域面積が大きく、且つ動き量が大きいと判断し、位置合わせを開始する階数(以下、「位置合わせ開始階数」と称する)nsが大きな値となるように、空間方向の低周波領域のパワーの割合に応じて位置合わせ開始階数nsを決定し、決定した位置合わせ開始階数nsの情報を階層型位置合わせ処理部2015bに送出する位置合わせ開始階数決定部2141bとして構成することができる。
For example, as illustrated in FIG. 9, the alignment start
階層型位置合わせ処理部2015bは、位置合わせ開始階数nsに応じた空間方向に低周波領域の基準フレームF(tC)及び参照フレームF(tR)の画像を得るために、基準フレームF(tC)及び参照フレームF(tR)の空間方向2次元Ns階離散ウェーブレット分解したデータに対して、位置合わせ開始階数nsに応じた空間ns階ウェーブレットの再構成を行い、予め定めたブロックサイズ及び探索範囲の大きさで位置合わせ処理を実行し、続いて空間ns−1階ウェーブレットの再構成を行い、当該予め定めたブロックサイズ及び探索範囲の大きさで位置合わせ処理を再度実行し、最上位の階層(即ち、元の画像レベル)にて当該予め定めたブロックサイズ及び探索範囲の大きさで位置合わせ情報の検出を行うまで階数をデクリメントして繰り返す。この階層型位置合わせ処理の動作は、基準フレームF(tC)及び参照フレームF(tR)を入力し、位置合わせ開始分解能に基づいて、基準フレームF(tC)に対して順次ブロックサイズ及び探索範囲の大きさを縮小しながら位置合わせ処理を行うことと類似した処理となる。ただし、空間ns階ウェーブレット分解及び再構成を経て順次繰り返すことによる階層型位置合わせ処理によれば、階層に応じて順次可変にすべきブロックサイズ及び探索範囲の大きさを用意する必要がなく固定とすることができ、且つ画像シーンに応じた位置合わせ開始階数nsに応じた位置合わせ処理を行うため、高精度化が期待できる。
The hierarchical
例えば、図10に示すように、階層型位置合わせ処理部2015bは、位置合わせ開始階数nsに応じた空間方向に低周波領域の基準フレームF(tC)及び参照フレームF(tR)の画像を得るために位置合わせ開始階数nsに応じた空間ns階ウェーブレットの再構成を行い、予め定めたブロックサイズ及び探索範囲の大きさで小数画素精度のブロックマッチングによる位置合わせ処理を行う位置合わせ情報生成部2151bと、この位置合わせ情報の生成処理を最上位の階数に対応する元の画像レベルとなるまで階数をデクリメントして繰り返すために、空間方向低周波領域パワー算出部2013bによって算出した空間Ns階離散ウェーブレット分解データに対して位置合わせ開始階数nsよりも上位の階数の画像となるように空間方向に1階上位のウェーブレット再構成を実行して位置合わせ情報生成部2151bに送出する空間1階ウェーブレット再構成部2152bから構成することができる。従って、位置合わせ情報生成部2151bは、空間1階ウェーブレット再構成部2152bから得られる基準フレームF(tC)及び参照フレームF(tR)の再構成画像を用いて、位置合わせ処理を階層的に繰り返し、最終的な一合わせ情報を決定して出力することができる。
For example, as illustrated in FIG. 10, the hierarchical
以下、本例の位置合わせ情報生成部の動作について更に詳細に説明する。 Hereinafter, the operation of the alignment information generation unit of this example will be described in more detail.
[装置動作]
図11は、本発明による一実施例の画像縮小装置における別例の位置合わせ情報生成部の動作を示す動作フローである。ステップS1にて、位置合わせ情報生成部201bは、基準フレームF(tC)及び参照フレームF(tR)を含む、時刻t=t0・・・tmにおけるフレーム画像列F(t0),・・・,F(tC),・・・,F(tR),・・・,F(tm)を入力して、位置合わせ情報生成部201bが備える記憶部(図示せず)に適宜読み出し可能に格納する。
[Device operation]
FIG. 11 is an operation flow showing the operation of another example of the alignment information generating unit in the image reducing apparatus according to the embodiment of the present invention. In step S1, the alignment information generation unit 201b includes the frame image sequence F (t 0 ) at time t = t 0 ... T m including the base frame F (t C ) and the reference frame F (t R ). ,..., F (t C ),..., F (t R ),..., F (t m ) are input, and a storage unit (not shown) included in the alignment information generation unit 201b. Are stored in a readable manner.
ステップS2にて、時間方向高周波領域パワー算出部2011bにより、フレーム画像列F(t0),・・・,F(tC),・・・,F(tR),・・・,F(tm)を入力し、基準フレームF(tC)における全画素について時間方向に予め規定した最大階数の周波領域に分解した後、全画素における時間方向の周波数帯域毎のパワーを算出し、算出した全画素における時間方向の周波数帯域別のパワーから時間方向の高周波領域のパワーの割合を算出する。 In step S2, the temporal high-frequency range power calculation unit 2011 b, frame image sequence F (t 0), ···, F (t C), ···, F (t R), ···, F ( t m ) is input, and all the pixels in the reference frame F (t C ) are decomposed into frequency regions of the maximum rank defined in advance in the time direction, and then power for each frequency band in the time direction in all pixels is calculated. The ratio of the power in the high-frequency region in the time direction is calculated from the power for each frequency band in the time direction in all the pixels.
例えば、図12に示すように、フレーム画像列F(t0),・・・,F(tC),・・・,F(tR),・・・,F(tm)における或る画素R(k,l)について、時間方向に予め規定した最大階数(Nmax)の周波領域に分解した後、全画素における時間方向周波数帯域毎のパワーを算出することができる。例えば、図13に示すように、16フレームのフレーム画像列F(t)を時間方向にNmax階に分解するとすれば、Nmax=1では、低周波領域L1及び高周波領域H1として分割することができ(図13(a)参照)、Nmax=2では、低周波領域L2及び高周波領域H1,H2として分割することができ(図13(b)参照)、Nmax=3では、低周波領域L3及び高周波領域H1,H2,H3として分割することができ(図13(c)参照)、Nmax=4では、低周波領域L4及び高周波領域H1,H2,H3,H4として分割することができる(図13(d)参照)。 For example, as shown in FIG. 12, frame image sequence F (t 0), ···, F (t C), ···, F (t R), ···, one at F (t m) After the pixel R (k, l) is decomposed into frequency regions of the maximum rank (Nmax) defined in advance in the time direction, the power for each time direction frequency band in all the pixels can be calculated. For example, as shown in FIG. 13, if a frame image sequence F (t) of 16 frames is decomposed into Nmax floors in the time direction, when Nmax = 1, it is divided into a low frequency region L 1 and a high frequency region H 1. (See FIG. 13A), when Nmax = 2, it can be divided into the low frequency region L 2 and the high frequency regions H 1 and H 2 (see FIG. 13B), and when Nmax = 3, it is low. It can be divided into the frequency region L 3 and the high frequency regions H 1 , H 2 , H 3 (see FIG. 13C), and when Nmax = 4, the low frequency region L 4 and the high frequency regions H 1 , H 2 , H 3 and H 4 (see FIG. 13D).
ステップS3にて、空間分解階数決定部2012bにより、算出した時間方向の高周波領域のパワーの割合から、時間方向の高周波領域のパワーの割合が大きいほど動領域面積が大きく、且つ動き量が大きいと判断し、空間周波数の分解階数Nsが大きな値となるように、時間方向の高周波領域のパワーの割合に応じて準フレームF(tC)及び参照フレームF(tR)の空間周波数の分解階数Nsを決定する。
In step S3, when the power ratio of the high frequency region in the time direction is larger from the ratio of power in the high frequency region in the time direction calculated by the spatial resolution
例えば、表1に示すように、時間方向の高周波領域のパワーの割合と空間周波数の分解階数Nsとの間で規定されるテーブルを予め保持しておく。 For example, as shown in Table 1, a table defined in advance between the power ratio in the high frequency region in the time direction and the resolution rank Ns of the spatial frequency is held in advance.
ステップS4にて、空間方向低周波領域パワー算出部2013bにより、基準フレームF(tC)及び参照フレームF(tR)を入力し、空間分解階数決定部2012bによって決定した空間周波数の分解階数Nsに基づいて、基準フレームF(tC)及び参照フレームF(tR)に対して空間Ns階離散ウェーブレット分解を実行し、基準フレームF(tC)及び参照フレームF(tR)における空間周波数帯域毎のパワーをそれぞれ算出し、位置合わせ開始分解能(又は位置合わせ開始階数ns)の決定のために、算出した空間周波数帯域毎のパワーから基準フレームF(tC)及び参照フレームF(tR)における空間周波数帯域毎のパワーの割合の大きいほうを選定する。基準フレームF(tC)又は参照フレームF(tR)における空間周波数帯域毎のパワーの割合のみを算出してもよい。
In step S4, the base frame F (t C ) and the reference frame F (t R ) are input by the spatial direction low frequency region
例えば、図14(a)に示すように、基準フレームF(tC)の全画素に対して空間方向に2次元2階離散ウェーブレット分解を実行して、各周波領域のパワーを算出し、算出した空間周波数帯域毎のパワーから空間方向の低周波領域のパワーの割合を算出することができる。また、図14(b)に示すように、基準フレームF(tC)の空間方向の低周波領域(例えば、LL2)のみを抽出して基準フレームF(tC)の低周波領域のみの画像を再構成することができる。 For example, as shown in FIG. 14A, the power of each frequency domain is calculated by performing two-dimensional second-order discrete wavelet decomposition in the spatial direction on all the pixels of the reference frame F (t C ). The power ratio in the low frequency region in the spatial direction can be calculated from the power for each spatial frequency band. Further, as shown in FIG. 14 (b), the reference frame F (t C) a low-frequency region (e.g., LL 2) spatial direction only extracted by the reference frame F low-frequency region only of the (t C) Images can be reconstructed.
ステップS5にて、位置合わせ開始分解能決定部2014bにより、空間Ns階離散ウェーブレット分解データ及び空間方向の低周波領域のパワーの割合から、空間方向の低周波領域のパワーの割合が大きいほど(空間方向の高周波領域のパワーの割合が小さいほど)動領域面積が大きく、且つ動き量が大きいと判断し、位置合わせ開始分解能が小さい値(位置合わせ開始階数nsが大きい値)となるように、空間方向の低周波領域のパワーの割合に応じて階層的な位置合わせ開始分解能(又は位置合わせ開始階数ns)を決定する。ただし、ns≦Nsである。
In step S5, the alignment start
例えば、表2に示すように、空間方向の低周波領域のパワーの割合と位置合わせ開始分解能(又は位置合わせ開始階数ns)との間で規定されるテーブルを予め保持しておく。尚、位置合わせ開始階数が大きくなるにつれて、元の画像が低解像度化することを意味しており、元の画像に対して相対的にブロックサイズ及び位置合わせ情報の探索範囲の大きさが増大することを意味している。例えば、空間分解能1/16,1/8,1/4,1/2とすれば、それぞれ(ブロックサイズ,位置合わせ情報の探索範囲の大きさ)は、(16×16,水平・垂直16画素),(8×8,水平・垂直8画素),(4×4,水平・垂直4画素),(2×2,水平・垂直2画素)などである。ここで、例えば、空間分解能1/16は、元の画像における水平標本化周波数Hs及び垂直標本化周波数Vsにおいて、16画素を1画素として標本化する低解像度化を意味する。 For example, as shown in Table 2, a table defined between the power ratio of the low frequency region in the spatial direction and the alignment start resolution (or alignment start floor ns) is held in advance. This means that the resolution of the original image is reduced as the alignment start floor number increases, and the block size and the size of the search range for alignment information increase relative to the original image. It means that. For example, if the spatial resolution is 1/16, 1/8, 1/4, 1/2, the (block size, the size of the search range of the alignment information) is (16 × 16, horizontal / vertical 16 pixels). ), (8 × 8, horizontal / vertical 8 pixels), (4 × 4, horizontal / vertical 4 pixels), (2 × 2, horizontal / vertical 2 pixels), and the like. Here, for example, the spatial resolution of 1/16 means a reduction in resolution in which 16 pixels are sampled as one pixel at the horizontal sampling frequency Hs and the vertical sampling frequency Vs in the original image.
つまり、図15に示すように、空間方向の低周波領域のパワーの割合によって、位置合わせ開始階数nsを関連付けることができる。例えば、Ns=4のとき、低周波領域(LL4)及び高周波領域(LL4以外)のそれぞれのパワーを算出して、全体における低周波領域(LL4)の割合が、99.5%以上であれば、位置合わせ開始階数ns=4として4階層の低周波領域のみの画像を再構成することができる(図15(d)参照)。また、全体における低周波領域(LL4)の割合が、98.0%以上99.5%未満であれば、位置合わせ開始階数ns=3として3階層の低周波領域(この場合、LL3)のみの画像を再構成することができる(図15(c)参照)。同様に、全体における低周波領域(LL4)の割合が、95.0%以上98.0%未満であれば、位置合わせ開始階数ns=2として2階層の低周波領域(この場合、LL2)のみの画像を再構成することができ(図15(b)参照)、全体における低周波領域(LL4)の割合が、95.0%未満であれば、位置合わせ開始階数ns=1として1階層の低周波領域(この場合、LL1)のみの画像を再構成することができる(図15(a)参照)。 That is, as shown in FIG. 15, the alignment start rank ns can be associated with the ratio of the power in the low frequency region in the spatial direction. For example, when Ns = 4, the respective powers of the low frequency region (LL 4 ) and the high frequency region (other than LL 4 ) are calculated, and the ratio of the low frequency region (LL 4 ) in the whole is 99.5% or more. If so, it is possible to reconstruct an image of only the low-frequency region of the four layers with the alignment start rank ns = 4 (see FIG. 15D). Further, if the ratio of the low frequency region (LL 4 ) in the whole is 98.0% or more and less than 99.5%, the alignment start rank ns = 3 and the three layers of low frequency regions (in this case, LL 3 ). Only an image can be reconstructed (see FIG. 15C). Similarly, when the ratio of the low frequency region (LL 4 ) in the whole is 95.0% or more and less than 98.0%, the alignment start rank ns = 2 is set to two layers of low frequency regions (in this case, LL 2 ) Only can be reconstructed (see FIG. 15B), and if the ratio of the low frequency region (LL 4 ) in the whole is less than 95.0%, the alignment start rank ns = 1 An image of only one layer of the low-frequency region (in this case, LL 1 ) can be reconstructed (see FIG. 15A).
ステップS6にて、階層型位置合わせ処理部2015bにより、位置合わせ開始分解能(位置合わせ開始階数ns)に基づいた基準フレームF(tC)及び参照フレームF(tR)の低周波画像に対して、基準フレームF(tC)の低周波画像を所定のブロックサイズに分割し、分割した各ブロックについて、所定の位置合わせ情報の探索範囲の大きさで、小数画素精度のブロックマッチングによる位置合わせ情報の生成処理を行う。
In step S6, the hierarchical
ステップS7にて、階層型位置合わせ処理部2015bにより、基準フレームF(tC)及び参照フレームF(tR)に対してブロックサイズ及び位置合わせ情報の探索範囲の大きさを縮小しながら位置合わせ処理を繰り返す効果を得るために、算出していた基準フレームF(tC)及び参照フレームF(tR)の空間ns階離散ウェーブレット分解データに対して位置合わせ開始階数nsよりも上位の階数の画像となるように空間方向に1階上位のウェーブレット再構成を実行する。
In step S7, the hierarchical
階層型位置合わせ処理部2015bは、空間1階ウェーブレット再構成部2152bから得られる基準フレームF(tC)及び参照フレームF(tR)の再構成画像を用いて、最上位の階層(即ち、元の画像レベルにおける位置合わせ情報)となるまで順次階数をデクリメントして位置合わせ処理を繰り返し(ステップS8)、最終的な位置合わせ情報を決定して出力することができる(ステップS9)。
The hierarchical
例えば、図16(a)〜(d)に示すように、位置合わせ開始階数nsが大きいほどブロックサイズが大きくなる様子を示しており、ブロックサイズが大きいほど参照フレームF(tR)における位置合わせ情報の探索範囲の大きさも大きくなる。 For example, as shown in FIGS. 16A to 16D, the block size increases as the alignment start rank ns increases, and the alignment in the reference frame F (t R ) increases as the block size increases. The size of the information search range also increases.
つまり、基準フレームF(tC)のns階低周波画像を水平及び垂直のブロックサイズ(Bxns,Byns)の或るブロックBns(上添え字は、階級を示す)に分割し、参照フレームF(tR)の±Sxns,±Synsの範囲(例えば、±2ブロック)で探索し、各ブロックの位置合わせ情報vnsを算出する。次に、基準フレームF(tC)のns−1階低周波画像を、ブロックサイズ(Bxns,Byns)で分割し、参照フレームF(tR)のns階低周波画像上の同じ位置から2×vnsだけずらした場所を中心位置とする水平及び垂直画素数としてそれぞれ±Sxns,±Synsの範囲で探索し、得られた位置合わせ情報に2×vnsをベクトル加算して、ns−1階低周波画像における位置合わせ情報vns−1を算出する。このようにして、最上位の階数(即ち、1階)まで位置合わせ処理を繰り返すことにより、高精度化を図ることができる。 That is, the ns-order low-frequency image of the reference frame F (t C ) is divided into a certain block B ns (the superscript indicates the class) of horizontal and vertical block sizes (Bx ns , By ns ) and referred to ± Sx ns frame F (t R), probed with a range of ± Sy ns (e.g., ± 2 blocks), calculates the alignment information v ns of each block. Next, the ns-1 floor low frequency image of the base frame F (t C ) is divided by the block size (Bx ns , By ns ), and the same position on the ns floor low frequency image of the reference frame F (t R ) 2 × v ns shifted by location respectively ± Sx ns as the horizontal and vertical number of pixels centered position from probed with a range of ± Sy ns, the 2 × v ns to the obtained positioning information by vector addition , Ns-1 floor low-frequency image registration information v ns-1 is calculated. In this way, high accuracy can be achieved by repeating the alignment process up to the highest rank (that is, the first floor).
尚、位置合わせ処理は、2次関数近似による小数画素位置のブロックマッチング法を用いて行うのは、最上位の階数(即ち、1階)でのみ行うのが好適であり、次式で与えられる。 Note that the alignment processing is preferably performed only with the highest rank (that is, the first floor) using the block matching method of decimal pixel positions by quadratic function approximation, and is given by the following equation: .
尚、探索位置における画素位置をxとしたとき、SSD(x)は、画素位置におけるSSD値(誤差二乗和)を表し、より具体的には、SSD(0)は中心位置におけるSSD値、SSD(−1)は中心位置から−Sx(Sy)画素の位置におけるSSD値、SSD(1)は中心位置から+Sx(Sy)画素の位置におけるSSD値を表す。上記の式から、水平又は垂直方向の小数画素精度の画素位置(小数画素位置)をそれぞれ算出することができる。 When the pixel position at the search position is x, SSD (x) represents the SSD value (sum of squares of error) at the pixel position. More specifically, SSD (0) is the SSD value at the center position, SSD (−1) represents the SSD value at the position of −Sx (Sy) pixel from the center position, and SSD (1) represents the SSD value at the position of + Sx (Sy) pixel from the center position. From the above equations, the pixel position (decimal pixel position) with decimal pixel accuracy in the horizontal or vertical direction can be calculated.
このように、時空間方向の周波数パワーに基づいて位置合わせ情報を生成することができる。 In this way, alignment information can be generated based on the frequency power in the spatiotemporal direction.
次に、本発明による一実施例の画像縮小装置における更に別例の位置合わせ情報生成部について説明する。 Next, another example of the alignment information generating unit in the image reducing apparatus according to the embodiment of the present invention will be described.
(位置合わせ情報の確度判定)
図17は、本発明による一実施例の画像縮小装置における更に別例の位置合わせ情報生成部のブロック図である。本例の位置合わせ情報生成部201cは、原画像フレームをブロック分割したブロック単位で位置合わせ情報を生成し、各ブロック内の小領域のサブブロック単位で位置合わせ情報を生成し、サブブロック単位で検出した位置合わせ情報が、対応するブロック位置のブロック単位の動き量に対して所定の閾値以上、及び/又は一致度評価関数値が所定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする確度判定を行ない、有効と判断したサブブロック単位の位置合わせ情報を、対応するブロック単位の位置合わせ情報にベクトル加算して補正することにより、位置合わせ情報修正部203で用いる位置合わせ情報を生成する機能を有し、具体的には、ブロック単位小数画素位置合わせ処理部2011cと、画素単位小数位置合わせ処理部2012cと、位置合わせ情報確度判定部2013cと、補正位置合わせ情報生成部2014cとを備える。尚、本例の位置合わせ情報生成部201cは、各構成要素が処理するのに必要なデータを格納する記憶部(図示せず)を備える。位置合わせ処理を行う基準フレームをF(tC)、及び位置合わせ情報の探索を行う参照フレームをF(tR)とする。
(Accuracy judgment of alignment information)
FIG. 17 is a block diagram of another example of the alignment information generating unit in the image reducing apparatus according to the embodiment of the present invention. The alignment
ブロック単位小数画素位置合わせ処理部2011cは、原画像列についてブロック単位で位置合わせ情報を算出する。より具体的には、後述するように、ブロック単位小数画素位置合わせ処理部2011cは、基準フレームF(tC)、及び参照フレームF(tR)を入力して、基準フレームF(tC)を例えば16×16画素のブロックBi,j(i,jは、水平及び垂直のブロック番号)で分割し、参照フレームF(tR)上を探索してブロック単位の位置合わせ情報vBi,jを求め、当該記憶部に保持する。ブロック単位の位置合わせ処理は、小数画素精度の位置合わせ処理を行うのが好適である。
The block unit decimal pixel
画素単位小数画素位置合わせ処理部2012cは、ブロックBi,j内の小領域のサブブロック単位(例えば、1画素単位)で位置合わせ情報を算出する。より具体的には、後述するように、画素単位小数画素位置合わせ処理部2012cは、ブロックBi,j内の画素位置(k,l)について、各画素位置の位置合わせ情報ui,j(k,l)を求め、当該記憶部に保持する。小領域のサブブロック単位(例えば、1画素単位)の位置合わせ情報は、小数画素精度の位置合わせ処理を行うのが好適である。
The pixel unit decimal pixel
位置合わせ情報確度判定部2013cは、当該記憶部に保持したブロック単位及びサブブロック単位で検出した位置合わせ情報を読み出し、サブブロック単位で検出した位置合わせ情報が、対応するブロック位置のブロック単位の動き量に対して所定の閾値以上、及び/又は一致度評価関数値が所定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする確度判定を行う。位置合わせ情報確度判定部2013cは、確度判定によって得られたサブブロック単位の位置合わせ情報について有効であるか否かを表す情報と、ブロック単位及びサブブロック単位で検出した位置合わせ情報を補正位置合わせ情報生成部2014cに送出する。より具体的には、位置合わせ情報確度判定部2013cは、サブブロック単位で検出した位置合わせ情報が、ブロック単位の動き量の半値以上である場合、及び/又は、一致度評価関数値が一定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする。
The alignment information
補正位置合わせ情報生成部2014cは、有効と判断したサブブロック単位の位置合わせ情報を、対応するブロック単位の位置合わせ情報にベクトル加算して補正する。
The corrected alignment
これにより、ブロック単位で求めた位置合わせ情報に関して、より小領域のサブブロック単位(例えば、画素単位)で再検出し、サブブロック単位(例えば、画素単位)の位置合わせ情報について有効又は無効の判定を行うため、確度の高い位置合わせ情報を得ることができる。また、少なくとも小領域のサブブロック単位(例えば、画素単位)で小数画素精度の位置合わせ処理を行うため、精度の高い位置合わせ情報を得ることができる。 As a result, the alignment information obtained in units of blocks is re-detected in units of sub-blocks (for example, in units of pixels) of a smaller area, and whether the alignment information in units of sub-blocks (for example of units of pixels) is valid or invalid Therefore, highly accurate alignment information can be obtained. In addition, since alignment processing with decimal pixel accuracy is performed at least in sub-block units (for example, pixel units) in a small area, alignment information with high accuracy can be obtained.
以下、図18を参照して、本発明による一実施例の画像縮小装置における更に別例の位置合わせ情報生成部の動作について詳細に説明する。 Hereinafter, with reference to FIG. 18, the operation of another example of the alignment information generation unit in the image reduction device according to the embodiment of the present invention will be described in detail.
ステップS11にて、原画像列を構成する基準フレームF(tC)及び参照フレームF(tR)を入力し、適宜記憶部に保持する。 In step S11, the base frame F (t C ) and the reference frame F (t R ) constituting the original image sequence are input and stored in the storage unit as appropriate.
ステップS12にて、ブロック単位小数画素位置合わせ処理部2011cにより、まず、ブロック単位(例えば、16×16画素のブロック単位)の小数画素精度の位置合わせ情報の生成を行う。例えば、図19(a)に示すように、基準フレームF(tC)をブロックBi,j(i,jは、水平及び垂直のブロック番号)で分割し、図19(b)に示すように、参照フレームF(tR)上を探索してブロック単位の位置合わせ情報vBi,jを求める。
In step S12, the block unit decimal pixel
ステップS13にて、画素単位小数画素位置合わせ処理部2012cにより、小領域のサブブロック単位(例えば、画素単位)の小数画素精度の位置合わせ処理を行う。以下、画素単位の小数画素精度の位置合わせ処理を行う例を説明する。
In step S13, the pixel unit decimal pixel
ブロックBi,j内の画素位置(k,l)とし、各画素位置の位置合わせ情報ui,j(k,l)を、上述したように、画素単位の小数画素精度位置における位置合わせ情報の生成を行う。画素単位の位置合わせ処理は、2次関数近似(パラボラフィッティング)を用いた一致度評価関数とするブロックマッチング法を用いて、参照フレームF(tR)上をブロック単位の位置合わせ情報vBi,jだけずらした位置を中心とする±Sx’(Sy’)の範囲で探索する。尚、探索範囲の大きさを規定する±Sx’又はSy’の大きさは、±1画素とすることができる。 The pixel position (k, l) in the block B i, j is used, and the alignment information u i, j (k, l) of each pixel position is used as described above, and the alignment information at the decimal pixel precision position in pixel units is used. Is generated. The pixel-by-pixel alignment process uses the block matching method that uses a degree-of-match evaluation function using quadratic function approximation (parabolic fitting), and performs block-unit alignment information v Bi, on the reference frame F (t R ) . Search is performed in a range of ± Sx ′ (Sy ′) centered on a position shifted by j . The size of ± Sx ′ or Sy ′ that defines the size of the search range can be ± 1 pixel.
ステップS14にて、位置合わせ情報確度判定部2013cにより、求めた画素単位の位置合わせ情報ui,j(k,l)が、ブロック単位の動き量に対して所定の閾値以上、及び/又は一致度評価関数値が所定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする(ステップS15,S16)。
In step S14, the alignment information u i, j (k, l) obtained in pixel units by the alignment information
例えば、求めた画素単位の位置合わせ情報ui,j(k,l)が、ブロック単位の動き量の半値、即ち±(0.5,0.5)以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする(図20参照)。 For example, the accuracy is low when the obtained alignment information u i, j (k, l) in pixel units is equal to or greater than the half value of the motion amount in blocks, that is, ± (0.5,0.5) or more. Is invalid, and the others are valid with high accuracy (see FIG. 20).
更に別の例として、求めた画素単位の位置合わせ情報ui,j(k,l)が、SSD値が一定の閾値(例えば、SSD(0)の値)以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする。 As yet another example, when the obtained pixel unit alignment information u i, j (k, l) is greater than or equal to a certain threshold value (for example, the value of SSD (0)), the accuracy is high. Invalid if low, otherwise valid with high accuracy.
更に別の例として、求めた画素単位の位置合わせ情報ui,j(k,l)が、ブロック単位の動き量の半値、即ち±(0.5,0.5)以上である場合、且つSSD値(誤差二乗和)が一定の閾値(例えば、SSD(0)の値)以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする。 As yet another example, when the obtained pixel unit alignment information u i, j (k, l) is equal to or greater than the half value of the block-unit motion amount, that is, ± (0.5,0.5), and When the SSD value (sum of squared errors) is equal to or greater than a certain threshold (for example, the value of SSD (0)), the accuracy is low and invalid, and otherwise, the accuracy is high and valid.
有効と判断した場合に、補正位置合わせ情報生成部2014cにより、この基準フレームF(tC)における小領域のサブブロック単位(例えば、画素単位)の位置合わせ情報V(i,j,k,l)を、V(i,j,k,l)=vBi,j+ui,j(k,l)として補正する。
When it is determined to be valid, the correction alignment
尚、補正位置合わせ情報生成部2014cは、無効であるとされた対象の画素単位小数精度位置の位置合わせ情報については、その周囲の有効値(例えば、最も隣接する有効値)で置き換えるか、又は周囲の複数の有効値で平均化するか、又は、ブロック単位の位置合わせ情報で置き換える(即ち、V(i,j,k,l)=vBi,j)ことにより、全ての小領域のサブブロック単位(例えば、画素単位)の位置合わせ情報V(i,j,k,l)を決定することもできる。
Note that the correction alignment
このように、本実施例の位置合わせ情報生成部201cであれば、ブロック単位で求めた位置合わせ情報に関して、より小領域のサブブロック単位(例えば、画素単位)にて小数精度で再検出し、サブブロック単位の位置合わせ情報について有効及び無効の判定を行うため、確度の高く、且つ精度も高い位置合わせ情報を得ることができる。
As described above, with the alignment
次に、動き量適応型点広がり関数について説明する。 Next, the motion amount adaptive point spread function will be described.
(動き量適応型点広がり関数)
図21は、本発明による一実施例の画像縮小装置で利用可能な点広がり関数を生成する動き量適応型点広がり関数生成装置のブロック図である。通常、画像縮小の際に発生する動きぼけ関数として点広がり関数PSF(Point Spreading Function)を用い、画像拡大の際にその逆関数を利用して超解像を行う。したがって、動き量適応型点広がり関数生成装置300は、原画像列を用いて位置合わせ情報を生成し、この位置合わせ情報に応じて適応的に点広がり関数が変化する動き量適応型点広がり関数を生成する例である。この動き量適応型点広がり関数は、前述した画像縮小装置10における記憶部30に予め記憶しておくことで利用可能となる。
(Motion-adaptive point spread function)
FIG. 21 is a block diagram of a motion amount adaptive point spread function generating apparatus that generates a point spread function that can be used in the image reducing apparatus according to an embodiment of the present invention. Usually, a point spreading function PSF (Point Spreading Function) is used as a motion blur function generated at the time of image reduction, and super-resolution is performed using the inverse function at the time of image enlargement. Therefore, the motion amount adaptive type point spread
動き量適応型点広がり関数生成装置300は、位置合わせ情報生成部201によって生成した位置合わせ情報に応じて点広がり関数の幅が変化する動き量適応型点広がり関数を用いて、当該位置合わせ情報を修正した情報を補助情報として生成する機能を有し、位置合わせ情報修正部203に組み入れることができる。具体的には、動き量適応型点広がり関数生成装置300は、位置合わせ情報生成部301と、画素対応付け処理部302と、再構成処理部303とを備える。
The motion amount adaptive type point spread
位置合わせ情報生成部301は、図1で説明した場合と同様に、原画像列を用いて位置合わせ情報を生成する。
The alignment
画素対応付け処理部302は、原画像列を用いて生成した位置合わせ情報から、図1で説明した場合と同様に生成された縮小画像列について、複数フレーム間で画素の対応付けを行い、超解像元フレーム(縮小画像列のフレーム)の画素を被超解像フレーム(画像拡大するフレーム)上に反映する対応付け情報を生成して再構成処理部303に送出する(図21参照)。
The pixel
再構成処理部303は、縮小画像の画素を、画像拡大するフレーム上に反映するときの事後確率(被超解像フレーム上に複数の低解像度な超解像元フレームの画素が与えられた時の事後確率)を最大にする高解像度画像の推定を行って高解像度画像を再構成するのに必要な動き量適応型点広がり関数を決定する。この推定にはMAP(Maximum A Posterior)法や、その他の方法を用いることができる。また動き量適応型点広がり関数は、原画像列を用いて生成した位置合わせ情報を基に、PSFを拡張した動きぼけ関数である。詳細に後述するが、再構成処理部303は、動き量適応型点広がり関数として、点広がり関数PSFを模擬する2次元ガウス関数近似を用いて、2次元ガウス関数近似の水平及び垂直方向の動きぼけ量を制御することができる。
The
従来からのMAP法(以下、「従来MAP法」と称する)は、xを高解像度な画像復元されたフレーム画像ベクトル、yを低解像度な超解像元フレーム画像ベクトル、Nを入力フレーム数とした時の事後確率p(x|y1,y2,・・・,yN)を最大にする高解像度フレーム画像を推定する方法である。 A conventional MAP method (hereinafter, referred to as “conventional MAP method”) is a method in which x is a frame image vector restored with a high resolution image, y is a super resolution original frame image vector with a low resolution, and N is the number of input frames. This is a method for estimating a high-resolution frame image that maximizes the posterior probability p (x | y 1 , y 2 ,..., Y N ).
式(1)での第1項では、Dはサブサンプリングを表す行列、Bkは点広がり関数PSF行列、Wkは位置合わせ情報(特に、シーンやカメラの動きを表す動き量にも適用できる)の行列を示す。 In the first term in equation (1), D is a matrix representing sub-sampling, B k is a point spread function PSF matrix, and W k is also applicable to alignment information (especially a motion amount representing a scene or camera motion). ) Matrix.
ゆえに、式(1)の第1項の||yk−D・Bk・Wk・x||2は、k番目の低解像度の超解像元フレーム画像と、観測信号としての高解像度の画像復元されるフレーム画像にPSFによる解像度変換時の動きぼけとk番目の超解像元フレームからの位置合わせ情報を与えてサブサンプリングした画像との二乗誤差となる。 Therefore, || y k −D · B k · W k · x || 2 of the first term of Equation (1) is the k-th low-resolution super-resolution source frame image and the high resolution as the observation signal. This is a square error between the sub-sampled image given the motion blur at the time of resolution conversion by PSF and the alignment information from the kth super-resolution source frame to the frame image to be restored.
そして、式(1)の第2項のλ||C・x||2は、λが事前情報の寄与度合いを示す変数量、Cが入力画像の事前情報として与えられる「画像縮小率情報」の行列となる。 Λ || C · x || 2 in the second term of equation (1) is “image reduction rate information” in which λ is a variable amount indicating the degree of contribution of prior information, and C is given as prior information of the input image. It becomes the matrix of.
ただし、従来MAP法では、「点広がり関数PSF」、「位置合わせ情報」、「画像縮小率情報」は補助情報としては与えられないことに注意する。ゆえに、従来MAP法におけるCは、例えば4近傍のMRF(Markov Random Field)を仮定して、4近傍のラプラシアンカーネルを利用するものであるため、シーンやカメラの動きに十分に対応できていなかった。 However, it should be noted that in the conventional MAP method, “point spread function PSF”, “alignment information”, and “image reduction ratio information” are not provided as auxiliary information. Therefore, C in the conventional MAP method assumes a MRF (Markov Random Field) in the vicinity of 4, for example, and uses a Laplacian kernel in the vicinity of 4 and cannot sufficiently cope with the scene and the movement of the camera. .
本例の動き量適応型点広がり関数生成装置300は、「位置合わせ情報」及び「画像縮小率情報」が補助情報としては与えられない状況下で、式(1)の点広がり関数PSFのBkを、2次元ガウス関数近似による点広がり関数とし、位置合わせ情報(つまり、フレーム間動きベクトルの向きと大きさに対応する情報)に応じて、2次元ガウス関数近似による点広がり関数の拡張を行う。この拡張されたPSF関数を動き量適応型点広がり関数カーネルEBkとする。
The motion amount adaptive type point spread
式(2)に、動き量適応型点広がり関数カーネルEBkを用いたMAP再構成処理式を示す。 Formula (2) shows a MAP reconstruction processing formula using the motion amount adaptive point spread function kernel EB k .
より具体的に、「2次元ガウス関数近似による点広がり関数PSK」と、「動き量適応型点広がり関数(拡張された2次元ガウス関数近似による点広がり関数PSK)」について、詳細に説明する。 More specifically, the “point spread function PSK by two-dimensional Gaussian function approximation” and the “motion amount adaptive point spread function (point spread function PSK by extended two-dimensional Gaussian function approximation)” will be described in detail.
〔2次元ガウス関数近似による点広がり関数〕
PSKを、2次元のガウス関数で近似するあたり、式(3)のように、半値幅をwとし、面積が1の規格化ガウス関数の振幅をαとして定義する。
[Point spread function by two-dimensional Gaussian function approximation]
When approximating PSK with a two-dimensional Gaussian function, the half-value width is defined as w and the amplitude of a normalized Gaussian function with an area of 1 is defined as α, as shown in Equation (3).
式(3)より、2次元のガウス関数は、式(4)のようになる。ここで、水平方向の基準位置はx0、垂直方向の基準位置はy0となる。 From Equation (3), the two-dimensional Gaussian function is as shown in Equation (4). Here, the horizontal reference position is x 0 , and the vertical reference position is y 0 .
〔動き量適応型点広がり関数(拡張された2次元ガウス関数近以による点広がり関数)〕
動き量適応型点広がり関数生成装置300は、式(4)の点広がり関数を拡張する。位置合わせ情報mの水平方向の動き量をmx、垂直方向の動き量をmyとすると、式(4)のガウス関数における水平方向と垂直方向の半値幅は、式(5)のように制御される。
[Motion-adaptive point spread function (point spread function based on an extended 2D Gaussian function)]
The motion amount adaptive point
式(5)は、位置合わせ情報の向きと大きさに応じて点広がり関数の広がり方向と広がり量を制御するものである。 Expression (5) controls the spread direction and spread amount of the point spread function according to the direction and size of the alignment information.
動き量適応型点広がり関数生成装置300の再構成処理では、式(2)のカーネルEBkを式(5)の2次元のガウス関数として、画像拡大倍率に応じて式(5)の半値幅wを決定し、式(2)のλを変化させながら式(2)の繰り返し演算を行い、最適な高解像度画像を求めることができる。
In the reconstruction processing of the motion amount adaptive type point spread
このように、動き量適応型点広がり関数生成装置300で生成した動き量適応型点広がり関数を、図1に示す画像縮小装置10に適用すれば、動き量に対する鮮鋭な位置合わせ情報を生成することができる。
As described above, when the motion amount adaptive point spread function generated by the motion amount adaptive point spread
本発明によれば、複数フレーム超解像処理のために、原画像精度のみならず点広がり関数による復元過程の誤差を修正した修正後位置合わせ情報を用いることができるようになるので、従来よりも高画質な超解像処理の画像を得ることができ、縮小画像から拡大画像を得る用途に有用である。 According to the present invention, for the multi-frame super-resolution processing, it becomes possible to use post-correction alignment information that corrects not only the original image accuracy but also the restoration process error due to the point spread function. In addition, a high-resolution super-resolution image can be obtained, which is useful for obtaining an enlarged image from a reduced image.
10 画像縮小装置
20 制御部
30 記憶部
50 画像拡大装置
60 制御部
70 記憶部
201,201b,201c 位置合わせ情報生成部
202 画像縮小部
203 位置合わせ情報修正部
300 動き量適応型点広がり関数生成装置
301 位置合わせ情報生成部
302 画素対応付け処理部
303 再構成処理部
601 位置合わせ処理部
602 画素補完処理部
603 拡大画像生成部
2011 ブロック分割部
2012 ブロックマッチング処理部
2021 ウェーブレット分解部
2022 空間低周波成分抽出部
2023 縮小画像生成部
2031 全画素比較処理部
2032 画素補完処理部
2033 補完誤差算出部
2034 加算部
2035 補助情報生成部
2011b 時間方向高周波領域パワー算出部
2012b 空間分解階数決定部
2013b 空間方向低周波領域パワー算出部
2014b 位置合わせ開始分解能決定部
2015b 階層型位置合わせ処理部
2011c ブロック単位小数画素位置合わせ処理部
2012c 画素単位小数位置合わせ処理部
2013c 位置合わせ情報確度判定部
2014c 補正位置合わせ情報生成部
DESCRIPTION OF
Claims (7)
連続する複数の原画像フレームからなる原画像列を入力して、処理対象の原画像フレームから連続する少なくとも1つの原画像フレームへの位置合わせ情報を生成する位置合わせ情報生成部と、
原画像列を所定の画像縮小率で縮小した縮小画像列を生成する画像縮小部と、
生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の処理対象の縮小画像フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なって拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を前記点広がり関数の処理範囲内でシフトしながら当該差分値が最小となるシフト量を算出し、該シフト量を当該位置合わせ情報の値に加算することにより前記位置合わせ情報を修正した情報を補助情報として生成する位置合わせ情報修正部と、
を備えることを特徴とする画像縮小装置。 An image reduction device that generates a reduced image sequence by reducing an original image sequence,
An alignment information generation unit that inputs an original image sequence including a plurality of continuous original image frames and generates alignment information from the original image frame to be processed to at least one original image frame;
An image reduction unit for generating a reduced image sequence obtained by reducing the original image sequence at a predetermined image reduction rate;
Using the generated alignment information and the reduced image sequence, when expanding the reduced image frame to be processed in the reduced image sequence at an enlargement rate corresponding to the image reduction rate, a point spread function is applied to the enlarged sample position. The enlarged image is generated by performing the pixel interpolation used, the difference value between the generated enlarged image pixel and the original image pixel is calculated, and the value of the alignment information is shifted within the processing range of the point spread function. While calculating the shift amount that minimizes the difference value, and adding the shift amount to the value of the alignment information, the alignment information correction unit that generates information that has corrected the alignment information as auxiliary information,
An image reduction apparatus comprising:
前記原画像フレームをブロック分割したブロック単位で位置合わせ情報を生成する第1位置合わせ処理部と、
各ブロック内の小領域のサブブロック単位で位置合わせ情報を生成する第2位置合わせ処理部と、
サブブロック単位で検出した位置合わせ情報が、対応するブロック位置のブロック単位の動き量に対して所定の閾値以上、及び/又は一致度評価関数値が所定の閾値以上である場合には、確度が低いとして無効とし、それ以外は確度が高いとして有効とする確度判定を行う位置合わせ情報確度判定部と、
有効と判断したサブブロック単位の位置合わせ情報を、対応するブロック単位の位置合わせ情報にベクトル加算して補正することにより、前記位置合わせ情報修正部で用いる位置合わせ情報を生成する補正位置合わせ情報生成部と、
を備えることを特徴とする、請求項1に記載の画像縮小装置。 The alignment information generation unit
A first alignment processing unit for generating alignment information in units of blocks obtained by dividing the original image frame;
A second alignment processing unit that generates alignment information in units of sub-blocks of small areas in each block;
When the alignment information detected in units of sub-blocks is greater than or equal to a predetermined threshold with respect to the amount of motion in units of the corresponding block position and / or the matching score evaluation function value is greater than or equal to a predetermined threshold, the accuracy is A positioning information accuracy determination unit that performs accuracy determination that invalidates as low and is effective as high accuracy otherwise;
Corrected alignment information generation for generating alignment information to be used by the alignment information correction unit by correcting the alignment information of sub-block units determined to be valid by adding the vector to the corresponding alignment information of blocks. And
The image reduction device according to claim 1, further comprising:
前記位置合わせ情報生成部によって生成した位置合わせ情報に応じて点広がり関数の幅が変化する動き量適応型点広がり関数を用いて、前記位置合わせ情報を修正した情報を補助情報として生成することを特徴とする、請求項1に記載の画像縮小装置。 The alignment information correction unit
Using the motion amount adaptive type point spread function in which the width of the point spread function changes according to the alignment information generated by the alignment information generation unit, and generating the corrected information as the auxiliary information. The image reduction device according to claim 1, wherein the image reduction device is a feature.
当該位置合わせを行った拡大後の標本点を画素補完する画素補完部と、
画素補完後の拡大画像を用いて前記原画像列に対応する拡大画像列を生成する拡大画像生成部と、
を備えることを特徴とする画像拡大装置。 An alignment process for aligning the reduced image sequence generated by the image reduction device according to any one of claims 1 to 4 at an enlargement rate corresponding to the image reduction rate using the auxiliary information. And
A pixel complementing unit that pixel-complements the enlarged sample point after the alignment;
An enlarged image generating unit that generates an enlarged image sequence corresponding to the original image sequence using an enlarged image after pixel interpolation;
An image enlarging apparatus comprising:
連続する複数の原画像フレームからなる原画像列を入力して、処理対象の原画像フレームから連続する少なくとも1つの原画像フレームへの位置合わせ情報を生成するステップと、
原画像列を所定の画像縮小率で縮小した縮小画像列を生成するステップと、
生成した位置合わせ情報と縮小画像列を用いて、当該画像縮小率に対応する拡大率で縮小画像列の処理対象の縮小画像フレームを拡大する際に、拡大した標本位置に対して点広がり関数を用いた画素補完を行なって拡大画像を生成し、生成した拡大画像の画素と原画像の画素との差分値を算出し、当該位置合わせ情報の値を前記点広がり関数の処理範囲内でシフトしながら当該差分値が最小となるシフト量を算出し、該シフト量を当該位置合わせ情報の値に加算することにより前記位置合わせ情報を修正した情報を補助情報として生成するステップと、
を実行させるためのプログラム。 In a computer functioning as an image reduction device that reduces the original image sequence to generate a reduced image sequence,
Inputting an original image sequence composed of a plurality of continuous original image frames and generating alignment information from the original image frame to be processed to at least one original image frame;
Generating a reduced image sequence obtained by reducing the original image sequence at a predetermined image reduction rate;
Using the generated alignment information and the reduced image sequence, when expanding the reduced image frame to be processed in the reduced image sequence at an enlargement rate corresponding to the image reduction rate, a point spread function is applied to the enlarged sample position. The enlarged image is generated by performing the pixel interpolation used, the difference value between the generated enlarged image pixel and the original image pixel is calculated, and the value of the alignment information is shifted within the processing range of the point spread function. While calculating the shift amount that minimizes the difference value and adding the shift amount to the value of the alignment information to generate information that corrects the alignment information as auxiliary information;
A program for running
請求項1〜4のいずれか一項に記載の画像縮小装置によって生成された縮小画像列に対して、前記補助情報を用いて当該画像縮小率に対応する拡大率で位置合わせを行うステップと、
当該位置合わせを行った拡大後の標本点を画素補完するステップと、
画素補完後の拡大画像を用いて前記原画像列に対応する拡大画像列を生成するステップと、
を実行させるためのプログラム。 On the computer,
Aligning the reduced image sequence generated by the image reduction device according to any one of claims 1 to 4 at an enlargement rate corresponding to the image reduction rate using the auxiliary information;
Pixel complementation of the enlarged sample point subjected to the alignment; and
Generating an enlarged image sequence corresponding to the original image sequence using an enlarged image after pixel interpolation;
A program for running
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011009975A JP5498970B2 (en) | 2011-01-20 | 2011-01-20 | Image reduction device, image enlargement device, and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011009975A JP5498970B2 (en) | 2011-01-20 | 2011-01-20 | Image reduction device, image enlargement device, and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012151751A true JP2012151751A (en) | 2012-08-09 |
JP5498970B2 JP5498970B2 (en) | 2014-05-21 |
Family
ID=46793572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011009975A Expired - Fee Related JP5498970B2 (en) | 2011-01-20 | 2011-01-20 | Image reduction device, image enlargement device, and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5498970B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012164147A (en) * | 2011-02-07 | 2012-08-30 | Nippon Hoso Kyokai <Nhk> | Image reduction device, image enlargement device and programs for these |
JP2019057225A (en) * | 2017-09-22 | 2019-04-11 | 日本放送協会 | Gradation complementation device and program |
JP2019101836A (en) * | 2017-12-05 | 2019-06-24 | 日本放送協会 | Super-resolution apparatus and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005045700A (en) * | 2003-07-25 | 2005-02-17 | Victor Co Of Japan Ltd | Motion estimation method for moving picture interpolation and motion estimation apparatus for moving picture interpolation |
JP2008033914A (en) * | 2006-06-28 | 2008-02-14 | Matsushita Electric Ind Co Ltd | Image reading method and image expansion method |
JP2010045666A (en) * | 2008-08-14 | 2010-02-25 | Sony Corp | Information processing apparatus, information processing method, and program |
JP2010218271A (en) * | 2009-03-17 | 2010-09-30 | Tokyo Institute Of Technology | Parameter control processing apparatus and image processing apparatus |
-
2011
- 2011-01-20 JP JP2011009975A patent/JP5498970B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005045700A (en) * | 2003-07-25 | 2005-02-17 | Victor Co Of Japan Ltd | Motion estimation method for moving picture interpolation and motion estimation apparatus for moving picture interpolation |
JP2008033914A (en) * | 2006-06-28 | 2008-02-14 | Matsushita Electric Ind Co Ltd | Image reading method and image expansion method |
JP2010045666A (en) * | 2008-08-14 | 2010-02-25 | Sony Corp | Information processing apparatus, information processing method, and program |
JP2010218271A (en) * | 2009-03-17 | 2010-09-30 | Tokyo Institute Of Technology | Parameter control processing apparatus and image processing apparatus |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012164147A (en) * | 2011-02-07 | 2012-08-30 | Nippon Hoso Kyokai <Nhk> | Image reduction device, image enlargement device and programs for these |
JP2019057225A (en) * | 2017-09-22 | 2019-04-11 | 日本放送協会 | Gradation complementation device and program |
JP2019101836A (en) * | 2017-12-05 | 2019-06-24 | 日本放送協会 | Super-resolution apparatus and program |
Also Published As
Publication number | Publication date |
---|---|
JP5498970B2 (en) | 2014-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7840095B2 (en) | Image processing method, image processing apparatus, program and recording medium | |
US9258518B2 (en) | Method and apparatus for performing super-resolution | |
JP5727873B2 (en) | Motion vector detection device, encoding device, and program thereof | |
US8275218B2 (en) | Forward and backward image resizing method | |
CN103985085A (en) | Image super-resolution amplifying method and device | |
JP6462372B2 (en) | Super-resolution device and program | |
US8253854B2 (en) | Image processing method and system with repetitive pattern detection | |
Jeong et al. | Multi-frame example-based super-resolution using locally directional self-similarity | |
KR101538313B1 (en) | Block based image Registration for Super Resolution Image Reconstruction Method and Apparatus | |
JP5514132B2 (en) | Image reduction device, image enlargement device, and program thereof | |
JP5498970B2 (en) | Image reduction device, image enlargement device, and program thereof | |
JP5717548B2 (en) | Super-resolution auxiliary information generation device, encoding device, decoding device, and programs thereof | |
JP6102938B2 (en) | Image processing apparatus and image processing method | |
JP2017010093A (en) | Image processing apparatus, imaging device, image processing method, image processing program, and recording medium | |
KR20100097858A (en) | Super-resolution using example-based neural networks | |
KR101341617B1 (en) | Apparatus and method for super-resolution based on error model of single image | |
US20130120461A1 (en) | Image processor and image processing method | |
JP5331643B2 (en) | Motion vector detection apparatus and program | |
CN107155096B (en) | A kind of super resolution ratio reconstruction method and device based on half error back projection | |
JP2011182330A (en) | Image processing method, image processing apparatus and program | |
JP5894422B2 (en) | Spatio-temporal low correlation image super-resolution device, image space super-resolution device, and program thereof | |
JP5463250B2 (en) | Image reconstruction device, encoding device, decoding device, and program | |
JP2013069012A (en) | Multi-lens imaging apparatus | |
JP6817784B2 (en) | Super-resolution device and program | |
CN112581362A (en) | Image processing method and device for adjusting image details |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5498970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |