JP5081109B2 - Video signal conversion system - Google Patents
Video signal conversion system Download PDFInfo
- Publication number
- JP5081109B2 JP5081109B2 JP2008227628A JP2008227628A JP5081109B2 JP 5081109 B2 JP5081109 B2 JP 5081109B2 JP 2008227628 A JP2008227628 A JP 2008227628A JP 2008227628 A JP2008227628 A JP 2008227628A JP 5081109 B2 JP5081109 B2 JP 5081109B2
- Authority
- JP
- Japan
- Prior art keywords
- processing unit
- function
- image
- frame
- corresponding point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Processing (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
本発明は、動画像を高圧縮化、高解像度化した画情報に変換する映像信号変換システムに関する。 The present invention relates to a video signal conversion system for converting a moving image into image information with high compression and high resolution.
近年、デジタル信号技術の進展に伴い、映像(動画像)、画像又は音声を対象にした、通信、放送、記録媒体[CD(Compact Disc)、DVD(Digital Versatile Disc)]、医用画像、印刷等の分野がマルチメディア産業或いはIT(Information Technology)として著しい発展を遂げている。映像や画像、音声に対するデジタル信号技術の一翼を担うのが情報量を低減する圧縮符号化であるが、その信号理論として、代表的にはシャノンの標本化定理があり、更に新しくはウェーブレット変換理論等がある。また、例えば音楽のCDでは、圧縮を伴わないリニアPCM(Pulse Code Modulation)が用いられるが、信号理論は同様にシャノンの標本化定理である。 In recent years, with the advancement of digital signal technology, communication, broadcasting, recording media [CD (Compact Disc), DVD (Digital Versatile Disc)], medical images, printing, etc. targeted for video (moving images), images or audio This field has made remarkable progress as a multimedia industry or IT (Information Technology). One of the digital signal technologies for video, images, and audio is compression coding that reduces the amount of information, but the signal theory is typically the Shannon sampling theorem, and more recently the wavelet transform theory. Etc. Also, for example, music CDs use linear PCM (Pulse Code Modulation) without compression, but signal theory is also Shannon's sampling theorem.
従来、映像、アニメ画像などの動画の圧縮技術としてMPEGが知られており、デジタル放送やDVDにおけるMPEG−2方式の採用や、第3世代携帯電話のインターネット・ストリーミングや移動体通信などの分野におけるMPEG−4方式の採用などにより、映像信号のデジタル圧縮技術は、近年非常に身近なものとなっている。その背景には、蓄積メディアの大容量化、ネットワークの高速化、プロセッサの高性能化、システムLSIの大規模・低価格化などがある。このように、デジタル圧縮を必要とする映像応用システムを支える環境が着々と整ってきている。 Conventionally, MPEG is known as a compression technique for moving images such as video and animation images, and is used in fields such as adoption of the MPEG-2 system in digital broadcasting and DVD, Internet streaming of third-generation mobile phones, and mobile communication. In recent years, digital compression technology for video signals has become very familiar due to the adoption of the MPEG-4 system and the like. The reasons behind this are an increase in the capacity of storage media, an increase in network speed, an increase in processor performance, and a large scale and low price of system LSI. As described above, an environment for supporting a video application system that requires digital compression has been steadily prepared.
MPEG2(ISO(International Organization for Standardization)/IEC(International Electrotechnical Commition)13818−2)は、汎用の画像符号化方式として定義された方式であり、飛び越し走査方式、順次走査方式の双方に対応できるように定義され、また標準解像度画像、高精細画像の双方に対応できるように定義されている。このMPEG2は、現在、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに広く用いられている。MPEG2では、例えば720×480画素の標準解像度、飛び越し走査方式の画像データを4〜8〔Mbps〕のビットレートにデータ圧縮することができ、また1920×1088画素の高解像度 、飛び越し走査方式の画像データを18〜22〔Mbps〕のビットレートにデータ圧縮することができ、高画質で高い圧縮率を確保することができる。 MPEG2 (ISO (International Organization for Standardization) / IEC (International Electrotechnical Commition) 13818-2) is a method defined as a general-purpose image encoding method, so that both the interlaced scanning method and the sequential scanning method can be supported. It is defined so as to be compatible with both standard resolution images and high-definition images. MPEG2 is currently widely used in a wide range of applications for professional use and consumer use. In MPEG2, for example, image data of a standard resolution of 720 × 480 pixels and interlaced scanning can be compressed to a bit rate of 4 to 8 [Mbps], and a high resolution image of 1920 × 1088 pixels and interlaced scanning can be used. Data can be compressed to a bit rate of 18 to 22 [Mbps], and a high compression rate can be ensured with high image quality.
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。 In general, in encoding of moving images, the amount of information is compressed by reducing redundancy in the time direction and the spatial direction. Therefore, in inter-picture predictive coding for the purpose of reducing temporal redundancy, motion is detected and a predicted image is created in units of blocks with reference to the forward or backward picture, and the resulting predicted image and the encoded image are encoded. Encoding is performed on the difference value from the target picture. Here, a picture is a term representing a single screen, which means a frame in a progressive image and a frame or field in an interlaced image. Here, an interlaced image is an image in which one frame is composed of two fields having different times. In interlaced image encoding and decoding processing, one frame may be processed as a frame, processed as two fields, or processed as a frame structure or a field structure for each block in the frame. it can.
テレビジョン画像の品質を向上させる手法として、走査線の数を増やすとともに水平画素の数を増やす方法がある。例えば、現行のNTSC方式のビデオ信号は、2:1のインターレス走査を行っているため、垂直解像度は300本程度となる。一般のテレビジョン受像機で用いられているCRTの走査線は525本であり、インターレス走査によって解像度が低下しており、フィールドバッファを用いたフィールド補間によって垂直方向の画素数を増やして走査をノン・インターレス化することにより、垂直方向の解像度を上げる手法が知られている。 As a technique for improving the quality of a television image, there is a method of increasing the number of horizontal pixels while increasing the number of scanning lines. For example, since the current NTSC video signal performs 2: 1 interlace scanning, the vertical resolution is about 300 lines. The number of CRT scanning lines used in general television receivers is 525, and the resolution is lowered by interlaced scanning. The number of pixels in the vertical direction is increased by field interpolation using a field buffer. There is known a method of increasing the resolution in the vertical direction by making it non-interlaced.
また、高品位テレビジョン受像機に用いられているCRTには、垂直画素数が通常のテレビジョン受像機のCRTに比べて2倍程度に設定されたものがあり、走査線方向の画素数を補間によって2倍に増やすことにより、水平方向の解像度を上げる手法が知られている。 In addition, some CRTs used in high-definition television receivers have a vertical pixel number set to about twice that of ordinary television receivers. There is known a method of increasing the resolution in the horizontal direction by increasing it by interpolation twice.
従来から、画像の拡大あるいは縮小を簡単な処理によって行う方法として、所定間隔で同じ画素を繰り返したり間引いたりする手法が知られており、誤差による画像の歪みが少なく、しかも演算量を低減するための手法や、画像データを、より効率的に符号化するための手法が提案されている(例えば、特許文献1、2、3参照)。
Conventionally, as a method for enlarging or reducing an image by a simple process, a method of repeating or decimating the same pixel at a predetermined interval is known, in order to reduce image distortion due to an error and to reduce a calculation amount. And methods for more efficiently encoding image data have been proposed (see, for example,
従来のシャノンの標本化定理に基づくA−D変換/D−A変換系では、ナイキスト周波数によって帯域制限された信号を扱う。このとき、D−A変換において、標本化によって離散的になった信号の連続波への再生に、制限された帯域内の信号を再現する函数(正則函数)が用いられていた。 A conventional AD conversion / DA conversion system based on Shannon's sampling theorem handles a signal whose band is limited by the Nyquist frequency. At this time, in the DA conversion, a function (regular function) for reproducing a signal in a limited band is used to reproduce a signal that has become discrete by sampling into a continuous wave.
本願発明者の一人は、映像(動画像)、文字図形や自然画等の画像又は音声等の信号の持つ種々の性質をフルーエンシ函数を用いて分類可能であることを見出した。この理論によれば、シャノンの標本化定理に基づく上記正則函数は、フルーエンシ函数の一つであり、信号が持つ種々の性質の内の一つの性質に適合するにとどまる。従って、種々の性質をもつ信号をシャノンの標本化定理に基づく上記正則函数のみで扱うのでは、D−A変換後の再生信号の品質に限界を与える恐れがあることとなる。 One of the inventors of the present application has found that various properties of images such as video (moving images), character figures and natural images, or signals such as audio can be classified using a fluency function. According to this theory, the regular function based on Shannon's sampling theorem is one of the fluency functions, and only fits one of the various properties of the signal. Therefore, if a signal having various properties is handled only by the regular function based on Shannon's sampling theorem, there is a risk of limiting the quality of the reproduced signal after DA conversion.
上記ウェーブレット変換理論は、対象を解像度で分解するマザーウェーブレットを用いて信号を表すものであるが、信号に最適のマザーウェーブレットが与えられるとは限らず、やはりD−A変換後の再生信号の品質に限界を与える恐れがあることとなる。 The wavelet transform theory represents a signal using a mother wavelet that decomposes an object with resolution. However, the optimum mother wavelet is not always given to the signal, and the quality of the reproduced signal after DA conversion is also used. There is a risk of giving a limit.
ここで、フルーエンシ函数は、パラメータm(mは1〜∞の正の整数)によって類別される函数である。mは、その函数が(m−2)回のみ連続微分可能であることを表す。因みに、上記正則函数は何回でも微分可能であるので、mが∞である。更に、フルーエンシ 函数は、(m−1)次の函数で構成され、特にフルーエンシ 函数の内のフルーエンシDA函数は、標本間隔をτとして、着目するk番目の標本点kτで数値が与えられるが、その他の標本点では0となる函数である。 Here, the fluency function is a function classified by the parameter m (m is a positive integer of 1 to ∞). m represents that the function can be continuously differentiated only (m−2) times. Incidentally, since the regular function can be differentiated any number of times, m is ∞. Furthermore, the fluency function is composed of (m−1) -th order functions. In particular, the fluency DA function in the fluency function is given a numerical value at the k-th sample point kτ of interest, where τ is the sample interval. It is a function that becomes 0 at other sample points.
信号の性質は、パラメータmを持つフルーエンシ函数によって全てが分類可能となり、パラメータmによってクラス分けされる。そのため、フルーエンシ 函数を用いたフルーエンシ 情報理論は、従来の信号の性質の一部を表すにとどまっていたシャノンの標本化定理やウェーブレット変換理論等を包含し、信号の全体を表す理論体系であると位置付けられる。そのような函数を用いることにより、D−A変換後に、シャノンの標本化定理によって帯域制限されることのない高品質の再生信号を、信号の全体に亘って得ることが期待される。 All signal properties can be classified by a fluency function having a parameter m, and are classified by the parameter m. For this reason, the fluency information theory using the fluency function includes the Shannon sampling theorem and wavelet transformation theory, which only represent some of the properties of conventional signals, and is a theoretical system that represents the entire signal. Positioned. By using such a function, it is expected that a high-quality reproduction signal that is not band-limited by the Shannon sampling theorem is obtained over the entire signal after the DA conversion.
ところで、従来より、映像、アニメ画像などの動画の圧縮技術として知られているMPEGにおいても、画像の輪郭部におけるジャギーの発生、濃淡部の色再現性の悪化などの問題がある。 By the way, MPEG, which is conventionally known as a compression technique for moving images such as videos and animation images, has problems such as the occurrence of jaggies in the contour portion of the image and the deterioration of color reproducibility in the light and shade portion.
また、海外のビデオ情報や映画をビデオ情報への変換したり、アニメ制作においてフレーム間情報の補間を行う必要からフレームレート変換が必要であり、例えば、映画の24フレームレートをビデオの30フレームに変換したり、TVの映像を高精細化のために高フレームレート化することや、携帯のフレームレートに変換することが要求されている。 In addition, it is necessary to convert overseas video information and movies to video information, and to perform frame rate conversion because it is necessary to interpolate inter-frame information in animation production. For example, the 24 frame rate of movies is changed to 30 frames of video. There is a demand for conversion, to increase the frame rate of TV images for higher definition, and to convert to a portable frame rate.
しかし、従来は、フレーム間引きや前後のフレームの内分補間で新規なフレームを生成する方法が主流となっているため、映像の動きが円滑でない、映像が線形でないなどの問題点があった。 However, conventionally, a method of generating a new frame by frame thinning or internal division interpolation of the preceding and following frames has been mainstream, and there have been problems such as that the motion of the image is not smooth and the image is not linear.
そこで、本発明の目的は、上述の如き従来の実情に鑑み、映像、アニメ等の動画情報を統一的に処理して高圧縮化し、高品質な動画像再生を可能にする映像信号変換システムを提供することにある。 Therefore, in view of the conventional situation as described above, an object of the present invention is to provide a video signal conversion system that uniformly processes moving image information such as video and animation, and performs high compression to enable high-quality moving image reproduction. It is to provide.
本発明の更に他の目的、本発明によって得られる具体的な利点は、以下に説明される実施の形態の説明から一層明らかにされる。 Other objects of the present invention and specific advantages obtained by the present invention will become more apparent from the description of embodiments described below.
本発明では、フルーエンシ函数化処理に基づく共通符号化処理により、情報の圧縮及び再生時の高品質化を図る。 In the present invention, the quality of information during compression and reproduction is improved by a common encoding process based on a fluency function.
本発明に係る映像信号変換システムは、真の入力画像f(x,y)が入力されるぼけ函数H(x,y)の劣化モデルの出力にノイズn(x,y)を付加することにより得られる観測画像g(X,y)を入力として、ぼけ函数H(X,y)の再帰的最適化を行って推定された真の映像情報を抽出する逆フィルタからなり、入力映像信号に含まれるノイズを上記逆フィルタにより除去する前処理部と、上記前処理部によりノイズ除去処理が施された映像信号について、基準フレームにおける所定領域の画像濃淡値を面関数で近似し、且つ他のフレームにおける部分画像の濃淡値を面函数化し、上記基準フレームにおける面関数と他のフレームの面関数との相関値が最大となる位置を画像の対応点として推定し、該対応点のフレーム毎の位置の変化を画像の動き情報として函数化して表現するとともに、上記ノイズ除去処理が施された映像信号について、フルーエンシ理論に基づいて信号空間を選択し、選択した信号空間毎に画像情報を函数化して表現し、上記画像の動き情報を函数化した結果と上記選択した信号空間毎に画像情報を函数化した結果を所定の形式で記述して圧縮符号化する圧縮符号化処理部と、上記圧縮符号化処理部により圧縮符号化された映像信号を高フレームレート化する高フレームレート化処理部とを備えることを特徴する。 The video signal conversion system according to the present invention adds noise n (x, y) to the output of the degradation model of the blur function H (x, y) to which the true input image f (x, y) is input. It consists of an inverse filter that extracts the true video information estimated by performing recursive optimization of the blur function H (X, y) using the obtained observation image g (X, y) as an input, and is included in the input video signal A pre-processing unit that removes generated noise by the inverse filter, and an image grayscale value of a predetermined region in a reference frame for a video signal that has been subjected to noise removal processing by the pre-processing unit, and another frame The gray scale value of the partial image at is converted into a surface function, the position where the correlation value between the surface function in the reference frame and the surface function of another frame is maximized is estimated as the corresponding point of the image, and the position of the corresponding point for each frame change of The model expresses to function as motion information of the image, the video signal in which the noise removal process has been performed, and selects a signal space based on fluency theory, expressed by a function of the image information for each signal space selected, A compression encoding processing unit that compresses and encodes the result of functioning the motion information of the image and the result of functioning the image information for each selected signal space in a predetermined format, and the compression encoding processing unit And a high frame rate processing unit for increasing the frame rate of the video signal compression-encoded according to the above.
本発明に係る映像信号変換システムにおいて、上記圧縮符号化処理部は、上記前処理部によりノイズ除去処理が施された映像信号について、所定領域の画像濃淡値を函数化してフレーム毎の相関が最大となる位置を対応点として推定する対応点推定部と、この対応点推定部によるフレーム毎の対応点位置を画像の動き情報として函数化して表現する動き函数化処理部からなる第1の函数化処理部を備え、上記対応点推定部は、フレーム画像の部分領域を抽出する第1の部分領域抽出手段と、上記第1の部分領域抽出手段により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を抽出する第2の部分領域抽出手段と、上記第1の部分領域抽出手段及び上記第2の部分領域抽出手段により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡を区分多項式で函数表現して出力する函数近似手段と、上記函数近似手段の出力の相関値を演算する相関値演算手段と、上記相関値演算手段により算出される相関値の最大値を与える画像の位置ずれを演算し、該演算値を対応点のずれ量として出力するずれ量演算手段とからなることを特徴する。 In the video signal conversion system according to the present invention, the compression encoding processing unit functions as a function of an image gray value of a predetermined region for the video signal that has been subjected to noise removal processing by the preprocessing unit , so that the correlation for each frame is maximized. A corresponding function estimating unit that estimates the corresponding position as a corresponding point, and a motion function processing unit that expresses the corresponding point position for each frame by the corresponding point estimating unit as a function of image motion . The corresponding point estimation unit includes a first partial region extraction unit that extracts a partial region of the frame image, and another continuous frame similar to the partial region extracted by the first partial region extraction unit. A second partial area extracting means for extracting a partial area of the image, and each partial area extracted by the first partial area extracting means and the second partial area extracting means is converted into the same ratio; Function approximation means for expressing the converted shade of the image by a piecewise polynomial function, correlation value calculation means for calculating the correlation value of the output of the function approximation means, and correlation value calculated by the correlation value calculation means It is characterized by comprising a displacement amount calculating means for calculating a positional shift of an image that gives the maximum value of and outputting the calculated value as a shift amount of a corresponding point.
また、本発明に係る映像信号変換システムにおいて、上記圧縮符号化処理部は、さらに、上記前処理部によりノイズ除去処理が施された映像信号について、フルーエンシ理論に基づいて信号空間を選択する領域自動分類処理部と、この領域自動分類処理部により選択した信号空間毎に画像情報を函数化して表現する函数化処理部からなる第2の函数化処理部を備え、上記函数化処理部は、上記領域自動分類処理部により選択された多項式表現可能な領域について画像の濃淡を面函数で近似して表現し濃淡情報を函数化する濃淡函数化処理部と、上記領域自動分類処理部により選択された多項式表現可能な領域について画像の輪郭線函数で近似して表現し輪郭情報を函数化する輪郭線函数化処理部とを備えることを特徴する。 In the video signal conversion system according to the present invention, the compression encoding processing unit further performs automatic region selection for selecting a signal space based on a fluency theory for the video signal subjected to noise removal processing by the preprocessing unit. A second processing unit including a classification processing unit and a functioning processing unit that expresses the image information as a function for each signal space selected by the region automatic classification processing unit, and the functioning processing unit includes: The region selected by the automatic region classification processing unit is represented by the grayscale function processing unit that approximates the density of the image by a surface function and functions the grayscale information by selecting the region that can be expressed by the polynomial, and the region automatic classification processing unit. An area that can be expressed in polynomial terms is approximated by an outline function of the image, and is provided with an outline function conversion processing unit that converts the outline information into a function.
また、本発明に係る映像信号変換システムにおいて、上記濃淡函数化処理部は、例えば、上記領域自動分類処理部により選択された多項式表現可能な区分的平面領域(m≦2)、区分的曲面領域(m=3)、区分的球面領域(m=∞)の画像情報について、それぞれフルーエンシ函数を用いて濃淡情報を函数化する。 In the video signal conversion system according to the present invention, the tone function processing unit may be, for example, a piecewise plane area (m ≦ 2), a piecewise curved surface area that can be expressed by a polynomial selected by the area automatic classification processing unit. For the image information of (m = 3) and the piecewise spherical area (m = ∞), the density information is converted into a function using a fluency function.
また、本発明に係る映像信号変換システムにおいて、上記輪郭線函数化処理部は、上記領域自動分類処理部により選択された画像情報について、区分的直線、区分的2次曲線、区分的円弧を抽出し分類する輪郭自動分類処理部と、上記輪郭自動分類処理部により分類された区分的直線、区分的2次曲線、区分的円弧をそれぞれフルーエンシ函数を用いて近似することにより、輪郭情報を函数化する函数化処理部とを備えることを特徴する。 In the video signal conversion system according to the present invention, the contour function converting unit extracts a piecewise straight line, a piecewise quadratic curve, and a piecewise circular arc from the image information selected by the region automatic classification processing unit. The contour information is converted into a function by approximating the piecewise straight line, piecewise quadratic curve and piecewise arc classified by the outline automatic classification processing unit to be classified by the fluency function. And a function processing unit.
また、本発明に係る映像信号変換システムにおいて、上記高フレーム化処理部は、基準フレームにおける複数個の画素について、時間を異にする複数の画像フレームにおける画素の各対応点位置を推定する対応点推定処理部と、上記対応点推定処理部により推定した各画像フレームにおける各対応点について、それぞれ上記対応点位置近傍の画素の濃淡を示す階調値から各対応点の階調値を求める第1の階調値生成処理部と、上記基準フレームにおける複数個の画素に対して、上記第1の階調値生成処理部により求めた上記推定した各画像フレームにおける各対応点の階調値から、フレーム間の対応点軌跡上の濃淡値の変化をフルーエンシ函数で近似し、その函数から新たに挿入する補間フレームにおける対応点の各階調値を求める第2の階調値生成処理部と、上記第2の階調値生成処理部により求めた上記補間フレームにおける各対応点の階調値から、上記補間フレームにおける各対応点の各画素の階調値を生成する第3の階調値生成処理部とを備えることを特徴とする。
Further, in the video signal conversion system according to the present invention, the high frame processing unit is configured to estimate the corresponding point positions of pixels in a plurality of image frames having different times with respect to the plurality of pixels in the reference frame. For each corresponding point in each image frame estimated by the estimation processing unit and the corresponding point estimation processing unit, a first gradation value for each corresponding point is obtained from a gradation value indicating the shade of a pixel near the corresponding point position. From the tone value of each corresponding point in each of the estimated image frames obtained by the first tone value generation processor for the plurality of pixels in the reference frame and the plurality of pixels in the reference frame, A second step that approximates the change in the gray value on the locus of corresponding points between frames with a fluency function, and obtains each gradation value of the corresponding point in the newly inserted interpolation frame from the function. Value generation processing unit, the gradation value of each corresponding point in the interpolated frame obtained by the second gradation value generating unit, first generates a gradation value of each pixel of each corresponding point in said interpolated
また、本発明に係る映像信号変換システムにおいて、上記高フレーム化処理部は、例えば、上記圧縮符号化処理部により圧縮符号化された映像信号について、函数表現された画像の動き情報及び画像情報により、画像の大きさを所定の大きさに拡大又は縮小するサイズ変換処理とともに高フレームレート化処理を行う。 Further, in the video signal conversion system according to the present invention, the high frame processing unit, for example, for the video signal compressed and encoded by the compression encoding processing unit, based on the motion information and image information of the image expressed as a function. Then, the frame rate increasing process is performed together with the size converting process for enlarging or reducing the size of the image to a predetermined size.
さらに、本発明に係る映像信号変換システムにおいて、上記高フレーム化処理部は、例えば、基準フレームにおける複数個の画素について、その濃淡分布を函数近似する第1の函数近似処理部と、上記第1の函数近似処理部により近似された時間を異にする複数の上記基準フレームにおける上記濃淡分布の函数で相関演算を行い、その最大値を与えるそれぞれの位置を上記複数の基準フレームにおいて対応する対応点位置とする対応点推定処理部と、上記対応点推定処理部により推定された各基準フレームにおける対応点位置を基準フレームの原点からの水平方向、垂直方向の距離で座標化し、上記時間を異にする複数の基準フレームにおける該座標点の水平方向位置、及び垂直方向位置のそれぞれの変化を時系列信号に変換し、各基準フレームの時系列信号を函数近似する第2の函数近似処理部と、上記第2の函数近似処理部で近似された函数により、上記複数の基準フレーム間の任意の時間における補間フレームについて、上記基準フレームの対応点位置に該当する補間フレーム内の対応する位置を対応点位置とし、該補間フレームの対応点位置における濃淡値を、上記基準フレームの対応点における濃淡値で補間して求め、該補間フレームの対応点の濃淡値に合わせて上記第1の函数近似を当てはめて、該対応点近傍の濃淡分布を求め、該対応点近傍の濃淡値を補間フレームにおける画素点の濃淡値に変換する第3の函数近似処理部とを備える。 Furthermore, in the video signal conversion system according to the present invention, the high frame processing unit includes, for example, a first function approximation processing unit that approximates the density distribution of a plurality of pixels in a reference frame, and the first Corresponding points corresponding to the respective positions giving the maximum value in the plurality of reference frames are subjected to correlation calculation with the functions of the gradation distribution in the plurality of reference frames having different times approximated by the function approximation processing unit of The corresponding point estimation processing unit as a position and the corresponding point position in each reference frame estimated by the corresponding point estimation processing unit are coordinated by the horizontal and vertical distances from the origin of the reference frame, and the above times are different. Each change of the horizontal position and vertical position of the coordinate point in a plurality of reference frames is converted into a time series signal, and each reference frame is converted. A second function approximation processing unit that approximates the time series signal of the system and a function approximated by the second function approximation processing unit, with respect to the interpolation frame at any time between the plurality of reference frames. The corresponding position in the interpolation frame corresponding to the corresponding point position of the frame is set as the corresponding point position, and the gray value at the corresponding point position of the interpolation frame is obtained by interpolation with the gray value at the corresponding point of the reference frame. The first function approximation is applied in accordance with the gray value of the corresponding point of the frame to obtain the gray level distribution near the corresponding point, and the gray value near the corresponding point is converted into the gray value of the pixel point in the interpolation frame. 3 function approximation processing unit.
本発明では、動画の高圧縮化による通信容量の低減、高速化、動画再生の高品質化が図れ、且つ、種々のフレーム形式を持つ動画情報の統一的変換が可能となる。 In the present invention, the communication capacity can be reduced, speeded up, and the quality of moving image reproduction can be improved by increasing the compression of moving images, and moving image information having various frame formats can be uniformly converted.
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明は以下の例に限定されるものではなく、本発明の要旨を逸脱しない範囲で、任意に変更可能であることは言うまでもない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Needless to say, the present invention is not limited to the following examples, and can be arbitrarily changed without departing from the gist of the present invention.
本発明は、例えば図1に示すような構成の映像信号変換システム100に適用される。
The present invention is applied to, for example, a video
この映像信号変換システム100は、撮像装置等の画像入力部10から入力される画像情報にノイズ除去処理を施す前処理部20、上記前処理部20によりノイズ除去処理が施された画像情報が入力され、入力された画像情報を圧縮符号化する圧縮符号化処理部30、上記圧縮符号化処理部30により圧縮符号化された画像情報を高フレームレート化する高フレームレート化処理部40などからなる。
The video
この映像信号変換システム100における前処理部20は、入力された画像情報に含まれるボケや手ぶれなどのノイズを、画像のテンソル演算技術とぼけ函数の適応修正処理技術により除去するフィルタリング処理を行うものであって、図2に示すようなシステムモデルにより、真の入力画像f(x,y)が入力されるぼけ函数H(x,y)の劣化モデル21の出力
The
にノイズn(x,y)を付加することにより観測画像g(x,y)を得て、図3に示すようなリストレーションシステムモデルにより、上記観測画像g(x,y)を入力として推定された画像 The observed image g (x, y) is obtained by adding noise n (x, y) to the image, and the observed image g (x, y) is estimated by the restoration system model as shown in FIG. Images
を得る逆フィルタ22からなる。 It comprises an inverse filter 22 for obtaining
前処理部20は、画像のテンソル演算技術とぼけ函数の適応修正処理技術により除去するフィルタリング処理を行うものであって、原画像をクロネッカー積の特性を利用して評価する。
The preprocessing
クロネッカー積は、次のように定義される。 The Kronecker product is defined as:
A=[aij]をmn行列、B=[bij]をst行列とするとき、クロネッカー積 When A = [a ij ] is an mn matrix and B = [b ij ] is an st matrix, the Kronecker product
は、次のような、ms×nt行列である。 Is an ms × nt matrix as follows.
ここで、 here,
は、クロネッカー積演算子を表す。 Represents the Kronecker product operator.
また、クロネッカー積の基本的な性質は、次の通りである。 The basic properties of the Kronecker product are as follows.
ここで、 here,
は、行列を列方向に伸ばし、列ベクトルを生成する操作を示す演算子である。 Is an operator indicating an operation of generating a column vector by extending the matrix in the column direction.
この前処理部20における画像モデルでは、未知の真の入力画像f(x,y)が存在するものと仮定して、上記劣化モデル21の出力
In the image model in the
にノイズn(x,y)を付加することにより得られる観測画像g(x,y)は、次の式(1)にて表すことができる。 An observation image g (x, y) obtained by adding noise n (x, y) to can be expressed by the following equation (1).
ここで、 here,
は、この画像システムにより得られる劣化画像を代表し、また、n(x,y)は付加したノイズである。そして、劣化画像 Represents a deteriorated image obtained by this image system, and n (x, y) is added noise. And degraded image
は、次の式(2)で示される。 Is represented by the following equation (2).
ここで、h(x,y;x’,y’)は、劣化システムのインパルス応答を代表している。 Here, h (x, y; x ′, y ′) represents the impulse response of the deteriorated system.
使用される画像は離散量であるから、入力画像f(x,y)の画像モデルは、式(3)のように書き換えることができる。 Since the image used is a discrete quantity, the image model of the input image f (x, y) can be rewritten as shown in Expression (3).
ここで、Hk (x)Hl (y)は、次の式(4)のようにマトリクス形式で表すことにより、劣化モデルの点像強度分布函数(PSF:Point Spread Function)Hとなる。 Here, H k (x) H l (y) becomes a point spread function (PSF) H of the degradation model by expressing it in matrix form as in the following equation (4).
上記逆フィルタ22の特性は、図4のフローチャートに示す手順にしたがった学習処理により決定される。 The characteristics of the inverse filter 22 are determined by a learning process according to the procedure shown in the flowchart of FIG.
すなわち、学習処理では、先ず、観測画像g(x,y)を入力画像gとして読み込み(ステップS1a)、 That is, in the learning process, first, the observation image g (x, y) is read as the input image g (step S1a),
として画像gEを構成して(ステップS2a)、 As image g E (step S2a),
の特異値分解(SVD:singular value decomposition)を行う(ステップS3a)。 Singular value decomposition (SVD) is performed (step S3a).
また、劣化モデルの点像強度分布函数(PSF:Point Spread Function)Hを読み込み(ステップS1b)、 Further, a point spread function (PSF) H of the degradation model is read (step S1b),
なるクロネッカー積で示される劣化モデルを構築して(ステップS2b)、上記劣化モデルの函数Hの特異値分解(SVD:singular value decomposition)を行う(ステップS3b)。 A degradation model represented by the Kronecker product is constructed (step S2b), and a singular value decomposition (SVD) of the function H of the degradation model is performed (step S3b).
ここで、システム方程式gは Where the system equation g is
と書き直すことができる。 Can be rewritten.
そして、 And
として新たな画像gKPAを算出する(ステップS4)。 A new image g KPA is calculated (step S4).
そして、算出した新たな画像gKPAについて、 And about the calculated new image g KPA ,
なる最小化処理を行い(ステップS5)、得られたfKについて、 (Step S5), and for the obtained f K ,
なるテスト条件を満たすか否かを判定する(ステップS6)。 It is determined whether or not the test condition is satisfied (step S6).
ここで、kは繰り返し番号であり、ε,cは、それぞれ判定の閾値である。 Here, k is a repetition number, and ε and c are thresholds for determination, respectively.
そして、上記ステップS6における判定結果がFaise、すなわち、上記ステップS5で得られたfKが上記テスト条件を満たしていない場合には、上記劣化モデルの函数Hについて、 Then, the determination result in step S6 is Faise, i.e., when f K obtained in step S5 does not satisfy the above test conditions, the function H of the deterioration model,
なる最小化処理を行い(ステップS7)、上記ステップS3bに戻り、上記ステップS6で得られた函数HK+1について特異値分解(SVD:singular value decomposition)を行い、上記ステップS3bからステップS7の処理を繰り返し行い、上記ステップS6における判定結果がTrue、すなわち、上記ステップS5で得られたfKが上記テスト条件を満たす場合に、上記ステップS5で得られたfKを (Step S7), the process returns to step S3b, singular value decomposition (SVD) is performed on the function HK + 1 obtained in step S6, and the processes from step S3b to step S7 are performed. repeatedly performs the determination result in step S6 is True, that is, when f K obtained in the step S5 is the test condition is satisfied, the f K obtained in the step S5
として(ステップS8)、1の入力画像gに対する学習処理を終了する。 (Step S8), the learning process for one input image g is terminated.
上記逆フィルタ22の特性は、上記学習処理を多数の入力画像gについて行うことにより決定される。 The characteristics of the inverse filter 22 are determined by performing the learning process on a large number of input images g.
すなわち、ここでは、h(x,y)*f(x,y)を代表してHfとして表し、システムの方程式を That is, here, h (x, y) * f (x, y) is represented as Hf, and the system equation is
とし、また、 And also
として、fを近似して、目的とする新たな画像gEを次のように導出している。 As, by approximating the f, and derives a new image g E of interest as follows.
ここで、Eは予測を示す。新たな画像gEは、原画像のエッジ細部の保存や強調として構成される。 Here, E indicates prediction. The new image g E is configured as preservation and enhancement of edge details of the original image.
新たな画像gEは、 The new image g E
として得られる。ここで、CEPとCENは、それぞれエッジ保存とエッジ強調の演算子である。 As obtained. Here, CEP and CEN are edge preservation and edge enhancement operators, respectively.
そして、シンプルなラプラシアンカーネルCEN=∇2fと制御パラメータβとγを持ったガウシャンカーネルCEPを選択し、 And select a simple Laplacian kernel C EN = ∇ 2 f and a Gaussian kernel C EP with control parameters β and γ,
とする。 And
そして、 And
として、最小化問題を再構築し、次の特異値分解(SVD:singular value decomposition)から And reconstruct the minimization problem from the following singular value decomposition (SVD)
上記劣化モデルの函数Hを Function H of the above degradation model
として推定して用いる。 Estimate and use.
この映像信号変換システム100における前処理部20のように、入力された画像情報に含まれるボケや手ぶれなどのノイズを、画像のテンソル演算技術とぼけ函数の適応修正処理技術により除去するフィルタリング処理を行うことにより、ノイズを除去するとともに画像の鮮明化やエッジ強調などを行うことができる。
Like the
この映像信号変換システム100は、上記前処理部20によりノイズ除去処理が施された画像情報について、圧縮符号化処理部30により圧縮符号化し、圧縮符号化された画像情報をフレームレート化処理部40により高フレームレート化する。
The video
この映像信号変換システム100における圧縮符号化処理部30は、フルーエンシ理論に基づく圧縮符号化処理を行うもので、図5に示すように、第1の函数化処理部31、第2の函数化処理部32、上記第1の函数化処理部31と第2の函数化処理部32で函数化された各画像情報を所定の形式で記述して符号化する符号化処理部33などを備える。
The compression
第1の函数化処理部31は、上記前処理部20によりノイズ除去処理が施された画像情報について、複数のフレーム画像間の対応点推定を行う対応点推定部31Aと、上記対応点推定部31Aにより推定された各フレーム画像の対応点の画像情報を用いて、動き部分の画像情報を函数化する動き函数化処理部31Bからなる。
The first function processing unit 31 includes a corresponding
対応点推定部31Aは、例えば、図6に示すように構成される。
The corresponding
すなわち、対応点推定部31Aは、フレーム画像の部分領域を抽出する第1の部分領域抽出部311と、上記第1の部分領域抽出部311により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を抽出する第2の部分領域抽出部312と、上記第1の部分領域抽出部311及び上記第2の部分領域抽出部312により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡をフルーエンシ理論に従って区分多項式で函数表現して出力する函数近似部313と、上記函数近似部313の出力の相関値を演算する相関値演算部314と、上記相関値演算部314により算出される相関値の最大値を与える画像の位置ずれを演算し、該演算値を対応点のずれ量として出力するずれ量演算部315とからなる。
That is, the corresponding
この対応点推定部31Aでは、第1の部分領域抽出部311によりフレーム画像の部分領域をテンプレートとして抽出するとともに、上記第1の部分領域抽出部311により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を第2の部分領域抽出部312により抽出し、函数近似部313により上記第1の部分領域抽出部311及び上記第2の部分領域抽出部312により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡を区分多項式で函数表現する。
In the corresponding
この対応点推定部31Aは、画像の濃淡を連続的な変化状態として捉え、フルーエンシ情報理論により、画像の対応点を推定するものであって、第1の部分領域抽出部311と、第2の部分領域抽出部312と、函数近似部313と、相関値演算部314と、ずれ量演算部315からなる。
The corresponding
この対応点推定部31Aにおいて、第1の部分領域抽出部311は、入力画像についてフレーム画像の部分領域を抽出する。
In the corresponding
また、第2の部分領域抽出部312は、上記第1の部分領域抽出部311により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を抽出する。
The second partial
また、函数近似部313は、上記第1の部分領域抽出部311及び上記第2の部分領域抽出部312により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡をフルーエンシ理論に従って区分多項式で函数表現して出力する。
The
また、相関値演算部314は、上記函数近似部313の出力の相関値を演算する。
The correlation
さらに、ずれ量演算部315は、上記相関値演算部314により算出される相関値の最大値を与える画像の位置ずれを演算し、該演算値を対応点のずれ量として出力する。
Further, the deviation
そして、この対応点推定部31では、第1の部分領域抽出部311によりフレーム画像の部分領域をテンプレートとして抽出するとともに、上記第1の部分領域抽出部311により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を第2の部分領域抽出部312により抽出し、函数近似部313により上記第1の部分領域抽出部311及び上記第2の部分領域抽出部312により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡を区分多項式で函数表現する。
In the corresponding point estimation unit 31, the first partial
ここで、画像f1(x,y),f2(x,y)は、空間S(m)(R2)に属していると仮定し、φm(t)を(m−2)次の区分多項式で次の式(5)のように表し、 Here, it is assumed that the images f 1 (x, y) and f 2 (x, y) belong to the space S (m) (R 2 ), and φm (t) is (m−2) th order It is expressed as the following equation (5) by a piecewise polynomial,
上記空間S(m)(R2)を次の式(6)のように表すと、 When the space S (m) (R 2 ) is expressed as the following equation (6),
フレーム間の相関関数c(τ1,τ2)は、次の式(7)として表すことができる。 The correlation function c (τ 1 , τ 2 ) between frames can be expressed as the following equation (7).
そして、上記仮定、すなわち、 And the above assumption, ie,
から、フレーム相関関数を表す式(7)は、次の式(8)で示すことができる。 From Equation (7), the frame correlation function can be expressed by the following Equation (8).
すなわち、上記フレーム間の相関関数c(τ1,τ2)は、図7に示すような2m次補間を行う空間S(2m)(R2)に属し、上記2m次補間を行う空間S(2m)(R2)の標本化周波数ψ2m(τ1,τ2)は一意的に存在し、上記フレーム間の相関関数c(τ1,τ2)は、次の式(9)にて表される。 That is, the correlation function c (τ 1, τ 2) between the frame belongs to the space S (2m) (R 2) for performing 2m following interpolation as shown in FIG. 7, the space performs the 2m order interpolation S ( 2m) (sampling frequency [psi 2m of R 2) (τ 1, τ 2) is present uniquely, the correlation function c (tau 1 between the frame, tau 2), at the following equation (9) expressed.
式(8)から、相関面を補間するために、(2m−1)次の区分的な多項式の関数を構築することができる。 From equation (8), a (2m-1) th order piecewise polynomial function can be constructed to interpolate the correlation surface.
すなわち、ブロックに基づく動きベクトル評価アプローチによって、適切に式(7)の別々のブロック動きベクトルの初期の推定を得て、それから、任意の正確さの本当の動きを得る式(8)を適用する。 That is, the block-based motion vector estimation approach appropriately obtains an initial estimate of the separate block motion vectors in equation (7), and then applies equation (8) to obtain real motion of arbitrary accuracy. .
分離可能な相関面補間関数の一般形は、式(10)にて表される。 The general form of the separable correlation surface interpolation function is expressed by equation (10).
ここで、Ckとdlが補間係数であり、M2m(x)=φ2m(x+2)・φm(x)は、(m−1)次のB−スプラインである。 Here, Ck and dl are interpolation coefficients, and M 2m (x) = φ 2 m ( x + 2) · φ m (x) is an (m−1) -order B-spline.
式(10)における適切な打ちきり制限により、上記相関関数c(τ1,τ2)は、次の式(11)によって近似することができる。 The correlation function c (τ 1 , τ 2 ) can be approximated by the following equation (11) by the appropriate stroke limit in the equation (10).
ここで、K1=[τ1]−s+1,K2=[τ2]+s,L1=[τ2]−s+1,L2=[τ2]+sであり、sはφm(x)を定める。 Here, K 1 = [τ 1 ] −s + 1, K 2 = [τ 2 ] + s, L 1 = [τ 2 ] −s + 1, L 2 = [τ 2 ] + s, and s is φ m (x) Determine.
そして、例えば、m=2とき、次の式(12)を式(11)に代入することにより、望ましい補間式を得る。 Then, for example, when m = 2, a desired interpolation formula is obtained by substituting the following formula (12) into formula (11).
動きベクトルvは、次の式(13)を使って導出される。 The motion vector v is derived using the following equation (13).
上記相関関数c(τ1,τ2)は、整数点の情報だけを用いて再生することができ、相関値演算部314は、上記相関関数c(τ1,τ2)により上記函数近似部313の出力の相関値を算出する。
The correlation function c (τ 1 , τ 2 ) can be reproduced using only integer point information, and the correlation
そして、ずれ量演算部315は、上記相関値演算部314により算出される相関値の最大値を与える画像の位置ずれを示す式(13)により動きベクトルVを演算し、得られる動きベクトルVを対応点のずれ量として出力する。
Then, the deviation
ここで、上記対応点推定部31Aによる対応点推定による動きベクトルVの決定の様子を図8に模式的に示す。
Here, FIG. 8 schematically shows how the motion vector V is determined by the corresponding point estimation by the corresponding
すなわち、この対応点推定部31Aでは、図8の(A)に示すように、フレーム画像(k)の部分領域を取り出し、この部分領域に相似な連続する他のフレーム画像の部分領域を抽出して、図8の(B)に示すように、
That is, in the corresponding
にて表される相関関数c(τ1,τ2)を用いて各フレーム間の相関を計算して、図8の(C)に示すように、相関曲面のピーク点て動きを検出し、動きベクトルvを上記式(13)にて求めことにより、図8の(D)に示すように、フレーム画像(k)における画素の動きを決定する。 Is calculated using the correlation function c (τ 1 , τ 2 ) expressed by the following equation to detect the motion at the peak point of the correlation surface, as shown in FIG. By obtaining the motion vector v by the above equation (13), the motion of the pixels in the frame image (k) is determined as shown in FIG.
このようにして決定されたフレーム画像(k)の各ブロックの動きベクトルは、同じフレーム画像(k)の各ブロックの動きベクトルを従来のブロックマッチングにより決定されたものと比較して、各ブロック間で滑らかに変化するものとなる。 The motion vector of each block of the frame image (k) determined as described above is obtained by comparing the motion vector of each block of the same frame image (k) with that determined by the conventional block matching. It will change smoothly.
すなわち、例えば、図9の(A)に示すように、被写体が回転する動きのあるフレーム1とフレーム2について、2フレーム対応点推定と不均等補間により4倍拡大を行ったところ、図9の(B1),(C1)に示すように、従来のブロックマッチングによる推定対応点で推定された動きベクトルには変化が滑らかなでない部分が生じたが、上述の如き構成の対応点推定部31Aによる推定対応点で推定された動きベクトルの変化は、図9の(B2),(C2)に示すように、全体的に滑らかなものとなっている。しかも、1/Nの精度での計算量は、従来手法ではN2であるのに対し、本手法ではNとなる。
That is, for example, as shown in FIG. 9 (A), when
そして、動き函数化処理部31Bでは、上記対応点推定部31Aにおける対応点推定により得られる動きベクトルVを用いて、動き部分の画像情報を函数化する。
Then, the motion function processing unit 31B functions the image information of the motion part using the motion vector V obtained by the corresponding point estimation in the corresponding
すなわち、動き函数化処理部31Bでは、基準フレーム毎に部分動画像の対応点が推定されると、その移動量すなわち対応点のずれ量はフレームの座標位置x、yの変化に対応するので、図10に示すように、フレームの原点を左上隅に取った場合、例えば、図11の(A)に示すような各フレームの画像の動きについて、図11の(B),(C)に示すように各フレームのX座標、Y座標の動きとして表し、X座標、Y座標それぞれの動きの変化を函数近似して函数化する。そして、図12に示すように、その函数で補間してフレーム間の位置を推定することにより動き補償を行う。 That is, in the motion function processing unit 31B, when the corresponding point of the partial moving image is estimated for each reference frame, the movement amount, that is, the shift amount of the corresponding point corresponds to the change in the coordinate position x, y of the frame. As shown in FIG. 10, when the origin of the frame is taken at the upper left corner, for example, the movement of the image of each frame as shown in FIG. 11A is shown in FIGS. In this way, the movement of the X coordinate and the Y coordinate of each frame is expressed, and the change of the movement of each of the X coordinate and the Y coordinate is approximated by a function to be converted into a function. Then, as shown in FIG. 12, motion compensation is performed by estimating the position between frames by interpolating with the function.
また、第2の函数化処理部32は、フルーエンシ情報理論に基づき、輪郭、濃淡、フレーム間情報を近似するフルーエンシ函数化処理により、入力画像を符号化するものであって、領域自動分類処理部32A、輪郭函数近似処理部32B、濃淡函数化処理部32C、周波数函数近似処理部32Dなどからなる。
The second
領域自動分類処理部32Aは、入力画像をフルーエンシ情報理論に基づいて、区分的平面領域(m≦2)、区分的曲面領域(m=3)、区分的球面領域(m=∞)、不規則領域(m≧4)に分類する。
Based on the fluency information theory, the area automatic
フルーエンシ情報理論では、信号を信号空間という概念で次数mによって指定されるクラスに分類する。 In the fluency information theory, signals are classified into classes specified by the order m in the concept of signal space.
信号空間mSは、(m−2)回連続微分可能な変数を持つ(m−1)次の区分的多項式によって表される。 The signal space m S is represented by a (m−1) th order piecewise polynomial with a variable that can be continuously differentiated (m−2) times.
信号空間mSは、m=1のとき、階段関数のものと等しくなり、またm=∞のとき、フーリエべき関数のものと等しくなることが証明されている。フルーエンシモデルは、フルーエンシ標本化関数を定義することで、この信号空間mSに属する信号と離散時間信号との関係を明確化するモデルである。 It has been proved that the signal space m S is equal to that of the step function when m = 1, and equal to that of the Fourier power function when m = ∞. The fluency model is a model that clarifies the relationship between signals belonging to the signal space m S and discrete-time signals by defining a fluency sampling function.
輪郭函数近似処理部32Bは、輪郭自動分類処理部321と関数近似処理部322からなり、上記領域自動分類処理部32Aにより分類された区分的平面領域(m≦2)、区分的曲面領域(m=3)、区分的球面領域(m=∞)に含まれる直線、円弧、2次曲線を上記輪郭自動分類処理部321により抽出して関数近似処理部322により関数近似する。 The contour function approximation processing unit 32B includes an automatic contour classification processing unit 321 and a function approximation processing unit 322, and includes a piecewise plane area (m ≦ 2) and a piecewise curved surface area (m = 3) The straight line, arc, and quadratic curve included in the piecewise spherical area (m = ∞) are extracted by the contour automatic classification processing unit 321 and approximated by the function by the function approximation processing unit 322.
濃淡函数化処理部32Cは、上記領域自動分類処理部32Aにより分類される区分的平面領域(m≦2)、区分的曲面領域(m=3)、区分的球面領域(m=∞)について、フルーエンシ函数を用いて濃淡函数化処理を行う。
The gradation function processing unit 32C is configured to perform the piecewise plane region (m ≦ 2), the piecewise curved surface region (m = 3), and the piecewise spherical region (m = ∞) classified by the region automatic
周波数函数近似処理部32Dは、上記領域自動分類処理部2により分類される不規則領域(m≧4)、すなわち、多項式表現できない領域について、DCT等により周波数函数近似処理を行う。
The frequency function approximation processing unit 32D performs frequency function approximation processing by DCT or the like on the irregular regions (m ≧ 4) classified by the region automatic
この第2の函数化処理部32では、映像のフレーム毎に多数の多変数フルーエンシ函数を使って、画像の濃淡や輪郭を表現することができる。
The second
そして、符号化処理部33は、上記第1の函数化処理部31と第2の函数化処理部32で函数化された各画像情報を所定の形式で記述して符号化する。
Then, the
さらに、高フレームレート化処理部40は、例えば、図13に示すように構成される。
Further, the high frame
この高フレームレート化処理部40は、例えば図14の(A),(B)に示すように、原フレーム間に補間フレームを挿入することにより、図14の(A)に示す低フレームレート(この例では30フレーム/秒)の動画を図14の(B)に示す高フレームレートの動画(この例では60フレーム/秒)に変換する高フレームレート化処理を行うもので、対応点推定処理部41、第1の階調値生成処理部42、第2の階調値生成処理部43、第3の階調値生成処理部44などからなる。
The high frame
この高フレームレート化処理部40において、対応点推定処理部41は、基準フレームにおける複数個の画素について、時間を異にする複数の画像フレームにおける各対応点を推定する。
In the high frame
また、第1の階調値生成処理部42は、上記対応点推定処理部41により推定した各画像フレームにおける各対応点について、それぞれ近傍の画素の濃淡を示す階調値から各階調値を求める。
Further, the first tone value
また、第2の階調値生成処理部43は、上記基準フレームにおける複数個の画素に対して、上記推定した各画像フレームにおける各対応点の階調値から対応点軌跡上の濃淡をフルーエンシ函数で近似し、その函数から補間フレームにおける対応点の各階調値を求める。
In addition, the second gradation value
さらに、第3の階調値生成処理部44は、上記補間フレームにおける各対応点の階調値から、上記補間フレームにおける各画素の階調値を生成する。
Further, the third gradation value
この映像信号変換システム100において、上記高フレームレート化処理部40の機能は、図示しない記憶部から読み出される映像信号変換プログラムをコンピュータにより実行することに実現され、図15のフローチャートに示すステップS11〜ステップS14の手順に従って、対応点推定処理を行って推定した対応点の階調値を用いて均等補間により補間フレームの対応点の階調値を生成し、さらに、不均等補間により補間フレームの対応点の階調値を生成する高フレームレート化処理を実行することに実現される。
In the video
すなわち、この高フレームレート化処理部40では、先ず、図16の(A)に示すように、時間t=kの画像フレームを基準フレームF(k)とし、基準フレームF(k)における複数個の画素Pn(k)について、時間t=k+1の画像フレームF(k+1)、時間t=k+2の画像フレームF(k+2)、・・・時間t=k+mの画像フレームF(k+m)における各動きベクトルを求めて、各画像フレーム(k+1),(k+2),・・・F(k+m)における各対応点Pn(k+1),Pn(k+2),・・・P(k+m)を推定する対応点推定処理を行う(ステップS11)。
That is, in the high frame
次に、上記ステップS11で推定した各画像フレーム(k+1),(k+2),・・・F(k+m)における各対応点Pn(k+1),Pn(k+2),・・・P(k+m)について、図16の(B)に示すように、それぞれ近傍の画素の濃淡を示す階調値から各階調値を求める第1の階調値生成処理を行う(ステップS12)。 Next, for each corresponding point Pn (k + 1), Pn (k + 2),... P (k + m) in each image frame (k + 1), (k + 2),... F (k + m) estimated in step S11, As shown in FIG. 16B, a first gradation value generation process is performed for obtaining each gradation value from gradation values indicating the shades of neighboring pixels (step S12).
次に、上記基準フレームF(k)における複数個の画素Pn(k)に対して、図16の(C)に示すように、上記ステップS12で生成した各対応点Pn(k+1),Pn(k+2),・・・P(k+m)における各階調値、すなわち、各画像フレーム(k+1),(k+2),・・・F(k+m)の対応点軌跡上の濃淡をフルーエンシ函数で近似し、その函数から各画像フレーム(k+1),(k+2),・・・F(k+m)間の補間フレームにおける対応点の各階調値を求める第2の階調値生成処理を行う(ステップS13)。 Next, with respect to the plurality of pixels Pn (k) in the reference frame F (k), as shown in FIG. 16C, the corresponding points Pn (k + 1), Pn ( k + 2),... P (k + m), each tone value, that is, the shade on the corresponding point trajectory of each image frame (k + 1), (k + 2),... F (k + m) is approximated by a fluency function. A second tone value generation process is performed for obtaining each tone value of the corresponding point in the interpolated frame between the image frames (k + 1), (k + 2),... F (k + m) from the function (step S13).
次のステップS14では、図16の(D)に示すように、上記ステップS13の第2の階調値生成処理により生成した補間フレームF(k+1/2)における各対応点の階調値から、不均等補間により時間t=k+1/2の補間フレームF(k+1/2)における各画素の階調値を生成する第3の階調値生成処理を行う(ステップS14)。 In the next step S14, as shown in FIG. 16D, from the gradation value of each corresponding point in the interpolation frame F (k + 1/2) generated by the second gradation value generation process in step S13, A third gradation value generation process for generating gradation values of each pixel in the interpolation frame F (k + 1/2) at time t = k + 1/2 by non-uniform interpolation is performed (step S14).
ここで、複数フレームからなる動画像は、その動きのある部分画像のフレーム上の位置はフレーム毎に異なる。また、一つのフレーム上の画素点は、他のフレーム上の異なる位置の画素点に移動するとは限らず、画素間に対応することが通常である。すなわち、1つの自然画は、連続した情報としたとき、2つのフレーム上では異なる位置の画素情報をそれぞれ表していることになる。特に、フレーム間の補間により、新規フレーム画像を生成する場合は、元のフレーム上の画素情報と新規フレーム上での画素上は殆ど全て異なる。例えば、図17の(A),(B)に示すような2つのフレーム画像を同一点で重ね合わせると、各フレームの画素点(ここでは、説明のための粗くしている)の関係は、図17の(C)に示すような関係となる。すなわち、画像の移動分ずれる。この2つのフレーム画像を用いて、第1フレームの格子点(印のない画素点)の濃淡値を求めるためには、不均等補間処理が必要となる。 Here, in a moving image composed of a plurality of frames, the position of the moving partial image on the frame differs for each frame. In addition, pixel points on one frame do not always move to pixel points at different positions on other frames, and usually correspond to pixels. That is, when one natural image is continuous information, it represents pixel information at different positions on the two frames. In particular, when a new frame image is generated by interpolation between frames, the pixel information on the original frame and the pixels on the new frame are almost all different. For example, when two frame images as shown in FIGS. 17A and 17B are overlapped at the same point, the relationship between the pixel points of each frame (here, rough for explanation) is The relationship is as shown in FIG. That is, the image shifts. In order to obtain the gray value of the grid point (pixel point without a mark) of the first frame using these two frame images, non-uniform interpolation processing is required.
例えば、図18に示すように、画像の解像度を変換した際に新たに生成された画素u(τx,τy)位置の値を決める画像補間処理は、原画素u(xi,yj)と補間函数h(x)の畳み込み処理により行われる。 For example, as shown in FIG. 18, the image interpolation processing for determining the value of the position of the pixel u (τ x , τ y ) newly generated when the resolution of the image is converted is the original pixel u (x i , y j ) And the interpolation function h (x).
そして、複数のフレーム画像を用いて同一部分画像を対応させ、図19の(A)に示すような均等補間函数を用いて所望の対応点近傍における水平(垂直)方向の画素情報から均等補間により求めた各フレーム毎の補間情報、すなわち、例えば図20に示すように、フレーム1及びフレーム2の各内挿画素値×を垂直(水平)方向の画素情報として、図19の(B)に示すような不均等補間函数を用いてフレームのずれ量に基づき不均等補間を行い、図20に示すように、フレーム1における所望の位置○の画素情報を決定する。
Then, the same partial image is made to correspond using a plurality of frame images, and uniform interpolation is performed from pixel information in the horizontal (vertical) direction near the desired corresponding point using a uniform interpolation function as shown in FIG. The obtained interpolation information for each frame, that is, for example, as shown in FIG. 20, each interpolation pixel value x of
ここで、高フレームレート化処理部40では、上述の如き高フレームレート化処理を行うとともに、2フレーム画像を用いて拡大補間処理を行う機能を備える。2フレーム画像を用いて拡大補間処理を行う機能は、例えば、例えば図21に示すように、入力データ制御回路51、出力同期信号生成回路52、SRAM53、SRAM選択部54、画像処理モジュール55により構成される拡大補間処理装置50により実現される。
Here, the high frame
この拡大補間処理装置50において、入力データ制御回路51は、水平同期信号及び垂直同期信号とともに供給される入力画像すなわち各画素の画像情報をSRAM選択部54に順次入力する制御を行う。
In the enlargement
出力同期信号生成回路52は、供給される水平同期信号及び垂直同期信号に基づいて出力側同期信号を生成し、生成した出力側同期信号を出力するとともにSRAM選択部54に供給する。
The output synchronization
SRAM選択部54は、例えば、図22に示すように構成され、供給される同期信号に生成される書き込み制御信号及び読み出し制御信号に基づいて制御信号切り換え回路54Aから供給されるメモリ選択信号に応じた動作を行う書き込みデータ選択部54Bと読み出しデータ選択部54Cにより、入力データ制御回路51を介して入力される入力画像を1フレームごとSRAM53に格納し、同時に2フレームの画像を出力同期信号生成回路52により生成された出力側同期信号に同期して読み出す。
The
また、画像処理モジュール55は、フレーム間情報による画像補間処理を行う例えば、図23に示すように構成される。
The
すなわち、画像処理モジュール55は、SRAM選択部54を介してSRAM53から同時に読み出された2フレームの画像情報が入力される窓設定部55A、第1の均等補間処理部55B及び第2の均等補間処理部55C、上記窓設定部55Aにより上記2フレームの画像情報から抽出された画素の情報が入力されるずれ量推定部55D、このずれ量推定部55Dにより推定されたずれ量ベクトルと上記第2の均等補間処理部55Cにより補間された画素の情報入力されるずれ補正部55E、このずれ補正部55Eにより補正された画素の情報及び上記第1の補間処理部55Bにより補間された画素の情報が入力される不均等補間処理部55Fからなる。
That is, the
画像処理モジュール55では、図24の(A),(B)に示すように、SRAM選択部54を介して入力される2つのフレーム画像f,gについて、窓設定部55Aにより所定のポイント(p,q)にウインドウを設定し、ずれ量推定部55Dにより、片方のフレーム画像gのウインドウをずれ量(τx,τy)だけずらして、ウインドウ内の相対位置(x,y)の画素値により内積演算を行い、その値を相互相関値Rpq(τx,τy)とする。
In the
そして、ずれ量(τx,τy)を変化させてポイント(p,q)の回りでの相互相関値Rpq(τx,τy)が最大となるずれ量(τx,τy)を抽出する。 Then, the shift amount (τx, τy) that maximizes the cross-correlation value Rpq (τx, τy) around the point (p, q) is extracted by changing the shift amount (τx, τy).
なお、2つのフレーム画像f,gのウインドウ内画素データをそれぞれフーリエ変換して相互相関値Rpq(τx,τy)を求めることもできる。 The cross-correlation values Rpq (τx, τy) can also be obtained by performing Fourier transform on the pixel data in the windows of the two frame images f and g, respectively.
そして、この拡大補間処理装置50では、図25のフローチャートに示すように手順に従って拡大補間処理を行う。
The enlargement
すなわち、画像処理モジュール55では、SRAM53からSRAM選択部54を介して2つのフレーム画像f,gが読み出されると(ステップA)、ずれ量推定部55Dで相関演算処理により2つのフレーム画像f,gのずれ量(τx,τy)を演算する(ステップB)。
That is, in the
そして、フレーム1の画像fについて均等補間による内挿画素値を第1の均等補間処理部55Bで演算することにより、水平方向あるいは垂直方向に拡大する(ステップC)。
Then, the interpolated pixel value obtained by the uniform interpolation for the image f of the
また、フレーム2の画像gについて均等補間による内挿画素値を第2の均等補間処理部55Cで演算することにより、水平方向あるいは垂直方向に拡大する(ステップD)。
Further, the interpolation pixel value obtained by uniform interpolation for the image g of
さらに、フレーム2の拡大画像をフレーム1に対するずれ量分移動した画素位置での画素値をずれ量補正部55Eにより演算する(ステップE)。
Further, the pixel value at the pixel position obtained by moving the enlarged image of
そして、不均等補間処理部55Fにおいて、フレーム1の内挿画素値2点とフレーム2の移動位置の画素値2点の計4点の画素値からフレーム1における求める位置の画素値を不均等補間で垂直方向あるいは水平方向に拡大演算を行い(ステップF)、フレーム1の補間演算結果を拡大画像として出力する(ステップG)。
Then, in the non-uniform
このような拡大補間処理を行う機能を備えるフレームレート変換装置110は、例えば、図26に示すように構成される。
The frame
このフレームレート変換装置110は、第1の函数近似処理部111、対応点推定処理部112、第2の函数近似処理部113、第3の函数近似処理部114として機能するコンピュータからなる。
The frame
第1の函数近似処理部111は、基準フレームにおける複数個の画素について、その濃淡分布を函数近似する第1の函数近似処理を行う。 The first function approximation processing unit 111 performs a first function approximation process for approximating the density distribution of a plurality of pixels in the reference frame.
対応点推定処理部112は、上記第1の函数近似部111により近似された時間を異にする複数の上記基準フレームにおける上記濃淡分布の函数で相関演算を行い、その最大値を与えるそれぞれの位置を上記複数の基準フレームにおいて対応する対応点位置とする対応点推定処理を行う。 Corresponding point estimation processing unit 112 performs a correlation operation with functions of the gray distribution in the plurality of reference frames having different times approximated by the first function approximating unit 111, and provides each position that gives the maximum value. Corresponding point estimation processing is performed with corresponding point positions corresponding to the plurality of reference frames.
第2の函数近似処理部113は、上記対応点推定部112により推定された各基準フレームにおける対応点位置を基準フレームの原点からの水平方向、垂直方向の距離で座標化し、上記時間を異にする複数の基準フレームにおける該座標点の水平方向位置、及び垂直方向位置のそれぞれの変化を時系列信号に変換し、各基準フレームの時系列信号を函数近似する第2の函数近似を行う。 The second function approximation processing unit 113 coordinates the corresponding point position in each reference frame estimated by the corresponding point estimation unit 112 by the horizontal and vertical distances from the origin of the reference frame, and changes the time. Each change in the horizontal position and the vertical position of the coordinate point in a plurality of reference frames is converted into a time series signal, and second function approximation is performed to approximate the time series signal of each reference frame.
第3の函数近似処理部114は、上記第2の函数近似部113で近似された函数により、上記複数の基準フレーム間の任意の時間における補間フレームについて、上記基準フレームの対応点位置に該当する補間フレーム内の対応する位置を対応点位置とし、該補間フレームの対応点位置における濃淡値を、上記基準フレームの対応点における濃淡値で補間して求め、該補間フレームの対応点の濃淡値に合わせて上記第1の函数近似を当てはめて、該対応点近傍の濃淡分布を求め、該対応点近傍の濃淡値を補間フレームにおける画素点の濃淡値に変換する第3の函数近似処理を行う。 The third function approximation processing unit 114 corresponds to the corresponding point position of the reference frame for the interpolated frame at any time between the plurality of reference frames by the function approximated by the second function approximation unit 113. The corresponding position in the interpolation frame is set as the corresponding point position, and the gray value at the corresponding point position in the interpolation frame is obtained by interpolation with the gray value at the corresponding point in the reference frame. At the same time, the first function approximation is applied to obtain a gray level distribution near the corresponding point, and a third function approximation process for converting the gray value near the corresponding point into the gray value of the pixel point in the interpolation frame is performed.
このフレームレート変換装置110では、第1の函数近似処理部111により、基準フレームにおける複数個の画素について、その濃淡分布を函数近似し、対応点推定処理部112により、上記第1の函数近似処理部111で近似された時間を異にする複数の上記基準フレームにおける上記濃淡分布の函数で相関演算を行い、その最大値を与えるそれぞれの位置を上記複数の基準フレームにおいて対応する対応点位置とし、第2の函数近似処理部113により、上記対応点推定処理部112で推定された各基準フレームにおける対応点位置を基準フレームの原点からの水平方向、垂直方向の距離で座標化し、上記時間を異にする複数の基準フレームにおける該座標点の水平方向位置、及び垂直方向位置のそれぞれの変化を時系列信号に変換し、各基準フレームの時系列信号を函数近似する。そして、第3の函数近似処理部114により、第2の階調値生成処理部113で近似された函数により、上記複数の基準フレーム間の任意の時間における補間フレームについて、上記基準フレームの対応点位置に該当する補間フレーム内の対応する位置を対応点位置とし、該補間フレームの対応点位置における濃淡値を、上記基準フレームの対応点における濃淡値で補間して求め、該補間フレームの対応点の濃淡値に合わせて上記第1の函数近似を当てはめて、該対応点近傍の濃淡分布を求め、該対応点近傍の濃淡値を補間フレームにおける画素点の濃淡値に変換することにより、拡大補間処理とともに高フレームレート化処理を行う。
In the frame
この映像信号変換システム100では、上述の如く、撮像装置等の画像入力部10から入力される画像情報に前処理部20によりノイズ除去処理を施し、上記前処理部20によりノイズ除去処理が施された画像情報を圧縮符号化処理部30により圧縮符号化し、上記フレームレート変換装置1を用いた高フレームレート化処理部40において、フレーム間の映像対応点を追跡し、その時間推移を函数表現して、原フレームと変換するフレーム数との比で函数補間フレームを生成する。
In the video
すなわち、この映像信号変換システム100は、映像のフレーム毎に多数のフルーエンシ函数を使って輪郭などを表現し、離散フレーム列を時間方向で区分多項式に基づく連続関数で表すことで、任意フレームレートの高品位な映像を再生できるようにしたものである。
That is, the video
フルーエンシ情報理論では、信号が連続的に微分可能であるという度数に基づいて、次数mによって指定されるクラスにおける信号空間を分類する。 In fluency information theory, the signal space in the class specified by the order m is classified based on the frequency that the signal is continuously differentiable.
そして、どのようなm>2に対しても、subspace spannedは、(m−2)回のみ連続微分可能な(m−1)次の区分的な多項式によって表される。
(m=3)クラスの標本化関数ψ(x) は、1回のみ連続微分可能な2次の区分多項式の線形結合により次の式(14)で表される。
For any m> 2, subspace spanned is expressed by a (m−1) -order piecewise polynomial that can be continuously differentiated only (m−2) times.
The sampling function ψ (x) of the (m = 3) class is expressed by the following equation (14) by linear combination of second-order piecewise polynomials that can be continuously differentiated only once.
ここで、φ(x)は次の式(15)で示される。 Here, φ (x) is expressed by the following equation (15).
そして、ψ(x)は、標本化函数であるため、標本列と畳み込み演算で区間の函数を求めることができる。 Since ψ (x) is a sampling function, a section function can be obtained by a sampling sequence and a convolution operation.
ここで、τ=1とき、式(13)は、次の式(16)よって与えられる区分的な多項式として表されることができる。 Here, when τ = 1, equation (13) can be expressed as a piecewise polynomial given by equation (16) below.
例えば、(m=3)クラスの不均等フルーエンシ補間函数 For example, (m = 3) class of unequal fluency interpolation functions
は、図27に示すような函数である。 Is a function as shown in FIG.
不均等補間フルーエンシ関数 Non-uniform interpolation fluency function
は、度数2の8部分多項式から成り、(m=3)クラスの不均等補間フルーエンシ関数は、図27で示すようにs1(x)〜S8(x)に指定される不均等の間隔で定められ、その構成要素は、次の式(17)で与えられる。
Is composed of 8 partial polynomials of
ここで、 here,
である。 It is.
ここで、高解像度補間の実例を図28に示す。 Here, FIG. 28 shows an example of high resolution interpolation.
また、図29は、補間のためのピクセル構造の具体例を示している。 FIG. 29 shows a specific example of a pixel structure for interpolation.
図29において、Frame_1のピクセルは、Frame_2でピクセルを変える異なる動きベクトル In FIG. 29, the pixel of Frame_1 is a different motion vector that changes the pixel in Frame_2.
を持つ。 have.
図30は2つの連続的なフレームから一次元イメージ補間の概念を例示している。 FIG. 30 illustrates the concept of one-dimensional image interpolation from two consecutive frames.
動き評価は、ブロック・サイズと検索ウィンドウ・サイズが知られている全検索ブロックマッチングのアルゴリズムによるものとされる。 The motion estimation is based on an all search block matching algorithm whose block size and search window size are known.
高解像度フレームピクセルは、f(τx,τy))によって表され、ピクセル構造は、図29の高解像度補間アプローチの1例に示すようである。 The high resolution frame pixel is represented by f (τ x , τ y )), and the pixel structure is as shown in one example of the high resolution interpolation approach of FIG.
第1のステップでは、ビデオ・シーケンスから2つの連続的なフレームを得て、f1(x,y)とf2(x,y)によって表す。 In the first step, two consecutive frames are obtained from the video sequence and represented by f 1 (x, y) and f 2 (x, y).
第2のステップでは、動きベクトルの初期推定を行う。 In the second step, an initial estimation of the motion vector is performed.
にて、動きベクトルの初期推定を行う。 The initial estimation of the motion vector is performed.
ここで、 here,
である。 It is.
式(18)において、 In equation (18):
はサーチウインドウの平均を表し、そして、 Represents the average of the search window, and
はマッチングにおける現ブロックの平均を表す。 Represents the average of the current blocks in the matching.
第3のステップでは、式(13)と式(17)を用いた全ピクセル In the third step, all pixels using equations (13) and (17)
のために、第2のステップから動きベクトル For the motion vector from the second step
付近の一つのピクセルの中から動きベクトルを得る。 A motion vector is obtained from one nearby pixel.
第4のステップでは、以下の通りに均等水平補間を実行する。 In the fourth step, uniform horizontal interpolation is performed as follows.
第5のステップでは、第4のステップで得られるピクセルを使っている不均等垂直補間を式(20)により実行する。 In the fifth step, non-uniform vertical interpolation using the pixels obtained in the fourth step is executed according to equation (20).
第4のステップと第5のステップは、高解像度イメージで全てのピクセルのために繰り返される。 The fourth and fifth steps are repeated for all pixels in the high resolution image.
フルーエンシ理論に基づく動画符号化では、原信号に適した信号空間を選択し、函数化を行うことでシャープさを保存したまま高圧縮化することができる。 In moving picture coding based on the fluency theory, a signal space suitable for the original signal is selected, and the function is converted into a highly compressed image while preserving sharpness.
フルーエンシ理論に基づいて、フレーム間の相関函数の属する函数空間を正確に決定することにより、任意精度で動きベクトルを求めることができる。 A motion vector can be obtained with arbitrary accuracy by accurately determining a function space to which a correlation function between frames belongs based on the fluency theory.
フルーエンシ理論に基づく動画符号化では、原信号に適した信号空間を選択し、函数化を行うことでシャープさを保存したまま高圧縮化することができる。 In moving picture coding based on the fluency theory, a signal space suitable for the original signal is selected, and the function is converted into a highly compressed image while preserving sharpness.
このように、フレーム間の映像対応点を追跡し、その時間推移を函数表現して、原フレームと変換するフレーム数との比で函数補間フレームを生成することで、フレーム数を増減しても鮮明で円滑な動きの映像信号を得ることができ、表示器にあったフレームレートで鮮明で円滑な動きの映像表示を行うことができる。 In this way, by tracking the video corresponding points between frames, expressing the time transition as a function, and generating a function interpolation frame with the ratio of the original frame and the number of frames to be converted, the number of frames can be increased or decreased. A clear and smooth motion video signal can be obtained, and a clear and smooth motion video display can be performed at a frame rate suitable for the display.
例えば、図30の(A)に示すように、フレームkとフレームk+1の間の任意時刻におけるフレームを生成する場合、均等補間により補間フレームF(k+1/2)を生成して1/2精度の動き推定により求められる動き情報を用いてブロックマッチングにより対応点の階調値を1/2精度で生成する従来の高フレームレート化処理では、図30の(B1),(C1)に示すように、挿入される補間フレームの画像は動きのある部分が劣化するが、上記高フレームレート化処理部40のように、対応点推定処理を行って推定した対応点の階調値を用いて均等補間により補間フレームの対応点の階調値を生成し、さらに、不均等補間により補間フレームの対応点の階調値を生成する高フレームレート化処理では、図30の(B2),(C2)に示すように、動きのある部分が劣化することなく高フレームレート化することができた。
For example, as shown in FIG. 30A, when generating a frame at an arbitrary time between the frame k and the frame k + 1, the interpolation frame F (k + 1/2) is generated by equal interpolation, and the ½ precision is obtained. In the conventional high frame rate processing in which the gradation value of the corresponding point is generated with the half accuracy by block matching using the motion information obtained by the motion estimation, as shown in (B1) and (C1) of FIG. In the interpolated frame image to be inserted, the moving portion is deteriorated, but as in the high frame
この映像信号変換システム100では、撮像装置等の画像入力部10から入力される画像情報に前処理部20によりノイズ除去処理を施し、上記前処理部20によりノイズ除去処理が施された画像情報を圧縮符号化処理部30により圧縮符号化し、上記高フレームレート化処理部40において、フレーム間の映像対応点を追跡し、その時間推移を函数表現して、原フレームと変換するフレーム数との比で函数補間フレームを生成することで、上記圧縮符号化処理部30により圧縮符号化された画像情報を高フレームレート化することにより、鮮明で円滑な動きの映像信号を得ることができる。
In the video
10 画像入力部、20 前処理部、21 劣化モデル、22 逆フィルタ、30 圧縮符号化処理部、31 第1の函数化処理部、31A 対応点推定部31A、31B 動き函数化処理部31B、 第2の函数化処理部、33 符号化処理部、32A 領域自動分類処理部、32B 輪郭函数近似処理部、32C 濃淡函数化処理部、32D 周波数函数近似処理部32D、40 高フレームレート化処理部、41 対応点推定処理部、42 、第1の階調値生成処理部、43 第2の階調値生成処理部、44 第3の階調値生成処理部、100 映像信号変換システム、311 第1の部分領域抽出部、312 第2の部分領域抽出部、313 函数近似部、314 相関値演算部、315 ずれ量演算部、110 フレームレート変換装置、111 第1の函数近似処理部、112 対応点推定処理部、113 第2の函数近似処理部、114 第3の函数近似処理部
DESCRIPTION OF
Claims (8)
上記前処理部によりノイズ除去処理が施された映像信号について、基準フレームにおける所定領域の画像濃淡値を面関数で近似し、且つ他のフレームにおける部分画像の濃淡値を面函数化し、上記基準フレームにおける面関数と他のフレームの面関数との相関値が最大となる位置を画像の対応点として推定し、該対応点のフレーム毎の位置の変化を画像の動き情報として函数化して表現するとともに、上記ノイズ除去処理が施された映像信号について、フルーエンシ理論に基づいて信号空間を選択し、選択した信号空間毎に画像情報を函数化して表現し、上記画像の動き情報を函数化した結果と上記選択した信号空間毎に画像情報を函数化した結果を所定の形式で記述して圧縮符号化する圧縮符号化処理部と、
上記圧縮符号化処理部により圧縮符号化された映像信号を高フレームレート化する高フレームレート化処理部と
を備えることを特徴する映像信号変換システム。 Observation image g (X, y) obtained by adding noise n (x, y) to the output of the degradation model of the blur function H (x, y) to which the true input image f (x, y) is input As an input, and a recursive optimization of the blur function H (X, y) is performed to extract the true video information estimated, before the noise contained in the input video signal is removed by the inverse filter. A processing unit;
For the video signal subjected to noise removal processing by the pre-processing unit, the image gray level value of a predetermined area in the reference frame is approximated by a surface function, and the gray value of the partial image in another frame is converted into a surface function, and the reference frame The position where the correlation value between the surface function in the image and the surface function of another frame is maximized is estimated as the corresponding point of the image, and the change in the position of the corresponding point for each frame is expressed as a function as image motion information. For the video signal that has been subjected to the noise removal processing, a signal space is selected based on the fluency theory, and the image information is expressed as a function for each selected signal space, and the motion information of the image is converted into a function result. A compression encoding processing unit that compresses and encodes the result of functioning image information for each selected signal space in a predetermined format;
A video signal conversion system comprising: a high frame rate processing unit configured to increase the frame rate of the video signal compressed and encoded by the compression encoding processing unit.
この対応点推定部によるフレーム毎の対応点位置を画像の動き情報として函数化して表現する動き函数化処理部からなる第1の函数化処理部を備え、
上記対応点推定部は、フレーム画像の部分領域を抽出する第1の部分領域抽出手段と、上記第1の部分領域抽出手段により抽出した部分領域に相似な連続する他のフレーム画像の部分領域を抽出する第2の部分領域抽出手段と、上記第1の部分領域抽出手段及び上記第2の部分領域抽出手段により抽出された各部分領域を同一比に変換し、変換した各画像の濃淡を区分多項式で函数表現して出力する函数近似手段と、上記函数近似手段の出力の相関値を演算する相関値演算手段と、上記相関値演算手段により算出される相関値の最大値を与える画像の位置ずれを演算し、該演算値を対応点のずれ量として出力するずれ量演算手段とからなることを特徴する請求項1記載の映像信号変換システム。 The compression coding processing unit functions to estimate the position where the correlation for each frame is maximized as a corresponding point by functioning an image gray value of a predetermined region for the video signal subjected to noise removal processing by the preprocessing unit. A point estimator;
A first functionalization processing unit comprising a motion functioning processing unit for expressing the corresponding point position for each frame by the corresponding point estimation unit as a function of image motion.
The corresponding point estimation unit includes a first partial region extracting unit that extracts a partial region of a frame image and a partial region of another continuous frame image similar to the partial region extracted by the first partial region extracting unit. The second partial area extracting means for extracting, the partial areas extracted by the first partial area extracting means and the second partial area extracting means are converted into the same ratio, and the shades of the converted images are classified. A function approximating means that outputs the function expressed in polynomial form, a correlation value calculating means for calculating the correlation value of the output of the function approximating means, and the position of the image that gives the maximum correlation value calculated by the correlation value calculating means 2. The video signal conversion system according to claim 1, further comprising a deviation amount calculating means for calculating a deviation and outputting the calculated value as a deviation amount of the corresponding point.
この領域自動分類処理部により選択した信号空間毎に画像情報を函数化して表現する函数化処理部からなる第2の函数化処理部を備え、
上記函数化処理部は、上記領域自動分類処理部により選択された多項式表現可能な領域について画像の濃淡を面函数で近似して表現し濃淡情報を函数化する濃淡函数化処理部と、
上記領域自動分類処理部により選択された多項式表現可能な領域について画像の輪郭線函数で近似して表現し輪郭情報を函数化する輪郭線函数化処理部とを備える
ことを特徴する請求項2記載の映像信号変換システム。 The compression encoding processing unit further includes an area automatic classification processing unit that selects a signal space based on fluency theory for the video signal that has been subjected to noise removal processing by the preprocessing unit,
A second function processing unit comprising a function processing unit for expressing image information as a function for each signal space selected by the automatic region classification processing unit;
The function processing unit is a tone function processing unit that approximates the density of an image by a surface function for the region that can be represented by the polynomial selected by the region automatic classification processing unit, and functions the tone information as a function,
3. An outline function processing unit that approximates and expresses an area that can be represented by a polynomial selected by the automatic area classification processing unit with an outline function of an image, and converts the outline information into a function. Video signal conversion system.
上記対応点推定処理部により推定した各画像フレームにおける各対応点について、それぞれ上記対応点位置近傍の画素の濃淡を示す階調値から各対応点の階調値を求める第1の階調値生成処理部と、
上記基準フレームにおける複数個の画素に対して、上記第1の階調値生成処理部により求めた上記推定した各画像フレームにおける各対応点の階調値から、フレーム間の対応点軌跡上の濃淡値の変化をフルーエンシ函数で近似し、その函数から新たに挿入する補間フレームにおける対応点の各階調値を求める第2の階調値生成処理部と、
上記第2の階調値生成処理部により求めた上記補間フレームにおける各対応点の階調値から、上記補間フレームにおける各対応点の各画素の階調値を生成する第3の階調値生成処理部とを備えることを特徴とする請求項1記載の映像信号変換システム。 The high frame processing unit includes, for a plurality of pixels in a reference frame, a corresponding point estimation processing unit that estimates each corresponding point position of a pixel in a plurality of image frames at different times;
First gradation value generation for obtaining the gradation value of each corresponding point from the gradation value indicating the shade of the pixel in the vicinity of the corresponding point position for each corresponding point in each image frame estimated by the corresponding point estimation processing unit A processing unit;
For a plurality of pixels in the reference frame, the density on the locus of corresponding points between frames is determined from the gradation values of the corresponding points in the estimated image frames obtained by the first gradation value generation processing unit. A second tone value generation processing unit for approximating a change in value with a fluency function and obtaining each tone value of a corresponding point in an interpolation frame newly inserted from the function;
Third gradation value generation for generating a gradation value of each pixel of each corresponding point in the interpolation frame from the gradation value of each corresponding point in the interpolation frame obtained by the second gradation value generation processing unit The video signal conversion system according to claim 1, further comprising a processing unit.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008227628A JP5081109B2 (en) | 2008-09-04 | 2008-09-04 | Video signal conversion system |
EP09811368.1A EP2330817B1 (en) | 2008-09-04 | 2009-07-17 | Video signal converting system |
US13/061,931 US20110188583A1 (en) | 2008-09-04 | 2009-07-17 | Picture signal conversion system |
CN200980141504.2A CN102187664B (en) | 2008-09-04 | 2009-07-17 | Video signal converting system |
PCT/JP2009/062949 WO2010026839A1 (en) | 2008-09-04 | 2009-07-17 | Video signal converting system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008227628A JP5081109B2 (en) | 2008-09-04 | 2008-09-04 | Video signal conversion system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010062955A JP2010062955A (en) | 2010-03-18 |
JP5081109B2 true JP5081109B2 (en) | 2012-11-21 |
Family
ID=42189247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008227628A Expired - Fee Related JP5081109B2 (en) | 2008-09-04 | 2008-09-04 | Video signal conversion system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5081109B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10546367B2 (en) * | 2015-04-14 | 2020-01-28 | Koninklijke Philips N.V. | Device and method for improving medical image quality |
CN111898701B (en) * | 2020-08-13 | 2023-07-25 | 网易(杭州)网络有限公司 | Model training, frame image generation and frame insertion methods, devices, equipment and media |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07177514A (en) * | 1993-12-17 | 1995-07-14 | Casio Comput Co Ltd | Dynamic image compressor |
JPH1169170A (en) * | 1997-08-19 | 1999-03-09 | Kazuo Toraichi | Image communication system |
JPH1168515A (en) * | 1997-08-19 | 1999-03-09 | Kazuo Toraichi | Data interpolation method |
JP2000004363A (en) * | 1998-06-17 | 2000-01-07 | Olympus Optical Co Ltd | Image restoring method |
JP3732978B2 (en) * | 1999-08-23 | 2006-01-11 | ペンタックス株式会社 | Image compression and decompression apparatus and method |
JP2001326902A (en) * | 2000-05-18 | 2001-11-22 | Olympus Optical Co Ltd | Electronic camera |
-
2008
- 2008-09-04 JP JP2008227628A patent/JP5081109B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010062955A (en) | 2010-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2010026839A1 (en) | Video signal converting system | |
US7420487B2 (en) | Denoising video | |
CN1179302C (en) | Method and apparatus for motion estimating using block matching in orthogonal transformation field | |
CN102714726B (en) | Edge enhancement for temporal scaling with metadata | |
WO2010026838A1 (en) | Frame rate converting apparatus and corresponding point estimating apparatus, corresponding point estimating method and corresponding point estimating program | |
Song et al. | Video super-resolution algorithm using bi-directional overlapped block motion compensation and on-the-fly dictionary training | |
KR100657261B1 (en) | Method and apparatus for interpolating with adaptive motion compensation | |
JP2008518318A (en) | How to improve the image quality of blurred images | |
JP4931884B2 (en) | Frame rate conversion apparatus, frame rate conversion method, and frame rate conversion program | |
JP3674186B2 (en) | Image information conversion apparatus and method | |
JP5081109B2 (en) | Video signal conversion system | |
JP5042171B2 (en) | Filtering processing apparatus and filtering processing method | |
JP2001285881A (en) | Digital information converter and method, and image information converter and method | |
US20050025243A1 (en) | Motion type decision apparatus and method thereof | |
JP5042172B2 (en) | Movie processing apparatus and movie processing method | |
JP4743449B2 (en) | Corresponding point estimation device, corresponding point estimation method, and corresponding point estimation program | |
JP4552262B2 (en) | Noise reduction apparatus and method | |
JP2013500666A (en) | Signal filtering method and filter coefficient calculation method | |
JP3896635B2 (en) | Image data conversion apparatus and method, prediction coefficient generation apparatus and method | |
JPH08317347A (en) | Image information converting device | |
JP4552263B2 (en) | Digital signal processing apparatus and method, and digital image signal processing apparatus and method | |
JP4552264B2 (en) | Error correction apparatus and method | |
JP3922286B2 (en) | Coefficient learning apparatus and method | |
JP4001143B2 (en) | Coefficient generation apparatus and method | |
Yang | Video noise reduction based on motion complexity classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110830 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120416 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120510 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120612 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120831 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |