[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4157567B2 - 動画像の高解像度化方法及び装置 - Google Patents

動画像の高解像度化方法及び装置 Download PDF

Info

Publication number
JP4157567B2
JP4157567B2 JP2006108941A JP2006108941A JP4157567B2 JP 4157567 B2 JP4157567 B2 JP 4157567B2 JP 2006108941 A JP2006108941 A JP 2006108941A JP 2006108941 A JP2006108941 A JP 2006108941A JP 4157567 B2 JP4157567 B2 JP 4157567B2
Authority
JP
Japan
Prior art keywords
moving image
time
box
space
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006108941A
Other languages
English (en)
Other versions
JP2007280283A (ja
Inventor
安則 田口
孝 井田
敏充 金子
信幸 松本
雄志 三田
秀則 竹島
賢造 五十川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006108941A priority Critical patent/JP4157567B2/ja
Priority to US11/677,719 priority patent/US7965339B2/en
Publication of JP2007280283A publication Critical patent/JP2007280283A/ja
Application granted granted Critical
Publication of JP4157567B2 publication Critical patent/JP4157567B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4084Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Television Systems (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Circuits (AREA)

Description

本発明は、動画像を縦方向、横方向及び時間方向の少なくとも一つの方向に拡大するための高解像度化方法及び装置に関する。
低解像度の静止画を高解像度化する手法の一例は、特許文献1に開示されている。特許文献1の手法は、訓練段階と高解像度化段階からなる。訓練段階では訓練画像を縮小した縮小画像を生成すると共に、訓練画像の高周波成分画像を生成する。縮小画像中のブロック(縮小ブロック)の特徴ベクトルと、縮小ブロックと同一位置(同じ被写体が写っている部分)の高周波成分画像中のブロック(高周波ブロック)との複数の対をルックアップテーブルとして記憶する。縮小ブロックの位置を移動させて同様の処理を繰り返し、また訓練画像を適宜追加して上述の処理を繰り返すことにより訓練段階を終了する。
一方、高解像度化段階では、高解像度化すべき入力画像を拡大した仮拡大画像を生成すると共に、入力画像中のブロック(入力ブロック)の特徴ベクトルを算出する。ここで、入力ブロックは先の縮小ブロックと同じサイズであり、入力ブロックの特徴ベクトルは訓練段階と同じ方法で計算される。
次に、入力ブロックの特徴ベクトルと類似した、縮小ブロックの特徴ベクトルを先のルックアップテーブルから検索し、検索した特徴ベクトルと対をなす高周波ブロックを入力ブロックと同一位置の仮拡大画像中のブロック(仮拡大ブロック)に加算することにより、出力ブロックを生成する。ここで、仮拡大ブロックは加算される高周波ブロックと同じサイズであり、出力ブロックは出力画像の一部分である。出力ブロックが出力画像の全体を覆っていない場合は、覆うように入力ブロックの位置を移動させて同様の処理を繰り返し、覆っていれば高解像度化段階を終了する。
このような特許文献1の手法によれば、仮拡大画像にブロック毎に高周波成分を加算することによりテクスチャが鮮鋭になるため、鮮鋭な高解像度化画像が得られる。
特開2003−18398号公報
特許文献1の手法を動画像の各フレームに対して適用して得られた複数枚の高解像度化画像を動画像として再生すると、空間方向において同一位置の色が時間変化する場合がある。例えば、入力動画像の第tフレームが高解像度化された第1出力画像の出力ブロックと、第t+1フレームが高解像度化された第2出力画像の出力ブロックが空間方向には同一位置にあっても、これらの出力ブロックは訓練段階においては異なる2つの高周波成分画像の中の高周波ブロックであり、空間的に全く異なる位置から生成される場合がある。これら2つの高周波ブロックは、時間方向に連続しない高周波成分を要素に持つため、これらを仮拡大ブロックに加算して得られる出力ブロックをそれぞれ含む第1及び第2出力画像を動画像として再生すると、不自然な時間変化が起こる。
このように高解像度化段階において時間方向に連続して空間方向で同一位置に加算されたブロック同士が訓練段階において全く異なる位置から生成されるという状況は、第tフレームの入力画像中のブロックと同一位置のブロックと、第t+1フレームの入力画像中のブロックと同一位置のブロックの特徴ベクトルが全く同じでない限り、高い頻度で起こる。従って、特許文献1の手法を動画像の各フレームに対して適用して得られた複数枚の高解像度化画像を動画像として再生すると、高い頻度でちらつきが発生してしまう。
本発明の第1の態様によると、縮小動画像を生成するために少なくとも一つの訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小するステップと;高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出するステップと;前記縮小動画像中の少なくとも一つの第1時空間ボックスの特徴量を要素に含む少なくとも一つの第1特徴ベクトルを算出するステップと;前記第1特徴ベクトルと前記第1時空間ボックスと同一位置の前記高周波成分動画像中の第2時空間ボックスとの複数の対をルックアップテーブルとして記憶するステップと;仮拡大動画像を生成するために入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大するステップと;前記入力動画像の処理対象の第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索するステップと;高解像度化された出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の第4時空間ボックスに加算するステップと;を具備する動画像の高解像度化方法が提供される。
ここで、前記縮小するステップは前記訓練動画像を時間方向にも縮小し、前記拡大するステップは前記入力動画像を時間方向にも拡大してもよい。
一つの訓練動画像をフレーム毎に縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの訓練動画像を縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することにより複数の訓練動画像を生成し、該複数の訓練動画像を前記縮小するステップに渡してもよい。
一つの第1時空間ボックスの各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの第1時空間ボックスを縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することによって複数の第1時空間ボックスを生成し、該複数の第1時空間ボックスを前記第1特徴ベクトルの算出ステップに渡してもよい。
一つの第3時空間ボックスの各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすことによって複数の第3時空間ボックスを生成し、該複数の第3時空間ボックスを前記検索するステップに渡してもよい。
前記加算するステップにおいては、前記第4時空間ブロック同士に重なりがある場合に、該重なり部分に対しては当該重なり部分に対応する複数の第2時空間ボックスの平均値あるいは当該複数の第2時空間ボックスのうち最後に加算される第2時空間ボックスの値を加算してもよい。また、前記加算するステップは、被写体の動きが相対的に大きい部分を除いて前記加算を行ってもよい。前記入力動画像を前記訓練動画像として用いることも可能である。
本発明の他の態様によると、縮小動画像を生成するために訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小する縮小部と;高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出する抽出部と;前記縮小動画像中の第1時空間ボックスの特徴量を要素に含む第1特徴ベクトルと、前記第1時空間ボックスと同一位置の前記高周波成分動画像中の第2時空間ボックスとの複数の対をルックアップテーブルとして記憶する記憶部と;仮拡大動画像を生成するために入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大する拡大部と;前記入力動画像の処理対象の第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索する検索部と;高解像度化された出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の第4時空間ボックスに加算する加算部;とを具備する動画像の高解像度化装置が提供される。
さらに、本発明の第3の態様によると、縮小動画像を生成するために少なくとも一つの訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小する処理と;高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出する処理と;前記縮小動画像中の少なくとも一つの第1時空間ボックスの特徴量を要素に含む少なくとも一つの第1特徴ベクトルを算出する処理と;前記第1特徴ベクトルと前記第1時空間ボックスと同一位置の前記高周波成分動画像中の第2時空間ボックスとの複数の対をルックアップテーブルとして記憶する処理と;仮拡大動画像を生成するために入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大する処理と;前記入力動画像の処理対象の第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索する処理と;前記出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の第4時空間ボックスに加算する処理と;を含む動画像の高解像度化処理をコンピュータに行わせるプログラムを提供することもできる。
本発明によれば、画像のブロック単位での処理ではなく、時間方向に連続性を持たせた時空間ボックス単位での処理によって高解像度化を行うことにより、ブロック単位の処理では空間方向において同一位置の色が時間変化を起こしてちらつきとして知覚されるという問題が解決され、ちらつきのない高品質な高解像度化を実現できる。
以下、図面を参照しながら本発明の実施の形態を説明する。ここでは、複数フレームからなる入力動画像を空間方向に縦横それぞれの方向に2倍に拡大した出力動画像を生成する場合を例にとって説明する。拡大倍率は整数でなくともよい。また、入力動画像を時間方向に拡大し、すなわち出力動画像のフレーム数を入力動画像のフレーム数よりも多くすることもできる。さらに、拡大倍率は縦方向、横方向及び時間方向で異なっていても構わない。以下の説明においては、画像信号あるいは画像データを単に「画像」と呼ぶことにする。
本実施形態に係る動画像の高解像度化装置は、訓練ユニットと高解像度化ユニットとからなる。図1に示されるように、訓練ユニット200は訓練動画像201を一時記憶するフレームメモリ202、動画像縮小部203、高周波成分抽出部204、特徴ベクトル抽出部206、高周波ボックス生成部212、及びルックアップテーブルを記憶する記憶部210を有する。
一方、図2に示されるように高解像度化ユニット300は、ルックアップテーブルが記憶された記憶部210、高解像度化すべき対象の入力動画像301を一時記憶するフレームメモリ302、動画像拡大部304、特徴ベクトル算出部305、及び加算部307を有する。記憶部210は、訓練ユニット200と高解像度化ユニット300とで共有される。訓練ユニット200では記憶部210へのルックアップテーブルの記憶が行われ、高解像度化ユニット300では記憶装置210に記憶されているルックアップテーブルが参照される。
まず、図3を参照して図1の訓練ユニット200の詳細について説明する。外部から入力される訓練動画像201は、フレームメモリ202を介してフレーム単位で動画像縮小部203と高周波成分抽出部204に入力される。動画像縮小部203では、入力された訓練動画像201の各フレームが例えばバイリニア法により空間方向に縦横それぞれ2分の1に縮小されることにより、縮小動画像205が生成される。
動画像縮小部203における訓練動画像201の縮小法として、バイリニア法以外の方法を利用しても構わない。例えば、ニアレストネイバー法やバイキュービック法、キュービックコンボリューション法、キュービックスプライン法、面積平均法などの方法でもよい。あるいはローパスフィルタにより訓練動画像201をぼかしてからサブサンプリングすることにより縮小を行っても構わない。高速な縮小方法を利用すれば、画像高解像度化処理の高速化が可能になる。高品質な縮小方法を利用すれば、画像高解像度化自体も高品質になる。
動画像縮小部203においては、入力された訓練動画像201を空間方向のみでなく時間方向にも縮小してもよい。これにより、訓練動画像201として被写体が素早く動くような画像を用いることなく、被写体が素早く動く入力動画像301を高品質に高解像度化することができる。
すなわち、動画像縮小部203は訓練動画像201を縦方向にα分の1倍(α≧1)、横方向にβ分の1倍(β≧1)、時間方向にγ分の1倍(γ≧1)に縮小して縮小動画像205を生成する。こうして動画像縮小部203により生成される縮小動画像205は、特徴量ベクトル算出部206に入力される。
特徴ベクトル算出部206では、入力された縮小動画像205から、図示しない制御部により指定される縮小動画像205中の第1時空間ボックス401の特徴量を要素に持つ第1特徴ベクトル209が算出される。ここで、時空間ボックスとは例えば動画像における時間方向にT画素(Tフレーム)、縦方向にY画素及び横方向にX画素の画素集合である。この場合、時空間ボックスの形状は方形状となるが、画素集合の選び方を変えることによって他の形状としても構わない。
特徴量とは、例えば第1時空間ボックス401内の画素の値そのものである。あるいは、縮小動画像205中の各フレームを例えばバイリニア法により縦横それぞれ2分の1に縮小した後に2倍に拡大した縮小拡大画像を生成し、その縮小拡大画像を対応する元のフレームの画像から減算して得られる画像からなる動画像中の第1時空間ボックス401と同一位置の時空間ボックス内の画素の値であってもよい。特徴ベクトル算出部206により算出された第1特徴ベクトル209は、記憶部210に入力される。
高周波成分抽出部204では、入力された訓練動画像201中の高周波成分が抽出されることにより、高周波成分画像211が生成される。より具体的には、高周波成分抽出部204は具体的には例えば訓練動画像201中の各フレームを縦横それぞれ2分の1に縮小した後に2倍に拡大した縮小拡大画像を生成し、その縮小拡大画像を元のフレームの画像から減算することにより高周波成分を抽出する。あるいは、訓練動画像201の各フレームに対してハイパスフィルタを適用することにより、高周波成分を抽出しても構わない。高周波成分抽出部204から出力される高周波成分動画像211は、高周波ボックス生成部212に入力される。
高周波ボックス生成部212では、入力された高周波成分動画像211から図示しない制御部により指定される位置の第2時空間ボックス(高周波ボックス)213が抽出され、記憶部210に入力される。制御部により指定される第2時空間ボックス213の位置は、縮小動画像205中の第1時空間ボックス401と同一位置である。ここで、同一位置とは同じ被写体が写っている部分という意味であり、時空間ボックス213と401の大きさが同じである必要はない。
記憶部210では、入力された第1特徴ベクトル209と第2時空間ボックス213との対がルックアップテーブルの要素として記憶される。高解像度化ユニット300では、上記のようにして訓練ユニット200により記憶部210に記憶されたルックアップテーブルを用いて入力動画像301に対して高解像度化の処理が行われる。
次に、図4を参照して図2の高解像度化ユニット300について詳細に説明する。高解像度化ユニット300では、外部からの入力動画像301が入力され、高解像度化された出力動画像313が出力される。入力動画像301はフレームメモリ302を介してフレーム単位で動画像拡大部304と特徴量ベクトル算出部305に入力される。動画像拡大部304では、入力動画像301の各フレームが例えばバイリニア法により空間方向に縦横それぞれ2倍に拡大され、仮拡大動画像306が生成される。仮拡大動画像306の「仮」とは、仮拡大画像306が動画像高解像度化装置により最終的に得られる高解像度化された出力画像313(拡大画像)を生成する前の段階の仮の拡大画像であることを意味している。
動画像拡大部304における入力動画像301の拡大法として、バイリニア法以外の方法を利用しても構わない。例えば、ニアレストネイバー法やバイキュービック法、キュービックコンボリューション法、キュービックスプライン法などの内挿法でもよい。高速な内挿法を利用すれば、画像高解像度化処理の高速化が可能になる。高品質な内挿法を利用すれば、画像高解像度化自体も高品質になる。
動画像縮小部203において、訓練動画像201を空間方向のみでなく時間方向にも縮小している場合には、動画像拡大部304は入力動画像301を時間方向にも拡大する。すなわち、動画像拡大部304は画像縮小部203における訓練動画像201に対する縮小率(α分の1、β分の1、γ分の1)の逆数の拡大率(縦方向にα倍(α≧1)、横方向にβ倍(β≧1)、時間方向にγ倍(γ≧1))で入力動画像301を拡大して仮拡大動画像306を生成する。こうして動画像拡大部304により生成される仮拡大動画像306は、加算部307に入力される。
一方、特徴量ベクトル算出部305では入力動画像301から図示しない制御部により指定される、入力動画像301中の処理対象の第3時空間ボックス501の特徴量を要素に持つ第2特徴ベクトル310が算出され、記憶部210にルックアップテーブルを参照するために入力される。
第3時空間ボックス501は、当該時空間ボックス501が入力動画像301を覆うように制御部によって順次指定され、縮小動画像205中の第1時空間ボックス401と同じサイズを持つ。第3時空間ボックス501同士は重なりがあっても構わない。特徴量とは、例えば第3時空間ボックス501内の画素の値そのものである。あるいは、入力動画像301中の各フレームを例えばバイリニア法により縦横それぞれ2分の1に縮小した後に2倍に拡大した縮小拡大画像を生成し、その縮小拡大画像を対応する元のフレームから減算して得られる画像からなる動画像中の第3時空間ボックス501と同一位置の時空間ボックス内の画素の値であってもよい。特徴ベクトル算出部305における特徴量の計算方法は、図1に示した訓練ユニット200内の特徴ベクトル算出部206のそれと同じであることが望ましい。
こうして算出された第2特徴ベクトル310によって、記憶部210に記憶されているルックアップテーブルが参照される。この結果、ルックアップテーブル内の第1特徴ベクトル209の中から第2特徴ベクトル310と最も類似したベクトルが検索されると共に、ルックアップテーブル内の第2時空間ボックス(高周波ボックス)213のうち、検索された特徴ベクトルと対をなす時空間ボックスが加算用ボックス312として出力され、加算部307に送られる。
ここで、第2特徴ベクトル310と最も類似したベクトルとしては、当該特徴ベクトル310との距離が最小である第1特徴ベクトルが選ばれる。ルックアップテーブルからの検索に用いるベクトル間の距離としては、L1距離(マンハッタン距離)が好適に用いられるが、これに限られるものではなく、L2距離(ユークリッド距離)、L∞距離、あるいは、L1距離、L2距離またはL∞距離に重みを付けたもの、その他の距離でもよい。
また、ここではルックアップテーブルから検索される、第2特徴ベクトル310に最も類似したベクトルと対になっている高周波ボックス(第2時空間ボックス)を加算用ボックス312としたが、必ずしもそうする必要はない。例えば、k番目(k≧2)に類似したベクトルと対になっている高周波ボックス(第2時空間ボックス)を加算用ボックス312としてもよい。また、ルックアップテーブルから第2特徴ベクトル310に類似した複数のベクトルを検索し、それらと対になっている複数の高周波ボックスの平均を加算用ボックス312としてもよい。また、当該複数の高周波ボックスをルックアップテーブルから検索した複数のベクトル間の距離に応じて重み付けして平均化することで加算用ボックス312を生成してもよい。ベクトル間の距離が閾値を超えた場合は、加算用ボックス312を生成せず、後で説明する仮拡大画像306への加算をしないようにしてもよく、それによりルックアップテーブル内に第2特徴ベクトル310に類似したベクトルが存在しなかったときの出力動画像313に発生するノイズを抑制できる。
加算部307では、図示しない制御部により指定される仮拡大動画像306中の、第3ボックス501と同一位置の第4時空間ボックス502に加算用ボックス312が加算されることにより、出力動画像313が生成される。ここで、同一位置とは同じ被写体が写っている部分という意味である。第4時空間ボックス502は、加算用ボックス312と同じサイズであるが、第3ボックス501と同じサイズである必要はない。第4時空間ボックス502同士に重なりがあっても構わない。第4時空間ボックス502同士に重なりがある場合、重なり部分においては、平均値を加算するか、後に処理したボックスの値を加算する。
加算部307においては、被写体の動きが激しい部分(被写体の動きが相対的に大きい部分)では加算用ボックスの加算を行わないようにしてもよい。人間の目は動きの素早い部分を鮮鋭に感じる特性があるので、その部分の処理を省略することにより計算量を削減できる。あるいは、被写体の動きの激しい部分では、特許文献1の手法を利用してもよく、それによれ動きの激しい部分がより鮮鋭に見える場合がある。
次に、図5に示すフローチャートを参照して本実施形態における動画像の高解像度化の処理の流れを説明する。
<ステップS1001> 訓練動画像201を例えばバイリニア法により縦横それぞれ2分の1倍に縮小し、縮小動画像205を生成する。前述したように、縮小を縦横方向及び時間方向に行ってもよい。
<ステップS1002> 訓練動画像201の各フレームから高周波成分を抽出し、高周波成分動画像211を生成する。
<ステップS1003> 縮小動画像205中の第1時空間ボックス401の特徴量を要素に持つ第1特徴ベクトル209を算出する。
<ステップS1004> 高周波成分動画像211からステップS1003で得られた第1時空間ボックス401と同一位置の第2時空間ボックス(高周波ボックス)213を抽出し、第1特徴ベクトル209と高周波ボックス213との対を記憶部210にルックアップテーブル(図中ではLUTと表記)の要素として記憶する。
<ステップS1005> 縮小動画像信号中の第1時空間ボックス401の位置を移動させてステップS1003に戻るか、ステップS1006に進む。ステップS1003に戻るかステップS1006に進むかどうかは、例えば記憶部210に記憶するルックアップテーブルの容量に基づいて決定されるか、あるいは訓練動画像201中の全ての第1時空間ボックスが処理されたかどうかにより決定される。
<ステップS1006> 訓練動画像を追加する場合はステップS1001に戻り、追加しない場合はステップS1007に進む。
<ステップS1007> 入力動画像301をバイリニア法により縦横それぞれ2倍に拡大し、仮拡大動画像306を生成する。ステップS1001で縮小を縦横方向及び時間方向に行う場合は、拡大も縦横方向及び時間方向に行う。
<ステップS1008> 入力動画像301中の処理対象である第3時空間ボックス501の特徴量を要素とする第2特徴ベクトル310を算出する。
<ステップS1009> 記憶部210に記憶されたルックアップテーブル中の第1特徴ベクトル209の中から、第2特徴ベクトル310に最も類似した一つの特徴ベクトルあるいは第2特徴ベクトル310にルウ辞した複数の特徴ベクトルを検索する。
<ステップS1010> ステップS1009で検索された特徴ベクトルと対をなす第2時空間ボックス(高周波ボックス)213を加算用ボックス312として、加算用ボックス312を処理対象である第3時空間ボックス501と同一位置の仮拡大動画像306中の第4時空間ボックス502に加算する。
<ステップS1011> 第3時空間ボックス501が入力動画像301を覆いつくしたときに、仮拡大画像306と全ての加算用ボックス312との加算結果が高解像度化された出力動画像313として出力されて終了する。第3時空間ボックス501が入力動画像301を覆いつくしていないときは、第3時空間ボックス501の位置を移動してステップS1009に戻る。
上述した本発明の一実施形態の手法に従って動画像を高解像度化すると、特許文献1の手法により発生するちらつきを抑制できる。この効果を図6及び図7により説明する。図6は、特許文献1に記載されたような従来の手法で動画像を高解像度化する様子を示している。入力動画像の第tフレームが高解像度化された出力画像605中の出力ブロック607と、第t+1フレームが高解像度化された第2出力画像606の出力ブロック608は空間方向には同一位置にある。しかし、出力ブロック607及び608は訓練段階においては異なる2つの高周波成分画像601及び602中の高周波ブロック603及び604であり、空間的に全く異なる位置から生成される。これら2つの高周波ブロック603及び604は、時間方向に連続しない高周波成分を要素に持つ。従って、高周波ブロック603及び604をそれぞれ仮拡大ブロックに加算して得られる出力ブロック607及び608をそれぞれ含む出力画像605及び606を動画像として再生すると、不自然な時間変化が起こる。
一方、図7は上述した本発明の一実施形態に従って動画像を解像度化する様子を示している。入力動画像が高解像度化された出力動画像の第tフレーム703及び第t+1フレーム704の時空間ボックス705の第tフレームにおける断面と第t+1フレームにおける断面とは、空間方向において同一位置にある。時空間ボックス705の第tフレームにおける断面と第t+1フレームにおける断面は、訓練段階においてはそれぞれ高周波成分動画像701時空間ボックス702であり、時間方向に連続し、かつ空間方向において同一位置から生成される。従って、時間方向に連続しない高周波成分は加算されず、時間方向に不自然な時間変化が起こらないため、ちらつきを抑制できる。
なお、本発明は前記した実施形態そのままに限定されるものではない。実施段階ではその要旨を逸脱しない範囲で構成要素を種々変形して具体化することができる。前記の複数の構成要素を適宜組み合わせたり、全構成要素から幾つかの構成要素を削除したりしても構わない。
例えば、ルックアップテーブルの要素として記憶する第1特徴ベクトル−第2時空間ボックス対を以下のように水増ししてもよい。
(1)一つの訓練動画像をフレーム毎に縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの訓練動画像を縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することにより複数の訓練動画像を生成し、該複数の訓練動画像を図1中の動画像縮小部203あるいは図5中のステップS1001に渡す。これにより、被写体が多様な動きをする訓練動画像を数多く集めなくても、多くの第1特徴ベクトル−第2時空間ボックス対を生成できるので、より高品質な高解像度化を実現できるようになる。なお、実際に新たな訓練動画像を生成せず、以下のような手法で第1特徴ベクトル−第2時空間ボックス対を水増しすることもできる。
(2)入力される訓練動画像をそのまま利用せずに、時間方向に逆転させてから利用してもよい。これにより、入力される訓練動画像とは逆の動きをする被写体に好適な第1特徴ベクトル209−第2時空間ボックス213対がルックアップテーブルの要素として記憶される。入力された元の訓練動画像と、時間方向に逆転させた訓練画像の両方を利用すれば、1つの動画像から2つ分の対をルックアップテーブルに記憶できる。
(3)一つの第1時空間ボックス401の各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの第1時空間ボックス401を縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することによって複数の第1時空間ボックスを生成し、該複数の第1時空間ボックスを図1中の特徴ベクトル算出部206あるいは図5中のステップS1003に渡す。
(4)一つの第3時空間ボックス(高周波ボックス)213の各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすことによって複数の第3時空間ボックスを生成し、該複数の第3時空間ボックスを図1中の記憶部210あるいは図5中の検索ステップS1006に渡す。
一方、第1特徴ベクトル−第2時空間ボックス対を水増しする以外に、以下のような方法を用いてもよい。第1特徴ベクトル209−第2時空間ボックス213対の各要素をベクトル209のノルムに小数を加算した値で割ってから記憶し、第2特徴ベクトル310のノルムに小数を加算したベクトルをベクトル310として類似したものをルックアップテーブル210から検索し、加算用ボックス312にベクトル310のノルムに小数を加算した値をかけてから仮拡大動画像306に加算するように変更してもよい。
あるいは、第1特徴ベクトル209を各要素の平均が0、分散が1になるように正規化したベクトルとしてから第2時空間ボックス213との対を記憶し、第2特徴ベクトル310を各要素の平均が0、分散が1になるように正規化してから第2特徴ベクトルに類似した第1特徴ベクトル209をルックアップテーブル210から検索してもよい。
これにより、第1特徴ベクトル−第2時空間ボック対をルックアップテーブル210により少ない数だけしか記憶しなくても、高品質な高解像度化画像を得られるようになる。
ルックアップテーブルからの検索時に、入力動画像301の処理対象である第3時空間ボックス501の各時刻における断面であるブロックの位置を縦方向や横方向にずらしたボックスを新たな第3時空間ボックス501としてもよい。これにより、被写体が多様に動く訓練動画像から生成された第1特徴ベクトル−第2時空間ボックス対がルックアップテーブルに記憶されていなくても、高品質な高解像度化を実現できる。
これまでの説明では、入力動画像501は訓練動画像301と別の画像であるかのように説明したが、入力動画像501を訓練動画像301として利用しても構わない。これにより、入力動画像と似た種類(顔、建物、植物など)の訓練動画像を収集する手間を省くことができる。
さらに、入力動画像を縦方向、横方向及び時間方向に2分の1倍に縮小することで縮小動画像を生成し、縦方向、横方向及び時間方向に2倍に拡大することで仮拡大動画像を生成してもよい。これにより、被写体が入力動画像と似た動きをする訓練動画像を収集しなくても、高品質な高解像度化が実現できる。
本発明は、デジタルカメラ、ビデオカメラ、テレビジョン受像機、ビデオデッキ、HDDレコーダ、DVDプレーヤ、パーソナルコンピュータ、電話機、携帯情報端末などの画像を閲覧する機能を有する電子機器に好適である。
本発明の一実施形態に従う動画像の高解像度化装置における訓練ユニットの構成を示すブロック図 本発明の一実施形態に従う動画像の高解像度化装置における高解像度化ユニットの構成を示すブロック図 本発明の一実施形態における訓練段階の処理を説明するための模式図 本発明の一実施形態における高解像度化段階の処理を説明するための模式図 本発明の一実施形態に従う動画像の高解像度処理の流れを説明するためのフローチャート 比較例の問題点を説明するための模式図 本発明の一実施形態による効果を説明するための模式図
符号の説明
200・・・訓練ユニット
201・・・訓練動画像
203・・・動画像縮小部
204・・・高周波成分抽出部
205・・・縮小画像
206・・・特徴ベクトル算出部
209・・・第1特徴ベクトル
210・・・記憶部
211・・・高周波成分画像
212・・・高周波ボックス生成部
213・・・第2時空間ボックス
300・・・高解像度化ユニット
301・・・入力動画像
304・・・動画像拡大部
305・・・特徴ベクトル算出部
306・・・仮拡大画像
307・・・加算部
310・・・第2特徴ベクトル
312・・・第2時空間ボックス
313・・・出力動画像
401・・・第1時空間ボックス
501・・・第3時空間ボックス
502・・・第4時空間ボックス

Claims (10)

  1. 入力動画像を空間方向に高解像度化した出力動画像を生成する動画像の高解像度化方法において、
    縮小動画像を生成するために少なくとも一つの訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小するステップと;
    高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出するステップと;
    前記縮小動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である少なくとも一つの第1時空間ボックスの特徴量を要素に含む少なくとも一つの第1特徴ベクトルを算出するステップと;
    前記第1特徴ベクトルと前記第1時空間ボックスと同一位置の前記高周波成分動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第2時空間ボックスとの複数の対をルックアップテーブルに記憶するステップと;
    仮拡大動画像を生成するために前記入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大するステップと;
    前記入力動画像の処理対象の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索するステップと;
    前記出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第4時空間ボックスに加算するステップと; を具備する動画像の高解像度化方法。
  2. 入力動画像を空間方向と時間方向に高解像度化した出力動画像を生成する動画像の高解像度化方法において、
    縮小動画像を生成するために前記入力動画像を含む一つ以上の訓練動画像を縦方向及び横方向の少なくとも一方と時間方向に特定の縮小率で縮小するステップと;
    高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出するステップ
    と;
    前記縮小動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である一つ以上の第1時空間ボックスの特徴量を要素に含む一つ以上の第1特徴ベクトルを算出するステップと;
    前記第1特徴ベクトルと前記第1時空間ボックスと同一位置の前記高周波成分動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第2時空間ボックスとの複数の対をルックアップテーブルに記憶するステップと;
    仮拡大動画像を生成するために前記入力動画像を縦方向及び横方向の少なくとも一方と時間方向に前記縮小率の逆数の拡大率で拡大するステップと;
    前記入力動画像の処理対象の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索するステップと;
    前記出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第4時空間ボックスに加算するステップと; を具備する動画像の高解像度化方法。
  3. 一つの訓練動画像をフレーム毎に縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの訓練動画像を縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することにより複数の訓練動画像を生成するステップをさらに具備し、該複数の訓練動画像は前記縮小するステップに渡される請求項1または2に記載の動画像の高解像度化方法。
  4. 一つの第1時空間ボックスの各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすか、あるいは当該一つの第1時空間ボックスを縦方向、横方向及び時間方向の少なくとも一方の方向に縮小することによって複数の第1時空間ボックスを生成するステップをさらに具備し、該複数の第1時空間ボックスは前記第1特徴ベクトルを算出するステップに渡される請求項1または2に記載の動画像の高解像度化方法。
  5. 一つの第3時空間ボックスの各時刻における断面の位置を縦方向及び横方向の少なくとも一方の方向にずらすことによって複数の第3時空間ボックスを生成するステップをさらに具備し、該複数の第3時空間ボックスは前記検索するステップに渡される請求項1または2に記載の動画像の高解像度化方法。
  6. 前記加算するステップは、前記第4時空間ブロック同士に重なりがある場合に、該重なり部分に対しては当該重なり部分に対応する複数の第2時空間ボックスの平均値あるいは当該複数の第2時空間ボックスのうち最後に加算される第2時空間ボックスの値を加算する請求項1または2に記載の動画像の高解像度化方法。
  7. 前記加算するステップは、被写体の動きが相対的に大きい部分を除いて前記加算を行う請求項1または2に記載の動画像の高解像度化方法。
  8. 前記入力動画像を前記訓練動画像として用いる請求項1に記載の動画像の高解像度化方法。
  9. 入力動画像を空間方向に高解像度化した出力動画像を生成する動画像の高解像度化装置において、
    縮小動画像を生成するために訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小する縮小部と;
    高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出する抽出部と;
    前記縮小動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第1時空間ボックスの特徴量を要素に含む第1特徴ベクトルと、前記第1時空間ボックスと同一位置の前記高周波成分動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第2時空間ボックスとの複数の対をルックアップテーブルに記憶する記憶部と;
    仮拡大動画像を生成するために前記入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大する拡大部と;
    前記入力動画像の処理対象の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索する検索部と;
    前記出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の時間方向に複数フレーム、縦方向及び横方向にそれぞれ複数画素の画素集合である第4時空間ボックスに加算する加算部; とを具備する動画像の高解像度化装置。
  10. 入力動画像を空間方向に高解像度化した出力動画像を生成する動画像の高解像度化処理をコンピュータに行わせるプログラムにおいて、
    縮小動画像を生成するために少なくとも一つの訓練動画像を縦方向及び横方向の少なくとも一方に特定の縮小率で縮小する処理と;
    高周波成分動画像を生成するために前記訓練動画像から高周波成分を抽出する処理と;
    前記縮小動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である一つ以上の第1時空間ボックスの特徴量を要素に含む一つ以上の第1特徴ベクトルを算出する処理と;
    前記第1特徴ベクトルと前記第1時空間ボックスと同一位置の前記高周波成分動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第2時空間ボックスとの複数の対をルックアップテーブルに記憶する処理と;
    仮拡大動画像を生成するために前記入力動画像を縦方向及び横方向の少なくとも一方に前記縮小率の逆数の拡大率で拡大する処理と;
    前記入力動画像の処理対象の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第3時空間ボックスの特徴量を要素に含む第2特徴ベクトルに類似した第1特徴ベクトルを前記ルックアップテーブルから検索する処理と;
    前記出力動画像を生成するために、前記検索された第1特徴ベクトルと対をなす前記ルックアップテーブル中の第2時空間ボックスを前記第3時空間ボックスと同一位置の前記仮拡大動画像中の時間方向に複数フレーム、縦方向及び横方向の少なくとも一方に複数画素の画素集合である第4時空間ボックスに加算する処理と; を含む動画像の高解像度化処理をコンピュータに行わせるプログラム。
JP2006108941A 2006-04-11 2006-04-11 動画像の高解像度化方法及び装置 Expired - Fee Related JP4157567B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006108941A JP4157567B2 (ja) 2006-04-11 2006-04-11 動画像の高解像度化方法及び装置
US11/677,719 US7965339B2 (en) 2006-04-11 2007-02-22 Resolution enhancing method and apparatus of video

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006108941A JP4157567B2 (ja) 2006-04-11 2006-04-11 動画像の高解像度化方法及び装置

Publications (2)

Publication Number Publication Date
JP2007280283A JP2007280283A (ja) 2007-10-25
JP4157567B2 true JP4157567B2 (ja) 2008-10-01

Family

ID=38575338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006108941A Expired - Fee Related JP4157567B2 (ja) 2006-04-11 2006-04-11 動画像の高解像度化方法及び装置

Country Status (2)

Country Link
US (1) US7965339B2 (ja)
JP (1) JP4157567B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4886583B2 (ja) * 2007-04-26 2012-02-29 株式会社東芝 画像拡大装置および方法
JP4461165B2 (ja) * 2007-09-26 2010-05-12 株式会社東芝 画像処理装置、方法およびプログラム
JP5238220B2 (ja) * 2007-10-29 2013-07-17 株式会社東芝 解像度変換装置、方法およびプログラム
JP2009212969A (ja) * 2008-03-05 2009-09-17 Toshiba Corp 画像処理装置、画像処理方法、及び画像処理プログラム
JP5366855B2 (ja) * 2010-02-16 2013-12-11 富士フイルム株式会社 画像処理方法及び装置並びにプログラム
WO2012153727A1 (ja) * 2011-05-11 2012-11-15 アイキューブド研究所株式会社 画像処理装置、画像処理方法、およびプログラムを記録した記録媒体
JP6102061B2 (ja) * 2012-02-28 2017-03-29 株式会社ニコン 画像処理装置
US9576192B2 (en) * 2014-03-12 2017-02-21 Yamaha Corporation Method and apparatus for notifying motion
CN111931678B (zh) * 2020-08-21 2021-09-07 腾讯科技(深圳)有限公司 一种视频信息处理方法、装置、电子设备及存储介质
CN113656623B (zh) * 2021-08-17 2024-09-27 安徽大学 基于时序移位和多分支时空增强网络的成趟足迹图像检索方法
CN118351039A (zh) * 2023-01-12 2024-07-16 京东方科技集团股份有限公司 一种视频质量增强方法、模型训练方法及设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055335A (en) 1994-09-14 2000-04-25 Kabushiki Kaisha Toshiba Method and apparatus for image representation and/or reorientation
US6380934B1 (en) * 1998-11-30 2002-04-30 Mitsubishi Electric Research Laboratories, Inc. Estimating targets using statistical properties of observations of known targets
US6766067B2 (en) 2001-04-20 2004-07-20 Mitsubishi Electric Research Laboratories, Inc. One-pass super-resolution images
WO2005067294A1 (ja) 2004-01-09 2005-07-21 Matsushita Electric Industrial Co., Ltd. 画像処理方法、画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
US20070237416A1 (en) 2007-10-11
US7965339B2 (en) 2011-06-21
JP2007280283A (ja) 2007-10-25

Similar Documents

Publication Publication Date Title
JP4157567B2 (ja) 動画像の高解像度化方法及び装置
JP4157568B2 (ja) 画像の高解像度化方法及び装置
Sun et al. Learned image downscaling for upscaling using content adaptive resampler
Rukundo et al. Nearest neighbor value interpolation
CN109819321B (zh) 一种视频超分辨率增强方法
WO2011111819A1 (ja) 画像処理装置、画像処理プログラム、および、画像を生成する方法
US8275218B2 (en) Forward and backward image resizing method
US8649558B2 (en) Video processing with region-based warping
JP2009194896A (ja) 画像処理装置及び方法並びに撮像装置
KR20110065997A (ko) 영상처리장치 및 영상처리방법
CN111402139A (zh) 图像处理方法、装置、电子设备和计算机可读存储介质
WO2013020860A1 (en) Image mosaicing
CN102291531A (zh) 图像处理装置、图像处理方法和程序
CN114339030B (zh) 一种基于自适应可分离卷积的网络直播视频稳像方法
KR101987079B1 (ko) 머신러닝 기반의 동적 파라미터에 의한 업스케일된 동영상의 노이즈 제거방법
JP2014077993A (ja) 表示装置
JP5640071B2 (ja) 画像拡大装置、画像拡大プログラム、画像拡大プログラムを記憶した記憶媒体、及び表示装置
CN112488922A (zh) 一种基于光流插值的超分辨率处理方法
WO2021179954A1 (zh) 视频处理方法、装置、设备及存储介质
CN112801876B (zh) 信息处理方法、装置及电子设备和存储介质
JP5203824B2 (ja) 画像処理装置及び撮像システム
CN117768774A (zh) 图像处理器、图像处理方法、拍摄装置和电子设备
Park et al. Dual-stage Super-resolution for edge devices
Sanada et al. FPGA implementation of single-image super-resolution based on frame-Bufferless box filtering
WO2016035568A1 (ja) 信号処理装置および信号処理方法、固体撮像素子、撮像装置、電子機器、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080711

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees