[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2010512607A - デジタルコラージュのための画像処理システム - Google Patents

デジタルコラージュのための画像処理システム Download PDF

Info

Publication number
JP2010512607A
JP2010512607A JP2009541570A JP2009541570A JP2010512607A JP 2010512607 A JP2010512607 A JP 2010512607A JP 2009541570 A JP2009541570 A JP 2009541570A JP 2009541570 A JP2009541570 A JP 2009541570A JP 2010512607 A JP2010512607 A JP 2010512607A
Authority
JP
Japan
Prior art keywords
image
module
image processing
calculation
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009541570A
Other languages
English (en)
Other versions
JP2010512607A5 (ja
Inventor
テイラー スチュアート
ローター カールステン
エイチ.デ ボーア ウィリアム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2010512607A publication Critical patent/JP2010512607A/ja
Publication of JP2010512607A5 publication Critical patent/JP2010512607A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

複数の入力画像から、視覚的に魅力的なコラージュを形成する自動化プロセス向けのフレームワークを提供することが必要とされている。柔軟かつ堅固でありながら、しかも関連するソフトウェアアプリケーションと容易に接続することができるこの種の自動化プロセス向けのフレームワークを提供することが必要とされている。画像合成フレームワークは、第1のモジュール、複数の事前計算モジュール、および画像合成モジュールを有するモジュラーアーキテクチャが備えられている。第1のモジュールはアプリケーションプログラミングインターフェイスを提供し、事前計算モジュールは入力画像に関する情報を計算し、画像合成モジュールは計算された情報を入力画像と共に使用してデジタルコラージュを形成する。

Description

この説明は一般に、デジタルタペストリおよびフォトモンタージュとしても知られるデジタルコラージュを複数のデジタル画像から作成するための画像処理に関する。
複数の入力画像から、視覚的に魅力的なコラージュを形成する自動化プロセス向けのフレームワークを提供することが必要とされている。そのようなコラージュを形成することは、特に、入力画像の数が増大し、視聴者にとって魅力的な視覚画像サマリの一種としての役割を果たすコラージュを生成することが求められる場合に、困難な問題である。加えて、柔軟かつ堅固でありながら、しかも関連するソフトウェアアプリケーションと容易に接続することができるこの種の自動化プロセス向けのフレームワークを提供することは困難である。
画像タペストリまたは画像コラージュを生成する手動の方法は、知られている。たとえば、消費者の写真のコレクションを手動で区分化して結合することによって生成する方法がある。これらの写真は、商用画像編集ソフトウェアを使用することなどによって、手動でトリミングされて結合され、手動で生成されたタペストリを形成することができる。しかし、これには多大な時間を要し、ユーザ側には膨大なスキルと知識が求められる。
従来の自動化の手法は、すでに広く互換性のある画像を、継ぎ目に沿ってほぼ整合させることによって、組み合わせることに依存していた。次に必要となるのは、継ぎ目を目立たなくするために、継ぎ目を調整することだけである。しかし、すでに広く互換性があるわけではない画像を使用することが求められている。
米国特許出願第11/552,312号明細書
Itti, L. Koch, C., and Niebur, E. 1998, "A model of saliency based visual attention for rapid scene analysis. IEEE Trans. on Pattern Analysis and Machine Intelligence 20, 11 Crow, F. 1984 "Summoned area tables for texture mapping", in Proc. ACM Siggraph, ACM, 207-212 Waltz, D, 1975 "Understanding line drawings of scenes with shadows", in the Psychology of Vision, W.P.H., Ed McGraw-Hill, New York Marriott, K and Stuckey, P, 1998, "Programming with Constraints", The MIT Press Boykov, Y Veksler, O and Zabih, R, 2001 "Fast approximate energy minimization via graph cuts", IEEE Trans on Pattern Analysis and Machine Intelligence 23, 11 Perez, P., Gagnet, M., and Blake, A. 2003 "Poisson image editing." ACM Trans. Graph. 22, 3, 313-318 Agarwala, A. et. al. 2004 "Interactive digital photomontage". ACM Trans. Graph. 23, 3, 294-302
以下の説明は、読者に基本的な理解をもたらすために、本開示の概要を簡略化して示すものである。この要約は、本開示の広範にわたる概要ではなく、本発明の主要/重要要素を識別するものでもなく、また本発明の範囲を規定するものではない。この要約の唯一の目的は、本明細書に開示される一部の概念を、これ以降提示されるさらに詳細な説明への導入として、簡略化した形式で提示することである。
複数の入力画像から、視覚的に魅力的なコラージュを形成する自動化プロセス向けのフレームワークを提供することが必要とされている。柔軟かつ堅固でありながら、しかも関連するソフトウェアアプリケーションと容易に接続することができるこの種の自動化プロセス向けのフレームワークを提供することが必要とされている。画像合成フレームワークは、第1のモジュール、複数の事前計算モジュール、および画像合成モジュールを有するモジュラーアーキテクチャが備えられている。第1のモジュールはアプリケーションプログラミングインターフェイスを提供し、事前計算モジュールは入力画像に関する情報を計算し、画像合成モジュールは計算された情報を入力画像と共に使用してデジタルコラージュを形成する。
付随する特徴の多くは、添付の図面と併せて検討される以下の詳細な説明を参照することによって、理解もより深まり、さらに容易に認識されるであろう。
本発明の説明は、付属の図面を踏まえて以下の詳細な説明を読めば、さらに深く理解されよう。
ソフトウェアアプリケーションに接続された画像合成フレームワークを示す概略図である。 画像合成フレームワークを使用してデジタルコラージュを形成する方法を示す流れ図である。 図3Aは入力画像を示す概略図である。図3Bは関心領域が表示された図3Aの入力画像を示す概略図である。図3Cは図3Aの入力画像から得られた事前行列を示す概略図である。 画像合成フレームワークを使用する方法を示す流れ図である。 画像合成フレームワークを初期化して、そのフレームワークを構成し、正規化方法を指定する方法を示す流れ図である。 画像合成フレームワークを使用して入力画像をランク付けする方法を示す流れ図である。 画像合成フレームワークを使用して事前計算および画像合成を実行する方法を示す流れ図である。 画像合成フレームワークを示す状態遷移図である。 画像合成フレームワークを提供し、デジタルコラージュを形成できるようにする装置を示す概略図である。 コラージュの作成に使用するエネルギー関数を作成する方法を示す流れ図である。 最適化プロセスを示す流れ図である。
添付の図において、類似した参照番号は類似する部分を示すために使用される。
付属の図面に関連して以下に示される詳細な説明は、本発明の実施例を説明することを意図したものであり、本発明の実施例が構成されるかまたは使用されうる唯一の形態を表すことを意図したものではない。説明は、実施例の機能、および実施例を構成して操作するためのステップの順序を示す。しかし、同一または同等の機能および順序は、さまざまな実施例によって達成されうる。
本発明の実施例は、本明細書においてデジタル写真からコラージュを生成するシステムにおいて実施されることが説明され表されているが、説明されるシステムは、限定的ではなく例示的なものとして提供される。当業者であれば理解されるように、本発明の実施例は、ビデオからのスチル写真、医療用画像、UV画像、IR画像、または任意の他の適切な種類の画像など、任意の種類のデジタル画像を使用する、多種多様な種類の選択および/またはラベル付けのシステムにおける用途に適している。
図1は、画像合成フレームワーク108の概略図である。フレームワーク108は、ソフトウェアフレームワークとして、または任意の他の適切な形式で提供され、複数のモジュールを備える。フレームワーク108は、任意の適切な形式で入力画像100を受信し、入力画像100の全部または一部からデジタルコラージュ画像104を生成する。入力画像および出力デジタルコラージュ画像は、JPEG、BMP、GIF、およびPNGを含む任意の適切な形式であってもよいが、これらに限定されることはない。入力画像は、アルファチャネルが存在し、たとえばモノクロームから32ビットまでの任意の画像の色の深みであってもよいアルファ情報を備えることができる。出力デジタルコラージュ画像のサイズは、任意の幅および高さになるように制御することができる。
たとえば、複数の入力画像100は、休日のようなイベントの約50枚の写真の個人データセットであるコレクションであってもよい。写真は、サイズがさまざま異なっていることもあり、また結合するために継ぎ目に沿ってすでにほぼ整合されているわけではないという点で相互に異なっている場合もある。たとえば、写真の一部には、夜間に撮られたものもあり、また昼間に撮られたものもある。その他、景色の写真の場合もあれば、人々の肖像写真の場合もある。コラージュを形成することにより、入力画像の一部または全部の部分の混合物である単一の画像が生成される。したがって、コラージュは、たとえば家族の休日の画像をまとめるための、入力画像の一種の視覚的なサマリとしての役割を果たす。複数の入力画像が、すべて特定のイベントなどによって相互に関連している必要はない。
コラージュは、たとえば、画像コレクションの「サムネイル」として、入力画像のコレクションのことをユーザに連想させることができる。場合によっては、コラージュは、画像検索システムとしての役割を果たすことができる。たとえば、ユーザは、コラージュの1つまたは複数の部分を選択することができ、コラージュシステムは、類似した画像特性を有する1つまたは複数の画像を検索することができ、選択された領域に示された画像を提供する入力画像を検索することなどができる。
画像合成フレームワーク108は、パブリックであってもよく、1つまたは複数のソフトウェアアプリケーション105に接続できるように配置されるアプリケーションプログラミングインターフェイス(API)106を有する第1のモジュール101を備える。第1のモジュール101は、API 106と統合されていることを示す点線で図1に示される。画像合成フレームワーク108はまた、1つまたは複数の事前計算モジュール102および画像合成モジュール103を備える。1つまたは複数の第1のモジュール101,事前計算モジュール102、および画像合成モジュール103は、ダイナミックリンクライブラリとして提供されてもよい。これらのモジュールは、任意の適切なフォーマットで提供することができる。事前計算モジュール102および画像合成モジュール103は各々、統合パブリックAPI 106を備える第1のモジュール101へのプライベートインターフェイスを有する。したがって、事前計算モジュール102および画像合成モジュールは、統合パブリックAPI 106を備える第1のモジュール101を介して制御される。
したがって、画像合成フレームワーク108は、モジュール101、102、103の結果としてモジュラーアーキテクチャを備え、それにより処理モジュールのさまざまなインスタンスが実行時にロードされて構成されるようにすることができる。画像合成フレームワークは、1つまたは複数の画像100が入力として機能し、単一の合成された画像104が出力である、データ処理パイプラインを提供する。パイプラインの制御は、パブリックAPI 106への呼び出しを通じて達成される。
第1のモジュール101および統合API 106は、事前計算モジュール102および画像合成モジュール103のような、プラグインモジュールをロード、構成、および実行するための機能を提供する。第1のモジュール101はまた、入力画像100をロードおよびアンロードして、それらの関連データ構造を作成するための機能も提供する。このモジュールは、入力画像100をランク付けして、さらに1つまたは複数の入力画像の関心領域(RoI)を計算するように配置される。加えて、このモジュールは、出力画像104を保存する機能を提供する。
事前計算モジュール102は、顕在性および顔検出などの因子に基づいて入力画像100の事前情報を計算する機能を提供する。これは、以下でさらに詳細に説明される。
画像合成モジュール103は、入力画像および事前計算の結果からデジタルコラージュを形成する機能を提供する。これは、任意の適切な方法で達成される。
ソフトウェアアプリケーション105は、画像合成フレームワーク108によって実行されるプロセスを制御および/または表示するユーザインターフェイス107を提供することができる。このユーザインターフェイスおよびソフトウェアアプリケーション105は、任意の適切なプログラミング言語を使用して任意の適切な方法で提供され、パブリックAPI 106を使用して画像合成フレームワークに接続する。
ここで、画像合成フレームワーク108を経由するデータの流れの例は、図2を参照して説明される。情報の流れは、フレームワーク108に供給される画像100のコレクション(ボックス200)から始まる。各入力画像100は、たとえば、あらかじめ定められた寸法に適合して、入力画像100全体にわたり著しく変化することがないように縮小されることにより、正規化される(ボックス201)。たとえば、入力画像は、24ビットのビットマップ画像として表され、それが一時ファイルとしてディスクに格納される。しかし、これは必須ではなく、入力画像の任意の適切な表現フォーマットが使用されてもよい。正規化された入力画像は、任意の適切な方法でランク付けされる(ボックス202)。画像ランク付けの方法の例は、以下でさらに詳細に説明される。
入力画像を正規化することにより、必要とされる処理時間は、合成画像の生成の段階の一部または全部にわたり短縮される。たとえば、画像ランク付け、関心領域の計算、事前計算モジュール処理、および画像合成モジュール処理に必要な処理は、処理されるべきデータの量を減らすための画像正規化を使用することにより、軽減される。したがって、正規化中に入力画像の寸法を可能な限り減少させることは有益である。次いで、結果として得られた合成画像は、ユーザが指定した寸法まで拡大することができる。しかし、入力画像の正規化を提供することは必須ではない。
次いで、最初のn個の正規化画像のような、ランク付けされ正規化された画像のサブセットは、事前計算モジュールを使用するステップを備える次の段階に供給される(ボックス203)。次いで、画像合成フレームワークのこのインスタンス化において使用するために選択されたそれらの事前計算モジュールは、正規化された画像のサブセットに実行される(ボックス203)。各事前計算モジュールは、画像内の顔に関する情報または顕在性マップなど、画像からの指定された種類の情報を抽出する。この抽出された情報は、オプションで関連する正規化された画像と同じ寸法を有する行列として表すことができる。この行列表現のような汎用表現を使用することにより、事前計算モジュールおよび画像合成モジュールをプラグ可能にすることができる、つまり、容易に交換、除去、および/または元に戻すことができるようになる。
次いで、1つまたは複数の正規化された入力画像について関心領域が計算される(ボックス204)。この関心領域計算プロセスは、必要に応じて、画像合成モジュールによって内部的に呼び出すことができる。この関心領域計算プロセスは、1つまたは複数の事前計算モジュールの結果を使用することができる。
事前計算モジュールの結果および正規化された画像のサブセットは、デジタルコラージュを形成する画像合成モジュールに供給される(ボックス205)。次いで、そのデジタルコラージュは格納される(ボックス206)。画像合成モジュール103は、事前計算モジュールによって計算された行列表現および正規化された画像自体を入力として取る。たとえば、このモジュールは、事前計算モジュールに供給されたものと同じ正規化された画像で作業を進める。このモジュールはまた、それらの画像が正規化される前に1つまたは複数の入力画像を入力として取ることもできる。これらの元の入力画像は、合成された画像をユーザが指定した寸法まで拡大するときに使用することができる。このモジュールはまた、プラグ可能であることが好ましい。このモジュールは常に、複数の正規化された画像およびそれらの関連する事前行列(またはその他の事前計算モジュールの出力)を入力として予期する。このモジュールは、単一の画像を出力として生成する。たとえば、出力画像は、正規化された入力画像およびそれらの事前行列を処理し、事前行列のユーザ定義可能な重み付け組み合わせに応じて画像の部分を取り、それを出力画像内の特定の場所に配置することによって生成される。次いで、出力画像は事後処理され、オプションでユーザが指定した寸法まで拡大することができる。
図3Aは、正規化された入力画像300の概略図を示し、図3Bは、関心領域301が検出された状態のこの同じ正規化された入力画像を示す。この関心領域は、以下でさらに詳細に説明されるように、任意の適切な方法で検出される。図3Cは、図3Aの正規化された入力画像から得られた事前行列304の概略図である。事前行列が顔検出プロセスの結果を格納するために使用されると仮定する。この事前行列は入力画像と同じ寸法を有し(ただし、それは必須ではない)、関心領域302に対応する位置における行列内の値は、顔が検出される画像要素に関連するので、同じ指定された値(たとえば、1など)が与えられる。その他の位置303における行列内の値は、これとは異なる同一の指定された値(たとえば、0など)を与えられる。
各事前行列は、画像ブロックの2D配列を備え、画像ブロックは単一ピクセルまたは32×32ピクセルもしくは別のサイズのようなピクセルのグループである。事前計算モジュールは、そのような行列に入力画像に関する情報を取り込む。たとえば、画像内の顔を識別する事前計算モジュールは、顔が見い出される位置における行列内の高い潜在的値、および他の場所の低い値にマークを付けることができる。
1つの例において、事前計算モジュールは、潜在的行列を潜在的値のガウス分布で満たすように配置される。次いで、このモジュールは、その位置に従って画像内の情報に区別をつけて重み付けするために使用することができる。たとえば、画像内の最も重要な情報が中央に向かって含まれている場合、この事前計算モジュールは、それに応じて画像情報に重み付けすることができる。
もう1つの例において、事前計算モジュールは、潜在的行列を、入力画像の対応する領域から計算されたコントラスト値で満たすように配置される。
もう1つの例において、事前計算モジュールは、入力画像内の1つまたは複数の顔を識別して、潜在的行列内の対応する値にマークを付ける。
事前計算モジュールの各々の結果について同じ行列表現を使用することにより、事前計算モジュールのさまざまな組み合わせを交換および/または使用することが可能になる。加えて、各事前計算モジュールの結果に与えられた重みは、区別をつけて迅速かつ容易に調整することができる。たとえば、1つの実施形態において、図1のソフトウェアアプリケーション105は、チェックボックスおよびスライダのグラフィカル表示を提供するユーザインターフェイス107をもたらすように配置される。チェックボックスは、使用される事前計算モジュールの選択を可能にするように配置され、スライダは、画像合成プロセスにおいてそれらの選択された事前計算モジュールの結果に与えられる相対的重みを設定するように配置される。このようにして、ユーザ制御は、選択された事前計算モジュールおよび選択された相対的重みに応じてさまざまな結果を得るように与えられる。任意の適切なユーザインターフェイス項目は、チェックボックスおよびスライダの代わりに使用することができる。
1つの例において、画像合成フレームワークは、オブジェクト指向プログラミング言語を使用して提供されるが、これは必須ではない。ここで、オブジェクト指向プログラミング言語を使用して提供される画像合成フレームワークの例を使用する方法は、図4を参照して説明される。(入力画像100である)外部画像ファイルがロードされる。結果として得られた画像は、画像オブジェクトとして返される(ボックス400)。
各入力画像について、ルート画像オブジェクトが作成され(ボックス401)、初期化される。このプロセスの一環として、画像の正規化されたバージョンが生成され(ボックス402)、潜在的行列のベクトルが作成され(ボックス403)、初期化される(行列のベクトルのサイズは、使用される事前計算モジュールの数と等しくすることができる)。次いで、ルート画像オブジェクトが、任意の適切な方法でランク付けされる(ボックス401)。たとえば、それらは指定された品質(単項)および相違(2項)メトリクスに従ってランク付けされ、このランク付けに従って順序付けられる。次いで、最初のN個のランク付けされたルート画像オブジェクトは、事前計算モジュールの各々に渡される(ボックス405)。事前計算モジュールは、ルート画像オブジェクト内に格納されている正規化された画像に必要な計算を行う。結果として得られたデータは、潜在的行列オブジェクトに格納されるが、これもまたルート画像オブジェクト内に含むことができる(ボックス406)。次いで、ルート画像オブジェクトは、最終合成出力画像を生成する画像合成モジュールに渡される(ボックス407)。
前述のように、画像合成フレームワーク(ISF)はパブリックAPIを備える。言い換えれば、ISFは、画像合成プロセスを制御するためにソフトウェアアプリケーションまたはその他のエンティティによって使用されうるパブリックAPI関数のセットを公開する。ここで、このパブリックAPIに適切な関数の例が示される。これらは例示としてのみ示されるものであり、類似した関数のその他の組み合わせもまた使用することができる。
Figure 2010512607
Figure 2010512607
Figure 2010512607
Figure 2010512607
Figure 2010512607
Figure 2010512607
Figure 2010512607
図5は、ISFのインスタンス化を初期化および構成する方法を示す流れ図である。ISFの新規インスタンスは、ISFInitを呼び出すことによって初期化することができる(ボックス501)。成功すると、この関数は、ISFの現在のインスタンスにハンドルを返す(ボックス502)。次いで、このハンドルは、すべてのその他のISF API関数に第1のパラメータとして渡すことができる。ISFInitは、呼び出されるたびに一意のハンドルを返し、それによりISFの複数のインスタンスがインスタンス化されるようにすることができる。ISFのインスタンスが必要とされなくなったときに、ISFDeInitへの呼び出しを行うことができ、この関数が任意の割り振られているリソースを解放する。
ISFは、複数の方法で構成することができる(ボックス503)。構成は、どの事前計算および画像合成モジュールをロードするかをISFに指示するステップを備える。構成は、以下の方法のいずれかを個々に、または組み合わせて使用して達成することができる。
ISFLoadConfigFileを呼び出して、どのプラグインモジュールをロードするかを指定する構成ファイルをISFにロードさせる(ボックス504)
ISFLoadModuleFolderを呼び出すことにより、指定されたフォルダ内にあるすべてのモジュールをISFにロードさせる(ボックス505)
ISFLoadModuleの呼び出しを通じて個別にモジュールをISFにロードさせる(ボックス506)
この段階において、ISFGetPriorInfoのオプションの呼び出しを行うことができる(ボックス507)。これは、個々の事前計算モジュールを使用可能または使用不可にして、事前計算結果に与えられる重みを制御するために使用することができる構造体へのポインタのベクトルを返す。モジュール情報が確実に解放されるように、ISFGetPriorInfoの呼び出しは、ISFFreePriorInfoの呼び出しと適合させることができる。
使用される画像正規化の方法は、たとえばISFSetNormalizationInfoを使用して指定される(ボックス508)。
図6は、入力画像をロードして画像ランク付けを実行する方法を示す流れ図である。ISFが初期化され構成されると、ISFに指定された画像をロードさせるISFLoadImageの呼び出しを行うことができる(ボックス600)。この関数は、入力画像のセットがロードされるようにするため、複数回呼び出すことができる。画像は、ISFUnloadAllImagesまたはISFUnloadImageを呼び出して、すべての画像または特定の画像だけをアンロードすることにより、フレームワークがビジー処理中ではない間の任意の時点においてアンロードすることができる。
必要に応じて、コールバック機能をセットアップすることができる(ボックス601)。たとえば、ISFSetPriorStatusCallback、ISFSetRankingStatusCallback、およびISFSetSynthStatusCallbackの呼び出しを行うことができる。これは、ランク付け、事前計算、および画像合成処理の段階の間に呼び出されるコールバック機能をインストールする。コールバック機能は、処理操作に関する進行状態情報を受信し、たとえばユーザに進行状態情報を表示するために使用することができる。進行状態情報は、任意の適切な種類のものである。たとえば、進行状態情報は、0から100までの数字を備え、100は特定の段階が処理を終了したことを知らせる働きをする。
画像ランク付けは、次に、たとえば、ISFRunImageRankingの呼び出しを行うことによって実行される(ボックス602)。結果には、ISFGetRankingResultsを呼び出すことによってクエリを行うことができ(603)、その後のISFFreeRankingResultsの呼び出しは、結果が必要とされなくなったときに行うことができる。ユーザは、ISFMoveImageToRankを呼び出すことによって指定されたランクに画像を移動することができる(ボックス604)。ランク付けプロセスは、図6に示されるように、オプションで一時停止および再開することができる。
図7は、事前計算モジュールを実行して画像を合成する方法を示す流れ図である。ロードされた事前計算モジュールは、たとえば、ISFRunPriorComputesの呼び出しを行うことにより実行され(ボックス700)、このプロセスは一時停止(ボックス702)および再開(ボックス701)することができる。入力画像のいずれかの事前結果は、ISFGetPriorResultsの呼び出しを通じて取得することができる(ボックス703)。これらの結果が必要とされなくなったときに、ISFFreePriorResultsの呼び出しを行うことができる。事前計算結果が取得されると、画像合成モジュールは、たとえば、ISFRunSynthImageの呼び出しを行うことによって実行することができる(ボックス704)。合成プロセスは、一時停止(ボックス706)および再開(ボックス705)することができる。合成された画像は、たとえばISFSaveSynthImageを呼び出すことによって保存することができる(ボックス707)。画像は、ISFGetSynthImageの呼び出しを介してBITMAPINFOHEADERおよび画像データへのポインタとしてメモリ内に返すことができる。
ISFの各インスタンスは、一部の例において、内部状態変数を保持する。現在の状態に応じて、一部のAPI関数はエラーコードを返すことができる。これは、現在の状態が、行われている特定の関数呼び出しを禁止することを指示する。たとえば、入力画像のロードが行われる前にすべてのモジュールが確実にロードされることが要求される。ISFGetStateの呼び出しは、現在の状態を決定するためにいかなる時点においても行うことができる。
図8は、1つの実施形態におけるISFのさまざまな状態を示す例示の状態遷移図である。これらの状態の異なるものは、さまざまな組み合わせで使用することができ、状態は異なる順序で使用することができる。また、すべての割り振られているリソースのクリーンアップを強制して、状態を強制的にISF_UNINITIALIZEDに戻すために、ほとんどの状態からISFDeInitを呼び出すことが可能である。任意の許容状態におけるISFLoadImageの呼び出しは、その状態をISF_LOADIMAGEにリセットするように手配される。この状況において、新しい画像はまだ、ランク、関心領域、または事前計算モジュール結果など、計算されたデータをまだ何も有してはいない。状態をISF_LOADIMAGEにリセットすることで、そのようなデータが計算されるようになる。また、一部の実施形態において、事前計算モジュールの結果はキャッシュに入れられて、可能であれば処理時間を短縮するために再使用される。
ISFがまだ初期化されていない状態から開始し(ボックス800)、ISFは初期化され(ボックス801)、次いで事前計算モジュールおよび画像合成モジュールがロードされた状態に移行することができる(ボックス802)。次の状態は、入力画像がロードされたときに生じ(ボックス803)、これに続いて状態は、ランク付けプロセスが実行し(ボックス804)、次いで完了する(ボックス806)ものであってもよい。ランク付けプロセスは、一時停止状態(ボックス805)にすることができる。事前計算モジュールが実行しているとき、状態はボックス807に示され、このプロセスは一時停止することができる(ボックス808)。事前計算モジュールが完了すると、状態はボックス809に示される。次に、画像合成プロセスが生じ(ボックス810)、次いで完了する(ボックス812)。画像合成プロセスもまた、一時停止することができる(ボックス811)。
図9は、ISF904を提供する装置900の概略図である。装置は、入力画像を受信するように配置された画像入力903を有する。この入力は、ネットワーク接続、USB接続、ディスクドライブ、ユーザインターフェイス、またはその他の入力など、任意の適切な種類のものである。装置は、コンピュータ、または任意の他の適切な種類のプロセッサとして提供されうるプロセッサ905を備える。オペレーティングシステム906は、プロセッサおよび装置900を制御するために提供され、メモリ907が存在する。画像合成フレームワーク904は、ソフトウェアとして、または任意の他の適切な形態で提供され、オペレーティングシステム906を使用して任意の適切な種類のソフトウェアアプリケーション902の制御の下にプロセッサ905で実行することができる。ソフトウェアアプリケーション902はオプションで、グラフィカルユーザインターフェイスまたはその他の種類のユーザインターフェイスなどの、ユーザインターフェイス901に接続する。
一部の実施形態において、事前計算モジュールおよび画像合成モジュールへのロードおよび接続を簡略化するため、ラッパークラスが使用される。たとえば、これらのクラスは、たとえば、dllモジュールのロードおよびアンロードをサポートし、エクスポートされたdll機能のプロシージャアドレスの取得を全体的にサポートするCPlugInWrapperクラスと呼ばれるカスタムラッパークラスから派生することができる。1つの例において、さらに派生したクラスCPriorComputeWrapperおよびCImageSynthWrapperは、エクスポートされたdll機能にアクセスするために特定のメンバ関数を提供する。ラッパークラスは、画像合成フレームワーク、画像合成モジュール、および事前計算モジュールのクライアント側呼び出しのいずれかを囲むようにオブジェクト指向のラッパーを提供する。
たとえば、ISFの各インスタンスは、複数のCPriorComputeWrapperオブジェクト(ロードされている事前計算モジュールごとに1つ)、および単一のCImageSynthWrapperオブジェクトのベクトルを保持する。ISFの各インスタンスはまた、ISFLoadImageまたはISFLoadImageFolderが呼び出されるときに作成されるルート画像オブジェクトのベクトルを保持することもできる。1つの例において、ルート画像オブジェクトは、呼び出されたCRootImageオブジェクトであり、これはルート画像オブジェクトのオブジェクト指向c++実施である。
事前計算モジュールは各々、ISFへの共通プライベートAPIインターフェイスを実施する。たとえば、事前計算モジュールの基礎をなすコードは、CPCMainクラス内に含まれる。各事前計算モジュールは、CPCMainオブジェクトのベクトルを保持する。それにより、ISFの異なるインスタンスが、事前計算モジュールの異なる一意のインスタンスを使用することができるようになる。このようにして、各事前計算モジュールによって保持される状態情報は、各インスタンスに一意である事前情報構造体に格納することができる。さまざまな事前計算モジュールの各々は、関連するGUID値を有する。PCCompute関数は、このGUID値をルート画像オブジェクトに格納することができる。それにより、画像合成モジュールは、どの事前計算モジュールによってどの潜在的行列が作成されたかを後に判別することができるようになる。
1つの例において、事前計算モジュールのプライベートAPIによって提供される関数は、以下のものを備える。
PCInit−事前計算モジュールの新規インスタンスを初期化してハンドルを返す初期化関数
PCDeInit−事前計算モジュールを消去し、クリーンアップして、任意の割り振られているリソースを解放する
PCGetPriorInfo−現在のモジュール情報を取得するために使用される
PCFreePriorInfo−PCGetPriorInfo関数によって返された情報を解放するために使用される
PCSetPriorInfo−モジュール情報を設定するために使用される。たとえば、これはモジュールの使用可能化/使用不可化および加重係数の設定を含む
PCCompute−これは事前計算プロセスを実行し、結果をCRootImageオブジェクトに保存する
画像合成モジュールは、ISFへの共通プライベートAPIインターフェイスを実施する。たとえば、これは以下の関数を備える。
ISInit−新規画像合成モジュールのインスタンスを初期化する
ISDeInit−画像合成モジュールを消去する
ISGetSynthInfo−現在のモジュール情報を取得する
ISFreeSynthInfo−ISGetSynthInfo関数によって返された情報を解放する
ISSetSynthInfo−指定された情報を設定する
ISSetStatusCallback−コールバック機能を設定する
ISPause−現在の処理操作を一時停止する
ISResume−ISPauseの呼び出しの後、現在の処理操作を再開する
ISStop−現在の処理操作を終了する
lSSaveSynthImage−合成された画像を指定したファイルに保存する
ISGetSynthImage−合成された画像のコピーを検索する
ISFreeSynthImage−ISGetSynthImageによって返された画像データを解放する
lSSynth−合成プロセスを実行する
ISSetISFStateCallback−ISFコールバック機能を設定するために使用される
特定の例において、関心領域の計算、画像ランク付け、事前計算モジュールの一部、および画像合成プロセスは、2006年10月24日に出願された我々の以前の特許文献1において説明されている。ここで、さらにその詳細について説明される。自動的にコラージュを形成するプロセスは、ラベル付けの問題として特徴付けられる。コラージュのラベルは、それらのコラージュ領域を形成するために入力画像のどの領域が使用されるかを指定する。各々さまざまな潜在的コラージュに対応する可能なラベル付けには膨大な数がある。我々のタスクは、結果として得られるコラージュが、入力画像の楽しく参考になる良質なサマリとなるように、指定する基準に関して最適なラベル付けを見いだすことである。使用されうるラベル付けシステムの例についてのさらなる詳細は、以下に示される。
エネルギー関数は、システムが良質なコラージュを生成するために指定されたさまざまな基準を考慮することができるように、調整または設計されるさまざまな条件を含むラベル付けのエネルギーに対して作成される。エネルギー関数についてのさらなる詳細は、以下に示される。エネルギー関数は、エネルギー関数作成の一環として指定されるさまざまなパラメータまたは重みを有する。パラメータまたは重みは、さまざまな基準が考慮される度合いに影響を及ぼす。オプションで、入力画像のオブジェクト認識結果は1つまたは複数の事前計算モジュールから取得され、この情報は、エネルギー関数自体においてパラメータの一部として、またはオプションの制約指定プロセス中に使用される。エネルギー関数への1つまたは複数の制約が指定されるが、制約はたとえば、計算の複雑さを軽減することができるか、またはより優れたコラージュが生成されるように動作することができる。制約の例についてのさらなる詳細は、以下に示される。
最適化プロセスは、任意の指定されている制約を考慮して、エネルギー関数に対して実行される。任意の適切な最適化プロセスを使用することができ、例が以下に示される。最適化プロセスは、可能なラベル付けであるエネルギー関数の最大または最小(あるいは極大または極小)を見いだす。可能なラベル付けは各々、コラージュに対応する。1つまたは複数のこれらのコラージュは、格納されるかまたは表示される。
ラベル付け
ここで、問題を指定するプロセスについてのさらなる詳細が示される。AutoCollageへの入力は、入力画像の集合I={In,...,IN}である。入力を標準化するため、各画像Inが個々の画像の縦横比を保持しながら単位面積を有するよう拡大縮小されるように、前処理ステップが適用されたものと想定される。前述のように、コラージュの作成は、ラベル付けの問題と見なされ、以下の表記を使用して説明される。コラージュ自体は、領域Pにわたって定義される画像Iであり、コラージュの各ピクセル−位置p∈Pは、アルゴリズムによってラベルL(p)を割り当てられるものとする。ラベル付けL={L(p),p∈P}は、以下のようにコラージュを完全に指定する。個々のラベルは形式L(p)=(n,s)を有し、ここでIn∈Iはコラージュピクセルpの取り出される入力画像であり、s∈Sはコラージュに関して入力画像nのピクセル単位の2Dシフトであり、I(p)=In(p−s)となる。これは、簡潔にI(p)=S(p,L(p))と表記されるが、ここでS(...)はS(p,(n,s))=In(p−s)によって定義され、S(...)∈[0,1]x[0,1]x[0,1]と正規化される。
方法は、可能なラベル付けの空間Lにおいて、最善のラベル付けL∈Lを見い出そうと努める。これは、エネルギーまたはコストE(L)を最小化するラベル付けLを見い出すこととして表現され、以下に詳細に定義される。許容されるラベル付けの空間を効率的に検索して、低エネルギーのラベル付けを取得する最適化手順が定義されるが、ここでアルゴリズムが近似であるので、エネルギーは必ずしも大域最小である必要はない。すべての入力画像が事前に調整された他者による以前の作業において、比較すると、各ピクセルラベルは、シフト変数sを伴うことなく、画像索引のみで構成されていたことに留意されたい。本発明の場合、各ピクセルにおける画像索引n=1,...,Nだけではなく、許容されるシフトsにわたっても検索する必要があるので、最適化の問題はさらに複雑である。
コラージュのエネルギー
ここで、ラベル付けLのエネルギー関数を作成するプロセスは、図10を参照してさらに詳細に説明される。これは、各々が最善のラベル付け(またはコラージュ)を生成するために必要とされる基準または特性を指定するように設計または調整される1つまたは複数のエネルギー項を合計することを備える。
特定の例において、エネルギー関数は、以下に示されるように4つの項を備える。しかし、これは必須ではない。さらに、これらの項のうちのいずれか1つまたは複数を使用するか、または必要に応じて他のエネルギー項を使用することも可能である。
ラベル付けLのエネルギーは、以下に示すように4つの項を備える。
E(L)=Erep(L)+wimpimp(L)+wtranstrans(L)+wobjobj(L) (1)
第1の項Erepは、第1に選択される画像がテクスチャ的に「興味深い」こと、および第2にそれらが相互に異なっていること、という2つの意味において最も典型的である入力画像セットから画像を選択する傾向がある。たとえば、これは、近接する複製が選択されないという効果を及ぼすことができる。Eimpの項は、相当量の興味深い関心領域(ROI)がI内の各画像から確実に選択されるようにする。次に、Etransは、視覚的に魅力的ではない画像間の任意の移行にペナルティを課すペアワイズの項である。最後に、Eobjは、オブジェクト認識に関する情報を取り込み、(我々の実施形態における、全体が保持される顔、最上部の空)妥当な構成におけるオブジェクトの配置に有利にはたらく。以下で、これらのエネルギー項の各々が、保持されるべき制約と共に詳細に定義される。
ここで、エネルギー項Erepの例が示される。
第1の可能なエネルギー項は、使用可能にされた入力画像のコレクションから1つまたは複数の入力画像を選択するように機能する(ボックス3000、図10)。たとえば入力画像のうち最も興味深いものだけが選択され、たとえば空白またはわずかな詳細しか含まないものは選択されない。加えて、目立つ画像がオプションで選択される。
たとえば、使用可能な入力画像のセットから最も典型的で目立つ画像を選択するように機能するエネルギー項が提供される(図10の3000)。たとえば、すべての使用可能な入力画像から、最もテクスチャ的に参考となる入力画像が選択される。画像は、画像内の情報量の測度に基づいて選択することができる。オプションで選択は、画像が、顔、人物、建物、自動車、またはオブジェクト認識システムによって提供される情報を使用するその他の指定されたオブジェクトのクラスなど、特定のオブジェクトのクラスの画像を含むかどうかについての情報に基づくことができる。
非常に似通っている画像を拒否するために、システムは、色ヒストグラム、相関標識、または任意のその他の適切な測度など、画像の類似性の任意の適切な標識を使用することができる。このようにして、コラージュ内の素材の重複を減少させる。
特定の例において、選択された画像の集合Iに関連付けられているコストは、Erep=Σnrep(n)の形であり、ここで
Figure 2010512607
およびanは補助の標識変数であり、コラージュに画像Inが存在する場合1をとり、それ以外の場合は0をとり、
Figure 2010512607
単項Dr(n)は、画像n内の情報の測度である。情報の測度は以下の式によって定義され、
r(n)+Entropy(In)+wfaceδ({画像nが顔を含む}) (3)
ここで、述部πが真である場合δ(π)=1であり、wfaceは、画像内の一般テクスチャ情報に相関して、顔を含む画像の影響を重み付けする。所定の画像のエントロピーを計算するために使用されるヒストグラムは、L,a,b表色系から二次元a,b空間に構築され、16×16ビンに離散化される。
(2)における第2の項は、画像間のペアワイズの距離a,bに関して表され、集合I内の各画像からその最近傍までの距離を合計する。使用している距離測度Vr∈[0,1]として、正規化カイ二乗距離が1組の画像の色ヒストグラム間で使用されてもよい。ヒストグラムは、上記のように、a,b空間内で構築される。最も典型的な画像に有利にはたらくことに加えて、このエネルギーは、可能な限り多くの画像の使用を促進する。
相当量の興味深い関心領域がI内の各画像から確実に選択されるように機能するもう1つの可能なエネルギー項を提供することができる(ボックス3100)。たとえば、このエネルギー項は、入力画像のピクセルの周囲の指定された領域の局所エントロピー測度を考慮する。この局所エントロピー測度は、画像領域の顕在性の可能な標識の例である。その他の顕在性標識が、その代わりに使用されてもよい(たとえば、非特許文献1の顕在性モデルを参照)。オプションで、このエネルギー項は、入力画像の中心が関心領域に対して有利になるように重み付けされる。しかし、これは必須ではない。このエネルギー項を使用することにより、微少な視覚的に無意味な画像フラグメントがコラージュ内に発生する尤度を減少させることが可能である。
重要コストエネルギー項とも呼ばれる、この「関心領域」エネルギー項は、ここで特定の例について詳細に説明される。重要コストは以下の形の単項で構成される。
Figure 2010512607
関数Eimp(p,L(p))=G(p,L(p))T(p,L(p))、ここでT(p,L(p))はピクセルp周囲の(32×32ピクセル)領域のab座標における局所エントロピーを測定し、局所エントロピーの合計が所定の入力画像にわたり1になるように正規化される。ガウス重み関数G(...)は、pが描かれる入力画像の中心に有利にはたらく。
もう1つの可能なエネルギー項は、2つの入力画像の間の境界にわたる不一致の測度に基づいて画像間の移行にペナルティを課す(ボックス3200)。たとえば、このエネルギー項はまた、いずれかの入力画像の高コントラスト境界で移行を促進するように調整される。特定の例において、そのようなエネルギー項は、移行コストとも呼ばれ、以下で詳細に説明される。
例示の移行コストは、Etrans=Σp,q∈NT(p,q,L(p),L(q))の形をとり、ここでNは近隣の(8近傍)ピクセルのすべての組の集合である。項Vを以下のように定義する。
Figure 2010512607
ここで、輝度関数S(...)は上記で定義されたとおりであり、ε=0.001は下位桁あふれを防ぎ、‖・‖はユークリッドノルムを定義する。
合計で、Etransは、2つの入力画像間の境界にわたる不一致を測定する。このことを確認するため、最初に、L(p)≠L(q)の場合を除いてVT(p,q,L(p),L(q))=0であることを観察する。次いで、入力画像のうちの1つに強い勾配がある場合、関連する分母も大きくなるので、VT(p,q,L(p),L(q))=0は小さいことに留意されたい。この問題において隣接する画像が通常、一致しないことの多いかなり異なるシーンから取り出されるので、min演算子が使用される。次いで、我々のエネルギーの選択は、境界にわたり良好な一致を促進する通常の効果に加えて、いずれのシーンにも高コントラスト境界で移行を促進する際に適切に機能する。
もう1つの可能なエネルギー項は、オブジェクト認識システム(たとえば、事前計算モジュール)からの情報が考慮されるようにすることができる(ボックス3300、図10)。たとえば、オブジェクトクラスは、入力画像に示された1つまたは複数のオブジェクトについて識別され、この情報はコラージュの作成に影響を及ぼすために使用される(ボックス3400を参照)。1つの例において、顔が検出され、エネルギー項は、顔がコラージュに含まれている場合に、全体として顔が含まれる傾向になるように調整される。もう1つの例において、空領域が検出される場合、それらはコラージュの上部に向かってのみ含まれる傾向がある。
1つの特定の例において、Eobj=Σp,q∈Nf(p,q,L(p),L(q))というエネルギー項を使用し、ここでL(p)≠L(q)でありp、qがL(p)またはL(q)の画像のいずれかの同じ顔からのピクセルである場合、常にf(p,q,L(p),L(q))=∞であり、それ以外の場合は0である。明示的なエネルギーを定義することではなく、空の場合には、空を含む画像を単にラベル付けして、その情報を、そのような画像をコラージュの上部のみに配置しようと試みる制約満足化エンジンに渡す。
パラメータは、エネルギー関数について指定される。これらのパラメータは、手動で指定されるか、またはシステムの非公式テストと共に調整プロセスを使用することにより決定されてもよい。たとえば、1つの実施形態において、以下のパラメータ値が使用されるが、これらのパラメータ値は大幅に変更されることがあっても引き続き実行可能な結果をもたらすことに留意されたい。たとえば、wimp=10.0,wtrans=1.0,wobj=1.0,wface=0.01とする。
エネルギー関数の最適化への制約は、オプションで指定される。このように制約を指定することにより、生成されるコラージュの品質を向上させることができ、また計算の複雑さを軽減することもできる。
第1の制約は、関心領域が取り出される画像全体と相対的な関心領域内に含まれる情報の量に関連する。たとえば、この制約は、入力画像の微少な認識不能なフラグメントのみが選択されてコラージュに使用される可能性を回避するために使用される。関心領域に含まれる(絶対または相対)情報量は、たとえば、指定されたしきい値を上回る必要がある。特定の例において、関心領域は、関連する入力画像情報の少なくとも90%を取り込む必要がある。しかし、任意の適切なしきい値を使用することができる。
情報限定制約と呼ばれる、この第1の制約の特定の例において、ラベル付けに存在する、つまり一部のsおよび一部のp∈PについてL(p)=(n,s)である任意の画像Inは、
imp(L,n)>T (6)
を満たす必要があり、ここでEimp(L,n)∈[0.1]は、ROIに取り込まれる局所画像情報Σpimp(p,L(p))の割合である。1つの例において、T=0.9、つまり画像情報の少なくとも90%が取り込まれるようにする。
もう1つのオプションの制約は、本明細書において、一様シフト制約と呼ばれる。これは、所定の入力画像が、(コラージュに関して入力画像の)唯一の一意の2Dシフトでコラージュに現れることを指定する。たとえば、所定の入力画像Inが唯一の一意のシフトsでコラージュに表示される、つまりラベルL(p)=(n,s),L(q)=(n,s’)で2つの相異なるピクセルp,q∈P:p≠qを与えられ、s=s’である必要がある。この制約は、部分的には計算の効率にとって有用であり、部分的には入力画像の構造が歪みをまねくことなく確実に保持されるという点において有用である。
もう1つのオプションの制約は、本明細書において、接続性制約と呼ばれる。これは、同一の入力画像から描かれるコラージュのピクセルは、好ましくは、ただし必須ではないが、合致すべきであるという相対位置基準を指定する。たとえば、画像nから描かれるコラージュピクセルの各集合Sn∈{p∈P:L(p)=(n,s),一部のsについて}は、4つの連結領域を形成する必要がある。これは、最適化中に促進される。
もう1つの制約は、コラージュ内のすべてのピクセルの全部または指定された部分がラベル付けされるというものである、つまり、ラベル付けされていないピクセルは視覚的に魅力的ではないコラージュの空白領域をもたらすので、これをあまり多く備えることは望ましくない。
最適化プロセスは、任意の指定されている制約を考慮して、エネルギー関数に実行される。1つの実施形態において、上記で参照された我々の以前の特許文献に説明されているように、単一段階グラフカット最適化プロセスが使用される。実施形態のもう1つのグループにおいて、ラベル付けのさまざまな態様が独立して、または(以下で詳細に説明されるように並行もしくは順次の)別個の最適化段階で最適化されるヒューリスティック手法が使用される。このような多段式の最適化プロセスを使用することにより、計算の複雑さに対処することができ、50以上の入力画像のような、膨大な入力画像の集合に迅速かつ拡張可能なシステムを提供することができる。図11は、1つの例による4つの最適化段階を示す。
入力画像は、どのくらい多くの情報を含み、近似の複製を拒否するかに基づいて、ランク付けプロセス400中に静的にランク付けされる。これは、Erepエネルギー項とも呼ばれる、図10のボックス3000を参照して説明されているエネルギー項を使用して行われる。関心領域は、各入力画像について選択され(ボックス4100)、指定された制約に従って最小化される。たとえば、関心領域は長方形(ここで長方形は正方形を含む)または任意のその他の指定された形状である。制約は、たとえば、前述の情報限定制約、およびすべての検出された顔が含まれるという要件であってもよい。明示的な関心領域選択プロセスを使用することによって、入力画像がテクスチャおよび情報内容に関して非常に異なっている場合でも、良好な品質のコラージュを生成することができる。入力画像をランク付けるステップおよび関心領域を選択するステップは、順次または並行して実行することができる。
次いで、パッキングの問題が解決され(ボックス4200)、最高ランクの多くの画像を、関心領域を重複させることなく、コラージュに準備された領域に集めて配置する。また、コラージュ内のピクセルは空白のままにしておくことはできないが、この要件は必須ではない。次いで、最適化プロセス(ボックス4300)は、2つ以上の画像の重複する領域内のコラージュのピクセル識別を修正するために使用される。以下に説明されるように、グラフカット最適化などの任意の適切な最適化プロセスを使用することができる。適切な最適化プロセスのその他の例は、信頼伝搬(belief propagation)、シミュレーションアニーリング(simulated annealing)、ICM、およびTRWを含むが、これらに限定されることはない。
ここで、これらの4つの最適化ステップは各々、特定の例を参照してさらに詳細に説明される。
イメージのランク付け。最適化のシーケンスにおいて、ランク付けステップは、コラージュエネルギー内のErep項に対応する(1)。最初に画像Inは、部分集合I1,...,Inがどの程度典型的であるかに従って索引nがそれらをランク付けするように、再度ラベル付けが行われる。これは、Erep(n)が単にn番目の画像およびその上位ランクの先行の画像に関して独立して計算された静的ランクであるため、容易である。したがって、n番目の画像は、
Figure 2010512607
を最小化するものとして貪欲に選択され、項Erep(n)を適合させる(2)。次いで、結果として得られたランク付けは、以下の制約満足化ステップに渡される。
関心領域(ROI)の最適化。各入力画像InのROIは、画像ごとに独立して、情報限定制約(6)、およびすべての検出された顔が含まれるという制約を満足することを前提として、ROIの領域を最小化することにより修正される。これは、任意の長方形ROI R内の合計情報Σp∈Rimp(p,L(p))の迅速なルックアップのために、合算領域テーブルを構築することによって達成される(たとえば、非特許文献2参照)。次いで、すべての長方形は列挙され、最小面積を持つ長方形を選択するために、制約の満足化が検査される。この操作は、In内のピクセルの数における二次であり、これは二段抽出により緩和される。これは、すべての顔が含まれるという制約の下で行われる。
制約の満足化。ここで、パッキングの下位の問題は、以下のように説明することができる。選択された画像の集合とそれらのROIを、上記で計算されたランク付けと共に与えられる。目標は、可能な限り多くの上位ランク付けされた画像をコラージュの幅および高さの中に取り込み、しかもあらゆるピクセルがいずれかの画像によって覆われる(ただし、いずれかのROIによって覆われる必要はない)という追加の制約を順守することである。
このパッキングの問題は、非重複、つまり2つのROIが交差してはならないという制約、および被覆、つまりすべてのピクセルが画像によって覆われる(ただし必ずしもROIによって覆われなくてもよい)という制約が同時に存在するので、特異なものである。一般的な手法は、変数の集合の間の制約のセット(不等式、論理式、および一次式)として問題をモデル化して、制約満足化技法を適用することにより、それらの制約を解決することである。ここで、制約を使用して問題をモデル化する1つの方法が説明される(いくつかの変形が代替として検討されうる)。この問題において、変数の集合は、
Figure 2010512607
各画像の位置(xn、yn)、および画像が含まれるべきかどうかを指示するブールフラグbnである。
ROIが交差しない(非重複)ことを表現するため、制約は画像にペアワイズで適用され、典型的な制約は、
if bn and bm then π1 or π2,...,(bnかつbmである場合、π1またはπ2である) (b)
ここで、典型的な命題はπ1=(xn−xm>wm+wn)であり、wmおよびwnはそれぞれROIの半値幅である。ROIの組の相対位置は交換されうるので、それらの制約は論理和集合に現れる。
コラージュのすべてのピクセルが少なくとも1つの画像の表面の下に含まれる(被覆)ことを表現するため、制約はすべてのピクセルに課せられ、典型的な制約は、
|i−xn|≦Wn∧|j−yn|≦Hn
ここで、WnおよびHnはそれぞれ画像nの半値幅であり半値高である。この制約は、ピクセル(i,j)がn番目の画像によって覆われることを課す。たとえば、そのような制約の論理和はすべてのピクセルについて課され、それらの各々が画像の(少なくとも)1つによって覆われるという要件をモデル化する。
さらなるオブジェクト依存の制約を含むことができ、たとえば、空を伴う画像がコラージュの上部のみに表示されるように要求することもできる。
制約のブール組み合わせを伴う問題は、制約プログラミング(CP)に基づく手法の影響を受けやすい。たとえば、効率的に良好な解決を得るために使用する二段階の手法が、ここで説明される。第1のステップ(分岐および限定)はROIの非重複の制約のみを考慮することにより問題を解決し、次いで第2のステップ(局所検索)が被覆の制約を順守するために解決を修正する。
1. 分岐および限定。第1の最適化ステップのフレームワークは、選択された画像の数およびそれらの品質を最大化することを目指す縦型検索である(式(2))。制約の伝搬(たとえば、非特許文献3参照)は、サブツリーに適用され、そこからサブツリーが枝取りされるか、またはその検索空間を縮小させる。実変数(xn,yn)は、制約の保守的な切り捨てでの粗い離散化により対処される。伝搬からのアクティブな制約の集合の切り替えの課題は、具象化(非特許文献4参照)により対処される。分岐および限定のステップにおいて、被覆の要件は全く考慮されない。この段階において、可能な限り多くの長方形をパッキングする問題は、ROIの重複に対する論理和の制約内で解決される。粗い離散化による場合であっても、ノードにおける分岐係数は大きい。これは、限定された数の探索する分岐を無作為に選択し、それらの各々について有界数の後戻りステップを許容することにより、対処される。
2. 局所検索。分岐および限定が終了すると、結果として得られたパッキングは、ROI間の非重複の制約を満たすが、一般に被覆の制約は満たさない。この時点において、局所検索は、解決策を修復するために適用される。摂動は、bnではなく、(xn,yn)のみに適用されるので、選択された画像の集合は、このステップ中に修正される。このステップの効果は、この動きが被覆を増大させる場合には常に画像を移動させることであり、これは任意の決定論または確率的局所検索アルゴリズムによって行うことができる。
非重複および被覆の制約を共に満足する解決策が体系的に見いだされることを確認するため、必要に応じてステップ1)および2)を数回繰り返し、毎回制約をわずかに緩和する(式8の命題πi)。制約満足化ステップは、複数の解決策を生成することができる。ステップ2における細分の後、これらの複数の解決策は、エネルギー関数で限定を使用して評価することができるか(式1)、または直接グラフカット最適化に与えられる。(厳密にエネルギー関数自体は、制約満足化によって搬送される際にピクセルの複数の被覆ではなく単一の被覆に対してのみ定義されるので、限定が必要とされる。)
アルファ展開によるグラフカット。各画像のシフトsが修正されているので、グラフカット最適化は、各ピクセル−ラベルL(p)の画像の変数nにのみ適用される必要がある。実際に、各pにおいて最大4つのnの値が考慮される必要があるので、アルファ展開は非特許文献5に定義されているように使用される。ここで、最小化されるべき目的関数は、引き続き「動作中」である(1)のエネルギーEの一部、つまりWimpimp(L)+Wtranstrans(L)+Wobjobj(L)である。これらの項のうち第1は単項であり、第2および第3は2項である。このエネルギーは非メトリックと見ることができるので、上記で参照された我々の以前の特許文献に説明されているように、アルファ展開の短縮されたスキーマが使用される。アルファ展開の反復ごとに、4連結性特性が、1ピクセルずつ最適に展開された集合を拡張することによって促進される。
図11に示されるように、混合プロセス4400は、コラージュ内で隣接する入力画像間のシームレスな移行をもたらすために実行される。任意の適切な画像混合プロセスを使用することができる。オプションは、ポワソン混合(たとえば、非特許文献6参照)、またはエッジ感度を含むポワソン混合の拡張(たとえば、非特許文献7参照)を使用することである。
1つの実施形態において、画像色チャネルではなくαチャネルでエッジ依存の混合を使用する。これは、個々の入力画像ごとにアルファマスクを計算することによって行われる。第1のステップにおいて、特定の画像Ikについて、全ピクセルpを備える重複領域が計算され、ここで、先行のグラフカット最適化の場合と同じであるラベルの集合L(p)は、ラベルIkおよび少なくとも1つのその他のラベルを含む。次いで、以下の汎関数は重複領域を最小化し、
F(α)=∫‖u(r)−α(r)‖2+w(r)‖▽α‖2dr (9)
ここで
Figure 2010512607
は、重複内に存在する画像Inに取り込まれる。正規化定数g2は平均二乗勾配であり、λ=20、β=10と設定する。関数u(r)は、グラフカットによって与えられた画像ラベルがIkである場合、ピクセルpにおいて値1をとり、それ以外の場合0をとる。次いで、この選択は、αをグラフカット解決策寄りに偏らせる。汎関数Fの最大化は、重複領域にわたりα=0,1という境界条件に従い、ポワソン式を解くことによって計算される。最終ステップにおいて、各画像アルファマスクは、出力領域の各ピクセルpにおいてすべての定義されたアルファマスクの合計が1になるように正規化される。その結果、シャープな接合および透明な混合がともに、コラージュ内で自動的に達成される。
αチャネルにこのエッジ依存の混合プロセスを使用することで、基となるシャープなエッジの存在または不在に従って、固有の境界に沿って切り取ること、または透明に混合することを自動的に切り替える継ぎ目が入力画像の間に作成される。
その他の実施形態において、ユーザ入力プリファレンス情報を考慮に入れることが可能である。たとえば、特定の画像がコラージュの作成に使用されるように選択するなど、ユーザが特定の制約を指定できるようにするユーザインターフェイスが提供される。次いで、それらのユーザ指定の制約は、最適化プロセス中に考慮に入れられる。加えて、ユーザインターフェイスは、ユーザが、入力画像を移動、サイズ変更、およびスワップを行えるようにして、特定の画像部分をコラージュに含むように選択できるようにする。
本明細書において使用される「コンピュータ」という用語は、命令を実行することができるなど、処理能力を備える任意の装置を示す。そのような処理能力は多くのさまざまな装置に組み入れられ、そのため「コンピュータ」という用語はPC、サーバ、携帯電話、携帯情報端末、および多くのその他の装置を含むことを、当業者は理解するであろう。
本明細書において説明される方法は、記憶媒体上の機械可読の形態をとるソフトウェアによって実行することができる。ソフトウェアは、方法のステップが任意の適切な順序で、または同時に実行されうるように、並列プロセッサまたはシリアルプロセッサ上での実行に適したものであってもよい。
このことは、ソフトウェアが価値のある、単独で取引可能な商品となりうることを確認する。所望の機能を実行するために、「ダム」または標準のハードウェアで実行または制御するソフトウェアを含むことが意図されている。さらに、所望の機能を実行するために、シリコンチップの設計、または汎用プログラマブルチップの構成に使用されるような、HDL(ハードウェア記述言語)ソフトウェアなどの、ハードウェアの構成を「記述」または定義するソフトウェアを含むことも意図されている。
プログラム命令を格納するために使用される記憶装置はネットワーク全体にわたり分散されうることを、当業者であれば理解するであろう。たとえば、リモートコンピュータは、ソフトウェアとして記述されるプロセスの例を格納することができる。ローカルまたは端末のコンピュータは、リモートコンピュータにアクセスし、ソフトウェアの一部または全部をダウンロードしてプログラムを実行することができる。あるいは、ローカルコンピュータは、必要に応じてソフトウェアの一部分をダウンロードするか、またはローカル端末において一部のソフトウェア命令を実行し、リモートコンピュータ(またはコンピュータネットワーク)において一部のソフトウェア命令を実行することができる。当業者に既知の従来の技法を使用することにより、ソフトウェア命令の全部または一部がDSP、プログラマブル論理アレイなどの専用回路によって実行されうることもまた、当業者であれば理解するであろう。
本明細書に示される任意の範囲または装置の価値は、求められている効果を失うことなく拡大または変更することができることは、当業者には明らかであろう。
上記で説明されている利点および利益が1つの実施形態に関連するか、または複数の実施形態に関連することを理解されたい。さらに、「an(ある)」項目が1つまたは複数のそのような項目を示すことを理解されたい。
本明細書において説明される方法のステップは、必要に応じて、任意の適切な順序で、または同時に実行することができる。
好ましい実施形態の上記の説明が、例示のためにのみ提示されたものであり、当業者によってさまざまな変更を加えることができることを理解されたい。上記の仕様、例、およびデータは、本発明の例示的な実施形態の構造および使用について詳細に説明する。上記で本発明のさまざまな実施形態は、ある程度詳細に、あるいは1つまたは複数の個々の実施形態を参照して説明されたが、当業者であれば、本発明の精神または範囲を逸脱することなく開示されている実施形態に数多くの変更を加えることができるであろう。

Claims (20)

  1. (i)複数のデジタル画像(100)を受信するように配置された入力と、
    (ii)画像処理システムを制御するためにアプリケーション(105)によって使用されるように配置された少なくとも1つのアプリケーションプログラミングインターフェイス(106)を提供する第1のモジュール(101)と、
    (ii)各々前記第1のモジュールへのインターフェイスを有し、各々デジタルコラージュ(104)の形成に使用される情報を計算するように配置された複数の事前計算モジュール(102)と、
    (iii)前記第1のモジュールへのインターフェイスを有し、前記事前計算モジュールによって計算された前記情報に基づいて前記複数のデジタル画像の少なくとも一部からデジタルコラージュを形成するように配置された画像合成モジュール(103)とを備えることを特徴とする画像処理システム(108)。
  2. 前記第1のモジュールは指定された寸法の要件を満たすために前記受信したデジタル画像の前記寸法を変更するように配置されることを特徴とする請求項1に記載の画像処理システム。
  3. 前記第1のモジュールは少なくとも1つのメトリックに基づいて前記受信したデジタル画像をランク付けするように配置されることを特徴とする請求項1に記載の画像処理システム。
  4. 各事前計算モジュールの出力は、値の2次元配列である潜在的行列を備え、各値は画像ブロックに関連付けられていることを特徴とする請求項1に記載の画像処理システム。
  5. 前記事前計算モジュールの1つは、ガウス分布に従って重みを備える潜在的行列を生成するように配置されることを特徴とする請求項4に記載の画像処理システム。
  6. 前記事前計算モジュールの1つは、所定の画像に対して、その画像から計算されたコントラスト値を備える顕在性の潜在的行列を生成するように配置されることを特徴とする請求項4に記載の画像処理システム。
  7. 前記事前計算モジュールの1つは、所定の画像に対して、その画像から検出された顔に関する情報を備える顔の潜在的行列を生成するように配置されることを特徴とする請求項4に記載の画像処理システム。
  8. 前記第1のモジュールはまた複数の前記受信した画像の各々に対して関心領域を決定するように配置されることを特徴とする請求項1に記載の画像処理システム。
  9. 前記アプリケーションプログラミングインターフェイスは、特定の受信した画像の計算された関心領域が変更されるようにすることができる関数を備えることを特徴とする請求項1に記載の画像処理システム。
  10. 前記アプリケーションプログラミングインターフェイスは、前記第1のモジュールによって決定された受信した画像のランクがオーバーライドされるようにすることができる関数を備えることを特徴とする請求項1に記載の画像処理システム。
  11. 前記アプリケーションプログラミングインターフェイスは、前記事前計算および画像合成モジュールのいずれかの処理が一時停止されるようにすることができる関数を備えることを特徴とする請求項1に記載の画像処理システム。
  12. 前記アプリケーションプログラミングインターフェイスは、前記事前計算および画像合成モジュールのいずれかの処理が再開されるようにすることができる関数を備えることを特徴とする請求項1に記載の画像処理システム。
  13. 前記アプリケーションプログラミングインターフェイスは、前記事前計算および画像合成モジュールのいずれかにおける計算の進行状況に関する状態情報を取得するための少なくとも1つの関数を備えることを特徴とする請求項1に記載の画像処理システム。
  14. 前記画像処理システムを制御するように配置されたアプリケーションをさらに備え、前記アプリケーションは表示画面においてユーザインターフェイスを表示するように配置され、前記ユーザインターフェイスは、事前計算モジュールの選択および前記選択された事前計算モジュールの結果に関連して使用されるべき相対的重みの選択を制御するための項目を備えることを特徴とする請求項1に記載の画像処理システム。
  15. (i)複数のデジタル画像(100)を受信するステップと、
    (ii)第1のモジュール(101)において、画像処理の方法を制御するためにアプリケーション(105)によって使用されるように配置された少なくとも1つのアプリケーションプログラミングインターフェイス(106)を提供するステップと、
    (ii)複数の事前計算モジュール(102)を使用するステップであって、各々前記第1のモジュールへのインターフェイスを有し、デジタルコラージュ(104)の形成に使用される情報を計算するステップと、
    (iii)画像合成モジュール(103)を使用するステップであって、前記第1のモジュールへのインターフェイスを有し、前記事前計算モジュールによって計算された前記情報に基づいて前記複数のデジタル画像の少なくとも一部からデジタルコラージュを形成するステップとを備えることを特徴とする画像処理の方法。
  16. 前記第1のモジュールを使用して、指定された寸法の要件を満たすように前記受信したデジタル画像の前記寸法を変更するステップを備えることを特徴とする請求項15に記載の方法。
  17. 前記第1のモジュールを使用して、少なくとも1つのメトリックに基づいて前記受信したデジタル画像をランク付けするステップを備えることを特徴とする請求項15に記載の方法。
  18. 各事前計算モジュールを使用して、値の2次元配列である潜在的行列を生成するステップであって、各値は画像ブロックに関連付けられているステップを備えることを特徴とする請求項15に記載の方法。
  19. 前記事前計算モジュールの1つを使用して、ガウス分布に従って重みを備える潜在的行列を生成するステップを備えることを特徴とする請求項18に記載の方法。
  20. (i)複数のデジタル画像(100)を受信するステップと、
    (ii)第1のモジュール(101)において、画像処理の方法を制御するためにアプリケーションによって使用されるように配置された少なくとも1つのアプリケーションプログラミングインターフェイスを提供するステップと、さらに前記第1のモジュールにおいて、受信した画像ごとに関心領域を計算するステップと、
    (ii)複数の事前計算モジュール(102)を使用するステップであって、各々前記第1のモジュールへのインターフェイスを有し、デジタルコラージュの形成に使用される情報を計算するステップと、
    (iii)画像合成モジュールを使用するステップであって、前記第1のモジュールへのインターフェイスを有し、前記事前計算モジュールによって計算された前記情報に基づいて前記複数のデジタル画像の少なくとも一部からデジタルコラージュを形成するステップとを備えるステップを実行するための装置実行可能命令を備えることを特徴とする1つまたは複数の装置読み取り可能媒体。
JP2009541570A 2006-12-12 2007-12-12 デジタルコラージュのための画像処理システム Pending JP2010512607A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/609,802 US7532771B2 (en) 2004-11-12 2006-12-12 Image processing system for digital collage
PCT/US2007/087318 WO2008073998A1 (en) 2006-12-12 2007-12-12 Image processing system for digital collage

Publications (2)

Publication Number Publication Date
JP2010512607A true JP2010512607A (ja) 2010-04-22
JP2010512607A5 JP2010512607A5 (ja) 2010-11-25

Family

ID=39512111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009541570A Pending JP2010512607A (ja) 2006-12-12 2007-12-12 デジタルコラージュのための画像処理システム

Country Status (6)

Country Link
US (1) US7532771B2 (ja)
EP (1) EP2102818B1 (ja)
JP (1) JP2010512607A (ja)
KR (1) KR101433986B1 (ja)
CN (1) CN101553846B (ja)
WO (1) WO2008073998A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013042734A1 (ja) * 2011-09-20 2013-03-28 株式会社東芝 画像処理装置及び医用画像診断装置
JP2014016787A (ja) * 2012-07-09 2014-01-30 Canon Inc 画像配置制御装置、画像配置制御方法、及びプログラム

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7653261B2 (en) * 2004-11-12 2010-01-26 Microsoft Corporation Image tapestry
US7689064B2 (en) * 2005-09-29 2010-03-30 Cozi Group Inc. Media display collages
US8144919B2 (en) * 2006-09-22 2012-03-27 Fuji Xerox Co., Ltd. Annealing algorithm for non-rectangular shaped stained glass collages
US20080101761A1 (en) * 2006-10-31 2008-05-01 Simon Widdowson Weighted occlusion costing
US20080175456A1 (en) * 2007-01-18 2008-07-24 Dimitrios Ioannou Methods for explosive detection with multiresolution computed tomography data
US7747107B2 (en) * 2007-03-06 2010-06-29 Mitsubishi Electric Research Laboratories, Inc. Method for retargeting images
GB2460589B (en) * 2007-08-31 2012-11-28 Furuno Electric Co Chart display device and method for displaying chart
US8189959B2 (en) * 2008-04-17 2012-05-29 Microsoft Corporation Image blending using multi-splines
JP5153940B2 (ja) * 2008-06-24 2013-02-27 トムソン ライセンシング 動き補償を用いた画像の奥行き抽出のためのシステムおよび方法
US8729732B2 (en) * 2008-07-10 2014-05-20 T-Mobile Usa, Inc. Cell site power generation
US8279074B2 (en) * 2008-07-10 2012-10-02 T-Mobile Usa, Inc. Battery monitoring system, such as for use in monitoring cell site power systems
US8160398B1 (en) 2008-07-31 2012-04-17 Adobe Systems Incorporated Independent resizing of multiple image regions
US8280191B1 (en) 2008-07-31 2012-10-02 Abode Systems Incorporated Banded seam carving of images with pyramidal retargeting
US8270765B1 (en) 2008-07-31 2012-09-18 Adobe Systems Incorporated Hybrid seam carving and scaling of images with configurable energy threshold
US8265424B1 (en) 2008-07-31 2012-09-11 Adobe Systems Incorporated Variable seam replication in images with energy-weighted priority
US8280186B1 (en) 2008-07-31 2012-10-02 Adobe Systems Incorporated Seam-based reduction and expansion of images with table-based priority
US8270766B1 (en) 2008-07-31 2012-09-18 Adobe Systems Incorporated Hybrid seam carving and scaling of images with configurable carving tolerance
US8290300B2 (en) * 2008-07-31 2012-10-16 Adobe Systems Incorporated Seam-based reduction and expansion of images with color-weighted priority
US8280187B1 (en) 2008-07-31 2012-10-02 Adobe Systems Incorporated Seam carving and expansion of images with color frequency priority
US8218900B1 (en) 2008-07-31 2012-07-10 Adobe Systems Incorporated Non-linear image scaling with seam energy
US8625932B2 (en) 2008-08-28 2014-01-07 Adobe Systems Incorporated Seam carving using seam energy re-computation in seam neighborhood
US8180177B1 (en) 2008-10-13 2012-05-15 Adobe Systems Incorporated Seam-based reduction and expansion of images using parallel processing of retargeting matrix strips
US8581937B2 (en) 2008-10-14 2013-11-12 Adobe Systems Incorporated Seam-based reduction and expansion of images using partial solution matrix dependent on dynamic programming access pattern
US20100164986A1 (en) * 2008-12-29 2010-07-01 Microsoft Corporation Dynamic Collage for Visualizing Large Photograph Collections
GB0901351D0 (en) * 2009-01-28 2009-03-11 Univ Dundee System and method for arranging items for display
WO2010124376A1 (en) * 2009-04-27 2010-11-04 Vincent Charles Cheung Method, system and computer product for distribution of data objects
US8963960B2 (en) 2009-05-20 2015-02-24 Adobe Systems Incorporated System and method for content aware hybrid cropping and seam carving of images
US8358876B1 (en) 2009-05-20 2013-01-22 Adobe Systems Incorporated System and method for content aware in place translations in images
US8412272B2 (en) * 2009-07-24 2013-04-02 T-Mobile Usa, Inc. Rectifier circuit management system, such as for use in cell site power systems
US8897603B2 (en) * 2009-08-20 2014-11-25 Nikon Corporation Image processing apparatus that selects a plurality of video frames and creates an image based on a plurality of images extracted and selected from the frames
US8659622B2 (en) 2009-08-31 2014-02-25 Adobe Systems Incorporated Systems and methods for creating and editing seam carving masks
US8644644B2 (en) * 2009-09-14 2014-02-04 Adobe Systems Incorporation Methods and apparatus for blending images
US9275479B2 (en) 2009-10-22 2016-03-01 Collage.Com, Llc Method, system and computer program product for creating collages that visually resemble a particular shape or group of shapes
KR101164353B1 (ko) * 2009-10-23 2012-07-09 삼성전자주식회사 미디어 콘텐츠 열람 및 관련 기능 실행 방법과 장치
US8310103B2 (en) * 2010-03-17 2012-11-13 T-Mobile Usa, Inc. Cell site power system management, including battery circuit management
EP2599054A4 (en) 2010-07-29 2017-08-02 Hewlett-Packard Development Company, L.P. Inserting content and exclusion zone(s) into a page
US9454520B2 (en) 2010-07-29 2016-09-27 Hewlett-Packard Development Company, L.P. Generating a representation of a layout having partitions for exclusion zones
KR101659091B1 (ko) 2010-08-31 2016-09-22 삼성전자주식회사 문자 콜라주 메시지 생성 장치 및 방법
JP5720275B2 (ja) * 2011-02-03 2015-05-20 株式会社リコー 撮像装置および撮像方法
US9271035B2 (en) 2011-04-12 2016-02-23 Microsoft Technology Licensing, Llc Detecting key roles and their relationships from video
CN102194241B (zh) * 2011-04-28 2013-07-10 西安交通大学 基于互联网的艺术拼图系统设计方法
JP5785453B2 (ja) * 2011-07-08 2015-09-30 キヤノン株式会社 表示制御装置及び表示制御方法、プログラム並びに記憶媒体
WO2013075316A1 (en) * 2011-11-24 2013-05-30 Microsoft Corporation Interactive multi-modal image search
BR112014018274A8 (pt) * 2012-01-25 2017-07-11 Intel Corp Seleção de objeto em uma imagem
WO2013130071A1 (en) * 2012-02-29 2013-09-06 Hewlett-Packard Development Company, L.P. Image prioritization in a collage shape
AU2013243380B2 (en) 2012-04-05 2017-04-20 Magic Leap, Inc. Wide-field of view (FOV) imaging devices with active foveation capability
US20140169697A1 (en) * 2012-12-19 2014-06-19 Lifetouch Inc. Editor for assembled group images
US9355487B2 (en) 2013-03-15 2016-05-31 Crayola, Llc Coloring kit for capturing and animating two-dimensional colored creation
US9946448B2 (en) 2013-03-15 2018-04-17 Crayola Llc Coloring kit for capturing and animating two-dimensional colored creation
US10475226B2 (en) 2013-03-15 2019-11-12 Crayola Llc Coloring kit for capturing and animating two-dimensional colored creation
US9424811B2 (en) * 2013-03-15 2016-08-23 Crayola Llc Digital collage creation kit
KR102288280B1 (ko) * 2014-11-05 2021-08-10 삼성전자주식회사 영상 학습 모델을 이용한 영상 생성 방법 및 장치
KR102594858B1 (ko) * 2016-08-01 2023-10-27 삼성전자 주식회사 이미지 합성 및 복원하는 전자 장치 및 방법
US11176675B2 (en) 2017-02-01 2021-11-16 Conflu3Nce Ltd System and method for creating an image and/or automatically interpreting images
US10582189B2 (en) 2017-02-01 2020-03-03 Conflu3nce Ltd. System and method for generating composite images
US11158060B2 (en) 2017-02-01 2021-10-26 Conflu3Nce Ltd System and method for creating an image and/or automatically interpreting images
WO2019156819A1 (en) * 2018-02-07 2019-08-15 Intel Corporation Method and apparatus for processing and distributing live virtual reality content
JP6572500B1 (ja) * 2018-03-14 2019-09-11 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd 画像処理装置、撮像装置、移動体、画像処理方法、及びプログラム
KR102627658B1 (ko) 2018-10-11 2024-01-22 삼성전자주식회사 레이아웃에 대한 이미지의 배치를 판단하는 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체.
CN111309220B (zh) * 2018-12-11 2024-08-30 阿里巴巴华东有限公司 交互方法、图片处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004288182A (ja) * 2003-03-21 2004-10-14 Fuji Xerox Co Ltd レイアウト作成方法、サマリレイアウト作成方法、画像サマリレイアウト決定システム、及びこれらの方法及びシステムをプロセッサに実行させるためのプログラム
WO2006079991A2 (en) * 2005-01-28 2006-08-03 Koninklijke Philips Electronics, N.V. Dynamic photo collage

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US699095A (en) * 1901-02-07 1902-04-29 Julius C Le Hardy Hernial truss.
US6850252B1 (en) * 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5568194A (en) * 1994-05-31 1996-10-22 Asahi Kogaku Kogyo Kabushiki Kaisha Adjusting a white balance in a camera using a flash
JP3569992B2 (ja) * 1995-02-17 2004-09-29 株式会社日立製作所 移動体検出・抽出装置、移動体検出・抽出方法及び移動体監視システム
US6549681B1 (en) 1995-09-26 2003-04-15 Canon Kabushiki Kaisha Image synthesization method
US6263088B1 (en) * 1997-06-19 2001-07-17 Ncr Corporation System and method for tracking movement of objects in a scene
EP1100262B1 (en) 1998-06-22 2007-10-10 FUJIFILM Corporation Imaging device and method
JP2000043363A (ja) 1998-07-22 2000-02-15 Eastman Kodak Co 写真コラ―ジュの作成システム及び方法
US6123362A (en) 1998-10-26 2000-09-26 Eastman Kodak Company System and method of constructing a photo collage
US6396963B2 (en) 1998-12-29 2002-05-28 Eastman Kodak Company Photocollage generation and modification
US6320976B1 (en) 1999-04-01 2001-11-20 Siemens Corporate Research, Inc. Computer-assisted diagnosis method and system for automatically determining diagnostic saliency of digital images
US7096426B1 (en) 1999-05-07 2006-08-22 Catherine Lin-Hendel Clustered presentation of objects with group and individual identity in, and virtual layered composition of, electronically recorded, computer presented media
US7098914B1 (en) 1999-07-30 2006-08-29 Canon Kabushiki Kaisha Image synthesis method, image synthesis apparatus, and storage medium
JP3961734B2 (ja) * 1999-12-24 2007-08-22 富士フイルム株式会社 画像処理方法、装置及び記録媒体
US6411742B1 (en) 2000-05-16 2002-06-25 Adobe Systems Incorporated Merging images to form a panoramic image
US6663732B1 (en) 2000-07-21 2003-12-16 Donald J. Link Process for making an individualized puzzle collage
KR100471056B1 (ko) * 2000-11-18 2005-03-07 삼성전자주식회사 컴퓨터시스템 및 컴퓨터시스템의 대기모드제어방법
US7181017B1 (en) * 2001-03-23 2007-02-20 David Felsher System and method for secure three-party communications
GB0119176D0 (en) * 2001-08-06 2001-09-26 Ocuity Ltd Optical switching apparatus
US7308133B2 (en) * 2001-09-28 2007-12-11 Koninklijke Philips Elecyronics N.V. System and method of face recognition using proportions of learned model
US7203380B2 (en) 2001-11-16 2007-04-10 Fuji Xerox Co., Ltd. Video production and compaction with collage picture frame user interface
US6919892B1 (en) * 2002-08-14 2005-07-19 Avaworks, Incorporated Photo realistic talking head creation system and method
US7027054B1 (en) * 2002-08-14 2006-04-11 Avaworks, Incorporated Do-it-yourself photo realistic talking head creation system and method
US6825850B2 (en) 2002-10-30 2004-11-30 Microsoft Corporation System and process for optimal texture map reconstruction from multiple views
JP2004246868A (ja) 2003-01-22 2004-09-02 Canon Inc 画像抽出方法及び該方法をコンピュータに実行させるプログラム
US7073363B2 (en) 2003-05-20 2006-07-11 Schumag Ag Method for processing drawn material and drawn material production installation
US7573486B2 (en) 2003-08-18 2009-08-11 LumaPix Inc. Method and system for automatic generation of image distributions
US20050062841A1 (en) 2003-09-18 2005-03-24 Rivera-Cintron Carlos A. System and method for multi-media record, distribution and playback using wireless communication
US7634106B2 (en) 2004-09-22 2009-12-15 Fujifilm Corporation Synthesized image generation method, synthesized image generation apparatus, and synthesized image generation program
US7724959B2 (en) 2004-09-23 2010-05-25 Fuji Xerox Co., Ltd. Determining regions of interest in photographs and images
US7848567B2 (en) 2004-09-23 2010-12-07 Fuji Xerox Co., Ltd. Determining regions of interest in synthetic images
US7653261B2 (en) 2004-11-12 2010-01-26 Microsoft Corporation Image tapestry
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004288182A (ja) * 2003-03-21 2004-10-14 Fuji Xerox Co Ltd レイアウト作成方法、サマリレイアウト作成方法、画像サマリレイアウト決定システム、及びこれらの方法及びシステムをプロセッサに実行させるためのプログラム
WO2006079991A2 (en) * 2005-01-28 2006-08-03 Koninklijke Philips Electronics, N.V. Dynamic photo collage

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013042734A1 (ja) * 2011-09-20 2013-03-28 株式会社東芝 画像処理装置及び医用画像診断装置
JP2013078569A (ja) * 2011-09-20 2013-05-02 Toshiba Corp 画像処理装置及び医用画像診断装置
US9031301B2 (en) 2011-09-20 2015-05-12 Kabushiki Kaisha Toshiba Image processing apparatus and medical image diagnosis apparatus
JP2014016787A (ja) * 2012-07-09 2014-01-30 Canon Inc 画像配置制御装置、画像配置制御方法、及びプログラム

Also Published As

Publication number Publication date
CN101553846A (zh) 2009-10-07
EP2102818B1 (en) 2014-04-09
EP2102818A4 (en) 2010-12-22
EP2102818A1 (en) 2009-09-23
CN101553846B (zh) 2012-07-11
KR20090088434A (ko) 2009-08-19
US20070110335A1 (en) 2007-05-17
WO2008073998A1 (en) 2008-06-19
US7532771B2 (en) 2009-05-12
KR101433986B1 (ko) 2014-08-25

Similar Documents

Publication Publication Date Title
JP2010512607A (ja) デジタルコラージュのための画像処理システム
US7529429B2 (en) Auto collage
US7653261B2 (en) Image tapestry
US7551181B2 (en) Image region filling by exemplar-based inpainting
Gracias et al. Fast image blending using watersheds and graph cuts
Barnes et al. The patchmatch randomized matching algorithm for image manipulation
US7729531B2 (en) Identifying repeated-structure elements in images
US8411948B2 (en) Up-sampling binary images for segmentation
US8594428B2 (en) Interactive segmentation of images with single scribbles
US20240171848A1 (en) Removing distracting objects from digital images
US20240153047A1 (en) Modifying digital images utilizing intent deterministic user interface tools
Goldberg et al. Data‐driven object manipulation in images
US20240144520A1 (en) Generating three-dimensional human models representing two-dimensional humans in two-dimensional images
US20240378832A1 (en) Generating and visualizing planar surfaces within a three-dimensional space for modifying objects in a two-dimensional editing interface
US20240144586A1 (en) Generating shadows for objects in two-dimensional images utilizing a plurality of shadow maps
US20240169631A1 (en) Texture-preserving shadow removal in digital images utilizing generating inpainting models
US20240135612A1 (en) Generating shadows for placed objects in depth estimated scenes of two-dimensional images
US20240127509A1 (en) Generating scale fields indicating pixel-to-metric distances relationships in digital images via neural networks
US20240135561A1 (en) Modifying digital images via depth-aware object move
JP2001052011A (ja) 画像検索装置およびその方法
US20240135613A1 (en) Modifying digital images via perspective-aware object move
US20240265692A1 (en) Generating semantic scene graphs utilizing template graphs for digital image modification
CN118429477A (zh) 生成和使用为数字图像编辑向对象分配行为的行为策略图
US20240169685A1 (en) Detecting shadows and corresponding objects in digital images
JP2001134765A (ja) 画像検索方法及び装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101005

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101005

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20101005

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20101111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110315