[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2001202522A - 消費者画像の強調及び魅力の自動評価方法 - Google Patents

消費者画像の強調及び魅力の自動評価方法

Info

Publication number
JP2001202522A
JP2001202522A JP2000378621A JP2000378621A JP2001202522A JP 2001202522 A JP2001202522 A JP 2001202522A JP 2000378621 A JP2000378621 A JP 2000378621A JP 2000378621 A JP2000378621 A JP 2000378621A JP 2001202522 A JP2001202522 A JP 2001202522A
Authority
JP
Japan
Prior art keywords
image
features
images
detector
main object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000378621A
Other languages
English (en)
Inventor
Andreas E Savakis
イー サヴァキス アンドレアス
Stephen Etz
エッツ スティーヴン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2001202522A publication Critical patent/JP2001202522A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 本発明は、従来の問題点の一つ以上の問題を
解消することを目的とした画像の評価方法を提供するこ
とを目的とする。 【解決手段】 画像は特定の特徴に関して自動評価さ
れ、評価は画像の重要度、興味度、魅力度の決定であ
る。まず、デジタル画像は画像に応じて入手される。次
いで、デジタル画像の内容に関係する一つ以上の特徴を
含む、デジタル画像の一つ以上の特徴に関係する一つ以
上の量が計算される。その量は推論アルゴリズムで処理
され、そのアルゴリズムは一人以上の観察者の意見に基
づいて調整され、出力は画像を評価する推論アルゴリズ
ムから得られる。具体的には、推論アルゴリズムはベイ
ズネットワークであり、そのネットワークは一群の画像
に対して実行される評価を提供し、強調画像として一の
画像を選択する。デジタル画像の内容に関係する特徴に
は、人に関連した特徴及び/又は主要対象物に関連した
特徴がある。さらに、色の多彩さ及び/又はシャープネ
スのようなデジタル画像の客観的尺度に関係する付加量
が計算される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処置に係り、
より詳細には、画像評価及び認識の分野に関する。
【0002】
【従来の技術】画像評価及び認識は、一定の知力を有す
るヒトにより容易に解決される問題を扱うが、完全自動
化されたコンピュータシステムにより解決することは、
極端に困難である。写真応用にて重要と考えられている
画像認識に係る問題には、対象物の検出、シーンの分
類、空及び芝の検出、ヒトの検出、配置の自動検出など
である。一群の画像を取扱うさまざまな応用では、論理
命令の見地から、画像を評価することが重要であり、そ
の命令に応じて加工若しくは処理される。現在関心のあ
る写真応用では、自動アルバム化であり、一群のデジタ
ル画像は自動的にデジタルフォトアルバムに組織化され
る。これには、画像を別々のイベントにクラスター化さ
せ、次いで、可能ならば、ある論理命令にて各イベント
を展開することが伴う。この命令は画像の相対的内容に
対して少なくとも注意を向ける、つまりある種の画像は
他の画像よりも好ましいという考えに基づいている。
【0003】ダド(dud)検出、イベント検出及びペー
ジレイアウトアルゴリズムのような数多くの公知なアル
ゴリズムは、自動アルバム化応用と共に有用である。ダ
ド検出は複数の画像及び不良品質の画像の排除、又はあ
まり重きを置かないことを取扱い、一方、イベント検出
は、日及び時間のようなある特定な基準により、画像を
別々のイベントに分類することを含む。同じイベントに
属する一組の画像によれば、ページレイアウトの対象は
論理及び満足な表示に各イベントをレイアウトし、例え
ば、各頁の画像の最も満足で、かつ空間効率的な表示を
見つける。一群の画像にて最も重要な画像を選択できる
ことが望まれる、例えば、ページレイアウトにて最も注
意を惹きつけることが望まれる。
【0004】画像評価問題の性質のため、つまり自動シ
ステムは高レベルなヒト認識(理解)処理を代表する結
果を生じさせることが期待される性質のため、評価シス
テムの設計は挑戦的な仕事である。心理学的効果のため
に、特定な視覚的印象の文書を作り又は編集させる目的
で、文書及び図形データを評価するための努力が払われ
てきた(米国特許第5,875,265号及び第5,42
4,945号)。前記’265号特許には、ある場合に
はオペレータの助けをかりて、システムが画像を解析し
て、オペレータにより利用されるために表示する感応言
語に対応する視覚的特徴のある通信を決定する。本シス
テムの困難性は、視覚的特徴が低レベルの特徴、つまり
画像内容と必ずしも関係しない色及び肌合いを主に基調
としており、言語記述は画像の相対的な評価には利用す
ることが難しい。前記’945号特許には文書のテキス
ト及び図形の心理的効果を評価するシステムが開示され
ている。前記’945号特許に係る欠点は、特定の内容
に関係なく文書全体の視覚的印象を評価することであ
る。心理的効果の識別に対する複雑性及び配向のほかに
も、上記システムは、現存する画像の評価及び利用より
も、知覚的印象の解析及び創出に焦点を当てている。
【0005】
【発明が解決しようとする課題】本発明は上述の点に鑑
みてなされたものであり、前記した一つ以上の問題を解
消することを目的とする。
【0006】
【課題を解決するための手段】上記の目的は、特徴に関
して、画像の重要度、興味度又は魅力度の決定を行う画
像の評価方法であって、(a) 画像に対応するデジタ
ル画像を得る工程と、(b) 前記デジタル画像のその
内容に関連した一つ以上の特徴に関連した一つ以上の量
を計算する工程と、(c) 一人以上の観察者の意見に
調整される推論アルゴリズムで前記一つ以上の量を加工
する工程と、(d) 画像を評価する推論アルゴリズム
から出力を生じさせる工程とを具備する評価方法により
達成される。
【0007】簡潔に要約すると、本発明の一の態様から
は、特定の特徴に関して画像を評価する方法を開示し、
その評価は画像の重要度、画像の興味度及び魅力度の決
定である。第一に、デジタル画像は画像に対応して得ら
れる。その後、デジタル画像の内容に関係する一つ以上
の特徴を含むデジタル画像の一つ以上の特徴と関係する
一つ以上の量が計算される。その量は、一人以上の人間
の観察者の意見に沿う推論アルゴリズムで加工され、出
力は画像を評価する推論アルゴリズムから得られる。本
発明の別の諸相からは、デジタル画像の内容に関係した
特徴には、少なくとも一の人に関連した特徴及び対象物
に関連した特徴がある。さらに、色の多彩さ及びシャー
プネスのようなデジタル画像の一つ以上の客観的尺度に
関係する付加量が計算される。
【0008】本発明の別の態様から、後述するように、
本発明は画像の強調若しくはアピール(魅力)を評価す
るものとして理解できる。アピール及び強調の双方評価
に対する本観点から、自己の目立つ特徴は、 a 人に関連した特徴であって、人の有無、皮膚及び顔
領域の量及び顔サイズに基づくクローズアップの程度、 b 客観的特徴であって、画像の色の多彩さ及びシャー
プネス、 c 対象物に関連した特徴であって、対象物のサイズや
主要な対象物のマッピングに基づく構成物の美点、のよ
うなものが計算される。
【0009】上記特徴は強調評価には十分であるが、 a 色内容の観点から各画像の代表値、 b 各画像の画像面のフォーマットのユニークさのよう
な特定の付加的で、相対的に目立つ画像の特徴をアピー
ル強化にて考慮する。
【0010】画像評価は、ベイズネットワークのような
推論エンジンにより得ることができ、入力として上記述
べた特徴を受け入れ、画像評価値を発生させるように調
整する。本評価は個々の固有の評価であり、自己の目立
つ特徴は画像アピール値を発生させるベイズネットワー
クにより処理される、または、その評価は一群の画像の
相対的評価であり、自己の目立つ、任意には相対的に目
立つ特徴は、画像強調値を発生させるベイズネットワー
クにより処理される。
【0011】本発明の効果は、人間の干渉なしに一つ以
上の画像の評価を実行する能力にある。自動アルバム化
のような一群の画像を扱うさまざまな応用では、かかる
アルゴリズム評価により、論理命令の観点から画像の自
動評価を可能し、それらの順序により、一層効率的に加
工若しくは処理することができる。
【0012】本発明の上記及び他の諸相、目的、特徴及
び効果は、添付図面を参照して、以下の好適な実施態様
の説明及び特許請求の範囲の記載を精読することによ
り、明白に理解される。
【0013】
【発明の実施の形態】以下の説明では、本発明の好適な
実施態様をソフトウェアプログラムとして説明する。か
かるソフトウェアの均等物がハードウェアにて構成され
ることは、当業者には容易に理解できる。画像処理アル
ゴリズム及びシステムは周知であるので、本発明の説明
は、本発明の方法の一部を構成し、より直接的に協働す
る、アルゴリズム及びシステムに向けられる。かかるア
ルゴリズム及びシステムの他の態様、本願で特別に図示
しない若しくは説明しない関係画像信号の発生及び他の
処理のためのハードウェア及び/又はソフトウェアは、
本技術分野では公知であるシステム、アルゴリズム、成
分及び要素から選択される。以下の実施の形態で記載す
る説明のとおり、コンピュータプログラムとしての全て
のソフトウェアの実行は従来のものであり、当業者の通
常の創作能力により行うことができる。
【0014】さらに、本願で利用するように、コンピュ
ータプログラムはコンピュータ読取り可能な記録媒体に
保存され、その媒体は、例えば、磁気ディスク(フロッ
ピー(登録商標)ディスのような)や磁気テープのよう
な磁気保存媒体;光ディスク、光テープまたは機械読取
り可能なバーコードのような光記録ディスク;ランダム
アクセスメモリー(RAM)、読取り専用メモリ(RO
M)のような固体状態電子記録装置;又はコンピュータ
プログラムを保存させるために利用される他の物理的装
置又は媒体がある。
【0015】一群の写真を取扱うさまざまな応用にて、
相対値及び/又は固有値の見地から、画像を評価するこ
とは重要であり、上記の値に応じて加工若しくは処理さ
れ得る。前記したように、現在関心のある写真応用で
は、自動アルバム化であり、それでは一群のデジタル画
像をデジタルフォトアルバムに自動的に組織化させる。
これに、画像を個々のイベントにクラスター化させ、論
理命令にて各イベントをレイアウトすることを含む。こ
の論理命令は画像の二つの関連評価、画像アピールと画
像強調に基づいている。画像アピールは重要性、個々の
写真の興味及び魅力の固有な程度であるのに対し、画像
強度はイベント又は群の他の写真に関して、写真の相対
的な重要性、興味及び魅力である。一旦、評価を得る
と、画像群に最も重要な画像を選択すること望ましく、
例えば、ページレイアウトにて最も関心を惹きつける。
したがって、画像評価アルゴリズムはイベント検出とペ
ージレイアウトとの工程間の自動アルバム化アーキテク
チャに十分に適合する。イベント検出アルゴリズムは画
像群を出力し、群の全ての画像は同じイベントに属す
る。評価アルゴリズムは各イベントの画像に働き、各画
像に評価値(例えば、強調値及び/又はアピール値)を
割り当てる。評価値は特定の群の各画像と関連したメタ
データとして観測され、他のアルゴリズムにより利用さ
れる。提案システムには、ページレイアウトアルゴリズ
ムが、入力として各イベントの全ての画像の相対的評価
値を受取り、画像が各ページの適正に配列される。例え
ば、あるイベントの一群の画像の強調値はページレイア
ウトアルゴリズムにより利用され、アルバムページに相
対的サイズ及び写真の位置を割り当てる。
【0016】しかしながら、提案システムでは、システ
ムアーキテクチャのタイプと評価の有効な特徴の選択に
係る多くの未決問題がある。他の画像理解問題にうまく
適用されたアーキテクチャは、特徴抽出とそれに続く分
類段階に基づいている。特徴抽出に関しては、特徴の調
和を選択することが必要である。このためには二つのア
プローチがあるようである。一つは直感的に画像評価値
とある程度関連性を有する特徴を選択することである。
このアプローチの問題点は、特徴の選択への正当化がな
いことである。第二のアプローチは、制御実験から得ら
れた経験に基づく特徴選択を基礎とすることである。発
明者らはかかる実験にはなにも発見されなかったので、
意味のある特徴を特定するデータを得るために、地上調
査を行った。その地上調査の結果は、特徴選択と分類器
の訓練に利用される。
【0017】図1を参照するに、強調値を計算するため
の画像強調ネットワーク10を示し、特徴抽出段階12
と分類段階14からなる。画像抽出段階12は数多くの
アルゴリズムを利用し、各アルゴリズムは画像特徴の特
性を測定するように設計されており、特徴の定量尺度は
アルゴリズムの出力値として表現される。よって、特徴
抽出段階12の出力は特定特徴の有無の証拠を表示し、
その出力は次の分類段階14で統合され、強調値を計算
する。この値は、例えば、0から100までの範囲があ
るが、加工画像が強調画像である可能性または信念を表
わす。図4に示すように、別々の画像強調ネットワーク
10.1、10.2、...、10.Nにて強調値が一
群の画像に対して計算された後、強調値は対比段階16
で対比され、それぞれの正規化段階16.1、16.
2、...、16.Nにて正規化される。最大の強調値
を有する画像が群の強調画像として選択される。
【0018】特徴の全体調和は、人間の観察者を優先し
た地上調査に基づき、特徴抽出段階12にて選択した。
地上調査から、強調画像選択に重要である特徴は、シャ
ープネス、コントラスト、フィルムグレイン及び露光の
ような伝統的な画像品質の測定基準にはあまり関係しな
いことが分かった。もっとも、一つ以上の伝統的測定基
準は評価値の計算にて値を有し続ける。選択特徴は、通
常、三つのカテゴリーに分割される:(a)人に関係す
る特徴と、(b)主要対象物に関係する特徴と、(c)
画像の客観的尺度に関係する特徴とに分割される。図1
を参照すると、人に関係する特徴は皮膚領域検出器2
0、クローズアップ検出器22及び人検出器24により
抽出される。入力画像iは、典型的には皮膚検出器26
及び顔検出器28により加工され、人に関連する特徴検
出器20、22及び24に適する中間値が生じる。主要
対象物に関連する特徴は、主要対象物検出器34に基づ
き、構成検出器30及び対象物サイズ検出器32により
抽出される。構成検出器30は、図3に示すように、主
要対象物分散アルゴリズム30.1、主要対象物中心度
アルゴリズム30.2及び主要対象物緻密度アルゴリズ
ム30.3を含み、数多の構成関連主要対象物アルゴリ
ズムからなる。主要対象物データはクラスター化段階3
1でクラスター化され、次いで、構成関連アルゴリズム
30.2及び30.3と対象物サイズアルゴリズム32
とをもたらす。画像の客観的尺度に関連する特徴は、シ
ャープネス検出器36、色の多彩さ検出器38及びユニ
ークフォーマット検出器40により抽出される。加え
て、画像の色内容を一群の画像とどのように関連して表
示するかに関連する客観的尺度は、色表示検出器42に
より抽出される。
【0019】図1に示す特徴の全体調和は、画像強調の
表示する値を計算するために利用され、群の他の画像に
関して、画像の相対的重要性、関心または魅力の程度と
して定義される。各画像は群の他の画像と関係して評価
されるので、図4に示すように、画像強調計算は画像強
調ネットワーク10.1、10.2、...、10.N
を実現させ、各強調値に関して画像を評価する。実際
に、一つの画像強調ネットワーク10は繰り返して関係
し、一連の画像の強調値を決定し、この場合には、連続
して得られた結果をコンパラター16への入力の中間保
存(図示せず)に保存する。図2に示す特徴の全体調和
は、図1に示す特徴の全体調和のサブセットであり、画
像アピールを表示する値を計算するために利用され、他
の画像の参照なしに、絶対的に意味で、画像の固有の重
要度、関心又は魅力として定義される。図2に示す特徴
は、上記の特徴が画像の評価として有効である限り、自
己の目立つ特徴という。比較として、二つの付加特徴
は、つまりユニークフォーマット特徴と代表的な色特徴
は図1にて検出される。これらの特徴は、その特徴が他
の画像と必ず関係している測定値である限り、相対的に
目立つ特徴という。(しかしながら、強調の満足な測定
が自己の目立つ特徴のみから得られるならば、上記特徴
は任意である。)結果として、アピール及び強調の双方
の評価は自己の目立つ特徴を含むのに対し、強調のみの
評価には相対的に目立つ特徴も含む。
【0020】図1及び図2による特徴の全体の調和抽出
は、後述するように、対応する特徴の量に算定数値と関
係する。
【0021】客観的特徴 客観的特徴は最も容易に計算でき、他のタイプの特徴と
比較して最も一貫した結果をもたらす。計算方法は、長
い間利用可能であり、イメージングサイエンスの大部分
の技術がかかる測定を基礎としていた。数多くの客観的
特徴が計算されたが、色の多彩さ及びシャープネスが画
像強調及びアピール(図1及び図2)の双方の目的のた
めに考慮され、さらに画像強調にはユニークフォーマッ
ト及び代表的色が考慮された(図1)。コントラスト及
びノイズのような他の客観的特徴は、特定の状況にて有
用であることが判明し、本発明の適用範囲内に包含され
る。
【0022】色の多彩さ 色の多彩さ検出器38は、多彩な写真はさまざまな色合
いにて高彩度を表示する色を有するという観察に基づい
て、色の多彩さの定量的測定を可能にする。これは、さ
まざまな色合いに沿って高彩度色の有無を調べることに
より、地上調査決定された。RGB色空間の仮定は、画
像データに関して行った。特に、図6に示すように、色
の多彩さ検出器38は色多彩を計算する以下の工程を実
行する。まず、工程60にて、入力画像値iをルミナン
ス/クロミナンス空間へ変換させる。多くのかかる変換
は当業者には公知であり、本発明とともにうまく利用さ
れるが、好適な変換は以下の式に従って実行される。
【0023】
【数1】 式中、ニュートラルはルミナンスの尺度であり、グリー
ン−マゼンタ及びイルミネーションはクロミナンスの尺
度である。工程62にて、クロミナンス平面(イルミネ
ーション、グリーン−マゼンタ)は分割され、図7に示
す12個の色度平面分割の分けられ、それぞれを角度容
器という。次に、工程64では、クロミナンス成分は容
器の境界に位置するならば、各画素が一つの角度容器と
関係する。各角度容器の各画素に対して、彩度レベル
(オリジンからの距離である)が工程66で計算され
る。次いで、各角度容器に位置する高彩度画素の数を工
程68で計算し、高彩度画素は、クロミナンス平面での
オリジンからの距離があるしきい値T(例えば、T
=0.33)以上の画素である。各角度容器に対して、
高彩度画素の数があるしきい値Tc(例えば、Tc=2
50画素)を超えているならば、工程70にて、その容
器は活性と決定される。その後、工程72にて、色の多
彩さが以下の式に従って計算される
【0024】
【数2】 なお、色の多彩さは12のうちの10の容器が占められ
ているならば、色の多彩さは1.0とみなされ、画像が
最も多彩であると仮定する。
【0025】シャープネス シャープネス検出器36は、画像のシャープネス特徴を
発見するために以下の工程を実行する: a) 画像を境界に沿って20%レベル切り込み、グリ
ーンチャンネルを抽出させてグレースケールへ変換させ
る。 b) ノイズを削減させるために、3x3平均化フィル
タをかけた後、ソーベルオペレータ(sobel operator)
を利用して、グリーンチャンネルにて画像縁部を検出す
る。 c) ヒストグラム端部を形成し、最も強い縁部を含有
する領域を、ヒストグラム縁部の100分の90以上で
ある領域として識別する。 d) 最も強い縁部領域を中程度フィルタにより改良
し、最も強い縁部の統計を計算する。そして、 e) 最も強い縁部の平均からシャープネスの評価を得
る。
【0026】シャープネス検出に利用される方法の詳細
は、本願の参考文献に援用される、Andreas SavakisとA
lexander Louiの名で1999年3月23日に出願し
た、発明名称「A Method for Automatically Detecting
Digital Images that are Undersirable for Placing
in Albums」である、本願と同一の譲受人の米国特許出
願第09/274,645号に開示されている。
【0027】フォーマットユニークさ 地上調査の参加人から、APS「パノラマ」モードで撮
影した写真は、より強調する価値があることが分かっ
た。地上調査データの予備的解析から、写真がパノラマ
のみの群の写真であるならば、強調画像として選択され
る蓋然性が増すことが分かった。相対的特徴である「フ
ォーマットユニークさ」は本性質を表出させる。
【0028】ユニークフォーマット検出器40は、群の
各画像iに対する以下のアルゴリズムを実行し、フォー
マットfは画像の長い、短い画素寸法l、sに基づ
いている。
【0029】
【数3】 ついで、フォーマットのユニークさUは、
【0030】
【数4】 で表わされる。
【0031】代表的色 代表的色の検出器42は、画像の色を同様に表示するか
を決定する以下の工程を実行する: 1. 各画像iに対して、色ヒストグラムhi(R,
G,B)(RGB又はルミナンス/クロミナンス空間)
を計算する。 2. 以下の全ての画像ヒストグラムを平均化させるこ
とにより、群に対して平均色ヒストグラムを求める。
【0032】
【数5】 3. 各画像iに対して、画像のヒストグラムと平均色
ヒストグラムとの間の距離を(ユークリッド又はヒスト
グラム公差距離)、以下のように計算する。
【0033】
【数6】 4. 以下のように、3にて計算した距離の最大を求め
る。
【0034】
【数7】 5. 代表的測定値rを、最大の距離で各距離を以下の
ようにして割って求める。
【0035】
【数8】 人‐関連特徴 人関連特徴は、画像強調を決定する際には重要である
が、人に関連する多くの積極的属性は、例えば、人の笑
顔、カメラと対面する人などを計算することが困難であ
る。皮膚検出方法により、多くの人に関連する特徴、例
えば、人の存在、皮膚領域の大きさ、クローズアップの
程度のような特徴の計算を可能にする。
【0036】皮膚及び顔の検出 皮膚検出器26を利用する皮膚検出方法、及び顔検出器
28を利用する顔検出方法は、本願の参考文献として援
用される、H. C. LeeとH. Nicponskiの名義で1998
年7月9日に出願され、本願と共通の譲受人による発明
名称「A Methodfor Detecting Human Faces in Digitiz
ed Images」である米国特許出願第09/112,661
号に開示されている。
【0037】図8を参照するに、前記の米国特許出願第
09/112,551号に開示した方法の全体を示す。
入力画像は色均衡されており、工程S102での優先的
全体照射を補正し、(r,g,b)値を(L,s,t)
値へ変換する。(L,s,t)空間では、L軸は色の輝
度を表わし、一方、s及びt軸は色軸(chromatic axes)
である。s成分は日光からタングステン光、青から赤の
照射変動をほぼ表示する。t成分は緑とマゼンタとの間
の軸を表わす。数多くの周知の色バランスアルゴリズム
が、平均化からグレーへの単純方法を含む上記工程に利
用される。次に、kモードクラスター化アルゴリズムが
工程S104の色分割に利用される。本アルゴリズムの
開示は、本願の参考文献として援用され、本願と共通の
譲受人の米国特第5,418,895号に含まれてい
る。基本的には(L,s,t)空間の3D色ヒストグラ
ムが入力色画像から形成され、クラスター化アルゴリズ
ムにより処理される。本工程の結果は、ユニークラベル
を有する各領域が繋がった領域マップである。各領域で
は、平均化ルミナンス及び色度が、工程S106で計算
される。上記特徴は、条件的確率及び適応しきい値に基
づいて、可能な皮膚領域(候補皮膚領域)を予測するの
に利用される。各皮膚領域のスケール及び平面での回転
ポーズの評価は、最善楕円を工程S108の各皮膚領域
に適合させることにより行われる。上記評価でのスケー
ル範囲及び平面での回転ポーズを利用して、一連の線形
フィルターリング工程を、一時的に顔特徴を識別する工
程S110ので各顔領域に適用される。数多くの確率の
測定基準は工程S112で利用され、実際にその領域が
顔特徴及びその特徴のタイプを表示する蓋然性を予測す
る。
【0038】先のスクリーニング工程を通過した特徴
は、提案顔のため、工程S114にて初期の特徴として
利用される。投影配置を利用して、三つの初期特徴の識
別が頭のポーズの可能な範囲を画定する。総括的な3次
元頭モデルと顔特徴の位置の変動範囲とともに、各潜在
的に可能な顔ポーズは、残余の顔特徴の位置を予測する
ために利用し得る。候補顔特徴のリストは、予測特徴が
配置されるかを知るためにサーチされる。予測位置及び
配向への候補特徴の近接は、その特徴の確率的評価の有
効性に影響を及ぼす。
【0039】頭のベイズネットワーク確率モデルは工程
S116で、顔の有無の蓄積された証拠を解釈するため
に利用される。そのネットワークの先の確率は、さまざ
まな配向及びスケールの頭のある画像の一連の調整から
抽出される。そのネットワークは候補顔の提案した特徴
で、及び計算の測定基準及びテンプレートへの空間的適
合に基づく評価した確率で開始する。顔の存在の確立の
全体評価に収束するまで、そのネットワークが初期条件
で実行される。二進法評価を必要としないときに、その
可能性がハードしきい値に対して対比され、確率の形で
残る。皮膚及び顔検出方法のさらに詳しい説明は、本願
の参考文献として援用される米国特許出願第09/11
2,6612号に開示されている。
【0040】皮膚領域 写真の皮膚/顔領域の割合は、皮膚領域検出器20によ
り、人検出及びクローズアップ検出の予備的工程として
計算される。結果として、皮膚領域検出器20の出力は
分類段階14と接続しており、クローズアップ検出器2
2及び人検出器24へ入力される。皮膚領域は0と1と
の間で連続可変であり、人に関連する数多くの特徴と相
関する。例えば、同じ距離から撮影した写真では、皮膚
領域は増すことは写真に多くの人が存在していることを
意味し、「写真の全体群」の積極的なインディケータと
関係する。あるいは、二つの写真には同数の人がいると
すると、大きな皮膚領域があることは、「クローズアッ
プ」の積極的属性と相関する大きな倍率を示唆する。大
きな皮膚領域の他の説明は、対象物の加工に起因しても
起こり得る。クローズアップ クローズアップ検出器22はクローズアップ決定の以下
の測定を利用する: a) 皮膚検出が実行され、結果発生したマップは中央
領域(境界から25%)で調査され、 b) クローズアップは、画像のその中央領域の皮膚領
域の割合として決定される。
【0041】ある場合には、クローズアップ決定では、
皮膚検出よりも顔検出が適正である。
【0042】人の存在 皮膚領域の重要量が画像にあるときには、人の存在は人
検出器24により検出される。画像の皮膚画素が計算さ
れ、皮膚割合が画素のしきい値Tf数(例えば、Tf=
20画素)以上である場合には人が存在するとみなされ
る。人が存在することは、人の有無をそれぞれ1または
0の二進法の特徴で表わす。
【0043】成 分 特 徴 良性成分は画像強調の非常に重要な積極的属性であり、
悪性成分は通常いわれているネがティブな属性である。
画像成分の自動評価は非常に困難であり、しばしば主観
的である。良性成分は数多くの通常周知な規則、例え
ば、ルールオブサードに従うが、しばしば上記規則に違
反して、写真家の考えを表現する。
【0044】主要対象物の検出 主要対象物検出器34により利用されるアルゴリズム
は、J. Luo, S. EtzとA.Singhalの名義で、本願と共通
の譲受人による1998年12月31日に出願した発明
名称「Method for Automatic Determination of Main S
ubjects in Consumers Images」の米国特許出願第09/
223、860号に開示されている。図9を参照する
に、前記米国特許出願に開示された主要対象物検出方法
の全体を示す。まず、自然風景(シーン)の入力画像を
得て、デジタル形態で工程S200にて保存される。次
いで、工程S202で画像が一様な性質の数領域に分割
される。次に、分割領域を工程S204で、非目的知覚
グルーピングによる類似の測定に基づき大きな群にグル
ープ化させ、さらに工程S206にて目的グルーピング
(特定目的に関係する目的グルーピング)による知覚的
に統一した目的に対応する大きな領域にグループ化させ
る。二つの独立しているが、相補的なタイプの目立つ特
徴、具体的には構造的に目立つ特徴とセマティックに目
立つ特徴を利用して、上記領域を工程S208にて評価
する。構造的に目立つ特徴には一組の低レベルの初期視
覚特徴と一組の形態上の特徴を含み、工程S208aに
て抽出され、されに加工されて一組の自己の目立つ特徴
と一組の相対的に目立つ特徴が生じる。鍵を握る対称物
形態であるセマティックに目立つ特徴は、前景(例え
ば、人)又は背景(例えば、空や芝生)のどちらかの一
部となる傾向があり、工程S208bで検出され、セマ
ティックな手掛かり及び景色内容の手掛かりを提供す
る。両タイプの証拠は、ベイズネットに基づく推論エン
ジンを利用して工程S210で統合され、工程S212
にて主要対象物の最終信念マップができる。
【0045】画像のセマティック解釈の目的のために
は、単一の基準では明らかに不十分である。実世界の対
象物とシナリオの先天的知識と膨大なメモリのある人の
脳を、シーンの興味ある又は主要な対象物の評価を与え
るために、異なる主観的基準と組合わせる。特徴の以下
の拡張リストは、位置、サイズ、輝度、色の多彩さ、質
感、主要対象物、形、対称、空間的関係(周囲/閉
鎖)、境界、室内/室外、配向、深さ(該当すると
き)、移動(ビデオ配列に該当するとき)のような主要
対象物検出としてのやや無体物の仕事を実行する際に人
の脳に影響を及ぼすと信じられている。
【0046】低レベルの初期視覚特徴には、色、輝度及
び色調がある。形状特徴には、位置(中央)、空間的関
係(境界、隣接、周囲及び閉鎖)、サイズ、形及び対象
がある。セマティック特徴には、皮膚、顔、空、芝生及
び他の緑黄色野菜がある。当業者には、本発明の範囲か
ら逸脱することなく多くの特徴を定義することができ
る。主要対象物検出アルゴリズムの詳細は、本願の参考
文献として援用される米国特許出願第09/223,8
60号に記載されている。
【0047】主要対象物検出アルゴリズムの前記したバ
ージョンは、計算に集中しており、別のバージョンは対
象物に関連した特徴の小さな組への基礎対称物検出を利
用する。本願で考慮する全ての成分測定は、主要対象物
信念マップに関し、システムを上記測定の多くの計算に
有効な観点から、例えば、「中心度」測定を有する観点
から、集中させることができ、ある程度の精度を犠牲し
て全体の計算複雑性を低下させる。再調整させるべきア
ルゴリズムを要せず、このようにして特徴を排除するこ
とができるのは、主要対象物検出にて利用されるベイズ
ネットワークの有用な性質である。次に、主要対象物検
出器50へ供給される画像は、右側に配向していること
が公知である。シーン内の領域の空間位置と関連した対
象物関連特徴は、上記知識を反映させるために変形され
得る。例えば、シーン配向が未知ならば、主要対象物検
出器50は主要対象物領域の中心に重心がある分布であ
ると仮定するが、配向が既知ならば、底の中心に重心が
ある分布があると仮定する。
【0048】図3を参照するに、主要対象物信念マップ
が主要対象物検出器50にて計算された後、クラスター
化段階31で強度値のk‐ミーンズクラスター化を利用
して三つの領域に分割する。三つの領域は主要対象物の
一部であるという高確率を有する画素と、主要対象物の
一部であるという低確率を有する画素と、中間画素とに
対応する。量子化マップに基づいて、主要対象物サイ
ズ、中心度、緻密度及び興味(分散)の特徴は、図5A
から図5Dを参照して、以下に説明するように計算され
る。
【0049】主要対象物分散 写真の内容を特徴付ける一つの方法は、どのような興味
があるかによる。強調画像選択の目的のため、以下の特
性を有する画像が興味を示すと考えられる:主要対象物
自体がフレームの配置内で興味があり、主要対象物は写
真の適度の大きさの面積を構成するが、全体のフレーム
ではなく、背景は主要対象物から注意を散らす分離物体
を有しない。
【0050】画像興味のレベルの評価は、主要対象物マ
ップの分散を評価することにより計算される。上記特徴
はカウンターインディケータとして、主に変数である。
つまり、興味のない画像は強調画像にすべきではない。
特に、図5Aに示すように、主要対象物分散検出器3
0.1は、主要対象物分散を計算する以下の工程を実行
する。まず、工程S10にて、全主要対象物信念マップ
値の統計的変動vを計算する。工程S12にて、主要対
象物分散特徴yは次の式により計算される:
【0051】
【数9】 主要対象物中心度 主要対象物中心度は画像中心と、量子化された主要対象
物信念マップの高確率(及び任意の中間確率)領域の重
心との間の距離として計算される。特に、図5Bに示す
ように、主要対象物中心度検出器30.2は主要対象物
中心度を計算ための以下の工程を実行する。まず、工程
S20にて、高値クラスターの重心の画素座標を位置決
めする。工程S22にて、画像の中心から重心のユーク
リッド距離jを計算する。工程S24にて、正規化距離
kを画像の最も短いサイドに沿って画素数によりjを割
ることにより計算する。工程S26にて、主要対象物特
徴Mは以下の式により計算される。
【0052】
【数10】 主要対象物サイズ 主要対象物のサイズは、量子化された主要対象物信念マ
ップの高確率(及び任意の中間確率)領域のサイズによ
り決定される。高(及び任意の中間)確率領域により占
有される中央領域(境界から25%のところ)の割合で
表現される。特に、図5Cに示すように、主要対象物サ
イズ検出器32は主要対象物サイズを計算する以下の工
程を実行する。まず、工程S30にて、最高値クラスタ
の交差の画素Gの数と画像領域の矩形中心の1/4がカ
ウントされる。工程S32にて、主要対象物サイズ特徴
Gは次の式により計算される: g = f/N ここで、Nは画素数の全数である。
【0053】主要対象物緻密度 主要対象物の緻密度は、量子化された主要対象物信念マ
ップの高確率(及び任意の中程度土確率)領域の境界矩
形を計算し、次いで、主要対象物により占有される境界
矩形の割合を調査することにより見積られる。特に、図
5Dに示すように、主要対象物緻密度検出器30.3は
主要対象物緻密度を計算する以下の工程を実行する。先
ず、工程S40にて、最高値クラスターの画素数aをカ
ウントする。工程S42にて、最高値クラスターの全画
素を有する最も小さな矩形ボックス(境界ボックス)を
計算し、工程S44にて、画素の境界面積bを算定す
る。工程S46にて、主要対象物緻密度特徴eを次の式
により求める;
【0054】
【数11】 ここでeは0と1との間で、それに含まれる値である。
【0055】分 類 段 階 前記したアルゴリズムによリ発生した特徴量を分類段階
14に適用し、入力して、自己及び/または相対的に目
立つ特徴を受容する推論エンジンを利用するのが好まし
く、画像評価(強調及びアピール)値は発生させるよう
に調整される。実像の人の観察者評価の地上調査の結果
から得られる知識から、さまざまな証拠が各々競争又は
強化される。競争及び強化により推論エンジンの干渉ネ
ットワークが解決される。好適な推論エンジンはベイズ
ネットワークである。
【0056】ベイズネット(J. Pearl, Probablistic R
easoning in intelligent Systems,San Francisco, CA:
Morgan Kaufmann, 1988を例えば参照)は、グラフのさ
まざまな物体間の因果関係を表示する指向非環状グラフ
であり、リンクの方向は因果関係を示す。評価はさまざ
まな物体間の共同確率分布機能(PDF)に基づいてい
る。ベイズネットの効果には、明白な不確実特性、効率
的な計算、容易な構築及びメンテナンス、迅速な調整及
びネットワーク構造及びそのパラメータにおける変化へ
の迅速な適応がある。ベイズネットは四つの成分からな
る。
【0057】事前:ベイズネットのさまざなまノードに
ついての初期信念 条件的確率マトリックス(CPM):ベイズネットの二
つの接続されたノード間の関係についての専門知識 証拠:ベイズネットへ入力された特徴検出器からの観察 事後:証拠がベイズネットを介して伝播された後の最終
的に計算された信念調整用の最も重要な成分は、図1に
示されるCPM段階15.1、...、15.9(図2
では15.1、...、15.7)として示される一組
のCPMである。なぜならば、直ぐに特定応用に対する
ドメイン知識を表わすからである。CPMの導関数はベ
イズネットのような推論エンジンを利用する当業者には
知識があり、典型的なCPMの導関数は、以下に説明さ
れる。
【0058】図1及び図2を参照するに、単純な2レベ
ルベイズネットは現在のシステムにて利用され、強調
(若しくはアピール)評価はルートノードで決定され、
全ての特徴検出器はリーフノードにある。なお、各リン
クは同じレベルで他のリンクとは条件的には独立してい
ると仮定し、各リンクを別々に調整することにより、つ
まり、他とは独立した一定のリンクに対するCPMを誘
導することにより、全体ネットの便利な調整を行える。
この仮定は実際にはしばしば破られるが、独立単純化に
より実行可能にし、合理的な結果が生じる。また、分類
器又は推論エンジンと比較してベースラインを提供す
る。
【0059】確率の推論 全ての特徴はベイズネットにより統合され、強調値また
はアピール値を与える。一方で、さまざまな証拠が互い
に競争し、または矛盾する。他方で、さまざまな証拠が
典型的な写真シーンの先行モデル若しくは知識に応じて
相互に強化される。競争及び強化の双方が、ベイズネッ
トを基礎とする干渉エンジンによる解決される。
【0060】図10を参照するに、2‐レベルベイズネ
ットは、さまざなま特徴検出器間で条件的に独立してい
ると仮定して本発明で利用される。強調値若しくはアピ
ール値はルートノード44で決定され、全ての特徴検出
器はリーフノード46で決定される。各画像に対して動
作する一つのベイズネットがある。本発明は、本発明の
範囲から逸脱することなく、2レベル以上を有するベイ
ズネットで利用されることは理解できる。
【0061】ベイズネットの調整 ベイズネットのある効果は、各リンクは同じレベルにあ
る独立したリンクであると仮定することにある。したが
って、各リンクを別々に調整することにより、つまり他
と独立である一定のリンクに対するCPM15.
1、...、15.9を誘導することにより、全体のネ
ットを調整することは便利である。一般に、各ルート特
徴ノードペアを得るために、二つの方法が利用される。 1.専門知識を利用すること これはad−hoc法である。専門家と相談し、かなり
アピールする画像を与える高若しくは低出力を発生させ
る各特徴検出器の条件的確率を入手する。 2.偶発性テーブル(contingency table)を利用するこ
と これはサンプリング及び相関方法である。強調若しくは
アピールに関する情報に沿って、各特徴検出器の多くの
観察を記録する。次いで、上記観察は一緒に編集して偶
発性テーブルを作成し、正規化させ、CPM15.
1、...、15.9として利用可能である。本方法は
ニュートラルネットワークタイプの調整(学習)と同様
である。本方法は本発明にて好適な方法である。
【0062】例として任意の特徴のCPMを検討する。
地上調査及び特徴検出器から誘導された偶発性テーブル
を利用して、このマトリックスを発生させた。通常、特
徴検出器は二進法の決定をもたらさず(表1を参照)、
分割内容はCPMを誘導する際に利用される。CPMの
エントリは、以下のように決定される:
【0063】
【数12】 ここで、Iは全ての調整画像群の組であり、Rは群
の全ての画像の組であり、nは群iの観察(観察者)
の数である。さらに、Frは画像rのMラベル特徴ベク
トルであり、TrはLレベルの地上調査ベクトルであ
り、Pは正規化定数印しの対角線マトリックスLxLで
ある。例えば、表1では、画像1、4、5及び7は、表
2のボックス00、11、10及び01にそれぞれ寄与
する。なお、全ての信念値は正確な信念センサにより正
規化されている。中心度のCPMの第一のカラムの直感
的解釈として、高特徴を有する画像が、高特徴値ではな
くかなりアピールするものよりの約2倍の値を有する。
【0064】
【表1】
【0065】
【表2】 本発明はベイズネットを利用して説明したが、さまざな
ます推論エンジンはベイズネットに代わって利用され得
る。例えば、B. D. Ropley(ケンブリジユニバーシティ
プレス、1996年)によるPattern Recognition and N
eutral Networksには、多くの異なる分類器が記載され
ており、パターン認識問題を解決するために利用され、
正確な特徴を有することは、通常、最も重要な考慮すべ
きことである。かかる分類器には、線形識別解析方法、
柔軟な識別、(送り方向)ニュートラルネットワーク、
非パラメータ方法、ツリー構造分類器及び信念ネットワ
ーク(ベイズネットワークのような)がある。上記分類
器のいずれもが、本発明を実施する推論エンジンとして
採用されることは、かかる方法が属する当業者には明白
である。
【0066】コンピュータシステム 本発明を説明する際に、本発明は、パーソナルコンピュ
ータのような何れかの周知なコンピュータシステムを利
用することが好ましいことは明白である。そのため、コ
ンピュータシステムは本願では詳細には説明していな
い。なお、画像はコンピュータシステムに直接入力され
る(例えば、デジタルカメラによる)、又はコンピュー
タシステムへの入力前にデジタル化される(銀塩フィル
ムのようなオリジナルをスキャンさせることにより)。
【0067】図11を参照するに、本発明を実施するコ
ンピュータシステム110を例示する。コンピュータシ
ステム110は好適な実施態様を説明する目的で示す
が、本発明は例示したコンピュータシステムに制限され
ず、何れかの電子処理システムにて利用される得る。コ
ンピュータシステム110は、ソフトウェアプログラム
を収納し処理し、他の加工機能を実行するマイクロプロ
セッサを基礎とするユニット112を具備する。ディス
プレイ114は、ソフトウェアと関連したユーザ関連情
報を表示するマイクロプロセッサを基礎とするユニット
112、例えば、グラフィカルユーザインターフェース
と電気的に接続している。また、キーボード116は、
ユーザがソフトウェアに情報を入力することを可能にす
るマイクロプロセッサを基礎とするユニット112と接
続している。入力用のキーボード116を利用すること
の代替として、当業者には周知であるように、ディスプ
レイ114にセレクタ120を移動させ、セレクタ12
0が重なるアイテムを選択するマウス118が利用され
得る。
【0068】コンパクトディスク読取り専用メモリCD
‐ROM122はソフトウェアプログラムを収納し、そ
のソフトウェアプログラム及び他の情報をコンパクトデ
ィスク124を介してマイクロプロセッサ112へを入
力するマイクロプロセッサを基礎とするユニット112
と接続する。通常、CD−ROM122はソフトウェア
プログラムを具有する。本発明によれば、本ソフトウェ
アプログラムは本願で開示する画像評価プログラムを具
有するだけでなく、自動アルバム化プログラムのよう
な、出力を利用するプログラムをも具有する。加えて、
また、フロッピーディスク126はソフトウェアプログ
ラムを具有し、ソフトウェアプログラムを入力するマイ
クロプロセッサを基礎とするユニット112に挿入され
る。さらに、マイクロプロセッサを基礎とするユニット
112は当業者には周知であるように、ソフトウェアプ
ログラムを内部に格納するようにプログラム化されてい
る。また、マイクロプロセッサを基礎とするユニット1
12は、電話線のようなネットワーク接続127をも有
し、ローカルエリアネットワーク若しくはインターネッ
トにような外部ネットワークと接続している。したがっ
て、遠隔サーバに格納されているプログラムは、必要な
ときにアクセス、つまりダウンロードされている。プリ
ンタ128は、コンピュータシステム110の出力のハ
ードコピーを印字するためのマイクロプロセッサを基礎
とするユニット112と接続されている。
【0069】また、画像は従来から公知のカード130
に電気的に埋設されているデジタル化画像を含有する
(パーソナルコンピュータメモリカードインターナショ
ナル協会の仕様に基づく)PCMCIAカードのような
パーソナルコンピュータカード(PCカード)130を
介して、ディスプレイ114に表示される。PCカード
130は、ディスプレイ114に画像の視覚的表示を可
能にするマイクロプロセッサを基礎とするユニット11
2へ最終的に挿入される。また、画像はPCカード13
0、フロッピーディスク126又はコンパクトディスク
124に保存され、ネットワーク接続127を介して入
力され、デジタルカメラ(図示せず)またはスキャナー
(図示せず)のような多様なソースから入手可能であ
る。
【0070】本発明の主題は、デジタル画像理解技術に
関係しており、デジタル画像をデジタル的に認識できる
平均的技術では理解でき、よって人が理解可能な物体、
属性または条件に有用な意味があり、デジタル画像の将
来の加工において入手される結果を利用することができ
る。
【0071】本発明は好適な実施態様を参照して説明さ
れる。しかしながら、本発明の範囲から逸脱することな
く、当業者には変更及び変形態様をなすことは理解でき
る。本発明は時々自動アルバム化と関係して説明した
が、本発明には多くの他の使用があり、特に、画像が相
対的値または固有値に基づく加工を評価する必要性があ
る画像処理応用の何れかの種類がある。
【図面の簡単な説明】
【図1】画像の強調値を計算するネットワークのブロッ
ク図である。
【図2】画像のアピール値を計算するネットワークのブ
ロック図である。
【図3】図1及び図2に示す主要対象物検出の構成をよ
り詳細に示すブロック図である。
【図4】一群の画像の相対的強調を計算するためのネッ
トワークアーキテクチャのブロック図である。
【図5A】主要対象物の図3に示す構成方法の詳細な図
である。
【図5B】主要対象物の図3に示す構成方法の詳細な図
である。
【図5C】主要対象物の図3に示す構成方法の詳細な図
である。
【図5D】主要対象物の図3に示す構成方法の詳細な図
である。
【図6】画像の色の多彩さを決定する方法の詳細な図で
ある。
【図7】色の多彩さ特徴計算に利用される色度面分割の
図である。
【図8】皮膚及び顔の検出方法のブロック図である。
【図9】図5に示す主要対象物検出の詳細なブロック図
である。
【図10】図1及び図2に示すネットワークに利用され
る二つのレベルのベイズネットの図である。
【図11】先の図に記載された発明を実施するためのコ
ンピュータシステムの斜視図である。
【符号の説明】
10 画像強調ネットワーク 12 特徴抽出段階 14 分類段階 16 対比段階 18 正規化段階 20 皮膚領域検出器 22 クローズアップ検出器 24 人検出器 26 皮膚検出器 28 顔検出器 30 成分検出器 30.1 主要対象物分散アルゴリズム 30.2 主要対象物中心度アルゴリズム 30.3 主要対象物緻密度アルゴリズム 31 クラスター化段階 32 主要サイズ検出器 34 主要対象物検出器 36 シャープネス検出器 38 色の多彩さ検出器 40 ユニークフォーマット検出器 42 代表的色検出器 44 ルートノード 46 ルーフノード 50 主要対象物検出器 52 クラスター化段階 110 コンピュータシステム 112 マイクロプロセッサを基礎とするユニッ
ト 114 ディスプレイ 116 キーボード 118 マウス 120 セレクタ 122 CD−ROM 124 CD 126 フロッピーディスク 127 ネットワーク接続 128 プリンター 130 PCカード

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 特徴に関して、画像の重要度、興味度又
    は魅力度の決定を行う画像の評価方法であって、 (a) 画像に対応するデジタル画像を得る工程と、 (b) 前記デジタル画像のその内容に関連した一つ以
    上の特徴に関連した一つ以上の量を計算する工程と、 (c) 一人以上の観察者の意見に調整される推論アル
    ゴリズムで前記一つ以上の量を加工する工程と、 (d) 画像を評価する推論アルゴリズムから出力を生
    じさせる工程と、を具備する評価方法。
  2. 【請求項2】 前記工程(c)の推論アルゴリズムは候
    補画像の地上調査から少なくとも部分的に調整される、
    請求項1に記載した評価方法。
  3. 【請求項3】 前記推論アルゴリズムはベイズネットワ
    ークである、請求項1に記載の評価方法。
JP2000378621A 1999-12-14 2000-12-13 消費者画像の強調及び魅力の自動評価方法 Pending JP2001202522A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US460759 1999-12-14
US09/460,759 US6671405B1 (en) 1999-12-14 1999-12-14 Method for automatic assessment of emphasis and appeal in consumer images

Publications (1)

Publication Number Publication Date
JP2001202522A true JP2001202522A (ja) 2001-07-27

Family

ID=23829974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000378621A Pending JP2001202522A (ja) 1999-12-14 2000-12-13 消費者画像の強調及び魅力の自動評価方法

Country Status (3)

Country Link
US (1) US6671405B1 (ja)
EP (1) EP1109132A3 (ja)
JP (1) JP2001202522A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005050357A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2009259035A (ja) * 2008-04-17 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 視線位置推定方法、視線位置推定装置、コンピュータプログラム、及び記録媒体
JP7486337B2 (ja) 2020-04-15 2024-05-17 日本放送協会 映像抽出装置及びプログラム

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ464099A0 (en) * 1999-12-14 2000-01-13 Canon Kabushiki Kaisha Emotive editing system
US6910000B1 (en) * 2000-06-02 2005-06-21 Mitsubishi Electric Research Labs, Inc. Generalized belief propagation for probabilistic systems
US6748097B1 (en) 2000-06-23 2004-06-08 Eastman Kodak Company Method for varying the number, size, and magnification of photographic prints based on image emphasis and appeal
GB2370438A (en) * 2000-12-22 2002-06-26 Hewlett Packard Co Automated image cropping using selected compositional rules.
US7035477B2 (en) * 2000-12-22 2006-04-25 Hewlett-Packard Development Comapny, L.P. Image composition evaluation
JP4277309B2 (ja) * 2001-02-28 2009-06-10 富士フイルム株式会社 デジタルカメラ
JP4199939B2 (ja) * 2001-04-27 2008-12-24 株式会社日立製作所 半導体検査システム
GB0116113D0 (en) * 2001-06-30 2001-08-22 Hewlett Packard Co Tilt correction of electronic images
GB2378340A (en) * 2001-07-31 2003-02-05 Hewlett Packard Co Generation of an image bounded by a frame or of overlapping images
US6938222B2 (en) * 2002-02-08 2005-08-30 Microsoft Corporation Ink gestures
GB2394851A (en) 2002-10-30 2004-05-05 Hewlett Packard Co A camera having a user operable control for producing a saliency signal representative of a user's interest in a scene being imaged
US7590287B2 (en) 2002-11-06 2009-09-15 Agency For Science, Technology And Research Method for generating a quality oriented significance map for assessing the quality of an image or video
US7233684B2 (en) 2002-11-25 2007-06-19 Eastman Kodak Company Imaging method and system using affective information
US7391885B2 (en) * 2003-07-30 2008-06-24 Xerox Corporation Method for determining overall effectiveness of a document
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
US7382903B2 (en) 2003-11-19 2008-06-03 Eastman Kodak Company Method for selecting an emphasis image from an image collection based upon content recognition
US20050254727A1 (en) * 2004-05-14 2005-11-17 Eastman Kodak Company Method, apparatus and computer program product for determining image quality
JP2006094053A (ja) * 2004-09-22 2006-04-06 Fuji Photo Film Co Ltd フォトムービー作成方法および装置、並びにフォトムービー作成プログラム
US7809197B2 (en) * 2004-12-09 2010-10-05 Eastman Kodak Company Method for automatically determining the acceptability of a digital image
US20060125928A1 (en) * 2004-12-10 2006-06-15 Eastman Kodak Company Scene and user image capture device and method
US7760372B2 (en) 2005-01-11 2010-07-20 Xerox Corporation Method for automated document selection
US7451140B2 (en) * 2005-01-11 2008-11-11 Xerox Corporation System and method for proofing individual documents of variable information document runs using document quality measurements
JP2008529150A (ja) * 2005-01-28 2008-07-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ダイナミックフォトコラージュ
JP4588642B2 (ja) * 2005-03-15 2010-12-01 富士フイルム株式会社 アルバム作成装置、アルバム作成方法、及びプログラム
CN101253537B (zh) * 2005-05-12 2012-10-10 富士胶片株式会社 影集制作装置、影集制作方法及程序
US7760956B2 (en) 2005-05-12 2010-07-20 Hewlett-Packard Development Company, L.P. System and method for producing a page using frames of a video stream
JP2007097090A (ja) * 2005-09-30 2007-04-12 Fujifilm Corp 画像表示装置および方法ならびにプログラム、さらに写真プリント注文受付装置
EP1785847B1 (en) * 2005-10-27 2015-11-18 Accenture Global Services Limited Display apparatus for automatically visualizing an application landscape
KR100647337B1 (ko) * 2005-11-17 2006-11-23 삼성전자주식회사 지역 분할 템플릿을 이용한 카테고리 기반 사진 클러스터링방법 및 시스템
US7561722B2 (en) * 2005-12-14 2009-07-14 Xerox Corporation System and method for interactive document layout
US8116573B2 (en) * 2006-03-01 2012-02-14 Fujifilm Corporation Category weight setting apparatus and method, image weight setting apparatus and method, category abnormality setting apparatus and method, and programs therefor
US8135684B2 (en) * 2006-04-13 2012-03-13 Eastman Kodak Company Value index from incomplete data
US7742083B2 (en) * 2006-04-13 2010-06-22 Eastman Kodak Company In-camera dud image management
US8330830B2 (en) * 2006-04-13 2012-12-11 Eastman Kodak Company Camera user input based image value index
US7467222B2 (en) * 2006-05-12 2008-12-16 Shutterfly, Inc. Image ranking for imaging products and services
US20080085032A1 (en) * 2006-10-06 2008-04-10 Cerosaletti Cathleen D Supplying digital images from a collection
US20080085055A1 (en) * 2006-10-06 2008-04-10 Cerosaletti Cathleen D Differential cluster ranking for image record access
US20080155422A1 (en) * 2006-12-20 2008-06-26 Joseph Anthony Manico Automated production of multiple output products
US20080215984A1 (en) * 2006-12-20 2008-09-04 Joseph Anthony Manico Storyshare automation
US8035747B2 (en) * 2007-01-05 2011-10-11 Eastman Kodak Company Image digital processing based on edit status
US8132096B1 (en) * 2007-03-26 2012-03-06 Hewlett-Packard Development Company, L.P. Image composition evaluation
US7917518B2 (en) * 2007-07-20 2011-03-29 Hewlett-Packard Development Company, L.P. Compositional balance and color driven content retrieval
US8122356B2 (en) * 2007-10-03 2012-02-21 Eastman Kodak Company Method for image animation using image value rules
US20090132264A1 (en) * 2007-11-16 2009-05-21 Wood Mark D Media asset evaluation based on social relationships
JP5083138B2 (ja) * 2008-09-12 2012-11-28 株式会社ニコン 画像分類装置
US9152292B2 (en) * 2009-02-05 2015-10-06 Hewlett-Packard Development Company, L.P. Image collage authoring
JP5149858B2 (ja) * 2009-04-20 2013-02-20 富士フイルム株式会社 カラー画像の代表色決定装置およびその動作制御方法
US8478053B2 (en) * 2009-07-15 2013-07-02 Nikon Corporation Image sorting apparatus
US8238615B2 (en) * 2009-09-25 2012-08-07 Eastman Kodak Company Method for comparing photographer aesthetic quality
US8311364B2 (en) * 2009-09-25 2012-11-13 Eastman Kodak Company Estimating aesthetic quality of digital images
US8330826B2 (en) * 2009-09-25 2012-12-11 Eastman Kodak Company Method for measuring photographer's aesthetic quality progress
US9619469B2 (en) * 2009-12-22 2017-04-11 Apple Inc. Adaptive image browsing
TWI432168B (zh) * 2009-12-31 2014-04-01 Univ Nat Yunlin Sci & Tech 內視鏡導航方法以及內視鏡導航系統
US20110191141A1 (en) * 2010-02-04 2011-08-04 Thompson Michael L Method for Conducting Consumer Research
US8831360B2 (en) 2011-10-21 2014-09-09 Intellectual Ventures Fund 83 Llc Making image-based product from digital image collection
US9336442B2 (en) 2012-01-18 2016-05-10 Intellectual Ventures Fund 83 Llc Selecting images using relationship weights
US8917943B2 (en) 2012-05-11 2014-12-23 Intellectual Ventures Fund 83 Llc Determining image-based product from digital image collection
US9014509B2 (en) 2012-06-29 2015-04-21 Intellectual Ventures Fund 83 Llc Modifying digital images to increase interest level
US8897485B2 (en) 2012-06-29 2014-11-25 Intellectual Ventures Fund 83 Llc Determining an interest level for an image
US9014510B2 (en) * 2012-06-29 2015-04-21 Intellectual Ventures Fund 83 Llc Method for presenting high-interest-level images
US8842882B2 (en) 2012-06-29 2014-09-23 Apple Inc. Individualizing generic communications
US8873851B2 (en) 2012-06-29 2014-10-28 Intellectual Ventures Fund 83 Llc System for presenting high-interest-level images
GB201212878D0 (en) 2012-07-20 2012-09-05 Pike Justin Authentication method and system
US9866900B2 (en) * 2013-03-12 2018-01-09 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to detect shapes
US9552374B2 (en) 2013-08-19 2017-01-24 Kodak Alaris, Inc. Imaging workflow using facial and non-facial features
US9558423B2 (en) * 2013-12-17 2017-01-31 Canon Kabushiki Kaisha Observer preference model
US9836205B2 (en) 2014-02-27 2017-12-05 Dropbox, Inc. Activating a camera function within a content management application
US10095398B2 (en) 2014-02-27 2018-10-09 Dropbox, Inc. Navigating galleries of digital content
US10140517B2 (en) * 2014-08-06 2018-11-27 Dropbox, Inc. Event-based image classification and scoring
US10290019B2 (en) 2014-10-24 2019-05-14 Dropbox, Inc. User re-engagement with online photo management service
GB201520741D0 (en) 2015-05-27 2016-01-06 Mypinpad Ltd And Licentia Group Ltd Authentication methods and systems
US20160357784A1 (en) * 2015-06-02 2016-12-08 Thomson Licensing Method and apparatus for scoring an image
JP6525862B2 (ja) * 2015-08-07 2019-06-05 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
EP3128461B1 (en) * 2015-08-07 2022-05-25 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program
US9769367B2 (en) 2015-08-07 2017-09-19 Google Inc. Speech and computer vision-based control
US9838641B1 (en) 2015-12-30 2017-12-05 Google Llc Low power framework for processing, compressing, and transmitting images at a mobile image capture device
US9836484B1 (en) 2015-12-30 2017-12-05 Google Llc Systems and methods that leverage deep learning to selectively store images at a mobile image capture device
US10225511B1 (en) 2015-12-30 2019-03-05 Google Llc Low power framework for controlling image sensor mode in a mobile image capture device
US9836819B1 (en) 2015-12-30 2017-12-05 Google Llc Systems and methods for selective retention and editing of images captured by mobile image capture device
US10732809B2 (en) 2015-12-30 2020-08-04 Google Llc Systems and methods for selective retention and editing of images captured by mobile image capture device
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
WO2018119406A1 (en) 2016-12-22 2018-06-28 Aestatix LLC Image processing to determine center of balance in a digital image
CN108401154B (zh) * 2018-05-25 2020-08-14 同济大学 一种图像曝光度无参考质量评价方法
CN112995509B (zh) * 2021-02-24 2022-11-11 深圳市沃特沃德信息有限公司 基于移动终端的摄像头切换方法、装置和计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330406A (ja) * 1996-06-10 1997-12-22 Fuji Facom Corp 学習支援装置およびパターン認識装置
JPH1125269A (ja) * 1997-07-02 1999-01-29 Sanyo Electric Co Ltd 顔画像認識装置及びその方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4396903A (en) * 1981-05-29 1983-08-02 Westinghouse Electric Corp. Electro-optical system for correlating and integrating image data from frame-to-frame
US5418895A (en) * 1992-11-25 1995-05-23 Eastman Kodak Company Method for displaying a high quality digital color image on a limited color display
US5424945A (en) 1993-08-31 1995-06-13 Xerox Corporation System for evaluating a psychological effect of a document
JP3063073B2 (ja) 1995-06-30 2000-07-12 富士ゼロックス株式会社 画像解析表現付加装置
US5855482A (en) 1996-05-22 1999-01-05 Island Graphics Corporation Graphic visualization of consumer desirability hierarchy
US5983218A (en) * 1997-06-30 1999-11-09 Xerox Corporation Multimedia database for use over networks
US6282317B1 (en) * 1998-12-31 2001-08-28 Eastman Kodak Company Method for automatic determination of main subjects in photographic images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330406A (ja) * 1996-06-10 1997-12-22 Fuji Facom Corp 学習支援装置およびパターン認識装置
JPH1125269A (ja) * 1997-07-02 1999-01-29 Sanyo Electric Co Ltd 顔画像認識装置及びその方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4619720B2 (ja) * 2003-07-30 2011-01-26 ゼロックス コーポレイション ドキュメントの品質の測度を定量化する方法
JP4558403B2 (ja) * 2003-07-30 2010-10-06 ゼロックス コーポレイション 文書品質値計算装置
JP2005050355A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2005050351A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2005050353A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2005050352A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP2005050354A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP4624026B2 (ja) * 2003-07-30 2011-02-02 ゼロックス コーポレイション ドキュメントの品質の測度を定量化する方法
JP4619721B2 (ja) * 2003-07-30 2011-01-26 ゼロックス コーポレイション ドキュメントの品質の測度を定量化する方法
JP2005050357A (ja) * 2003-07-30 2005-02-24 Xerox Corp ドキュメントの品質の測度を定量化する方法
JP4558404B2 (ja) * 2003-07-30 2010-10-06 ゼロックス コーポレイション 文書品質値計算装置
JP4619719B2 (ja) * 2003-07-30 2011-01-26 ゼロックス コーポレイション ドキュメントの品質の測度を定量化する方法
JP2009259035A (ja) * 2008-04-17 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 視線位置推定方法、視線位置推定装置、コンピュータプログラム、及び記録媒体
JP7486337B2 (ja) 2020-04-15 2024-05-17 日本放送協会 映像抽出装置及びプログラム

Also Published As

Publication number Publication date
EP1109132A2 (en) 2001-06-20
US6671405B1 (en) 2003-12-30
EP1109132A3 (en) 2002-09-11

Similar Documents

Publication Publication Date Title
JP2001202522A (ja) 消費者画像の強調及び魅力の自動評価方法
US6738494B1 (en) Method for varying an image processing path based on image emphasis and appeal
US6847733B2 (en) Retrieval and browsing of database images based on image emphasis and appeal
US6748097B1 (en) Method for varying the number, size, and magnification of photographic prints based on image emphasis and appeal
US6832006B2 (en) System and method for controlling image compression based on image emphasis
US7212668B1 (en) Digital image processing system and method for emphasizing a main subject of an image
JP5782404B2 (ja) 画質評価
CN102576461B (zh) 评估数字图像的美学质量
US8285059B2 (en) Method for automatic enhancement of images containing snow
CN101601287B (zh) 产生照片级真实感图像缩略图的设备和方法
US8675960B2 (en) Detecting skin tone in images
Khan et al. Evaluating visual aesthetics in photographic portraiture
EP2246808A2 (en) Automated method for alignment of document objects
Mavridaki et al. A comprehensive aesthetic quality assessment method for natural images using basic rules of photography
JP5083138B2 (ja) 画像分類装置
Obrador et al. Towards category-based aesthetic models of photographs
JP2007047965A (ja) デジタル画像の対象物検出方法および装置並びにプログラム
US8203772B2 (en) Image output method, apparatus, and program using one or more attention levels
US20140029843A1 (en) Method for classification of images
JP2004538555A (ja) デジタル画像を分類する方法
Patuano Measuring naturalness and complexity using the fractal dimensions of landscape photographs
Bergman et al. Perceptual segmentation: Combining image segmentation with object tagging
JP2003248825A (ja) 画像処理装置及び画像処理方法、画像処理プログラム、記憶媒体
Goswami et al. Assessing product image quality for online shopping
Almobarak et al. Classification of aesthetic photographic images using SVM and KNN classifiers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110301