[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2009277027A - 画像における顔の器官の画像に対応する器官領域の検出 - Google Patents

画像における顔の器官の画像に対応する器官領域の検出 Download PDF

Info

Publication number
JP2009277027A
JP2009277027A JP2008127842A JP2008127842A JP2009277027A JP 2009277027 A JP2009277027 A JP 2009277027A JP 2008127842 A JP2008127842 A JP 2008127842A JP 2008127842 A JP2008127842 A JP 2008127842A JP 2009277027 A JP2009277027 A JP 2009277027A
Authority
JP
Japan
Prior art keywords
face
image
area
organ
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008127842A
Other languages
English (en)
Inventor
Kenji Matsuzaka
健治 松坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2008127842A priority Critical patent/JP2009277027A/ja
Priority to US12/464,692 priority patent/US20090285457A1/en
Publication of JP2009277027A publication Critical patent/JP2009277027A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像における器官領域の検出処理の精度向上および効率化を図ることを可能とする。
【解決手段】画像処理装置は、対象画像における顔の画像に対応する顔領域の検出を行う顔領域検出部と、顔領域の検出結果に基づき顔領域における顔の器官の画像に対応する器官領域を検出する際の検出すべき器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件を設定する検出条件設定部と、設定された検出条件を満たす器官領域の検出を行う器官領域検出部と、を備える。
【選択図】図10

Description

本発明は、画像における顔の器官の画像に対応する画像領域である器官領域の検出に関する。
画像において顔の器官(例えば目)の画像に対応する画像領域である器官領域を検出する技術が知られている(例えば特許文献1)。
特開2006−065640号公報
画像における器官領域の検出の際には、精度の向上や処理の効率化が図られることが好ましい。
本発明は、上記の課題を解決するためになされたものであり、画像における器官領域の検出処理の精度向上および効率化を図ることを可能とする技術を提供することを目的とする。
上記課題の少なくとも一部を解決するために、本発明は、以下の形態または適用例として実現することが可能である。
[適用例1]画像処理装置であって、
対象画像における顔の画像に対応する顔領域の検出を行う顔領域検出部と、
前記顔領域の検出結果に基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する際の、検出すべき前記器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件を設定する検出条件設定部と、
設定された前記検出条件を満たす前記器官領域の検出を行う器官領域検出部と、を備える、画像処理装置。
この画像処理装置では、顔領域の検出結果に基づき、器官領域を検出する際の検出すべき器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件が設定され、設定された検出条件を満たす器官領域の検出が行われるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例2]適用例1に記載の画像処理装置であって、
前記顔領域検出部は、顔の画像を含むサンプル画像を用いて生成された顔評価用データを用いて前記対象画像上における画像領域が顔の画像に対応する画像領域であることの確からしさを評価することにより、前記顔領域の検出を行い、
前記検出条件設定部は、前記顔評価用データの生成に用いられた前記サンプル画像における顔の器官の画像に基づき予め設定された前記顔領域と前記器官領域との間の位置と大きさと数との少なくとも1つに関する関係に基づき、前記検出条件を設定する、画像処理装置。
この画像処理装置では、顔評価用データの生成に用いられたサンプル画像における顔の器官の画像に基づき予め設定された顔領域と器官領域との間の位置と大きさと数との少なくとも1つに関する関係に基づき検出条件が設定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例3]適用例2に記載の画像処理装置であって、
前記顔評価用データは、前記顔評価用データの生成に用いられた前記サンプル画像における顔の画像の画像面に平行な軸を中心とした回転角度である顔向きに対応付けられており、
前記顔領域と前記器官領域との間の前記関係は、前記顔評価用データに対応付けられた顔向き毎に設定されており、
前記検出条件設定部は、前記顔領域の検出に用いられた前記顔評価用データに対応付けられた顔向きに対応する前記関係に基づき、前記検出条件を設定する、画像処理装置。
この画像処理装置では、顔領域の検出に用いられた顔評価用データに対応付けられた顔向きに対応する関係に基づき検出条件が設定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例4]適用例2または適用例3に記載の画像処理装置であって、
前記器官領域検出部は、
前記顔領域における画像領域である判定対象画像領域を設定する判定対象設定部と、
前記判定対象画像領域が顔の器官の画像に対応する画像領域であることの確からしさを表す評価値を算出するための器官評価用データを記憶する記憶部と、
前記器官評価用データと前記判定対象画像領域に対応する画像データとに基づき前記評価値を算出する評価値算出部と、
前記評価値と前記判定対象画像領域の位置およびサイズとに基づき、前記器官領域を設定する領域設定部と、を含み、
前記判定対象設定部は、前記顔領域と前記器官領域との間の前記関係に基づき、設定する前記判定対象画像領域の位置と大きさと数との少なくとも1つを決定する、画像処理装置。
この画像処理装置では、顔領域と器官領域との間の関係に基づき設定する判定対象画像領域の位置と大きさと数との少なくとも1つが決定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例5]適用例2ないし適用例4のいずれかに記載の画像処理装置であって、
前記顔評価用データは、前記サンプル画像を用いた学習により生成される、画像処理装置。
この画像処理装置では、学習による顔評価用データの生成に用いられたサンプル画像における顔の器官の画像に基づき予め設定された顔領域と器官領域との間の位置と大きさと数との少なくとも1つに関する関係に基づき検出条件が設定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例6]適用例1ないし適用例5のいずれかに記載の画像処理装置であって、
前記検出条件設定部は、検出すべき前記器官領域に対応する顔の器官の種類に応じて、前記検出条件を設定する、画像処理装置。
この画像処理装置では、顔の器官の種類に応じて画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例7]適用例1ないし適用例6のいずれかに記載の画像処理装置であって、
前記器官領域検出部は、複数の前記器官領域の候補を検出し、前記複数の器官領域の候補間の幾何学的な関係に基づき前記器官領域を決定する、画像処理装置。
この画像処理装置では、複数の器官領域の候補が検出され、複数の器官領域の候補間の幾何学的な関係に基づき器官領域が決定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
[適用例8]適用例1ないし適用例7のいずれかに記載の画像処理装置であって、
前記顔の器官の種類は、右目と左目と口との少なくとも1つである、画像処理装置。
この画像処理装置では、画像における右目と左目と口との少なくとも1つに対応する器官領域の検出処理の精度向上および効率化を図ることができる。
なお、本発明は、種々の態様で実現することが可能であり、例えば、画像処理方法および装置、器官領域検出方法および装置、これらの方法または装置の機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の形態で実現することができる。
次に、本発明の実施の形態を実施例に基づいて以下の順序で説明する。
A.第1実施例:
A−1.画像処理装置の構成:
A−2.顔領域・器官領域検出処理:
B.第2実施例:
C.変形例:
A.第1実施例:
A−1.画像処理装置の構成:
図1は、本発明の第1実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。第1実施例のプリンタ100は、メモリカードMC等から取得した画像データに基づき画像を印刷する、いわゆるダイレクトプリントに対応したインクジェット式カラープリンタである。プリンタ100は、プリンタ100の各部を制御するCPU110と、ROMやRAMによって構成された内部メモリ120と、ボタンやタッチパネルにより構成された操作部140と、液晶ディスプレイにより構成された表示部150と、プリンタエンジン160と、カードインターフェース(カードI/F)170と、を備えている。プリンタ100は、さらに、他の機器(例えばデジタルスチルカメラやパーソナルコンピュータ)とのデータ通信を行うためのインターフェースを備えているとしてもよい。プリンタ100の各構成要素は、バスを介して互いに接続されている。
プリンタエンジン160は、印刷データに基づき印刷を行う印刷機構である。カードインターフェース170は、カードスロット172に挿入されたメモリカードMCとの間でデータのやり取りを行うためのインターフェースである。なお、本実施例では、メモリカードMCに画像データを含む画像ファイルが格納されている。
内部メモリ120には、画像処理部200と、表示処理部310と、印刷処理部320と、が格納されている。画像処理部200は、所定のオペレーティングシステムの下で、後述する顔領域・器官領域検出処理を実行するためのコンピュータプログラムである。表示処理部310は、表示部150を制御して、表示部150上に処理メニューやメッセージ、画像等を表示させるディスプレイドライバである。印刷処理部320は、画像データから印刷データを生成し、プリンタエンジン160を制御して、印刷データに基づく画像の印刷を実行するためのコンピュータプログラムである。CPU110は、内部メモリ120から、これらのプログラムを読み出して実行することにより、これら各部の機能を実現する。
画像処理部200は、プログラムモジュールとして、領域検出部210と、情報付加部230と、検出条件設定部240と、を含んでいる。領域検出部210は、画像データの表す画像における所定の種類の被写体の画像(顔の画像および顔の器官の画像)に対応する画像領域(顔領域および器官領域)の検出を行う。領域検出部210は、判定対象設定部211と、評価値算出部212と、判定部213と、領域設定部214と、を含んでいる。これら各部の機能については、後述の顔領域・器官領域検出処理の説明において詳述する。なお、後述するように、領域検出部210は、顔の画像に対応する顔領域の検出および顔の器官の画像に対応する器官領域の検出を行うため、本発明における顔領域検出部および器官領域検出部として機能する。
情報付加部230は、画像データを含む画像ファイルに所定の情報を付加する。検出条件設定部240は、顔領域の検出結果に基づき、器官領域を検出する際における検出すべき器官領域の位置と大きさと数との取り得る範囲を特定する検出条件を設定する。検出条件の設定方法については、後述の顔領域・器官領域検出処理の説明において詳述する。
内部メモリ120には、また、予め設定された複数の顔学習データFLDおよび複数の顔器官学習データOLDが格納されている。顔学習データFLDおよび顔器官学習データOLDは、領域検出部210による顔領域および器官領域の検出に用いられる。図2は、顔学習データFLDおよび顔器官学習データOLDの種類を示す説明図である。図2(a)ないし図2(h)には、顔学習データFLDおよび顔器官学習データOLDの種類と、当該種類の顔学習データFLDおよび顔器官学習データOLDを用いて検出される画像領域の例と、を示している。
顔学習データFLDの内容については後述の顔領域・器官領域検出処理の説明において詳述するが、顔学習データFLDは、顔傾きと顔向きとの組み合わせに対応付けられて設定されている。ここで、顔傾きとは、画像面内(インプレーン)における顔の傾き(回転角度)を意味している。すなわち、顔傾きは、画像面に垂直な軸を中心とした顔の回転角度である。本実施例では、対象画像上の領域や被写体等の傾きを、領域や被写体等の上方向が対象画像の上方向と一致した状態を基準状態(傾き=0度)とした場合における基準状態からの時計回りの回転角度で表すものとしている。例えば、顔傾きは、対象画像の上下方向に沿って顔が位置している状態(頭頂が上方向を向き顎が下方向を向いた状態)を基準状態(顔傾き=0度)とした場合における基準状態からの顔の時計回りの回転角度で表される。
また、顔向きとは、画像面外(アウトプレーン)における顔の向き(顔の振りの角度)を意味している。ここで、顔の振りとは、略円筒状の首の軸を中心とした顔の方向である。すなわち、顔向きは、画像面に平行な軸を中心とした顔の回転角度である。本実施例では、デジタルスチルカメラ等の画像生成装置の撮像面に正対した顔の顔向きを「正面向き」と呼び、撮像面に向かって右を向いた顔(画像の観賞者からみて左を向いた顔の画像)の顔向きを「右向き」と、撮像面に向かって左を向いた顔(画像の観賞者からみて右を向いた顔の画像)の顔向きを「左向き」と呼ぶものとしている。
内部メモリ120には、図2(a)ないし図2(d)に示す4つの顔学習データFLD、すなわち、図2(a)に示す正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(b)に示す正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(c)に示す右向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(d)に示す右向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLDと、が格納されている。なお、正面向きの顔と右向き(または左向き)の顔とは、別の種類の被写体と解釈することも可能であり、このように解釈した場合には、顔学習データFLDは被写体の種類と被写体の傾きとの組み合わせに対応して設定されていると表現することも可能である。
後述するように、ある顔傾きに対応する顔学習データFLDは、当該顔傾きを中心に顔傾きの値がプラスマイナス15度の範囲の顔の画像を検出可能なように学習によって設定されている。また、人物の顔は実質的に左右対称である。そのため、正面向きの顔向きについては、0度の顔傾きに対応する顔学習データFLD(図2(a))と30度の顔傾きに対応する顔学習データFLD(図2(b))との2つが予め準備されれば、これら2つの顔学習データFLDを90度単位で回転させることにより、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。右向きの顔向きについても同様に、0度の顔傾きに対応する顔学習データFLD(図2(c))と30度の顔傾きに対応する顔学習データFLD(図2(d))との2つが予め準備されれば、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。また、左向きの顔向きについては、右向きの顔向きに対応する顔学習データFLDを反転させることにより、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。
顔器官学習データOLDは、顔の器官の種類と器官傾きとの組み合わせに対応付けられて設定されている。本実施例では、顔の器官の種類として、目(右目および左目)と口とが設定されている。また、器官傾きとは、上述の顔傾きと同様に、画像面内(インプレーン)における顔の器官の傾き(回転角度)を意味している。すなわち、器官傾きは、画像面に垂直な軸を中心とした顔の器官の回転角度である。器官傾きは、顔傾きと同様に、対象画像の上下方向に沿って顔の器官が位置している状態を基準状態(器官傾き=0度)とした場合における基準状態からの顔の器官の時計回りの回転角度で表される。
内部メモリ120には、図2(e)ないし図2(h)に示す4つの顔器官学習データOLD、すなわち、図2(e)に示す目と0度の器官傾きとの組み合わせに対応する顔器官学習データOLDと、図2(f)に示す目と30度の器官傾きとの組み合わせに対応する顔器官学習データOLDと、図2(g)に示す口と0度の器官傾きとの組み合わせに対応する顔器官学習データOLDと、図2(h)に示す口と30度の器官傾きとの組み合わせに対応する顔器官学習データOLDと、が格納されている。目と口とは別の種類の被写体であるため、顔器官学習データOLDは被写体の種類と被写体の傾きとの組み合わせに対応して設定されていると表現できる。
顔学習データFLDと同様に、ある器官傾きに対応する顔器官学習データOLDは、当該器官傾きを中心に器官傾きの値がプラスマイナス15度の範囲の器官の画像を検出可能なように学習によって設定されている。また、人物の目や口は実質的に左右対称である。そのため、目については、0度の器官傾きに対応する顔器官学習データOLD(図2(e))と30度の器官傾きに対応する顔器官学習データOLD(図2(f))との2つが予め準備されれば、これら2つの顔器官学習データOLDを90度単位で回転させることにより、あらゆる器官傾きの目の画像を検出可能な顔器官学習データOLDを得ることができる。口についても同様に、0度の器官傾きに対応する顔器官学習データOLD(図2(g))と30度の器官傾きに対応する顔器官学習データOLDであることを(図2(h))との2つが予め準備されれば、あらゆる器官傾きの口の画像を検出可能な顔器官学習データOLDを得ることができる。なお、本実施例では、右目と左目とは同じ種類の被写体であるとし、右目の画像に対応する右目領域と左目の画像に対応する左目領域とを共通の顔器官学習データOLDを用いて検出するものとしているが、右目と左目とは異なる種類の被写体であるとして、右目領域検出用と左目領域検出用とにそれぞれ専用の顔器官学習データOLDを準備するものとしてもよい。
A−2.顔領域・器官領域検出処理:
図3は、第1実施例における顔領域・器官領域検出処理の流れを示すフローチャートである。本実施例における顔領域・器官領域検出処理は、画像データの表す画像における顔の画像に対応する顔領域の検出と顔領域における顔の器官に対応する器官領域の検出とを行う処理である。なお、顔領域・器官領域検出処理の処理結果、すなわち検出された顔領域や器官領域は、所定の画像処理(例えば肌色補正、赤目補正、顔画像の変形、表情(笑顔等)の検出)に利用可能である。
ステップS110(図3)では、画像処理部200(図1)が、顔領域・器官領域検出処理の対象となる画像を表す画像データを取得する。本実施例のプリンタ100では、カードスロット172にメモリカードMCが挿入されると、メモリカードMCに格納された画像ファイルのサムネイル画像が表示部150に表示される。ユーザは、表示されたサムネイル画像を参照しつつ、操作部140を介して処理の対象となる1つまたは複数の画像を選択する。画像処理部200は、選択された1つまたは複数の画像に対応する画像データを含む画像ファイルをメモリカードMCより取得して内部メモリ120の所定の領域に格納する。なお、取得された画像データを原画像データと呼び、原画像データの表す画像を原画像OImgと呼ぶものとする。
ステップS120(図3)では、領域検出部210(図1)が、顔領域検出処理を行う。顔領域検出処理は、顔の画像に対応する画像領域を顔領域FAとして検出する処理である。図4は、顔領域検出処理の流れを示すフローチャートである。また、図5は、顔領域検出処理の概要を示す説明図である。図5の最上段には原画像OImgの一例を示している。
顔領域検出処理(図4)におけるステップS310では、領域検出部210(図1)が、原画像OImgを表す原画像データから顔検出用画像FDImgを表す顔検出用画像データを生成する。本実施例では、図5に示すように、顔検出用画像FDImgは横320画素×縦240画素のサイズの画像である。領域検出部210は、必要により原画像データの解像度変換を行うことにより、顔検出用画像FDImgを表す顔検出用画像データを生成する。
ステップS320(図4)では、判定対象設定部211(図1)が、判定対象画像領域JIA(後述)の設定に用いるウィンドウSWのサイズを初期値に設定する。ステップS330では、判定対象設定部211が、ウィンドウSWを顔検出用画像FDImg上の初期位置に配置する。ステップS340では、判定対象設定部211が、顔検出用画像FDImg上に配置されたウィンドウSWにより規定される画像領域を、顔の画像に対応する画像領域であるか否かの判定(以下「顔判定」とも呼ぶ)の対象となる判定対象画像領域JIAに設定する。図5の中段には、顔検出用画像FDImg上に初期値のサイズのウィンドウSWが初期位置に配置され、ウィンドウSWにより規定される画像領域が判定対象画像領域JIAに設定される様子を示している。本実施例では、後述するように、正方形形状のウィンドウSWのサイズおよび位置が変更されつつ判定対象画像領域JIAの設定が順に行われるが、ウィンドウSWのサイズの初期値は最大サイズである横240画素×縦240画素であり、ウィンドウSWの初期位置はウィンドウSWの左上の頂点が顔検出用画像FDImgの左上の頂点に重なるような位置である。また、ウィンドウSWは、その傾きが0度の状態で配置される。なお、上述したように、ウィンドウSWの傾きとは、ウィンドウSWの上方向が対象画像(顔検出用画像FDImg)の上方向と一致した状態を基準状態(傾き=0度)とした場合における基準状態からの時計回りの回転角度を意味している。
ステップS350(図4)では、評価値算出部212(図1)が、判定対象画像領域JIAについて、判定対象画像領域JIAに対応する画像データ基づき、顔判定に用いる累計評価値Tvを算出する。なお、本実施例では、顔判定は、予め設定された特定顔傾きと特定顔向きとの組み合わせ毎に実行される。すなわち、特定顔傾きと特定顔向きとの組み合わせ毎に、判定対象画像領域JIAが当該特定顔傾きと特定顔向きとを有する顔の画像に対応する画像領域であるか否かの判定が行われる。そのため、累計評価値Tvも特定顔傾きと特定顔向きとの組み合わせ毎に算出される。ここで、特定顔傾きとは、所定の顔傾きであり、本実施例では、基準顔傾き(顔傾き=0度)と基準顔傾きから顔傾きを30度ずつ増加させた顔傾きとの計12個の顔傾き(0度、30度、60度、・・・、330度)が、特定顔傾きとして設定されている。また、特定顔向きとは、所定の顔向きであり、本実施例では、正面向きと右向きと左向きとの計3個の顔向きが特定顔向きとして設定されている。
図6は、顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。本実施例では、累計評価値Tvの算出にN個のフィルタ(フィルタ1〜フィルタN)が用いられる。各フィルタの外形はウィンドウSWと同じアスペクト比を有しており(すなわち正方形形状であり)、各フィルタにはプラス領域paとマイナス領域maとが設定されている。評価値算出部212は、判定対象画像領域JIAにフィルタX(X=1,2,・・・,N)を順に適用して評価値vX(すなわちv1〜vN)を算出する。具体的には、評価値vXは、フィルタXのプラス領域paに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計から、マイナス領域maに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計を差し引いた値である。
算出された評価値vXは、各評価値vXに対応して設定された閾値thX(すなわちth1〜thN)と比較される。本実施例では、評価値vXが閾値thX以上である場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応する画像領域であると判定され、フィルタXの出力値として値「1」が設定される。一方、評価値vXが閾値thXより小さい場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応する画像領域ではないと判定され、フィルタXの出力値として値「0」が設定される。各フィルタXには重み係数WeX(すなわちWe1〜WeN)が設定されており、すべてのフィルタについての出力値と重み係数WeXとの積の合計が、累計評価値Tvとして算出される。
なお、顔判定に用いられるフィルタXの態様や閾値thX、重み係数WeX、後述の閾値THは、顔学習データFLDとして予め規定されている。すなわち、例えば、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定には、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(a)参照)に規定されたフィルタXの態様、閾値thX、重み係数WeX、閾値THが用いられる。同様に、正面向きの顔向きと30度の顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定には、正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(b)参照)が用いられる。また、正面向きの顔向きと他の特定顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定の際には、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(a))と正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(b))とに基づき、正面向きの顔向きと当該他の特定顔傾きとの組み合わせに対応する顔学習データFLDが評価値算出部212により生成され、使用される。右向きや左向きの顔向きについても同様に、内部メモリ120に予め格納された顔学習データFLDに基づき必要な顔学習データFLDが生成され、使用される。なお、本実施例における顔学習データFLDは、判定対象画像領域JIAが顔の画像に対応する画像領域であることの確からしさを評価するためのデータであり、本発明における顔評価用データに相当する。
なお、顔学習データFLDは、サンプル画像を用いた学習によって設定(生成)される。図7は、正面向きの顔に対応する顔学習データFLDの設定のための学習に用いられるサンプル画像の一例を示す説明図である。学習には、正面向きの顔に対応する画像であることが予めわかっている複数の顔サンプル画像によって構成された顔サンプル画像群と、正面向きの顔に対応する画像ではないことが予めわかっている複数の非顔サンプル画像によって構成された非顔サンプル画像群と、が用いられる。
学習による正面向きの顔に対応する顔学習データFLDの設定は特定顔傾き毎に実行されるため、図7に示すように、顔サンプル画像群は、12個の特定顔傾きのそれぞれに対応するものが準備される。例えば0度の特定顔傾きについての顔学習データFLDの設定は、0度の特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とを用いて実行され、30度の特定顔傾きについての顔学習データFLDの設定は、30度の特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とを用いて実行される。
各特定顔傾きに対応する顔サンプル画像群は、画像サイズに対する顔の画像の大きさの比が所定の値の範囲内であると共に顔の画像の傾きが特定顔傾きに等しい複数の顔サンプル画像(以下「基本顔サンプル画像FIo」とも呼ぶ)を含む。また、顔サンプル画像群は、少なくとも1つの基本顔サンプル画像FIoについて、基本顔サンプル画像FIoを1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図7における画像FIaおよびFIb)や、基本顔サンプル画像FIoの顔傾きをプラスマイナス15度の範囲で変化させた画像(例えば図7における画像FIcおよびFId)、基本顔サンプル画像FIoにおける顔の画像の位置を上下左右に所定の移動量だけ移動した画像(例えば図7における画像FIeないしFIh)をも含む。
サンプル画像を用いた学習は、例えばニューラルネットワークを用いた方法や、ブースティング(例えばアダブースティング)を用いた方法、サポートベクターマシーンを用いた方法等により実行される。例えば学習がニューラルネットワークを用いた方法により実行される場合には、各フィルタX(すなわちフィルタ1〜フィルタN、図6参照)について、ある特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とに含まれるすべてのサンプル画像を用いて評価値vX(すなわちv1〜vN)が算出され、所定の顔検出率を達成する閾値thX(すなわちth1〜thN)が設定される。ここで、顔検出率とは、顔サンプル画像群を構成する顔サンプル画像の総数に対する、評価値vXによる閾値判定によって顔の画像に対応する画像であると判定される顔サンプル画像の数の割合を意味している。
次に、各フィルタXに設定された重み係数WeX(すなわちWe1〜WeN)が初期値に設定され、顔サンプル画像群および非顔サンプル画像群の中から選択された1つのサンプル画像についての累計評価値Tvが算出される。後述するように、顔判定においては、ある画像について算出された累計評価値Tvが所定の閾値TH以上の場合には、当該画像は顔の画像に対応する画像であると判定される。学習においては、選択されたサンプル画像(顔サンプル画像または非顔サンプル画像)について算出された累計評価値Tvによる閾値判定結果の正誤に基づき、各フィルタXに設定された重み係数WeXの値が修正される。以降、サンプル画像の選択と、選択されたサンプル画像について算出された累計評価値Tvによる閾値判定、および判定結果の正誤に基づく重み係数WeXの値の修正が、顔サンプル画像群および非顔サンプル画像群に含まれるすべてのサンプル画像について繰り返し実行される。このような処理によって、正面向きの顔向きと特定顔傾きとの組み合わせに対応する顔学習データFLDが設定される。
なお、他の特定顔向き(右向きおよび左向き)に対応する顔学習データFLDも同様に、右向き(または左向き)の顔に対応する画像であることが予めわかっている複数の顔サンプル画像によって構成された顔サンプル画像群と、右向き(または左向き)の顔に対応する画像ではないことが予めわかっている複数の非顔サンプル画像によって構成された非顔サンプル画像群とを用いた学習によって設定される。
判定対象画像領域JIAについて特定顔傾きと特定顔向きとの組み合わせ毎に累計評価値Tvが算出されると(図4のステップS350)、判定部213(図1)は、累計評価値Tvを特定顔傾きと特定顔向きとの組み合わせ毎に設定された閾値THと比較する(ステップS360)。ある特定顔傾きと特定顔向きとの組み合わせについて累計評価値Tvが閾値TH以上である場合には、領域検出部210が、判定対象画像領域JIAは当該特定顔傾きと当該特定顔向きとを有する顔の画像に対応する画像領域であるとして、判定対象画像領域JIAの位置、すなわち現在設定されているウィンドウSWの座標と、当該特定顔傾きおよび当該特定顔向きと、を記憶する(ステップS370)。一方、いずれの特定顔傾きと特定顔向きとの組み合わせについても累計評価値Tvが閾値THより小さい場合には、ステップS370の処理はスキップされる。
ステップS380(図4)では、領域検出部210(図1)が、現在設定されているサイズのウィンドウSWにより顔検出用画像FDImg全体がスキャンされたか否かを判定する。未だ顔検出用画像FDImg全体がスキャンされていないと判定された場合には、判定対象設定部211(図1)が、ウィンドウSWを所定の方向に所定の移動量だけ移動する(ステップS390)。図5の下段には、ウィンドウSWが移動した様子を示している。本実施例では、ステップS390において、ウィンドウSWがウィンドウSWの水平方向の大きさの2割分の移動量で右方向に移動するものとしている。また、ウィンドウSWがさらに右方向には移動できない位置に配置されている場合には、ステップS390において、ウィンドウSWが顔検出用画像FDImgの左端まで戻ると共に、ウィンドウSWの垂直方向の大きさの2割分の移動量で下方向に移動するものとしている。ウィンドウSWがさらに下方向には移動できない位置に配置されている場合には、顔検出用画像FDImg全体がスキャンされたこととなる。ウィンドウSWの移動(ステップS390)の後には、移動後のウィンドウSWについて、上述のステップS340以降の処理が実行される。
ステップS380(図4)において現在設定されているサイズのウィンドウSWにより顔検出用画像FDImg全体がスキャンされたと判定された場合には、ウィンドウSWの所定のサイズがすべて使用されたか否かが判定される(ステップS400)。本実施例では、ウィンドウSWのサイズとして、初期値(最大サイズ)である横240画素×縦240画素の他に、横213画素×縦213画素、横178画素×縦178画素、横149画素×縦149画素、横124画素×縦124画素、横103画素×縦103画素、横86画素×縦86画素、横72画素×縦72画素、横60画素×縦60画素、横50画素×縦50画素、横41画素×縦41画素、横35画素×縦35画素、横29画素×縦29画素、横24画素×縦24画素、横20画素×縦20画素(最小サイズ)、の合計15個のサイズが設定されている。未だ使用されていないウィンドウSWのサイズがあると判定された場合には、判定対象設定部211(図1)が、ウィンドウSWのサイズを現在設定されているサイズの次に小さいサイズに変更する(ステップS410)。すなわち、ウィンドウSWのサイズは、最初に最大サイズに設定され、その後、順に小さいサイズに変更されていく。ウィンドウSWのサイズの変更(ステップS410)の後には、変更後のサイズのウィンドウSWについて、上述のステップS330以降の処理が実行される。
ステップS400(図4)においてウィンドウSWの所定のサイズがすべて使用されたと判定された場合には、領域設定部214(図1)が、顔領域決定処理を実行する(ステップS420)。図8および図9は、顔領域決定処理の概要を示す説明図である。領域設定部214は、図4のステップS360において累計評価値Tvが閾値TH以上であると判定され、ステップS370において記憶されたウィンドウSWの座標と特定顔傾きとに基づき、顔の画像に対応する画像領域としての顔領域FAを決定する。具体的には、記憶された特定顔傾きが0度である場合には、ウィンドウSWにより規定される画像領域(すなわち判定対象画像領域JIA)が、そのまま顔領域FAとして決定される。一方、記憶された特定顔傾きが0度以外である場合には、ウィンドウSWの傾きを特定顔傾きに一致させ(すなわちウィンドウSWを所定の点(例えばウィンドウSWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後のウィンドウSWにより規定される画像領域が顔領域FAとして決定される。例えば図8(a)に示すように、30度の特定顔傾きについて累計評価値Tvが閾値TH以上であると判定された場合には、図8(b)に示すように、ウィンドウSWの傾きを30度に変化させ、傾き変化後のウィンドウSWにより規定される画像領域が顔領域FAとして決定される。
また、領域設定部214(図1)は、ステップS370(図4)においてある特定顔傾きについて互いに一部が重複する複数のウィンドウSWが記憶された場合には、各ウィンドウSWにおける所定の点(例えばウィンドウSWの重心)の座標の平均の座標を重心とし、各ウィンドウSWのサイズの平均のサイズを有する1つの新たなウィンドウ(以下「平均ウィンドウAW」とも呼ぶ)を設定する。例えば図9(a)に示すように、互いに一部が重複する4つのウィンドウSW(SW1〜SW4)が記憶された場合には、図9(b)に示すように、4つのウィンドウSWのそれぞれの重心の座標の平均の座標を重心とし、4つのウィンドウSWのそれぞれのサイズの平均のサイズを有する1つの平均ウィンドウAWが定義される。このとき、上述したのと同様に、記憶された特定顔傾きが0度である場合には、平均ウィンドウAWにより規定される画像領域がそのまま顔領域FAとして決定される。一方、記憶された特定顔傾きが0度以外である場合には、平均ウィンドウAWの傾きを特定顔傾きに一致させ(すなわち平均ウィンドウAWを所定の点(例えば平均ウィンドウAWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後の平均ウィンドウAWにより規定される画像領域が顔領域FAとして決定される(図9(c)参照)。
なお、図8に示したように、他のウィンドウSWと重複しない1つのウィンドウSWが記憶された場合にも、図9に示した互いに一部が重複する複数のウィンドウSWが記憶された場合と同様に、1つのウィンドウSW自身が平均ウィンドウAWであると解釈することも可能である。
本実施例では、学習の際に用いられる顔サンプル画像群(図7参照)に、基本顔サンプル画像FIoを1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図7における画像FIaおよびFIb)が含まれているため、ウィンドウSWの大きさに対する顔の画像の大きさが基本顔サンプル画像FIoと比べてわずかに大きかったり小さかったりする場合にも、顔領域FAが検出されうる。従って、本実施例では、ウィンドウSWの標準サイズとして上述した15個の離散的なサイズのみが設定されているが、あらゆる大きさの顔の画像について顔領域FAが検出されうる。同様に、本実施例では、学習の際に用いられる顔サンプル画像群に、基本顔サンプル画像FIoの顔傾きをプラスマイナス15度の範囲で変化させた画像(例えば図7における画像FIcおよびFId)が含まれているため、ウィンドウSWに対する顔の画像の傾きが基本顔サンプル画像FIoとはわずかに異なっている場合にも、顔領域FAが検出されうる。従って、本実施例では、特定顔傾きとして上述した12個の離散的な角度のみが設定されているが、あらゆる角度の顔の画像について顔領域FAが検出されうる。
顔領域検出処理(図3のステップS120)において、顔領域FAが検出されなかった場合には(ステップS130:No)、顔領域・器官領域検出処理は終了する。一方、少なくとも1つの顔領域FAが検出された場合には(ステップS130:Yes)、領域検出部210(図1)が、検出された顔領域FAの1つを選択する(ステップS140)。
ステップS150(図3)では、検出条件設定部240(図1)が、顔領域検出処理(ステップS120)の結果に基づき、後述の器官領域検出処理(ステップS160)において検出すべき器官領域の位置と大きさと数との取り得る範囲を特定する検出条件を設定する。上述したように、本実施例では、顔の器官の種類として目(右目および左目)と口とが設定されているため、後述の器官領域検出処理では、右目の画像に対応する右目領域EA(r)と左目の画像に対応する左目領域EA(l)と口の画像に対応する口領域MAとの検出が行われる(以下、右目領域EA(r)および左目領域EA(l)をまとめて「目領域EA」とも呼ぶ)。検出条件の設定も、目領域EAおよび口領域MAのそれぞれについて実行される。
図10および図11は、検出条件の設定方法の概要を示す説明図である。図10には、器官領域の位置についての検出条件の設定方法の概要を示している。図10(a)および図10(b)に示すように、器官領域の位置についての検出条件の設定の際には、選択された顔領域FAにおいて3つの領域(領域A、領域B、領域C、以下、3つの領域をまとめて「位置特定領域」とも呼ぶ)が設定され、領域Aおよび領域Cが目領域EAが位置し得る範囲とされ、領域Bおよび領域Cが口領域MAが位置し得る範囲とされる。ここで、本実施例では、領域の位置とは、当該領域の重心の位置を意味するものとしている。
顔領域FAと位置特定領域(領域A、領域B、領域C)との間の位置に関する関係は、特定顔向き(正面向き、右向き、左向き)毎に予め設定され、内部メモリ120の所定の領域に記憶されている。図10(a)には正面向きの特定顔向きに対応した顔領域FAと位置特定領域との位置関係を示しており、図10(b)には右向きの特定顔向きに対応した顔領域FAと位置特定領域との位置関係を示している。左向きの特定顔向きに対応した顔領域FAと位置特定領域との位置関係は、図10(b)に示した関係を左右反転させた関係である。位置特定領域により器官領域(目領域EAおよび口領域MA)の位置し得る範囲が特定されるため、顔領域FAと器官領域の位置し得る範囲との位置関係が予め設定されていると表現できる。
顔領域FAと位置特定領域(領域A、領域B、領域C)との位置関係の設定は、特定顔向き毎に、顔学習データFLD(図2参照)の設定に用いられた顔サンプル画像群(図7参照)を構成する複数の顔サンプル画像における顔の器官の画像の位置に基づき実行される。すなわち、特定顔向き毎に、複数の顔サンプル画像における目および口の画像の位置が調べられ、顔サンプル画像における目の画像が位置し得る範囲に対応する顔領域FA上の領域(以下「目配置可能領域」とも呼ぶ)と、顔サンプル画像における口の画像が位置し得る範囲に対応する顔領域FA上の領域(以下「口配置可能領域」とも呼ぶ)と、の重複部分が領域Cに設定される。また、目配置可能領域の内の領域Cと重複しない部分が領域Aに設定され、口配置可能領域の内の領域Cと重複しない部分が領域Bに設定される。
検出条件設定部240は、ステップS140で選択された顔領域FAの検出に用いられた顔学習データFLDに対応付けられた特定顔向きを特定し、当該特定顔向きに対応する顔領域FAと位置特定領域(領域A、領域B、領域C)との位置関係(図10参照)に基づき顔領域FAにおける位置特定領域を設定することにより、器官領域の位置についての検出条件を設定する。
図11には、器官領域の大きさについての検出条件の設定方法の概要を示している。本実施例では、顔領域FAの大きさに対する各器官領域の大きさの比の範囲が、特定顔向き(正面向き、右向き、左向き)毎に予め設定され、内部メモリ120の所定の領域に記憶されている。顔領域FAの大きさに対する各器官領域の大きさの比の範囲の設定は、特定顔向き毎に、顔学習データFLD(図2参照)の設定に用いられた顔サンプル画像群(図7参照)を構成する複数の顔サンプル画像における顔の器官の画像の大きさに基づき実行される。すなわち、特定顔向き毎に、複数の顔サンプル画像における目および口の画像の大きさが調べられ、顔サンプル画像の大きさに対する目および口の画像の大きさの比の範囲が、顔領域FAの大きさに対する器官領域の大きさの比の範囲として設定される。図11(a)には、正面向きの特定顔向きに対応する顔学習データFLDの設定に用いられた顔サンプル画像の内、目および口の画像の大きさが最大の画像である画像FIaを示しており、図11(b)には、正面向きの特定顔向きに対応する顔学習データFLDの設定に用いられた顔サンプル画像の内、目および口の画像の大きさが最小の画像である画像FIbを示している。この場合、画像FIbにおける画像FIbの大きさに対する各器官領域(右目領域EA(r)、左目領域EA(l)、口領域MA)の大きさの比から、画像FIaにおける画像FIaの大きさに対する各器官領域の大きさの比までの範囲が、顔領域FAの大きさに対する各器官領域の大きさの比の範囲として設定される。
検出条件設定部240は、ステップS140で選択された顔領域FAの検出に用いられた顔学習データFLDに対応付けられた特定顔向きを特定し、当該特定顔向きに対応する顔領域FAの大きさに対する各器官領域の大きさの比の範囲を設定することにより、器官領域の大きさについての検出条件を設定する。
また、検出条件設定部240は、ステップS140で選択された顔領域FAの検出に用いられた顔学習データFLDに対応付けられた特定顔向きに基づき、器官領域の数についての検出条件を設定する。具体的には、特定顔向きが正面向きである場合には、検出すべき器官領域の数を、右目領域EA(r)、左目領域EA(l)、口領域MAの3つに設定し、特定顔向きが右向き(または左向き)である場合には、検出すべき器官領域の数を、右目領域EA(r)(または左目領域EA(l))、口領域MAの2つに設定する。
ステップS160(図3)では、領域検出部210(図1)が、器官領域検出処理を行う。器官領域検出処理は、ステップS140で選択された顔領域FAにおける顔の器官の画像に対応する画像領域を器官領域として検出する処理である。本実施例の器官領域検出処理では、ステップS150で設定された検出条件を満たす器官領域の検出が行われる。
図12は、器官領域検出処理の流れを示すフローチャートである。また、図13は、器官領域検出処理の概要を示す説明図である。図13の最上段には、顔検出処理に用いられた顔検出用画像FDImg(図5参照)の一例を示している。
顔検出用画像FDImgからの器官領域の検出は、上述した顔領域FAの検出と同様に行われる。すなわち、図13に示すように、矩形形状のウィンドウSWがその位置およびサイズ(大きさ)が変更されつつ顔検出用画像FDImg上に配置され(図12のステップS520,S530,S580〜S610)、配置されたウィンドウSWにより規定される画像領域が顔の器官の画像に対応する器官領域であるか否かの判定(以下「器官判定」とも呼ぶ)の対象となる判定対象画像領域JIAとして設定される(図12のステップS540)。なお、ウィンドウSWの取り得る位置およびサイズ(大きさ)は、ステップS150で設定された検出条件に基づき決定される。すなわち、ウィンドウSWは、設定された検出条件により特定される器官領域の位置し得る範囲内に配置される。具体的には、目領域EAの検出の際には、ウィンドウSWは、その重心が図10に示した領域Aおよび領域Bの範囲内に位置するように配置され、口領域MAの検出の際には、ウィンドウSWは、その重心が図10に示した領域Cおよび領域Bの範囲内に位置するように配置される。また、ウィンドウSWのサイズ(大きさ)は、設定された検出条件により特定される器官領域の大きさの取り得る範囲内に設定される(図11参照)。このようにウィンドウSWの取り得る位置およびサイズが設定されることにより、設定された検出条件を満たす器官領域が検出される。なお、ウィンドウSWは、その傾きが0度の状態(ウィンドウSWの上方向が顔検出用画像FDImgの上方向と一致した基準状態)で配置される。
判定対象画像領域JIAが設定されると、顔器官学習データOLD(図1)を用いて、顔の器官(目および口)毎に、器官判定に用いられる累計評価値Tvが算出される(図12のステップS550)。累計評価値Tvの算出や器官判定に用いられるフィルタXの態様や閾値thX、重み係数WeX、閾値TH(図6参照)は、顔器官学習データOLDに規定されている。なお、顔器官学習データOLDの設定のための学習は、顔学習データFLDの設定のための学習と同様に、顔の器官に対応する画像であることが予めわかっている複数の器官サンプル画像によって構成された器官サンプル画像群と、顔の器官に対応する画像ではないことが予めわかっている複数の非器官サンプル画像によって構成された非器官サンプル画像群と、を用いて実行される。
なお、顔領域検出処理(図4)においては、累計評価値Tvの算出および顔判定が、すべての特定顔傾きについて実行されるのに対し、器官領域検出処理(図12)では、累計評価値Tvの算出および器官判定が、選択された顔領域FAの特定顔傾きと同一の器官傾きに対応する顔器官学習データOLD(図2(e)ないし図2(h)参照)を用いて、顔領域FAの特定顔傾きと同一の器官傾きについてのみ実行される。ただし、器官領域検出処理においても、累計評価値Tvの算出および器官判定が、すべての特定器官傾きについて実行されるものとしてもよい。
算出された累計評価値Tvが所定の閾値TH以上である場合には、判定対象画像領域JIAは顔の当該器官の画像に対応する画像領域であるとして、判定対象画像領域JIAの位置、すなわち現在設定されているウィンドウSWの座標が記憶される(図12のステップS570)。一方、累計評価値Tvが閾値THより小さい場合には、ステップS570の処理はスキップされる。
ウィンドウSWの取り得るサイズのすべてについて、ウィンドウSWの位置し得る範囲全体がスキャンされた後に、領域設定部214(図1)による器官領域設定処理が実行される(図12のステップS620)。図14は、器官領域設定処理の概要を示す説明図である。器官領域設定処理は、顔領域設定処理(図8および図9参照)と同様の処理である。領域設定部214は、図12のステップS560において累計評価値Tvが閾値TH以上であると判定され、ステップS570において記憶されたウィンドウSWの座標と、顔領域FAに対応する特定顔傾きと、に基づき、顔の器官の画像に対応する画像領域としての器官領域を設定する。具体的には、特定顔傾きが0度である場合には、ウィンドウSWにより規定される画像領域(すなわち判定対象画像領域JIA)が、そのまま器官領域として設定される。一方、特定顔傾きが0度以外である場合には、ウィンドウSWの傾きを特定顔傾きに一致させ(すなわちウィンドウSWを所定の点(例えばウィンドウSWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後のウィンドウSWにより規定される画像領域が器官領域として設定される。例えば図14(a)に示すように、30度の特定顔傾きについて、右目に対応するウィンドウSW(er)と左目に対応するウィンドウSW(el)と口に対応するウィンドウSW(m)とにおいて累計評価値Tvが閾値TH以上であると判定された場合には、図14(b)に示すように、各ウィンドウSWの傾きを30度に変化させ、傾き変化後の各ウィンドウSWにより規定される画像領域が器官領域(右目領域EA(r)、左目領域EA(l)、口領域MA)として設定される。
また、顔領域設定処理と同様に、互いに一部が重複する複数のウィンドウSWが記憶された場合には、各ウィンドウSWにおける所定の点(例えばウィンドウSWの重心)の座標の平均の座標を重心とし、各ウィンドウSWのサイズの平均のサイズを有する1つの新たなウィンドウ(平均ウィンドウAW)が設定され、特定顔傾きが0度である場合には、平均ウィンドウAWにより規定される画像領域がそのまま器官領域として設定され、特定顔傾きが0度以外である場合には、平均ウィンドウAWの傾きを特定顔傾きに一致させ(すなわち平均ウィンドウAWを所定の点(例えば平均ウィンドウAWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後の平均ウィンドウAWにより規定される画像領域が器官領域として設定される。
ステップS170(図3)では、領域検出部210(図1)が、ステップS140において未だ選択されていない顔領域FAが存在するか否かを判定する。未だ選択されていない顔領域FAが存在すると判定された場合には(ステップS170:No)、ステップS140に戻って未選択の顔領域FAの1つが選択され、ステップS150以降の処理が実行される。一方、すべての顔領域FAが選択されたと判定された場合には(ステップS170:Yes)、処理はステップS180に進む。
ステップS180(図3)では、情報付加部230(図1)が、原画像データを含む画像ファイルに付属情報を付加する情報記録処理を行う。情報付加部230は、原画像データを含む画像ファイルの付属情報格納領域に、付属情報として、検出された顔領域および器官領域を特定する情報(原画像OImgにおける顔領域および器官領域の位置(座標)を示す情報)を格納する。なお、情報付加部230は、顔領域および器官領域の大きさ(サイズ)を示す情報や、原画像OImgにおける顔領域および器官領域の傾きを示す情報をも、付属情報格納領域に格納するとしてもよい。
以上説明したように、本実施例のプリンタ100による顔領域・器官領域検出処理では、顔領域の検出結果に基づき、顔領域における器官領域を検出する際の検出すべき器官領域の位置と大きさと数との取り得る範囲を特定する検出条件が設定され、設定された検出条件を満たす器官領域の検出が行われる。すなわち、検出条件を満たす器官領域のみが検出され、評価により器官領域と判定され得る画像領域であっても検出条件を満たさない場合には器官領域として検出されない。そのため、本実施例のプリンタ100による顔領域・器官領域検出処理では、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
B.第2実施例:
図15および図16は、本発明の第2実施例におけるウィンドウ決定処理の流れを示すフローチャートである。また、図17は、本発明の第2実施例におけるウィンドウ決定処理の概要を示す説明図である。第2実施例におけるウィンドウ決定処理は、第1実施例の器官領域検出処理(図12)における器官領域決定処理(ステップS620)の一部の処理であり、具体的には、目領域EAに関して図12のステップS570で複数のウィンドウSWの座標が記憶された場合に右目領域EA(r)および左目領域EA(l)に対応するウィンドウSW(右目ウィンドウSW(er)および左目ウィンドウSW(el)、図14参照)を決定する処理である。
ステップS702(図15)では、領域設定部214(図1)が、初期化を行う。具体的には、ウィンドウ重複数OLの最大値OLmaxの値がゼロに設定されると共に、参照距離RDの最小値RDminの値が1,000に設定される。ウィンドウ重複数OLおよび参照距離RDについては後述する。なお、初期化において、参照距離の最小値RDminの値は後に算出される参照距離RDが最小値RDminの値を超えないような比較的大きな値に設定されるものであり、1,000以外の値に設定されてもよい。
ステップS704(図15)では、領域設定部214が、目領域EAに対応するウィンドウSW(ウィンドウSW(e)と表す)を1つ選択する。なお、目領域EAに対応するウィンドウSW(e)は、目に対応する顔器官学習データOLDを用いた器官判定により目の画像に対応する画像領域であると判定されたウィンドウSWである。図17(a)には、複数のウィンドウSW(e)を示しており、複数のウィンドウSW(e)の内の1つが選択される。
ステップS706(図15)では、領域設定部214が、選択されたウィンドウSW(e)について、ウィンドウ重心Cwの座標と参照距離RDとを算出する。図17(b)に示すように、本実施例では、顔領域FAにおいて、右目領域EA(r)の重心の標準的な位置である標準重心AC(er)と、左目領域EA(l)の重心の標準的な位置である標準重心AC(el)とが、予め設定されている。参照距離RDは、選択されたウィンドウSW(e)の重心Cwと標準重心AC(er)および標準重心AC(el)との間の距離の内の小さい方である。
ステップS708(図15)では、領域設定部214が、選択されたウィンドウSW(e)の重心Cwが、顔領域FAの上半分に位置するか否かを判定する。ここで、図17(a)に示すように、顔領域FAの上半分とは、矩形形状の顔領域FAを顔の左右方向に対応する顔領域FAの外周線に平行な直線により半分に分割した際の、顔の上側に対応する領域である。なお、同様に、顔領域FAを顔の左右方向に対応する顔領域FAの外周線に平行な直線により半分に分割した際の顔の下側に対応する領域を顔領域FAの下半分と呼ぶ。また、顔領域FAを顔の上下方向に対応する顔領域FAの外周線に平行な直線により半分に分割した際の顔の右側に対応する領域を顔領域FAの右半分と呼び、残りの半分の領域を顔領域FAの左半分と呼ぶ。選択されたウィンドウSW(e)の重心Cwが顔領域FAの上半分に位置しないと判定された場合には、選択されたウィンドウSW(e)は真に目領域EAに対応するウィンドウSWではないと判定され、後述のステップS710ないしS714の処理がスキップされる。この場合には、ステップS716において、目領域EAに対応するウィンドウSW(e)がすべて選択されたか否かが判定され、未だ選択されていないウィンドウSW(e)が存在する場合には、ステップS704に戻ってウィンドウSW(e)の選択が実行される。
ステップS708(図15)において、選択されたウィンドウSW(e)の重心Cwが顔領域FAの上半分に位置すると判定された場合には、領域設定部214(図1)が、ウィンドウ重複数OLと最大値OLmaxとの比較を行う(ステップS710)。ここで、ウィンドウ重複数OLは、選択されたウィンドウSW(e)に少なくとも一部が重複する他のウィンドウSW(e)の数である。ステップS710においてウィンドウ重複数OLが最大値OLmaxより大きいと判定された場合、またはステップS710においてウィンドウ重複数OLがOLmaxと等しいと判定され、かつステップS714において参照距離RDが最小値RDminより小さいと判定された場合には、領域設定部214は、現在選択されているウィンドウSW(e)を候補ウィンドウに設定する(ステップS712)。さらに、このとき、領域設定部214は、最大値OLmaxを現在のウィンドウ重複数OLに更新し、最小値RDminを現在の参照距離RDに更新する。一方、ステップS710においてウィンドウ重複数OLが最大値OLmaxより小さいと判定された場合や、ステップS714において参照距離RDが最小値RDminより小さくないと判定された場合には、ステップS712の処理はスキップされ、処理はステップS716に進む。
上述したステップS704からS714までの処理が、ステップS716において目領域EAに対応するウィンドウSW(e)がすべて選択されたと判定されるまで、繰り返し実行される。これにより、目領域EAに対応するウィンドウSW(e)の内、ウィンドウ重複数OLの最も大きいウィンドウSW(e)(ウィンドウ重複数OLの最も大きいウィンドウSW(e)が複数存在する場合には、その内の参照距離RDの最も小さいウィンドウSW(e))が最終的な候補ウィンドウとして設定される。
ステップS718(図15)では、領域設定部214が、最終的な候補ウィンドウの重心Cwが顔領域FAの右半分に位置するか左半分に位置するかを判定する。右半分に位置すると判定された場合には、候補ウィンドウが右目ウィンドウSW(er)として決定される(ステップS720)。一方、左半分に位置すると判定された場合には、候補ウィンドウが左目ウィンドウSW(el)として決定される(ステップS722)。
図15のステップS722までの処理により、右目ウィンドウSW(er)および左目ウィンドウSW(el)の一方が決定される。以降の処理(図16のステップS724以降の処理)では、右目ウィンドウSW(er)および左目ウィンドウSW(el)の内の未だ未決定のウィンドウSWの決定が実行される。
図16のステップS724、S726、S728の処理内容は、それぞれ、図15のステップS702、S704、S706の処理内容と同様である。ステップS730(図16)では、領域設定部214が、選択されたウィンドウSW(e)が条件Xを満たすか否かを判定する。ここで、条件Xは、選択されたウィンドウSW(e)の重心Cwが顔領域FAの上半分に位置することと、選択されたウィンドウSW(e)が図15のステップS720またはS722において既に決定された右目ウィンドウSW(er)または左目ウィンドウSW(el)(以下「既決定ウィンドウ」とも呼ぶ)に一部でも重複しないことと、選択されたウィンドウSW(e)と既決定ウィンドウとの為す角度が30度以内であることと、顔領域FAにおける選択されたウィンドウSW(e)の重心Cwの位置が既決定ウィンドウの重心Cwの位置と左右反対の位置であることと、の4つのAND条件である。なお、選択されたウィンドウSW(e)と既決定ウィンドウとの為す角度が30度以内であるとは、選択されたウィンドウSW(e)の重心Cwと既決定ウィンドウの重心Cwとを結ぶ直線と、顔領域FAの顔の左右方向に対応する外周線と、の為す角度を意味している。選択されたウィンドウSW(e)の重心Cwが顔領域FAの上半分に位置しない場合、選択されたウィンドウSW(e)が既決定ウィンドウに一部でも重複する場合、選択されたウィンドウSW(e)と既決定ウィンドウとの為す角度が30度を超える場合、顔領域FAにおける選択されたウィンドウSW(e)の重心Cwの位置が既決定ウィンドウの重心Cwの位置と左右反対の位置となっていない場合には、それぞれ、当該ウィンドウSW(e)は真に目の画像に対応するウィンドウSWではないと考えられる。従って、条件Xが満たされないと判定された場合には、以下のステップS732ないしS736の処理がスキップされ、処理はステップS738に進む。なお、条件Xを構成する4つの条件の内、ウィンドウSW(e)の重心Cwが顔領域FAの上半分に位置すること以外の条件は、目領域EAの候補としての複数のウィンドウSW(e)間の幾何学的な関係に関する条件である。
一方、条件Xが満たされると判定された場合には、ステップS732ないしS736の処理が実行される。ステップS732ないしS736の処理内容は、図15のステップS710ないしS714の処理内容と同様である。上述したステップS726からS736までの処理が、ステップS738において目領域EAに対応するウィンドウSW(e)がすべて選択されたと判定されるまで、繰り返し実行される。これにより、目領域EAに対応するウィンドウSW(e)の内、条件Xを満足し、かつウィンドウ重複数OLの最も大きいウィンドウSW(e)(ウィンドウ重複数OLの最も大きいウィンドウSW(e)が複数存在する場合には、その内の参照距離RDの最も小さいウィンドウSW(e))が最終的な候補ウィンドウとして設定される。
ステップS740(図16)では、領域設定部214が、最終的な候補ウィンドウの重心Cwが顔領域FAの右半分に位置するか左半分に位置するかを判定する。右半分に位置すると判定された場合には、候補ウィンドウが右目ウィンドウSW(er)として決定される(ステップS742)。一方、左半分に位置すると判定された場合には、候補ウィンドウが左目ウィンドウSW(el)として決定される(ステップS744)。
以上説明したウィンドウ決定処理により、目領域EAに関して図12のステップS570で複数のウィンドウSWの座標が記憶された場合に右目領域EA(r)および左目領域EA(l)に対応する右目ウィンドウSW(er)および左目ウィンドウSW(el)が決定される。第2実施例におけるウィンドウ決定処理では、目領域EAの候補としての複数のウィンドウSW(e)間の幾何学的な関係に関する条件に基づき右目ウィンドウSW(er)および左目ウィンドウSW(el)が決定されるため、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
C.変形例:
なお、この発明は上記の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
C1.変形例1:
上記各実施例では、検出すべき器官領域の位置と大きさと数との取り得る範囲を特定する検出条件が設定されるとしているが、設定される検出条件は、必ずしも器官領域の位置と大きさと数とのすべてに関して取り得る範囲を特定するものである必要はなく、器官領域の位置と大きさと数との少なくとも1つに関して取り得る範囲を特定するものであればよい。このようにしても、画像における器官領域の検出処理の精度向上および効率化を図ることができる。
C2.変形例2:
上記各実施例では、器官領域検出処理(図12)において、設定された検出条件が満たされるようにウィンドウSWの取り得る位置およびサイズ(大きさ)が設定されることにより判定対象画像領域JIAの設定が行われるとしているが、判定対象画像領域JIAの設定は検出条件とは独立して実行されるとしてもよい。この場合には、器官判定(図12のステップS560)の後に、あるいは器官領域決定処理(図12のステップS620)の後に、ウィンドウSWあるいは器官領域が設定された検出条件を満足するようなものであるか否かが判定される。このようにしても、画像における器官領域の検出処理の精度向上を図ることができる。
C3.変形例3:
上記各実施例では、器官領域の位置と大きさとに関する検出条件は、顔器官学習データOLDの設定に用いられた顔サンプル画像における顔の器官の画像の位置および大きさに基づき予め設定されるとしているが、顔領域検出処理において器官の画像の位置および大きさに関して統計をとり、統計に基づき検出条件を設定するものとしてもよい。
C4.変形例4:
上記第2実施例では、右目ウィンドウSW(er)および左目ウィンドウSW(el)の決定のためのウィンドウ決定処理を説明したが、ウィンドウ決定処理は、他の顔の器官の画像に対応するウィンドウSWの決定のための処理に変形可能である。例えば、ウィンドウ決定処理は、右目ウィンドウSW(er)、左目ウィンドウSW(el)および口の画像に対応するウィンドウSW(口ウィンドウSW(m)、図14参照)の決定のための処理であるとしてもよい。この場合には、目領域EAおよび口領域MAの候補としての複数のウィンドウSW(e)間の幾何学的な関係に関する条件を利用してウィンドウSWの決定を行えばよい。
また、ウィンドウ決定処理は、目領域EAおよび口領域MAの候補としての各ウィンドウSW(e)の信頼度を用いて実行するとしてもよい。ここで信頼度とは、目領域EAおよび口領域MAの候補としてのウィンドウSW(e)が、真に目領域EAおよび口領域MAに対応する画像領域であることの確からしさを表す指標である。信頼度としては、ウィンドウSW(e)に重複するウィンドウの数や、ウィンドウSW(e)について算出された累計評価値Tvを利用可能である。目領域EAおよび口領域MAの候補としての各ウィンドウSW(e)の内、信頼度の高いウィンドウSW(e)を右目ウィンドウSW(er)、左目ウィンドウSW(el)、口ウィンドウSW(m)として決定するとしてもよい。また、目領域EAの候補としての各ウィンドウSW(e)の内、2つのウィンドウSW(e)の組み合わせについての信頼度の高いウィンドウSW(e)の組み合わせを右目ウィンドウSW(er)および左目ウィンドウSW(el)として決定するとしてもよい。また、目領域EAおよび口領域MAの候補としての各ウィンドウSW(e)の内、2つのウィンドウSW(e)の組み合わせについての目領域としての信頼度と、1つのウィンドウSW(e)についての口領域としての信頼度と、の合計の高いウィンドウSW(e)の組み合わせを右目ウィンドウSW(er)、左目ウィンドウSW(el)、口ウィンドウSW(m)として決定するとしてもよい。
C5.変形例5:
上記各実施例における顔領域検出処理(図4)や器官領域検出処理(図12)の態様はあくまで一例であり、種々変更可能である。例えば顔検出用画像FDImg(図5参照)のサイズは320画素×240画素に限られず、他のサイズであってもよいし、原画像OImgそのものを顔検出用画像FDImgとして用いることも可能である。また、使用されるウィンドウSWのサイズやウィンドウSWの移動方向および移動量(移動ピッチ)は上述したものに限られない。また、上記各実施例では、顔検出用画像FDImgのサイズが固定され、複数種類のサイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されているが、複数種類のサイズの顔検出用画像FDImgが生成され、固定サイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されるものとしてもよい。
また、上記各実施例では、累計評価値Tvを閾値THと比較することにより顔判定および器官判定を行っているが(図6参照)、顔判定および器官判定を複数の判別器を用いた判別等の他の方法によって行ってもよい。顔判定および器官判定の方法に応じて、顔学習データFLDおよび顔器官学習データOLDの設定に用いられる学習方法も変更される。また、顔判定および器官判定は、必ずしも学習を用いた判別方法により行われる必要はなく、パターンマッチング等の他の方法により行われるとしてもよい。
また、上記各実施例では、30度刻みの12種類の特定顔傾きが設定されているが、より多くの種類の特定顔傾きが設定されてもよいし、より少ない種類の特定顔傾きが設定されてもよい。また、必ずしも特定顔傾きが設定される必要はなく、0度の顔傾きについての顔判定が行われるとしてもよい。また、上記各実施例では、顔サンプル画像群に基本顔サンプル画像FIoを拡大・縮小した画像や回転させた画像が含まれるとしているが、顔サンプル画像群に必ずしもこのような画像が含まれる必要はない。
上記各実施例において、あるサイズのウィンドウSWにより規定される判定対象画像領域JIAについての顔判定(または器官判定)で顔の画像(または顔の器官の画像)に対応する画像領域であると判定された場合には、当該サイズより所定の比率以上小さいサイズのウィンドウSWを配置する場合には、顔の画像に対応する画像領域であると判定された判定対象画像領域JIAを避けて配置するものとしてもよい。このようにすれば、処理の高速化を図ることができる。
上記各実施例では、メモリカードMCに格納された画像データが原画像データに設定されているが、原画像データはメモリカードMCに格納された画像データに限らず、例えばネットワークを介して取得された画像データであってもよい。
上記各実施例では、顔の器官の種類として、右目と左目と口とが設定されており、器官領域として、右目領域EA(r)と左目領域EA(l)と口領域MAとの検出が行われるが、顔の器官の種類として顔のどの器官を設定するかは変更可能である。例えば、顔の器官の種類として、右目と左目と口とのいずれか1つまたは2つのみが設定されるとしてもよい。また、顔の器官の種類として、右目と左目と口とに加えて、または右目と左目と口との少なくとも1つに代わり、顔のその他の器官の種類(例えば鼻や眉)が設定され、器官領域としてこのような器官の画像に対応する領域が検出されるとしてもよい。
上記各実施例では、顔領域FAおよび器官領域は矩形の領域であるが、顔領域FAおよび器官領域は矩形以外の形状の領域であってもよい。
上記各実施例では、画像処理装置としてのプリンタ100による画像処理を説明したが、処理の一部または全部がパーソナルコンピュータやデジタルスチルカメラ、デジタルビデオカメラ等の他の種類の画像処理装置により実行されるものとしてもよい。また、プリンタ100はインクジェットプリンタに限らず、他の方式のプリンタ、例えばレーザプリンタや昇華型プリンタであるとしてもよい。
上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
また、本発明の機能の一部または全部がソフトウェアで実現される場合には、そのソフトウェア(コンピュータプログラム)は、コンピュータ読み取り可能な記録媒体に格納された形で提供することができる。この発明において、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスクやCD−ROMのような携帯型の記録媒体に限らず、各種のRAMやROM等のコンピュータ内の内部記憶装置や、ハードディスク等のコンピュータに固定されている外部記憶装置も含んでいる。
本発明の第1実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。 顔学習データFLDおよび顔器官学習データOLDの種類を示す説明図である。 第1実施例における顔領域・器官領域検出処理の流れを示すフローチャートである。 顔領域検出処理の流れを示すフローチャートである。 顔領域検出処理の概要を示す説明図である。 顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。 正面向きの顔に対応する顔学習データFLDの設定のための学習に用いられるサンプル画像の一例を示す説明図である。 顔領域決定処理の概要を示す説明図である。 顔領域決定処理の概要を示す説明図である。 検出条件の設定方法の概要を示す説明図である。 検出条件の設定方法の概要を示す説明図である。 器官領域検出処理の流れを示すフローチャートである。 器官領域検出処理の概要を示す説明図である。 器官領域設定処理の概要を示す説明図である。 本発明の第2実施例におけるウィンドウ決定処理の流れを示すフローチャートである。 本発明の第2実施例におけるウィンドウ決定処理の流れを示すフローチャートである。 本発明の第2実施例におけるウィンドウ決定処理の概要を示す説明図である。
符号の説明
100…プリンタ
110…CPU
120…内部メモリ
140…操作部
150…表示部
160…プリンタエンジン
170…カードインターフェース
172…カードスロット
200…画像処理部
210…領域検出部
211…判定対象設定部
212…評価値算出部
213…判定部
214…領域設定部
230…情報付加部
240…検出条件設定部
310…表示処理部
320…印刷処理部

Claims (10)

  1. 画像処理装置であって、
    対象画像における顔の画像に対応する顔領域の検出を行う顔領域検出部と、
    前記顔領域の検出結果に基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する際の、検出すべき前記器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件を設定する検出条件設定部と、
    設定された前記検出条件を満たす前記器官領域の検出を行う器官領域検出部と、を備える、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記顔領域検出部は、顔の画像を含むサンプル画像を用いて生成された顔評価用データを用いて前記対象画像上における画像領域が顔の画像に対応する画像領域であることの確からしさを評価することにより、前記顔領域の検出を行い、
    前記検出条件設定部は、前記顔評価用データの生成に用いられた前記サンプル画像における顔の器官の画像に基づき予め設定された前記顔領域と前記器官領域との間の位置と大きさと数との少なくとも1つに関する関係に基づき、前記検出条件を設定する、画像処理装置。
  3. 請求項2に記載の画像処理装置であって、
    前記顔評価用データは、前記顔評価用データの生成に用いられた前記サンプル画像における顔の画像の画像面に平行な軸を中心とした回転角度である顔向きに対応付けられており、
    前記顔領域と前記器官領域との間の前記関係は、前記顔評価用データに対応付けられた顔向き毎に設定されており、
    前記検出条件設定部は、前記顔領域の検出に用いられた前記顔評価用データに対応付けられた顔向きに対応する前記関係に基づき、前記検出条件を設定する、画像処理装置。
  4. 請求項2または請求項3に記載の画像処理装置であって、
    前記器官領域検出部は、
    前記顔領域における画像領域である判定対象画像領域を設定する判定対象設定部と、
    前記判定対象画像領域が顔の器官の画像に対応する画像領域であることの確からしさを表す評価値を算出するための器官評価用データを記憶する記憶部と、
    前記器官評価用データと前記判定対象画像領域に対応する画像データとに基づき前記評価値を算出する評価値算出部と、
    前記評価値と前記判定対象画像領域の位置およびサイズとに基づき、前記器官領域を設定する領域設定部と、を含み、
    前記判定対象設定部は、前記顔領域と前記器官領域との間の前記関係に基づき、設定する前記判定対象画像領域の位置と大きさと数との少なくとも1つを決定する、画像処理装置。
  5. 請求項2ないし請求項4のいずれかに記載の画像処理装置であって、
    前記顔評価用データは、前記サンプル画像を用いた学習により生成される、画像処理装置。
  6. 請求項1ないし請求項5のいずれかに記載の画像処理装置であって、
    前記検出条件設定部は、検出すべき前記器官領域に対応する顔の器官の種類に応じて、前記検出条件を設定する、画像処理装置。
  7. 請求項1ないし請求項6のいずれかに記載の画像処理装置であって、
    前記器官領域検出部は、複数の前記器官領域の候補を検出し、前記複数の器官領域の候補間の幾何学的な関係に基づき前記器官領域を決定する、画像処理装置。
  8. 請求項1ないし請求項7のいずれかに記載の画像処理装置であって、
    前記顔の器官の種類は、右目と左目と口との少なくとも1つである、画像処理装置。
  9. 画像処理方法であって、
    (a)対象画像における顔の画像に対応する顔領域の検出を行う工程と、
    (b)前記顔領域の検出結果に基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する際の、検出すべき前記器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件を設定する工程と、
    (c)設定された前記検出条件を満たす前記器官領域の検出を行う工程と、を備える、画像処理方法。
  10. 画像処理のためのコンピュータプログラムであって、
    対象画像における顔の画像に対応する顔領域の検出を行う顔領域検出機能と、
    前記顔領域の検出結果に基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する際の、検出すべき前記器官領域の位置と大きさと数との少なくとも1つの取り得る範囲を特定する検出条件を設定する検出条件設定機能と、
    設定された前記検出条件を満たす前記器官領域の検出を行う器官領域検出機能と、を、コンピュータに実現させる、コンピュータプログラム。
JP2008127842A 2008-05-15 2008-05-15 画像における顔の器官の画像に対応する器官領域の検出 Withdrawn JP2009277027A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008127842A JP2009277027A (ja) 2008-05-15 2008-05-15 画像における顔の器官の画像に対応する器官領域の検出
US12/464,692 US20090285457A1 (en) 2008-05-15 2009-05-12 Detection of Organ Area Corresponding to Facial Organ Image in Image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008127842A JP2009277027A (ja) 2008-05-15 2008-05-15 画像における顔の器官の画像に対応する器官領域の検出

Publications (1)

Publication Number Publication Date
JP2009277027A true JP2009277027A (ja) 2009-11-26

Family

ID=41316209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008127842A Withdrawn JP2009277027A (ja) 2008-05-15 2008-05-15 画像における顔の器官の画像に対応する器官領域の検出

Country Status (2)

Country Link
US (1) US20090285457A1 (ja)
JP (1) JP2009277027A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198807A (ja) * 2011-03-22 2012-10-18 Olympus Imaging Corp 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
JP2022072017A (ja) * 2020-10-29 2022-05-17 富士通クライアントコンピューティング株式会社 情報処理装置およびプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5586203B2 (ja) * 2009-10-08 2014-09-10 株式会社東芝 超音波診断装置、超音波画像処理装置及び超音波画像処理プログラム
US9854159B2 (en) * 2012-07-20 2017-12-26 Pixart Imaging Inc. Image system with eye protection
CN106874826A (zh) 2015-12-11 2017-06-20 腾讯科技(深圳)有限公司 人脸关键点跟踪方法和装置
US11348370B2 (en) * 2018-10-16 2022-05-31 Nec Corporation Iris authentication device, iris authentication method, and recording medium
US20210383098A1 (en) * 2018-11-08 2021-12-09 Nec Corporation Feature point extraction device, feature point extraction method, and program storage medium
JP7433860B2 (ja) * 2019-11-26 2024-02-20 キヤノン株式会社 電子機器及び電子機器の制御方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141551A (ja) * 2001-10-31 2003-05-16 Toshiba Corp 顔向き計算方法及びその装置
JP2003346158A (ja) * 2002-05-28 2003-12-05 Toshiba Corp 顔画像による顔領域追跡方法
JP2006285956A (ja) * 2005-03-11 2006-10-19 Fuji Photo Film Co Ltd 赤目検出方法および装置並びにプログラム
JP2009049489A (ja) * 2007-08-14 2009-03-05 Sony Corp 撮像装置、撮像方法およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPS140502A0 (en) * 2002-03-27 2002-05-09 Seeing Machines Pty Ltd Method for automatic detection of facial features
JP4847685B2 (ja) * 2004-04-16 2011-12-28 株式会社日立ハイテクノロジーズ パターンサーチ方法
EP1693782B1 (en) * 2005-02-21 2009-02-11 Mitsubishi Electric Information Technology Centre Europe B.V. Method for facial features detection
JP4315215B2 (ja) * 2007-05-18 2009-08-19 カシオ計算機株式会社 撮像装置、及び顔検出方法、顔検出制御プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141551A (ja) * 2001-10-31 2003-05-16 Toshiba Corp 顔向き計算方法及びその装置
JP2003346158A (ja) * 2002-05-28 2003-12-05 Toshiba Corp 顔画像による顔領域追跡方法
JP2006285956A (ja) * 2005-03-11 2006-10-19 Fuji Photo Film Co Ltd 赤目検出方法および装置並びにプログラム
JP2009049489A (ja) * 2007-08-14 2009-03-05 Sony Corp 撮像装置、撮像方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012198807A (ja) * 2011-03-22 2012-10-18 Olympus Imaging Corp 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
JP2022072017A (ja) * 2020-10-29 2022-05-17 富士通クライアントコンピューティング株式会社 情報処理装置およびプログラム
JP7216297B2 (ja) 2020-10-29 2023-02-01 富士通クライアントコンピューティング株式会社 情報処理装置およびプログラム

Also Published As

Publication number Publication date
US20090285457A1 (en) 2009-11-19

Similar Documents

Publication Publication Date Title
JP2009237619A (ja) 画像における顔領域および器官領域の検出
US8249312B2 (en) Image processing device and image processing method
JP2009277027A (ja) 画像における顔の器官の画像に対応する器官領域の検出
JP5239625B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
US8218899B2 (en) Image processing device, image processing method, and image processing program
US8224117B2 (en) Image processing device, image processing method, and image processing program
US20090028390A1 (en) Image Processing for Estimating Subject Distance
US20080240615A1 (en) Image processing for image deformation
US20080240516A1 (en) Image Processing Apparatus and Image Processing Method
JP4957607B2 (ja) 画像における顔領域の検出
JP2011053942A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2012022474A (ja) 画像処理方法、携帯情報端末及びプログラム
US8031915B2 (en) Image processing device and image processing method
JP2009282699A (ja) 画像における顔の器官の画像に対応する器官領域の検出
JP5256974B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2010282339A (ja) 目における瞳の位置を補正する画像処理装置、画像処理方法、画像処理プログラム、および、印刷装置
JP4985510B2 (ja) 対象画像における顔の画像に対応する顔領域の設定
JP2010244251A (ja) 顔の特徴部位の座標位置を検出する画像処理装置
JP2009237857A (ja) 画像における顔の器官の画像に対応する器官領域の設定
CN112541506B (zh) 文本图像的矫正方法及装置、设备和介质
JP2009237618A (ja) 画像における顔領域の検出
JP4957608B2 (ja) 画像における顔領域の検出
WO2020095400A1 (ja) 特徴点抽出装置、特徴点抽出方法およびプログラム記憶媒体
JP2009237613A (ja) 対象画像からの顔の画像に対応する顔領域の検出
JP2009230473A (ja) 対象画像からの特定種類の被写体の画像に対応する画像領域の検出

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20130125