[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2009237620A - 画像における顔領域および器官領域の検出 - Google Patents

画像における顔領域および器官領域の検出 Download PDF

Info

Publication number
JP2009237620A
JP2009237620A JP2008079251A JP2008079251A JP2009237620A JP 2009237620 A JP2009237620 A JP 2009237620A JP 2008079251 A JP2008079251 A JP 2008079251A JP 2008079251 A JP2008079251 A JP 2008079251A JP 2009237620 A JP2009237620 A JP 2009237620A
Authority
JP
Japan
Prior art keywords
image
face
organ
detection
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008079251A
Other languages
English (en)
Inventor
Kenji Matsuzaka
健治 松坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2008079251A priority Critical patent/JP2009237620A/ja
Publication of JP2009237620A publication Critical patent/JP2009237620A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Record Information Processing For Printing (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】顔領域からの器官領域の検出処理の検出精度と処理速度との調整を図ることを可能とする。
【解決手段】画像処理装置は、顔領域を検出する顔領域検出部と、顔領域の検出結果に基づき顔の画像を含む所定のサイズの器官検出用画像を生成する画像生成部と、器官検出用画像を表す画像データに基づき顔領域における顔の器官の画像に対応する器官領域を検出する器官領域検出部と、器官領域の検出結果の用途を特定する用途特定情報を取得する用途特定情報取得部と、用途特定情報に基づき所定のサイズを設定するサイズ設定部と、を備える。
【選択図】図12

Description

本発明は、画像における顔領域および器官領域の検出に関する。
画像中からの顔の画像に対応する顔領域の検出および顔領域からの顔の器官(例えば目)の画像に対応する器官領域の検出を行う技術が知られている(例えば特許文献1および2)。
特開2006−065640号公報 特開2006−179030号公報
顔領域からの器官領域の検出の際には、検出精度と処理速度との調整が図られることが好ましい。
本発明は、上記の課題を解決するためになされたものであり、顔領域からの器官領域の検出処理の検出精度と処理速度との調整を図ることを可能とする技術を提供することを目的とする。
上記課題の少なくとも一部を解決するために、本発明は、以下の形態または適用例として実現することが可能である。
[適用例1]画像処理装置であって、
対象画像における顔の画像に対応する顔領域を検出する顔領域検出部と、
前記顔領域の検出結果に基づき、前記顔の画像を含む所定のサイズの器官検出用画像を生成する画像生成部と、
前記器官検出用画像を表す画像データに基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する器官領域検出部と、
前記器官領域の検出結果の用途を特定する用途特定情報を取得する用途特定情報取得部と、
前記用途特定情報に基づき、前記所定のサイズを設定するサイズ設定部と、を備える、画像処理装置。
この画像処理装置では、顔領域が検出され、検出された顔領域に基づき顔の画像を含む所定のサイズの器官検出用画像が生成され、器官検出用画像を表す画像データに基づき顔領域における顔の器官の画像に対応する器官領域が検出される。また、この画像処理装置では、器官領域の検出結果の用途を特定する用途特定情報が取得され、用途特定情報に基づき所定のサイズが設定される。そのため、この画像処理装置では、顔領域からの器官領域の検出処理の検出精度と処理速度との調整を図ることができる。
[適用例2]適用例1に記載の画像処理装置であって、
前記サイズ設定部は、前記用途特定情報に基づき前記器官領域検出における要求精度を特定し、前記要求精度が高いほど前記所定のサイズが大きくなるように、前記所定のサイズを設定する、画像処理装置。
この画像処理装置では、用途特定情報に基づき器官領域検出における要求精度が特定され、要求精度が高いほど所定のサイズが大きくなるように所定のサイズが設定されるため、顔領域からの器官領域の検出処理の検出精度と処理速度との調整を図ることができる。
[適用例3]適用例1または適用例2に記載の画像処理装置であって、
前記用途は、検出された前記器官領域に基づき設定される画像領域を利用して実行される所定の画像処理である、画像処理装置。
この画像処理装置では、検出された器官領域に基づき設定される画像領域を利用して実行される所定の画像処理の種別に応じて、顔領域からの器官領域の検出処理の検出精度と処理速度との調整を図ることができる。
[適用例4]適用例1ないし適用例3のいずれかに記載の画像処理装置であって、
前記画像生成部は、前記顔領域に基づき前記顔領域を含む特定画像領域を設定し、前記特定画像領域の解像度を調整することにより、前記器官検出用画像を生成する、画像処理装置。
この画像処理装置では、検出された顔領域に基づき、顔の画像を含む所定のサイズの器官検出用画像を生成することができる。
[適用例5]適用例1ないし適用例4のいずれかに記載の画像処理装置であって、
前記顔の器官の種類は、右目と左目と口との少なくとも1つである、画像処理装置。
この画像処理装置では、顔領域からの右目と左目と口との少なくとも1つに対応する器官領域の検出処理の検出精度と処理速度との調整を図ることができる。
なお、本発明は、種々の態様で実現することが可能であり、例えば、画像処理方法および装置、器官領域検出方法および装置、これらの方法または装置の機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の形態で実現することができる。
次に、本発明の実施の形態を実施例に基づいて以下の順序で説明する。
A.実施例:
A−1.画像処理装置の構成:
A−2.画像処理:
B.変形例:
A.実施例:
A−1.画像処理装置の構成:
図1は、本発明の実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。本実施例のプリンタ100は、メモリカードMC等から取得した画像データに基づき画像を印刷する、いわゆるダイレクトプリントに対応したインクジェット式カラープリンタである。プリンタ100は、プリンタ100の各部を制御するCPU110と、ROMやRAMによって構成された内部メモリ120と、ボタンやタッチパネルにより構成された操作部140と、液晶ディスプレイにより構成された表示部150と、プリンタエンジン160と、カードインターフェース(カードI/F)170と、を備えている。プリンタ100は、さらに、他の機器(例えばデジタルスチルカメラやパーソナルコンピュータ)とのデータ通信を行うためのインターフェースを備えているとしてもよい。プリンタ100の各構成要素は、バスを介して互いに接続されている。
プリンタエンジン160は、印刷データに基づき印刷を行う印刷機構である。カードインターフェース170は、カードスロット172に挿入されたメモリカードMCとの間でデータのやり取りを行うためのインターフェースである。なお、本実施例では、メモリカードMCに画像データを含む画像ファイルが格納されている。
内部メモリ120には、画像処理部200と、表示処理部310と、印刷処理部320と、が格納されている。画像処理部200は、所定のオペレーティングシステムの下で、後述する画像処理を実行するためのコンピュータプログラムである。表示処理部310は、表示部150を制御して、表示部150上に処理メニューやメッセージ、画像等を表示させるディスプレイドライバである。印刷処理部320は、画像データから印刷データを生成し、プリンタエンジン160を制御して、印刷データに基づく画像の印刷を実行するためのコンピュータプログラムである。CPU110は、内部メモリ120から、これらのプログラムを読み出して実行することにより、これら各部の機能を実現する。
画像処理部200は、プログラムモジュールとして、領域検出部210と、処理種別設定部220と、を含んでいる。領域検出部210は、対象画像データの表す対象画像における所定の種類の被写体の画像(顔の画像および顔の器官の画像)に対応する画像領域の検出を行う。領域検出部210は、判定対象設定部211と、評価値算出部212と、判定部213と、領域設定部214と、画像生成部216と、サイズ設定部217と、を含んでいる。これら各部の機能については、後述の画像処理の説明において詳述する。なお、後述するように、領域検出部210は、顔の画像に対応する顔領域の検出および顔の器官の画像に対応する器官領域の検出を行うため、本発明における顔領域検出部および器官領域検出部として機能する。また、判定部213および領域設定部214は、本発明における領域設定部として機能する。
処理種別設定部220は、実行すべき画像処理の種別を設定する。処理種別設定部220は、ユーザによる実行すべき画像処理の種別の指定を取得する指定取得部222を含んでいる。
内部メモリ120には、また、予め設定された複数の顔学習データFLDおよび複数の顔器官学習データOLDが格納されている。顔学習データFLDおよび顔器官学習データOLDは、領域検出部210による所定の画像領域の検出に用いられる。図2は、顔学習データFLDおよび顔器官学習データOLDの種類を示す説明図である。図2(a)ないし図2(f)には、顔学習データFLDおよび顔器官学習データOLDの種類と、当該種類の顔学習データFLDおよび顔器官学習データOLDを用いて検出される画像領域の例と、を示している。
顔学習データFLDの内容については後述の画像処理の説明において詳述するが、顔学習データFLDは、顔傾きと顔向きとの組み合わせに対応付けられて設定されている。ここで、顔傾きとは、画像面内(インプレーン)における顔の傾き(回転角度)を意味している。すなわち、顔傾きは、画像面に垂直な軸を中心とした顔の回転角度である。本実施例では、対象画像上の領域や被写体等の傾きを、領域や被写体等の上方向が対象画像の上方向と一致した状態を基準状態(傾き=0度)とした場合における基準状態からの時計回りの回転角度で表すものとしている。例えば、顔傾きは、対象画像の上下方向に沿って顔が位置している状態(頭頂が上方向を向き顎が下方向を向いた状態)を基準状態(顔傾き=0度)とした場合における基準状態からの顔の時計回りの回転角度で表される。
また、顔向きとは、画像面外(アウトプレーン)における顔の向き(顔の振りの角度)を意味している。ここで、顔の振りとは、略円筒状の首の軸を中心とした顔の方向である。すなわち、顔向きは、画像面に平行な軸を中心とした顔の回転角度である。本実施例では、デジタルスチルカメラ等の画像生成装置の撮像面に正対した顔の顔向きを「正面向き」と呼び、撮像面に向かって右を向いた顔(画像の観賞者からみて左を向いた顔の画像)の顔向きを「右向き」と、撮像面に向かって左を向いた顔(画像の観賞者からみて右を向いた顔の画像)の顔向きを「左向き」と呼ぶものとしている。
内部メモリ120には、図2(a)ないし図2(d)に示す4つの顔学習データFLD、すなわち、図2(a)に示す正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(b)に示す正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(c)に示す右向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLDと、図2(d)に示す右向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLDと、が格納されている。なお、正面向きの顔と右向き(または左向き)の顔とは、別の種類の被写体と解釈することも可能であり、このように解釈した場合には、顔学習データFLDは被写体の種類と被写体の傾きとの組み合わせに対応して設定されていると表現することも可能である。
後述するように、ある顔傾きに対応する顔学習データFLDは、当該顔傾きを中心に顔傾きの値がプラスマイナス15度の範囲の顔の画像を検出可能なように学習によって設定されている。また、人物の顔は実質的に左右対称である。そのため、正面向きの顔向きについては、0度の顔傾きに対応する顔学習データFLD(図2(a))と30度の顔傾きに対応する顔学習データFLD(図2(b))との2つが予め準備されれば、これら2つの顔学習データFLDを90度単位で回転させることにより、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。右向きの顔向きについても同様に、0度の顔傾きに対応する顔学習データFLD(図2(c))と30度の顔傾きに対応する顔学習データFLD(図2(d))との2つが予め準備されれば、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。また、左向きの顔向きについては、右向きの顔向きに対応する顔学習データFLDを反転させることにより、あらゆる顔傾きの顔の画像を検出可能な顔学習データFLDを得ることができる。
顔器官学習データOLDは、顔の器官の種類に対応付けられて設定されている。本実施例では、顔の器官の種類として、目(右目および左目)と口とが設定されている。顔器官学習データOLDは、上述の顔学習データFLDと異なり、各顔の器官の種類毎に、1つの器官傾き(具体的には0度)のみに対応付けられている。ここで、器官傾きとは、上述の顔傾きと同様に、画像面内(インプレーン)における顔の器官の傾き(回転角度)を意味している。すなわち、器官傾きは、画像面に垂直な軸を中心とした顔の器官の回転角度である。器官傾きは、顔傾きと同様に、対象画像の上下方向に沿って顔の器官が位置している状態を基準状態(器官傾き=0度)とした場合における基準状態からの顔の器官の時計回りの回転角度で表される。
内部メモリ120には、図2(e)および図2(f)に示す2つの顔器官学習データOLD、すなわち、図2(e)に示す目に対応する顔器官学習データOLDと、図2(f)に示す口に対応する顔器官学習データOLDと、が格納されている。目と口とは別の種類の被写体であるため、顔器官学習データOLDは被写体の種類に対応して設定されていると表現できる。
顔学習データFLDと同様に、0度の器官傾きに対応する顔器官学習データOLDは、0度を中心に器官傾きの値がプラスマイナス15度の範囲の器官の画像を検出可能なように学習によって設定されている。なお、本実施例では、右目と左目とは同じ種類の被写体であるとし、右目の画像に対応する右目領域と左目の画像に対応する左目領域とを共通の顔器官学習データOLDを用いて検出するものとしているが、右目と左目とは異なる種類の被写体であるとして、右目領域検出用と左目領域検出用とにそれぞれ専用の顔器官学習データOLDを準備するものとしてもよい。
内部メモリ120(図1)には、さらに、予め設定されたサイズテーブルSTが格納されている。サイズテーブルSTは、実行される画像処理の種別と、後述の器官領域検出処理における要求精度および用いられる器官検出用画像ODImgのサイズと、を対応付ける情報を含んでいる。サイズテーブルSTの内容については後に詳述する。
A−2.画像処理:
図3は、画像処理の流れを示すフローチャートである。本実施例における画像処理は、実行すべき画像処理の種別を設定し、設定された種別の画像処理を実行する処理である。
画像処理のステップS110(図3)では、処理種別設定部220(図1)が、実行すべき画像処理の種別を設定する。具体的には、処理種別設定部220は、表示処理部310(図1)を制御して表示部150上に画像処理種別設定のためのユーザインタフェースを表示させる。図4は、画像処理種別設定のためのユーザインタフェースの一例を示す説明図である。図4に示すように、本実施例のプリンタ100は、画像処理種別として、肌色補正と顔変形と赤目補正と笑顔検出との4つの種別を有している。
肌色補正は、人物の肌の色を好ましい肌色に補正する画像処理である。顔変形は、顔領域内の画像または顔領域に基づき設定される顔の画像を含む画像領域内の画像を変形する画像処理である。赤目補正は、赤目現象が発生した目の画像の色を自然な目の色に補正する画像処理である。笑顔検出は、人物の笑顔の画像を検出する画像処理である。
ユーザが操作部140を介して画像処理の種別の1つを選択指定すると、指定取得部222(図1)は、選択指定された画像処理の種別を特定する情報(以下「画像処理種別特定情報」とも呼ぶ)を取得し、処理種別設定部220は、画像処理種別特定情報により特定される画像処理の種別を実行すべき画像処理の種別として設定する。なお、本実施例における画像処理の種別は、後述の器官領域検出処理(図3のステップS180)により検出される器官領域(または器官領域に基づき設定される画像領域)を利用して所定の処理が実行されるものである。そのため、設定された画像処理の種別は、器官領域検出結果の用途であると表現でき、画像処理種別特定情報は、器官領域検出結果の用途を特定する用途特定情報であると表現できる。従って、画像処理種別特定情報を取得する指定取得部222は、本発明における用途特定情報取得部として機能するといえる。
ステップS130(図3)では、画像処理部200(図1)が、画像処理の対象となる画像を表す画像データを取得する。本実施例のプリンタ100では、カードスロット172に挿入されたメモリカードMCに格納された画像ファイルのサムネイル画像が表示部150に表示される。ユーザは、表示されたサムネイル画像を参照しつつ、操作部140を介して処理の対象となる1つまたは複数の画像を選択する。画像処理部200は、選択された1つまたは複数の画像に対応する画像データを含む画像ファイルをメモリカードMCより取得して内部メモリ120の所定の領域に格納する。なお、取得された画像データを原画像データと呼び、原画像データの表す画像を原画像OImgと呼ぶものとする。
ステップS140(図3)では、領域検出部210(図1)が、顔領域検出処理を行う。顔領域検出処理は、顔の画像に対応する画像領域を顔領域FAとして検出する処理である。図5は、顔領域検出処理の流れを示すフローチャートである。また、図6は、顔領域検出処理の概要を示す説明図である。図6の最上段には原画像OImgの一例を示している。
顔領域検出処理(図5)におけるステップS310では、領域検出部210の画像生成部216(図1)が、原画像OImgを表す原画像データから顔検出用画像FDImgを表す顔検出用画像データを生成する。本実施例では、図6に示すように、顔検出用画像FDImgは横320画素×縦240画素のサイズの画像である。画像生成部216は、必要により原画像データの解像度変換を行うことにより、顔検出用画像FDImgを表す顔検出用画像データを生成する。
ステップS320(図5)では、判定対象設定部211(図1)が、判定対象画像領域JIA(後述)の設定に用いるウィンドウSWのサイズを初期値に設定する。ステップS330では、判定対象設定部211が、ウィンドウSWを顔検出用画像FDImg上の初期位置に配置する。ステップS340では、判定対象設定部211が、顔検出用画像FDImg上に配置されたウィンドウSWにより規定される画像領域を、顔の画像に対応する画像領域であるか否かの判定(以下「顔判定」とも呼ぶ)の対象となる判定対象画像領域JIAに設定する。図6の中段には、顔検出用画像FDImg上に初期値のサイズのウィンドウSWが初期位置に配置され、ウィンドウSWにより規定される画像領域が判定対象画像領域JIAに設定される様子を示している。本実施例では、後述するように、正方形形状のウィンドウSWのサイズおよび位置が変更されつつ判定対象画像領域JIAの設定が順に行われるが、ウィンドウSWのサイズの初期値は最大サイズである横240画素×縦240画素であり、ウィンドウSWの初期位置はウィンドウSWの左上の頂点が顔検出用画像FDImgの左上の頂点に重なるような位置である。また、ウィンドウSWは、その傾きが0度の状態で配置される。なお、上述したように、ウィンドウSWの傾きとは、ウィンドウSWの上方向が対象画像(顔検出用画像FDImg)の上方向と一致した状態を基準状態(傾き=0度)とした場合における基準状態からの時計回りの回転角度を意味している。
ステップS350(図5)では、評価値算出部212(図1)が、判定対象画像領域JIAについて、判定対象画像領域JIAに対応する画像データ基づき、顔判定に用いる累計評価値Tvを算出する。なお、本実施例では、顔判定は、予め設定された特定顔傾きと特定顔向きとの組み合わせ毎に実行される。すなわち、特定顔傾きと特定顔向きとの組み合わせ毎に、判定対象画像領域JIAが当該特定顔傾きと特定顔向きとを有する顔の画像に対応する画像領域であるか否かの判定が行われる。そのため、累計評価値Tvも特定顔傾きと特定顔向きとの組み合わせ毎に算出される。ここで、特定顔傾きとは、所定の顔傾きであり、本実施例では、基準顔傾き(顔傾き=0度)と基準顔傾きから顔傾きを30度ずつ増加させた顔傾きとの計12個の顔傾き(0度、30度、60度、・・・、330度)が、特定顔傾きとして設定されている。また、特定顔向きとは、所定の顔向きであり、本実施例では、正面向きと右向きと左向きとの計3個の顔向きが特定顔向きとして設定されている。
図7は、顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。本実施例では、累計評価値Tvの算出にN個のフィルタ(フィルタ1〜フィルタN)が用いられる。各フィルタの外形はウィンドウSWと同じアスペクト比を有しており(すなわち正方形形状であり)、各フィルタにはプラス領域paとマイナス領域maとが設定されている。評価値算出部212は、判定対象画像領域JIAにフィルタX(X=1,2,・・・,N)を順に適用して評価値vX(すなわちv1〜vN)を算出する。具体的には、評価値vXは、フィルタXのプラス領域paに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計から、マイナス領域maに対応する判定対象画像領域JIA上の領域内に位置する画素の輝度値の合計を差し引いた値である。
算出された評価値vXは、各評価値vXに対応して設定された閾値thX(すなわちth1〜thN)と比較される。本実施例では、評価値vXが閾値thX以上である場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応する画像領域であると判定され、フィルタXの出力値として値「1」が設定される。一方、評価値vXが閾値thXより小さい場合には、フィルタXに関しては判定対象画像領域JIAが顔の画像に対応する画像領域ではないと判定され、フィルタXの出力値として値「0」が設定される。各フィルタXには重み係数WeX(すなわちWe1〜WeN)が設定されており、すべてのフィルタについての出力値と重み係数WeXとの積の合計が、累計評価値Tvとして算出される。
なお、顔判定に用いられるフィルタXの態様や閾値thX、重み係数WeX、後述の閾値THは、顔学習データFLDとして予め規定されている。すなわち、例えば、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定には、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(a)参照)に規定されたフィルタXの態様、閾値thX、重み係数WeX、閾値THが用いられる。同様に、正面向きの顔向きと30度の顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定には、正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(b)参照)が用いられる。また、正面向きの顔向きと他の特定顔傾きとの組み合わせに対応する累計評価値Tvの算出や顔判定の際には、正面向きの顔向きと0度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(a))と正面向きの顔向きと30度の顔傾きとの組み合わせに対応する顔学習データFLD(図2(b))とに基づき、正面向きの顔向きと当該他の特定顔傾きとの組み合わせに対応する顔学習データFLDが評価値算出部212により生成され、使用される。右向きや左向きの顔向きについても同様に、内部メモリ120に予め格納された顔学習データFLDに基づき必要な顔学習データFLDが生成され、使用される。なお、本実施例における顔学習データFLDは、判定対象画像領域JIAが顔の画像に対応する画像領域であることの確からしさを表す評価値を算出するためのデータであるため、本発明における評価用データに相当する。
なお、顔学習データFLDは、サンプル画像を用いた学習によって設定される。図8は、正面向きの顔に対応する顔学習データFLDの設定のための学習に用いられるサンプル画像の一例を示す説明図である。学習には、正面向きの顔に対応する画像であることが予めわかっている複数の顔サンプル画像によって構成された顔サンプル画像群と、正面向きの顔に対応する画像ではないことが予めわかっている複数の非顔サンプル画像によって構成された非顔サンプル画像群と、が用いられる。
学習による正面向きの顔に対応する顔学習データFLDの設定は特定顔傾き毎に実行されるため、図8に示すように、顔サンプル画像群は、12個の特定顔傾きのそれぞれに対応するものが準備される。例えば0度の特定顔傾きについての顔学習データFLDの設定は、0度の特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とを用いて実行され、30度の特定顔傾きについての顔学習データFLDの設定は、30度の特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とを用いて実行される。
各特定顔傾きに対応する顔サンプル画像群は、画像サイズに対する顔の画像の大きさの比が所定の値の範囲内であると共に顔の画像の傾きが特定顔傾きに等しい複数の顔サンプル画像(以下「基本顔サンプル画像FIo」とも呼ぶ)を含む。また、顔サンプル画像群は、少なくとも1つの基本顔サンプル画像FIoについて、基本顔サンプル画像FIoを1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図8における画像FIaおよびFIb)や、基本顔サンプル画像FIoの顔傾きをプラスマイナス15度の範囲で変化させた画像(例えば図8における画像FIcおよびFId)をも含む。
サンプル画像を用いた学習は、例えばニューラルネットワークを用いた方法や、ブースティング(例えばアダブースティング)を用いた方法、サポートベクターマシーンを用いた方法等により実行される。例えば学習がニューラルネットワークを用いた方法により実行される場合には、各フィルタX(すなわちフィルタ1〜フィルタN、図7参照)について、ある特定顔傾きに対応する顔サンプル画像群と非顔サンプル画像群とに含まれるすべてのサンプル画像を用いて評価値vX(すなわちv1〜vN)が算出され、所定の顔検出率を達成する閾値thX(すなわちth1〜thN)が設定される。ここで、顔検出率とは、顔サンプル画像群を構成する顔サンプル画像の総数に対する、評価値vXによる閾値判定によって顔の画像に対応する画像であると判定される顔サンプル画像の数の割合を意味している。
次に、各フィルタXに設定された重み係数WeX(すなわちWe1〜WeN)が初期値に設定され、顔サンプル画像群および非顔サンプル画像群の中から選択された1つのサンプル画像についての累計評価値Tvが算出される。後述するように、顔判定においては、ある画像について算出された累計評価値Tvが所定の閾値TH以上の場合には、当該画像は顔の画像に対応する画像であると判定される。学習においては、選択されたサンプル画像(顔サンプル画像または非顔サンプル画像)について算出された累計評価値Tvによる閾値判定結果の正誤に基づき、各フィルタXに設定された重み係数WeXの値が修正される。以降、サンプル画像の選択と、選択されたサンプル画像について算出された累計評価値Tvによる閾値判定、および判定結果の正誤に基づく重み係数WeXの値の修正が、顔サンプル画像群および非顔サンプル画像群に含まれるすべてのサンプル画像について繰り返し実行される。このような処理によって、正面向きの顔向きと特定顔傾きとの組み合わせに対応する顔学習データFLDが設定される。
なお、他の特定顔向き(右向きおよび左向き)に対応する顔学習データFLDも同様に、右向き(または左向き)の顔に対応する画像であることが予めわかっている複数の顔サンプル画像によって構成された顔サンプル画像群と、右向き(または左向き)の顔に対応する画像ではないことが予めわかっている複数の非顔サンプル画像によって構成された非顔サンプル画像群とを用いた学習によって設定される。
判定対象画像領域JIAについて特定顔傾きと特定顔向きとの組み合わせ毎に累計評価値Tvが算出されると(図5のステップS350)、判定部213(図1)は、累計評価値Tvを特定顔傾きと特定顔向きとの組み合わせ毎に設定された閾値THと比較する(ステップS360)。ある特定顔傾きと特定顔向きとの組み合わせについて累計評価値Tvが閾値TH以上である場合には、領域検出部210が、判定対象画像領域JIAは当該特定顔傾きと当該特定顔向きとを有する顔の画像に対応する画像領域であるとして、判定対象画像領域JIAの位置、すなわち現在設定されているウィンドウSWの座標と、当該特定顔傾きおよび当該特定顔向きと、を記憶する(ステップS370)。一方、いずれの特定顔傾きと特定顔向きとの組み合わせについても累計評価値Tvが閾値THより小さい場合には、ステップS370の処理はスキップされる。
ステップS380(図5)では、領域検出部210(図1)が、現在設定されているサイズのウィンドウSWにより顔検出用画像FDImg全体がスキャンされたか否かを判定する。未だ顔検出用画像FDImg全体がスキャンされていないと判定された場合には、判定対象設定部211(図1)が、ウィンドウSWを所定の方向に所定の移動量だけ移動する(ステップS390)。図6の下段には、ウィンドウSWが移動した様子を示している。本実施例では、ステップS390において、ウィンドウSWがウィンドウSWの水平方向の大きさの2割分の移動量で右方向に移動するものとしている。また、ウィンドウSWがさらに右方向には移動できない位置に配置されている場合には、ステップS390において、ウィンドウSWが顔検出用画像FDImgの左端まで戻ると共に、ウィンドウSWの垂直方向の大きさの2割分の移動量で下方向に移動するものとしている。ウィンドウSWがさらに下方向には移動できない位置に配置されている場合には、顔検出用画像FDImg全体がスキャンされたこととなる。ウィンドウSWの移動(ステップS390)の後には、移動後のウィンドウSWについて、上述のステップS340以降の処理が実行される。
ステップS380(図5)において現在設定されているサイズのウィンドウSWにより顔検出用画像FDImg全体がスキャンされたと判定された場合には、ウィンドウSWの所定のサイズがすべて使用されたか否かが判定される(ステップS400)。本実施例では、ウィンドウSWのサイズとして、初期値(最大サイズ)である横240画素×縦240画素の他に、横213画素×縦213画素、横178画素×縦178画素、横149画素×縦149画素、横124画素×縦124画素、横103画素×縦103画素、横86画素×縦86画素、横72画素×縦72画素、横60画素×縦60画素、横50画素×縦50画素、横41画素×縦41画素、横35画素×縦35画素、横29画素×縦29画素、横24画素×縦24画素、横20画素×縦20画素(最小サイズ)、の合計15個のサイズが設定されている。未だ使用されていないウィンドウSWのサイズがあると判定された場合には、判定対象設定部211(図1)が、ウィンドウSWのサイズを現在設定されているサイズの次に小さいサイズに変更する(ステップS410)。すなわち、ウィンドウSWのサイズは、最初に最大サイズに設定され、その後、順に小さいサイズに変更されていく。ウィンドウSWのサイズの変更(ステップS410)の後には、変更後のサイズのウィンドウSWについて、上述のステップS330以降の処理が実行される。
ステップS400(図5)においてウィンドウSWの所定のサイズがすべて使用されたと判定された場合には、領域設定部214(図1)が、顔領域設定処理を実行する(ステップS420)。図9および図10は、顔領域設定処理の概要を示す説明図である。領域設定部214は、図5のステップS360において累計評価値Tvが閾値TH以上であると判定され、ステップS370において記憶されたウィンドウSWの座標と特定顔傾きとに基づき、顔の画像に対応する画像領域としての顔領域FAを設定する。具体的には、記憶された特定顔傾きが0度である場合には、ウィンドウSWにより規定される画像領域(すなわち判定対象画像領域JIA)が、そのまま顔領域FAとして設定される。一方、記憶された特定顔傾きが0度以外である場合には、ウィンドウSWの傾きを特定顔傾きに一致させ(すなわちウィンドウSWを所定の点(例えばウィンドウSWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後のウィンドウSWにより規定される画像領域が顔領域FAとして設定される。例えば図9(a)に示すように、30度の特定顔傾きについて累計評価値Tvが閾値TH以上であると判定された場合には、図9(b)に示すように、ウィンドウSWの傾きを30度に変化させ、傾き変化後のウィンドウSWにより規定される画像領域が顔領域FAとして設定される。
また、領域設定部214(図1)は、ステップS370(図5)においてある特定顔傾きについて互いに一部が重複する複数のウィンドウSWが記憶された場合には、各ウィンドウSWにおける所定の点(例えばウィンドウSWの重心)の座標の平均の座標を重心とし、各ウィンドウSWのサイズの平均のサイズを有する1つの新たなウィンドウ(以下「平均ウィンドウAW」とも呼ぶ)を設定する。例えば図10(a)に示すように、互いに一部が重複する4つのウィンドウSW(SW1〜SW4)が記憶された場合には、図10(b)に示すように、4つのウィンドウSWのそれぞれの重心の座標の平均の座標を重心とし、4つのウィンドウSWのそれぞれのサイズの平均のサイズを有する1つの平均ウィンドウAWが定義される。このとき、上述したのと同様に、記憶された特定顔傾きが0度である場合には、平均ウィンドウAWにより規定される画像領域がそのまま顔領域FAとして設定される。一方、記憶された特定顔傾きが0度以外である場合には、平均ウィンドウAWの傾きを特定顔傾きに一致させ(すなわち平均ウィンドウAWを所定の点(例えば平均ウィンドウAWの重心)を中心として特定顔傾き分だけ時計回りに回転させ)、傾きを変化させた後の平均ウィンドウAWにより規定される画像領域が顔領域FAとして設定される(図10(c)参照)。
なお、図9に示したように、他のウィンドウSWと重複しない1つのウィンドウSWが記憶された場合にも、図10に示した互いに一部が重複する複数のウィンドウSWが記憶された場合と同様に、1つのウィンドウSW自身が平均ウィンドウAWであると解釈することも可能である。
本実施例では、学習の際に用いられる顔サンプル画像群(図8参照)に、基本顔サンプル画像FIoを1.2倍から0.8倍までの範囲の所定の倍率で拡大および縮小した画像(例えば図8における画像FIaおよびFIb)が含まれているため、ウィンドウSWの大きさに対する顔の画像の大きさが基本顔サンプル画像FIoと比べてわずかに大きかったり小さかったりする場合にも、顔領域FAが検出されうる。従って、本実施例では、ウィンドウSWの標準サイズとして上述した15個の離散的なサイズのみが設定されているが、あらゆる大きさの顔の画像について顔領域FAが検出されうる。同様に、本実施例では、学習の際に用いられる顔サンプル画像群に、基本顔サンプル画像FIoの顔傾きをプラスマイナス15度の範囲で変化させた画像(例えば図8における画像FIcおよびFId)が含まれているため、ウィンドウSWに対する顔の画像の傾きが基本顔サンプル画像FIoとはわずかに異なっている場合にも、顔領域FAが検出されうる。従って、本実施例では、特定顔傾きとして上述した12個の離散的な角度のみが設定されているが、あらゆる角度の顔の画像について顔領域FAが検出されうる。
顔領域検出処理(図3のステップS140)において、顔領域FAが検出されなかった場合には(ステップS150:No)、画像処理は終了する。一方、少なくとも1つの顔領域FAが検出された場合には(ステップS150:Yes)、領域検出部210(図1)が、検出された顔領域FAの1つを選択する(ステップS170)。
ステップS180(図3)では、領域検出部210(図1)が、器官領域検出処理を行う。器官領域検出処理は、選択された顔領域FAにおける顔の器官の画像に対応する画像領域を器官領域として検出する処理である。上述したように、本実施例では、顔の器官とは、右目と左目と口との3つの器官を意味しており、領域検出部210は、器官領域として、右目の画像に対応する右目領域EA(r)と、左目の画像に対応する左目領域EA(l)と、口の画像に対応する口領域MAと、の検出を行う。
図11は、器官領域検出処理の流れを示すフローチャートである。また、図12は、器官領域検出処理の概要を示す説明図である。器官領域検出処理におけるステップS502(図11)では、サイズ設定部217(図1)が、サイズテーブルSTを参照して、器官領域検出処理に用いられる器官検出用画像ODImgのサイズを設定する。
図13は、サイズテーブルSTの内容の一例を示す説明図である。サイズテーブルSTは、実行すべき画像処理種別と、器官領域検出処理における要求精度および用いられる器官検出用画像ODImgのサイズと、を対応付ける情報を含んでいる。図13に示すように、サイズテーブルSTにおいて、肌色補正には、器官領域検出処理における要求精度として比較的低い精度が対応付けられ、器官検出用画像ODImgのサイズとして比較的小さい横40画素×縦44画素というサイズが対応付けられている。本実施例では、肌色補正の実行の際には器官領域は参照されないため、肌色補正には、器官領域検出処理の要求精度として比較的低い精度が対応付けられている。また、一般に、器官検出用画像ODImgのサイズが大きいほど、器官領域検出処理の精度が高くなる一方、処理時間が増大する傾向にある。そのため、サイズテーブルSTにおいては、器官領域検出処理における要求精度が高いほど、使用される器官検出用画像ODImgのサイズが大きい値に設定されている。従って、肌色補正には、器官検出用画像ODImgのサイズとして比較的小さいサイズが対応付けられている。なお、実行すべき画像処理種別が肌色補正である場合には、器官領域検出処理が実行されないものとしてもよい。この場合には、サイズテーブルSTには、肌色補正に対応する要求精度や器官検出用画像ODImgのサイズを特定する情報は含まれない。
サイズテーブルST(図13)において、笑顔検出には、器官領域検出処理における要求精度として比較的高い精度が対応付けられ、器官検出用画像ODImgのサイズとして比較的大きい横80画素×縦88画素というサイズが対応付けられている。本実施例では、後述するように、笑顔検出の際に、器官領域検出処理により検出された器官領域(口領域MA)を対象として輪郭検出が行われるため、笑顔検出には、器官領域検出処理の要求精度として比較的高い精度が対応付けられ、器官検出用画像ODImgのサイズとして比較的大きいサイズが対応付けられている。
サイズテーブルST(図13)において、顔変形および赤目補正には、器官領域検出処理における要求精度として中程度の精度が対応付けられ、器官検出用画像ODImgのサイズとして中程度のサイズである横60画素×縦66画素というサイズが対応付けられている。本実施例では、顔変形の際に、器官領域検出処理により検出された器官領域相互の位置関係に基づく顔領域FAの調整が行われるため、顔変形には、器官領域検出処理の要求精度として中程度の精度が対応付けられ、器官検出用画像ODImgのサイズとして中程度のサイズが対応付けられている。また、赤目補正の際には、器官領域検出処理により検出された器官領域(右目領域EA(r)および左目領域EA(l))において赤目画像の検出が行われるため、赤目補正には、器官領域検出処理の要求精度として中程度の精度が対応付けられ、器官検出用画像ODImgのサイズとして中程度のサイズが対応付けられている。
サイズ設定部217(図1)は、サイズテーブルST(図13)においてステップS110(図3)で設定された実行すべき画像処理の種別に対応付けられた器官検出用画像ODImgのサイズを、使用する器官検出用画像ODImgのサイズとして設定する。なお、上述したように、設定された画像処理の種別を特定する情報(画像処理種別特定情報)は器官領域検出結果の用途を特定する用途特定情報であると表現できるため、サイズ設定部217は、用途特定情報に基づき器官検出用画像ODImgのサイズを設定すると表現することもできる。
器官領域検出処理(図11)のステップS510では、画像生成部216(図1)が、顔検出用画像FDImgを表す顔検出用画像データから器官検出用画像ODImgを表す器官検出用画像データを生成する。画像生成部216は、図12の上部に示すように、まず、顔検出用画像FDImgにおける矩形形状の顔領域FAの外周枠を拡大した枠により規定される矩形形状の画像領域を拡大顔領域FAeとして設定する。顔領域FAの外周枠の拡大の際の拡大方向や拡大率は予め設定されている。拡大顔領域FAeは、本発明における特定画像領域に相当する。次に、画像生成部216は、顔検出用画像FDImgにおける拡大顔領域FAeの部分を切り出して(トリミングして)切り出し画像TImgを生成し、切り出し画像TImgの解像度を調整して解像度調整画像RCImgを生成する。解像度の調整は、矩形形状の解像度調整画像RCImgのサイズが、ステップS502で設定された器官検出用画像ODImgのサイズと同じサイズとなるように解像度変換を行うことにより実行される。例えば、実行すべき画像処理の種別が顔変形である場合には、解像度調整画像RCImgのサイズは60画素×66画素となる(図13参照)。さらに、画像生成部216は、解像度調整画像RCImgの傾きを調整して器官検出用画像ODImgを生成する。傾きの調整は、解像度調整画像RCImgを顔領域FAの検出に用いられた顔学習データFLDに対応付けられた特定顔傾き分だけ反時計回りに回転させるアフィン変換を行うことにより実行される。
このように器官検出用画像ODImgが生成されると、器官検出用画像ODImgは、顔検出用画像FDImgにおける顔領域FAより大きな画像領域(拡大顔領域FAe)に対応する画像であり、実行すべき画像処理種別に対応付けられたサイズ(図13参照)を有する画像となる。また、器官検出用画像ODImgに表される顔の画像の傾きは、略0度(より詳細には0度を中心とした時計回りおよび反時計回りに15度の範囲内の値)となる。
器官検出用画像ODImgからの器官領域の検出は、上述した顔検出用画像FDImgからの顔領域FAの検出と同様に行われる。すなわち、図12の下部に示すように、矩形形状のウィンドウSWがそのサイズおよび位置が変更されつつ器官検出用画像ODImg上に配置され(図11のステップS520,S530,S580〜S610)、配置されたウィンドウSWにより規定される画像領域が顔の器官の画像に対応する器官領域であるか否かの判定(以下「器官判定」とも呼ぶ)の対象となる判定対象画像領域JIAとして設定される(図11のステップS540)。なお、ウィンドウSWの取り得るサイズは、器官の種類(目および口)毎に、器官検出用画像ODImgのサイズに応じて予め設定されている。すなわち、実行すべき画像処理の種別に応じて器官検出用画像ODImgのサイズが決まれば、ウィンドウSWの取り得るサイズも決まる。
判定対象画像領域JIAが設定されると、設定された判定対象画像領域JIAについて、顔器官学習データOLD(図1)を用いて、検出器官毎に、器官判定に用いられる累計評価値Tvが算出される(図11のステップS550)。顔器官学習データOLDは、累計評価値Tvの算出や器官判定に用いられるフィルタXの態様や閾値thX、重み係数WeX、閾値TH(図7参照)を規定する。なお、顔器官学習データOLDの設定のための学習は、顔学習データFLDの設定のための学習と同様に、顔の器官の画像を含むことが予めわかっている複数の器官サンプル画像によって構成された器官サンプル画像群と、顔の器官の画像を含まないことが予めわかっている複数の非器官サンプル画像によって構成された非器官サンプル画像群と、を用いて実行される。
なお、顔領域検出処理(図3のステップS140)においては累計評価値Tvが特定顔傾き毎に算出され、特定顔傾き毎に顔判定が行われるのに対し、器官領域検出処理では、累計評価値Tvは1つの判定対象画像領域JIAについて、傾き0度に対応した顔器官学習データOLDを用いて傾き0度に対応した1つの値のみが算出され、傾き0度に対応した器官の画像についての器官判定のみが行われる。これは、上述したように器官検出用画像ODImgに表される顔の画像の傾きは略0度であり、顔の器官の傾きは顔全体の傾きに概ね一致するものと考えられるからである。
検出器官毎に算出された累計評価値Tvが所定の閾値TH以上である場合には、判定対象画像領域JIAは当該器官の画像に対応する画像領域であるとして、判定対象画像領域JIAの位置、すなわち現在設定されているウィンドウSWの座標が記憶される(図11のステップS570)。一方、累計評価値Tvが閾値THより小さい場合には、ステップS570の処理はスキップされる。ウィンドウSWの所定のサイズのすべてについて、ウィンドウSWにより器官検出用画像ODImg全体がスキャンされた後に、器官領域設定処理が実行される(図11のステップS620)。器官領域設定処理は、顔領域設定処理(図5参照)と同様に、平均ウィンドウAWを設定して、平均ウィンドウAWにより規定される画像領域を器官領域として設定する処理である。
器官領域検出処理(図3のステップS180)が完了すると、領域検出部210(図1)が、ステップS170において未だ選択されていない顔領域FAが存在するか否かを判定する(ステップS190)。未だ選択されていない顔領域FAが存在すると判定された場合には(ステップS190:No)、ステップS170に戻って未選択の顔領域FAの1つが選択され、ステップS180以降の処理が実行される。一方、すべての顔領域FAが選択されたと判定された場合には(ステップS190:Yes)、処理はステップS200に進む。
ステップS200(図3)では、画像処理部200(図1)が、ステップS110で実行すべきとして設定された種別の画像処理を実行する。具体的には、実行すべき画像処理の種別が肌色補正である場合には、顔領域FAまたは顔領域FAに基づき設定される顔の画像を含む画像領域内における人物の肌の色が好ましい肌色に補正される。実行すべき画像処理の種別が顔変形である場合には、検出された器官領域(右目領域EA(r)、左目領域EA(l)、口領域MA)の相互の位置関係に基づき顔領域FAが調整され、調整後の顔領域FA内の画像または調整後の顔領域FAに基づき設定される顔の画像を含む画像領域内の画像が変形される。実行すべき画像処理の種別が赤目補正である場合には、顔領域FAにおいて検出された器官領域(右目領域EA(r)、左目領域EA(l))において赤目の画像が検出され、当該画像の色が自然な目の色に近づくように補正される。実行すべき画像処理の種別が笑顔検出である場合には、検出された顔領域FAおよび器官領域(口領域MA)の輪郭検出が行われ、例えば口角の開き具合を評価することにより顔領域FA内の画像が笑顔の画像か否かの判定(笑顔判定)が実行される。笑顔判定に必要な技術は、特開2004−178593号公報や、副島義貴著「場景変動を考慮した移動物体の追跡に関する研究」1998年2月15日等に記載されている。
以上説明したように、本実施例のプリンタ100による画像処理では、顔検出用画像FDImgから顔領域FAが検出され、顔領域FAの検出結果に基づき、画像面内における傾きの値が所定範囲内(略0度)である顔の画像を含む器官検出用画像ODImgが生成され、器官検出用画像ODImgを表す画像データに基づき、顔領域FAにおける器官領域が検出される。ここで、器官検出用画像ODImgは、画像面内における傾きが略0度である顔の画像を含む画像であるため、器官領域検出の際には、0度の器官傾きに対応する顔器官学習データOLDのみが用いられ、他の器官傾きに対応する顔器官学習データOLDは用いられない。そのため、本実施例のプリンタ100による画像処理では、顔領域FAからの器官領域の検出処理の精度の向上および高速化を図ることができる。また、0度の器官傾きに対応する顔器官学習データOLDのみを予め準備すればよいため、準備(学習による顔器官学習データOLDの設定等)の効率化、メモリ容量の有効活用を図ることができる。
また、本実施例のプリンタ100による画像処理では、実行すべき画像処理の種別に応じて器官検出用画像ODImgのサイズが決定するため、実行すべき画像処理の種別が設定されれば、検出された顔領域FAのサイズに関わらず所定のサイズの器官検出用画像ODImgを用いて器官領域検出処理が実行され、所定の複数のサイズのウィンドウSWが用いられる。そのため、本実施例のプリンタ100による画像処理では、顔領域FAからの器官領域の検出処理の精度の向上および高速化を一層図ることができる。
また、本実施例のプリンタ100による画像処理では、実行すべき画像処理の種別を特定する情報(画像処理種別特定情報)に基づき、器官検出用画像ODImgのサイズが設定される。すなわち、器官領域検出結果の用途を特定する用途特定情報に基づき、器官検出用画像ODImgのサイズが設定される。そのため、本実施例のプリンタ100による画像処理では、実行すべき画像処理の種別に応じて必要十分なサイズの器官検出用画像ODImgを用いた器官領域検出処理を実現することができ、顔領域FAからの器官領域の検出処理の検出精度と処理速度との調整を図ることができる。
また、本実施例のプリンタ100による画像処理では、顔領域FAの外周枠を拡大した枠により規定される拡大顔領域FAeの部分が切り出し画像TImgとして設定され、切り出し画像TImgに基づき器官検出用画像ODImgが生成されるため、器官検出用画像ODImgを顔の器官の画像が確実に含まれた画像とすることができ、顔領域FAからの器官領域の検出処理の精度の向上を図ることができる。
B.変形例:
なお、この発明は上記の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
B1.変形例1:
上記実施例では、器官検出用画像ODImgの生成の際に(図12参照)、顔領域FAを拡張した拡大顔領域FAeの部分を切り出して切り出し画像TImgとしているが、顔領域FAを拡張せず、顔領域FAそのものの部分を切り出して切り出し画像TImgとしてもよい。また、切り出し画像TImgの解像度の調整は必ずしも行われる必要はなく、切り出し画像TImgそのものの傾きを調整することにより器官検出用画像ODImgを生成するものとしてもよい。また、解像度調整画像RCImgの傾きの調整は必ずしも行われる必要はなく、解像度調整画像RCImgそのものを器官検出用画像ODImgとして使用するとしてもよい。
また、上記実施例では、器官検出用画像ODImgに表される顔の画像の傾きが略0度となるように、解像度調整画像RCImgを顔領域FAの検出に用いられた顔学習データFLDに対応付けられた特定顔傾き分だけ反時計回りに回転させるアフィン変換を行うことによって解像度調整画像RCImgの傾き調整が実行されているが、器官検出用画像ODImgに表される顔の画像の傾きが略0度ではない所定値(当該所定値を含む所定の範囲)となるように解像度調整画像RCImgの傾き調整が実行されるものとしてもよい。このようにしても、当該所定値の傾きに対応する1つの顔器官学習データOLDのみが用意され、当該顔器官学習データOLDのみを用いて器官領域検出処理を実行することができる。
B2.変形例2:
上記実施例では、実行すべき画像処理の種別に応じて器官検出用画像ODImgのサイズが設定されるとしているが(図13参照)、器官検出用画像ODImgのサイズは画像処理の種別に関わらず一定であるとしてもよい。また、器官領域検出処理における要求精度がユーザによりあるいは自動的に直接指定され、指定された要求精度に応じて器官検出用画像ODImgのサイズが設定されるものとしてもよい。また、器官検出用画像ODImgのサイズがユーザによりあるいは自動的に直接指定され、指定に従い器官検出用画像ODImgのサイズが設定されるものとしてもよい。
また、上記実施例における画像処理の種別の例や、画像処理の種別に対応付けられた要求精度および器官検出用画像ODImgのサイズはあくまで一例であり、プリンタ100が実行可能な画像処理の種別として図13に示したもの以外の画像処理の種別を有しているとしてもよいし、図13に示した画像処理の種別の一部は実行できないものとしてもよい。また、要求精度や器官検出用画像ODImgのサイズは任意に変更可能である。また、実行すべき画像処理の種別は、ユーザによる指定に従い設定される必要はなく、自動的に設定されるとしてもよい。
B3.変形例3:
上記実施例における顔領域検出処理(図5)や器官領域検出処理(図11)の態様はあくまで一例であり、種々変更可能である。例えば顔検出用画像FDImg(図6参照)のサイズは320画素×240画素に限られず、他のサイズであってもよいし、原画像OImgそのものを顔検出用画像FDImgとして用いることも可能である。また、使用されるウィンドウSWのサイズやウィンドウSWの移動方向および移動量(移動ピッチ)は上述したものに限られない。また、上記実施例では、顔検出用画像FDImgのサイズが固定され、複数種類のサイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されているが、複数種類のサイズの顔検出用画像FDImgが生成され、固定サイズのウィンドウSWが顔検出用画像FDImg上に配置されることにより複数サイズの判定対象画像領域JIAが設定されるものとしてもよい。
また、上記実施例では、累計評価値Tvを閾値THと比較することにより顔判定および器官判定を行っているが(図7参照)、顔判定および器官判定を複数の判別器を用いた判別等の他の方法によって行ってもよい。顔判定および器官判定の方法に応じて、顔学習データFLDおよび顔器官学習データOLDの設定に用いられる学習方法も変更される。また、顔判定および器官判定は、必ずしも学習を用いた判別方法により行われる必要はなく、パターンマッチング等の他の方法により行われるとしてもよい。
また、上記実施例では、30度刻みの12種類の特定顔傾きが設定されているが、より多くの種類の特定顔傾きが設定されてもよいし、より少ない種類の特定顔傾きが設定されてもよい。また、必ずしも特定顔傾きが設定される必要はなく、0度の顔傾きについての顔判定が行われるとしてもよい。また、上記実施例では、顔サンプル画像群に基本顔サンプル画像FIoを拡大・縮小した画像や回転させた画像が含まれるとしているが、顔サンプル画像群に必ずしもこのような画像が含まれる必要はない。
上記実施例において、あるサイズのウィンドウSWにより規定される判定対象画像領域JIAについての顔判定(または器官判定)で顔の画像(または顔の器官の画像)に対応する画像領域であると判定された場合には、当該サイズより所定の比率以上小さいサイズのウィンドウSWを配置する場合には、顔の画像に対応する画像領域であると判定された判定対象画像領域JIAを避けて配置するものとしてもよい。このようにすれば、処理の高速化を図ることができる。
上記実施例では、メモリカードMCに格納された画像データが原画像データに設定されているが、原画像データはメモリカードMCに格納された画像データに限らず、例えばネットワークを介して取得された画像データであってもよい。
上記実施例では、顔の器官の種類として、右目と左目と口とが設定されており、器官領域として、右目領域EA(r)と左目領域EA(l)と口領域MAとの検出が行われるが、顔の器官の種類として顔のどの器官を設定するかは変更可能である。例えば、顔の器官の種類として、右目と左目と口とのいずれか1つまたは2つのみが設定されるとしてもよい。また、顔の器官の種類として、右目と左目と口とに加えて、または右目と左目と口との少なくとも1つに代わり、顔のその他の器官の種類(例えば鼻や眉)が設定され、器官領域としてこのような器官の画像に対応する領域が検出されるとしてもよい。
上記実施例では、顔領域FAおよび器官領域は矩形の領域であるが、顔領域FAおよび器官領域は矩形以外の形状の領域であってもよい。
上記実施例では、画像処理装置としてのプリンタ100による画像処理を説明したが、処理の一部または全部がパーソナルコンピュータやデジタルスチルカメラ、デジタルビデオカメラ等の他の種類の画像処理装置により実行されるものとしてもよい。また、プリンタ100はインクジェットプリンタに限らず、他の方式のプリンタ、例えばレーザプリンタや昇華型プリンタであるとしてもよい。
上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
また、本発明の機能の一部または全部がソフトウェアで実現される場合には、そのソフトウェア(コンピュータプログラム)は、コンピュータ読み取り可能な記録媒体に格納された形で提供することができる。この発明において、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスクやCD−ROMのような携帯型の記録媒体に限らず、各種のRAMやROM等のコンピュータ内の内部記憶装置や、ハードディスク等のコンピュータに固定されている外部記憶装置も含んでいる。
本発明の実施例における画像処理装置としてのプリンタ100の構成を概略的に示す説明図である。 顔学習データFLDおよび顔器官学習データOLDの種類を示す説明図である。 画像処理の流れを示すフローチャートである。 画像処理種別設定のためのユーザインタフェースの一例を示す説明図である。 顔領域検出処理の流れを示すフローチャートである。 顔領域検出処理の概要を示す説明図である。 顔判定に用いる累計評価値Tvの算出方法の概要を示す説明図である。 正面向きの顔に対応する顔学習データFLDの設定のための学習に用いられるサンプル画像の一例を示す説明図である。 顔領域設定処理の概要を示す説明図である。 顔領域設定処理の概要を示す説明図である。 器官領域検出処理の流れを示すフローチャートである。 器官領域検出処理の概要を示す説明図である。 サイズテーブルSTの内容の一例を示す説明図である。
符号の説明
100…プリンタ
110…CPU
120…内部メモリ
140…操作部
150…表示部
160…プリンタエンジン
170…カードインターフェース
172…カードスロット
200…画像処理部
210…領域検出部
211…判定対象設定部
212…評価値算出部
213…判定部
214…領域設定部
216…画像生成部
217…サイズ設定部
220…処理種別設定部
222…指定取得部
310…表示処理部
320…印刷処理部

Claims (7)

  1. 画像処理装置であって、
    対象画像における顔の画像に対応する顔領域を検出する顔領域検出部と、
    前記顔領域の検出結果に基づき、前記顔の画像を含む所定のサイズの器官検出用画像を生成する画像生成部と、
    前記器官検出用画像を表す画像データに基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する器官領域検出部と、
    前記器官領域の検出結果の用途を特定する用途特定情報を取得する用途特定情報取得部と、
    前記用途特定情報に基づき、前記所定のサイズを設定するサイズ設定部と、を備える、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記サイズ設定部は、前記用途特定情報に基づき前記器官領域検出における要求精度を特定し、前記要求精度が高いほど前記所定のサイズが大きくなるように、前記所定のサイズを設定する、画像処理装置。
  3. 請求項1または請求項2に記載の画像処理装置であって、
    前記用途は、検出された前記器官領域に基づき設定される画像領域を利用して実行される所定の画像処理である、画像処理装置。
  4. 請求項1ないし請求項3のいずれかに記載の画像処理装置であって、
    前記画像生成部は、前記顔領域に基づき前記顔領域を含む特定画像領域を設定し、前記特定画像領域の解像度を調整することにより、前記器官検出用画像を生成する、画像処理装置。
  5. 請求項1ないし請求項4のいずれかに記載の画像処理装置であって、
    前記顔の器官の種類は、右目と左目と口との少なくとも1つである、画像処理装置。
  6. 画像処理方法であって、
    (a)対象画像における顔の画像に対応する顔領域を検出する工程と、
    (b)前記顔領域の検出結果に基づき、前記顔の画像を含む所定のサイズの器官検出用画像を生成する工程と、
    (c)前記器官検出用画像を表す画像データに基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する工程と、
    (d)前記器官領域の検出結果の用途を特定する用途特定情報を取得する工程と、
    (e)前記用途特定情報に基づき、前記所定のサイズを設定する工程と、を備える、画像処理方法。
  7. 画像処理のためのコンピュータプログラムであって、
    対象画像における顔の画像に対応する顔領域を検出する顔領域検出機能と、
    前記顔領域の検出結果に基づき、前記顔の画像を含む所定のサイズの器官検出用画像を生成する画像生成機能と、
    前記器官検出用画像を表す画像データに基づき、前記顔領域における顔の器官の画像に対応する器官領域を検出する器官領域検出機能と、
    前記器官領域の検出結果の用途を特定する用途特定情報を取得する用途特定情報取得機能と、
    前記用途特定情報に基づき、前記所定のサイズを設定するサイズ設定機能と、を、コンピュータに実現させる、コンピュータプログラム。
JP2008079251A 2008-03-25 2008-03-25 画像における顔領域および器官領域の検出 Withdrawn JP2009237620A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008079251A JP2009237620A (ja) 2008-03-25 2008-03-25 画像における顔領域および器官領域の検出

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008079251A JP2009237620A (ja) 2008-03-25 2008-03-25 画像における顔領域および器官領域の検出

Publications (1)

Publication Number Publication Date
JP2009237620A true JP2009237620A (ja) 2009-10-15

Family

ID=41251536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008079251A Withdrawn JP2009237620A (ja) 2008-03-25 2008-03-25 画像における顔領域および器官領域の検出

Country Status (1)

Country Link
JP (1) JP2009237620A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105829A (ja) * 1998-09-29 2000-04-11 Matsushita Electric Ind Co Ltd 顔パーツ検出方法及びその装置
JP2004240622A (ja) * 2003-02-05 2004-08-26 Konica Minolta Holdings Inc 画像処理方法、画像処理装置及び画像処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000105829A (ja) * 1998-09-29 2000-04-11 Matsushita Electric Ind Co Ltd 顔パーツ検出方法及びその装置
JP2004240622A (ja) * 2003-02-05 2004-08-26 Konica Minolta Holdings Inc 画像処理方法、画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
JP2009237619A (ja) 画像における顔領域および器官領域の検出
JP5239625B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
US8249312B2 (en) Image processing device and image processing method
US20090028390A1 (en) Image Processing for Estimating Subject Distance
JP4957607B2 (ja) 画像における顔領域の検出
JP2011053942A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2009277027A (ja) 画像における顔の器官の画像に対応する器官領域の検出
US8031915B2 (en) Image processing device and image processing method
JP2010282339A (ja) 目における瞳の位置を補正する画像処理装置、画像処理方法、画像処理プログラム、および、印刷装置
JP5256974B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2009282699A (ja) 画像における顔の器官の画像に対応する器官領域の検出
JP5966657B2 (ja) 画像生成装置、画像生成方法及びプログラム
JP4985510B2 (ja) 対象画像における顔の画像に対応する顔領域の設定
JP2010244251A (ja) 顔の特徴部位の座標位置を検出する画像処理装置
JP2009237857A (ja) 画像における顔の器官の画像に対応する器官領域の設定
JP4957608B2 (ja) 画像における顔領域の検出
JP2009237618A (ja) 画像における顔領域の検出
JP2009237620A (ja) 画像における顔領域および器官領域の検出
CN112541506A (zh) 文本图像的矫正方法及装置、设备和介质
JP2009230473A (ja) 対象画像からの特定種類の被写体の画像に対応する画像領域の検出
JP4816540B2 (ja) 画像処理装置および画像処理方法
JP2009217607A (ja) 画像中の顔領域検出における信頼度の算出
JP2009237611A (ja) 対象画像からの顔領域の検出
JP2009237615A (ja) 対象画像における特定種類の被写体の画像の検出
JP2009217609A (ja) 顔領域に基づき設定された画像領域を対象とした補正処理

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20111221