[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP7124912B2 - 情報処理装置、情報処理方法、および、情報処理プログラム - Google Patents

情報処理装置、情報処理方法、および、情報処理プログラム Download PDF

Info

Publication number
JP7124912B2
JP7124912B2 JP2021039200A JP2021039200A JP7124912B2 JP 7124912 B2 JP7124912 B2 JP 7124912B2 JP 2021039200 A JP2021039200 A JP 2021039200A JP 2021039200 A JP2021039200 A JP 2021039200A JP 7124912 B2 JP7124912 B2 JP 7124912B2
Authority
JP
Japan
Prior art keywords
area
face image
image
region
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021039200A
Other languages
English (en)
Other versions
JP2021103538A (ja
Inventor
昭裕 早坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2021039200A priority Critical patent/JP7124912B2/ja
Publication of JP2021103538A publication Critical patent/JP2021103538A/ja
Priority to JP2022121851A priority patent/JP7302719B2/ja
Application granted granted Critical
Publication of JP7124912B2 publication Critical patent/JP7124912B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

本発明は、遮蔽領域を含む顔画像を識別する技術に関する。
顔画像を識別する画像認識装置が良く知られている。このような画像認識装置では、入力された顔画像または登録されている顔画像において顔の一部が眼鏡やサングラス、マスクなどの装着物によって遮蔽されている場合、認識精度が低下する。
このような問題に関連する技術の1つが、特許文献1に記載されている。特許文献1に記載の関連技術は、入力画像における複数の各小領域と、各小領域に対応する位置にある登録画像の各小領域との間で、パターン間距離値を算出する。そして、この関連技術は、パターン間距離値のうち小さい順に所定数だけを用いて算出した統合距離値に基づいて、入力画像を識別する。この関連技術では、入力画像および登録画像間でパターン間距離値が大きい小領域は識別に寄与しない。このため、この関連技術は、遮蔽によって入力画像および登録画像が大きく異なる小領域については、その小領域を避けて照合することができる。
また、このような問題に関連する他の技術が、特許文献2に記載されている。特許文献2に記載の関連技術は、利用者ごとに、装着物(眼鏡など)の装着状態が異なる複数の顔情報をあらかじめ登録しておく。そして、この関連技術は、複数の顔情報のうち、入力顔画像と類似する候補顔情報を特定する。さらに、この関連技術は、候補顔情報に対応する利用者について登録された複数の顔情報のうち、候補顔情報とは装着状態が異なる別種顔情報を特定する。そして、この関連技術は、装着物の装着領域以外の領域において、入力顔画像および別種顔情報が類似する場合に、入力顔画像が、候補顔情報に対応する利用者を表すと判定する。このように、この関連技術は、入力顔画像における装着物の装着状態がどちらの場合であっても、照合を行うことができる。
また、このような問題に関連する他の技術が、特許文献3に記載されている。特許文献3に記載の関連技術は、顔画像について装着物ありと判定した場合、装着物領域を回避した領域から第1特徴量を抽出する。そして、この関連技術は、第1特徴量とともに、装着物ありの顔画像を登録しておく。また、この関連技術は、顔画像について装着物なしと判定した場合、第1特徴量に加えて、想定される装着物領域を含む領域から第2特徴量を抽出する。そして、この関連技術は、第1特徴量および第2特徴量とともに、装着物なしの顔画像を登録しておく。また、この関連技術は、入力顔画像から第1特徴量または第2特徴量を抽出し、登録画像の第1特徴量または第2特徴量との照合を行う。このように、この関連技術は、登録顔画像に装着物があり入力顔画像に装着物がない場合や、登録顔画像に装着物がなく入力顔画像に装着物がある場合も、照合を行うことができる。
また、このような問題に関連する他の関連技術が、特許文献4に記載されている。特許文献4に記載の関連技術は、入力顔画像および基準顔画像を、特徴点を頂点とする複数の小領域に分割し、対応する小領域ごとに比較する。そして、この関連技術は、比較結果に基づいて、入力顔画像の小領域ごとに、遮蔽領域であるか否かを判定する。
また、このような問題に関連する他の関連技術が、特許文献5に記載されている。特許文献5に記載の関連技術は、入力顔画像の部分的な遮蔽領域を、事前に学習させた連想記憶回路によって補完する。そして、この関連技術は、補完された想起画像を利用して照合を行う。このように、この関連技術は、全ての画像を遮蔽領域の無い画像として照合を行う。
特許第4803214号 特開2014-115784号公報 特開2007-280250号公報 特開2011-60038号公報 特開2007-148872号公報
しかしながら、上述の関連技術には、以下の課題がある。
特許文献1に記載の関連技術では、入力画像および登録画像のそれぞれ表す顔の人物が異なる場合であっても、各画像における遮蔽領域の配置や内容が類似する場合がある。このような場合、この関連技術は、パターン間距離値が小さい遮蔽領域を照合に用いてしまう。そのため、この関連技術は、実際には異なる人物を示す入力画像および登録画像を、同一人物を示すと判定してしまう場合がある。
また、特許文献2に記載の関連技術では、利用者ごとに、装着状態の異なる複数の顔画像を登録する必要がある。しかしながら、どのような利用者も、そのような複数の顔画像を登録可能であるとは限らない。また、想定される装着物の種類が増えると、利用者は、装着物ごとに装着状態の異なる顔画像を登録しなければならない。これは、利便性の面での問題を生じる。
また、特許文献3に記載の関連技術では、想定される装着物の種類が増えると、各装着物について、想定される装着物領域を回避した第1特徴量を抽出する必要が生じる。したがって、この関連技術は、想定される装着物の種類数だけ異なるパターンの第1特徴量を抽出しなければならず、処理負荷が増加する。なお、想定される全ての装着物の装着物領域を避けた領域から第1特徴量を抽出すれば、想定される装着物の種類が増加しても、第1特徴量のパターン数は増加しない。しかしながら、この場合、想定される装着物の種類の増加に伴い、顔を表す領域のうちで照合に用いることができる領域が減少してしまう。その結果、認識精度が低下する。また、想定される装着物の種類の増加に応じて、装着物の有無を判定する機能の事前学習にかかるコストも増大する。
また、特許文献4に記載の関連技術は、入力画像の小領域ごとに、基準顔画像の小領域との輝度の差分に基づき遮蔽領域であるかないかを判定している。しかし、照明変動の影響により、小領域によっては、遮蔽領域でなくても基準顔画像との輝度の差分が大きい場合がある。この場合、この関連技術は、遮蔽領域でない小領域を遮蔽領域であると判定してしまう。また、入力顔画像の小領域がテクスチャの少ない遮蔽物によって遮蔽されており、対応する基準顔画像の小領域におけるテクスチャがもともと少ないことがある。このとき、そのような小領域間では、輝度の差分が少なくなる場合がある。この場合、この関連技術は、遮蔽領域である小領域を遮蔽領域でないと判定してしまう。例えば、白いマスクをした人物のマスクの一部と基準顔の肌との輝度の差分は少ない可能性がある。この場合、この関連技術は、マスクで遮蔽されている領域を遮蔽領域でないと判定してしまう。このように、この関連技術は、小領域ごとの遮蔽領域の判定精度に問題がある。
また、特許文献5に記載の関連技術は、登録画像に遮蔽領域がある場合に対応できない。これは、部分的な遮蔽領域を補完する想起画像生成のための学習には、遮蔽領域のない登録画像が必要となるからである。また、この関連技術は、登録画像の表す人物以外の人物を表す入力顔画像が入力された場合、登録画像の表す人物に近い想起画像を生成してしまう。そのため、この関連技術は、そのような入力顔画像について、実際には異なる人物を示す登録顔画像と同一人物を示すと判定してしまう可能性がある。
本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、システム構築にかかるコストおよび識別時の処理負荷を増大させることなく、遮蔽領域を含む画像の認識精度をより向上させる技術を提供することを目的とする。
本発明の情報処理装置は、顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定する判定部と、前記遮蔽領域に基づく遮蔽パターンと関連付けられている領域以外を用いて、前記入力画像の識別を行う識別部と、を備える。
また、本発明の情報処理方法は、顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定し、前記遮蔽領域に基づく遮蔽パターンと関連付けられている領域以外を用いて、前記入力画像の識別を行う。
また、本発明の情報処理プログラムは、顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定する処理と、前記遮蔽領域に基づく遮蔽パターンと関連付けられている領域以外を用いて、前記入力画像の識別を行う処理と、をコンピュータ装置に実行させる。
本発明は、システム構築にかかるコストおよび識別時の処理負荷を増大させることなく、遮蔽領域を含む画像の認識精度をより向上させる技術を提供することができる。
本発明の第1の実施の形態としての画像認識装置の機能ブロック図である。 本発明の第1の実施の形態としての画像認識装置のハードウェア構成の一例を示す図である。 本発明の第1の実施の形態としての画像認識装置の動作を説明するフローチャートである。 本発明の第2の実施の形態としての画像認識装置の機能ブロック図である。 本発明の第2の実施の形態において顔画像が分割された小領域の一例を模式的に示す図である。 本発明の第2の実施の形態において顔画像が分割された小領域の他の一例を模式的に示す図である。 本発明の第2の実施の形態において顔画像が分割された小領域の他の一例を模式的に示す図である。 本発明の第2の実施の形態において顔画像が分割された小領域の他の一例を模式的に示す図である。 本発明の第2の実施の形態としての画像認識装置の動作を説明するフローチャートである。 本発明の第3の実施の形態としての画像認識装置の機能ブロック図である。 本発明の第3の実施の形態としての画像認識装置の動作を説明するフローチャートである。 本発明の第4の実施の形態としての画像認識装置の機能ブロック図である。 本発明の第4の実施の形態としての画像認識装置の動作を説明するフローチャートである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態としての画像認識装置1の構成を図1に示す。図1において、画像認識装置1は、判定部11と、識別部12とを含む。
ここで、画像認識装置1は、図2に示すように、CPU(Central Processing Unit)1001と、RAM(Random Access Memory)1002と、ROM(Read Only Memory)1003と、ハードディスク等の記憶装置1004と、撮像装置1005と、出力装置1006とを含むコンピュータ装置によって構成可能である。ROM1003および記憶装置1004は、コンピュータ装置を本実施の形態の画像認識装置1として機能させるためのコンピュータ・プログラムおよび各種データを記憶している。撮像装置1005は、人物の顔を撮像することにより顔を表す画像を生成するカメラやビデオカメラ等の装置である。出力装置1006は、情報を出力するディスプレイ等の装置である。CPU1001は、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行することにより、コンピュータ装置の各部を制御する。
この場合、判定部11は、撮像装置1005と、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001とによって構成される。また、識別部12は、出力装置1006と、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001とによって構成される。なお、画像認識装置1およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
次に、画像認識装置1の各機能ブロックについて説明する。
判定部11は、顔画像および標準顔画像を比較することにより、顔画像における顔の遮蔽パターンを判定する。ここで、顔画像は、顔を表す画像である。例えば、判定部11は、顔画像を、撮像装置1005を介して取得する。また、標準顔画像は、標準的な顔を表す画像である。なお、標準顔画像は、あらかじめ定められており、例えば、記憶装置1004に記憶されているものとする。また、顔画像および標準顔画像は、該当する画像から顔を表す領域が切り出された画像であるものとする。また、本実施の形態では、顔画像および標準顔画像は、サイズや顔の向きなどが略同一であることを前提とする。
また、遮蔽パターンとは、顔に対してどのような遮蔽物によりどの領域に遮蔽が発生しているかを表す情報である。具体的には、遮蔽パターンは、マスクで口が隠れている、サングラスで目が隠れている、といった情報であってもよい。例えば、判定部11は、顔画像および標準顔画像を比較することにより、顔が遮蔽物により遮蔽されている遮蔽領域を推定し、推定した遮蔽領域の分布を考慮して、遮蔽パターンを判定してもよい。
識別部12は、顔画像中の遮蔽パターンに基づく領域を除外して、顔画像の識別を行う。除外領域は、想定される遮蔽パターンに応じてあらかじめ定められているものとする。なお、除外領域は、判定部21によって遮蔽パターンを判定する過程で推定された遮蔽領域と必ずしも一致していなくてもよい。また、顔画像の識別技術については、公知の技術を採用可能である。そして、識別部12は、識別結果を、出力装置1006に出力する。
以上のように構成された画像認識装置1の動作について、図3を参照して説明する。
まず、判定部11は、入力された顔画像(入力顔画像)および標準顔画像を比較する(ステップS1)。
次に、判定部11は、ステップS1の比較結果に基づいて、入力顔画像における遮蔽パターンを判定する(ステップS2)。
次に、識別部12は、入力顔画像中で、ステップS2で判定された遮蔽パターンに基づく領域を除外して、入力顔画像の識別を行う。そして、識別部12は、識別結果を出力する(ステップS3)。
以上で、画像認識装置1は動作を終了する。
次に、本発明の第1の実施の形態の効果について述べる。
本発明の第1の実施の形態としての画像認識装置は、システム構築にかかるコストおよび識別処理の負荷を増大させることなく、遮蔽領域を含む画像の認識精度をより向上させることができる。
その理由は、判定部が、顔画像および標準顔画像を比較することにより、顔画像の遮蔽パターンを判定し、識別部が、顔画像中の遮蔽パターンに基づく領域を除外して、顔画像の識別を行うからである。
このように、本実施の形態は、顔画像を標準顔画像と比較して、顔画像における遮蔽領域の分布を考慮して遮蔽パターンを判定する。また、本実施の形態は、標準顔画像との比較により遮蔽されていると推定した遮蔽領域そのものを除外するのではなく、遮蔽領域の分布を考慮して判定した遮蔽パターンに対して定めておいた領域を除外して識別を行う。これにより、本実施の形態は、遮蔽領域の判定エラーに頑健な遮蔽検出を実現する。また、本実施の形態は、遮蔽領域の判定エラーに伴う認証精度の低下を防ぐことができ、顔画像の認識精度を向上させることができる。
また、本実施の形態は、遮蔽物の種類ごとに遮蔽物の有無を判定する機能の事前学習を必要としない。また、本実施の形態は、利用者毎の遮蔽有無に対応する複数画像の事前登録を必要としない。また、本実施の形態は、遮蔽物の種類数分の特徴量の抽出を必要としない。そして、本実施の形態は、標準顔画像をあらかじめ用意しておき、想定される遮蔽パターンに応じて除外する領域を定めておけばよく、システム構築のコストおよび識別処理の負荷を増大させることがない。
(第2の実施の形態)
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第2の実施の形態としての画像認識装置2の構成を図4に示す。図4において、画像認識装置2は、本発明の第1の実施の形態としての画像認識装置1に対して、判定部11に替えて判定部21と、識別部12に替えて識別部22とを備え、さらに、分割部23と、信頼度算出部24とを有する。
ここで、画像認識装置2は、図2を参照して説明した本発明の第1の実施の形態の画像認識装置1と同様のハードウェア要素によって構成可能である。この場合、分割部23は、撮像装置1005と、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001とによって構成される。また、信頼度算出部24は、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001によって構成される。なお、画像認識装置2およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
次に、画像認識装置2の各機能ブロックについて説明する。
分割部23は、顔画像を小領域(パッチともいう)に分割する。なお、分割部23は、撮像装置1005を介して顔画像を取得してもよい。例えば、分割部23は、顔画像を、同一形状の小領域に分割してもよい。また、分割部23は、顔画像を、ある小領域の形状が他の少なくとも一部と異なるように分割してもよい。また、分割された各小領域は、他の小領域と重なり合う部分があってもよい。なお、分割部23は、顔画像を、標準顔画像と同様の配置および形状の小領域に分割することが望ましい。例えば、分割部23は、あらかじめ標準顔画像を小領域に分割しておき、入力された顔画像を同様の小領域に分割すればよい。あるいは、分割部23は、小領域にあらかじめ分割された標準顔画像の情報を取得し、取得した小領域と同様の小領域に顔画像を分割してもよい。
なお、分割部23は、顔画像を分割する前に、顔画像を正規化する処理を行ってもよい。これは、画像認識装置2に入力される顔画像が、正規化されていない場合に対応するためである。具体的には、分割部23は、顔画像中の顔を正規化した顔画像を生成する。なお、ここでいう正規化とは、顔の角度、大きさ等が、所定の角度や大きさになるよう変形処理することをいうものとする。例えば、分割部23は、入力顔画像中の目や口などの特徴点を検出し、その特徴点が所定の位置にくるよう幾何変換をすればよい。また、分割部23は、画像認識装置2に入力される画像が顔より広い範囲を表す画像であった場合、該当する画像から顔画像を切り出してから、正規化を行ってもよい。例えば、分割部23は、顔画像の正規化処理に、特許4653606号の手法を採用してもよい。なお、分割部23は、その他の手法を用いて入力顔画像を正規化してもよい。
具体例として、例えば、分割部23は、正規化した顔画像を、図5に示すように、格子状の等サイズの矩形の小領域に分割してもよい。あるいは、図6に示すように、一部または全部の小領域が、他の小領域に重なるように分割されていても構わない。図6では、太線の実線の矩形が示す小領域は、破線の矩形が示す4つの小領域と重なっている。あるいは、分割部23は、正規化した顔画像を、図7に示すように、ある小領域のサイズが他の少なくとも一部の小領域のサイズと異なるよう分割してもよい。あるいは、分割部23は、正規化した顔画像を、図8に示すように、矩形以外の形状(例えば、三角形)の小領域に分割してもよい。分割部23は、信頼度算出部24および識別部22の処理に支障のない範囲であれば、任意の形状やサイズの小領域に分割を行ってよい。
信頼度算出部24は、顔画像を構成する小領域と、標準顔画像を構成する小領域とで、対応する小領域同士を比較する。そして、信頼度算出部24は、顔画像の小領域毎に、比較結果に基づいて信頼度を算出する。信頼度は、その小領域が、遮蔽物により顔が隠されている遮蔽領域であるか否かの可能性を表す。なお、信頼度は、その小領域が遮蔽領域である可能性が高いほど小さく、低いほど大きい値であってもよい。逆に、信頼度は、その小領域が遮蔽領域である可能性が高いほど大きく、低いほど小さい値であってもよい。
また、標準顔画像は、あらかじめ記憶装置1004に記憶されている。また、標準顔画像は、あらかじめ正規化されているものとする。例えば、標準顔画像は、遮蔽領域を含まない一般的な証明写真のような顔を表すものであってもよい。また、標準顔画像としては、より多くの顔画像と照合されやすい顔画像を採用するのが望ましい。例えば、標準顔画像としては、複数の人物の顔が平均化された平均顔を表す画像を利用してもよい。また、標準顔画像としては、ウルフ/ラム(複数の人物の顔との類似度が所定条件を満たすサンプル)を表す画像を利用してもよい。また、標準顔画像としては、複数の人物の顔と類似するよう人工的に作り出された物体(人工物)を表す画像を利用してもよい。また、標準顔画像は、あらかじめ小領域に分割されていてもよい。この場合、標準顔画像を構成する小領域は、分割部23によって分割されたものであってもよい。
例えば、信頼度算出部24は、対応する小領域間で、輝度値の差分の総和により信頼度を算出するようにしてもよい。ただし、輝度値を用いた信頼度は、照明変動の影響を受けやすい。そこで、信頼度算出部24は、小領域毎に特徴量ベクトルを用いて信頼度を算出してもよい。特徴量ベクトルは、例えば、顔認証でよく用いられるGaborフィルタやLBP(Local Binary Pattern)のような特徴抽出処理によって得られる情報であってもよい。あるいは、特徴量ベクトルは、顔検出でよく用いられるHaar-likeフィルタのような特徴抽出処理によって得られる情報であってもよい。そして、この場合、信頼度算出部24は、対応する小領域同士で、特徴量ベクトル間の距離または相関に基づき信頼度を算出可能である。このような特徴量ベクトルに基づくことにより、信頼度算出部24は、照明変動などの影響を低減した信頼度を算出できる。なお、特徴量ベクトル間の距離に基づく信頼度を算出した場合、信頼度は、値が大きいほど、遮蔽領域である可能性が高いことを表すことになる。また、特徴量ベクトル間の相関に基づく信頼度を算出した場合、信頼度は、値が小さいほど、遮蔽領域である可能性が高いことを表すことになる。例えば、信頼度算出部24は、特徴量ベクトル間の正規化相関値を計算し、各小領域の信頼度としてもよい。この場合、信頼度が1に近いほど非遮蔽領域である可能性が高く、0に近いほど遮蔽領域である可能性が高いとみなせる。以下では、信頼度が、正規化相関値である例を中心に説明する。
判定部21は、顔画像における小領域別の信頼度の分布に基づいて、遮蔽パターンを判定する。ここで、判定部21は、所定範囲の小領域群をまとめた中領域に対して、中領域を構成する小領域群の信頼度の分布が遮蔽条件を満たすか否かを判定してもよい。そして、遮蔽条件を満たす場合、判定部21は、その中領域が遮蔽領域であると推定してもよい。そして、判定部21は、推定した遮蔽領域の分布に基づいて、遮蔽パターンを判定してもよい。
例えば、判定部21は、中領域を構成する各小領域の信頼度が閾値より高いか低いかを判別してもよい。そして、判定部21は、周囲の小領域の判別結果と異なる判別結果となった小領域の信頼度をノイズであるとみなしてもよい。具体的には、判定部21は、中領域を構成する小領域群の信頼度が閾値よりも低くなる小領域がその小領域群の過半数以上であるという遮蔽条件を満たす場合に、その中領域を遮蔽領域であると推定してもよい。なお、遮蔽条件は、その他の条件であってもよい。そして、判定部21は、遮蔽領域と推定された中領域の分布に基づいて、遮蔽パターンを判定してもよい。なお、中領域は、段階的に設定されていてもよい。例えば、判定部21は、所定範囲の小領域群をまとめた中領域をさらに所定範囲でまとめて大領域とするような構成にしてもよい。このような場合、判定部21は、大領域を構成する中領域のうち遮蔽領域であると推定されたものの分布が遮蔽条件を満たす場合に、大領域が遮蔽領域であると推定してもよい。そして、この場合、判定部21は、遮蔽領域であると推定された大領域の分布に基づいて、遮蔽パターンを判定すればよい。また、小領域、中領域、大領域の3段階に限らず、小領域から大領域までがさらに多段に設計されていてもよい。
例えば、判定部21は、顔画像中で鼻よりも上側の小領域群をまとめた顔上部領域を中領域に設定してもよい。この場合、判定部21は、顔上部領域における小領域群の信頼度の分布が遮蔽条件を満たす場合に、サングラスによる遮蔽パターンであると判定してもよい。また、判定部21は、鼻よりも下側の小領域群をまとめた顔下部領域を中領域に設定してもよい。この場合、判定部21は、顔下部領域における小領域群の信頼度の分布が遮蔽条件を満たす場合に、マスクによる遮蔽パターンであると判定してもよい。その他、判定部21は、想定される各種の遮蔽パターンに応じて中領域を設定しておけばよい。
ここで、小領域の信頼度の分布または遮蔽領域の分布に基づいて遮蔽パターンを判定することのメリットについて説明する。小領域毎に算出した信頼度は、撮影状況などにより結果が不安定になりやすい。そのため、仮に、小領域毎に、信頼度による遮蔽判定を行ったとすると、エラーが生じる可能性が高くなる。なお、ここでいうエラーとは、本来遮蔽領域である小領域を遮蔽領域でないと判定したり、本来遮蔽領域でない小領域を遮蔽領域であると判定することをいう。また、そのようなエラーを発生しうる信頼度は、ノイズであるといえる。仮に、このような小領域毎の遮蔽判定に基づき遮蔽領域以外を識別に用いるとすると、本来、識別の対象に適していない小領域(遮蔽領域)を遮蔽領域でないとして識別に利用する可能性がある。また、本来、識別の対象に適している小領域(遮蔽領域でない領域)を遮蔽領域であるとして識別に利用しない可能性がある。したがって、小領域毎の信頼度による遮蔽判定は、認証精度を低減してしまう。
一方、日常生活でよく起こり得る顔の遮蔽パターンとしては、マスクやサングラスが代表的である。これらの遮蔽パターンは、顔の1/3ないしは1/2程度の非常に大きい範囲を遮蔽するものである。このような遮蔽パターンの特性を考慮すると、信頼度にノイズがないと仮定すれば、閾値より高い(あるいは低い)信頼度の小領域群の中に、閾値より低い(あるいは高い)信頼度の小領域がわずかに存在する可能性は低い。したがって、周囲の小領域の信頼度と明らかに異なる信頼度が算出された場合には、その信頼度はノイズであると考えることができる。
そこで、前述のように、判定部21は、このようなエラー(ノイズ)を考慮して、所定範囲の小領域群をまとめた中領域における信頼度の分布が遮蔽条件を満たすか否かに基づいて、中領域が遮蔽領域であるか否かを推定する。これにより、判定部21は、小領域毎に信頼度のみを用いて遮蔽領域であるか否かを判定する場合と比べて、精度よく遮蔽領域を推定することができる。その結果、判定部21は、精度よく遮蔽パターンを判定可能となる。
識別部22は、入力された顔画像中で、遮蔽パターンに基づく除外領域以外において、小領域毎に識別を行う。除外領域は、本発明の第1の実施の形態と同様に、遮蔽パターンに応じてあらかじめ定められているものとする。例えば、マスクによる遮蔽パターンであれば、顔の下半分の領域を除外領域として定めておいてもよい。また、サングラスによる遮蔽パターンであれば、顔の上半分の領域を除外領域として定めておいてもよい。なお、除外領域は、判定部21による遮蔽パターンの判定の過程で推定された遮蔽領域と必ずしも一致していなくてよい。
そして、識別部22は、除外領域以外の小領域毎の識別結果に基づいて、顔画像の識別を行う。例えば、識別部22は、顔画像中の遮蔽パターンに基づく除外領域以外において、小領域毎に識別スコアを算出してもよい。その場合、識別部22は、算出した各小領域別の識別スコアを統合した統合スコアを算出し、統合スコアを、識別結果として出力してもよい。
具体的には、識別部22は、入力された顔画像が分割された各小領域と、登録顔画像を構成する各小領域との間で、対応する小領域同士を照合することにより、識別スコアを算出してもよい。この場合、識別部22は、入力顔画像中および登録画像中の各遮蔽パターンに基づくいずれの除外領域にも含まれない領域において、対応する小領域同士の比較を行う。そして、識別部22は、各小領域間の比較結果に基づいて、除外領域以外の小領域毎に識別スコアを算出する。そして、識別部22は、識別スコアを統合して統合スコアを算出し、識別結果として出力する。
ここで、登録顔画像は、あらかじめ記憶装置1004に記憶されているものとする。また、記憶装置1004には、登録顔画像とともに、その登録顔画像の遮蔽パターンを表す情報が記憶されていてもよい。また、記憶装置1004には、登録顔画像とともに、登録顔画像を構成する小領域を表す情報が記憶されていてもよい。なお、登録顔画像の遮蔽パターンについては、登録顔画像が登録される際に判定部21によって判定された情報であってもよい。また、登録顔画像を構成する小領域については、登録顔画像が登録される際に分割部23によって分割された情報であってもよい。
また、識別部22は、対応する小領域間の識別スコアとして、特徴量ベクトル間の距離ないし相関に基づく値を用いてもよい。この場合、各小領域の特徴量ベクトルは、例えば、GaborフィルまたはLBPのような特徴抽出処理によって得られる情報であってもよい。ただし、識別部22は、登録顔画像との識別処理に、標準顔画像との信頼度算出時に用いられた特徴量ベクトルよりも識別能力が高い特徴量ベクトルを利用するのが望ましい。例えば、識別部22は、学習データから抽出した特徴量ベクトルに対して線形判別分析(Linear Discriminant Analysis)を行うことにより、低次元への変換行列を学習しておいてもよい。この場合、学習データは、人物ごとに正しくラベル付けされた顔画像であってもよい。そのような学習データは、登録顔画像であってもよい。例えば、画像認識装置2の利用者が全員特定可能なケース(例えば、入退場管理に用いられるケース)では、学習データとして、システム利用者全員の登録顔画像を用いることが望ましい。あるいは、学習データは、登録顔画像に限らず、その他のラベル付けされた顔画像であってもよい。例えば、画像認識装置2が不特定多数の人物の認証に用いられるケース(例えば、不審者検出に用いられるケース)であれば、学習データとしては、システム利用者か否かにかかわらず、ラベル付された多数の人物の顔画像を用いることが望ましい。そして、識別部22は、入力顔画像および登録顔画像の小領域毎の特徴量ベクトルに対して、前述の変換行列を作用させることにより、識別能力を高めた低次元特徴量ベクトルを生成すればよい。
以上のように構成された画像認識装置2の動作について、図9を参照して説明する。なお、記憶装置1004には、標準顔画像および登録顔画像があらかじめ記憶されているものとする。また、標準顔画像は、あらかじめ小領域に分割されているものとする。また、登録顔画像も、あらかじめ小領域に分割されているものとする。また、登録顔画像は、遮蔽パターンを表す情報とともに記憶されているものとする。
図9において、まず、分割部23は、入力された顔画像(入力顔画像)を正規化する(ステップS21)。
次に、分割部23は、ステップS21で正規化した入力顔画像を小領域に分割する(ステップS22)。
次に、信頼度算出部24は、ステップS22で分割された顔画像の各小領域と、標準顔画像の各小領域との間で、対応する小領域同士を比較する。これにより、信頼度算出部24は、各小領域の信頼度を算出する(ステップS23)。
次に、判定部21は、中領域を構成する小領域群について信頼度の分布が遮蔽条件を満たすか否かに基づいて、入力顔画像の遮蔽パターンを判定する(ステップS24)。
具体的には、前述のように、判定部21は、顔の上半分または下半分を表す中領域の信頼度の分布が遮蔽条件を満たせば、その中領域が遮蔽領域であると推定する。一方、判定部21は、顔の上半分または下半分を表す中領域の信頼度の分布が遮蔽条件を満たさなければ、その中領域が遮蔽領域でないと推定する。そして、そのような中領域が遮蔽領域であると推定した場合、判定部21は、設定した中領域に対応する遮蔽パターンを判定すればよい。例えば、判定部21は、上半分領域が遮蔽領域であると推定した場合、サングラスによる遮蔽パターンであると判定する。また、判定部21は、下半分領域が遮蔽領域であると推定した場合、マスクによる遮蔽パターンであると判定する。
次に、識別部22は、入力顔画像が分割された各小領域と、登録顔画像を構成する各小領域との間で、対応する小領域同士を照合する。これにより、識別部22は、各小領域間の識別スコアを算出する(ステップS25)。
前述のように、識別部22は、識別スコアを、特徴量ベクトルまたは低次元特徴量ベクトル間の距離ないしは相関から算出すればよい。
次に、識別部22は、ステップS24で判定した遮蔽パターンに基づく領域を除外して、ステップS25で算出した各小領域間の識別スコアを統合した統合スコアを算出する(ステップS26)。
ここでは、識別部22は、入力顔画像および登録顔画像間で、対応する小領域の一方または両方が、各画像の遮蔽パターンに基づく除外領域に含まれる場合、その小領域間の識別スコアを統合に用いない。そして、識別部22は、対応する小領域の両方が、各画像の遮蔽パターンに基づく除外領域に含まれない場合、その小領域間の識別スコアを統合に用いる。
例えば、識別部22は、該当する小領域の識別スコアの平均値を統合スコアとしてもよい。もし、入力顔画像および登録顔画像の双方について、いずれの遮蔽パターンも判定されていない場合、識別部22は、すべての小領域の識別スコアの平均値を統合スコアとする。例えば、入力顔画像および登録顔画像の一方または両方でマスクの遮蔽パターンが判定されている場合、識別部22は、顔の下半分を除外領域として、上半分の小領域の識別スコアについて、その平均値を統合スコアとしてもよい。また、例えば、識別部22は、対象となる各小領域の識別スコアに各小領域の信頼度を乗じた上で平均をとり、重み付き平均値を統合スコアとしてもよい。
以上で、画像認識装置2は、動作を終了する。
次に、本発明の第2の実施の形態の効果について述べる。
本発明の第2の実施の形態としての画像認識装置は、システム構築にかかるコストおよび識別処理の負荷を増大させることなく、遮蔽領域を含む顔画像の認識精度をさらに向上させることができる。
その理由は、分割部が、顔画像を小領域に分割し、信頼度算出部が、顔画像および標準顔画像間で、対応する小領域同士を比較することにより小領域毎の信頼度を算出するからである。そして、判定部が、小領域毎の信頼度の分布に基づいて、顔画像の遮蔽領域を推定し、遮蔽領域の分布に基づいて遮蔽パターンを判定するからである。そして、識別部が、顔画像中の遮蔽パターンに基づき定められた領域を除外して、小領域毎に識別を行い、各識別結果に基づいて、顔画像全体の識別を行うからである。
このように、本実施の形態は、顔画像を構成する個々の小領域についてその信頼度のみで遮蔽領域であるか否かを判定するのではなく、より広い範囲の信頼度の分布に基づいて、遮蔽領域を推定する。その結果、本実施の形態は、小領域毎の遮蔽判定のエラーの影響を少なくすることができ、より正確な遮蔽領域を推定することができる。そして、本実施の形態は、推定した遮蔽領域の分布に基づいて遮蔽パターンを判定するので、遮蔽判定のエラーの影響をさらに少なくして、より高精度に遮蔽パターンを判定できる。そして、本実施の形態は、遮蔽領域として推定した領域をそのまま除外するのではなく、判定した遮蔽パターンに応じて定められた領域を除外して識別を行う。このため、本実施の形態は、遮蔽判定エラーに対してさらに頑健である。そして、本実施の形態は、そのような領域を除外して、小領域毎の識別結果に基づいて、顔画像の識別を行う。これにより、本実施の形態は、遮蔽領域の判定エラーに頑健な遮蔽検出を実現し、顔画像の認識精度を向上させることができる。
さらには、本実施の形態は、標準顔1枚との比較で遮蔽領域および遮蔽パターンの判定を行うため、既存の技術では遮蔽領域や遮蔽パターンの判定のために必要であった大量の学習データを必要としない。その結果、本実施の形態は、システム構築のコストを大幅に低減することができる。
なお、本実施の形態において、登録画像は、その遮蔽パターンおよび分割された小領域の情報とともにあらかじめ記憶装置に記憶されている例を中心に説明した。これに限らず、本実施の形態は、入力顔画像の識別時に、登録画像についても分割および遮蔽パターンの判定を行ってもよい。
(第3の実施の形態)
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第3の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第3の実施の形態としての画像認識装置3の構成を図10に示す。図10において、画像認識装置3は、本発明の第2の実施の形態としての画像認識装置2と同一の構成に加えて、全体識別部35と、切替部36とを有する。
ここで、画像認識装置3は、図2を参照して説明した本発明の第1の実施の形態の画像認識装置1と同様のハードウェア要素によって構成可能である。この場合、全体識別部35は、出力装置1006と、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001とによって構成される。また、切替部36は、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001によって構成される。なお、画像認識装置3およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
次に、画像認識装置3の各機能ブロックについて説明する。
全体識別部35は、顔画像における顔の全域を表す情報を用いて、顔画像の識別を行う。具体的には、例えば、全体識別部35は、顔の全域から特徴抽出を行って特徴量ベクトルを求める。また、全体識別部35は、登録顔画像からも、顔の全域についての特徴量ベクトルを求める。そして、全体識別部35は、入力顔画像の顔全域の特徴量ベクトルおよび登録顔画像の顔全域の特徴量ベクトルに基づいて、全体識別スコアを算出してもよい。この場合、全体識別部35は、全体識別スコアを、識別結果として出力する。
切替部36は、判定部21による遮蔽パターンの判定結果に基づいて、入力された顔画像の識別に、識別部22を用いるか全体識別部35を用いるかを切り替える。
以上のように構成された画像認識装置3の動作を、図11を用いて説明する。なお、以下では、登録顔画像は、遮蔽パターンおよび小領域を表す情報とともに記憶装置1004に記憶されているものとする。
図11において、まず、画像認識装置3は、ステップS21~S24まで、本発明の第2の実施の形態としての画像認識装置2と同様に動作して、入力顔画像の遮蔽パターンを判定する。
次に、切替部36は、判定された遮蔽パターンに基づいて後続の処理を切り替える。具体的には、切替部36は、入力顔画像および登録顔画像の少なくともいずれかに、種類は問わず遮蔽パターンがあると判定されているか否かを判断する(ステップS31)。
ここで、少なくともいずれかに遮蔽パターンがあると判定されている場合、切替部36は、識別部22を制御して、本発明の第2の実施の形態と同様にステップS25~S26を実行させる。
一方、入力顔画像および登録顔画像のいずれにも遮蔽パターンがないと判定されている場合、切替部36は、全体識別部35を制御して、以下のステップS32を実行させる。
ここでは、全体識別部35は、入力顔画像の顔の全域の情報と、登録顔画像の顔の全域の情報とを用いて識別を行う。具体的には、全体識別部35は、入力顔画像の顔全域から求めた特徴量ベクトルと、登録顔画像の顔全域から求めた特徴量ベクトルとを用いて、全体識別スコアを算出する(ステップS32)。
例えば、全体識別部35は、GaborフィルタやLBPのような特徴抽出処理によって、各画像の顔全域からの特徴量ベクトルを求めればよい。そして、全体識別部35は、入力顔画像および登録顔画像それぞれの顔全域の特徴量ベクトルおよび間の距離または相関から、全体識別スコアを算出すればよい。
以上で、画像認識装置3は、動作を終了する。
次に、本発明の第3の実施の形態の効果について述べる。
本発明の第3の実施の形態としての画像認識装置は、本発明の第2の実施の形態と同様の効果に加えて、さらに、遮蔽領域がない場合に顔画像の認証精度を低下させないようにすることができる。
その理由は、切替部が、入力顔画像または登録顔画像のいずれにも遮蔽パターンがない場合には、小領域毎の識別結果を用いずに、顔全域の情報を用いて識別を行うよう処理を切り替えるからである。また、切替部が、入力顔画像または登録顔画像の少なくともいずかに遮蔽パターンがある場合には、小領域毎の識別結果を用いて識別を行うよう処理を切り替えるからである。
ここで、遮蔽パターンがなく領域を除外する必要がない場合には、顔全域の情報を用いた識別結果のほうが、小領域毎の識別結果の統合より精度がよい傾向がある。したがって、本実施の形態は、両画像の少なくとも一方に遮蔽パターンがある場合の高い認証精度を維持しつつ、両画像ともに遮蔽パターンがない場合にも照合精度を低下させることがない。
なお、本実施の形態において、識別部および全体識別部は、特徴量ベクトル間の距離や相関に基づき識別スコアを算出する例について説明したが、識別部は、その他の技術を採用して識別を行ってもよい。
(第4の実施の形態)
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第3の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
まず、本発明の第4の実施の形態としての画像認識装置4の構成を図12に示す。図12において、画像認識装置4は、本発明の第3の実施の形態としての画像認識装置3に対して、識別部22に替えて識別部42と、信頼度算出部24に替えて信頼度算出部44と、全体識別部35に替えて全体識別部45とを備え、さらに、特徴抽出部47を備える点が異なる。
ここで、画像認識装置4は、図2を参照して説明した本発明の第1の実施の形態の画像認識装置1と同様のハードウェア要素によって構成可能である。この場合、特徴抽出部47は、ROM1003および記憶装置1004に記憶されたコンピュータ・プログラムおよび各種データをRAM1002に読み込んで実行するCPU1001によって構成される。なお、画像認識装置4およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
特徴抽出部47は、分割部23により分割された顔画像の小領域毎に、特徴量ベクトルを抽出する。特徴量ベクトルの抽出には、前述の各種フィルタや技術を用いればよい。例えば、特徴抽出部47は、Gaborフィルタを使ったGabor特徴量を抽出してもよい。具体的には、特徴抽出部47は、入力顔画像について、分割部23によって正規化・分割された小領域毎に特徴量ベクトルを算出し、記憶装置1004に記憶しておく。また、特徴抽出部47は、標準顔画像および登録顔画像についても、小領域毎にあらかじめ特徴量ベクトルを算出しておいてもよい。本実施の形態では、標準顔画像は、小領域毎の特徴量ベクトルとして記憶装置1004に記憶されていればよく、顔画像自体のデータは記憶されていなくてもよい。同様に、登録顔画像は、小領域毎の特徴量ベクトルとして記憶装置1004に記憶されていればよく、登録顔画像自体のデータは記憶されていなくてもよい。
信頼度算出部44は、本発明の第2~第3の実施の形態における信頼度算出部24と略同様に構成される。すなわち、信頼度算出部44は、入力顔画像および標準顔画像の間で、対応する小領域間ごとに特徴量ベクトルを用いて信頼度を算出する。ただし、信頼度算出部44は、入力顔画像および標準顔画像について各小領域の特徴量ベクトルを、算出する代わりに記憶装置1004から取得する点が、信頼度算出部24と異なる。
識別部42は、本発明の第2~第3の実施の形態における識別部22と略同様に構成される。すなわち、識別部42は、入力顔画像および登録顔画像の間で、対応する小領域間ごとに特徴量ベクトルを用いて識別スコアを算出する。ただし、識別部42は、入力顔画像および登録顔画像について各小領域の特徴量ベクトルを、算出する代わりに記憶装置1004から取得する点が、識別部22と異なる。また、識別部42は、本発明の第2~第3の実施の形態と同様に、事前に特徴量ベクトルを低次元へ変換する変換行列を学習しておいてもよい。その場合、識別部42は、小領域毎の特徴量ベクトルを低次元に変換したものを用いて、識別スコアを算出する。例えば、識別部42は、入力顔画像および登録顔画像について、対応する各小領域の低次元特徴量ベクトル間の正規化相関値を、識別スコアとして算出すればよい。そして、識別部42は、入力顔画像および登録顔画像の遮蔽パターンに基づくいずれの領域も除外した上で、小領域毎の識別結果を統合して統合スコアを算出する。
全体識別部45は、入力顔画像の連結特徴量ベクトルと、登録顔画像の連結特徴量ベクトルとに基づいて、全体識別スコアを算出する。ここで、連結特徴量ベクトルとは、各小領域の特徴量ベクトルを連結して生成される。例えば、3つの小領域についてn1行1列、n2行1列、n3行1列の特徴量ベクトルがそれぞれ抽出されているとする。n1、n2、n3は、それぞれ正の整数である。これらは、全て同じ値であってもよいし、少なくとも一部が他と異なる値であってもよい。この場合、全体識別部45は、各特徴量ベクトルを連結し、(n1+n2+n3)行1列の連結特徴量ベクトルを生成可能である。つまり、連結特徴量ベクトルは、各小領域の特徴量ベクトルより次元数が増加している。なお、連結の順序は任意である。
また、全体識別部45は、連結特徴量ベクトルについても、事前に、学習データに対する線形判別分析により、連結特徴量ベクトルを低次元の連結特徴量ベクトルへと変換する変換行列を学習しておいてもよい。この場合、全体識別部45は、低次元連結特徴量ベクトル同士の正規化相関値を、全体識別スコアとして算出すればよい。
以上のように構成された画像認識装置4の動作について、図13を参照して説明する。なお、以下では、標準顔画像の小領域毎の特徴量ベクトルが、記憶装置1004に記憶されているものとする。また、登録顔画像の小領域毎の特徴量ベクトルが、あらかじめ判定部21により判定された遮蔽パターンと共に、記憶装置1004に記憶されているものとする。
図13では、まず、分割部23は、本発明の第2の実施の形態と同様にステップS21~S22を実行し、入力顔画像を正規化・分割する。
次に、特徴抽出部47は、入力顔画像の小領域毎に特徴量を抽出し、記憶装置1004に記憶する(ステップS41)。
次に、信頼度算出部44は、ステップS41で記憶装置1004に記憶された入力顔画像の各小領域の特徴量ベクトルと、記憶装置1004に記録されている標準顔画像の各小領域の特徴量ベクトルとで、対応する各小領域間の信頼度を算出する(ステップS42)。
次に、判定部21は、本発明の第2の実施の形態と同様にステップS24を実行し、遮蔽パターンを判定する。
次に、切替部36により入力顔画像および登録顔画像の一方または両方で遮蔽パターンありと判断された場合、識別部42は、ステップS43、S26を実行する。
ここでは、識別部42は、入力顔画像および登録顔画像について、記憶装置1004に記憶されている小領域の特徴量ベクトルを用いて、対応する小領域間の識別スコアを算出する(ステップS43)。
例えば、前述のように、識別部42は、対応する各小領域の特徴量ベクトルを低次元に変換した低次元特徴量ベクトル間で、正規化相関値を識別スコアとして算出してもよい。そして、識別部42は、本発明の第2の実施の形態と同様にステップS26を実行し、統合スコアを算出する。
一方、切替部36により入力顔画像および登録顔画像のどちらにも遮蔽パターンなしと判断された場合、全体識別部45は、ステップS44~S45を実行する。
ここでは、全体識別部45は、入力顔画像および登録顔画像について、記憶装置1004に記憶されている小領域の特徴量ベクトルを連結した連結特徴量ベクトルをそれぞれ生成する(ステップS44)。
そして、全体識別部45は、入力顔画像および登録顔画像について、連結特徴量ベクトル間の比較により、全体識別スコアを算出する(ステップS45)。
例えば、前述のように、全体識別部45は、連結特徴量ベクトルを低次元に変換してから、低次元連結特徴量ベクトル間の正規化相関値を、全体識別スコアとして算出してもよい。
以上で、画像認識装置4は、動作を終了する。
次に、本発明の第4の実施の形態の効果について述べる。
本発明の第4の実施の形態としての画像認識装置は、遮蔽領域を含む顔画像について高い認証精度を保ちながら、さらに処理を効率化し高速化を実現する。
その理由は、特徴抽出部が、入力顔画像、標準顔画像、および、登録顔画像を構成する各小領域について、特徴量ベクトルを抽出して記憶しておくからである。これにより、信頼度算出部、識別部、および、全体識別部は、既に抽出された特徴量ベクトルを共通で利用することができ、各処理を効率化・高速化できる。
なお、上述した本発明の第2から第4の各実施の形態において、識別部および全体識別部が、登録画像との照合により入力顔画像を識別する例を中心に説明した。これに限らず、各実施の形態の識別部および全体識別部は、登録画像を用いずに、入力顔画像の表す人物の性別推定、姿勢推定、表情認識等を行ってもよい。このように、各実施の形態は、遮蔽領域を含む顔画像について、登録画像を用いない各種識別処理を行う用途にも適用可能である。
また、上述した本発明の第2から第4の各実施の形態において、判定部、識別部、および、全体識別部が、特徴量ベクトル間の距離または相関を用いて遮蔽パターンの判定および入力顔画像の識別を行う例を中心に説明した。これに限らず、各実施の形態のこれらの機能ブロックは、その他の手法により領域間を比較して信頼度または識別スコアを算出してもよい。なお、その場合、本発明の第4の実施の形態の特徴抽出部は、該当する画像の小領域について、比較に用いる情報を算出して記憶しておけばよい。
また、上述した本発明の各実施の形態において、遮蔽パターンの一例としてマスクやサングラスによる遮蔽を説明したが、遮蔽パターンの種類を限定するものではない。
また、上述した本発明の各実施の形態において、入力顔画像、標準顔画像、登録顔画像とは、該当する画像に含まれる顔を表す領域の部分を指すものとする。これらの顔画像は、あらかじめ顔の領域が切り出されたものであってもよいし、処理時に切り出されたものであってもよい。
また、上述した本発明の各実施の形態において、画像認識装置の各機能ブロックが、記憶装置またはROMに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組み合わせが専用のハードウェアにより実現されていてもよい。
また、上述した本発明の各実施の形態において、画像認識装置の機能ブロックは、複数の装置に分散されて実現されてもよい。
また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した画像認識装置の動作を、本発明の画像認識プログラムとしてコンピュータの記憶装置(記憶媒体)に格納しておいてもよい。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
また、本発明は、上述した各実施の形態に限定されず、様々な態様で実施されることが可能である。
また、上述した各実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
顔を表す画像(顔画像)と、標準的な顔を表す画像(標準顔画像)とを比較することにより、前記顔画像における顔の遮蔽パターンを判定する判定部と、
前記顔画像中の前記遮蔽パターンに基づく領域を除外して、前記顔画像の識別を行う識別部と、
を備えた画像認識装置。
(付記2)
前記判定部は、前記顔画像を構成する各小領域と、前記標準顔画像において前記顔画像の各小領域に対応する小領域との比較に基づく信頼度の分布に基づいて、前記遮蔽パターンを判定することを特徴とする付記1に記載の画像認識装置。
(付記3)
前記判定部は、所定範囲の前記小領域群をまとめた中領域に対して、その中領域を構成する小領域群の信頼度の分布が所定の遮蔽条件を満たす場合に、その中領域に基づき遮蔽パターンを判定することを特徴とする付記2に記載の画像認識装置。
(付記4)
前記判定部は、前記顔画像中で鼻よりも上側の小領域群をまとめた顔上部領域を前記中領域として、該中領域において前記信頼度の分布が前記遮蔽条件を満たす場合に、サングラスによる遮蔽パターンであると判定することを特徴とする付記3に記載の画像認識装置。
(付記5)
前記判定部は、前記顔画像中で鼻よりも下側の小領域群をまとめた顔下部領域を前記中領域として、該中領域において前記信頼度の分布が前記遮蔽条件を満たす場合に、マスクによる遮蔽パターンであると判定することを特徴とする付記3または付記4に記載の画像認識装置。
(付記6)
前記顔画像を前記小領域に分割する分割部と、
前記顔画像および前記標準顔画像について、対応する前記小領域間を比較することにより前記信頼度を算出する信頼度算出部と、
をさらに備えることを特徴とする付記2から付記5のいずれか1つに記載の画像認識装置。
(付記7)
前記識別部は、前記顔画像中の前記遮蔽パターンに基づく領域以外における前記小領域毎に識別を行い、前記小領域毎の識別結果に基づいて、前記顔画像の識別を行うことを特徴とする付記2から付記6のいずれか1つに記載の画像認識装置。
(付記8)
前記顔画像について、顔全域の情報を用いて識別を行う全体識別部と、
前記判定部の判定結果に基づいて、前記識別部および前記全体識別部のいずれを用いるかを切り替える切替部と、
をさらに備えることを特徴とする付記1から付記7のいずれか1つに記載の画像認識装置。
(付記9)
前記標準顔画像として、複数の人物の顔が平均化された平均顔を表す顔画像を用いることを特徴とする付記1から付記8のいずれか1つに記載の画像認識装置。
(付記10)
前記標準顔画像として、複数の人物の顔画像との類似度が所定条件を満たす顔画像を用いることを特徴とする付記1から付記8のいずれか1つに記載の画像認識装置。
(付記11)
前記標準顔画像として、標準的な顔の人工物を表す顔画像を用いることを特徴とする付記1から付記8のいずれか1つに記載の画像認識装置。
(付記12)
前記顔画像および前記標準顔画像として、特徴量ベクトルで表された情報を用いることを特徴とする付記1から付記11のいずれか1つに記載の画像認識装置。
(付記13)
顔を表す画像(顔画像)と、標準的な顔を表す画像(標準顔画像)とを比較することにより、前記顔画像における顔の遮蔽パターンを判定し、
前記顔画像中の前記遮蔽パターンに基づく領域を除外して、前記顔画像の識別を行う画像認識方法。
(付記14)
顔を表す画像(顔画像)と、標準的な顔を表す画像(標準顔画像)とを比較することにより、前記顔画像における顔の遮蔽パターンを判定する判定ステップと、
前記顔画像中の前記遮蔽パターンに基づく領域を除外して、前記顔画像の識別を行う識別ステップと、
をコンピュータ装置に実行させる画像認識プログラム。
1、2、3、4 画像認識装置
11、21 判定部
12、22、42 識別部
23 分割部
24、44 信頼度算出部
35、45 全体識別部
36 切替部
47 特徴抽出部
1001 CPU
1002 RAM
1003 ROM
1004 記憶装置
1005 撮像装置
1006 出力装置

Claims (11)

  1. 顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定する判定部と、
    前記遮蔽領域に基づく遮蔽パターンと予め関連付けられている、前記遮蔽パターンに応じた除外領域以外を用いて、前記入力画像の識別を行う識別部と、
    を備えた情報処理装置。
  2. 前記判定部は、前記入力画像を構成する複数の小領域と、標準的な顔を表す画像である標準画像において前記入力画像の各小領域に対応する小領域との比較に基づく信頼度の分布に基づいて、前記遮蔽パターンを判定する請求項1に記載の情報処理装置。
  3. 前記判定部は、所定範囲の前記小領域をまとめた小領域群である中領域について、当該中領域を構成する前記小領域の信頼度の分布が所定の遮蔽条件を満たす場合に、前記遮蔽パターンを判定する請求項2に記載の情報処理装置。
  4. 前記判定部は、前記入力画像における鼻よりも上側の前記小領域をまとめた顔上部領域を前記中領域とし、当該中領域において前記信頼度の分布が前記遮蔽条件を満たす場合に、サングラスによる遮蔽パターンであると判定する請求項3に記載の情報処理装置。
  5. 前記判定部は、前記入力画像における鼻よりも下側の前記小領域をまとめた顔下部領域を前記中領域とし、当該中領域において前記信頼度の分布が前記遮蔽条件を満たす場合に、マスクによる遮蔽パターンであると判定する請求項3または請求項4に記載の情報処理装置。
  6. 前記入力画像を前記小領域に分割する分割部と、
    前記入力画像および前記標準画像について、対応する前記小領域間を比較することにより前記信頼度を算出する信頼度算出部と、
    をさらに備える請求項2から請求項5のいずれか1項に記載の情報処理装置。
  7. 前記識別部は、前記入力画像における前記遮蔽パターンに基づいて定めた領域以外における前記小領域毎に前記入力画像の識別を行い、前記小領域毎の識別結果に基づいて、前記入力画像の識別を行う請求項2から請求項6のいずれか1項に記載の情報処理装置。
  8. 前記入力画像について、顔全域の情報を用いて識別を行う全体識別部と、
    前記判定部の判定結果に基づいて、前記識別部および前記全体識別部のいずれを用いるかを切り替える切替部と、
    をさらに備える請求項1から請求項7のいずれか1項に記載の情報処理装置。
  9. 前記識別部は、前記遮蔽領域に基づく前記遮蔽パターンと関連付けられている前記除外領域を前記入力画像から除外し、前記入力画像の識別を行い、
    前記除外領域は、前記判定部が判定した前記遮蔽領域とは異なる領域である請求項1から8のいずれか1項に記載の情報処理装置。
  10. 顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定し、
    前記遮蔽領域に基づく遮蔽パターンと予め関連付けられている、前記遮蔽パターンに応じた除外領域以外を用いて、前記入力画像の識別を行う情報処理方法。
  11. 顔を表す画像である入力画像において遮蔽されている遮蔽領域を判定する処理と、
    前記遮蔽領域に基づく遮蔽パターンと予め関連付けられている、前記遮蔽パターンに応じた除外領域以外を用いて、前記入力画像の識別を行う処理と、
    をコンピュータ装置に実行させる情報処理プログラム。
JP2021039200A 2019-12-12 2021-03-11 情報処理装置、情報処理方法、および、情報処理プログラム Active JP7124912B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021039200A JP7124912B2 (ja) 2019-12-12 2021-03-11 情報処理装置、情報処理方法、および、情報処理プログラム
JP2022121851A JP7302719B2 (ja) 2019-12-12 2022-07-29 情報処理装置、情報処理方法、および、情報処理プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019224879A JP6852779B2 (ja) 2019-12-12 2019-12-12 画像認識装置、画像認識方法、および、画像認識プログラム
JP2021039200A JP7124912B2 (ja) 2019-12-12 2021-03-11 情報処理装置、情報処理方法、および、情報処理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2019224879A Division JP6852779B2 (ja) 2019-12-12 2019-12-12 画像認識装置、画像認識方法、および、画像認識プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022121851A Division JP7302719B2 (ja) 2019-12-12 2022-07-29 情報処理装置、情報処理方法、および、情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021103538A JP2021103538A (ja) 2021-07-15
JP7124912B2 true JP7124912B2 (ja) 2022-08-24

Family

ID=69738579

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019224879A Active JP6852779B2 (ja) 2019-12-12 2019-12-12 画像認識装置、画像認識方法、および、画像認識プログラム
JP2021039200A Active JP7124912B2 (ja) 2019-12-12 2021-03-11 情報処理装置、情報処理方法、および、情報処理プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2019224879A Active JP6852779B2 (ja) 2019-12-12 2019-12-12 画像認識装置、画像認識方法、および、画像認識プログラム

Country Status (1)

Country Link
JP (2) JP6852779B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115886A (zh) * 2020-09-22 2020-12-22 北京市商汤科技开发有限公司 图像检测方法和相关装置、设备、存储介质
KR102686848B1 (ko) * 2020-10-28 2024-07-19 한국전자통신연구원 마스크 환경에 적응 가능한 신원 인식 방법 및 이를 위한 장치
KR102563153B1 (ko) * 2021-01-25 2023-08-04 상명대학교산학협력단 마스크 착용에 강인한 얼굴 인식 방법 및 시스템

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004158013A (ja) 2002-11-04 2004-06-03 Samsung Electronics Co Ltd 顔検出システム及び方法、並びに顔画像認証方法
JP2007128262A (ja) 2005-11-02 2007-05-24 Omron Corp 顔照合装置
JP2007280250A (ja) 2006-04-11 2007-10-25 Matsushita Electric Ind Co Ltd 顔認証システム
WO2010126120A1 (ja) 2009-04-30 2010-11-04 グローリー株式会社 画像処理装置、画像処理方法、及び同方法をコンピュータに実行させるプログラム
JP2011060038A (ja) 2009-09-10 2011-03-24 Seiko Epson Corp 画像処理装置
US20120230545A1 (en) 2009-11-30 2012-09-13 Tong Zhang Face Recognition Apparatus and Methods
JP2012212969A (ja) 2011-03-30 2012-11-01 Secom Co Ltd 画像監視装置
JP2014086042A (ja) 2012-10-26 2014-05-12 Secom Co Ltd 顔認証装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4161659B2 (ja) * 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004158013A (ja) 2002-11-04 2004-06-03 Samsung Electronics Co Ltd 顔検出システム及び方法、並びに顔画像認証方法
JP2007128262A (ja) 2005-11-02 2007-05-24 Omron Corp 顔照合装置
JP2007280250A (ja) 2006-04-11 2007-10-25 Matsushita Electric Ind Co Ltd 顔認証システム
WO2010126120A1 (ja) 2009-04-30 2010-11-04 グローリー株式会社 画像処理装置、画像処理方法、及び同方法をコンピュータに実行させるプログラム
JP2011060038A (ja) 2009-09-10 2011-03-24 Seiko Epson Corp 画像処理装置
US20120230545A1 (en) 2009-11-30 2012-09-13 Tong Zhang Face Recognition Apparatus and Methods
JP2012212969A (ja) 2011-03-30 2012-11-01 Secom Co Ltd 画像監視装置
JP2014086042A (ja) 2012-10-26 2014-05-12 Secom Co Ltd 顔認証装置

Also Published As

Publication number Publication date
JP2020038731A (ja) 2020-03-12
JP6852779B2 (ja) 2021-03-31
JP2021103538A (ja) 2021-07-15

Similar Documents

Publication Publication Date Title
JP6630999B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラム
US9563821B2 (en) Method, apparatus and computer readable recording medium for detecting a location of a face feature point using an Adaboost learning algorithm
JP7124912B2 (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
Zhang et al. Fast and robust occluded face detection in ATM surveillance
JP5010905B2 (ja) 顔認証装置
KR20120069922A (ko) 얼굴 인식 장치 및 그 방법
US20070242856A1 (en) Object Recognition Method and Apparatus Therefor
KR20130048076A (ko) 얼굴 인식 장치 및 그 제어방법
KR20160066380A (ko) 얼굴 등록 방법 및 장치, 얼굴 인식 방법 및 장치
Hassanat et al. Color-based object segmentation method using artificial neural network
Balasubramanian et al. Real time face and mouth recognition using radial basis function neural networks
Bianco et al. Adaptive skin classification using face and body detection
Ramalingam et al. Robust face recognition using enhanced local binary pattern
JP7302719B2 (ja) 情報処理装置、情報処理方法、および、情報処理プログラム
US10068321B2 (en) Image processing method, image processing apparatus, and recording medium
Boodoo-Jahangeer et al. Face recognition using chain codes
Thanh Do et al. Facial feature extraction using geometric feature and independent component analysis
Türkmen et al. Global feature based female facial beauty decision system
Fathima et al. Person authentication system with quality analysis of multimodal biometrics
Khryashchev et al. Gender and age recognition for video analytics solution
Paul et al. Automatic adaptive facial feature extraction using CDF analysis
Mishra et al. Face detection for video summary using enhancement based fusion strategy
Vrejoiu A Pattern Matching Method and Algorithm for Face Detection
Tomaselli et al. Low complexity smile detection technique for mobile devices
Shaikh et al. Human Face Detection and Facial Expression Identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210311

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220331

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R151 Written notification of patent or utility model registration

Ref document number: 7124912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151