JP4555396B2 - 顔検出装置および顔検出プログラム - Google Patents
顔検出装置および顔検出プログラム Download PDFInfo
- Publication number
- JP4555396B2 JP4555396B2 JP2009514034A JP2009514034A JP4555396B2 JP 4555396 B2 JP4555396 B2 JP 4555396B2 JP 2009514034 A JP2009514034 A JP 2009514034A JP 2009514034 A JP2009514034 A JP 2009514034A JP 4555396 B2 JP4555396 B2 JP 4555396B2
- Authority
- JP
- Japan
- Prior art keywords
- input image
- unit
- filter
- selection unit
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims description 42
- 238000010606 normalization Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 33
- 238000009826 distribution Methods 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
この発明は、顔を含む画像から顔部分を検出する顔検出装置および顔検出機能をコンピュータに実現させる顔検出プログラムに関するものである。
入力画像から顔を検出する際には、Haar特徴を利用したBoostingフィルタを用いる。このフィルタはたとえば眉毛の下は白いというような顔のコントラスト上の特徴をいくつも積み重ねていく方法である。この方法の特徴はフィルタの演算結果が常にDC成分を含まないということである。
一方で、顔を含む画像は撮像条件などによってコントラストがばらつく。このため画像によって顔検出の容易性にばらつきが出る。このばらつきを抑えるために、顔検出の前処理として画像のコントラストの正規化を行う。
一方で、顔を含む画像は撮像条件などによってコントラストがばらつく。このため画像によって顔検出の容易性にばらつきが出る。このばらつきを抑えるために、顔検出の前処理として画像のコントラストの正規化を行う。
従来のコントラスト補正方式は、以下(1)式、(2)式のように局所画像の平均値と標準偏差から画像信号の分散を計算し、分散の程度に応じて各画素の値を補正して顔を検出しやすくするようなコントラストの補正を行っていた(例えば、特許文献1)。
従来のコントラスト補正方式は、画像の二乗平均や分散値による割り算を行わねばならない点、局所部分のすべての画素に対して演算しなければならない点という2つの欠点があり、処理演算が大掛かりになるという問題点があった。
この発明は上記のような問題点を解決するためになされたもので、複雑な演算無しで画像の局所領域のコントラストを正規化することを目的とする。
この発明は上記のような問題点を解決するためになされたもので、複雑な演算無しで画像の局所領域のコントラストを正規化することを目的とする。
この発明による顔検出装置は、検出対象物である顔を含む画像から局所領域を選択する入力画像選択部と、検出用のフィルタを選択して出力するフィルタ選択部と、前記入力画像選択部と前記フィルタ選択部からの出力結果を用い、選択された局所領域の入力画像のフィルタ演算を行うフィルタ演算部と、前記入力画像選択部からの出力を用いて選択された局所領域の入力画像の画素値の分布を調べる正規化部と、前記正規化部から出力された分布情報を元に正規化係数を決定する変換テーブルと、前記フィルタ演算部の出力結果と、前記変換テーブルから出力された正規化係数とを乗算する乗算器と、前記乗算器の演算結果を用いて、入力画像内部に顔が含まれるか否かの判定を行い、検出結果を出力する顔検出部とを備える。
本発明の顔検出装置によれば、正規化部は、入力画像選択部の出力であるデジタル化された画素値の分布を調べるようにしているので、二乗平均や割り算という煩雑な計算を使わなくてもよく、さらに、入力画像信号を正規化するのではなく、フィルタ演算結果に対して正規化係数を乗算して、正規化を行うようにしているので、フィルタの演算結果がDC成分を含まないという特性を利用することで、演算回数を大幅に削減することができる。例えば入力画像が24・24である場合には演算回数を1/576に削減することができる。
実施の形態1.
図1はこの発明の実施の形態1による顔検出装置を示す構成図である。この実施の形態1による顔検出装置8は、入力画像選択部1、フィルタ選択部2、フィルタ演算部3、正規化部4、変換テーブル5、乗算器6、顔検出部7から構成される。
図1において、入力画像選択部1は検出の対象物(ここでは顔)を含む画像(動画でも静止画でもよい)から局所領域(例えば24・24、16・16など)を随時選択して、フィルタ演算部3および正規化部4に対して出力する。
フィルタ選択部2は前述したHaar特徴を利用したBoostingフィルタを入力として受け取り、フィルタ演算部3に対して適切なフィルタを随時選択して出力する。
図1はこの発明の実施の形態1による顔検出装置を示す構成図である。この実施の形態1による顔検出装置8は、入力画像選択部1、フィルタ選択部2、フィルタ演算部3、正規化部4、変換テーブル5、乗算器6、顔検出部7から構成される。
図1において、入力画像選択部1は検出の対象物(ここでは顔)を含む画像(動画でも静止画でもよい)から局所領域(例えば24・24、16・16など)を随時選択して、フィルタ演算部3および正規化部4に対して出力する。
フィルタ選択部2は前述したHaar特徴を利用したBoostingフィルタを入力として受け取り、フィルタ演算部3に対して適切なフィルタを随時選択して出力する。
フィルタ演算部3は入力画像選択部1とフィルタ選択部2からの出力結果を用いてフィルタ演算を行う。フィルタ演算部3の演算結果は、前述したようにBoostingフィルタを用いているのでDC成分を含まないという特性を有する。
正規化部4は、標準偏差を使う代わりに、入力画像選択部1からの出力のデジタル化された画素の輝度値を用いて、大まかな画素値の分布を調べる。
変換テーブル5は、正規化部4から出力された分布の情報(例えば、分布の幅)を元にフィルタ演算部3からの出力結果に対して掛け合わせる正規化係数を決定する。
乗算器6は、フィルタ演算部3の出力結果と、変換テーブル5から出力された正規化係数とを掛け合わせる。この計算は、局所領域の入力画像の全画素に対して行う必要はない。
顔検出部7は、乗算器6の演算結果を用いて、最終的に入力画像内部に顔が含まれるか否かの判定を行い、検出結果を出力する。
正規化部4は、標準偏差を使う代わりに、入力画像選択部1からの出力のデジタル化された画素の輝度値を用いて、大まかな画素値の分布を調べる。
変換テーブル5は、正規化部4から出力された分布の情報(例えば、分布の幅)を元にフィルタ演算部3からの出力結果に対して掛け合わせる正規化係数を決定する。
乗算器6は、フィルタ演算部3の出力結果と、変換テーブル5から出力された正規化係数とを掛け合わせる。この計算は、局所領域の入力画像の全画素に対して行う必要はない。
顔検出部7は、乗算器6の演算結果を用いて、最終的に入力画像内部に顔が含まれるか否かの判定を行い、検出結果を出力する。
また、顔検出装置8の構成要素である、入力画像選択部1、フィルタ選択部2、フィルタ演算部3、正規化部4、変換テーブル5、乗算器6、および顔検出部7は、この発明の趣旨に従う顔検出プログラムをコンピュータに読み込ませてその動作を制御することにより、当該コンピュータ上でソフトウェアとハードウェアが協働した具体的な手段として実現することもできる。このコンピュータには、通信機能を有し、上記顔検出プログラムを実行することができる携帯電話、携帯情報端末、デジタルカメラなども含まれる。
なお、コンピュータ自体の構成及びその基本的な機能については、当業者が当該技術分野の技術常識に基づいて容易に認識できるものであり、この発明の本質に直接関わるものでないので詳細な記載を省略する。
なお、コンピュータ自体の構成及びその基本的な機能については、当業者が当該技術分野の技術常識に基づいて容易に認識できるものであり、この発明の本質に直接関わるものでないので詳細な記載を省略する。
次に動作について説明する。
顔検出装置8は、この装置8が搭載されたシステムのCPU(Central Processing Unit)から検出開始命令を受けることにより動作を開始する。
検出開始命令を受けると、まず、入力画像選択部1は顔検出を行う局所領域を選択し、フィルタ選択部2は、判定の1番目に用いるフィルタを選択する。
次に、フィルタ演算部3により入力画像選択部1からの局所領域入力画像とフィルタ選択部2で選択されたフィルタが演算され、その演算結果を乗算器6に対して出力する。
顔検出装置8は、この装置8が搭載されたシステムのCPU(Central Processing Unit)から検出開始命令を受けることにより動作を開始する。
検出開始命令を受けると、まず、入力画像選択部1は顔検出を行う局所領域を選択し、フィルタ選択部2は、判定の1番目に用いるフィルタを選択する。
次に、フィルタ演算部3により入力画像選択部1からの局所領域入力画像とフィルタ選択部2で選択されたフィルタが演算され、その演算結果を乗算器6に対して出力する。
正規化部4は入力画像のデジタル化された輝度値を用いて、大まかな分布を調べる。ここでは、例としてデジタル化された画素値の上位4ビットだけを使う方式について説明する。ここで、デジタル化された画素値の上位4ビットは(0〜15)の16通りの値をとるので、これらの分布は図2のようになる。1以上の個数を有する要素の幅(W)は容易に求めることが可能で、図2の場合にはW=11となる。ここで、ある閾値(t)以下の値はノイズである可能性があるため、閾値(t)以下の値を除いてから幅を求めてもよい。この場合補正後の幅(W')は図3に示すようにW'=9となる。
変換テーブル5は正規化部4から出力された分布の幅(WまたはW')を用いて、正規化係数を選択する。正規化係数は図4に示すように(16/分布の幅)とするのが望ましい。ただし、除算を不要としたい場合には、元の値にある程度近く、係数の分母が2のべき乗となるような値を選択してもよい。例えば、分布の幅が3である時、正規化係数(16/3)にある程度近く、正規化係数の分母が2のべき乗となるような値(例えば341/64)を選択するようにしてもよい。
次に乗算器6は、フィルタ演算部3の出力結果と、変換テーブル5から出力された正規化係数を掛け合わせる。ここで、変換テーブル5は出力する正規化係数の分母が2のべき乗となるような値を選択しておけば、計算は、整数の乗算とビットシフトのみで実現できるため、ソフトウェアや回路の構成を簡略化することができる。
また実際には、乗算のタイミングが一致するようにフィルタ演算部3での演算処理と、正規化部4および変換テーブル5による正規化係数算出処理とが同一のサイクル数で処理できるようにしておくのが都合がよい。
また実際には、乗算のタイミングが一致するようにフィルタ演算部3での演算処理と、正規化部4および変換テーブル5による正規化係数算出処理とが同一のサイクル数で処理できるようにしておくのが都合がよい。
最後に顔検出部7は、乗算器6からの出力結果の値とあらかじめ定められた閾値との比較を行い、入力画像1に顔が含まれるか否かを判定する。
次に、顔検出処理の詳細について説明する。
図5は、実施の形態1による顔検出処理の流れを示すフローチャートであり、この図に沿って説明する。
最初に入力画像選択部1とフィルタ選択部2で適切な入力画像とフィルタを選択する(ステップST1)。
次に、フィルタ演算部3はフィルタ選択部2で選択されたフィルタを用いて、入力画像選択部1で選択された局所入力画像を演算する。また、正規化部4は、入力画像選択部1からのデジタル化された輝度値を用いて、大まかな分布を調べ、この分布の情報(例えば、分布の幅)を元に変換テーブル5が正規化係数を決定する。
次いで、乗算部6が、フィルタ演算部3のフィルタ演算結果と、変換テーブル5で選択された正規化の係数とを乗算する(ステップST2)。
次に、顔検出部7は、乗算器6からの出力結果の値とあらかじめ定められた閾値との比較を行う(ステップST3)。
図5は、実施の形態1による顔検出処理の流れを示すフローチャートであり、この図に沿って説明する。
最初に入力画像選択部1とフィルタ選択部2で適切な入力画像とフィルタを選択する(ステップST1)。
次に、フィルタ演算部3はフィルタ選択部2で選択されたフィルタを用いて、入力画像選択部1で選択された局所入力画像を演算する。また、正規化部4は、入力画像選択部1からのデジタル化された輝度値を用いて、大まかな分布を調べ、この分布の情報(例えば、分布の幅)を元に変換テーブル5が正規化係数を決定する。
次いで、乗算部6が、フィルタ演算部3のフィルタ演算結果と、変換テーブル5で選択された正規化の係数とを乗算する(ステップST2)。
次に、顔検出部7は、乗算器6からの出力結果の値とあらかじめ定められた閾値との比較を行う(ステップST3)。
比較の結果、入力画像の中に顔があるか否かを判定できた場合には(ステップST4)、検出結果を保存した後(ステップST6)、入力画像が最終画像であるか否かを判定して(ステップST7)最終画像であれば検出処理を終了する。
最終画像でなければ、入力画像とフィルタを変更して(ステップST1)、同様の処理を繰り返す。
最終画像でなければ、入力画像とフィルタを変更して(ステップST1)、同様の処理を繰り返す。
一方、ステップST4における判定の結果、入力画像1の中に顔があるか否かさらに判定が必要である場合には、フィルタ選択部2でフィルタを次の段階に変更した後(ステップST5)、ステップST2に戻り、同様の処理を続ける。この時入力画像は直前の判定時から変わらないため、変換テーブル5は直前と同じ正規化係数値を出力すればよい。
以上のように、この発明の実施の形態1では標準偏差を使う代わりに、デジタル化された画素値の上位4ビットだけを使って、大まかな分布を調べるようにしているので、これによって二乗平均や割り算という煩雑な計算をなくすことができる。
さらに、画像信号を正規化することをやめ、フィルタ演算結果に対して正規化を行うようにしているので、例えば入力画像が24・24である場合には演算回数を1/576に削減することができる。これは、フィルタの演算結果がDC成分を含まないという特性を利用したものである。
さらに、画像信号を正規化することをやめ、フィルタ演算結果に対して正規化を行うようにしているので、例えば入力画像が24・24である場合には演算回数を1/576に削減することができる。これは、フィルタの演算結果がDC成分を含まないという特性を利用したものである。
この発明に係る顔検出装置は、デジタルカメラやデジタルビデオカメラ等に適用され、例えば、デジタルカメラによって撮影されたスナップ写真における人物の顔領域の色分布を調べてその肌色を補正したり、監視システムのデジタルビデオカメラで撮影されたデジタル映像中の人物の顔領域を検出し、人物を認識したりするのに用いられる。
Claims (4)
- 検出対象物である顔を含む画像から所定の局所領域を選択する入力画像選択部と、
検出用のフィルタを選択して出力するフィルタ選択部と、
前記入力画像選択部と前記フィルタ選択部からの出力結果を用い、選択された局所領域の入力画像のフィルタ演算を行うフィルタ演算部と、
前記入力画像選択部からの出力を用いて選択された局所領域の入力画像の画素値の分布を調べる正規化部と、
前記正規化部から出力された分布情報を元に正規化係数を決定する変換テーブルと、
前記フィルタ演算部の出力結果と、前記変換テーブルから出力された正規化係数とを乗算する乗算器と、
前記乗算器の演算結果を用いて、入力画像内部に顔が含まれるか否かの判定を行い、検出結果を出力する顔検出部とを備えた顔検出装置。 - 正規化部は、入力された局所領域のデジタル化画像の画素値上位所定数のビットだけを用いて、大まかな分布を調べる構成にしたことを特徴とする請求項1記載の顔検出装置。
- 変換テーブルは、正規化係数を所定の算式により求められた値に近く分母が2のべき乗となるような値を選択する構成にされたことを特徴とする請求項1または請求項2記載の顔検出装置。
- 検出対象物である顔を含む画像から局所領域を選択する入力画像選択部と、
検出用のフィルタを選択して出力するフィルタ選択部と、
前記入力画像選択部と前記フィルタ選択部からの出力結果を用い、選択された局所領域の入力画像のフィルタ演算を行うフィルタ演算部と、
前記入力画像選択部からの出力を用いて選択された局所領域の入力画像の画素値の分布を調べる正規化部と、
前記正規化部から出力された分布情報を元に正規化係数を決定する変換テーブルと、
前記フィルタ演算部の出力結果と、前記変換テーブルから出力された正規化係数とを乗算する乗算器と、
前記乗算器の演算結果を用いて、入力画像内部に顔が含まれるか否かの判定を行い、検出結果を出力する顔検出部としてコンピュータを機能させる顔検出プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007124722 | 2007-05-09 | ||
JP2007124722 | 2007-05-09 | ||
PCT/JP2008/055263 WO2008139781A1 (ja) | 2007-05-09 | 2008-03-21 | 顔検出装置および顔検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008139781A1 JPWO2008139781A1 (ja) | 2010-07-29 |
JP4555396B2 true JP4555396B2 (ja) | 2010-09-29 |
Family
ID=40002004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009514034A Expired - Fee Related JP4555396B2 (ja) | 2007-05-09 | 2008-03-21 | 顔検出装置および顔検出プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4555396B2 (ja) |
WO (1) | WO2008139781A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
JP2006309714A (ja) * | 2005-03-31 | 2006-11-09 | Fuji Photo Film Co Ltd | 顔判別方法および装置並びにプログラム |
-
2008
- 2008-03-21 JP JP2009514034A patent/JP4555396B2/ja not_active Expired - Fee Related
- 2008-03-21 WO PCT/JP2008/055263 patent/WO2008139781A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
JP2006309714A (ja) * | 2005-03-31 | 2006-11-09 | Fuji Photo Film Co Ltd | 顔判別方法および装置並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008139781A1 (ja) | 2008-11-20 |
JPWO2008139781A1 (ja) | 2010-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8150188B2 (en) | Imaging apparatus | |
KR101858646B1 (ko) | 영상 융합 장치 및 방법 | |
US20140023247A1 (en) | Image transmission device, image transmission method, image transmission program, image recognition and authentication system, and image reception device | |
EP3308702A1 (en) | Pulse estimation device, pulse estimation system, and pulse estimation method | |
WO2018233637A1 (zh) | 视频处理方法、装置、电子设备及存储介质 | |
WO2006116744A1 (en) | Method and apparatus for incorporating iris color in red-eye correction | |
US10810401B2 (en) | Fingerprint sensing device and fingerprint sensing method | |
US7929794B2 (en) | Method and apparatus for image data compression | |
CN104902143A (zh) | 一种基于分辨率的图像去噪方法及装置 | |
US7817852B2 (en) | Color noise reduction image processing apparatus | |
US10373329B2 (en) | Information processing apparatus, information processing method and storage medium for determining an image to be subjected to a character recognition processing | |
JP4555396B2 (ja) | 顔検出装置および顔検出プログラム | |
JP6653459B2 (ja) | 画像処理装置及びこれを備えた脈拍推定システムならびに画像処理方法 | |
JP4534750B2 (ja) | 画像処理装置および画像処理プログラム | |
US20110279649A1 (en) | Digital photographing apparatus, method of controlling the same, and computer-readable storage medium | |
CN111062272A (zh) | 基于色彩恢复的图像处理、行人识别方法、装置与可读存储介质 | |
CN113487562B (zh) | 一种基于手持设备的皮肤光泽度检测系统 | |
US8797419B2 (en) | Image processing apparatus and image processing method | |
US8922678B2 (en) | Electronic apparatus, image capturing apparatus, and method thereof | |
JP5115297B2 (ja) | 画像処理装置、撮像装置、画像処理方法およびプログラム | |
JP2012191265A (ja) | 画像処理装置およびプログラム | |
US8004569B2 (en) | Method and apparatus for obtaining still image frame with anti-vibration clearness for image processing device | |
JP5146223B2 (ja) | プログラム、カメラ、画像処理装置および画像の輪郭抽出方法 | |
JP6514577B2 (ja) | 画像処理装置および画像処理方法ならびに撮像装置 | |
JP4720339B2 (ja) | 画像処理装置、画像処理プログラム、および電子カメラ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100706 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100715 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130723 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |