JP4006276B2 - 画像認識方法、画像認識装置及びコンピュータプログラム - Google Patents
画像認識方法、画像認識装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP4006276B2 JP4006276B2 JP2002193620A JP2002193620A JP4006276B2 JP 4006276 B2 JP4006276 B2 JP 4006276B2 JP 2002193620 A JP2002193620 A JP 2002193620A JP 2002193620 A JP2002193620 A JP 2002193620A JP 4006276 B2 JP4006276 B2 JP 4006276B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- detected
- partial
- chromaticity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は画像認識方法、画像認識装置及びコンピュータプログラムに係わり、特に、圧縮された画像データ形式であるJpegファイル画像を認識するために用いて好適なものである。
【0002】
【従来の技術】
デジタルカメラなどで撮影したJpegファイル画像を、PCプリンタもしくはダイレクトプリンタなどから印刷を行う場合や、DPEでプリントを行う場合がある。この時に、撮影画像データが良質な場合は忠実にプリントすればよいので問題は生じない。
【0003】
しかしながら、撮影画像データによっては色被り、コントラスト不足、露出の不適切などがあり、良質な印刷結果を得るためには画像補正を施す必要がある。特に、人物を撮影した画像の場合には、一般に、人の顔の色が適正になるようにプリントすると写真を見た人に与える感じが良くなり、写真の質を高めることになる。
【0004】
銀塩写真の場合、質の良い写真を得るためには原画像ごとに焼き付け時の露光量を変更することが好ましく、この焼付け時の露光量を決めるのに、人物が入った写真の場合には、人の顔の色に着目するのが便利である。何故ならば、人の顔は肌色であることが分かっているために、焼き付けられた写真における人の顔の色が肌色になるように露光量を決めることが可能であるからである。
【0005】
また、デジタルデータの画像ファイルから画像認識する方法としては、例えば“特開平8-161497号”、“特開2000-48036”、“特開平11-238067号”などが知られている。
【0006】
これらの方法は、指定画像との類似度や一致度を検出するもので、“特開平8-161497号”の場合は、直流成分によるブロック単位での粗一致を求め、その後、候補画像領域に対して復元処理を行い、非圧縮データとして微一致を求める方式である。
【0007】
また、“特開2000-48036”の場合は、検索データを入力作成し、このデータと複数の画像データの類似度を判定する画像処理装置である。さらに、“特開平11-238067号”の場合は、検索対象画像をウェーブレット変換して圧縮画像を作成する。また、指定された画像にもウェーブレット変換を施し、各々の特徴データを比較することで、類似度を判定するようにしている。
【0008】
また、デジタルカメラで撮影した画像をプリントする際に、アプリケーションやプリンタドライバのアプリケーションにより、撮影データをヒストグラムなどで解析し、コントラスト、ホワイトバランス、露出補正、シャープネスなど画像補正を一様に施すものが知られている。
【0009】
【発明が解決しようとする課題】
デジタルカメラなどで撮影したJpegファイル画像をプリントする場合に、銀塩写真のプリントのように、人物などの注目画像が、より良くプリントできるように必要に応じて補正を行えるように、Jpegファイル画像の中に注目画像を見つけ出す方法を決める必要がある。
【0010】
また、デジタルカメラからプリンタへ直接プリントを行うダイレクトプリントなどデータ処理能力の低い機器でも使用できるように、検出処理はできうるだけ軽く済む方法が求められている。
本発明は上述の問題点にかんがみ、画像ファイルの中の注目画像を処理負荷の少ない方法で検出できるようにすることを目的とする。
【0011】
【課題を解決するための手段】
本発明の画像認識方法は、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する画像認識方法であって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出工程と、上記データ抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定工程とを有し、前記判定工程において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定されることを特徴とする。
【0012】
本発明の画像認識装置は、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する画像認識装置であって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出手段と、上記データ抽出手段によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定手段とを有し、前記判定手段において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定されることを特徴とする。
【0013】
本発明のコンピュータプログラムは、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する工程をコンピュータに実行させるコンピュータプログラムであって、上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出工程と、上記データ抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定工程とを有し、前記判定工程において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定される工程をコンピュータに実行させることを特徴とする。
【0015】
【発明の実施の形態】
次に、添付図面を参照しながら本発明の画像認識方法、画像認識装置、コンピュータプログラム及びコンピュータ読み取り可能な記録媒体の実施の形態を説明する。最初に、一般的なデジタルカメラのデータ圧縮記録形式であるJpegファイル形式の画像データを印刷する際に、非圧縮データへ復元する前に、ブロック(8*8画素)ごとに輝度、色度ベースのDCT(離散コサイン変換)されたデータも取得し、注目画像検索のために利用する。このようにすることで、高度な計算をすることなく画像データブロックごとの交流成分情報等を取得して利用可能となる。
【0016】
「第1の実施の形態」
最初に、現在、最も一般的な画像圧縮ファイルの“Jpegファイル”の情報省略と符号化・復号化について説明する。
【0017】
まず、符号化であるが、通常、デジタルカメラやデジタルビデオなどでは、静止画をJpeg ファイルにて保存することが一般的になっている。この場合、入力機器の受光素子であるCCDなどの入った信号をA/D変換した後、フレームメモリーに取り込み、RGBもしくはCMYフィルタの情報を輝度と色度情報とに変換する。その後、8*8(64個)正方画素ブロックに分割する。
【0018】
図3の▲1▼は、輝度データのビットマップを8*8ブロックに分割したうちの1ブロックのデータ例を示している。また、図3の▲2▼においては、0〜255の画素値をレベルシフトして−128〜127の信号に変換する例を示している。さらに、図3の▲3▼においては、DCT(離散コサイン変換)によりDCT係数を求める例を示している。
【0019】
また、図3の▲4▼は、視覚特性を考慮した高周波成分の省略を大きくした量子化テーブルであり、このテーブルを用いて、上記図3の▲3▼の結果であるDCT係数に対して量子化する例を示している。
【0020】
図3の▲5▼は、量子化を行った結果である。この値をエントロピー符号化してハフマン符号で表すことにより符号化信号である圧縮データを生成する。
【0021】
次に、復号化においては、上述した符号化の逆の工程を行う。つまり、符号化信号を復号して、量子化DCT係数の値を復号する。次に、逆量子化を行うために量子化テーブルを乗ずることでDCT係数を得る。その後、逆DCTを行うことでレベルシフトした画像が復元され、更に逆レベルシフトの値128を加算することで1ブロックの画像が復号される。
【0022】
上記の説明では、輝度情報と色度情報とに分割したデータを合成してRGB画像に変換することを省略したが、符号化における流れとしては、図2に示すように、カラー画像を輝度成分(Y)と2つの色度成分(Cb、Cr)とに変換し、その各々を符号化して合成することで、圧縮画像データを生成している。
【0023】
以上のような、圧縮された画像データファイルであるJpeg画像をプリントする方法としては、入力機器からの圧縮画像データをUSBや記憶メディアによって、パーソナルコンピュータ(以下、PCとする)に取り込んで画像を展開し、必要に応じて画像補正を加えた後プリンタへデータを送る場合や、入力機器からの画像データを直接プリンタへ入力し、プリンタの中で、画像を解凍し、必要に応じて画像補正を加えた後で印刷を行うなど、幾種類かの選択肢がある。
【0024】
いずれにしても、良好な画像をプリントするためには、撮影画像データが良質な撮影画像であるか、あるいは補正が必要な画像であるのかを判断して、忠実に印刷すべき良質な画像と、補正を行うことにより良質な画像に近付けた後に印刷を行うもとをより分ける必要がある。
【0025】
良好な画像とは、下記のようなことが考えられる。
1)ホワイトバランスが良好である。
2)コントラストが適切である。
3)必要な部分の階調が割り当てられている。つまり、露出設定が良好である。
4)彩度が適正である。
5)銀塩写真のような仕上がりである。
6)人物など注目される画像が中心に補正されている。
【0026】
現在市販のPCプリンタやPCを経由しないダイレクトプリンタなどにおいても上記1)〜5)の項目においては、程度の差も有るが行われている。また、上記6)の注目画像に対する補正が行われていないのは、その検出に多大な処理が必要であることと、その方法が確立されていないことによる。
【0027】
特に、処理能力のひ弱なダイレクトプリンタなどにおいては実施が難しいとされているが、本発明はこれを解決するものである。その手段としては、Jpeg画像ファイルに注目画像の存在の検出と、その検出した画像に対する補正の必要等の確認を経て、全体画像補正へ受け渡す方法となる。
【0028】
図1は、Jpeg ファイルを解凍する過程とその際に取得する情報について表したブロック図である。
Jpeg ファイルをRGBのビットマップデータへ変換する過程においては、まず、符号テーブル2を用いてエントロピー復号化手段1にてエントロピー復号を行う。次に、逆量子化手段3において、逆量子化に使用する量子化テーブル4を、逆量子化を行う他にデータとして記憶する。
【0029】
この逆量子化されたデータは、ブロック単位のデータとして周波数変換されたものであり、このデータを、画像周波数特性を得るためのデータとして取得する。その後、逆DCT手段5において、逆DCT処理と逆レベルシフトとを行いYcc−RGB変換することで、通常のRGBビットマップデータに展開する。
【0030】
次に、この画像において、最も重要と思われる注目画像検出である人物検出のフローチャートを図6に示す。
最初のステップS601において、8*8画素のブロック単位のDCTデータを取得すると同時に、画像ファイルはRGBビットマップデータに展開する。
次に、ステップS602に進んで、RGBビットマップデータにおいて、8*8画素のブロック単位に注目画像である人の肌色の色度に対応するか検索を行う。
【0031】
この場合、検索範囲は全画面を行っても良いが、本実施の形態においては、注目画像が画像の端部に配置されているとは考えずらいので、画像端部より数ブロック分の領域は色度検索の対象から外して検索を行う。
【0032】
色度の検索方法としては、複数の方法がある。知られているものとしては、
1)B(青)/G(緑)の比率が0.7〜0.8の範囲に収まり、R(赤)/G(緑)の比率が1.4〜1.8の範囲に収まる色度を持つもの。
2)図5の概念図に示すように、肌色を確率楕円にて表すことができる。求める式としては下記の式(1)〜式(3)になる。
【0033】
【数1】
【0034】
本実施の形態においては、処理の簡便さを考慮に入れた下記式(4)である色度分布範囲を肌色の色度範囲とした。この範囲を表したのが図20である。
【0035】
【数2】
【0036】
本実施の形態においては、画像における周波数成分の特徴を検出する単位として8*8画素単位のブロックで行っている関係で、構造的論理的な簡単さより色度判定においても8*8画素単位にて実行する。
【0037】
図7は、本実施の形態で用いている色度検出ポイントを図示したものである。これによると「8*8画素」単位のブロックの四隅の色度の全てが色度範囲に入っているか否かを確認し、全てが範囲に入っている時は、そのブロックを適合色度と判定している。
【0038】
図7においては、上段の左から2番目と下段の左から1,2,3ブロックが該当する。上段の一番左のブロックは4ポイントのうち左上の式度は非肌色ピクセルと判定されるので、これを含むブロックは肌色の範囲外と判定される。同じように上段の右側1,2ブロックと下段の一番右のブロックが範囲外となる。
【0039】
図8は、「8*8画素」単位のブロック全体の平均色度による判定である。このブロック内の平均色度の求め方としては、8*8ブロック全ての画素値の平均値を取る方法の他に、解凍中の逆DCTを行う前の色度データ(Cb,Cr)の中のDC成分から求めることも可能である。この方式の利点としては、ブロック全体の色調にて判定できるので、検出点の少ないものに比べて精度が高い期待ができる。ここで、自然画における色度のみの検出についての内容を見ることにする。
【0040】
図9は、図7と同じ考えの中ではあるが、全体画像における検出間隔を等分化するためのものである。
【0041】
図10は、一般的なポートレート写真であり、図14は人物の肌色色度と同様な色度範囲を有する枯木の林の写真である。図10と図14に対して、それぞれの画素に色度の適合だけで検出を行った結果を図11と図15に示す。
【0042】
図11のポートレートでの検出結果としては人物の肌色部分をよく検出しているが、その他に柵や背景の中で、ごみのような細かい部分においても適合色度を満たすものが検出されていることがわかる。このため、色度のみでは注目画像を特定できないことがわかる。
【0043】
図14においては、人物の肌色を検出する目的にもかかわらず同じ色度を持つ枯れ木の林が全面検出されている。このように、画素レベルでの色度判定を行った場合、注目画像を特定することは不可能である。
【0044】
検出をブロックレベルにすることにより、特定のまとまりを持った状態が対象になるので、外来ノイズの影響は受けずらくなる。しかしながら、8*8画素のブロックが適正なまとまりの大きさとは言えず、色度によるブロック検出においても縦方向及び横方向に隣接したブロックの連続検出という、制約を付けた検出を行うことで更に精度を上げることになる。
【0045】
ここにおいて、人の肌色であってもプリントにおいて顔を認識できるデータ量を満たさないものにおいても適応外としてはじいても良いと言う概念でノイズと判定する連続範囲を設定する。
【0046】
この部分を表したのが、図6のステップS603以降の処理である。すなわち、ステップS603においては、画像に対して長手方向にブロックごとに色度検出を行い、連続検出ブロック数の多い順に候補を策定する。
【0047】
次に、ステップS604において、その連続量が、注目画像としての適応する連続量に入っているか否かを比較する。この比較の結果、該当する連続ブロックがある場合はステップS605に進み、短い方向のブロック連続検出設定を満たすデータが画像に存在するか否かを検索を行う。
【0048】
次に、ステップS606において、検出データが有るか否かを判断し、検出データが有る場合にはステップS608に進んで、この過程で残ったものの中から長手方向の連続ブロック量が大きいデータから順に候補番号を付ける。
【0049】
また、ステップS606の判断の結果、検出データが無い場合にはステップS607に進み、「目的領域無し」をセットして処理を終了する。
【0050】
ここで、話は少し戻るが、連続ブロックにて色度判定を施した場合の効果については、図12と図16で示す。
図12においては、図10のポートレート画像に対して検出を行った結果である。図12において、検出候補の優先順位が高い方からカラーコード(1=茶、2=赤、3=橙、4=黄、5=緑、6=青、7=紫、8=灰)順に配置され、それ以外で検出されているのは色度のみ適性範囲に入っているものである。連続ブロック検出により画素レベルの色度検出と比べるとかなりの背景などの非該当候補を削除できていることが判る。
【0051】
図16においては、図14の枯木の林に対して検出を行った結果で、連続ブロック検出においても注目画像以外を検出してしまうことがわかる。
【0052】
次に、VGA(video graphics array)サイズ(640*480画素)の複数の画像サンプルを用いて人物肌と枯れ木の林の部分において、検出された適合色度連続ブロックにおける周波数特性を算出した。
【0053】
図18は、画像内に撮影されている人物肌の連続ブロック検出されたブロックのDCTデータを周波数の低い順に並べたものを、周波数の低い方から10個単位で加算し、連続ブロック数で除したもので、連続検出されたブロックの1個あたりの平均周波数成分をまとめたものである。
【0054】
したがって、図面において横軸は、AC成分63個の周波数成分をまとめたもので、10個単位のまとまりが6グループと最も周波数の高いデータは3個分のデータとなる。縦軸は、各周波数成分の要素を加算した値である。
【0055】
これにより、値が大きいほどそのブロックにおいて、該当周波数成分が高いことがわかる。また、検出した連続ブロック数ごとに色分けしたデータ線で表されている。例えば“B2"は連続ブロックが2個検出されているデータの平均した値を表し、“B15"は連続ブロックが15個検出されているデータの平均した値を表している。以下同じで、“B2〜B15”までの複数画像からの平均的な人物肌色部分の連続検出値ごとの空間周波数特性を表している。
【0056】
検出結果を見ると、
1)低い周波数成分の値が大きく低い周波数成分の下から3グループ以降は、連続ブロック数に係わり無く50以下となっている。
2)連続ブロックの連続値が大きいほど周波数特性が低くなっている。
【0057】
これらの結果から言えることは、人物の肌色部分の周波数特性は比較的低い周波数で構成されていることと、検出された連続ブロックの値が大きいことは、被写体の撮影された大きさが大きいことを示していて、この連続ブロックとしての平均値を出すことによって周波数成分が下がっていることがわかる。
【0058】
連続ブロックの連続値により、同じ注目画像の色度を持っているものでも、その連続ブロックを1つの代表値にすること(例えば、B6のブロックの時は検出した6個のブロックの値を、各々周波数の低い順に10個単位のグループとして加算したものをグループごとに加算した後、その連続値である6で除して平均を出している。)により、空間周波数特性の値が変わるので、連続検出値により適当な該当周波数特性が違うことが判る。
【0059】
図19は、人物の肌色色度と同様な色度範囲を有する枯木の林の写真を複数用意して、検出を行った結果を図18と同じように表したものである。
【0060】
検出結果を見ると、
1)人物の肌の空間周波数特性と比べると高い周波数成分にデータ多くあることが確認できる。
2)一番低い周波数成分のグループは人物の肌の結果と大きくは違わない。
【0061】
これらのことから、連続ブロックにおける周波数成分を検出することで、同じ色度を持った検出物体を周波数特性により区別することが可能であることがわかる。
【0062】
図4は、本実施の形態において使用したもので、注目画像である人物肌の空間周波数特性を表したものである。上の段がVGA(640*480)画像における周波数特性の適正範囲である。
【0063】
連続ブロック値を2〜8個のグループ(〜L8)と9〜20個のグループ(L9〜20)と21個以上のグループ(L21〜)の3グループにまとめて、グループごとに周波数の適正範囲を設定したものである。周波数の適正範囲も先に示した10個単位の7グループによる周波数特性を用いた。これは、処理の簡略化と検出精度のバランスで行ったもので、これに縛られる必要は無い。
【0064】
図6の説明に戻る。上述したように、色度により検出された長手方向の連続量が大きいデータから順に注目画像の候補番号1〜n(本実施の形態においてはn=8)を付ける(ステップS608)。n以降の検出したものについては候補番号を付けられない。
【0065】
次に、ステップS609に進み、上記候補1〜nに対して、図4で示した連続ブロック数に対する空間周波数特性適正範囲判定表の範囲に適合するか逐次比較する。この結果、適合する候補が存在しない場合は注目画像が存在しないと判断する。
【0066】
また、適合する候補が存在する場合においては、以下に説明を行う。
図22に、そのフローチャートを示す。
最初のステップS2201において、候補の数を確認する(1〜m)。
次に、ステップS2202に進み、候補グループを形成する。この場合、候補に隣接する色度適合ブロックを候補グループとする。
【0067】
次に、ステップS2203に進み、候補グループが複数であるか否かをを判断する。この判断の結果、候補グループの中に複数の候補が含まれた場合は、ステップS2204に進み、候補番号の若い方の番号を用いたグループとする。
【0068】
そして、検出された各グループに対して、どちらのグループが補正対象となる注目画像としての重みが大きいかを判断するために、グループ内の確からしさをポイント換算で、比較を行い、よりポイントが高いグループが最終注目画像と設定される。
【0069】
ポイントの方法としては、候補が“m”個存在する場合、候補1のポイントは“m”。候補2のポイントは“m−1”以下同様に候補mのポイントは“1”となる。
【0070】
このようにして、候補グループ間の優位性を判断した結果の実例を図23に示す。検出した候補グループは2グループあり、そのうち右のグループのポイントが左の候補グループのポイントを上回ったので、最終候補となっている。
【0071】
また、ポイント数の絶対値は、対象となる候補グループの注目画像としての信頼度を表しているので、このポイントにより注目画像に対する補正強度を決定する。補正強度決定方法としては、ポイントによる閾値を設け、閾値の上下関係で強度の指定を行う。
【0072】
先の、図10と図14に対する結果を図13と図17に示す。
図13においては、注目画像である人物の顔の肌を検出している。また、図17においては、各候補が周波数特性に適合せず候補部分が黒塗りの状態で表している。これは、注目画像が検出されなかった状態を表し、注目画像に重みを置いた画像補正の対象にならないことを示し意している。
【0073】
こうして注目画像を検出することができる。通常の画像補正は、画像全体のバランスに亘って補正が行われるので、逆光などで本来注目したい画像の画質を落としてしまう場合が存在しているが、本実施の形態による注目画像検出により、補正項目として輝度の最適化のための露出、及び好ましい肌色のための色バランスや彩度補正を注目画像のデータを基に補正を行うことで、より高品質な画像を得ることができる。
【0074】
図24に、一般画像補正を行った結果と、本実施の形態の注目画像検出を利用して画像補正を行った結果の一例を示す。図24に示したように、本実施の形態の注目画像検出を利用して画像補正を行った場合は、人物などの注目画像をより良くプリントすることができる。
【0075】
本実施の形態においては、プリントのための最適画像処理用に注目画像を検出する方法を示しているが、表示用などにも使用できることは言うまでも無い。
【0076】
また、本実施の形態においては、検出画像の周波数成分特性を見るために周波数情報を10個単位で加算して周波数成分の63個を7グループとして、画像の特性を判断したが、グループ化という発想をなくし、63個全ての周波数をそのまま利用しても良いことは言うまでも無い。
【0077】
更に、画像の長手方向からの連続量の検出後短い方向の検出を行ったが、この順序も逆になっても可能であり、この他、検出ブロックを一列のグループとして検出する方法以外にも色度で検出したグループにおける全ての方向に隣接したブロックグループという、とらえ方で空間周波数特性を確認する方法など、色度と周波数特性を組み合わせた検出方法はいくらでもあり、これら一連の検出方法は本発明に含まれることは言うまでも無い。
【0078】
本実施の形態においては、図4のように、連続検出値を3グループに分け周波数特性の適正範囲との比較を行い周波数特性の合否を判定したが、連続検出を3グループ化したのは、実施形態を簡単化するためで、連続値ごとに適正範囲を設定しても良いし、連続値には相関関係が有るので、テーブル方式ではなく理論式による方法を用いても良い。また、周波数特性も7グループ値を使用したが、63個の周波数のすべてにて行っても良いし、更には特定の周波数に注目して判定しても良い。
【0079】
本実施の形態においては、検出の目的になっている注目画像は人物の肌の領域に設定して説明しているが、周波数成分、もしくは周波数成分と色度により検出可能なものは、人物の肌色に限らず、空、海、木々の緑なども存在する。
【0080】
本実施の形態においては、8*8ブロック単位データの周波数成分を周波数の低い順から10個単位でまとめた値を用いて、その10個の和によるグループ(最も高い周波数グループは3個の和)の特性から周波数特性を代表させているが、Jpeg ファイルの場合、DC成分1個に対し、AC成分63個の構成で、周波数特性を表しているので、10個の集合体として特性を見なくても良い。
【0081】
また、63個の個々の特性より判断しても良いし、もっとグループ化しても良い。また、特定の周波数成分のみの利用により特性を導き出しても良い。このように、周波数特性を利用した特性を導くのにAC成分の利用方法はいくらでもある。
【0082】
更に、本実施の形態では8*8ブロックの連結と言う概念で縦方向と横方向について注目画像を検出するために色度該当ブロックの連続性において、候補を抽出しているが、この時のブロック集合体の判定方法も、この方法に限られてものではないことは言うまでも無い。
【0083】
本実施の形態では連続検出した色度ブロックに対して検出した連続値により、端のブロックを削除した値を特性利用しているが、周波数成分による適合から色度ブロックの境界を設定したり(図21)、予め特定以上の周波数特性のあるブロックを、色度検索を行う前に除外してから行うようにしたりなど、ブロックの集合体を決定するための色度と周波数成分による分離の仕方は、複数の方法と組み合わせがあるが、本願特許の範囲に包含される。
【0084】
上記図21について説明する。図21の左側は元画像であり、このJpeg ファイル画像の圧縮単位である8*8画素ブロックの周波成分における高周波成分の総データ値が閾値を超えるか超えないかで判定したのが右側の画像になる。明るい部分が高周波成分を持つ領域で、暗い部分が高周波成分の少ない領域である。この領域を境に設けた色度判定による注目画像検出も可能である。
【0085】
また、本実施の形態は、画像圧縮ファイルとして、“Jpegファイル”を利用した方法を開示したが、“Jpeg2000 file“など、周波数成分への変換を利用した他のファイルに対しても同様な考え方で、注目画像の検出を簡単な処理で実現できることは、言うまでもない。
【0086】
(本発明の他の実施の形態)
なお、以上に説明した本実施形態の画像認識装置は、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。
【0087】
したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フレキシブルディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0088】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0089】
また、本発明をネットワーク環境で利用するべく、全部あるいは一部のプログラムが他のコンピュータで実行されるようになっていても良い。例えば、画面入力処理は、遠隔端末コンピュータで行われ、各種判断、ログ記録等は他のセンターコンピュータ等で行われるようにしても良い。
【0090】
【発明の効果】
上述したように、本発明によれば、複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出し、上記抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する際に、前記連続ブロック数に応じた空間周波数特性適正範囲が設定されるようにしたので、高度な計算をすることなく画像データブロックごとの交流成分情報を含む情報を取得して、画像ファイルの中の注目画像を検索するために利用することができる。これにより、処理負荷の少ない方法で注目画像を検出することができる。
【0091】
また、本発明のその他の特徴によれば、デジタルカメラから直接プリントする場合などのように、パーソナルコンピュータと比べ処理能力が低い組み込み式の機器においても製品として使用可能な範囲の処理で、印刷する圧縮画像ファイルに補正の対象となる注目画像の有無及びその値の適正度を検出することができ、必要に応じて注目画像を重視した画像補正を施すことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係わるJpeg画像解凍時に必要なデータを取得する流れを示す概念図である。
【図2】実施の形態の画像データをJpeg形式へ変換する処理過程の流れを示す概念図である。
【図3】実施の形態のJpegの画像圧縮単位である8*8ブロックを例にしたJpeg形式へ変換する処理過程を示す図である。
【図4】実施の形態のJpegファイル画像圧縮単位である8*8ブロックのAC成分特性を利用した判別テーブルを示す図である。
【図5】実施の形態の他にある肌色のRG色度分布例を示す図である。
【図6】実施の形態のJpeg画像解凍からの注目画像検出フローチャートである。
【図7】実施の形態のJpegファイル画像圧縮単位である8*8ブロックにおける、色度検出方法を示す図である。
【図8】実施の形態のJpegファイル画像圧縮単位である8*8ブロックでのDC成分を利用した色度検出方法を示す図である。
【図9】実施の形態の色度検出において、3ビット間引きを利用して検出をした場合の8*8ブロックにおける検出状況を示す図である。
【図10】実施の形態の検出用Jpeg画像サンプルの第1の例を示す図である。
【図11】第1の画像サンプルを色度のみによる検出を行った結果のBMP ファイルの一例を示す図である。
【図12】第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続Block検出を行った結果のBMP ファイルの一例を示す図である。
【図13】実施の形態の注目画像検出により、第1の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMPファイルの一例を示す図である。
【図14】実施の形態の検出用Jpeg画像サンプルの第2の例を示す図である。
【図15】第2の画像サンプルを色度のみによる検出を行った結果のBMPファイルの一例を示す図である。
【図16】第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続Block検出を行った結果のBMP ファイルの一例を示す図である。
【図17】実施の形態の注目画像検出により、第2の画像サンプルを8*8ブロック単位の色度検出を元に配置と連続ブロックとAC成分による検出を行った結果のBMP ファイルの一例を示す図である。
【図18】実施の形態の人物肌検出において、人物肌検出データの連続色度検出値におけるAC成分の周波数特性を示す図である。
【図19】実施の形態の人物肌検出において、枯れ林の検出データの連続色度検出値におけるAC成分の周波数特性の表を示す図である。
【図20】実施の形態の肌色のRG色度分布を示す図である。
【図21】周波数特性による境界作成のための検出方法の一例を示す図である。
【図22】実施の形態の候補グループの判定手順を示すフローチャートである。
【図23】実施の形態の候補グループ判定の検出結果画像の一例を示す図である。
【図24】実施の形態の注目画像検出を利用した画像補正の比較結果の一例を示す図である。
【符号の説明】
1 エントロピー復号化手段
2 符号テーブル
3 逆量子化手段
4 量子化テーブル
5 逆DCT手段
Claims (12)
- 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する画像認識方法であって、
上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出工程と、
上記データ抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定工程とを有し、
前記判定工程において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定されることを特徴とする画像認識方法。 - 上記圧縮データはJpegファイルデータであることを特徴とする請求項1に記載の画像認識方法。
- 上記注目画像対象部分に入っているか否かの判定を行うための情報に、上記抽出された部分領域の画像全体における配置情報が加えられ、前記配置情報が画像の端部近傍を示す場合、前記画像の端部近傍に対しては判定を行わないことを特徴とする請求項1または2に記載の画像認識方法。
- 上記注目画像対象部分に入っているか否かの判定を行うための情報に、上記抽出された部分領域の隣接した連続性情報が縦と横方向に加えられ、前記連続性情報が、所定の連続量に入っている場合、注目画像候補領域とすることを特徴とする請求項1乃至3の何れか1項に記載の画像認識方法。
- 上記注目画像対象部分に入っているか否かの判定を行うための情報に、上記抽出された部分領域の直流成分が加えられたことを特徴とする請求項1乃至3の何れか1項に記載の画像認識方法。
- 上記注目画像対象部分の判定において、上記設定範囲の中で複数の注目画像対象部分候補が検出された場合に、上記検出された部分領域の隣接した連続が一番多い注目画像対象部分候補を注目画像対象部分に該当すると判定することを特徴とする請求項3乃至5の何れか1項に記載の画像認識方法。
- 上記検出された部分領域の隣接した連続が一番多い注目画像対象部分候補を含む部分領域に連続で隣接している部分領域において、色度が適正範囲に入っている注目画像対象部分候補を含めて注目画像とすることを特徴とする請求項6に記載の画像認識方法。
- 上記検出した注目画像領域内において、部分領域の連続が2番目以降に長いものの含有率で検出した注目画像の検出の確からしさを求めることを行うようにしたことを特徴とする請求項7に記載の画像認識方法。
- 上記検出した注目画像の確からしさを用いて画像補正強度を決定するようにしたことを特徴とする請求項8に記載の画像認識方法。
- 上記検出した注目画像領域内の輝度情報を作成し、上記作成した輝度情報を元に、画像全体への露出補正を行うようにしたことを特徴とする請求項7乃至9の何れか1項に記載の画像認識方法。
- 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する画像認識装置であって、
上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出手段と、
上記データ抽出手段によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定手段とを有し、
前記判定手段において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定されることを特徴とする画像認識装置。 - 複数の画素単位で圧縮された圧縮データを非圧縮データへと復元する過程を利用して人物の肌を認識する工程をコンピュータに実行させるコンピュータプログラムであって、
上記圧縮データを非圧縮データへと復元する時に、圧縮の単位である複数の部分画素領域について、交流周波数成分を含むデータを抽出するデータ抽出工程と、
上記データ抽出工程によって抽出された複数の部分画素領域からなる部分領域の色度の特徴量が、肌色の色度範囲内に収まっている部分領域を抽出し、該抽出された部分領域が連続する連続ブロックを検出し、該検出されたブロックの交流周波数成分の特徴量が、人物の肌の空間周波数特性適正範囲内に収まっているか否かに基づいて、上記抽出された部分領域のそれぞれが人物の肌であるか否かを判定する判定工程とを有し、
前記判定工程において、前記連続ブロック数に応じた空間周波数特性適正範囲が設定される工程をコンピュータに実行させることを特徴とするコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002193620A JP4006276B2 (ja) | 2002-07-02 | 2002-07-02 | 画像認識方法、画像認識装置及びコンピュータプログラム |
US10/608,001 US7356190B2 (en) | 2002-07-02 | 2003-06-30 | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof |
US11/970,359 US7542615B2 (en) | 2002-07-02 | 2008-01-07 | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002193620A JP4006276B2 (ja) | 2002-07-02 | 2002-07-02 | 画像認識方法、画像認識装置及びコンピュータプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004038480A JP2004038480A (ja) | 2004-02-05 |
JP2004038480A5 JP2004038480A5 (ja) | 2005-07-28 |
JP4006276B2 true JP4006276B2 (ja) | 2007-11-14 |
Family
ID=31702544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002193620A Expired - Fee Related JP4006276B2 (ja) | 2002-07-02 | 2002-07-02 | 画像認識方法、画像認識装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4006276B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3979199A4 (en) * | 2019-05-30 | 2022-08-03 | Panasonic Intellectual Property Management Co., Ltd. | IMAGE PROCESSING METHOD, IMAGE PROCESSING APPARATUS AND PROGRAM |
-
2002
- 2002-07-02 JP JP2002193620A patent/JP4006276B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004038480A (ja) | 2004-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7542615B2 (en) | Image area extraction method, image reconstruction method using the extraction result and apparatus thereof | |
US6389162B2 (en) | Image processing apparatus and method and medium | |
TWI426774B (zh) | 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法 | |
JP3373008B2 (ja) | 画像像域分離装置 | |
JP4732660B2 (ja) | ビジュアルアテンションシステム | |
US7903888B2 (en) | Image encoding apparatus and image decoding apparatus | |
EP2645697B1 (en) | Image processing apparatus and method | |
US8452112B2 (en) | Image encoding apparatus and method of controlling the same | |
JP4045913B2 (ja) | 画像符号化装置、画像符号化方法、および画像処理装置 | |
JPH06223172A (ja) | 画像処理方法および画像処理装置 | |
JP6939449B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
EP1410334A2 (en) | Image block classification based on entropy of pixel differences | |
US7315652B2 (en) | Image processing apparatus | |
US8275198B2 (en) | Image processing apparatus, image processing method and computer readable medium with compression processing for each color | |
CN106717006B (zh) | 用于根据图像类型选择压缩算法的方法 | |
JP3977291B2 (ja) | 画像再生方法及び画像処理装置 | |
JP4006276B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
JP4078136B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
JP4078135B2 (ja) | 画像認識方法、画像認識装置及びコンピュータプログラム | |
US20060165305A1 (en) | Image compression method and image compression device | |
JP4040528B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体、および画像処理装置を備えた画像形成装置 | |
US8213713B2 (en) | Image processing apparatus and computer readable medium | |
JP3398343B2 (ja) | 埋め込み装置、デジタルカメラ及び記録媒体 | |
JPH08307666A (ja) | 文書・写真混在多階調画像のデータ処理装置 | |
JP2024064449A (ja) | 画像処理方法、画像処理装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061212 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070213 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070313 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070514 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070827 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100831 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110831 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120831 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120831 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130831 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |