[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4305000B2 - 画像処理方法、画像処理装置、記憶媒体及びプログラム - Google Patents

画像処理方法、画像処理装置、記憶媒体及びプログラム Download PDF

Info

Publication number
JP4305000B2
JP4305000B2 JP2003040843A JP2003040843A JP4305000B2 JP 4305000 B2 JP4305000 B2 JP 4305000B2 JP 2003040843 A JP2003040843 A JP 2003040843A JP 2003040843 A JP2003040843 A JP 2003040843A JP 4305000 B2 JP4305000 B2 JP 4305000B2
Authority
JP
Japan
Prior art keywords
image
screen
orientation
image processing
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003040843A
Other languages
English (en)
Other versions
JP2004252627A (ja
Inventor
洋道 榎本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2003040843A priority Critical patent/JP4305000B2/ja
Priority to US10/777,294 priority patent/US7349558B2/en
Publication of JP2004252627A publication Critical patent/JP2004252627A/ja
Application granted granted Critical
Publication of JP4305000B2 publication Critical patent/JP4305000B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理方法、画像処理装置及びそれらを実行もしくは動作させるためのプログラム並びにかかるプログラムを記憶した記憶媒体に関する。
【0002】
【従来の技術】
近年、デジタル画像信号の処理技術が向上し、銀塩フィルムやプリントなどからスキャナを用いて取り込んだ画像信号を、CD等の記憶媒体に記憶し保存するサービスが行われている。かかるサービスによれば、ユーザーが手持ちの銀塩フィルムやプリントをラボ等に持参すれば、その画像に対応する画像信号が記憶されたCD等を提供されるため、ユーザーは、銀塩フィルムの保存管理に気を遣う必要がなく、自己のパソコン等を用いて、適宜画像を鑑賞したり、コピーを配布することができるというメリットがある。
【0003】
ここで、ユーザーは被写体に応じて銀塩カメラを横位置又は縦位置にして撮影するため、それに応じて銀塩フィルムに撮影された画像の向きが変わる。従って、その銀塩フィルムやプリントなどからスキャナを用いて取り込んだ画像信号を、そのままCD等に記憶すると、例えば縦位置で撮影した画像について、ユーザーがモニタ上に表示させたときに、その画像の縦方向がモニタの水平方向に一致してしまい、視認しにくいという問題がある。かかる場合、パソコンに画像処理ソフトがインストールされていれば、それを用いて、モニタ上の画像を回転させることはできるが、そのような画像処理ソフトがインストールされていない場合、或いはパソコンの操作に不慣れなユーザーの場合、画像の回転を容易に行えないという問題がある。そこで、上述のサービスにおいては、銀塩フィルムやプリントなどからスキャナを用いて取り込んだ画像信号に基づいて、実際に表示させた画像から、作業者が画像の向きを逐一判断し、例えば全ての画像の縦方向がモニタの上下方向に一致するように画像処理を行ってから、CD等の記憶媒体に記憶し保存することが行われている。しかしながら、膨大な画像の全てについて、この作業を行うと時間がかかるため、機械化できないかという要請がある。
【0004】
同様の問題は、デジタルスチルカメラで撮影を行った後、CD等の記憶媒体に一連の画像信号を記憶する際にも生じる。
【0005】
ところで、以下の特許文献1において、画像における顔の部品(目、口、髪等)の位置関係、体の構成部分(手、足等)の位置関係により、その画像の向きを自動的に判定する方法が開示されている。かかる方法を用いれば、ある程度の確度で、画像の向きを求めることができる。
【特許文献1】
特開平8−138024号公報
【0006】
【発明が解決しようとする課題】
ところが、特許文献1の技術によれば、画像に顔が含まれていない場合、画像の向きを判定できないという問題がある。又、画像に顔が含まれていた場合でも、それを人物の顔として正しく認識することは、現状では必ずしも容易でなく、また顔の部品等の位置関係を求めることは更に困難である。従って、誤った認識に基づいて、画像の向きを不正確に判定してしまうおそれがある。
【0007】
本発明は、かかる従来技術の問題点に鑑みてなされたものであり、人手に頼ることなく画像の向きを精度良く判定できる画像処理方法、画像処理装置、及びそれらを実行もしくは動作させるためのプログラム並びにかかるプログラムを記憶した記憶媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の画像処理方法は、画像処理装置が、1画面に相当する画像信号に基づいて、前記1画面内に人物画像が含まれているか否かを判断するステップと、前記画像処理装置が、前記1画面内に人物画像が含まれていると判断した場合には、前記人物画像を構成する要素に関する要素特徴量に基づいて、前記1画面の画像の向きを判定し、前記画像処理装置が、前記1画面内に人物画像が含まれていないと判断した場合には、前記1画面に相当する画像信号より前記1画面の1つの領域から抽出した特徴量と、他の領域から抽出した特徴量とを対比することで得られる背景特徴量に基づいて、前記1画面の画像の向きを判定し、前記画像処理装置が、1つの画面の画像の向きを判定する際に、それに関連する他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量を用いる場合、前記1つの画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量の重み付けを、前記他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量の重み付けより重くするので、前記1画面に人物画像が含まれていない場合でも、前記背景特徴量から画像の向きを精度良く判定できる。ここで、「領域から抽出される特徴量」とは、例えば色情報(色差)、エッジ情報、輝度情報等をいうが、これに限られることはない。
【0009】
更に、前記1画面内に人物画像が含まれていると判断した場合には、前記要素特徴量に加え、更に前記背景特徴量に基づいて、前記1画面の画像の向きを判定するので、より高精度に画像の向きを判定できる。
【0010】
又、前記要素特徴量と前記背景特徴量とに基づいて前記1画面の画像の向きを判定する場合、前記要素特徴量の重み付けを、前記背景特徴量の重み付けより重くすることで、より高精度に画像の向きを判定できる。
【0011】
更に、前記1つの領域と前記他の領域は、それぞれ前記1画面の周辺に位置すると、より高精度に画像の向きを判定できる。
【0012】
又、前記1画面に相当する画像信号が複数あり、その少なくとも一部が関連している場合には、1つの画面の画像の向きを判定する際に、それに関連する他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量を用いると、例えば関連している例として銀塩フィルム1本(1ロット)分の画像のように、各画像の向きがおおむね一致していると思われる複数の画面がある場合、それに対応する複数の画像信号を関連づけて画像の向きを判定することで、判定の効率を向上させることができる。
【0014】
又、前記1画面の画像を縮小した画像から前記要素特徴量及び/又は前記背景特徴量を抽出して、前記1画面の画像の向きを判定すると処理時間を短縮できる。
【0015】
更に、判定された前記1画面の画像の向きが0度以外であった場合、前記1画面の画像を0度に回転させた画像に対応する変換画像信号と、前記1画面の画像を0度に回転させ更に縮小した画像に対応する変換縮小画像信号とを、記憶媒体に記憶すると、よりユーザーフレンドリーである。
【0016】
上述した画像処理方法を実行する画像処理装置は、例えばコンピュータが考えられるが、それに限られることはない。
【0017】
【発明の実施の形態】
以下、本発明の実施の形態につき、図面を参照して説明する。図11は、本実施の形態にかかる画像処理方法を実行できる画像処理装置を示す概略図である。図11において、フィルムスキャナ1は撮像素子を備えており、銀塩フィルムFの画像を読み取って電気信号に変換する。フィルムスキャナ1から出力された電気信号は、増幅器2により増幅され、A/D変換器3によりデジタルの画像信号に変換され、CPU4により画像処理を施された後、記憶装置5に記憶されるようになっている。尚、CPU4,記憶装置5はパーソナルコンピュータであってもよい。
【0018】
次に、本実施の形態の画像処理方法について説明する。本実施の形態では、CPU4が、画像の向きが0度、90度、180度、270度のいずれであるかを判定するものである。0度、90度、180度、270度については、図1(a)〜(d)に示す画像(人物の顔)の向きとする。最初に画像の向きが0度もしくは180度か、90度もしくは270度かのいずれかを判定する。次に0度もしくは180度と判定された場合は、0度か180度かの判定を行い、90度もしくは270度と判定された場合は、90度か270度かの判定を行う。
【0019】
画像の向きの判定は、1画面に被写体として人物が存在するか否か判定するステップ(図2のステップS102)と、人物が存在した場合、その人物を構成する部品(要素ともいう)に関する要素特徴量を抽出するステップ(図2のステップS103)と、人物以外の背景に関する背景特徴量を抽出するステップ(図2のステップS104)と、これらの特徴量から画像の向きを判定するステップ(図2のステップS106〜S108)とからなる。図2に示す画像の向きを判定する処理フローに基づいて、それぞれの処理内容を示す。
【0020】
まず、図2のステップS101で、CPU4は1画面に相当する画像信号を読み込んだ後、ステップS102で1画面の画像中に人物が写っているかどうか(人物画像が含まれているか否か)を判定する。これについては、様々な手法が提案されているが、例えば特開平8−63597号公報に記載されている方法により判定できるので、本明細書中では、かかる方法を利用するものとする。
【0021】
ステップS102で、人物が写っていると判断した場合、CPU4は、ステップS103で、人物の部品(目、鼻、口、耳、髪の毛、手足等)に関する要素特徴量を抽出する。画像の向きを判定するのに必要な要素特徴量の例として、顔の形状に関する特徴量、両目の位置関係に関する特徴量、顔と髪の位置関係に関する特徴量、顔と手又は顔と足との位置関係に基づく特徴量等が考えられる。それぞれの求め方について説明する。
【0022】
(a)顔の形状に関する要素特徴量EFa
まず、特開平8−63597号公報に記載されている方法により顔領域を抽出し、顔に外接する矩形のアスペクトレシオ(矩形の高さ/幅)を求め、これを1から引いた値を特徴量とする。この値が正であれば、画像の向きは0/180度である可能性が高い。また、負の数であれば、画像の向きは90/270度である可能性が高い。0に近ければ、この特徴量では判定しにくいことがわかるので、その値を0とするか、重み付けを下げるとよい。顔領域が抽出されないときは、この要素特徴量をゼロとする。
顔形状に関する要素特徴量EFa=1−アスペクトレシオ
【0023】
(b)両目の位置関係に関する要素特徴量EFb
ここでは、両目の位置に基づいて、画像の角度を求め要素特徴量を得る。
▲1▼ 目領域を抽出する。抽出方法は、例えば特開平8−63597号公報に記載されている方法を用いる。ここで、両目が検出されない場合は、その要素特徴量を0にする。
▲2▼ 両方の目領域が抽出されたら、顔領域の中心から両方の目領域の中心を通過する直線をひき、それと画像の水平方向との角度θを求める。
【0024】
角度θより、以下のようにして両目の位置関係に関する要素特徴量EFbを求める。その値が正で大きいほど、画像の向きは0/180度である可能牲が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。
0≦θ<90度の場合、両目の位置関係に関する要素特徴量EFb=θ−45
90≦θ<180度の場合、両目の位置関係に関する要素特徴量EFb=135−θ
180≦θ<270度の場合、両目の位置関係に関する要素特徴量EFb=θ−225
270≦θ<360度の場合、両目の位置関係に関する要素特徴量EFb=315−θ
【0025】
(c)顔と髪の位置関係に関する要素特徴量EFc
顔と髪の位置関係から、画像の角度を求め要素特徴量を得る。
▲1▼ 髪領域及び顔領域を抽出する。抽出方法は、例えば特開平8−635971号公報に記載されている方法を用いる。ここで、髪領域及び顔領域が検出されない場合は、その要素特徴量を0にする。
▲2▼ 髪領域及び顔領域が抽出されたら、顔領域の中心から髪領域の中心へ結ぶ直線の水平方向からの角度θを求める。次に以下のようにして顔と髪の位置関係に関する要素特徴量を求める。この値が正で大きいほど、画像の向きは0/180度である可能性が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。
0≦θ<90度の場合、顔と髪の位置関係に関する要素特徴量EFc=θ−45
90≦θ<180度の場合、顔と髪の位置関係に関する要素特徴量EFc=0−135
180≦θ<270度の場合、顔と髪の位置関係に関する要素特徴量EFc=θ−225
270≦θ<360度の場合、顔と髪の位置関係に関する要素特徴量EFc=θ−315
【0026】
(d)顔と手又は顔と足との位置関係に基づく要素特徴量EFd
顔と手又は顔と足との位置関係に基づいて、画像の角度を求め要素特徴量を得る。
▲1▼ 顔領域及び手領域又は足領域を抽出する。抽出方法は、例えば特開平8−138024号公報に記載されている方法を用いる。ここで、顔領域及び手領域又は足領域が検出されない場合は、その要素特徴量を0にする。
▲2▼ 顔領域及び手領域又は足領域が抽出されたら、手領域又は足領域の中心から顔領域の中心へ結ぶ直線の水平方向からの角度θを求める。次に以下のようにして顔と手又は足の位置関係に関する要素特徴量を求める。この値が正で大きいほど、画像の向きは0/180度である可能性が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。
0≦θ<90度の場合、顔と手又は顔と足との位置関係に基づく要素特徴量EFd=θ−45
90≦θ<180度の場合、顔と手又は顔と足との位置関係に基づく要素特徴量EFd=0−135
180≦θ<270度の場合、顔と手又は顔と足との位置関係に基づく要素特徴量EFd=θ−225
270≦θ<360度の場合、顔と手又は顔と足との位置関係に基づく要素特徴量EFd=θ−315
【0027】
続いて、CPU4は、ステップS104において背景特徴量を求める。尚、ステップS102で人物が写っていないと判断した場合、CPU4は、ステップ103を実行せず、ステップS104において背景特徴量を求める。
【0028】
人物以外の被写体(背景)に関する背景特徴量
画像の全体的な構図(背景という用語を用いるが、人物が含まれていてもよい)に関する特徴量の例としては、対称性、明るさの勾配、各辺に接する領域の均一度等が上げられる。それぞれの求め方について説明する。
【0029】
(a)対称性に関する背景特徴量
特に屋外の撮影では、図3に示すような構図の画像が得られることが多い。このような画像では、左右の対称性は上下の対称性より高いので、この対称性を示す背景特徴量を用いて画像の向きを判定することができる。また、屋内の撮影でも同様に、背景が壁で中央に人が写っている構図の画像が得られることが多く、かかる場合に同様の手法で画像の向きを判定できる。
【0030】
(I)色情報を利用した対称性に関する背景特徴量BFa
▲1▼ 1画面を模式的に示す図4において、画面の周辺部8つの領域(左上、左中、左下、中上、中下、右上、右中、右下と略す)中の色情報(例えばL***)の平均値を求める。尚、ここでは、色情報はL***を用い、色の差を表すのに色差を用いたが、これに限らず、例えば色情報はL***、HSV、HIQ等であり、それに対応する色の差を表す尺度であってもかまわない。
▲2▼ 色情報に基づいて、画像の水平方向の対称性を求める。具体的には、左上と右上、左中と右中、左下と右下の領域間の色差を計算し、その平均値aveh(色)を求める。尚、ここでは平均値用いることとするが、最小値、最大値、分散であってもかまわない)。
左上と右上の色差=(L*(左上)−L*(右上))2+(u*(左上)−u*(右上))2+(v*(左上)−v*(右上))2
左中と右中の色差=(L*(左中)−L*(右中))2+(u*(左中)−u*(右中))2+(v*(左中)v*(右中))2
左下と右下の色差=(L*(左下)−L*(右下))2+(u*(左下)−u*(右下))2+(v*(左下)−v*(右下))2
aveh(色)=(左上と右上の色差+左中と右中の色差+左下と右下の色差)/3
尚、例えばL*(左上)とは、左上領域のL*値を意味するものとする。
▲3▼ 色情報に基づいて、垂直方向の対称性を求める。具体的には左上と左下、中上と中下、右上と右下の領域間の色差を求める。
左上と左下の色差=(L*(左上)−L*(左下))2+(u*(左上)−u*(左下))2+(v*(左上)−v*(左下))2
中上と中下の色差=(L*(中上)−L*(中下))2+(u*(中上)−u*(中下))2+(v*(中上)v*(中下))2
右上と右下の色差=(L*(右上)−L*(右下))2+(u*(右上)−u*(右下))2+(v*(右上)−v*(右下))2
avev(色)=(左上と左下の色差+中上と中下の色差+右上と右下の色差)/3
▲4▼ aveh(色)とavev(色)の差を、色情報を利用した対称性に関する背景特徴量BFaとする(以下の式参照)。
色情報を利用した対称性に関する背景特徴量BFa=avev(色)−aveh(色)
この値が正の数で大きいほど画像の向きは0/180度である可能性高い。また、負の数で大きいほど、画像の向きは90/270度である可能性高い。また、0に近いほど、この特徴量では判定しにくいことを示している。
【0031】
以上の処理をCPU4で行う場合の具体的な処理フローを図5に示す。図5のステップS201で、CPU4は、画像周辺8領域におけるRGBデータを、Lデータに変換する。更に、ステップS202で、CPU4は、画像周辺8領域におけるLデータの平均値を求める。続いてステップS203で、CPU4は、かかるLデータの平均値に基づいて画面の横方向の色差を求め、その横平均値(=aveh)を演算する。又ステップS204で、CPU4は、かかるLデータの平均値に基づいて画面の縦方向の色差を求め、その縦平均値(=avev)を演算する。最後にステップS205で、CPU4は、横平均値と縦平均値とに基づいて背景特徴量BFaを求める。
【0032】
(II)エッジ情報を利用した対称性に関する背景特徴量BFb
色情報の代わりにエッジ情報を用いる以外は、上記と同じ手法を用いることができる。エッジ情報は、この例では対称画素の4近傍の周囲画素とB+G+R差の絶対値を求め、これを足し合わせた値をエッジ量として計算する。尚、これ以外に例えばラプラシアンフィルタ、Sobelフィルタをかけた値でもかまわない。
▲1▼ aveh(エッジ)=(左上と右上のエッジ量の差+左中と右中のエッジ量の差+左下と右下のエッジ量の差)/3を求める。
▲2▼ avev(エッジ)(左上と左下のエッジ量の差+中上と中下のエッジ量の差+左下と右下のエッジ量の差)/3を求める。
▲3▼ エッジ情報を利用した対称性に関する背景特徴量BFb=|avev(エッジ)|−|aveh(エッジ)|を求める。
この値が正の数で大きいほど画像の向きは0/180度である可能性が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。また、0に近いほど、この特徴量では判定しにくいことを示している。
【0033】
(III)明るさの傾きに関する背景特徴量BFc
図7に示すような屋外のシーンでも屋内のシーンでも太陽もしくは室内の電灯等の光源の影響で垂直方向に明るさの傾きが生じている場合が多い。つまり画像の上部で明るく、下にいくにしたがって暗くなる傾向がある。この傾向を、背景特徴量とすることで画像の向きを判定することができる。
▲1▼ 左上の輝度−右上の輝度、左中の輝度−右中の輝度、左下の輝度−右下の輝度を計算し、その平均値aveh(輝度)を求める。輝度としてはL値を用いてもよいし、R+G+Bの値を用いてもよい。
▲2▼ 左上の輝度−左下の輝度、中上の輝度−中下の輝度、右上の輝度−右下の輝度を計算しその平均値avev(輝度)を求める。
▲3▼ 明るさの傾きに関する背景特徴量として、aveh(輝度)の絶対値と、avev(輝度)の絶対値の差を求める(以下の式参照)。
明るさの傾きに関する背景特徴量BFc=|avev(輝度)|−|aveh(輝度)|
この値が正の数で大きいほど、画像の向きは0/180度である可能性が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。
【0034】
以上の処理をCPU4で行う場合の具体的な処理フローを図6に示す。図6のステップS301で、CPU4は、画面横方向の輝度差を求め、その横平均値(輝度)を演算する。又ステップS302で、CPU4は、画面縦方向の輝度差を求め、その縦平均値(輝度)を演算する。最後にステップS303で、CPU4は、横平均値(輝度)と縦平均値(輝度)とに基づいて、明るさの傾きに関する背景特徴量を求める。
【0035】
(IV)画面各辺に接する領域の均一度に関する背景特徴量BFd
屋外のシーンでも屋内のシーンでも画像の上部は、空、壁、天井であることが多く、画像の下部は地面、床であることが多い。この傾向を特徴量とすることで画像の向きを判定することができる。具体的には例えば図8のような構図では、画像の上端辺は全て空に接しているため、色情報やエッジ情報等の均一性が高くなる。
▲1▼ 周辺4辺各辺にそって、色の均一性を求める。色の均一性の求め方は多数あるが、ここでは、L、u、vの標準偏差を求め、これを重み付けて足し合わせた数値で示す。重みについての一例として特開平9−284429号公報に記載されているように、均一性=(Lの標準偏差)+0.852×(uの標準偏差)+0.323×(vの標準偏差)で求められる。
▲2▼ 画面各辺に接する領域の均一度に関する背景特徴量として、左辺の均一性と右辺の均一性のうちの小さい方の値と、上辺の均一性と下辺の均一性のうち小さい方の値との差を求める(以下の式参照)。
画面各辺に接する領域の均一度に関する背景特徴量BFd=min(均一性(左辺)、均一性(右辺))−min(均一性(上辺)、均一性(下辺))。
この値が正で大きいほど、画像の向きは0/180度である可能性が高い。また、負の数で大きいほど、画像の向きは90/270度である可能性が高い。
【0036】
以上の処理をCPU4で行う場合の具体的な処理フローを図9に示す。図9のステップS401で、CPU4は、画面周囲4辺に沿ってL、u、vの標準偏差を求める(図の式中、sdは標準偏差)。続くステップS402で、CPU4は、画面各辺に接する領域の均一度に関する背景特徴量を求める。
【0037】
以上のごとく背景特徴量を求めた後、図2のステップS105で、CPU4は、画像の向きが、0度もしくは180度か否かを判定する。ここでは、人物画像が1画面に存在するか否かの判定の結果により判定方法が異なる。人物画像が存在すると判定された場合は、要素特徴量と背景特徴量とを利用して判定を行う。この場合は、人物の部品に関する要素特徴量の重みが大きくなるようにする。人物画像が存在しないと判定された場合は、背景特徴量のみを利用して判定を行う。具体的な方法例を示す。
【0038】
(人物画像が存在すると判定された場合)
各要素特徴量、各背景特徴量にそれぞれ重みをかけたものを足し合わせた値により判定する。具体的には、
評価尺度(顔有り)=W1・EFa+W2・EFb+W3・EFc+W4・EFd+W5・BFa+W6・BFb+W7・BFc+W8・BFd (1)
の計算を行う。ここで、W1〜W8は、それぞれの特徴量に対する重み係数である。
【0039】
画像の向きの判定は、1画面に人物画像が含まれている場合には、人物以外から判断するよりも、人物の要素に基づいて判断する方が確度が高いので、人物の部品に関する要素特徴量の重み(W1、W2、W3、W4)を、背景特徴量の重み(W5、W6、W7、W8)より重くなるように設定することが好ましい。
【0040】
この評価尺度の値により0度もしくは180度か、90度もしくは270度かの判定を行う。この他に、ニューラルネットを用いて判定する手法でもよい。その場合は、ニューラルネットの入力層に上記特徴量を入力して判定する。
【0041】
(人物画像が存在しないと判定された場合)
この場合は、画像の全体的な構図に関する背景特徴量のみを用いて判定する。この場合、W1〜W4は0になるので、
Figure 0004305000
の計算を行い、計算値より画像の向きを判定する。人物画像があると判定された場合と同様に、ニューラルネットを用いて判定する手法でもよい。
【0042】
CPU4は、図2のステップS107で、画像の向きが0度か180度かの判定を行う。例えばネガフィルムをフィルムスキャナでデジタイズする場合、ネガ1本単位(以後、ロットと記述)で向きが180度回転している場合がある。この場合には1枚の画像のみで判定するのではなく、同一ロットの複数の画像の向きの傾向を利用する。ここでは、前述した人物の部品に関する要素特徴量と背景特徴量を利用して判定することができる。以下に具体例を示す。
【0043】
(背景特徴量を利用した例)。
▲1▼ 明るさの傾きに関する背景特徴量BFcを求めるときに計算したavev(輝度)を利用する。同一ロットのavev(輝度)の値の平均値を取り、その値が正の値であれば同一ロットのすべての画像の向きが0度、負であれば180度と判定する、
▲2▼ 画面各辺に接する領域の均一度に関する背景特徴量BFdを求めるときに計算した各辺に接する領域のL、u、vの平均値から、平均値が空の色を示すときは、その辺が画像の上であると判定する。平均値が地面の色を示すときは、その辺が画像の下であると判定する。尚、1画面に人物画像が存在すると判定された場合は、以下のようにして要素特徴量から判定することができる。
【0044】
(要素特徴量を利用した例)
▲1▼ 両目の位置関係に関する要素特徴量EFbを求めるときに計算したθが45度≦θ<135度の場合は、画像の向きは0度と判定し、225度≦θ<315度の場合は180度と判定する。
▲2▼ 顔と髪の位置関係に関する要素特徴量EFcを求めるときに計算したθが45度≦θ<135度の場合は、画像の向きは0度と判定し、225度≦θ<315度の場合は180度と判定する。
【0045】
これらの判定手法のどれか一つ実行してもよいし、組み合わせてもかまわない。処理速度を要求される場合はどれか一つを実行し、確度を要求される場合は、組み合わせることが好ましい。その際、1画面に人物画像がある場合は、前述したように、人物の部品の位置関係に関する要素特徴量の重み付けを重くすることが好ましい。
【0046】
一方、CPU4は、図2のステップS108で、画像の向きが90度か270度かの判定を行う。この具体例を示す。
【0047】
(背景特徴量を利用した例)
▲1▼ 明るさの傾きに関する背景特徴量BFcを求めるときに計算したaveh(輝度)を利用する。これが正の値であれば画像の向きが270度、負であれば90度と判定する。
▲2▼ 画面各辺に接する領域の均一度に関する背景特徴量BFdを求めるときに計算した各辺に接する領域のL、u、vの平均値から、平均値が空の色を示す時は、その辺が画像の上であると判定する。平均値が地面の色を示す時はその辺が画像の下であると判定する。尚、1画面に人物画像が存在すると判定された場合は、以下のようにして要素特徴量から判定することができる。
【0048】
(要素特徴量を利用した例)
▲1▼ 両目の位置関係に関する要素特徴量EFbを求めるときに計算したθが−45度≦θ<45度の場合は、画像の向きは90度と判定し、135度≦θ<225度の場合は270度と判定する。
▲2▼ 顔と髪の位置関係に関する要素特徴量EFcを求めるときに計算したθが−45度≦θ<45度の場合は、画像の向きは90度と判定し、135度≦θ<225度の場合は270度と判定する。
【0049】
これらの判定手法のどれか一つ実行してもよいし、組み合わせてもかまわない。処理速度を要求される場合はどれか一つを実行し、確度を要求される場合は、組み合わせることが好ましい。その際、1画面に人物画像がある場合は、前述したように、人物の部品の位置関係に関する要素特徴量の重み付けを重くすることが好ましい。
【0050】
また、同一ロット内では撮影者が同一人物である場合が多いので、90度か270度については、どちらかに集中する傾向を持つことが多い。この傾向を利用する方法として、例えば、ロット中で90度もしくは270度と判定された画像が3枚あり、その内、2枚が90度と判定された場合、3枚目の画像が90度になる可能性が高くなるよう評価尺度を調整することができる。本実施の形態によれば、1画面に顔が写っていない場合や、たとえ顔が写っていても正確に目、髪等を抽出できない場合でも、上記方法を用いることで画像の向きを正確に判定することができる。この場合、判定対象となる画像の評価尺度((1)、(2)式)に加え、その前後の画像の評価尺度を用いて判定を行うこともできるが、この場合は、判定対象となる画像の評価尺度の重み付けを、その前後の画像の評価尺度の重み付けより高くすることが望ましい。
【0051】
尚、上記処理は本画像(例えばスキャナから取り込んだ生データの画像)の縮小画像で行うことができる。画像の向きを判定するには解像度の高い画像は必要なく、VGA(Video Graphics Array)の1/4程度(320×240画素)の画像であれば正確に判定できる。これより大きい画像の場合は、間引いた画像を作製し上記処理を行う。これにより、精度を下げずに処理速度を向上させることができる。
【0052】
上述の手法による画像の向きの判定を、デジタルカメラ、フィルムスキャナ等の入力機器で行い、画像を回転させる必要のある場合(0度以外の場合)は、元画像を回転させた画像、更にその縮小両像を作製して元画像とは別に所定の記録媒体に記憶保存することもできる。このとき、元の画像を保存しないかどうかユーザーに確認する機能を、デジタルカメラ、フィルムスキャナ等に持たせると好ましい。
【0053】
更に、画像フォーマットがExif場合は、元画像を回転させた画像を作製するかわりに、画像の属性を示すメタデータとして画像の向きをヘッダ中の所定の場所に書き込んでもかまわない。以上によれば、入力機器内で、画像の向きが判定され、画像が回転させる必要のある場合は、回転させた画像が保存されるので、画像を表示する際に正立像が表示されることになるので、ユーザーにとって画像をみやすいという効果がある。以上の手法による画像の向きの判定にかかる画像処理方法を実行するプログラムは、CDやハードディスク等の記憶媒体に保存され、パソコン等で実行されることが可能である。
【0054】
以上、本発明を実施の形態を参照して説明してきたが、本発明は上記実施の形態に限定して解釈されるべきではなく、適宜変更・改良が可能であることはもちろんである。
【0055】
【発明の効果】
本発明によれば、人手に頼ることなく画像の向きを精度良く判定できる画像処理方法、画像処理装置、及びそれらを実行もしくは動作させるためのプログラム並びにかかるプログラムを記憶した記憶媒体を提供することができる。
【図面の簡単な説明】
【図1】画像の角度の例を示す図である。
【図2】画像の向きを判定する処理フローを示す図である。
【図3】1画面の画像の例である。
【図4】1画面を模式的に示した図である。
【図5】色情報を利用した対称性に関する背景特徴量を求めるための処理フローを示す図である。
【図6】明るさの傾きに関する背景特徴量を求めるための処理フローを示す図である。
【図7】1画面の画像の例である。
【図8】1画面の画像の例である。
【図9】画面各辺に接する領域の均一度に関する背景特徴量を求めるための処理フローを示す図である。
【図10】1画面の画像の例である。
【図11】本実施の形態にかかる画像処理方法を実行できる画像処理装置を示す概略図である。
【符号の説明】
1 フィルムスキャナ
2 増幅器
3 A/D変換器
4 CPU
5 記憶装置

Claims (7)

  1. 画像処理装置が、1画面に相当する画像信号に基づいて、前記1画面内に人物画像が含まれているか否かを判断するステップと、
    前記画像処理装置が、前記1画面内に人物画像が含まれていると判断した場合には、前記人物画像を構成する要素に関する要素特徴量に基づいて、前記1画面の画像の向きを判定し、
    前記画像処理装置が、前記1画面内に人物画像が含まれていないと判断した場合には、前記1画面に相当する画像信号より前記1画面の1つの領域から抽出した特徴量と、他の領域から抽出した特徴量とを対比することで得られる背景特徴量に基づいて、前記1画面の画像の向きを判定し、
    前記画像処理装置が、1つの画面の画像の向きを判定する際に、それに関連する他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量を用いる場合、前記1つの画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量の重み付けを、前記他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量の重み付けより重くすることを特徴とする画像処理方法。
  2. 前記画像処理装置が、前記1画面内に人物画像が含まれていると判断した場合には、前記要素特徴量に加え、更に前記背景特徴量に基づいて、前記1画面の画像の向きを判定することを特徴とする請求項1に記載の画像処理方法。
  3. 前記画像処理装置が、前記要素特徴量と前記背景特徴量とに基づいて前記1画面の画像の向きを判定する場合、前記要素特徴量の重み付けを、前記背景特徴量の重み付けより重くすることを特徴とする請求項2に記載の画像処理方法。
  4. 前記1つの領域と前記他の領域は、それぞれ前記1画面の周辺に位置することを特徴とする請求項1乃至3のいずれかに記載の画像処理方法。
  5. 前記1画面に相当する画像信号が複数あり、その少なくとも一部が関連している場合には、前記画像処理装置が、1つの画面の画像の向きを判定する際に、それに関連する他の画面に相当する画像信号から抽出された前記要素特徴量及び/又は前記背景特徴量を用いることを特徴とする請求項1乃至4のいずれかに記載の画像処理方法。
  6. 前記画像処理装置が、前記1画面の画像を縮小した画像から前記要素特徴量及び/又は前記背景特徴量を抽出して、前記1画面の画像の向きを判定することを特徴とする請求項1乃至のいずれかに記載の画像処理方法。
  7. 判定された前記1画面の画像の向きが0度以外であった場合、前記画像処理装置が、前記1画面の画像を0度に回転させた画像に対応する変換画像信号と、前記1画面の画像を0度に回転させ更に縮小した画像に対応する変換縮小画像信号とを、記憶媒体に記憶することを特徴とする請求項1乃至のいずれかに記載の画像処理方法。
JP2003040843A 2003-02-19 2003-02-19 画像処理方法、画像処理装置、記憶媒体及びプログラム Expired - Fee Related JP4305000B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003040843A JP4305000B2 (ja) 2003-02-19 2003-02-19 画像処理方法、画像処理装置、記憶媒体及びプログラム
US10/777,294 US7349558B2 (en) 2003-02-19 2004-02-12 Image processing method, image processing apparatus, storage medium and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003040843A JP4305000B2 (ja) 2003-02-19 2003-02-19 画像処理方法、画像処理装置、記憶媒体及びプログラム

Publications (2)

Publication Number Publication Date
JP2004252627A JP2004252627A (ja) 2004-09-09
JP4305000B2 true JP4305000B2 (ja) 2009-07-29

Family

ID=32844507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003040843A Expired - Fee Related JP4305000B2 (ja) 2003-02-19 2003-02-19 画像処理方法、画像処理装置、記憶媒体及びプログラム

Country Status (2)

Country Link
US (1) US7349558B2 (ja)
JP (1) JP4305000B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4177779B2 (ja) * 2004-03-31 2008-11-05 富士フイルム株式会社 画像表示制御装置および方法ならびに画像表示制御装置を制御するプログラム
JP4130641B2 (ja) * 2004-03-31 2008-08-06 富士フイルム株式会社 ディジタル・スチル・カメラおよびその制御方法
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法
JP4824411B2 (ja) * 2005-01-20 2011-11-30 パナソニック株式会社 顔抽出装置、半導体集積回路
WO2006087789A1 (ja) * 2005-02-17 2006-08-24 Fujitsu Limited 画像処理方法、画像処理システム、画像処理装置及びコンピュータプログラム
JP4478093B2 (ja) 2005-10-17 2010-06-09 富士フイルム株式会社 対象画像検索装置およびディジタル・カメラならびにそれらの制御方法
JP4874913B2 (ja) * 2007-09-28 2012-02-15 富士フイルム株式会社 頭頂位置算出装置、それを用いた画像処理装置および頭頂位置算出方法並びにプログラム
JP5438419B2 (ja) * 2009-07-29 2014-03-12 富士フイルム株式会社 人物照合装置及び人物照合方法
KR20120078980A (ko) * 2011-01-03 2012-07-11 삼성전자주식회사 휴대단말기에서 영상의 방향정보 추출장치 및 방법
JP5000781B1 (ja) * 2011-11-09 2012-08-15 楽天株式会社 画像処理装置、画像処理装置の制御方法、プログラム、及び情報記憶媒体
CN104636701B (zh) * 2014-12-12 2017-09-19 浙江工业大学 一种基于图像修复的激光二维码识别方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835616A (en) * 1994-02-18 1998-11-10 University Of Central Florida Face detection using templates
JPH08138024A (ja) 1994-11-04 1996-05-31 Konica Corp 画像の向き判定方法
KR100730500B1 (ko) * 1999-08-19 2007-06-27 소니 가부시끼 가이샤 화상 처리 장치와 화상 처리 방법 및 기록 매체
US6741756B1 (en) * 1999-09-30 2004-05-25 Microsoft Corp. System and method for estimating the orientation of an object
JP4526639B2 (ja) * 2000-03-02 2010-08-18 本田技研工業株式会社 顔認識装置およびその方法
JP2003296713A (ja) * 2002-04-04 2003-10-17 Mitsubishi Electric Corp 顔画像合成装置、顔画像合成方法およびその方法を実行するプログラムならびに顔画像合成装置を備えた通信用端末およびその通信用端末による通信方法
US7120279B2 (en) * 2003-01-30 2006-10-10 Eastman Kodak Company Method for face orientation determination in digital color images

Also Published As

Publication number Publication date
JP2004252627A (ja) 2004-09-09
US7349558B2 (en) 2008-03-25
US20040161166A1 (en) 2004-08-19

Similar Documents

Publication Publication Date Title
US7844135B2 (en) Detecting orientation of digital images using face detection information
US8040389B2 (en) Image processing method, image processing program and image processing apparatus for detecting object of an image
WO2019091271A1 (zh) 一种人脸检测方法以及人脸检测系统
US8391645B2 (en) Detecting orientation of digital images using face detection information
CN101216883B (zh) 一种照相方法及照相装置
US20150172537A1 (en) Photographing apparatus, method and program
US8446494B2 (en) Automatic redeye detection based on redeye and facial metric values
US20040086046A1 (en) Systems and methods for generating a motion attention model
US20080175481A1 (en) Color Segmentation
JP4305000B2 (ja) 画像処理方法、画像処理装置、記憶媒体及びプログラム
US20050220346A1 (en) Red eye detection device, red eye detection method, and recording medium with red eye detection program
EP1618739A1 (en) Adjusting the brightness of a digital image
US11301974B2 (en) Image processing apparatus, image processing method, image capturing apparatus, and storage medium
US20150168811A1 (en) Image processing apparatus, method, and computer program storage device
JP2005303991A (ja) 撮像装置、撮像方法、及び撮像プログラム
JP4367010B2 (ja) システム、プログラムおよび方法
JPWO2020213166A1 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP5504990B2 (ja) 撮像装置、画像処理装置及びプログラム
US7602943B2 (en) Image processing apparatus, image processing method, and image processing program
JP6098133B2 (ja) 顔構成部抽出装置、顔構成部抽出方法及びプログラム
JP4412929B2 (ja) 顔検知装置
JP3263253B2 (ja) 顔方向判定装置及びそれを用いた画像表示装置
JP2009223916A (ja) インターホン装置
JP5995610B2 (ja) 被写体認識装置及びその制御方法、撮像装置、表示装置、並びにプログラム
US20100150466A1 (en) Image processing method and image processing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090420

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees