上述した従来の人体検知装置では、距離画像から求めた勾配方向画像を予め登録された基準勾配方向画像と照合することによって、対象物体の検出を行っているのであるが、特許文献1に記載された人体検出装置では検知位置に関わらず、同じ基準勾配方向画像を使用してマッチングを行っているので、検出空間内の立ち位置によって距離画像での見え方が変化する人体を検出する場合には、検出対象である人体の検出が正確に行えない可能性があった。
本発明は上記問題点に鑑みて為されたものであり、その目的とするところは、検出位置によって距離画像での見え方が変化する人体を検出対象とする場合でも人体を確実に検出することが可能な人体検出装置を提供することにある。
上記目的を達成するために、請求項1の発明は、検出空間内の対象物体までの距離を求め、二次元配列の各画素の画素値を距離値とした距離画像を生成する距離画像生成手段と、距離画像の距離値から各画素の距離勾配方向を求め、勾配方向値を画素値とする勾配方向画像を生成する勾配画像生成手段と、検出空間内の複数の検出位置に所定の人体モデルが存在する場合の距離画像での見え方を示した複数の基準距離画像が予め求められ、複数の基準距離画像をそれぞれ微分して得た複数の基準勾配方向画像を記憶する基準勾配方向画像記憶手段と、勾配画像生成手段により生成された勾配方向画像と勾配方向画像内の検出位置に応じた基準勾配方向画像との相関を表す類似度を算出するとともに、類似度に基づいて基準勾配方向画像との一致度合いを評価する評価手段と、評価手段による評価結果をもとに人体の位置を判定する人体位置判定手段と、人体位置判定手段の判定結果をもとに人体の検知結果を外部に出力する人体検知結果出力手段とを備えたことを特徴とする。
請求項2の発明は、請求項1の発明において、体格又は姿勢のうち少なくとも何れか一方が異なる複数種類の人体モデルの各々について、検出空間内の複数の検出位置に各人体モデルが存在する場合の距離画像での見え方を示した複数の基準距離画像が予め求められ、個々の人体モデル毎に複数の基準距離画像から得た複数の基準勾配方向画像が基準勾配方向画像記憶手段に記憶されたことを特徴とする。
請求項3の発明は、請求項1又は2の発明において、評価手段は、0°から360°の範囲で規定される勾配方向を複数の勾配方向領域に分割し、勾配方向領域の単位で勾配方向が一致するか否かを評価することを特徴とする。
請求項4の発明は、請求項3の発明において、評価手段は、勾配画像生成手段により生成された勾配方向画像の画素の勾配方向と、基準勾配方向画像の画素の勾配方向とが同じ勾配方向領域に存在する場合、並びに隣接する勾配方向領域に存在する場合を勾配方向が一致したと評価することを特徴とする。
請求項5の発明は、請求項1乃至4の何れか1つの発明において、評価手段は、勾配方向が一致した画素数を基準勾配方向画像の画素数で規格化した値をもとに類似度を求めることを特徴とする。
請求項6の発明は、請求項1乃至4の何れか1つの発明において、評価手段は、勾配方向が一致した画素数を勾配方向を階級にとってヒストグラム化するとともに、ヒストグラムの形状に基づいて類似度を求めることを特徴とする。
請求項7の発明は、請求項1乃至6の何れか1つの発明において、評価手段は、勾配画像生成手段により生成された勾配方向画像の画素のうち、基準勾配方向画像の画素と勾配方向値が一定値以上離れている画素を不一致画素として抽出し、不一致画素の画素数と類似度の両方から基準勾配方向画像との一致度合いを評価することを特徴とする。
請求項8の発明は、請求項1乃至6の何れか1つの発明において、評価手段は、勾配方向が不一致の画素数を基準勾配方向画像の画素数で規格化した値をもとに、基準勾配方向画像との不一致度合いを示す不一致度を求め、類似度と不一致度の両方から基準勾配方向画像との一致度合いを評価することを特徴とする。
請求項9の発明は、請求項1乃至6の何れか1つの発明において、評価手段は、勾配方向が一致した画素数と勾配方向が不一致の画素数の両方から類似度を導出する評価関数を用いて類似度を算出することを特徴とする。
請求項10の発明は、請求項1乃至9の何れか1つの発明において、評価手段は、各画素位置での類似度を二次元配列上に並べて類似度マップを作成し、人体位置判定手段は、類似度マップにおいて類似度のピーク位置を抽出し、当該ピーク位置を人体の検出位置として求めることを特徴とする。
請求項11の発明は、請求項1乃至9の何れか1つの発明において、評価手段は、各画素位置での類似度を二次元配列上に並べて類似度マップを作成し、人体位置判定手段は、類似度マップにおいて類似度が所定の閾値を超える領域を抽出し、抽出された個々の領域の重心位置を人体の検出位置として求めることを特徴とする。
請求項12の発明は、請求項1乃至9の何れか1つの発明において、評価手段は、各画素位置での類似度を二次元配列上に並べて類似度マップを作成し、人体位置判定手段は、類似度マップにおいて類似度が所定の閾値を超える領域を抽出し、抽出された各領域内で距離値が最も小さい位置を人体の検出位置として求めることを特徴とする。
請求項13の発明は、請求項10乃至12の何れか1つの発明において、人体位置判定手段は、人体検出位置が複数得られた場合に、規定距離以内にある人体検出位置を同じ人体の検出位置として統合するとともに、複数の基準勾配方向画像のうち何れの基準勾配方向画像に一致しているかを判定することを特徴とする。
請求項14の発明は、請求項2の発明において、評価手段は、複数の基準勾配方向画像について、各画素位置での類似度を二次元配列上に並べて類似度マップをそれぞれ作成し、複数の類似度マップにおいて類似度が所定の閾値を超える領域を抽出し、複数の類似度マップ間で抽出された領域の重なり状態から、複数の基準勾配方向画像のうち何れの基準勾配方向画像に一致しているかを判定することを特徴とする。
請求項15の発明は、請求項1乃至14の何れか1つの発明において、距離画像生成手段は、予め人体が存在しない状態で撮影された背景距離画像を記憶する背景画像記憶部を備え、検出空間を撮像して得た距離画像と背景距離画像との差分演算を行い、背景距離画像と相違する領域を抽出することによって得られた距離画像を出力することを特徴とする。
請求項16の発明は、請求項15の発明において、距離画像生成手段は、差分演算を行って得た各画素毎の差分値のヒストグラムをもとに、差分値の閾値を決定し、差分値が閾値を超える領域を抽出することによって得られた距離画像を出力することを特徴とする。
請求項17の発明は、請求項1乃至14の何れか1つの発明において、距離画像生成手段は、検出空間を撮像して得た距離画像から、画素値が予め設定された距離範囲内である画素の領域を抽出することによって得られた距離画像を出力することを特徴とする。
請求項18の発明は、請求項15乃至17の何れか1つの発明において、距離画像生成手段は、抽出された領域が、想定される人体の大きさの最小値よりも小さい場合は、当該領域を削除することを特徴とする。
請求項19の発明は、請求項18の発明において、距離画像生成手段は、距離画像内の位置に応じて最小値を変化させることを特徴とする。
請求項20の発明は、請求項1乃至19の何れか1つの発明において、勾配画像生成手段は、生成した勾配方向画像から、勾配方向が同方向となる画素の集まりであって、その面積が人体を撮像した場合の画素領域に比べて大面積の画素領域を削除することを特徴とする。
請求項21の発明は、請求項1乃至20の何れか1つの発明において、基準勾配方向画像記憶手段には、検出空間内の一部の領域内に検出位置がある1乃至複数の基準勾配方向画像が予め記憶され、検出空間内の他の領域に検出位置がある基準勾配方向画像は、予め記憶された1乃至複数の基準勾配方向画像を、見え方が他の領域での見え方となるように写像することによって作成されることを特徴とする。
請求項22の発明は、請求項21の発明において、距離画像生成手段は、床面に対して正対するように上方位置に設置されており、基準勾配方向画像記憶手段には、距離画像生成手段の下方位置を通る直交2直線によって分割される4象限のうち、1つの象限に検出位置がある1乃至複数の基準勾配方向画像が予め記憶され、他の3つの象限に検出位置がある基準勾配方向画像は、予め記憶された1象限分の基準勾配方向画像を直交2直線に対して鏡像変換することによって作成されることを特徴とする。
請求項23の発明は、請求項21の発明において、距離画像生成手段は、床面に対して正対するように上方位置に設置されており、基準勾配方向画像記憶手段には、距離画像生成手段の下方位置を始点とする線分上に検出位置がある1乃至複数の基準勾配方向画像が予め記憶され、他の領域に検出位置がある基準勾配方向画像は、線分上に検出位置がある基準勾配方向画像を、始点を中心として回転移動させることによって作成されることを特徴とする。
請求項24の発明は、請求項1乃至23の何れか1つの発明において、人体位置判定手段は、評価手段によって求められた基準勾配方向画像とのマッチング位置と、マッチングした基準勾配方向画像の身長情報をもとに、実空間での人体の立ち位置を求めることを特徴とする。
請求項25の発明は、請求項1乃至24の何れか1つの発明において、人体検知結果出力手段は、人体位置判定手段により検出された人体位置を検出時刻に対応付けて記憶し、検知回数が所定の基準回数よりも少ない人体位置の検出結果は出力から除くことを特徴とする。
請求項1の発明によれば、検出空間内の複数の検出位置に所定の人体モデルが存在する場合の距離画像での見え方を示した複数の基準距離画像が予め求められ、複数の基準距離画像をそれぞれ微分して得た基準勾配方向画像が基準勾配方向画像記憶手段に記憶されており、評価手段では、勾配画像生成手段により生成された勾配方向画像と、検出位置に応じた基準勾配方向画像との相関を表す類似度を算出し、この類似度に基づいて基準勾配方向画像との一致度合いを評価しているので、検出空間内の位置によって距離画像での人体の見え方が異なる場合でも、検出空間内の人体を確実に検出できるという効果がある。しかも、距離画像によるマッチングでは、距離の測定精度や、対象物体が人体の場合はその個体差(身長、体格、姿勢など)によってマッチングの精度が左右されてしまうが、本発明によれば評価手段が、距離画像から求めた勾配方向画像と基準勾配方向画像との一致度合いを評価しているので、距離の測定精度や対象物体の個体差によらず対象物体の柔軟な検知が可能になるという効果がある。
また距離画像での人体の見え方は、人体の体格や姿勢によっても変化するが、請求項2の発明によれば、複数種類の人体モデルの各々について、複数の検出位置における基準距離画像から得た複数の基準勾配方向画像を用いているので、検出空間内の任意の位置に、体格或いは姿勢が異なる人体が存在する場合でもその人体を確実に検出することができる。
請求項3の発明によれば、0°から360°の範囲で規定される勾配方向を複数に分割した勾配方向領域の単位で、勾配方向が一致しているか否かを判定しているので、計算コストを低減できるとともに、ロバスト性を高めることができる。
請求項4の発明によれば、ノイズの影響などで安定した勾配方向画像が得られない場合でも、類似度の変動を低減することができる。
請求項5の発明によれば、勾配方向の一致した画素数から類似度を求める場合に比べて、基準勾配方向画像の大きさの影響を受けることなく、類似度を正確に評価することができる。
請求項6の発明によれば、ヒストグラムの形状を考慮して類似度を求めているので、例えば勾配方向が一致する画素の勾配方向値が、特定の勾配方向に集中している場合は、基準勾配方向画像と一致していないと判断することができ、ヒストグラムの形状を考慮しない場合に比べて、人体か否かを判定する精度が向上するという効果がある。
請求項7の発明によれば、評価手段が、勾配方向の一致する画素のみから基準勾配方向画像との一致度合いを評価する場合に比べて、勾配方向の一致していない不一致画素と類似度の両方から基準勾配方向画像との一致度合いを評価しているので、判定の精度が向上するという利点があり、また基準勾配方向画像と一部分のみが一致している人体以外の物体を誤検出する可能性を低減できる。
請求項8の発明によれば、評価手段が、勾配方向の一致する画素のみから基準勾配方向画像との一致度合いを評価する場合に比べて、勾配方向の一致していない不一致画素の画素数を基準勾配方向画像の画素数で規格化した値と、類似度の両方から基準勾配方向画像との一致度合いを評価しているので、判定の精度が向上するという利点があり、また基準勾配方向画像と一部分のみが一致している人体以外の物体を誤検出する可能性を低減できる。さらに、勾配方向の一致していない不一致画素の画素数を基準勾配方向画像の画素数で規格化した値を用いているので、基準勾配方向画像の大きさによらず、正確な判定を行うことができる。
請求項9の発明によれば、勾配方向が一致した画素数と、勾配方向が不一致の画素数とから1つの評価関数を用いて類似度を評価しているので、一致画素数及び不一致画素数から類似度を簡単に求めることができる。
請求項10の発明によれば、検出空間内に複数の人体が存在し、低い類似度では複数の人体に対応する画素領域が連結して1つの領域となっている場合でも、ピーク位置を人体の検出位置として求めることによって、複数の人体を別々に検出することができる。しかも、類似度のピーク位置を人体の検出位置としているので、基準勾配方向画像に最も近い位置を人体の検出位置として求めることができる。
請求項11の発明によれば、検出空間内に複数の人体が存在し、低い類似度では複数の人体に対応する画素領域が連結して1つの領域となっている場合でも、類似度が閾値を超える領域の重心位置を人体の検出位置として求めることによって、複数の人体を別々に検出することができる。しかも、類似度が閾値を超える領域を抽出し、その領域の重心位置を人体の検出位置として求めているので、ピーク位置を検出する場合に比べて検出処理を簡単にできる。
請求項12の発明によれば、検出空間内に複数の人体が存在し、低い類似度では複数の人体に対応する画素領域が連結して1つの領域となっている場合でも、類似度が閾値を超えた各領域内で距離値が最も小さい位置を人体の検出位置として求めることによって、複数の人体を別々に検出することができる。また、ピーク位置を検出する場合に比べて検出処理を簡単にでき、基準勾配方向画像の代表位置が頭部を基準に設定している場合は、距離値が最も小さい位置を検出することで、頭頂部の位置を正確に検出することができる。
請求項13の発明によれば、規定距離以内にある人体検出位置を同じ人体の検出位置として統合しているので1つの人体を複数の人体と誤検出するのを防止できる。
請求項14の発明によれば、複数の基準勾配方向画像について作成された複数の類似度マップ間で、抽出された領域の重なり状態から、複数の基準勾配方向画像のうち何れの基準勾配方向画像に一致しているかを判定しているので、検知空間に存在する人体を体格又は姿勢で切り分けて検出することができる。
請求項15の発明によれば、背景画像と異なる領域のみを抽出することで、背景を人体と誤検出する可能性を低減できるとともに、不要な演算を省くことによって演算時間を短縮することができる。
請求項16の発明によれば、差分値が閾値を超える領域のみを抽出することで、差分画像からノイズ領域を取り除くことができ、ノイズによる誤検出の可能性を低減するとともに、不要な演算を省くことによって演算時間を短縮することができる。
請求項17の発明によれば、距離画像から画素値が予め設定された距離範囲内にある画素の領域のみを抽出しているので、所望の領域にいる人体のみを抽出でき、不要な領域の画素を削除することによって、演算時間を短縮することができる。
請求項18の発明によれば、予想される人体よりも小さいノイズを削除することで、ノイズを誤検出する可能性を低減できるとともに、不要な演算を省くことによって演算時間を短縮することができる。
請求項19の発明によれば、距離画像内での見え方を考慮して、距離画像内の位置に応じて最小値を変化させているので、予想される人体よりも小さいノイズを確実に取り除くことができる。
請求項20の発明によれば、勾配方向が同方向となる画素領域で、その面積が人体に比べて大面積の画素領域を削除することによって、人体以外の物体を誤検出することがなく、また不要な演算を省くことによって演算時間を短縮することができる。
請求項21の発明によれば、基準勾配方向画像記憶手段に記憶させる基準勾配方向画像の数を少なくすることで、必要な記憶容量を削減することができる。
請求項22の発明によれば、基準勾配方向画像記憶手段に記憶させる基準勾配方向画像の数を4分の1に削減することができる。
請求項23の発明によれば、回転移動させる角度を例えば10度刻みとすれば、基準勾配方向画像記憶手段に記憶させる基準勾配方向画像の数を36分の1に削減することができ、必要な記憶容量を削減することができる。
請求項24の発明によれば、基準勾配方向画像とのマッチング位置と、マッチングした基準勾配方向画像の身長情報とに基づいて、実空間内での人体の立ち位置を推定することができ、立ち位置の推定結果を、例えば監視カメラや人体を照明する照明器具の制御に利用することができる。
請求項25の発明によれば、検知信頼性の低い検出結果を取り除いて、確度が高い検出結果のみを出力することができる。
以下に、本発明の実施の形態を図面に基づいて説明する。
(実施形態1)
本発明の実施形態1を図面に基づいて説明する。図1は人体検出装置Aの全体構成図であり、距離画像生成手段1と、距離画像取り込み手段2と、勾配画像生成手段3と、基準勾配方向画像記憶手段(以下、記憶手段と略称す。)4と、評価手段5と、人体位置判定手段6と、人体検知結果出力手段7とを備えている。
距離画像生成手段1は、例えば特開2006−53792号公報に開示された距離画像センサを用いて実現される。距離画像生成手段1は、LEDから検出空間Rに照射された光が、検出空間R内の対象物で反射されてCCDのような撮像素子で受光されるまでの伝搬時間を測定する。そして距離画像生成手段1は、検出空間Rを見込む撮像画像内の各画素について、当該画素の視線方向(光線方向)に存在する対象物までの距離値を上記伝搬時間から算出し、二次元配列の各画素の画素値を対象物までの距離値とした距離画像を出力する。なお距離画像生成手段1は、上記の距離画像センサに限定されるものではなく、スリット投光方式やステレオ方式やレーザ走査方式など、検出空間内の物体までの距離を求めて距離画像を生成できるものであれば、どのような構成のものでも良い。
次に、距離画像生成手段1により得られた対象空間の距離画像から対象物体を検出する技術について説明する。以下に説明する各部の機能はマイクロコンピュータにより適宜のプログラムを実行することで実現される。
距離画像生成手段1で生成された距離画像G10(図3(a)参照)は距離画像取り込み手段2によって取り込まれた後、距離画像取り込み手段2から勾配画像生成手段3に出力される。勾配画像生成手段3では、距離画像の距離値から各画素の微分方向値である勾配方向値を求め、勾配方向値を画素値とする勾配方向画像G11(図3(b)参照)を生成して、画像メモリ(図示せず)に記憶させる。例えば勾配画像生成手段3では、プリューイットフィルタ(Prewitt Filter)を用いて横方向及び縦方向の微分値を求めており、図17(a)のような3×3平方領域の中央の画素p5を着目画素とするとき、8近傍の画素p1〜p4,p6〜p9の画素値をB1〜B4,B6〜B9とすると、横方向及び縦方向の微分値ΔX,ΔYは次式で表される。
ΔX=(B1+B4+B7)−(B3+B6+B9)
ΔY=(B1+B2+B3)−(B7+B8+B9)
そして、勾配画像生成手段3では、着目画素における横方向及び縦方向の微分値が求まると、以下の(1)式を用いて着目画素における微分方向値を求めている。
(微分方向値)=tan−1(ΔY/ΔX) …(1)
ここにおいて、画素値B1〜B4,B6〜B9が距離値であるから、(1)式によって得られる微分方向値は勾配方向値であって、勾配方向値は、受光光学系17の光軸に直交する1つの平面を基準平面として、基準平面に対して各画素がどの向きの勾配を持つかを表している。つまり、勾配方向値は基準平面に対する勾配の向きだけを表しており、基準平面に対する傾斜角度は含んでおらず、対象物体の奥行き関係を示している。なお着目画素における縦方向及び横方向の微分値を求めるにあたってはプリューイットフィルタ以外の微分フィルタを用いてもよく、ソーベルフィルタ(Sobel Filter)やロバートフィルタ(Robert Filter)などの微分フィルタを用いてもよい。
また勾配画像生成手段3が、勾配方向値として0°から360°までの勾配方向をそのまま用いる代わりに、図17(b)に示すように0°から360°で規定される勾配方向を複数(例えば8個)の勾配方向領域DR0〜DR7に分割し、各々の勾配方向領域DR01〜DR7に0から7までの勾配方向値を割り当てることで、各画素の勾配方向が含まれる勾配方向領域DR0〜DR7の勾配方向値を画素値とした勾配方向画像を生成しても良く、分割数を少なくとることで演算処理の処理量を低減して計算コストを削減することができ、また勾配方向を比較的大きな単位で区分することで、ノイズに対するロバスト性を高めることができる。
そして、勾配画像生成手段3によって生成された勾配方向画像は評価手段5に与えられ、評価手段5では、作成された勾配方向画像と、記憶手段4に記憶されたテンプレート(基準勾配方向画像)との相関を示す類似度を算出する。
ここで、距離画像生成手段1から対象物体を見た時に、同一の対象物体で見え方が同じであれば、距離画像生成手段1からの測距値が変化しても、その奥行き関係が逆転しない限り距離勾配は変化が無いので、作成された勾配方向画像を基準勾配方向画像と比較することによって、対象物体までの距離によらず対象物体を確実に検出することが可能であるが、検出対象である人体は、検出空間内の検出位置によって見え方が異なるため、図2(a)に示すように同じ人物であっても立ち位置が異なれば、各位置における距離勾配画像は異なるものになる。したがって、評価手段5が、勾配画像生成手段3によって生成された勾配方向画像を基準勾配方向画像と比較する際に、位置によらず固定の基準勾配方向画像と照合した場合は人体の立ち位置によってミスマッチングが発生する可能性がある。
そこで本実施形態では、検出空間R内の複数の検出位置の各々について、各検出位置に存在する対象物体Ob(人体)の距離画像での見え方を示した複数の基準距離画像を予め求めておき、これら基準距離画像を微分して得た勾配方向画像からなる複数の基準勾配方向画像を各検出位置に対応させて記憶手段4に記憶させている。尚、距離画像生成手段1は、検出空間Rの中央位置の天井に設置されて、下方の検出空間Rを撮像している。図2(b)は基準距離画像の一例を示し、検出空間R内の左上隅、略中央、右下隅の3つの検出位置P1,P2,P3に対象物体Obが存在する場合の基準距離画像G1,G2,G3が予め求められ、これらの基準距離画像G1,G2,G3を微分して得た基準勾配方向画像TP1,TP2,TP3(図2(c)参照)が各検出位置における基準勾配方向画像として記憶される。
そして、評価手段5は、勾配画像生成手段3によって生成された勾配方向画像を、勾配方向画像内の検出位置に応じた基準勾配方向画像と照合しているので、検出空間内の検出位置によって対象物体の見え方が異なる場合でも、各検出位置での見え方を示す基準距離画像から作成した基準勾配方向画像とのマッチングを行うことによって、対象物体の人体を確実に検出することができる。例えば評価手段5では、図3(c)に示すように、勾配画像生成手段3によって生成される距離勾配画像G11を格子状にブロック化して、各々のブロックBL(x,y)[x=1〜11,y=1〜10]毎に、各ブロックBL(x,y)に所定の人体モデルが存在する場合の距離画像での見え方を示した基準距離画像より基準勾配方向画像TP(x,y)を求め、各ブロックBL(x,y)で使用する基準勾配方向画像として予め設定している。なお図3(c)中のTP(2,9)、TP(6,8)、TP(6,4),TP(11,1)は、それぞれ、ブロックBL(2,9)、BL(6,8)、BL(6,4)、BL(11,1)で使用される基準勾配方向画像の一例を示している。
そして評価手段5は、距離勾配画像G11を、各ブロックBL(x,y)に割り当てた基準勾配方向画像TP(x、y)とそれぞれマッチングすることで、基準勾配方向画像TP(x,y)との相関を示す類似度をそれぞれ算出しており、各ブロックBL(x,y)に対応する座標位置に当該ブロックBL(x,y)の基準勾配方向画像との類似度をマッピングする(図3(d)参照)。なお、各ブロックの大きさは例えば5×5画素に設定してあるが、対象物体の大きさや解像度などを考慮して、適宜設定すればよい。
ここで、評価手段5によるマッチング処理についてより詳細に説明する。評価手段5では、作成された勾配方向画像内の各検出位置において、勾配画像生成手段3により生成された勾配方向画像の各画素の画素値(勾配方向値)を、当該検出位置に対応する基準勾配方向画像の各画素の画素値(勾配方向値)と比較するのであるが、勾配方向値が同じ値となる画素数を求め、この画素数を基準勾配方向画像の画素数で規格化した値を類似度として求めている。このように勾配方向値が一致した画素数を基準勾配方向画像の画素数で規格化しているので、算出された類似度は基準勾配方向画像の大きさによって影響を受けることがなく、類似度を用いて正確な判定を行うことができる。
図3(d)は、各ブロックBL(x,y)で算出された類似度を、二次元配列上(xy平面上)の各ブロックBL(x,y)の座標位置に並べて作成した類似度マップMAPを示し、類似度マップMAP内には対象物体OB1,OB2の中心付近で類似度のピークPK1,PK2が出現する。人体位置判定手段6では、評価手段5により算出された各画素位置での類似度をもとに、類似度のピーク位置PK1,PK2を抽出し、各ピーク位置PK1,PK2における類似度が所定の閾値以上であれば、これらのピーク位置PK1,PK2を人体の検出位置として求める。そして、各ピーク位置PK1,PK2でそれぞれマッチングした基準勾配方向画像の体格及び姿勢の人体が存在すると判断して、人体検知結果出力手段7から人体の検出位置D1,D2を外部に出力させる(図3(e)参照)。
なおピーク位置の検出方法としてはラプラシアンフィルタや山登り法などの一般的な手法を用いても良いが、本実施形態では以下のような方法を用いて人体位置を検出する。すなわち人体位置判定手段6は、類似度マップMAPから類似度の最大値(ピーク位置P1における類似度)を求めた後、図4(a)に示すように、類似度の最大値から一定間隔刻み(例えば類似度が1刻み)の閾値で類似度マップMAPをスライスしたスライス面SP1〜SP4をそれぞれ求め、各スライス面SP1〜SP4に現れる類似度が閾値以上の相関領域a,b,cを検出する。次に人体位置判定手段6は、各スライス面SP1〜SP4に出現する相関領域a,b,cを、閾値が1つ下のスライス面に現れる相関領域と比較して、相関領域の重なりを検出することにより、初めて相関領域がスライス面SP1〜SP4に現れた時のピーク位置を検出しており、図4(a)の例では相関領域aが初めてスライス面SP1に現れた位置をピーク位置P1、相関領域bが初めてスライス面SP2に現れた位置をピーク位置P2として検出する。そして、人体位置判定手段6は、類似度マップ中に出現するピーク位置PK1,PK2を人体の検出位置として求めている。而して、図4(c)に示すように距離画像内で検出対象の2人の人体Ob1,Ob2が接近しているために、スライス面SP4のように低い類似度では2つの相関領域(複数の人体に対応する画素領域)が連結した1つの領域cになっていたとしても、ピーク位置PK1,PK2は個々の人体毎に現れるから、複数の人体を別々に検出でき、しかも類似度のピーク位置を検出位置としているので、基準勾配方向画像に最も近い画素位置を人体の検出位置として求めることができる。尚、人体位置判定手段6がピーク位置を検出する際に、類似度の分布に対して平滑フィルタをかけ、小振幅のスパイク状ノイズを除去してから、ピーク位置の抽出を開始するようにしてもよく、ピーク位置を精度良く抽出することができる。
ここにおいて、人体位置判定手段6では、上述の判定処理の結果、検出空間R内で人体の存在位置を検出するのであるが、人体の存在位置が複数検出された場合に複数の人体検出位置の間隔が規定距離(例えば標準体型の肩幅の半分の距離)以内であれば、同じ人体を検出したものと判断して、人体検出位置を統合することも好ましく、1つの人体を複数の人体と誤検出するのを防止できる。尚、この場合には複数の人体検出位置でマッチングした複数の基準勾配方向画像の何れかと一致したものと判定すれば良い。
また、人体検知結果出力手段7は、人体位置判定手段6で検出された人体位置を外部に出力するのであるが、人体の検出位置をその検出時刻と対応付けて図示しないメモリに記憶させるとともに、各時刻での検出位置を時系列方向で追跡することによって、同一の人体の検出結果を対応付けて記憶させ、追跡回数が所定の規定回数よりも少ない人体検出結果は出力から破棄しても良い。人体検知結果出力手段7では、人体位置判定手段6で判定された人体の検出位置のうち、検知回数が規定回数よりも少ない人体検出位置はノイズを誤検知した可能性が高いので、このような検知信頼性の低い人体検知結果を出力から破棄することで、検知の確度が高い結果のみを出力することができ、例えば検知エリアを通過する人数を計数する場合のように高い検知精度が要求される使用用途においても、より精度の高い検知出力を提供することができる。
以上説明したように本実施形態では、検出空間R内の複数の検出位置の各々について、各検出位置に存在する人体の距離画像での見え方を示した複数の基準距離画像を予め用意し、これら複数の基準距離画像をそれぞれ微分して得た複数の基準勾配方向画像を記憶手段4に記憶させており、評価手段5では、勾配画像生成手段3により生成された勾配方向画像を記憶手段4に記憶された基準勾配方向画像と比較する際に、勾配方向画像内の各検出位置に応じた基準勾配方向画像と比較することによって、基準勾配方向画像との相関を示す類似度を算出し、この類似度に基づいて基準勾配方向画像との一致度合いを評価しているので、検出空間内の検出位置によって距離画像での人体の見え方が異なる場合でも、検出空間内にいる人体を確実に検出することができる。
尚、検出空間内の各検出位置における基準距離画像は、人体検出装置Aが実際の検出空間Rに設置された状態で、検知対象となる人体を検出空間における複数の検出位置に移動させた後、距離画像取り込み手段2に距離画像生成手段1から距離画像を取得させることで各検出位置での基準距離画像を予め求めておき、勾配画像生成手段3で勾配方向値を求めて作成された勾配方向画像を、各検出位置における基準勾配方向画像として記憶手段4に記憶させれば良く、3次元CADのような他のアプリケーションソフトを用いることなく、検知対象の人体の各検出位置における基準勾配方向画像を作成することができる。
(実施形態2)
本発明の実施形態2を図5及び図6に基づいて説明する。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
上述の実施形態1では、評価手段5が、勾配画像生成手段3により生成された勾配方向画像と基準勾配方向画像との類似度を求める際に、基準勾配方向画像と勾配方向値が一致した画素数から類似度を求めているが、本実施形態では、評価手段5が、基準勾配方向画像と勾配方向値が一致した画素について、勾配方向値を階級値としたヒストグラムを求め、このヒストグラムの形状をもとに基準勾配方向画像との一致度合いを示す類似度を求めている。
図5(a)はN×M画素の基準勾配方向画像TPの一例を示し、基準勾配方向画像TPを構成する画素の画素値として0〜7までの勾配方向値が割り当てられ、N×M画素の領域のうち対象物体が存在しない画素については勾配方向値として無効な値(例えば255)が割り当てられている。また図5(b)は基準勾配方向画像TPと比較される勾配方向画像から切り出したN×M画素領域の一例を示し、基準勾配方向画像TP内で対象物体が存在しない画素の画素値には無効な値(例えば999)を表示させることでマスクしている。そして、図5(c)は、同図(a)の基準勾配方向画像TPと、同図(b)の勾配方向画像の各画素の画素値を比較した結果を示し、画素値が一致した画素についてはその画素値(勾配方向値)を表示させ、画素値が一致しない画素については無効な値(例えば10)を表示させている。
ここで、対象物体が人体の場合はどの方向から人体を見たとしても、人体に対応する勾配方向画像を構成する画素の勾配方向値が特定の勾配方向値に集中することは考えにくい。したがって、評価手段5では、基準勾配方向画像TPと勾配方向値が一致した画素について、0〜7までの勾配方向値を階級値とするヒストグラムを求めた結果、図6(b)のように一致画素数が特定の勾配方向値(例えば「3」)に集中するようなヒストグラムが得られた場合は人体ではない物体を検出したと判断し、図6(a)のように一致画素数が特定の勾配方向値に集中していない場合のみ、つまり一致画素数が規定値以上存在する勾配方向値が所定数(例えば3方向)ある場合のみ人体を検出できたと判断するので、ヒストグラムの形状を考慮しない場合に比べて検出された物体が人体か非人体かを精度良く判別することができる。また評価手段5では、上記ヒストグラムを求めた後、ある勾配方向値の画素数の、一致画素の総画素数に対する割合が所定の閾値を超えた場合は、人体ではない物体を検出したと判断してもよいし、一致画素数が規定値以上存在する勾配方向値が所定数あり、且つ、特定の勾配方向値の画素数の総画素数に対する割合が所定の閾値以下の場合のみ、人体を検出できたと判断するようにしてもよい。
また評価手段5では、勾配画像生成手段3により生成された勾配方向画像の各画素の画素値(勾配方向値)を、当該検出位置に対応する基準勾配方向画像と比較する際に、画素値(勾配方向値)が同じ値となる画素数を、基準勾配方向画像と一致した画素数として求めているが、画素値が同じ値になる画素、つまり当該画素の勾配方向が同じ勾配方向領域に存在する画素だけではなく、隣接する勾配方向領域に存在する画素を、勾配方向が一致したと評価してもよい。すなわち評価手段5は、基準勾配方向画像の画素と勾配方向値が同じ画素だけではなく、勾配方向値が1方向ずれている画素も基準勾配方向画像と一致していると評価しており、勾配方向値が同じか又は隣接する勾配方向領域の勾配方向値となる画素数を求め、この画素数を基準勾配方向画像の画素数で規格化した値と類似度として求めても良く、ノイズなどの影響を受けて安定した勾配方向画像が得られない場合でも類似度の変動を低減できる。
また更に評価手段5では、勾配画像生成手段3により生成された勾配方向画像から切り出したN×M画素領域の画像について、画素値である勾配方向値が基準勾配方向画像TPの対応画素の勾配方向値と一定値以上(例えば3方向以上)離れている画素、すなわち基準勾配方向画像TPの画素の勾配方向値が1であれば、勾配方向値が4,5,6である画素を不一致画素として抽出しており、類似度が所定の閾値以上となる場合でも、不一致画素の画素数が所定の基準値以上あると、人体ではない物体を検知したと判断するので、人体の検出精度を高めることができる。この方法によれば、人体の一部とは形状が似ているものの、人体の他の部位とは形状が似ていない非人体を、人体と区別して判別できるから誤検出を低減でき、判定の精度が向上するという効果がある。
また評価手段5では、勾配画像生成手段3により生成された勾配方向画像から切り出したN×M画素領域の画像について、画素値である勾配方向値が基準勾配方向画像TPの対応画素の勾配方向値と同じ値か若しくは隣接する勾配方向領域の勾配方向値であれば、勾配方向が一致したと判定するとともに、画素値である勾配方向値が基準勾配方向画像TPの対応画素の勾配方向値と一定値以上離れている画素を不一致画素と判定した後、勾配方向が一致した画素数と不一致の画素数の両方に基づいて、基準勾配方向画像との一致、不一致を判定してもよく、例えば勾配方向が一致した画素に1点、勾配方向が不一致の画素に(−1)点を割り当てた後、全ての画素の得点を集計し、集計結果が所定の基準値以上であれば、基準勾配方向画像と一致したと判定し、基準値未満であれば基準勾配方向画像と不一致であると判定してもよい。ここで、勾配方向が一致したと判断された画素の中でも、勾配方向値が基準勾配方向画像の対応画素と同じ画素については2点を、基準勾配方向画像の対応画素と勾配方向が1方向ずれている画素については1点を加算するというように、重み付けを行うこともでき、基準勾配方向画像との一致、不一致をより精度良く判断することができる。このように評価手段5では、勾配方向が一致した画素数と勾配方向が不一致の画素数の両方から類似度を導出する評価関数を用意し、この評価関数を用いて類似度を算出しているので、一致画素数及び不一致画素数から類似度を簡単に求めることができる。
なお評価手段5では、勾配画像生成手段3により生成された勾配方向画像から切り出したN×M画素領域の画像と、基準勾配方向画像との一致、不一致を評価する際に、基準勾配方向画像の対応する画素と勾配方向値が一致した画素数、或いは、基準勾配方向画像の対応する画素と勾配方向値が不一致の画素数をそれぞれ所定の閾値と比較することによって、基準勾配方向画像との一致、不一致を判定しても良く、勾配方向値が一致した画素数だけで一致、不一致を判定する場合に比べて判定の精度が向上するという利点がある。また一致、不一致の判定の両方、又は、何れか一方の評価を、基準勾配方向画像の総画素数で正規化した値に基づいて行うようにしても良く、一致画素の画素数或いは不一致画素の画素数を基準勾配方向画像の画素数で規格化した値を用いているので、基準勾配方向画像の大きさによらず、正確な判定を行うことができる。
(実施形態3)
以下に本発明の実施形態3について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
上述の実施形態1では、人体位置判定手段6が、類似度マップMAP内に出現したピーク位置PK1,PK2を求めることによって、人体位置を検出しているが、本実施形態では、評価手段5の評価結果に基づいて、勾配方向画像G11の各画素位置での類似度を二次元配列上(xy平面上)に並べて類似度マップMAPを作成した後(図3(d)参照)、この類似度マップMAPから類似度が規定閾値Th1未満である部分をカットすることによって、図4(b)に示すように類似度が規定閾値Th1以上となる相関領域d,eを抽出し、各領域にラベリング処理を施す。この規定閾値Th1は、規定閾値Th1未満であれば人体の代表位置を表していないと予想される類似度の値であり、予め実験などで求められた値(例えば10%)に設定されている。そして、人体位置判定手段6では、同じラベルが付与された画素の集まりからなる相関領域d,eの重心位置をそれぞれ検出し、各相関領域d,eの重心位置を人体の検出位置として求めている。
このように、本実施形態では低い類似度においては複数の相関領域が互いに連結して1つの領域となっている場合でも、類似度が規定閾値Th1未満の部分をカットすることによって、それぞれ独立した相関領域を求めることができる。そして人体位置判定手段6は、個々の相関領域の重心位置を人体の検出位置として求めることによって、複数の人体を別々に検出することができ、ピーク位置を抽出する場合に比べて少ない計算量で人体のマッチング位置を求めることができる。
なお人体位置判定手段6は、類似度マップMAPから類似度が規定閾値Th1以上となる相関領域d,eを抽出した後、各相関領域d,eの重心位置を人体のマッチング位置として求めているが、例えば距離画像生成手段1が検出空間Rの上方位置に設置されている場合は、各相関領域d,e内で距離画像生成手段1までの距離が最も近い位置が、人体の頭頂部の位置であると考えられるので、類似度マップMAPから類似度が規定閾値Th1以上となる相関領域d,eを抽出してラベリング処理を施した後、同一のラベルが付与された画素の集まりからなる個々の相関領域d,eにおいて距離画像の距離値が最小となる画素を抽出して、この画素位置を人体の検出位置として求めてもよい。このような検出方法を用いることでも、類似度が規定閾値Th1未満の部分をカットすることによって、低い類似度では互いに連結して1つの領域となっている複数の相関領域を、それぞれ独立した相関領域として求めることができ、また個々の相関領域のうち距離画像生成手段1に最も近い画素位置を人体の検出位置として求めているので、例えば頭頂部を基準勾配方向画像の代表点としている場合は、マッチング評価時に頭頂部の位置を正確に検出することができる。なお相関領域d,eにおいて距離画像での距離値が最小となる位置ではなく、天井面からの距離値が最小となる位置を検出位置とするのも好ましく、人体位置判定手段6が、相関領域d,e内の各画素の座標(x,y)とその距離値r、並びに距離画像生成手段1の設置位置パラメータ(既知)を用いて、距離値rを天井面からの垂直距離Zに変換した後、垂直距離Zが最小となる位置を人体の検出位置として求めれば、人体の頭頂部の位置をより高い精度で検出することができる。また人体位置判定手段6では、距離画像での距離値r或いは垂直距離Zを用いて頭頂部の位置を検出した後、頭頂部の高さ位置から、身長が所定の基準身長以上の人体のみしか検出しないようにすることもできる。
(実施形態4)
以下に本発明の実施形態4について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
上述の各実施形態では、成人男性および成人女性の体格の平均値から求めた標準人体モデルが直立している状態を想定し、各検出位置において標準体格で直立姿勢の人体の距離画像での見え方を示す複数の基準距離画像を予め用意して、複数の基準距離画像を微分して得た勾配方向画像を標準人体モデルの基準勾配方向画像として記憶手段4に記憶させているが、本実施形態では、実施形態1〜3で説明した人体検出装置において、体格の異なる複数の人間(例えば標準的な身長の成人男性、成人女性や、標準身長よりも身長が高い又は低い成人男性および成人女性や、10歳代の標準的な体格の子供など)が、検出空間内の複数の検出位置にそれぞれ直立した状態での見え方を示す複数の基準距離画像を用意し、これら複数の基準勾配画像を微分して求めた勾配方向画像を記憶手段4に記憶させており、体格が異なっているために距離画像での見え方が異なる場合でも、検出対象の人体をその体格も含めて検出することができる。また基準勾配方向画像として、体格の異なる複数種類の人間が、検出空間内の複数の検出位置に、複数種類の姿勢(直立している状態や、屈んでいる状態など)で存在する場合の見え方を示す複数の基準距離画像を予め用意しておき、これら複数の基準距離画像を微分して求めた勾配方向画像を用いるのも好ましく、体格や姿勢が異なっているために距離画像での見え方が異なる場合でも、検出対象の人体をその体格や姿勢も含めて検出することができる。
ここで、記憶手段4に、図7(a)に示すように標準体格で直立姿勢の人体Ob1が検出空間R内の複数の検出位置に存在する場合の見え方を示した距離画像から求めた勾配方向画像よりなる標準人体モデルの基準勾配方向画像TP1,TP2,TP3…(図7(b)参照)と、前屈みになるなどして低い姿勢をとっている人体Ob3が上記複数の検出位置に存在する場合の見え方を示した距離画像から求めた勾配方向画像よりなる低姿勢モデルの基準勾配方向画像TP11,TP12,TP13…(図7(c)参照)とが予め登録されており、標準人体モデルの基準勾配方向画像TP1〜TP3と、低姿勢モデルの基準勾配方向画像TP11〜TP13とを用いて人体の検出を行う場合について以下に説明する。
図7(a)に示すように検出空間R内に標準体型で直立姿勢の人体Ob1と、低姿勢の人体Ob2とが並んでいる状態で、距離画像生成手段1によって検出空間Rの距離画像G21(図8(a)参照)が撮像され、距離画像取り込み手段2によって距離画像生成手段1から距離画像G21が取り込まれると、勾配画像生成手段3が、距離画像の距離値から各画素の微分方向値である勾配方向値を求め、勾配方向値を画素値とする勾配方向画像G22を生成する(図8(b)参照)。次に評価手段5が、勾配画像生成手段3により生成された勾配方向画像G22と、記憶手段4に記憶された標準人体モデルの基準勾配方向画像TP1〜TP3、及び、低姿勢モデルの基準勾配方向画像TP11〜TP13とのマッチングをそれぞれ行い、標準人体モデルの基準勾配方向画像TP1〜TP3との類似度から類似度マップMAP1を作成するとともに、低姿勢モデルの基準勾配方向画像TP11〜TP13との類似度から類似度マップMAP2を作成する(図8(c)(d)参照)。
次に人体位置判定手段6は、標準人体モデルの基準勾配方向画像との類似度マップMAP1と、低姿勢モデルの基準勾配方向画像との類似度マップMAP2の各々について実施形態1〜3で説明した方法により人体のマッチング位置を求めており、標準人体モデルの基準勾配方向画像では標準体型の人体が検出できるのみで、標準体型の人体に比べて身長の低い低姿勢の人体は検出できないのに対して、低姿勢モデルの基準勾配方向画像では低姿勢の人体と標準体型の人体の両方を検出できる。したがって、類似度マップMAP1については図8(e)に示すように標準体型の人体Ob1に対応した位置のみにマッチング位置MP11が現れて、低姿勢の人体Ob2については検出されず、類似度マップMAP2については図8(f)に示すように標準体型の人体Ob1に対応した位置と低姿勢の人体Ob2に対応した位置とにそれぞれマッチング位置MP21,MP22が現れる。
ここで、人体位置判定手段6では、標準人体モデルの基準勾配方向画像とマッチングを行って求めた類似度マップMAP1中のマッチング位置MP11と、低姿勢モデルの基準勾配方向画像とマッチングを行って求めた類似度マップMAP2中のマッチング位置MP21,MP22との重なり状態から、各マッチング位置で一致している基準勾配方向画像が、標準人体モデルと低姿勢モデルのうち何れのモデルであるかを判定する。すなわち、標準人体モデルの基準勾配方向画像TP1〜TP3では、標準体型で直立姿勢の人体が検出できるのみで、低い姿勢をとっている人体を検出することができず、低姿勢モデルの基準勾配方向画像TP11〜TP13では低姿勢の人体と直立姿勢の人体の両方を検出できることから、人体位置判定手段6は、低姿勢モデルの基準勾配方向画像とのマッチング位置MP21,MP22のうち、標準人体モデルの基準勾配方向画像とのマッチング位置MP11から所定距離内にあるマッチング位置MP22をマッチング位置MP11と重複しているマッチング位置と判定して、このマッチング位置MP22を類似度マップMAP2から除去した後、図8(g)に示すように低姿勢モデルの基準勾配方向画像とのマッチング結果と、標準人体モデルの基準勾配方向画像とのマッチング結果を統合し、マッチング位置MP11を標準体型で直立姿勢の人体の検出位置、マッチング位置MP21を低姿勢の人体の検出位置として人体検知結果出力手段7に出力する。そして、人体検知結果出力手段7は、標準体型の人体の検出位置を示すマークMK1と、低姿勢の人体の検出位置を示すマークMK2を付加した距離画像G23を出力させている(図8(h)参照)。このように本実施形態では、体格や姿勢によって見え方の異なる複数種類の人体モデル(本実施形態では標準人体モデルと低姿勢モデルの2種類)についてそれぞれ各検出位置での見え方を示す複数の基準勾配方向画像を用意しており、それぞれの基準勾配方向画像とのマッチングを行って求めた類似度マップ中のマッチング位置の重なり状態から、個々のマッチング位置で、複数種類の基準勾配方向画像のうち何れの基準勾配方向画像と一致しているのかを、切り分けて判別することができる。
ここにおいて、人体位置判定手段6では、上述の判定処理の結果、検出空間R内に存在する人体のマッチング位置を検出するのであるが、検出空間R内に複数のマッチング位置が検出された場合に、複数のマッチング位置の間隔が所定の距離閾値(例えば標準体型の肩幅の半分の距離)以内であれば、同じ人体を検出したものと判断して、マッチング位置を統合することも好ましく、この場合は、統合されたマッチング位置に対応する基準勾配方向画像の何れかと一致したものと判定すれば良い。
ところで本実施形態では、勾配方向画像と標準人体モデル及び低姿勢モデルの基準勾配方向画像とのマッチングをそれぞれ行って、2種類の基準勾配方向画像に対応する類似度マップMAP1,MAP2を作成した後、各類似度マップMAP1,MAP2に現れるマッチング位置の重なり状態から、各マッチング位置で何れの基準勾配方向画像に一致しているのかを切り分けて判別しているが、類似度マップMAP1,MAP2を作成した後、人体位置判定手段6が、図9(a)に示すように規定閾値Th1で類似度マップMAP1,MAP2をスライスしたスライス面SP1,SP2に現れる相関領域(すなわち類似度が規定閾値Th1以上となる領域)をそれぞれ求め、図9(b)に示すように類似度マップMAP1に現れる相関領域aと、類似度マップMAP2に現れる相関領域b,cとの重なり状態から、各相関領域で一致している基準勾配方向画像が、標準人体モデルと低姿勢モデルのうち何れのモデルの基準勾配方向画像かを判定するようにしてもよい。上述のように、標準人体モデルの基準勾配方向画像TP1〜TP3では、標準体型の人体が検出できるのみで、標準体型に比べて小柄な低姿勢の人体を検出することはできず、低姿勢モデルの基準勾配方向画像TP11〜TP13では低姿勢の人体と標準体型の人体の両方を検出できることから、人体位置判定手段6では、標準人体モデルとの類似度を示す類似度マップMAP1から求めたスライス面SP1に現れる相関領域aを標準体型の人体の検出領域として判断するとともに、低姿勢モデルとの類似度を示す類似度マップMAP2から求めたスライス面SP2に現れる相関領域b、cのうち、標準体型の人体の検出位置である相関領域aと重なる領域cを削除して、残った相関領域bを低姿勢の人体の検出位置と判断する。そして、人体位置判定手段6では、標準体型の人体の検出位置である検出領域aと、低姿勢の人体の検出位置である検出領域bとを統合したものを検出結果として出力しており(図9(c)参照)、標準人体モデルの基準勾配方向画像と低姿勢モデルの基準勾配方向画像のうち何れの基準勾配方向画像と一致しているのかを、切り分けて判別することができる。
尚、本実施形態では体格或いは姿勢が異なる複数種類の基準勾配方向画像として、標準人体モデルの基準勾配方向画像と、低姿勢モデルの基準勾配方向画像の2種類を検出空間内の各検出位置で用意しているが、体格或いは姿勢が異なる3種類以上の基準勾配方向画像を各検出位置で用意して、記憶手段4に記憶させておいても良い。この場合、評価手段5では、勾配画像生成手段3により作成された勾配方向画像と、複数種類の基準勾配方向画像とのマッチングをそれぞれ行って、各基準勾配方向画像との類似度から複数の類似度マップをそれぞれ作成する。そして、人体位置判定手段6が、複数の類似度マップからマッピング位置をそれぞれ抽出し、複数種類の基準勾配方向画像のうち唯一性が高いもの(すなわちマッチング位置が重なる基準勾配方向画像の数が少ないもの)から順番に、個々の基準勾配方向画像に対応するマッチング位置を決定して、決定されたマッチング位置を残りの基準勾配方向画像との類似度マップから除去していくことで、複数の基準勾配方向画像にそれぞれ対応するマッチング位置を決定することができ、最終的に複数種類の基準勾配方向画像にそれぞれ対応するマッチング位置を統合することで、個々のマッチング位置で、複数種類の基準勾配方向画像のうち何れの基準勾配方向画像と一致しているのかを、切り分けて判別することができる。
(実施形態5)
以下に本発明の実施形態5について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態は上述の実施形態1〜4と距離画像取り込み手段2による距離画像の取り込み方法が異なっており、距離画像の取り込み方法以外は上述の各実施形態と同様であるので、その説明は省略し、本実施形態の特徴部分のみを説明する。
上述の実施形態1では、距離画像生成手段1により撮影された検出空間Rの距離画像を、距離画像取り込み手段2がそのまま取り込んでいるが、本実施形態では、検出空間R内に予め人がいない状態で距離画像生成手段1により撮影された背景画像を記憶する背景画像記憶部(図示せず)を距離画像取り込み手段2に設け、距離画像取り込み手段2では、距離画像生成手段1から取り込んだ現在の距離画像と、背景画像記憶部に記憶された背景画像との差分演算を行い、背景差分により得られた差分画像を勾配画像生成手段3に出力している。
このように本実施形態では、距離画像生成手段1により現時点で撮像された距離画像と、背景画像記憶部に記憶された背景画像との差分演算を行い、差分演算によって得られた距離画像について勾配画像生成手段3が勾配方向画像を作成し、評価手段5が基準勾配方向画像との評価を行っているので、背景画像から変化している動体領域のみを演算対象とすることで、不要な計算を省いて演算時間を短縮することができ、また背景部分を人体と誤検出する可能性を低減することもできる。
ここで、距離画像生成手段1により撮影される距離画像に比較的多くのノイズが発生するような撮影環境では、背景画像との差分演算を行って得られた距離画像において、動体の存在しない部分でもノイズ成分が存在するために、差分値がゼロにならない可能性があり、背景差分を行っても動体領域のみを抽出することができない可能性がある。そこで、距離画像取り込み手段2では、距離画像生成手段1から取り込んだ現在の距離画像と背景画像との差分演算を行った後、差分画像の各画素の画素値(差分値)のヒストグラムを求め(図10参照)、このヒストグラムをもとにノイズか否かを判定するための閾値Th2を決定し、画素値(差分値)が閾値Th2未満である画素をノイズ領域としてカットし、残りの画素(差分値が閾値Th2以上の画像)のみからなる差分画像を勾配画像生成手段3に出力してもよく、ノイズ領域を除いた動体領域のみの距離画像を勾配画像生成手段3に出力することができる。なお、距離画像取り込み手段2では、例えばヒストグラムにおいて最大度数Npのときの階級値x1を求めるとともに、階級値がx1より高い側で度数が最大度数Npに所定の係数kを乗じた値(Np×k)となるときの階級値x2を求めて、両者の差分dX(=x2−x1)だけ階級値x2からシフトさせた階級値x3(=x2+dX)を差分値の閾値Th2(=x3)に決定しており、背景差分後の距離画像から画素値が閾値Th2未満となる画素をカットすることで、ノイズ領域の画素を除いた距離画像を得ることができ、ノイズによる誤検出の可能性を低減するとともに、不要な演算を省くことによって演算時間を短縮することができる。なお係数kは、度数が比較的低い階級値を除外できるよう例えばk=0.2程度に設定すればよく、低い度数位置を示す階級値のばらつきに左右されることなく、ノイズ成分を除いた対象物体の画素を抽出することができる。
このように距離画像取り込み手段2では、背景画像との差分演算を行って動体領域のみを抽出する事前処理を行うことで、不要な領域を削除しているのであるが、事前処理によって得られた距離画像から、さらに人体以外の画素領域を除外することが好ましい。図11は事前処理後の距離画像を二値化した説明図であり、事前処理で抽出された領域A1,A2,A3を白、それ以外の領域を黒で図示している。そして、距離画像取り込み手段2では、事前処理で抽出された領域A1,A2,A3の面積を、人体を撮影した場合に抽出される予想人体領域の最小人体面積と比較し、抽出された領域が、想定される人体の大きさの最小値(最小人体面積)よりも小さい領域A2,A3は人体以外の物体を検出したと判断して、これらの領域A2,A3を削除しており、人体以外のノイズ領域を削除することによって、ノイズの影響をさらに低減でき、また演算速度の更なる向上を図ることができる。
ここにおいて、最小人体面積の設定値は、距離画像内の位置によって変化させるのが好ましい。図12(a)は距離画像G30内の検出位置によって検出対象の人体の見え方が異なる様子を示しており、画面の中央に距離画像生成手段1が設置されて下方を撮影している場合を考えると、距離画像G30の中央では人体Ob1を上方から見下ろすことになるため、人体Ob1が小さく映る。一方、距離画像G30の端では人体Ob2を斜め上方から見下ろすことになるので、人体Ob1が大きく映ることになる。したがって、距離画像取り込み手段2では、距離画像G30の中心位置を中心とする半径r1の円形領域AR1では最小人体面積をSth1に設定するとともに、距離画像G30の中心位置を中心とする半径r2(>r1)の円と半径r1の円とで囲まれた環状領域AR2では最小人体面積の設定値をSth2(>Sth1)とし、さらに半径r2の円の外側の領域AR3では最小人体面積の設定値をSth3(>Sth2)としている。このように、事前処理で抽出された領域が人体か否かを判定するための最小人体面積の設定は、距離画像G30の中央に近いほど設定値が小さく、画面の端に近いほど設定値が大きくなるように段階的に設定されているので、画面内の位置によって人体が大きく映ったり、小さく映ったりする場合でも、画面内の位置によって人体の写り方に合わせて最小人体面積の設定値を異ならせることで、人体に対応する領域を誤って削除することなく、人体以外のノイズ領域をできるだけ多く削除することができる。
(実施形態6)
以下に本発明の実施形態6について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態は上述の実施形態1〜4と距離画像取り込み手段2による距離画像の取り込み方法が異なっており、距離画像の取り込み方法以外は上述の各実施形態と同様であるので、その説明は省略し、本実施形態の特徴部分のみを説明する。
上述の実施形態1では、距離画像生成手段1により撮影された検出空間Rの距離画像を、距離画像取り込み手段2がそのまま取り込んでいるが、本実施形態では、距離画像取り込み手段2が、距離画像生成手段1から取り込んだ距離画像より、画素値(つまり距離値)が予め設定された距離範囲内である画素のみを抽出して得た距離画像を、勾配画像生成手段3に出力している。ここで、距離画像生成手段1が天井付近に下方を見下ろすようにして設置されている場合、上記距離範囲の下限値(距離閾値と言う)は、距離画像生成手段1から検出空間Rにいる標準体格モデルの人体の腰位置までの距離値に設定しておくのが好ましく、検出空間Rにいる人体は、その腰位置よりも上方部分を検出することができる。また人体の腰位置よりも下方にいる小動物や人体以外の物体を誤検出するのを防止できるから、不要な領域を演算対象から除外することによって、不要な計算を省いて演算時間を短縮することができる。尚、検出空間Rの中央部の天井に距離画像生成手段1が設置されている場合、検出空間Rの中央にいる人体に比べて、検出空間Rの端にいる人体の方が、距離画像生成手段1からの距離が遠くなるので、上記の距離閾値は、検出空間Rの端にいる人体の腰位置までの距離に設定するのが好ましく、検出空間Rにいる人体を確実に検出することができる。
なお距離画像取り込み手段2が、距離画像での各画素の距離値と距離閾値とを比較し、距離値が距離閾値以下の画素のみを抽出することで背の低い物体を除外する代わりに、距離画像での各画素の座標(x,y)と、当該画素の視線方向に存在する対象物体までの距離rと、画像生成手段1の設置位置(既知)とを用いて、画像生成手段1の鉛直下方位置を原点とする実空間距離座標系(X,Y,Z)における対象物体の存在位置を求め、実空間距離座標系での距離値X、距離値Y、又は距離値Zのうち少なくとも何れか1つと所定の閾値を比較し、その比較結果に応じて不要な領域の画素を演算対象から除外してもよい。例えば距離画像取り込み手段2が、距離値X又は距離値Yの一方或いはその両方を所定の距離閾値と比較し、距離値X又は距離値Yの一方或いはその両方が所定の距離範囲にある画素のみを抽出するようにすれば、XY平面内で画像生成手段1から所定の距離範囲に存在する人体のみを抽出し、上記距離範囲外にある画素については演算対象から除外することができる。また距離画像取り込み手段2が、距離値Zを所定の距離下限値、距離上限値と比較し、距離値Zが距離下限値よりも高く且つ距離上限値よりも低い画素のみを抽出するようにすれば、所定の高さ範囲にある対象物体のみを抽出することができ、距離値Zが距離下限値以下、又は、距離上限値以上となる物体を除外することができる。
このように距離画像取り込み手段2では、距離値が距離閾値以下となる画素のみを抽出する事前処理や、実空間距離座標系での距離値X,Y,Zと所定の距離閾値とを比較した結果に基づいて不要な領域の画素を除外する事前処理を行うことで、不要な領域の画素を演算対象から削除しているのであるが、事前処理によって得られた距離画像から、さらに人体以外の画素領域を除外することが好ましい。すなわち本実施形態においても、実施形態5で説明したように事前処理で抽出された領域の面積を、人体を撮影した場合に抽出される予想人体領域の最小人体面積と比較し、面積が最小人体面積よりも小さい領域を削除してもよく、人体以外のノイズ領域を演算対象から除外することができ、ノイズの影響を低減するとともに、演算速度の更なる向上を図ることができる。
(実施形態7)
以下に本発明の実施形態7について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態は上述の実施形態1〜4と距離画像取り込み手段2による距離画像の取り込み方法が異なっており、距離画像の取り込み方法以外は上述の各実施形態と同様であるので、その説明は省略し、本実施形態の特徴部分のみを説明する。
上述の実施形態5,6では、距離画像取り込み手段2が、取り込んだ距離画像に事前処理を施すことによって、人体以外の不要な領域を削除しているのに対して、本実施形態では、勾配画像生成手段3が、距離画像取り込み手段2から入力された距離画像の距離値から各画素の距離勾配方向を求めて、勾配方向値を画素値とする勾配方向画像を生成した後、勾配方向画像において、人体の勾配方向画像とは異なる特徴を有する画素領域を削除して画像メモリに記憶させており、勾配方向画像から不要な画素領域を削除することによって、ノイズによる誤検出を防止するとともに、演算速度の向上を図っている。
ここで、人体を撮像した距離画像から求めた勾配方向画像では、勾配方向が一定の方向となることはありえず、図13に示す勾配方向画像G31において、人体を撮像した領域AR11では様々な勾配方向が現れているのに対して、壁のように広い面積の平面を撮像した領域AR12,AR13,AR14は、勾配方向が単一、若しくは、少数(1つ又は2つの)の勾配方向が多数を占める画素領域となる。また、勾配方向が同じ画素領域の面積が、人体に対応する領域の予想最大面積を超える場合には、人体以外の壁や家具などを検出していると判断できる。したがって、勾配画像生成手段3では、人体の勾配方向画像と異なる特徴を有する画素領域として、勾配方向が単一、若しくは、少数(例えば1つ又は2つ)の勾配方向が多数を占める画素領域や、勾配方向が同じ隣接画素の集まりからなる領域であって、その面積が想定される人体の予想最大面積を超える画素領域を抽出しており、人体以外の物体を撮像したものと予想される画素領域を勾配方向画像から削除することによって、ノイズを人体と誤検出する可能性を低減できるとともに、不要な領域を省いて演算時間の短縮を図ることができる。
(実施形態8)
以下に本発明の実施形態8について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態では、検出空間内の一部の領域内に検出位置がある1乃至複数の基準勾配方向画像が記憶手段4に予め記憶され、検出空間内の他の領域に検出位置がある基準勾配方向画像は、予め記憶された1乃至複数の基準勾配方向画像を、見え方が他の領域での見え方となるように写像することによって作成されており、記憶手段4に記憶させる基準勾配方向画像以外は上述の実施形態1〜7と同様であるので、その説明は省略し、本実施形態の特徴部分のみを説明する。
上述の実施形態1では、検出空間内の複数の検出位置について、各検出位置に存在する人体の距離画像での見え方を示した基準距離画像を微分して得た基準勾配方向画像が記憶手段4に記憶されているが、距離画像生成手段1が床面に対して正対するように天井付近に設置され、距離画像生成手段1が真下を見下ろすように撮像している場合、距離画像生成手段1の撮像画像の中心位置(距離画像生成手段1の鉛直下方位置を見込む位置)に対して対称な位置に同じ検出対象物体が存在していれば、この検出対象物体を撮像した距離画像から求めた勾配方向画像は同じ画像となる。
したがって、本実施形態では、図14に示すように距離画像生成手段1による正方形状の撮像範囲を、撮像範囲の中心位置OPを通る直交2直線LN1,LN2によって第1〜第4象限に分割し、第2象限内に複数の検出位置を設定して、各検出位置(設置点MPと言う。)において人体が存在するときの基準距離画像を予め用意し、複数の基準距離画像を微分して得た勾配方向画像を基準勾配方向画像TP22として記憶手段4に記憶させており、第2象限以外の第1、第3、第4象限に人体が存在するときの基準勾配方向画像は、第2象限の基準勾配方向画像TP22を写像転換して得た基準勾配方向画像TP21,TP23,TP24を用いるようにしている。
そして、評価手段5では、勾配画像生成手段3によって生成された勾配方向画像を、記憶手段4に記憶された基準勾配方向画像とマッチングする際に、第2象限における勾配方向画像は記憶手段4に記憶された第2象限の基準勾配方向画像TP22とマッチングを行い、第2象限以外の第1、第3、第4象限における勾配方向画像は、第2象限の基準勾配方向画像TP22をそれぞれ各象限に写像転換して得た基準勾配方向画像を用いてマッチングを行っているので、記憶手段4に記憶させる基準勾配方向画像の数を減らすことができ、記憶手段4の記憶容量を削減することができる。
ここで、基準勾配方向画像の写像転換は以下のような方法で行う。図14は距離画像生成手段1による距離画像が128×123画素(x方向128画素、y方向123画素)の場合で、勾配方向を8方向(勾配方向値が0〜8)で検出する場合を例示してあり、記憶手段4には、第2象限に存在する基準勾配方向画像の勾配方向画像がその設置点の座標(X,Y)とともに記憶されている(0≦X≦63、0≦Y≦61)。そして、第2象限にある基準勾配方向画像TP22を第1象限に写像する場合、評価手段5では、表1に示すように基準勾配方向画像TP22の設置点の座標を(127−X,Y)に変換するとともに、基準勾配方向画像の左右を反転させるので、基準勾配方向画像TP22の各画素の勾配方向値を表2に示すように、0は0に、1は7に、2は6に、3は5に、4は4に、5は3に、6は2に、7は1にそれぞれ変換することで、第1象限に写像された基準勾配方向画像TP21を得ることができる。また第2象限にある基準勾配方向画像TP22を第3象限に写像する場合、評価手段5では、基準勾配方向画像TP22の設置点の座標を(X,122−Y)に変換するとともに、基準勾配方向画像の上下を反転させるので、基準勾配方向画像TP22の各画素の勾配方向値を表2に示すように、0は4に、1は3に、2は2に、3は1に、4は0に、5は7に、6は6に、7は5にそれぞれ変換することで、第3象限に写像された基準勾配方向画像TP23を得ることができる。また更に第2象限にある基準勾配方向画像TP22を第4象限に写像する場合、評価手段5では、基準勾配方向画像TP22の設置点の座標を(127−X,122−Y)に変換するとともに、基準勾配方向画像の上下左右を反転させるので、基準勾配方向画像TP22の各画素の勾配方向値を表2に示すように、0は4に、1は5に、2は6に、3は7に、4は0に、5は1に、6は2に、7は3にそれぞれ変換することで、第4象限に写像された基準勾配方向画像TP24を得ることができる。
以上のように評価手段5では、第1〜第4象限の4象限のうち何れかの象限(本実施形態では例えば第2象限)に設置点がある基準勾配方向画像の勾配方向画像のみを記憶手段4に記憶させており、他の3つの象限では、記憶手段4に記憶された基準勾配方向画像を各象限に写像転換することによって得た基準勾配方向画像によりマッチングを行っているので、記憶手段4に記憶させる基準勾配方向画像の数を4分の1に圧縮することができ、記憶手段4の記憶容量を削減することができる。
尚、記憶手段4に記憶させる複数の基準勾配方向画像は、人体検出装置Aが実際の検出空間Rに設置された状態で、検知対象となる人体を検出空間における複数の検出位置に移動させた後、距離画像取り込み手段2に距離画像生成手段1から距離画像を取得させ、勾配画像生成手段3で勾配方向値を求めて作成された勾配方向画像を、各検出位置における基準勾配方向画像として記憶手段4に記憶させれば良く、3次元CADのような他のアプリケーションソフトを用いることなく、検知対象の人体の各検出位置における基準勾配方向画像を作成することができる。
(実施形態9)
以下に本発明の実施形態9について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態では、検出空間内の一部の領域内に検出位置がある1乃至複数の基準勾配方向画像が記憶手段4に予め記憶され、検出空間内の他の領域に検出位置がある基準勾配方向画像は、予め記憶された1乃至複数の基準勾配方向画像を、見え方が他の領域での見え方となるように写像することによって作成されており、記憶手段4に記憶させる基準勾配方向画像以外は上述の実施形態1〜7と同様であるので、その説明は省略し、本実施形態の特徴部分のみを説明する。
上述の実施形態1では、検出空間内の複数の検出位置について、各検出位置に存在する人体の距離画像での見え方を示した基準距離画像を微分して得た基準勾配方向画像が記憶手段4に記憶されているが、本実施形態では、距離画像生成手段1が床面に対して正対するように天井付近に設置され、距離画像生成手段1が真下を見下ろすように撮像している場合に、距離画像生成手段1の鉛直下方の取付位置OP(xc,yc)を始点として所定の方向(例えばX軸方向)に延びる線分L3上に複数の設置点MP11〜MP16を割り当て、各設置点MP11〜MP16を検出位置とする基準勾配方向画像のみを記憶手段4に記憶させている。そして、評価手段5では、記憶手段4に記憶された線分L3上の各設置点MP11〜MP16での基準勾配方向画像を取付位置OPを中心として角度θだけ回転させることで、距離画像内の各位置における基準勾配方向画像を求めることができる。例えば評価手段5が、各設置点MP11〜MP16での基準勾配方向画像を10度から350度まで10度単位で回転させることによって、各検出位置での基準勾配方向画像を作成する場合、予め記憶させておく基準勾配方向画像の数を36分の1に削減できるから、実際に基準勾配方向画像を保存しておくのに必要な記憶領域を36分の1に削減することができる。
ここで、基準勾配方向画像の回転方法について図15を参照して説明する。すなわち、線分L3上のある設置点での基準勾配方向画像を構成する構成画素の座標を(x1,y1)、当該画素の勾配方向値をρ1とし、この基準勾配方向画像を角度θだけ回転させるものとすると、回転移動後の画素の座標(x2,y2)は次式で表される。
また、回転移動後の画素の勾配方向値ρ2は次式で表される。
ρ2=ρ1−θ
以上のように評価手段5では、距離画像生成手段1の設置位置MP11を始点とする線分L3上に設置点が存在する複数の基準勾配方向画像のみを記憶手段4に記憶させておき、記憶手段4に記憶された基準勾配方向画像を、たとえば10度間隔で回転移動させて基準勾配方向画像を作成することによって、基準勾配方向画像を予め記憶させておくのに必要な記憶手段4の記憶容量を36分の1に低減することができる。尚、画面の縦横比が1:1ではないカメラ(距離画像生成手段1)の距離画像を取り扱う場合は、画面の縦横比を、観測画像や、事前作成の基準勾配方向画像の変換パラメータに付加しておけばよく、画面の縦横比に合わせて基準基準勾配方向画像を写像変換することができる。
(実施形態10)
以下に本発明の実施形態10について説明を行う。尚、人体検出装置Aの構成は実施形態1と同様であるので、共通する構成要素には同一の符号を付して、図示及び説明は省略する。
本実施形態では、上述した各実施形態の人体検出装置において、人体位置判定手段6が、勾配方向画像中のマッチング位置から、マッチングに成功した基準勾配方向画像の身長情報(この基準勾配方向画像のモデルとなる人体の身長を示す情報)をもとに、三次元空間内での人体の立ち位置を検出している。ここで、図16を参照して立ち位置の検出方法を説明する。実空間における距離画像生成手段1の下方位置を原点Oとし、原点Oの座標を(xc,yc)、距離画像における人体Obのマッチング位置の座標を(x1,y1)、マッチングに成功した基準勾配方向画像のモデルの身長をT(例えば1650mm)、距離画像生成手段1の焦点距離をf(mm)、歪み無し像高をr1(mm)、歪み後の像高をr2(mm)、距離画像生成手段1の設置高さをd(mm)とすると、実空間におけるxy平面上での原点Oから人体Obまでの距離Rは下記の(2)式で表される。
ここで、k1をレンズの歪み係数とすると、歪み無し像高さr1は下記の(3)式で表されるので、距離Rは下記の(4)式のように表される。また、x方向及びy方向の画素ピッチをpx(mm),py(mm)とすると、歪み後の像高さr2は下記の(5)式のようになる。
(4)式、(5)式の変数のうち、焦点距離f、レンズ歪み係数k1、設置高さd、中心画素座標xc,yc、画素ピッチpx,pyは既知の値であるので、注目画素の座標x1,y1および基準勾配方向画像の身長Tの値を当てはめることによって、距離Rと歪み後の像高さr2とを求めることができる。
ここで、実空間における人体Obの存在位置の座標(X1,Y1)は、実空間における原点Oから人体Obまでの距離をR、原点Oからの角度をθとすると、下記の(6)式、(7)式のように表される。
X1=R×cosθ …(6)
Y1=R×sinθ …(7)
また、距離画像中の注目画素の座標、すなわちマッチング位置の座標を(x1,y1)とすると、角度θの正弦および余弦は下記の(8)式、(9)式のように表される。
而して、上記の演算によって求められた距離Rおよび歪み後の像高さr2の値と、(6)〜(9)式とを用いれば、人体Obの実空間上の立ち位置(X1,Y1)を求めることができるのである。
以上説明したように、本実施形態では人体位置判定手段6が、勾配方向画像中のマッチング位置から、マッチングした基準勾配方向画像の身長情報をもとに、三次元空間内での人体の立ち位置を検出しており、求められた人体の存在位置(X1,Y1)を用いて、撮像範囲内に設定した所定検知エリアの人体のみを検出することができる。ここで、本実施形態ではマッチングした基準勾配方向画像の代表点が頭頂部の場合について説明を行っているので、基準勾配方向画像の身体情報として身長を用いているが、代表点が首の付け根の場合は、上記Tの値として首の付け根までの高さを用いれば良く、首の付け根を代表点とする場合は基準勾配方向画像や観測対象画像において人体の頭頂部が画像視野領域の外側にはみ出していても、マッチングおよび位置推定が可能である。
なお本実施形態では距離画像生成手段1が天井から真下を見下ろして撮像している場合を例に説明を行っているが、距離画像生成手段1の撮像方向に俯角がついている場合でも、カメラと床との角度関係が予め判明していれば、一般的な座標変換処理(3軸の回転変換)を途中に入れることで、上記と同様の方法で実空間での人体Obの位置を求めることができる。