JP2002051316A - 画像通信端末 - Google Patents
画像通信端末Info
- Publication number
- JP2002051316A JP2002051316A JP2001152614A JP2001152614A JP2002051316A JP 2002051316 A JP2002051316 A JP 2002051316A JP 2001152614 A JP2001152614 A JP 2001152614A JP 2001152614 A JP2001152614 A JP 2001152614A JP 2002051316 A JP2002051316 A JP 2002051316A
- Authority
- JP
- Japan
- Prior art keywords
- image
- face
- unit
- area
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000006854 communication Effects 0.000 title claims abstract description 125
- 238000004891 communication Methods 0.000 title claims abstract description 125
- 230000005540 biological transmission Effects 0.000 claims abstract description 159
- 238000012545 processing Methods 0.000 claims abstract description 128
- 239000013598 vector Substances 0.000 claims description 89
- 238000000034 method Methods 0.000 claims description 85
- 238000000605 extraction Methods 0.000 claims description 73
- 238000011156 evaluation Methods 0.000 claims description 44
- 239000000284 extract Substances 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 12
- 230000010365 information processing Effects 0.000 claims description 10
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000001228 spectrum Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 13
- 230000007175 bidirectional communication Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 26
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000009432 framing Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000012141 concentrate Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 102100033040 Carbonic anhydrase 12 Human genes 0.000 description 1
- 101000867855 Homo sapiens Carbonic anhydrase 12 Proteins 0.000 description 1
- 101100280298 Homo sapiens FAM162A gene Proteins 0.000 description 1
- 101000680262 Homo sapiens Transmembrane protein 60 Proteins 0.000 description 1
- 102100023788 Protein FAM162A Human genes 0.000 description 1
- 102100022076 Transmembrane protein 60 Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
- Color Image Communication Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
(57)【要約】
【課題】 大掛かりな追従機構を用いることなく、利用
者の位置にカメラ部側が追従し、利用者を良好な位置で
撮影できる画像通信端末を提供する。 【解決手段】 カメラ部4で撮影された画像について、
顔領域の位置及び大きさを抽出する顔抽出部7と、利用
者に画像を表示する表示部3と、相手の情報処理装置に
対し、画像についての双方向通信を行う通信部9と、カ
メラ部4で撮影された画像内において移動可能に設定さ
れる矩形の送信領域内の画像を、通信部9へ出力する送
信データ処理部8とを備える。そして、カメラ部4で撮
影された画像中において、送信領域と一体的に移動する
有効領域が設定され、顔領域が有効領域を逸脱した場合
に限り、顔領域の位置及び大きさに合わせて送信領域の
位置を移動する。
者の位置にカメラ部側が追従し、利用者を良好な位置で
撮影できる画像通信端末を提供する。 【解決手段】 カメラ部4で撮影された画像について、
顔領域の位置及び大きさを抽出する顔抽出部7と、利用
者に画像を表示する表示部3と、相手の情報処理装置に
対し、画像についての双方向通信を行う通信部9と、カ
メラ部4で撮影された画像内において移動可能に設定さ
れる矩形の送信領域内の画像を、通信部9へ出力する送
信データ処理部8とを備える。そして、カメラ部4で撮
影された画像中において、送信領域と一体的に移動する
有効領域が設定され、顔領域が有効領域を逸脱した場合
に限り、顔領域の位置及び大きさに合わせて送信領域の
位置を移動する。
Description
【0001】
【発明の属する技術分野】本発明は、画像通信端末に関
し、より特定的には、利用者が自分又は近くにいる他人
の姿をカメラ部で撮影し、この撮影した画像を相手に送
信しながら対話を行うための画像通信端末に関する。
し、より特定的には、利用者が自分又は近くにいる他人
の姿をカメラ部で撮影し、この撮影した画像を相手に送
信しながら対話を行うための画像通信端末に関する。
【0002】
【従来の技術】周知のように、相手に画像を送信しなが
ら対話を行う画像通信端末としては、テレビ電話、テレ
ビ会議システム、ビデオメール等、種々の形態のものが
ある。これらのいずれの形態であっても、利用者が自分
又は近くにいる他人(以下、単に「利用者」という)の
姿を相手に送信するためには、画像通信端末に内蔵又は
外部接続されるカメラ部と被写体となる利用者とが、常
に適切な位置関係になっていなければならない。
ら対話を行う画像通信端末としては、テレビ電話、テレ
ビ会議システム、ビデオメール等、種々の形態のものが
ある。これらのいずれの形態であっても、利用者が自分
又は近くにいる他人(以下、単に「利用者」という)の
姿を相手に送信するためには、画像通信端末に内蔵又は
外部接続されるカメラ部と被写体となる利用者とが、常
に適切な位置関係になっていなければならない。
【0003】この適切な位置関係を維持するためには、
カメラ部に光軸を移動させる機構やズーム機構等を設
け、カメラ部を利用者の動きに追従させる方法が考えら
れる。しかし、この方法では、追従動作に必要なカメラ
部及び関連機構が大掛かりになって、画像通信端末の小
型化及び低コスト化を図れない。特に、携帯性が重要で
あるモバイル端末や携帯(テレビ)電話等の画像通信端
末に、このような機構を設けるのは現実的ではない。
カメラ部に光軸を移動させる機構やズーム機構等を設
け、カメラ部を利用者の動きに追従させる方法が考えら
れる。しかし、この方法では、追従動作に必要なカメラ
部及び関連機構が大掛かりになって、画像通信端末の小
型化及び低コスト化を図れない。特に、携帯性が重要で
あるモバイル端末や携帯(テレビ)電話等の画像通信端
末に、このような機構を設けるのは現実的ではない。
【0004】一方、画像通信端末から利用者へ、カメラ
部に対する利用者の位置に関する情報を提供し、利用者
が自らカメラ部に合わせるようにして、上記適切な位置
関係を維持する方法も考えられる。
部に対する利用者の位置に関する情報を提供し、利用者
が自らカメラ部に合わせるようにして、上記適切な位置
関係を維持する方法も考えられる。
【0005】具体的には、第1の手法として、ピクチャ
インピクチャ方式又は画面分割方式により、画面の一部
を自分(利用者自身)の姿を映すために利用することが
従来より行われている。しかしながら、この手法では、
自分の姿を映すために画面のかなりの部分が占有され、
結果的に相手の姿が小さくなって見辛くなるという問題
がある。また、第2の手法として、自分の画像と相手の
画像とを切り替えながら表示することも従来より行われ
ている。しかしながら、この手法では、画面が度々切り
替えられてしまうので、利用者は切り替えが気になって
会話に集中し難いという問題がある。加えて、上記第1
及び第2のいずれの手法によっても、通常の会話(自分
と相手とが膝を交えて行う会話)環境から、あまりにも
かけ離れた環境であり、利用者は不自然な感じを禁じ得
ない。
インピクチャ方式又は画面分割方式により、画面の一部
を自分(利用者自身)の姿を映すために利用することが
従来より行われている。しかしながら、この手法では、
自分の姿を映すために画面のかなりの部分が占有され、
結果的に相手の姿が小さくなって見辛くなるという問題
がある。また、第2の手法として、自分の画像と相手の
画像とを切り替えながら表示することも従来より行われ
ている。しかしながら、この手法では、画面が度々切り
替えられてしまうので、利用者は切り替えが気になって
会話に集中し難いという問題がある。加えて、上記第1
及び第2のいずれの手法によっても、通常の会話(自分
と相手とが膝を交えて行う会話)環境から、あまりにも
かけ離れた環境であり、利用者は不自然な感じを禁じ得
ない。
【0006】そこで、このような問題点に対応すべく、
特開平8−251561号公報には、自分の姿を表示さ
せず、かつ、カメラ部の追従機構を省略できる技術が開
示されている。この公報の技術では、カメラ部で利用者
自身を撮影し、利用者の位置を検出し、検出した位置が
撮影範囲を逸脱したかどうかを判断する。そして、逸脱
した場合のみ、次のいずれかの方法によってその旨を利
用者へ通知する。 (1)相手の姿をほぼ画面いっぱいに表示しておき、逸
脱した場合には相手の画像に変化を付けることで(例え
ば、相手の姿を変形させる等)、利用者へその旨を通知
する。 (2)画面内に、相手の姿を表示する領域だけでなく文
字表示領域を確保する。そして、逸脱した場合には文字
表示領域に逸脱した旨のメッセージを表示することで、
利用者へその旨を通知する。
特開平8−251561号公報には、自分の姿を表示さ
せず、かつ、カメラ部の追従機構を省略できる技術が開
示されている。この公報の技術では、カメラ部で利用者
自身を撮影し、利用者の位置を検出し、検出した位置が
撮影範囲を逸脱したかどうかを判断する。そして、逸脱
した場合のみ、次のいずれかの方法によってその旨を利
用者へ通知する。 (1)相手の姿をほぼ画面いっぱいに表示しておき、逸
脱した場合には相手の画像に変化を付けることで(例え
ば、相手の姿を変形させる等)、利用者へその旨を通知
する。 (2)画面内に、相手の姿を表示する領域だけでなく文
字表示領域を確保する。そして、逸脱した場合には文字
表示領域に逸脱した旨のメッセージを表示することで、
利用者へその旨を通知する。
【0007】
【発明が解決しようとする課題】しかしながら、上記
(1)及び(2)のいずれの方法にしても、利用者の位
置が撮影範囲を逸脱しなければ、利用者へは何の通知も
されない。また、利用者が常識的な使用をしている場合
には、そう頻繁に撮影範囲を逸脱するものではない。従
って、利用者は、ほとんどの場合(つまり逸脱していな
い時)、撮影範囲に対する自分の位置を確認することが
できない。
(1)及び(2)のいずれの方法にしても、利用者の位
置が撮影範囲を逸脱しなければ、利用者へは何の通知も
されない。また、利用者が常識的な使用をしている場合
には、そう頻繁に撮影範囲を逸脱するものではない。従
って、利用者は、ほとんどの場合(つまり逸脱していな
い時)、撮影範囲に対する自分の位置を確認することが
できない。
【0008】さらに、上記(1)の方法では、逸脱した
場合に、突然相手の姿が変化するので、利用者は驚いて
会話を途切らせたりしてしまう。また、上記(2)の方
法では、表示する文字(メッセージ)が潰れてしまわな
いようにするため、ある程度広い文字表示領域が必要と
なる。このため、文字表示領域に圧迫されて画像表示領
域が小さくなり、相手の姿が小さく見辛くなり易い。加
えて、上記(1)及び(2)のいずれの方法にしても、
画面における利用者の大きさについては全く関知されて
おらず、カメラ部に対する利用者の遠近方向の適否が不
明である。
場合に、突然相手の姿が変化するので、利用者は驚いて
会話を途切らせたりしてしまう。また、上記(2)の方
法では、表示する文字(メッセージ)が潰れてしまわな
いようにするため、ある程度広い文字表示領域が必要と
なる。このため、文字表示領域に圧迫されて画像表示領
域が小さくなり、相手の姿が小さく見辛くなり易い。加
えて、上記(1)及び(2)のいずれの方法にしても、
画面における利用者の大きさについては全く関知されて
おらず、カメラ部に対する利用者の遠近方向の適否が不
明である。
【0009】それ故、本発明の目的は、大掛かりな追従
機構を用いることなく、利用者の位置にカメラ部側が追
従し、利用者を良好な位置で撮影できる画像通信端末を
提供することである。また、本発明のさらなる目的は、
相手を見易く表示した自然な会話を確保しつつ、利用者
が自分の写り(撮影位置)を常に確認できる画像通信端
末を提供することである。
機構を用いることなく、利用者の位置にカメラ部側が追
従し、利用者を良好な位置で撮影できる画像通信端末を
提供することである。また、本発明のさらなる目的は、
相手を見易く表示した自然な会話を確保しつつ、利用者
が自分の写り(撮影位置)を常に確認できる画像通信端
末を提供することである。
【0010】
【課題を解決するための手段および発明の効果】第1の
発明は、カメラ部で撮影された利用者の画像を相手に送
信する画像通信端末であって、利用者からの入力を受け
付ける入力部と、利用者を撮影するカメラ部と、カメラ
部で撮影された画像から、利用者の顔の位置及び大きさ
(顔領域)を抽出する顔抽出部と、利用者に画像を表示
する表示部と、相手の情報処理装置に対し、少なくとも
画像の通信を行う通信部と、カメラ部で撮影された画像
の領域よりも小さく、かつ、当該画像の領域内で移動可
能に設定される矩形の送信領域の画像を、通信部へ出力
する送信データ処理部とを備え、カメラ部で撮影された
画像の領域内に、送信領域と一体的に移動する有効領域
が設定され、送信データ処理部は、抽出された顔領域が
有効領域を逸脱した場合に、当該顔領域の位置に合わせ
て送信領域の設定位置を移動させることを特徴とする。
発明は、カメラ部で撮影された利用者の画像を相手に送
信する画像通信端末であって、利用者からの入力を受け
付ける入力部と、利用者を撮影するカメラ部と、カメラ
部で撮影された画像から、利用者の顔の位置及び大きさ
(顔領域)を抽出する顔抽出部と、利用者に画像を表示
する表示部と、相手の情報処理装置に対し、少なくとも
画像の通信を行う通信部と、カメラ部で撮影された画像
の領域よりも小さく、かつ、当該画像の領域内で移動可
能に設定される矩形の送信領域の画像を、通信部へ出力
する送信データ処理部とを備え、カメラ部で撮影された
画像の領域内に、送信領域と一体的に移動する有効領域
が設定され、送信データ処理部は、抽出された顔領域が
有効領域を逸脱した場合に、当該顔領域の位置に合わせ
て送信領域の設定位置を移動させることを特徴とする。
【0011】上記のように、第1の発明によれば、顔領
域が有効領域を逸脱していないかを判定し、有効領域を
逸脱している場合には、顔領域の位置に合わせて送信領
域の位置を移動させる。これにより、顔領域の動きに送
信領域が追従することとなり、利用者が写り具合を気に
しなくても、おおよその位置にいるだけで、適切にフレ
ーミングした自画像が相手へ送信されることになる。し
かも、カメラ部の光軸移動部やズーム部のような大がか
りな追従機構がいらず、画像通信端末の携帯性をそこな
わない。また、顔領域が有効領域内にあれば、送信領域
は移動しないので、相手側に送信される画像、特に利用
者の背景画像が頻繁にぶれるようなことはなく、相手の
酔いを防止できる。
域が有効領域を逸脱していないかを判定し、有効領域を
逸脱している場合には、顔領域の位置に合わせて送信領
域の位置を移動させる。これにより、顔領域の動きに送
信領域が追従することとなり、利用者が写り具合を気に
しなくても、おおよその位置にいるだけで、適切にフレ
ーミングした自画像が相手へ送信されることになる。し
かも、カメラ部の光軸移動部やズーム部のような大がか
りな追従機構がいらず、画像通信端末の携帯性をそこな
わない。また、顔領域が有効領域内にあれば、送信領域
は移動しないので、相手側に送信される画像、特に利用
者の背景画像が頻繁にぶれるようなことはなく、相手の
酔いを防止できる。
【0012】第2の発明は、第1の発明に従属する発明
であって、有効領域は、送信領域よりも小さく、かつ、
送信領域内に設定されることを特徴とする。
であって、有効領域は、送信領域よりも小さく、かつ、
送信領域内に設定されることを特徴とする。
【0013】上記のように、第2の発明によれば、顔領
域は、送信領域を逸脱する前に必ず有効領域を逸脱する
ので、送信領域外に顔領域がはみ出して顔の一部が欠け
るような事態を回避できる。
域は、送信領域を逸脱する前に必ず有効領域を逸脱する
ので、送信領域外に顔領域がはみ出して顔の一部が欠け
るような事態を回避できる。
【0014】第3の発明は、第1の発明に従属する発明
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心に
位置するように、送信領域を移動させることを特徴とす
る。
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心に
位置するように、送信領域を移動させることを特徴とす
る。
【0015】第4の発明は、第1の発明に従属する発明
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心よ
り上方向に位置するように、送信領域を移動させること
を特徴とする。
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心よ
り上方向に位置するように、送信領域を移動させること
を特徴とする。
【0016】第5の発明は、第4の発明に従属する発明
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心又
は中心より上方向に位置するように、入力部から入力さ
れる送信モード情報に応じて切り替えて、送信領域を移
動させることを特徴とする。
であって、送信データ処理部は、抽出された顔領域が有
効領域を逸脱した場合、当該顔領域が送信領域の中心又
は中心より上方向に位置するように、入力部から入力さ
れる送信モード情報に応じて切り替えて、送信領域を移
動させることを特徴とする。
【0017】上記のように、第3の発明によれば、顔領
域が送信領域の中心に位置するように移動させるので、
顔アップの好ましいフレーミングを実現できる。また、
第4の発明によれば、顔領域が送信領域の中心より上方
向に位置するように移動させるので、バストアップの好
ましいフレーミングを実現できる。さらに、第5の発明
によれば、利用者の好みに応じて、上記顔アップ/バス
トアップのフレーミングを選択できる。
域が送信領域の中心に位置するように移動させるので、
顔アップの好ましいフレーミングを実現できる。また、
第4の発明によれば、顔領域が送信領域の中心より上方
向に位置するように移動させるので、バストアップの好
ましいフレーミングを実現できる。さらに、第5の発明
によれば、利用者の好みに応じて、上記顔アップ/バス
トアップのフレーミングを選択できる。
【0018】第6の発明は、第4の発明に従属する発明
であって、表示部は、入力部から入力される情報に応じ
て、送信領域内の画像と顔領域とをモニタ表示し、利用
者は、モニタ表示を参照して、入力部への入力により送
信領域の位置を縦横方向に調節可能なことを特徴とす
る。
であって、表示部は、入力部から入力される情報に応じ
て、送信領域内の画像と顔領域とをモニタ表示し、利用
者は、モニタ表示を参照して、入力部への入力により送
信領域の位置を縦横方向に調節可能なことを特徴とす
る。
【0019】上記のように、第6の発明によれば、利用
者は、送信領域内の画像と顔領域とをモニタし、送信領
域の位置を適宜調節することによって、任意のフレーミ
ングで自画像を相手に送信できる。
者は、送信領域内の画像と顔領域とをモニタし、送信領
域の位置を適宜調節することによって、任意のフレーミ
ングで自画像を相手に送信できる。
【0020】第7の発明は、カメラ部で撮影された利用
者の画像を相手に送信する画像通信端末であって、利用
者からの入力を受け付ける入力部と、利用者を撮影する
カメラ部と、カメラ部で撮影された画像から、利用者の
顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、
利用者に画像を表示する表示部と、相手の情報処理装置
に対し、少なくとも画像の通信を行う通信部と、カメラ
部で撮影された画像の領域よりも小さく、かつ、当該画
像の領域内で移動可能に設定される矩形の送信領域の画
像を、通信部へ出力する送信データ処理部とを備え、カ
メラ部で撮影された画像の領域内に、送信領域と一体的
に移動する有効領域が設定され、送信データ処理部は、
抽出された顔領域が有効領域を逸脱した場合に、当該顔
領域の位置に合わせて送信領域の設定位置を移動させ、
かつ、抽出された顔領域の画像輝度に基づいて、カメラ
部で撮影された画像内にある顔の視認性が向上するよう
に、送信領域の画像輝度を補正して通信部へ出力するこ
とを特徴とする。
者の画像を相手に送信する画像通信端末であって、利用
者からの入力を受け付ける入力部と、利用者を撮影する
カメラ部と、カメラ部で撮影された画像から、利用者の
顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、
利用者に画像を表示する表示部と、相手の情報処理装置
に対し、少なくとも画像の通信を行う通信部と、カメラ
部で撮影された画像の領域よりも小さく、かつ、当該画
像の領域内で移動可能に設定される矩形の送信領域の画
像を、通信部へ出力する送信データ処理部とを備え、カ
メラ部で撮影された画像の領域内に、送信領域と一体的
に移動する有効領域が設定され、送信データ処理部は、
抽出された顔領域が有効領域を逸脱した場合に、当該顔
領域の位置に合わせて送信領域の設定位置を移動させ、
かつ、抽出された顔領域の画像輝度に基づいて、カメラ
部で撮影された画像内にある顔の視認性が向上するよう
に、送信領域の画像輝度を補正して通信部へ出力するこ
とを特徴とする。
【0021】第8の発明は、第7の発明に従属する発明
であって、送信データ処理部は、送信領域の画像輝度に
加え、色調も補正して通信部へ出力することを特徴とす
る。
であって、送信データ処理部は、送信領域の画像輝度に
加え、色調も補正して通信部へ出力することを特徴とす
る。
【0022】第9の発明は、カメラ部で撮影された利用
者の画像を相手に送信する画像通信端末であって、利用
者からの入力を受け付ける入力部と、利用者を撮影する
カメラ部と、カメラ部で撮影された画像から、利用者の
顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、
利用者に画像を表示する表示部と、相手の情報処理装置
に対し、少なくとも画像の通信を行う通信部と、カメラ
部で撮影された画像の領域よりも小さく、かつ、当該画
像の領域内で移動可能に設定される矩形の送信領域の画
像を、通信部へ出力する送信データ処理部とを備え、カ
メラ部で撮影された画像の領域内に、送信領域と一体的
に移動する有効領域が設定され、送信データ処理部は、
抽出された顔領域が有効領域を逸脱した場合に、当該顔
領域の位置に合わせて送信領域の設定位置を移動させ、
かつ、抽出された顔領域の画像輝度に基づいて、カメラ
部で撮影された画像内にある顔の視認性が向上するよう
に、カメラ部の露出レベルの値を設定することを特徴と
する。
者の画像を相手に送信する画像通信端末であって、利用
者からの入力を受け付ける入力部と、利用者を撮影する
カメラ部と、カメラ部で撮影された画像から、利用者の
顔の位置及び大きさ(顔領域)を抽出する顔抽出部と、
利用者に画像を表示する表示部と、相手の情報処理装置
に対し、少なくとも画像の通信を行う通信部と、カメラ
部で撮影された画像の領域よりも小さく、かつ、当該画
像の領域内で移動可能に設定される矩形の送信領域の画
像を、通信部へ出力する送信データ処理部とを備え、カ
メラ部で撮影された画像の領域内に、送信領域と一体的
に移動する有効領域が設定され、送信データ処理部は、
抽出された顔領域が有効領域を逸脱した場合に、当該顔
領域の位置に合わせて送信領域の設定位置を移動させ、
かつ、抽出された顔領域の画像輝度に基づいて、カメラ
部で撮影された画像内にある顔の視認性が向上するよう
に、カメラ部の露出レベルの値を設定することを特徴と
する。
【0023】上記のように、第7〜第9の発明によれ
ば、逆光のような場合でも、利用者の顔が常に見えるよ
うな画像を相手側へ送信することが可能となる。これに
より、屋外においても周りの照明環境を気にすることな
く画像通信端末を用いて相手と対話することが可能とな
る。
ば、逆光のような場合でも、利用者の顔が常に見えるよ
うな画像を相手側へ送信することが可能となる。これに
より、屋外においても周りの照明環境を気にすることな
く画像通信端末を用いて相手と対話することが可能とな
る。
【0024】第10の発明は、カメラ部で撮影された利
用者の画像を相手に送信する画像通信端末であって、利
用者を撮影するカメラ部と、カメラ部で撮影された画像
から、利用者の顔の位置を抽出する顔抽出部と、利用者
に相手から受信した画像を表示する表示部と、抽出され
た顔の位置に基づいて、カメラ部で撮影された画像中に
おける利用者の顔の位置を、利用者に通知する通知制御
部と、相手の情報処理装置に対し、少なくとも画像の通
信を行う通信部とを備える。
用者の画像を相手に送信する画像通信端末であって、利
用者を撮影するカメラ部と、カメラ部で撮影された画像
から、利用者の顔の位置を抽出する顔抽出部と、利用者
に相手から受信した画像を表示する表示部と、抽出され
た顔の位置に基づいて、カメラ部で撮影された画像中に
おける利用者の顔の位置を、利用者に通知する通知制御
部と、相手の情報処理装置に対し、少なくとも画像の通
信を行う通信部とを備える。
【0025】上記のように、第10の発明によれば、利
用者は、撮影画像中の自分の位置を通知されるので、自
分の姿が画面を逸脱していない場合であっても、自分の
位置を確認しながら安心して相手との会話を進めること
ができる。万一、利用者が画面から逸脱しても、相手の
姿が突如変化するようなことはないので、利用者は、落
ち着いて通知を参照しながら、正しい位置へ復帰し、会
話を継続できる。しかも、カメラ部に利用者への追従機
構を設ける必要はないので、画像通信端末を軽量化かつ
低消費電力化させることができる。このため、携帯(テ
レビ)電話やモバイル端末等の携帯性が重視される機器
にも、好適に用いることができる。
用者は、撮影画像中の自分の位置を通知されるので、自
分の姿が画面を逸脱していない場合であっても、自分の
位置を確認しながら安心して相手との会話を進めること
ができる。万一、利用者が画面から逸脱しても、相手の
姿が突如変化するようなことはないので、利用者は、落
ち着いて通知を参照しながら、正しい位置へ復帰し、会
話を継続できる。しかも、カメラ部に利用者への追従機
構を設ける必要はないので、画像通信端末を軽量化かつ
低消費電力化させることができる。このため、携帯(テ
レビ)電話やモバイル端末等の携帯性が重視される機器
にも、好適に用いることができる。
【0026】第11の発明は、第10の発明に従属する
発明であって、顔抽出部は、利用者の顔の位置と共に顔
の大きさも抽出し、通知制御部は、カメラ部で撮影され
た画像中における利用者の顔の位置及び大きさを、利用
者に通知することを特徴とする。
発明であって、顔抽出部は、利用者の顔の位置と共に顔
の大きさも抽出し、通知制御部は、カメラ部で撮影され
た画像中における利用者の顔の位置及び大きさを、利用
者に通知することを特徴とする。
【0027】上記のように、第11の発明によれば、顔
領域の大きさも抽出して通知することにより、利用者
は、顔領域の位置及び大きさの両方の情報を得ることが
できる。従って、利用者は、これらの情報を参照して、
画面上の位置と遠近方向の位置とを、適正に保持するこ
とができる。また、利用者は、自画像を得なくとも、自
分が画面のどの位置にどの位の大きさで写っているのか
を確認できる。
領域の大きさも抽出して通知することにより、利用者
は、顔領域の位置及び大きさの両方の情報を得ることが
できる。従って、利用者は、これらの情報を参照して、
画面上の位置と遠近方向の位置とを、適正に保持するこ
とができる。また、利用者は、自画像を得なくとも、自
分が画面のどの位置にどの位の大きさで写っているのか
を確認できる。
【0028】第12の発明は、第10の発明に従属する
発明であって、通知制御部は、抽出された顔の位置のみ
又は位置と大きさとを示す目印を、表示部に表示させる
ことを特徴とする。
発明であって、通知制御部は、抽出された顔の位置のみ
又は位置と大きさとを示す目印を、表示部に表示させる
ことを特徴とする。
【0029】上記のように、第12の発明によれば、利
用者は、表示部に表示される相手の姿を見ながら、通常
の会話と同じように集中して会話を行える。また、利用
者は、簡潔な目印を参照して、自分の位置を確認でき
る。
用者は、表示部に表示される相手の姿を見ながら、通常
の会話と同じように集中して会話を行える。また、利用
者は、簡潔な目印を参照して、自分の位置を確認でき
る。
【0030】第13の発明は、第12の発明に従属する
発明であって、目印は、相手から受信した画像上に表示
されることを特徴とする。
発明であって、目印は、相手から受信した画像上に表示
されることを特徴とする。
【0031】上記のように、第13の発明によれば、相
手の姿の上に目印が現れるので、目印のためだけに広い
画面の領域を確保する必要がなく、相手の姿をより大き
くかつ見易く表示できる。しかも、利用者は、目印を見
るために視線を変える必要がなく、長時間会話しても疲
労が少ない。
手の姿の上に目印が現れるので、目印のためだけに広い
画面の領域を確保する必要がなく、相手の姿をより大き
くかつ見易く表示できる。しかも、利用者は、目印を見
るために視線を変える必要がなく、長時間会話しても疲
労が少ない。
【0032】第14の発明は、第12の発明に従属する
発明であって、目印は、相手から受信した画像外に表示
されることを特徴とする。
発明であって、目印は、相手から受信した画像外に表示
されることを特徴とする。
【0033】上記のように、第14の発明によれば、目
印を相手の画像から外すことにより、相手の画像に目印
が干渉せず、より鮮明に相手の姿を見ることができる。
印を相手の画像から外すことにより、相手の画像に目印
が干渉せず、より鮮明に相手の姿を見ることができる。
【0034】第15の発明は、第12の発明に従属する
発明であって、通知制御部は、抽出された顔の位置を、
表示部とは別個に備える位置通知部を介して通知するこ
とを特徴とする。
発明であって、通知制御部は、抽出された顔の位置を、
表示部とは別個に備える位置通知部を介して通知するこ
とを特徴とする。
【0035】上記のように、第15の発明によれば、位
置通知部を表示部とは別個に備えることにより、表示部
の画面全部を相手の姿の表示に割り当てることができる
ので、相手の姿をより広くかつ見易く表示できる。
置通知部を表示部とは別個に備えることにより、表示部
の画面全部を相手の姿の表示に割り当てることができる
ので、相手の姿をより広くかつ見易く表示できる。
【0036】第16の発明は、第10の発明に従属する
発明であって、通知制御部によって行われる利用者への
通知方法を、利用者からの指示に従って切り替え可能と
することを特徴とする。
発明であって、通知制御部によって行われる利用者への
通知方法を、利用者からの指示に従って切り替え可能と
することを特徴とする。
【0037】上記のように、第16の発明によれば、利
用者は、好みの通知方法を選択することができる。
用者は、好みの通知方法を選択することができる。
【0038】第17の発明は、第1〜第16の発明に従
属する発明であって、顔抽出部は、カメラ部で撮影され
た画像からエッジ部(人物の外郭や顔の輪郭等に相当す
る画素)を抽出して、当該エッジ部だけの画像(エッジ
画像)を生成するエッジ抽出部と、予め定めた形状を、
相似で大きさを異ならせた種々のサイズによって、中心
点で同心状に複数設けたテンプレートを記憶するテンプ
レート記憶部と、テンプレートを構成する各サイズの形
状毎に、エッジ画像上の座標位置と投票数とを対応付け
てそれぞれ記憶する投票結果記憶部と、エッジ部の各画
素位置にテンプレートの中心点を順次移動させ、移動さ
せた当該画素位置毎に、各サイズの形状を形成する全画
素の位置に対応する各座標位置について、投票結果記憶
部に記憶されている投票数をそれぞれ増加又は減少させ
る投票部と、投票結果記憶部に記憶されている各投票数
に基づいて、対象画像に含まれる顔の位置及び大きさを
求める解析部とを備える。
属する発明であって、顔抽出部は、カメラ部で撮影され
た画像からエッジ部(人物の外郭や顔の輪郭等に相当す
る画素)を抽出して、当該エッジ部だけの画像(エッジ
画像)を生成するエッジ抽出部と、予め定めた形状を、
相似で大きさを異ならせた種々のサイズによって、中心
点で同心状に複数設けたテンプレートを記憶するテンプ
レート記憶部と、テンプレートを構成する各サイズの形
状毎に、エッジ画像上の座標位置と投票数とを対応付け
てそれぞれ記憶する投票結果記憶部と、エッジ部の各画
素位置にテンプレートの中心点を順次移動させ、移動さ
せた当該画素位置毎に、各サイズの形状を形成する全画
素の位置に対応する各座標位置について、投票結果記憶
部に記憶されている投票数をそれぞれ増加又は減少させ
る投票部と、投票結果記憶部に記憶されている各投票数
に基づいて、対象画像に含まれる顔の位置及び大きさを
求める解析部とを備える。
【0039】上記のように、第17の発明によれば、処
理負担が軽い投票処理(基本的には加算のみ)とその評
価だけで、顔の位置を高速に検出できる。しかも、相似
で同心状の複数の形状を備えたテンプレートを用いてい
るから、顔を含むであろうエッジ部が、これらの形状の
うち、いずれの大きさに近いかという実質的な近似を行
っていることになり、顔の大きさも高速に抽出できる。
このように、処理負担を大幅に軽減できるので、現状の
パーソナルコンピュータレベルの処理能力でも、ほぼ実
時間で顔を抽出できる。また、対象画像のうち、どの部
分に顔領域があるかという点や、顔領域の個数などは、
抽出前に不明であって差し支えなく、広い範囲の対象画
像について、一様に顔を検出でき、極めて汎用性が高
い。
理負担が軽い投票処理(基本的には加算のみ)とその評
価だけで、顔の位置を高速に検出できる。しかも、相似
で同心状の複数の形状を備えたテンプレートを用いてい
るから、顔を含むであろうエッジ部が、これらの形状の
うち、いずれの大きさに近いかという実質的な近似を行
っていることになり、顔の大きさも高速に抽出できる。
このように、処理負担を大幅に軽減できるので、現状の
パーソナルコンピュータレベルの処理能力でも、ほぼ実
時間で顔を抽出できる。また、対象画像のうち、どの部
分に顔領域があるかという点や、顔領域の個数などは、
抽出前に不明であって差し支えなく、広い範囲の対象画
像について、一様に顔を検出でき、極めて汎用性が高
い。
【0040】第18の発明は、第17の発明に従属する
発明であって、予め定めた形状は、円であることを特徴
とする。
発明であって、予め定めた形状は、円であることを特徴
とする。
【0041】上記のように、第18の発明によれば、形
状群は、円であるため、テンプレートの中心点から、形
状の全ての画素までの距離が常に一定になり、投票結果
の精度を高く保持できる。
状群は、円であるため、テンプレートの中心点から、形
状の全ての画素までの距離が常に一定になり、投票結果
の精度を高く保持できる。
【0042】第19の発明は、第1〜第16の発明に従
属する発明であって、顔抽出部は、所定のテンプレート
画像を入力し、当該画像のエッジ法線方向ベクトルを求
め、当該エッジ法線方向ベクトルから評価ベクトルを生
成し、当該評価ベクトルを直交変換するテンプレート画
像処理部と、カメラ部で撮影された画像を入力し、当該
画像のエッジ法線方向ベクトルを求め、当該エッジ法線
方向ベクトルから評価ベクトルを生成し、当該評価ベク
トルを直交変換する入力画像処理部と、テンプレート画
像及び撮影された画像のそれぞれについて生成された直
交変換後の各評価ベクトルについて、対応スペクトルデ
ータを積和計算する積和部と、積和計算の結果を逆直交
変換して類似値のマップを生成する逆直交変換部とを備
え、評価ベクトルは、該当する画像のエッジ法線方向ベ
クトルを偶数倍角変換した成分を含み、類似値の算出
式、直交変換及び逆直交変換は、いずれも線形性を有す
るものであることを特徴とする。
属する発明であって、顔抽出部は、所定のテンプレート
画像を入力し、当該画像のエッジ法線方向ベクトルを求
め、当該エッジ法線方向ベクトルから評価ベクトルを生
成し、当該評価ベクトルを直交変換するテンプレート画
像処理部と、カメラ部で撮影された画像を入力し、当該
画像のエッジ法線方向ベクトルを求め、当該エッジ法線
方向ベクトルから評価ベクトルを生成し、当該評価ベク
トルを直交変換する入力画像処理部と、テンプレート画
像及び撮影された画像のそれぞれについて生成された直
交変換後の各評価ベクトルについて、対応スペクトルデ
ータを積和計算する積和部と、積和計算の結果を逆直交
変換して類似値のマップを生成する逆直交変換部とを備
え、評価ベクトルは、該当する画像のエッジ法線方向ベ
クトルを偶数倍角変換した成分を含み、類似値の算出
式、直交変換及び逆直交変換は、いずれも線形性を有す
るものであることを特徴とする。
【0043】上記のように、第19の発明によれば、背
景部分の輝度ばらつきにより、テンプレート画像のエッ
ジ法線方向ベクトルと、カメラ部で撮影された画像(入
力画像)のエッジ法線方向ベクトルとのなす角θの内積
(cosθ)の正負が反転する場合でも、類似値に影響
が無く、正当にマッチングを評価できる。
景部分の輝度ばらつきにより、テンプレート画像のエッ
ジ法線方向ベクトルと、カメラ部で撮影された画像(入
力画像)のエッジ法線方向ベクトルとのなす角θの内積
(cosθ)の正負が反転する場合でも、類似値に影響
が無く、正当にマッチングを評価できる。
【0044】第20の発明は、第19の発明に従属する
発明であって、顔抽出部は、評価ベクトルの表現におい
て、エッジ法線方向ベクトルを極座標表現した場合の角
度に基づいて計算した値を用いることを特徴とする。
発明であって、顔抽出部は、評価ベクトルの表現におい
て、エッジ法線方向ベクトルを極座標表現した場合の角
度に基づいて計算した値を用いることを特徴とする。
【0045】第21の発明は、第1〜第16の発明に従
属する発明であって、顔抽出部は、カメラ部で撮影され
た画像から顔として抽出された位置及び大きさが、真に
顔であるか否かを判定する顔・非顔判定部をさらに備
え、顔と判定した場合にのみ抽出結果を出力することを
特徴とする。
属する発明であって、顔抽出部は、カメラ部で撮影され
た画像から顔として抽出された位置及び大きさが、真に
顔であるか否かを判定する顔・非顔判定部をさらに備
え、顔と判定した場合にのみ抽出結果を出力することを
特徴とする。
【0046】第22の発明は、第17の発明に従属する
発明であって、顔抽出部は、投票結果記憶部に記憶され
ている内容に基づいて、カメラ部で撮影された画像から
顔として抽出された位置及び大きさが、真に顔であるか
否かを判定する顔・非顔判定部をさらに備え、顔と判定
した場合にのみ抽出結果を出力することを特徴とする。
発明であって、顔抽出部は、投票結果記憶部に記憶され
ている内容に基づいて、カメラ部で撮影された画像から
顔として抽出された位置及び大きさが、真に顔であるか
否かを判定する顔・非顔判定部をさらに備え、顔と判定
した場合にのみ抽出結果を出力することを特徴とする。
【0047】第23の発明は、第19の発明に従属する
発明であって、顔抽出部は、逆直交変換部で生成された
類似値に基づいて、カメラ部で撮影された画像から顔と
して抽出された位置及び大きさが、真に顔であるか否か
を判定する顔・非顔判定部をさらに備え、顔と判定した
場合にのみ抽出結果を出力することを特徴とする。
発明であって、顔抽出部は、逆直交変換部で生成された
類似値に基づいて、カメラ部で撮影された画像から顔と
して抽出された位置及び大きさが、真に顔であるか否か
を判定する顔・非顔判定部をさらに備え、顔と判定した
場合にのみ抽出結果を出力することを特徴とする。
【0048】上記のように、第21〜第23の発明によ
れば、実際の顔が顔領域の第1候補以外にある場合で
も、安定した顔領域の抽出が可能になる。また、画像中
に顔がない場合でも顔がないと判定することができるの
で、顔の位置を移動して表示する必要がない場合を自動
的に検出することが可能になる。
れば、実際の顔が顔領域の第1候補以外にある場合で
も、安定した顔領域の抽出が可能になる。また、画像中
に顔がない場合でも顔がないと判定することができるの
で、顔の位置を移動して表示する必要がない場合を自動
的に検出することが可能になる。
【0049】第24の発明は、第21の発明に従属する
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られる画像特
徴を用いて、サポートベクトル関数の判定結果に基づい
て顔・非顔の判定を行うことを特徴とする。
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られる画像特
徴を用いて、サポートベクトル関数の判定結果に基づい
て顔・非顔の判定を行うことを特徴とする。
【0050】第25の発明は、第24の発明に従属する
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られるエッジ
法線方向ベクトルを画像特徴とすることを特徴とする。
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られるエッジ
法線方向ベクトルを画像特徴とすることを特徴とする。
【0051】第26の発明は、第24の発明に従属する
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られるエッジ
法線のヒストグラムを画像特徴とすることを特徴とす
る。
発明であって、顔・非顔判定部は、カメラ部で撮影され
た画像から顔として抽出された領域から得られるエッジ
法線のヒストグラムを画像特徴とすることを特徴とす
る。
【0052】
【発明の実施の形態】以下、図面を参照しながら、本発
明の各実施形態を説明する。 (第1の実施形態)図1は、本発明の第1の実施形態に
係る画像通信端末の構成を示すブロック図である。図1
において、第1の実施形態に係る画像通信端末は、入力
部2と、表示部3と、カメラ部4と、表示制御部5と、
自画像メモリ6と、顔抽出部7と、送信データ処理部8
と、通信部9と、受信データ処理部10と、相手画像メ
モリ11とを備える。まず、第1の実施形態に係る画像
通信端末の各構成の概要を説明する。
明の各実施形態を説明する。 (第1の実施形態)図1は、本発明の第1の実施形態に
係る画像通信端末の構成を示すブロック図である。図1
において、第1の実施形態に係る画像通信端末は、入力
部2と、表示部3と、カメラ部4と、表示制御部5と、
自画像メモリ6と、顔抽出部7と、送信データ処理部8
と、通信部9と、受信データ処理部10と、相手画像メ
モリ11とを備える。まず、第1の実施形態に係る画像
通信端末の各構成の概要を説明する。
【0053】図1に示すように、本実施形態の画像通信
端末では、入力部2、表示部3及びカメラ部4が、利用
者1に臨んでいる。入力部2は、キーボード(テンキー
等を含む)やマウス等で構成され、利用者1が送信モー
ド及びその他必要な情報を入力するために利用される。
表示部3は、LCD等で構成され、画面上で相手の画像
や表示制御部5の指示に従った目印等を、利用者1に向
けて表示する。目印については後で詳述するが、利用者
1が画面中における自分の顔の位置や大きさを確認でき
る指標である。カメラ部4は、レンズ等の光学系及びC
CD等の電気系で構成され、利用者1を撮影するために
用いられる。このカメラ部4で撮影された画像(以下、
対象画像という)は、フレーム毎に自画像メモリ6に格
納される。表示制御部5は、表示部3の画面表示(主と
して、受信した相手画像の表示)を制御する。また、表
示制御部5は、入力部2から入力される情報に応じて、
顔抽出部7で抽出された顔領域に基づいた目印を、表示
部3の画面上に表示させる。
端末では、入力部2、表示部3及びカメラ部4が、利用
者1に臨んでいる。入力部2は、キーボード(テンキー
等を含む)やマウス等で構成され、利用者1が送信モー
ド及びその他必要な情報を入力するために利用される。
表示部3は、LCD等で構成され、画面上で相手の画像
や表示制御部5の指示に従った目印等を、利用者1に向
けて表示する。目印については後で詳述するが、利用者
1が画面中における自分の顔の位置や大きさを確認でき
る指標である。カメラ部4は、レンズ等の光学系及びC
CD等の電気系で構成され、利用者1を撮影するために
用いられる。このカメラ部4で撮影された画像(以下、
対象画像という)は、フレーム毎に自画像メモリ6に格
納される。表示制御部5は、表示部3の画面表示(主と
して、受信した相手画像の表示)を制御する。また、表
示制御部5は、入力部2から入力される情報に応じて、
顔抽出部7で抽出された顔領域に基づいた目印を、表示
部3の画面上に表示させる。
【0054】顔抽出部7は、自画像メモリ6に格納され
た対象画像に対して、存在する顔の位置及び大きさを調
べ、これらの情報を顔領域として表示制御部5及び送信
データ処理部8へ出力する。なお、この顔抽出部7につ
いては、本発明に適用可能な手法を後で詳細に説明す
る。送信データ処理部8は、顔抽出部7で抽出された顔
領域の位置に合わせて送信領域を設定する。そして、送
信データ処理部8は、入力部2から指示された送信モー
ドに従って、自画像メモリ6に格納された対象画像の
内、送信領域内の画像データを通信部9へ送出する。通
信部9は、通信経路を介して、相手の情報処理装置(画
像通信端末を含む)と、少なくとも画像データの通信を
行う。ここでの通信モードは任意であり、例えば、内線
電話のように基地局等を介さない子機間通信でもよい
し、テレビ電話のような基地局等を介する同期型通信又
は非同期型通信でもよい。受信データ処理部10は、通
信部9を介して受信した相手の画像データを処理して、
フレーム毎に相手画像メモリ11へ格納する。
た対象画像に対して、存在する顔の位置及び大きさを調
べ、これらの情報を顔領域として表示制御部5及び送信
データ処理部8へ出力する。なお、この顔抽出部7につ
いては、本発明に適用可能な手法を後で詳細に説明す
る。送信データ処理部8は、顔抽出部7で抽出された顔
領域の位置に合わせて送信領域を設定する。そして、送
信データ処理部8は、入力部2から指示された送信モー
ドに従って、自画像メモリ6に格納された対象画像の
内、送信領域内の画像データを通信部9へ送出する。通
信部9は、通信経路を介して、相手の情報処理装置(画
像通信端末を含む)と、少なくとも画像データの通信を
行う。ここでの通信モードは任意であり、例えば、内線
電話のように基地局等を介さない子機間通信でもよい
し、テレビ電話のような基地局等を介する同期型通信又
は非同期型通信でもよい。受信データ処理部10は、通
信部9を介して受信した相手の画像データを処理して、
フレーム毎に相手画像メモリ11へ格納する。
【0055】なお、本実施形態では、通信部9が双方向
通信を行う場合を一例に挙げて説明するが、利用者1か
ら相手に画像データを単方向通信するビデオメール等に
も本発明を適用することができる。この場合、相手の情
報処理装置は、送信される画像データを受信して画面表
示させる構成のみを持つものであってもよい。
通信を行う場合を一例に挙げて説明するが、利用者1か
ら相手に画像データを単方向通信するビデオメール等に
も本発明を適用することができる。この場合、相手の情
報処理装置は、送信される画像データを受信して画面表
示させる構成のみを持つものであってもよい。
【0056】次に、図2〜図6を用いて、送信データ処
理部8が行う顔領域の位置に合わせた追従処理について
説明する。まず、カメラ部4による撮影領域30と、通
信部9から送信される画像の送信領域31との関係は、
一般的に図3のようになる。送信領域31は、撮影領域
30よりも小さな矩形領域である。カメラ部4は、送信
領域31より広い撮影領域30で被写体(利用者1)を
撮影するが、画像通信端末からは送信領域31内の画像
だけが相手に送信される。図3の例では、撮影領域30
は、x方向長さA、y方向長さBであり、送信領域31
は、x方向長さL、y方向長さMである。また、L<A
及びM<Bであり、各々の長さA、B、L、Mは、固定
的である。図3の例では、送信領域31の左上点(x
1,y1)を基準点としている。この基準点は、撮影領
域30内を移動可能であり、基準点が定まることで、送
信領域31の位置が一意に定まるようにしている。な
お、送信領域31の左上点以外の点を基準としてもよ
い。
理部8が行う顔領域の位置に合わせた追従処理について
説明する。まず、カメラ部4による撮影領域30と、通
信部9から送信される画像の送信領域31との関係は、
一般的に図3のようになる。送信領域31は、撮影領域
30よりも小さな矩形領域である。カメラ部4は、送信
領域31より広い撮影領域30で被写体(利用者1)を
撮影するが、画像通信端末からは送信領域31内の画像
だけが相手に送信される。図3の例では、撮影領域30
は、x方向長さA、y方向長さBであり、送信領域31
は、x方向長さL、y方向長さMである。また、L<A
及びM<Bであり、各々の長さA、B、L、Mは、固定
的である。図3の例では、送信領域31の左上点(x
1,y1)を基準点としている。この基準点は、撮影領
域30内を移動可能であり、基準点が定まることで、送
信領域31の位置が一意に定まるようにしている。な
お、送信領域31の左上点以外の点を基準としてもよ
い。
【0057】一方、本実施形態では、顔抽出部7で抽出
された顔領域の位置及び大きさを、円形の目印Rで表現
する。この目印Rの中心が顔領域の中心であり、目印R
の直径が顔領域の大きさに相当する。なお、目印Rは、
円形以外の形状であっても構わない。
された顔領域の位置及び大きさを、円形の目印Rで表現
する。この目印Rの中心が顔領域の中心であり、目印R
の直径が顔領域の大きさに相当する。なお、目印Rは、
円形以外の形状であっても構わない。
【0058】図3の状態では、目印Rで示される顔領域
が送信領域31の右側へ逸脱している。従って、目印R
に基づいて図中矢印で示すように、送信領域31を右側
へ移動させれば、好ましいフレーミングになる。そこ
で、本実施形態では、目印Rが内部に含まれるように送
信領域31を移動させる。図4は、送信領域31を移動
させた後の状態(左上点(x2,y2))を示してい
る。ここで、本実施形態では、図4に示しているよう
に、送信領域31の内側にさらに有効領域32を設定
し、有効領域32と送信領域31とが一体的に移動する
ようにしている。そして、目印Rが送信領域31ではな
く有効領域32を逸脱したかどうかをチェックし、逸脱
した場合には、図3から図4のように送信領域31及び
有効領域32を移動させることとした。
が送信領域31の右側へ逸脱している。従って、目印R
に基づいて図中矢印で示すように、送信領域31を右側
へ移動させれば、好ましいフレーミングになる。そこ
で、本実施形態では、目印Rが内部に含まれるように送
信領域31を移動させる。図4は、送信領域31を移動
させた後の状態(左上点(x2,y2))を示してい
る。ここで、本実施形態では、図4に示しているよう
に、送信領域31の内側にさらに有効領域32を設定
し、有効領域32と送信領域31とが一体的に移動する
ようにしている。そして、目印Rが送信領域31ではな
く有効領域32を逸脱したかどうかをチェックし、逸脱
した場合には、図3から図4のように送信領域31及び
有効領域32を移動させることとした。
【0059】ここで、有効領域32を狭くすると、目印
Rが有効領域32を逸脱する確率が上がり、相手の酔い
を招来しやくすくなる。従って、図4に示しているよう
に、有効領域32を広めにとって、送信領域31の移動
を抑えることが望ましい。このようにしても、顔領域は
見易い位置にある。
Rが有効領域32を逸脱する確率が上がり、相手の酔い
を招来しやくすくなる。従って、図4に示しているよう
に、有効領域32を広めにとって、送信領域31の移動
を抑えることが望ましい。このようにしても、顔領域は
見易い位置にある。
【0060】加えて、本実施形態では、送信領域31の
移動直後の目印Rの位置を、送信モード(バストアップ
モード又はバストアップモード)によって切り替えられ
るようにしている。図4は、目印Rが送信領域31に対
してx方向中心かつy方向中心よりやや上方に位置す
る、バストアップモードによる画像表示手法の例であ
る。なお、顔アップモードとは、目印Rが送信領域31
に対してx方向中心かつy方向中心に位置する画像表示
手法である。さらには、本実施形態では、図5に示すよ
うに、これらのモードから目印Rを好みの方向にオフセ
ットさせることを可能とする。これによれば、例えば、
利用者1が自分と共に持参している物を一緒に相手に見
せたいと考えるような場合等、種々の要求に対応できる
ようになる。
移動直後の目印Rの位置を、送信モード(バストアップ
モード又はバストアップモード)によって切り替えられ
るようにしている。図4は、目印Rが送信領域31に対
してx方向中心かつy方向中心よりやや上方に位置す
る、バストアップモードによる画像表示手法の例であ
る。なお、顔アップモードとは、目印Rが送信領域31
に対してx方向中心かつy方向中心に位置する画像表示
手法である。さらには、本実施形態では、図5に示すよ
うに、これらのモードから目印Rを好みの方向にオフセ
ットさせることを可能とする。これによれば、例えば、
利用者1が自分と共に持参している物を一緒に相手に見
せたいと考えるような場合等、種々の要求に対応できる
ようになる。
【0061】次に、図2を参照して、送信データ処理部
8が行う追従処理の各プロセスを説明する。まず、利用
者1が、入力部2から送信モード(バストアップモード
/顔アップモード)を入力する(ステップS201)。
次に、カメラ部4によって利用者1が撮影され、対象画
像として自画像メモリ6に格納される(ステップS20
2)。この撮影の時には、利用者1は、広い撮影領域3
0内に顔が写る位置に居さえすれば十分である。次に、
顔抽出部7が、対象画像内の顔領域(顔の位置及び大き
さ)を抽出し、抽出した顔領域を送信データ処理部8へ
出力する(ステップS203)。
8が行う追従処理の各プロセスを説明する。まず、利用
者1が、入力部2から送信モード(バストアップモード
/顔アップモード)を入力する(ステップS201)。
次に、カメラ部4によって利用者1が撮影され、対象画
像として自画像メモリ6に格納される(ステップS20
2)。この撮影の時には、利用者1は、広い撮影領域3
0内に顔が写る位置に居さえすれば十分である。次に、
顔抽出部7が、対象画像内の顔領域(顔の位置及び大き
さ)を抽出し、抽出した顔領域を送信データ処理部8へ
出力する(ステップS203)。
【0062】顔領域が抽出されると、送信データ処理部
8は、送信モードに従って顔領域に送信領域31を合わ
せる(ステップS204)。具体的には、図4に示すよ
うに、顔領域が送信領域31内に含まれるように送信領
域31の左上点が決定される。次に、送信領域31内
に、有効領域32が設定され(ステップS205)、図
4の送信領域31内の画像が表示部3によって利用者1
へモニタ表示される(ステップS206)。なお、この
ステップS206では、利用者1自身の画像表示を省略
し、目印Rのみを表示してもよい。次に、利用者1が、
入力部2を用いてモニタ表示されたフレーミングでよい
か(送信領域31をロックするか)どうかを入力する
(ステップS207)。利用者1が、送信領域31のオ
フセットを希望する場合には、入力部2は、移動情報の
入力を受け付けて、送信領域31の位置を調節する(ス
テップS215)。その後、処理がステップS205へ
戻り、再度利用者1の確認を仰ぐ。
8は、送信モードに従って顔領域に送信領域31を合わ
せる(ステップS204)。具体的には、図4に示すよ
うに、顔領域が送信領域31内に含まれるように送信領
域31の左上点が決定される。次に、送信領域31内
に、有効領域32が設定され(ステップS205)、図
4の送信領域31内の画像が表示部3によって利用者1
へモニタ表示される(ステップS206)。なお、この
ステップS206では、利用者1自身の画像表示を省略
し、目印Rのみを表示してもよい。次に、利用者1が、
入力部2を用いてモニタ表示されたフレーミングでよい
か(送信領域31をロックするか)どうかを入力する
(ステップS207)。利用者1が、送信領域31のオ
フセットを希望する場合には、入力部2は、移動情報の
入力を受け付けて、送信領域31の位置を調節する(ス
テップS215)。その後、処理がステップS205へ
戻り、再度利用者1の確認を仰ぐ。
【0063】上記ステップS207でフレーミングが完
了すると、相手との画像通信が開始される(ステップS
208)。なお、適当な割り込み処理部を設けて、通信
途中でもステップS201〜S207の処理を行えるよ
うにすることもできる。通信が開始されると、通信部9
及び受信データ処理部10を介して、相手画像メモリ1
1に格納された相手の画像が、表示部3の画面上に表示
される(ステップS209)。ここで再び、カメラ部4
が利用者1を撮影し(ステップS210)、顔抽出部7
が顔領域を抽出し(ステップS211)、送信データ処
理部8が顔領域が有効領域32を逸脱したかどうかチェ
ックする(ステップS212)。
了すると、相手との画像通信が開始される(ステップS
208)。なお、適当な割り込み処理部を設けて、通信
途中でもステップS201〜S207の処理を行えるよ
うにすることもできる。通信が開始されると、通信部9
及び受信データ処理部10を介して、相手画像メモリ1
1に格納された相手の画像が、表示部3の画面上に表示
される(ステップS209)。ここで再び、カメラ部4
が利用者1を撮影し(ステップS210)、顔抽出部7
が顔領域を抽出し(ステップS211)、送信データ処
理部8が顔領域が有効領域32を逸脱したかどうかチェ
ックする(ステップS212)。
【0064】ここで、図6に示すように逸脱していれ
ば、送信データ処理部8は、上記ステップS204と同
様に送信モードに従って送信領域31の左上点を移動さ
せた後(ステップS213)、顔抽出部7において再び
抽出された顔領域が有効領域32を逸脱したかどうか再
チェックする(ステップS211,S212)。一方、
逸脱していなければ、送信データ処理部8は、送信領域
31を移動させることなく通信を継続させる。なお、利
用者が自分の写り具合を確認しながら安心して通信した
い場合には、例えばピクチャインピクチャ方式を用い
て、相手の画像と共に自分の画像が画面内に表示される
ようにしてもよい。そして、ステップS209〜S21
3の処理が、通信終了まで繰り返される(ステップS2
14)。
ば、送信データ処理部8は、上記ステップS204と同
様に送信モードに従って送信領域31の左上点を移動さ
せた後(ステップS213)、顔抽出部7において再び
抽出された顔領域が有効領域32を逸脱したかどうか再
チェックする(ステップS211,S212)。一方、
逸脱していなければ、送信データ処理部8は、送信領域
31を移動させることなく通信を継続させる。なお、利
用者が自分の写り具合を確認しながら安心して通信した
い場合には、例えばピクチャインピクチャ方式を用い
て、相手の画像と共に自分の画像が画面内に表示される
ようにしてもよい。そして、ステップS209〜S21
3の処理が、通信終了まで繰り返される(ステップS2
14)。
【0065】以上のように、本発明の第1の実施形態に
係る画像通信端末によれば、大掛かりな追従機構を用い
ることなく、画像通信端末の携帯性を損なわずに、実質
的に利用者の動きに追従した撮影及び画像通信を行うこ
とができる。すなわち、利用者は、写り具合を気にしな
くとも好ましいフレーミングで撮影され、自画像が相手
に送信される。また、顔領域が有効領域内にあれば、送
信領域は移動しないので、相手側に送信される画像、特
に利用者側の背景画像が、頻繁にぶれるようなことがな
くなり相手の酔いを防止できる。
係る画像通信端末によれば、大掛かりな追従機構を用い
ることなく、画像通信端末の携帯性を損なわずに、実質
的に利用者の動きに追従した撮影及び画像通信を行うこ
とができる。すなわち、利用者は、写り具合を気にしな
くとも好ましいフレーミングで撮影され、自画像が相手
に送信される。また、顔領域が有効領域内にあれば、送
信領域は移動しないので、相手側に送信される画像、特
に利用者側の背景画像が、頻繁にぶれるようなことがな
くなり相手の酔いを防止できる。
【0066】ところで、周知のように、カメラ部4に用
いるカメラによっては、自動露出補正の機能を有するも
のがある。自動露出補正とは、明るさが最適となるよう
に自動的に画像の輝度を補正する機能であり、一般に画
像全体又は数点の平均輝度に基づいて画像内の各画素の
輝度を変更することで行われる。しかしながら、逆光等
のように対象画像全体の平均輝度に比べ顔領域の平均輝
度が低い場合には、利用者1の顔が真っ黒になってしま
うという問題が残る。そこで、このような場合の対策と
して、送信データ処理部8では、顔抽出部7で抽出され
た顔領域に基づいて、カメラ部4が撮影した対象画像の
明るさを顔の視認性が向上するように輝度を補正した
後、通信部9へ送信するようにすればよい。
いるカメラによっては、自動露出補正の機能を有するも
のがある。自動露出補正とは、明るさが最適となるよう
に自動的に画像の輝度を補正する機能であり、一般に画
像全体又は数点の平均輝度に基づいて画像内の各画素の
輝度を変更することで行われる。しかしながら、逆光等
のように対象画像全体の平均輝度に比べ顔領域の平均輝
度が低い場合には、利用者1の顔が真っ黒になってしま
うという問題が残る。そこで、このような場合の対策と
して、送信データ処理部8では、顔抽出部7で抽出され
た顔領域に基づいて、カメラ部4が撮影した対象画像の
明るさを顔の視認性が向上するように輝度を補正した
後、通信部9へ送信するようにすればよい。
【0067】具体的には、送信データ処理部8が、顔領
域内部の平均輝度の理想値(理想平均輝度a)を予め記
憶している。そして、送信データ処理部8は、顔抽出部
7で抽出された顔領域内部の平均輝度Iを求め、カメラ
部4で撮影された対象画像の輝度Y1を新たな輝度Y2
に変更するため、対象画像の各画素に対して、Y2=Y
1×(a/I)を施す。これにより、顔領域内部が理想
平均輝度aとなるように補正することができる。また、
この理想平均輝度aを用いて、輝度だけでなく色相につ
いても同様に変更することも考えられる。なお、これ以
外に、送信データ処理部8が、顔領域内部が平均輝度I
である場合に顔領域が理想平均輝度aとなる、設定すべ
きカメラ部4の露出レベルを持っている場合もあり得
る。この場合には、送信データ処理部8が、顔領域内部
の平均輝度Iに対する露出レベルをカメラ部4へ通知す
ることにより、顔領域の明るさが理想値になるように補
正することが可能となる。
域内部の平均輝度の理想値(理想平均輝度a)を予め記
憶している。そして、送信データ処理部8は、顔抽出部
7で抽出された顔領域内部の平均輝度Iを求め、カメラ
部4で撮影された対象画像の輝度Y1を新たな輝度Y2
に変更するため、対象画像の各画素に対して、Y2=Y
1×(a/I)を施す。これにより、顔領域内部が理想
平均輝度aとなるように補正することができる。また、
この理想平均輝度aを用いて、輝度だけでなく色相につ
いても同様に変更することも考えられる。なお、これ以
外に、送信データ処理部8が、顔領域内部が平均輝度I
である場合に顔領域が理想平均輝度aとなる、設定すべ
きカメラ部4の露出レベルを持っている場合もあり得
る。この場合には、送信データ処理部8が、顔領域内部
の平均輝度Iに対する露出レベルをカメラ部4へ通知す
ることにより、顔領域の明るさが理想値になるように補
正することが可能となる。
【0068】このようにすれば、逆光のような場合で
も、利用者1の顔が常に見えるような画像を相手側へ送
信することが可能となる。これにより、屋外においても
周りの照明環境を気にすることなく画像通信端末を用い
て相手と対話することが可能となる。
も、利用者1の顔が常に見えるような画像を相手側へ送
信することが可能となる。これにより、屋外においても
周りの照明環境を気にすることなく画像通信端末を用い
て相手と対話することが可能となる。
【0069】(第2の実施形態)上記第1の実施形態で
は、簡単な追従機構を用い、画像通信端末側が利用者の
動きに自動的に合わせることによって、利用者をフレー
ム内に捉えた適切な画像を相手側に送信できる手法を説
明した。次に、この第2の実施形態では、追従機構を用
いることなく、利用者側が画像通信端末に合わせて動け
るような表示を行うことにより、利用者をフレーム内に
捉えた適切な画像を相手側に送信できる手法を説明す
る。
は、簡単な追従機構を用い、画像通信端末側が利用者の
動きに自動的に合わせることによって、利用者をフレー
ム内に捉えた適切な画像を相手側に送信できる手法を説
明した。次に、この第2の実施形態では、追従機構を用
いることなく、利用者側が画像通信端末に合わせて動け
るような表示を行うことにより、利用者をフレーム内に
捉えた適切な画像を相手側に送信できる手法を説明す
る。
【0070】図7は、本発明の第2の実施形態に係る画
像通信端末の構成を示すブロック図である。図7におい
て、第2の実施形態に係る画像通信端末は、入力部22
と、表示部3と、カメラ部4と、表示制御部25と、自
画像メモリ6と、顔抽出部7と、送信データ処理部8
と、通信部9と、受信データ処理部10と、相手画像メ
モリ11とを備える。まず、第2の実施形態に係る画像
通信端末の各構成の概要を説明する。
像通信端末の構成を示すブロック図である。図7におい
て、第2の実施形態に係る画像通信端末は、入力部22
と、表示部3と、カメラ部4と、表示制御部25と、自
画像メモリ6と、顔抽出部7と、送信データ処理部8
と、通信部9と、受信データ処理部10と、相手画像メ
モリ11とを備える。まず、第2の実施形態に係る画像
通信端末の各構成の概要を説明する。
【0071】図7に示すように、本実施形態の画像通信
端末では、入力部22、表示部3及びカメラ部4が、利
用者1に臨んでいる。入力部22は、キーボード(テン
キー等を含む)やマウス等で構成され、利用者1が通知
モード、送信モード及びその他必要な情報を入力するた
めに利用される。本実施形態では、入力部22に点灯
(又は点滅)が可能なテンキーが具備されている。表示
部3は、LCD等で構成され、画面上で相手の画像や表
示制御部25の指示に従った目印等を、利用者1に向け
て表示する。目印については後で詳述するが、利用者1
が画面中における自分の顔の位置や大きさを確認できる
指標である。なお、入力部22及び表示部3によって、
相手側への送信画像における利用者1の顔の位置及び大
きさを、利用者1へ通知する通知部12が構成される。
カメラ部4は、レンズ等の光学系及びCCD等の電気系
で構成され、利用者1を撮影するために用いられる。こ
のカメラ部4で撮影された画像(対象画像)は、フレー
ム毎に自画像メモリ6に格納される。表示制御部25
は、表示部3の画面表示(主として、受信した相手画像
の表示)を制御する。また、表示制御部25は、入力部
22から入力される通知モードに応じ、顔抽出部7で抽
出された顔領域に基づいて、目印を表示部3の画面上に
表示させたり、入力部22のテンキーを点灯させたりす
る。
端末では、入力部22、表示部3及びカメラ部4が、利
用者1に臨んでいる。入力部22は、キーボード(テン
キー等を含む)やマウス等で構成され、利用者1が通知
モード、送信モード及びその他必要な情報を入力するた
めに利用される。本実施形態では、入力部22に点灯
(又は点滅)が可能なテンキーが具備されている。表示
部3は、LCD等で構成され、画面上で相手の画像や表
示制御部25の指示に従った目印等を、利用者1に向け
て表示する。目印については後で詳述するが、利用者1
が画面中における自分の顔の位置や大きさを確認できる
指標である。なお、入力部22及び表示部3によって、
相手側への送信画像における利用者1の顔の位置及び大
きさを、利用者1へ通知する通知部12が構成される。
カメラ部4は、レンズ等の光学系及びCCD等の電気系
で構成され、利用者1を撮影するために用いられる。こ
のカメラ部4で撮影された画像(対象画像)は、フレー
ム毎に自画像メモリ6に格納される。表示制御部25
は、表示部3の画面表示(主として、受信した相手画像
の表示)を制御する。また、表示制御部25は、入力部
22から入力される通知モードに応じ、顔抽出部7で抽
出された顔領域に基づいて、目印を表示部3の画面上に
表示させたり、入力部22のテンキーを点灯させたりす
る。
【0072】顔抽出部7は、自画像メモリ6に格納され
た対象画像に対して、存在する顔の位置及び大きさを調
べ、これらの情報を顔領域として表示制御部25及び送
信データ処理部8へ出力する。なお、この顔抽出部7に
ついては、本発明に適用可能な手法を後で詳細に説明す
る。送信データ処理部8は、入力部22から指示された
送信モードに従って、自画像メモリ6に格納された対象
画像を、そのまま又は後述する加工を施して通信部9へ
送出する。通信部9は、通信経路を介して、相手の情報
処理装置(画像通信端末を含む)と、少なくとも画像デ
ータの通信を行う。ここでの通信モードは任意であり、
例えば、内線電話のように基地局等を介さない子機間通
信でもよいし、テレビ電話のような基地局等を介する同
期型通信又は非同期型通信でもよい。受信データ処理部
10は、通信部9を介して受信した相手の画像データを
処理して、フレーム毎に相手画像メモリ11へ格納す
る。
た対象画像に対して、存在する顔の位置及び大きさを調
べ、これらの情報を顔領域として表示制御部25及び送
信データ処理部8へ出力する。なお、この顔抽出部7に
ついては、本発明に適用可能な手法を後で詳細に説明す
る。送信データ処理部8は、入力部22から指示された
送信モードに従って、自画像メモリ6に格納された対象
画像を、そのまま又は後述する加工を施して通信部9へ
送出する。通信部9は、通信経路を介して、相手の情報
処理装置(画像通信端末を含む)と、少なくとも画像デ
ータの通信を行う。ここでの通信モードは任意であり、
例えば、内線電話のように基地局等を介さない子機間通
信でもよいし、テレビ電話のような基地局等を介する同
期型通信又は非同期型通信でもよい。受信データ処理部
10は、通信部9を介して受信した相手の画像データを
処理して、フレーム毎に相手画像メモリ11へ格納す
る。
【0073】次に、図8〜図10を参照して、表示制御
部25が表示部3の画面上に表示させる目印の一例を説
明する。なお、これらの例は、適宜組み合わせて用いる
ことができる。まず、図8(a)〜(d)は、利用者1
の顔の位置(ここでは、顔抽出部7で抽出された顔領域
の中心)だけを、表示部3の画面上に目印Rで表示させ
る例である。図中矩形で示した領域が表示部3の画面で
あり、ここに相手の画像が表示される。図8(a)〜
(c)では、目印Rが相手の画像内に重畳させて表示さ
れる。図8(d)では、目印Rが相手の画像外に表示さ
れる。これらの目印Rの表示は、相手の画像のフレーム
に同期して更新してもよいし、非同期で更新してもよ
い。図8(a)は、目印Rとして十字線を用い、線の交
点が利用者1の顔の位置を示すようにしたものである。
図8(b)は、目印Rとして矢印を用い、双方の矢印で
特定される点が利用者1の顔の位置を示すようにしたも
のである。図8(c)は、目印Rとして十字又は×印の
図形を用い、図形の位置が顔の位置を示すようにしたも
のである。図8(d)は、目印Rとして相手の画像の枠
外に表示される縦横ルーラを用い、縦ルーラ上に付され
た印と横ルーラ上に付された印とで特定される点が利用
者1の顔の位置を示すようにしたものである。
部25が表示部3の画面上に表示させる目印の一例を説
明する。なお、これらの例は、適宜組み合わせて用いる
ことができる。まず、図8(a)〜(d)は、利用者1
の顔の位置(ここでは、顔抽出部7で抽出された顔領域
の中心)だけを、表示部3の画面上に目印Rで表示させ
る例である。図中矩形で示した領域が表示部3の画面で
あり、ここに相手の画像が表示される。図8(a)〜
(c)では、目印Rが相手の画像内に重畳させて表示さ
れる。図8(d)では、目印Rが相手の画像外に表示さ
れる。これらの目印Rの表示は、相手の画像のフレーム
に同期して更新してもよいし、非同期で更新してもよ
い。図8(a)は、目印Rとして十字線を用い、線の交
点が利用者1の顔の位置を示すようにしたものである。
図8(b)は、目印Rとして矢印を用い、双方の矢印で
特定される点が利用者1の顔の位置を示すようにしたも
のである。図8(c)は、目印Rとして十字又は×印の
図形を用い、図形の位置が顔の位置を示すようにしたも
のである。図8(d)は、目印Rとして相手の画像の枠
外に表示される縦横ルーラを用い、縦ルーラ上に付され
た印と横ルーラ上に付された印とで特定される点が利用
者1の顔の位置を示すようにしたものである。
【0074】次に、図9(a)〜(c)は、利用者1の
顔の位置及び大きさ(顔抽出部7で抽出された顔領域全
体)を、表示部3の画面上に目印Rで表示させる例であ
る。図9(a)は、目印Rとして縦横2本ずつの平行線
を用い、この平行線で囲まれた矩形領域が利用者1の顔
の位置及び大きさを示すようにしたものである。図9
(b)は、目印Rとして相手の画像の枠外に表示される
縦横ルーラを用い、縦ルーラ上に付された幅付き印と横
ルーラ上に付された幅付き印とで特定される領域が利用
者1の顔の位置及び大きさを示すようにしたものであ
る。図9(c)では、目印Rとして顔領域に近似する円
(又は楕円)を用い、円領域が利用者1の顔の位置及び
大きさを示すようにしたものである。
顔の位置及び大きさ(顔抽出部7で抽出された顔領域全
体)を、表示部3の画面上に目印Rで表示させる例であ
る。図9(a)は、目印Rとして縦横2本ずつの平行線
を用い、この平行線で囲まれた矩形領域が利用者1の顔
の位置及び大きさを示すようにしたものである。図9
(b)は、目印Rとして相手の画像の枠外に表示される
縦横ルーラを用い、縦ルーラ上に付された幅付き印と横
ルーラ上に付された幅付き印とで特定される領域が利用
者1の顔の位置及び大きさを示すようにしたものであ
る。図9(c)では、目印Rとして顔領域に近似する円
(又は楕円)を用い、円領域が利用者1の顔の位置及び
大きさを示すようにしたものである。
【0075】なお、これらの目印Rは、相手の画像に依
存せずに表示させてもよいし、依存して表示させてもよ
い。前者としては、例えば、相手の画像にかかわらず所
定の色(黒一色等)で目印Rを表示させることである。
後者としては、例えば、表示させる目印Rが相手の画像
上でわかり難くなる場合に、目印Rを表示させる画素の
輝度を変化させたり、そのRGB値を変化(反転)させ
ることである。いずれにしても、これらの目印Rは、相
手の画像の邪魔にならぬように表示することが望まし
い。
存せずに表示させてもよいし、依存して表示させてもよ
い。前者としては、例えば、相手の画像にかかわらず所
定の色(黒一色等)で目印Rを表示させることである。
後者としては、例えば、表示させる目印Rが相手の画像
上でわかり難くなる場合に、目印Rを表示させる画素の
輝度を変化させたり、そのRGB値を変化(反転)させ
ることである。いずれにしても、これらの目印Rは、相
手の画像の邪魔にならぬように表示することが望まし
い。
【0076】さらに、図10は、利用者1の顔のおおよ
その位置を、表示部3ではなく入力部22で表示させる
例である。図10に示すように、目印Rとして点灯が可
能なテンキーを用い、このテンキーのいずれかを点灯さ
せることで顔の位置を利用者1へ通知することができ
る。図10では、「3」のキーを点灯させているので、
顔の位置が画面の「右上」にあることを通知できる。同
様に、「1」のキーなら画面の「左上」、「5」のキー
なら画面の「真中」、「9」のキーなら画面の「右下」
というように、概略の位置表示を行える。なお、このよ
うな概略位置の通知であっても、十分実用に値する。
その位置を、表示部3ではなく入力部22で表示させる
例である。図10に示すように、目印Rとして点灯が可
能なテンキーを用い、このテンキーのいずれかを点灯さ
せることで顔の位置を利用者1へ通知することができ
る。図10では、「3」のキーを点灯させているので、
顔の位置が画面の「右上」にあることを通知できる。同
様に、「1」のキーなら画面の「左上」、「5」のキー
なら画面の「真中」、「9」のキーなら画面の「右下」
というように、概略の位置表示を行える。なお、このよ
うな概略位置の通知であっても、十分実用に値する。
【0077】なお、本実施形態では、入力部22から表
示制御部25へ与えられる通知モードによって、図8〜
図10のいずれの方法で顔の位置を通知させるかを切り
替えることが可能なようにしている。さらに、これらの
通知は、常時行ってもよいし、利用者1が入力部22で
通知を指示した時のみ行ってもよい。また、概略位置の
通知を行う方法としては、図10に示す入力部22のテ
ンキーの点灯以外にも、音や光によることもできる。例
えば、音の場合には、スピーカから発するインターバル
や周波数を顔の位置に応じて変化させたり、光の場合に
は、点灯させる明るさや点滅のインターバルを顔の位置
に応じて変化させること等が考えられる。
示制御部25へ与えられる通知モードによって、図8〜
図10のいずれの方法で顔の位置を通知させるかを切り
替えることが可能なようにしている。さらに、これらの
通知は、常時行ってもよいし、利用者1が入力部22で
通知を指示した時のみ行ってもよい。また、概略位置の
通知を行う方法としては、図10に示す入力部22のテ
ンキーの点灯以外にも、音や光によることもできる。例
えば、音の場合には、スピーカから発するインターバル
や周波数を顔の位置に応じて変化させたり、光の場合に
は、点灯させる明るさや点滅のインターバルを顔の位置
に応じて変化させること等が考えられる。
【0078】次に、図11を参照して、送信データ処理
部8が通信部9を介して送信する利用者1の画像例につ
いて説明する。本実施形態では、相手側へ送信される画
像が、入力部22から送信データ処理部8へ与えられる
送信モードによって、選択できるようになっている。こ
こで、利用者1側(自分側)では、相手の画像の上に、
図11(a)のような目印R(図9(a)〜(c)の組
み合わせ)が表示されているものとする。このとき、送
信データ処理部8は、送信モードによって、種々の形態
で自画像を相手に送信することができる。例えば、送信
モードが「通常」であれば、図11(b)のように、送
信データ処理部8は、カメラ部4の取得画像をそのまま
送信する。また、送信モードが「目印付き」であれば、
図11(c)に示すように、送信データ処理部8は、顔
抽出部7で抽出された顔領域を参照して、取得画像に目
印Rを合成した自画像を作成し、相手に送信する。さら
に、送信モードが「顔のみ」であれば、図11(d)に
示すように、送信データ処理部8は、取得画像から顔抽
出部7で抽出された顔領域のみを切り取った自画像を、
相手に送信する。
部8が通信部9を介して送信する利用者1の画像例につ
いて説明する。本実施形態では、相手側へ送信される画
像が、入力部22から送信データ処理部8へ与えられる
送信モードによって、選択できるようになっている。こ
こで、利用者1側(自分側)では、相手の画像の上に、
図11(a)のような目印R(図9(a)〜(c)の組
み合わせ)が表示されているものとする。このとき、送
信データ処理部8は、送信モードによって、種々の形態
で自画像を相手に送信することができる。例えば、送信
モードが「通常」であれば、図11(b)のように、送
信データ処理部8は、カメラ部4の取得画像をそのまま
送信する。また、送信モードが「目印付き」であれば、
図11(c)に示すように、送信データ処理部8は、顔
抽出部7で抽出された顔領域を参照して、取得画像に目
印Rを合成した自画像を作成し、相手に送信する。さら
に、送信モードが「顔のみ」であれば、図11(d)に
示すように、送信データ処理部8は、取得画像から顔抽
出部7で抽出された顔領域のみを切り取った自画像を、
相手に送信する。
【0079】送信モードに基づくこれらの画像処理は、
周知技術によって簡単に実現することができるので、そ
の詳しい説明は省略する。ここで、図11(c)のよう
に「目印付き」で自画像を送信すれば、例えば自分がど
こに居るのかわかり難い画像(暗闇の中に居る画像)を
送信する場合であっても、相手に自分の位置を正確に把
握させることが可能となる。また、図11(d)のよう
に、「顔のみ」で自画像を送信すれば、背景が写らない
ので相手に見られたくない部分を隠すことができ、プラ
イバシーを保護できる。なお、このように背景を隠して
も、顔の表情等は相手に伝わるので、会話に支障はな
い。なお、上記説明した送信モードは、互いにユニーク
であれば、他の任意の区別法によることも可能である。
周知技術によって簡単に実現することができるので、そ
の詳しい説明は省略する。ここで、図11(c)のよう
に「目印付き」で自画像を送信すれば、例えば自分がど
こに居るのかわかり難い画像(暗闇の中に居る画像)を
送信する場合であっても、相手に自分の位置を正確に把
握させることが可能となる。また、図11(d)のよう
に、「顔のみ」で自画像を送信すれば、背景が写らない
ので相手に見られたくない部分を隠すことができ、プラ
イバシーを保護できる。なお、このように背景を隠して
も、顔の表情等は相手に伝わるので、会話に支障はな
い。なお、上記説明した送信モードは、互いにユニーク
であれば、他の任意の区別法によることも可能である。
【0080】以上のように、本発明の第2の実施形態に
係る画像通信端末によれば、抽出した顔領域に基づく目
印を用いて、利用者の画面上の位置関係を簡潔かつ適切
に表現することができる。従って、利用者は、自分の顔
の位置が画面を逸脱した場合はもとより、自分の顔の位
置が画面を逸脱していない場合であっても、自分の顔の
位置を確認しながら、安心して相手との会話を進めるこ
とができる。また、上記第1の実施形態に比べ追従機構
を省略しているので、画像通信端末の携帯性を良好にさ
せることができる。
係る画像通信端末によれば、抽出した顔領域に基づく目
印を用いて、利用者の画面上の位置関係を簡潔かつ適切
に表現することができる。従って、利用者は、自分の顔
の位置が画面を逸脱した場合はもとより、自分の顔の位
置が画面を逸脱していない場合であっても、自分の顔の
位置を確認しながら、安心して相手との会話を進めるこ
とができる。また、上記第1の実施形態に比べ追従機構
を省略しているので、画像通信端末の携帯性を良好にさ
せることができる。
【0081】(顔抽出部7の詳細な実施例)次に、上述
した本発明の第1及び第2の実施形態に係る画像通信端
末に適用できる顔抽出部7の具体的な実施例を、3通り
説明する。なお、顔抽出部7には、以下に説明する3つ
の手法の他に、色情報に基づくもの、目や口等の顔の部
分に着目するもの、テンプレートマッチングによるもの
等、周知のさまざまな手法を適用させることが可能であ
る。
した本発明の第1及び第2の実施形態に係る画像通信端
末に適用できる顔抽出部7の具体的な実施例を、3通り
説明する。なお、顔抽出部7には、以下に説明する3つ
の手法の他に、色情報に基づくもの、目や口等の顔の部
分に着目するもの、テンプレートマッチングによるもの
等、周知のさまざまな手法を適用させることが可能であ
る。
【0082】<実施例1>図12は、実施例1の顔抽出
部7の構成を示すブロック図である。図12において、
顔抽出部7は、エッジ抽出部51と、テンプレート記憶
部52と、投票結果記憶部53と、投票部54と、解析
部55とを備える。
部7の構成を示すブロック図である。図12において、
顔抽出部7は、エッジ抽出部51と、テンプレート記憶
部52と、投票結果記憶部53と、投票部54と、解析
部55とを備える。
【0083】エッジ抽出部51は、カメラ部4が撮影し
た対象画像からエッジ部を抽出し、エッジ部だけの画像
(以下、エッジ画像という)を生成する。ここで、エッ
ジ部とは、人物の外郭や顔の輪郭等に相当する部分(画
素)であって、対象画像内の高周波成分となる部分であ
る。このエッジ抽出部51には、対象画像から高周波成
分を取り出すSobelフィルタ等を用いるのが好まし
い。
た対象画像からエッジ部を抽出し、エッジ部だけの画像
(以下、エッジ画像という)を生成する。ここで、エッ
ジ部とは、人物の外郭や顔の輪郭等に相当する部分(画
素)であって、対象画像内の高周波成分となる部分であ
る。このエッジ抽出部51には、対象画像から高周波成
分を取り出すSobelフィルタ等を用いるのが好まし
い。
【0084】テンプレート記憶部52には、予め定めた
形状を、相似で大きさを異ならせた種々のサイズによっ
て、中心点で同心状に複数設けたテンプレートのデータ
が記憶されている。このテンプレートの形状には、円、
楕円、正多角形、多角形等を用いることができるが、中
心点から形状線(形状を形成する各画素)までの距離が
常に一定である円を用いることが最も好ましい。これに
より、後述する投票結果の精度を高くさせることができ
る。以下、この実施例1では、図13に示すように、中
心点がPで半径が異なる同心円を複数設けたテンプレー
トを用いた場合を説明する。ここで、テンプレートを構
成する複数の円t1〜tn(nは、任意の整数)は、図
13に示すテンプレートのように、一定間隔で半径が変
化する構成であってもよいし、不定間隔で半径が変化す
る構成であってもよい。また、テンプレートを構成する
複数の円t1〜tnは、全ての線幅が1ドット(対象画
像の1画素に相当)で構成されてもよいし、一部又は全
部の線幅が2ドット以上(すなわち、円環形状)で構成
されてもよい。なお、以下の説明では、円及び円環を総
称して単に「円」という。
形状を、相似で大きさを異ならせた種々のサイズによっ
て、中心点で同心状に複数設けたテンプレートのデータ
が記憶されている。このテンプレートの形状には、円、
楕円、正多角形、多角形等を用いることができるが、中
心点から形状線(形状を形成する各画素)までの距離が
常に一定である円を用いることが最も好ましい。これに
より、後述する投票結果の精度を高くさせることができ
る。以下、この実施例1では、図13に示すように、中
心点がPで半径が異なる同心円を複数設けたテンプレー
トを用いた場合を説明する。ここで、テンプレートを構
成する複数の円t1〜tn(nは、任意の整数)は、図
13に示すテンプレートのように、一定間隔で半径が変
化する構成であってもよいし、不定間隔で半径が変化す
る構成であってもよい。また、テンプレートを構成する
複数の円t1〜tnは、全ての線幅が1ドット(対象画
像の1画素に相当)で構成されてもよいし、一部又は全
部の線幅が2ドット以上(すなわち、円環形状)で構成
されてもよい。なお、以下の説明では、円及び円環を総
称して単に「円」という。
【0085】この複数の円t1〜tnは、まとめて1つ
のテンプレートとして扱われてテンプレート記憶部52
に記憶されるが、実際の処理では、テンプレートを構成
する各円t1〜tnは、独立して扱われることとなる。
このため、各円t1〜tnを形成する画素データは、テ
ンプレート記憶部52において、例えばテーブル形式で
それぞれ記憶される。
のテンプレートとして扱われてテンプレート記憶部52
に記憶されるが、実際の処理では、テンプレートを構成
する各円t1〜tnは、独立して扱われることとなる。
このため、各円t1〜tnを形成する画素データは、テ
ンプレート記憶部52において、例えばテーブル形式で
それぞれ記憶される。
【0086】投票結果記憶部53には、後述する投票部
54において行われる投票処理の結果を記憶する領域
(以下、投票記憶領域という)が、テンプレート記憶部
52に記憶されているテンプレートを構成する各サイズ
の形状毎に、設けられている。この例では、各サイズの
形状が円t1〜tnであるので、投票結果記憶部53に
は、円t1〜tnに関してn個の投票記憶領域が設けら
れることとなる。なお、この投票記憶領域は、対象画像
に対応する範囲を有する。
54において行われる投票処理の結果を記憶する領域
(以下、投票記憶領域という)が、テンプレート記憶部
52に記憶されているテンプレートを構成する各サイズ
の形状毎に、設けられている。この例では、各サイズの
形状が円t1〜tnであるので、投票結果記憶部53に
は、円t1〜tnに関してn個の投票記憶領域が設けら
れることとなる。なお、この投票記憶領域は、対象画像
に対応する範囲を有する。
【0087】投票部54は、エッジ抽出部51で生成さ
れたエッジ画像について、テンプレート記憶部52に記
憶されているテンプレートを用いて、投票処理を行う。
図14は、投票部54で行われる投票処理の手順を示す
フローチャートである。図14を参照して、投票部54
は、まず、投票結果記憶部53にアクセスして、各投票
記憶領域内の座標を表す成分(投票値)を、全て零に初
期化する(ステップS601)。次に、投票部54は、
エッジ画像内のエッジ部の先頭画素位置に、テンプレー
トの中心点Pをセットする(ステップS602)。この
先頭画素位置は、例えば、エッジ画像上を左上から右上
又は左下へ順次走査して行き、最初に検出されたエッジ
部の画素の位置とすればよい。
れたエッジ画像について、テンプレート記憶部52に記
憶されているテンプレートを用いて、投票処理を行う。
図14は、投票部54で行われる投票処理の手順を示す
フローチャートである。図14を参照して、投票部54
は、まず、投票結果記憶部53にアクセスして、各投票
記憶領域内の座標を表す成分(投票値)を、全て零に初
期化する(ステップS601)。次に、投票部54は、
エッジ画像内のエッジ部の先頭画素位置に、テンプレー
トの中心点Pをセットする(ステップS602)。この
先頭画素位置は、例えば、エッジ画像上を左上から右上
又は左下へ順次走査して行き、最初に検出されたエッジ
部の画素の位置とすればよい。
【0088】次に、投票部54は、テンプレートを構成
する形状(この例では、円t1〜tn)を特定するカウ
ンタiを、「1」に初期化する(ステップS603)。
次に、投票部54は、カウンタi(=1)によって特定
される円t1について、円t1を形成する全画素のエッ
ジ画像上のxy座標をそれぞれ取得する(ステップS6
04)。そして、投票部54は、投票結果記憶部53に
設けられた円t1に関する投票記憶領域において、取得
した各xy座標を表す成分にそれぞれ「1」を加算して
投票を行う(ステップS605)。この処理が終わる
と、投票部54は、カウンタiを1つインクリメントし
て、i=2とする(ステップS607)。次に、投票部
54は、カウンタi(=2)によって特定される円t2
について、円t2を形成する全画素のエッジ画像上のx
y座標をそれぞれ取得する(ステップS604)。そし
て、投票部54は、投票結果記憶部53に設けられた円
t2に関する投票記憶領域において、取得した各xy座
標を表す成分にそれぞれ「1」を加算して投票を行う
(ステップS605)。
する形状(この例では、円t1〜tn)を特定するカウ
ンタiを、「1」に初期化する(ステップS603)。
次に、投票部54は、カウンタi(=1)によって特定
される円t1について、円t1を形成する全画素のエッ
ジ画像上のxy座標をそれぞれ取得する(ステップS6
04)。そして、投票部54は、投票結果記憶部53に
設けられた円t1に関する投票記憶領域において、取得
した各xy座標を表す成分にそれぞれ「1」を加算して
投票を行う(ステップS605)。この処理が終わる
と、投票部54は、カウンタiを1つインクリメントし
て、i=2とする(ステップS607)。次に、投票部
54は、カウンタi(=2)によって特定される円t2
について、円t2を形成する全画素のエッジ画像上のx
y座標をそれぞれ取得する(ステップS604)。そし
て、投票部54は、投票結果記憶部53に設けられた円
t2に関する投票記憶領域において、取得した各xy座
標を表す成分にそれぞれ「1」を加算して投票を行う
(ステップS605)。
【0089】以降同様にして、投票部54は、i=nに
なるまでカウンタiを1つずつインクリメントしながら
(ステップS606,S607)、テンプレートを構成
する全形状である円t3〜tnについて、上記ステップ
S604及びS605の投票処理を繰り返し行う。これ
により、各円t1〜tnに関する投票記憶領域のそれぞ
れに、先頭画素位置における投票処理が行われることに
なる。そしてさらに、投票部54は、エッジ部の次の画
素位置にテンプレートの中心点Pをセットして上記ステ
ップS603〜S607の処理を繰り返し行うことを、
エッジ画像内のエッジ部の全画素に対して、1回ずつ行
う(ステップS608,S609)。すなわち、投票部
54による投票処理は、テンプレートの中心点Pがエッ
ジ部の全画素を這うように行われる。
なるまでカウンタiを1つずつインクリメントしながら
(ステップS606,S607)、テンプレートを構成
する全形状である円t3〜tnについて、上記ステップ
S604及びS605の投票処理を繰り返し行う。これ
により、各円t1〜tnに関する投票記憶領域のそれぞ
れに、先頭画素位置における投票処理が行われることに
なる。そしてさらに、投票部54は、エッジ部の次の画
素位置にテンプレートの中心点Pをセットして上記ステ
ップS603〜S607の処理を繰り返し行うことを、
エッジ画像内のエッジ部の全画素に対して、1回ずつ行
う(ステップS608,S609)。すなわち、投票部
54による投票処理は、テンプレートの中心点Pがエッ
ジ部の全画素を這うように行われる。
【0090】例えば、図15に示すエッジ画像に上記投
票処理を施すことによって、投票結果記憶部53に設け
られたn個の投票記憶領域には、図16に示すような投
票数が記憶される。なお、図16では、図面を見易くす
るため、エッジ部の一部の画素位置で投票処理が行われ
た場合を示している。図16において、実線円の部分
が、上記ステップS605においてテンプレートの各サ
イズの形状(円t1〜tn)に基づいて投票された座標
成分に相当し、座標数「1」となる。また、上述したよ
うに各投票数は累積加算されるので、図16の実線円が
交差する部分(図中、●印で示す)は、交差する数が多
いほど投票数が高いことを表している。
票処理を施すことによって、投票結果記憶部53に設け
られたn個の投票記憶領域には、図16に示すような投
票数が記憶される。なお、図16では、図面を見易くす
るため、エッジ部の一部の画素位置で投票処理が行われ
た場合を示している。図16において、実線円の部分
が、上記ステップS605においてテンプレートの各サ
イズの形状(円t1〜tn)に基づいて投票された座標
成分に相当し、座標数「1」となる。また、上述したよ
うに各投票数は累積加算されるので、図16の実線円が
交差する部分(図中、●印で示す)は、交差する数が多
いほど投票数が高いことを表している。
【0091】そのため、中心点を持つ円又は楕円に近似
した顔の輪郭を表現するエッジ部に、上述した投票処理
を施せば、その中心点付近に高い投票数が集中すること
となる。従って、高い投票値が集中する部分を判断すれ
ば、顔の中心を特定することが可能になる。また、この
ような高い投票値が集中する現象は、テンプレートの中
でも、顔の輪郭を表現するエッジ部の最小幅と等しい又
は非常に近い半径を持つ円形状を用いた場合に、より顕
著に現れる。従って、この現象がどの円形状の投票記憶
領域に顕著に現れているかを判断すれば、顔の大きさを
特定することが可能になる。この点は、一般化ハフ変換
と似ていると言える。しかし、本発明の顔抽出方法で
は、同心状に複数サイズの形状を持つテンプレートを使
用することにより、エッジ部の中心点と共にその大きさ
も一度に特定できるという点で、一般化ハフ変換とは明
確に異なる。
した顔の輪郭を表現するエッジ部に、上述した投票処理
を施せば、その中心点付近に高い投票数が集中すること
となる。従って、高い投票値が集中する部分を判断すれ
ば、顔の中心を特定することが可能になる。また、この
ような高い投票値が集中する現象は、テンプレートの中
でも、顔の輪郭を表現するエッジ部の最小幅と等しい又
は非常に近い半径を持つ円形状を用いた場合に、より顕
著に現れる。従って、この現象がどの円形状の投票記憶
領域に顕著に現れているかを判断すれば、顔の大きさを
特定することが可能になる。この点は、一般化ハフ変換
と似ていると言える。しかし、本発明の顔抽出方法で
は、同心状に複数サイズの形状を持つテンプレートを使
用することにより、エッジ部の中心点と共にその大きさ
も一度に特定できるという点で、一般化ハフ変換とは明
確に異なる。
【0092】なお、上記ステップS601において、各
投票記憶領域内の座標を表す成分を、全て予め定めた最
大値に初期化し、上記ステップS605において、取得
した各xy座標を表す成分からそれぞれ「1」を減算し
て投票を行ってもよい。この場合、低い投票値が集中す
る部分を判断すれば、顔の中心を特定することが可能で
あり、この集中現象がどの円形状の投票記憶領域に顕著
に現れているかを判断すれば、顔の大きさを特定するこ
とが可能になる。また、上記ステップS605におい
て、投票数を加算又は減算させる値は「1」以外であっ
てもよく、値を自由に設定することができる。
投票記憶領域内の座標を表す成分を、全て予め定めた最
大値に初期化し、上記ステップS605において、取得
した各xy座標を表す成分からそれぞれ「1」を減算し
て投票を行ってもよい。この場合、低い投票値が集中す
る部分を判断すれば、顔の中心を特定することが可能で
あり、この集中現象がどの円形状の投票記憶領域に顕著
に現れているかを判断すれば、顔の大きさを特定するこ
とが可能になる。また、上記ステップS605におい
て、投票数を加算又は減算させる値は「1」以外であっ
てもよく、値を自由に設定することができる。
【0093】次に、投票結果記憶部53に記憶された投
票結果に基づいて、対象画像の顔領域を特定する手法を
説明する。解析部55は、投票部54による投票処理が
完了した後、投票結果記憶部53に記憶された投票結果
に基づいて、そのクラスタを評価して、対象画像に含ま
れる顔の位置及び大きさを求める。図17は、解析部5
5で行われる解析処理の手順を示すフローチャートであ
る。
票結果に基づいて、対象画像の顔領域を特定する手法を
説明する。解析部55は、投票部54による投票処理が
完了した後、投票結果記憶部53に記憶された投票結果
に基づいて、そのクラスタを評価して、対象画像に含ま
れる顔の位置及び大きさを求める。図17は、解析部5
5で行われる解析処理の手順を示すフローチャートであ
る。
【0094】図17を参照して、解析部55は、まず、
テンプレートを構成する形状(この例では、円t1〜t
n)を特定するカウンタjを、「1」にセットする(ス
テップS701)。次に、解析部55は、カウンタj
(=1)によって特定される円t1について、投票結果
記憶部53の円t1に関する投票記憶領域に記憶されて
いる投票結果を参照して、投票数が予め定めたしきい値
G(例えば、200等)を越える成分だけを抽出する
(ステップS702)。このしきい値Gは、対象画像の
精細度や所望する抽出精度に基づいて、任意に定めるこ
とができる。次に、解析部55は、抽出した成分だけを
対象に、クラスタリングを行い(ステップS703)、
クラスタ化された各領域の分散値及び共分散値をそれぞ
れ計算する(ステップS704)。このクラスタリング
における類似度は、ユークリッド平方距離、標準化ユー
クリッド平方距離、マハラノビスの汎距離又はミンコフ
スキー距離のいずれを用いて判断されてもよい。また、
クラスタの形成には、最短距離法(SLINK:single
linkage clustering method)、最長距離法(CLIN
K:complete linkage clustering method)又は群平均
法(UPGMA:unweighted pair-group method using
arithmetic averages)のいずれを用いてもよい。
テンプレートを構成する形状(この例では、円t1〜t
n)を特定するカウンタjを、「1」にセットする(ス
テップS701)。次に、解析部55は、カウンタj
(=1)によって特定される円t1について、投票結果
記憶部53の円t1に関する投票記憶領域に記憶されて
いる投票結果を参照して、投票数が予め定めたしきい値
G(例えば、200等)を越える成分だけを抽出する
(ステップS702)。このしきい値Gは、対象画像の
精細度や所望する抽出精度に基づいて、任意に定めるこ
とができる。次に、解析部55は、抽出した成分だけを
対象に、クラスタリングを行い(ステップS703)、
クラスタ化された各領域の分散値及び共分散値をそれぞ
れ計算する(ステップS704)。このクラスタリング
における類似度は、ユークリッド平方距離、標準化ユー
クリッド平方距離、マハラノビスの汎距離又はミンコフ
スキー距離のいずれを用いて判断されてもよい。また、
クラスタの形成には、最短距離法(SLINK:single
linkage clustering method)、最長距離法(CLIN
K:complete linkage clustering method)又は群平均
法(UPGMA:unweighted pair-group method using
arithmetic averages)のいずれを用いてもよい。
【0095】次に、解析部55は、クラスタ化された各
領域の分散値及び共分散値を、予め定めたしきい値Hと
比較する(ステップS705)。そして、このステップ
S705において各値がしきい値H未満の場合、解析部
55は、その領域の中心点を顔の中心点とみなして、こ
の時のカウンタj(=1)が指す円t1のサイズ(直
径)を顔の短軸長とし(ステップS706)、この短軸
長に一定値(経験的に定める)を加えた長さを顔の長軸
長として決定する(ステップS707)。そして、解析
部55は、この決定した中心点、短軸長及び長軸長を、
解析結果として保持する(ステップS708)。一方、
上記ステップS705において各値がしきい値H以上の
場合、解析部55は、その領域の中心点が顔の中心点で
はないと判断して、次の処理に移る。
領域の分散値及び共分散値を、予め定めたしきい値Hと
比較する(ステップS705)。そして、このステップ
S705において各値がしきい値H未満の場合、解析部
55は、その領域の中心点を顔の中心点とみなして、こ
の時のカウンタj(=1)が指す円t1のサイズ(直
径)を顔の短軸長とし(ステップS706)、この短軸
長に一定値(経験的に定める)を加えた長さを顔の長軸
長として決定する(ステップS707)。そして、解析
部55は、この決定した中心点、短軸長及び長軸長を、
解析結果として保持する(ステップS708)。一方、
上記ステップS705において各値がしきい値H以上の
場合、解析部55は、その領域の中心点が顔の中心点で
はないと判断して、次の処理に移る。
【0096】この処理が終わると、解析部55は、カウ
ンタjを1つインクリメントして、j=2とする(ステ
ップS710)。次に、解析部55は、カウンタj(=
2)によって特定される円t2について、投票結果記憶
部53の円t2に関する投票記憶領域に記憶されている
投票結果を参照して、投票数が予め定めたしきい値Gを
越える成分だけを抽出する(ステップS702)。次
に、解析部55は、抽出した成分だけを対象に、クラス
タリングを行い(ステップS703)、クラスタ化され
た各領域の分散値及び共分散値をそれぞれ計算する(ス
テップS704)。次に、解析部55は、クラスタ化さ
れた各領域の分散値及び共分散値を、予め定めたしきい
値Hと比較する(ステップS705)。そして、このス
テップS705において各値がしきい値H未満の場合、
解析部55は、その領域の中心点を顔の中心点とみなし
て、この時のカウンタj(=2)が指す円t2のサイズ
を顔の短軸長とし(ステップS706)、この短軸長に
一定値を加えた長さを顔の長軸長として決定する(ステ
ップS707)。そして、解析部55は、この決定した
中心点、短軸長及び長軸長を、解析結果として追加して
保持する(ステップS708)。一方、上記ステップS
705において各値がしきい値H以上の場合、解析部5
5は、その領域の中心点が顔の中心点ではないと判断し
て、次の処理に移る。
ンタjを1つインクリメントして、j=2とする(ステ
ップS710)。次に、解析部55は、カウンタj(=
2)によって特定される円t2について、投票結果記憶
部53の円t2に関する投票記憶領域に記憶されている
投票結果を参照して、投票数が予め定めたしきい値Gを
越える成分だけを抽出する(ステップS702)。次
に、解析部55は、抽出した成分だけを対象に、クラス
タリングを行い(ステップS703)、クラスタ化され
た各領域の分散値及び共分散値をそれぞれ計算する(ス
テップS704)。次に、解析部55は、クラスタ化さ
れた各領域の分散値及び共分散値を、予め定めたしきい
値Hと比較する(ステップS705)。そして、このス
テップS705において各値がしきい値H未満の場合、
解析部55は、その領域の中心点を顔の中心点とみなし
て、この時のカウンタj(=2)が指す円t2のサイズ
を顔の短軸長とし(ステップS706)、この短軸長に
一定値を加えた長さを顔の長軸長として決定する(ステ
ップS707)。そして、解析部55は、この決定した
中心点、短軸長及び長軸長を、解析結果として追加して
保持する(ステップS708)。一方、上記ステップS
705において各値がしきい値H以上の場合、解析部5
5は、その領域の中心点が顔の中心点ではないと判断し
て、次の処理に移る。
【0097】以降同様にして、解析部55は、j=nに
なるまでカウンタjを1つずつインクリメントしながら
(ステップS709,S710)、投票結果記憶部53
に記憶されている各円t3〜tnに関する投票記憶領域
について、上記ステップS702〜S708の解析処理
を繰り返し行う。これにより、各円t1〜tnに関する
投票記憶領域における、顔領域抽出の解析結果を得るこ
とができる。この解析結果は、表示制御部5,25及び
送信データ処理部8へ出力される。
なるまでカウンタjを1つずつインクリメントしながら
(ステップS709,S710)、投票結果記憶部53
に記憶されている各円t3〜tnに関する投票記憶領域
について、上記ステップS702〜S708の解析処理
を繰り返し行う。これにより、各円t1〜tnに関する
投票記憶領域における、顔領域抽出の解析結果を得るこ
とができる。この解析結果は、表示制御部5,25及び
送信データ処理部8へ出力される。
【0098】このように、実施例1の顔抽出部7では、
負担が軽い投票処理(基本的には加算処理のみ)と投票
数の評価だけで、顔の位置を高速に抽出できる。しか
も、相似で同心状の複数サイズの形状を備えたテンプレ
ートを用いているので、顔領域であろうエッジ部が、こ
れらの形状のいずれのサイズに近いかという実質的な近
似を行っていることになり、顔の大きさも高速に抽出で
きる。
負担が軽い投票処理(基本的には加算処理のみ)と投票
数の評価だけで、顔の位置を高速に抽出できる。しか
も、相似で同心状の複数サイズの形状を備えたテンプレ
ートを用いているので、顔領域であろうエッジ部が、こ
れらの形状のいずれのサイズに近いかという実質的な近
似を行っていることになり、顔の大きさも高速に抽出で
きる。
【0099】<実施例2>次に、実施例2として、直交
変換後の空間でパターンマッチングを行うことにより処
理量の削減を図り、携帯電話等のような限られた処理量
を要求される端末において有効となる手法を説明する。
図18は、実施例2の顔抽出部7の構成を示すブロック
図である。図18において、顔抽出部7は、テンプレー
ト画像処理部80と、入力画像処理部90と、積算部1
01と、逆直交変換部(逆FFT)102と、マップ処
理部103とを備える。この実施例2の手法は、テンプ
レート画像処理部80及び入力画像処理部90におい
て、テンプレート画像及び入力画像(対象画像)にそれ
ぞれ線形性を有する直交変換を施し、それらを積算した
後に逆直交変換して、類似値Lを求めるものである。
変換後の空間でパターンマッチングを行うことにより処
理量の削減を図り、携帯電話等のような限られた処理量
を要求される端末において有効となる手法を説明する。
図18は、実施例2の顔抽出部7の構成を示すブロック
図である。図18において、顔抽出部7は、テンプレー
ト画像処理部80と、入力画像処理部90と、積算部1
01と、逆直交変換部(逆FFT)102と、マップ処
理部103とを備える。この実施例2の手法は、テンプ
レート画像処理部80及び入力画像処理部90におい
て、テンプレート画像及び入力画像(対象画像)にそれ
ぞれ線形性を有する直交変換を施し、それらを積算した
後に逆直交変換して、類似値Lを求めるものである。
【0100】ここで、実施例2では、直交変換としてF
FT(高速離散フーリエ変換)を使用する場合を説明す
るが、この他にHartley変換や数論的変換等を用
いることもできる。これら他の変換方法を使用する場合
には、以下の説明中の「フーリエ変換」とある部分を、
これらの変換方法に読み替えればよい。また、テンプレ
ート画像処理部80及び入力画像処理部90のいずれに
おいても、エッジ法線方向ベクトルの内積を利用し、エ
ッジ法線方向ベクトルの方向が近いほど、高い相関が出
るようにしている。しかも、この内積は、偶数倍角表現
を用いて評価される。以下簡単のため、偶数倍角の例と
して2倍角の場合を説明するが、4倍角や6倍角等の他
の偶数倍角においても、実施例2と同様の効果を奏する
ことができる。
FT(高速離散フーリエ変換)を使用する場合を説明す
るが、この他にHartley変換や数論的変換等を用
いることもできる。これら他の変換方法を使用する場合
には、以下の説明中の「フーリエ変換」とある部分を、
これらの変換方法に読み替えればよい。また、テンプレ
ート画像処理部80及び入力画像処理部90のいずれに
おいても、エッジ法線方向ベクトルの内積を利用し、エ
ッジ法線方向ベクトルの方向が近いほど、高い相関が出
るようにしている。しかも、この内積は、偶数倍角表現
を用いて評価される。以下簡単のため、偶数倍角の例と
して2倍角の場合を説明するが、4倍角や6倍角等の他
の偶数倍角においても、実施例2と同様の効果を奏する
ことができる。
【0101】まず、テンプレート画像処理部80につい
て説明する。図18において、テンプレート画像処理部
80は、エッジ抽出部81と、評価ベクトル生成部82
と、直交変換部(FFT)83と、圧縮部84と、記録
部85とを備える。
て説明する。図18において、テンプレート画像処理部
80は、エッジ抽出部81と、評価ベクトル生成部82
と、直交変換部(FFT)83と、圧縮部84と、記録
部85とを備える。
【0102】エッジ抽出部81は、入力されるテンプレ
ート画像に対して、x方向及びy方向のそれぞれについ
て微分処理(エッジ抽出)を施し、テンプレート画像の
エッジ法線方向ベクトルを出力する。本実施例2では、
x方向について、
ート画像に対して、x方向及びy方向のそれぞれについ
て微分処理(エッジ抽出)を施し、テンプレート画像の
エッジ法線方向ベクトルを出力する。本実施例2では、
x方向について、
【数1】 なるSobelフィルタを用い、y方向について、
【数2】 なるSobelフィルタを用いている。これらのフィル
タ(1)及び(2)より、次式(3)で定義されるテン
プレート画像のエッジ法線方向ベクトルが求められる。
タ(1)及び(2)より、次式(3)で定義されるテン
プレート画像のエッジ法線方向ベクトルが求められる。
【数3】
【0103】評価ベクトル生成部82は、エッジ抽出部
81からテンプレート画像のエッジ法線方向ベクトルを
入力し、次に述べる処理を行って、テンプレート画像の
評価ベクトルを直交変換部83へ出力する。まず、評価
ベクトル生成部82は、次式(4)を用いて、テンプレ
ート画像のエッジ法線方向ベクトルを長さについて正規
化する。
81からテンプレート画像のエッジ法線方向ベクトルを
入力し、次に述べる処理を行って、テンプレート画像の
評価ベクトルを直交変換部83へ出力する。まず、評価
ベクトル生成部82は、次式(4)を用いて、テンプレ
ート画像のエッジ法線方向ベクトルを長さについて正規
化する。
【数4】 これは、照明変動のような撮影条件が変化する場合、エ
ッジの強度(長さ)は影響を受け易いが、エッジの角度
は影響を受け難いことを考慮させるためである。そこ
で、本実施例2では、後述するように、入力画像処理部
90において対象画像のエッジ法線方向ベクトルを長さ
「1」に正規化している。これに合わせて、テンプレー
ト画像処理部80においても、テンプレート画像のエッ
ジ法線方向ベクトルを長さ「1」に正規化している。ま
た、周知のように、三角関数については次式(5)の倍
角公式が成立する。
ッジの強度(長さ)は影響を受け易いが、エッジの角度
は影響を受け難いことを考慮させるためである。そこ
で、本実施例2では、後述するように、入力画像処理部
90において対象画像のエッジ法線方向ベクトルを長さ
「1」に正規化している。これに合わせて、テンプレー
ト画像処理部80においても、テンプレート画像のエッ
ジ法線方向ベクトルを長さ「1」に正規化している。ま
た、周知のように、三角関数については次式(5)の倍
角公式が成立する。
【数5】 この倍角公式を用いて、エッジベクトルを次式(6)に
基づいて正規化する。
基づいて正規化する。
【数6】
【0104】以下、この式(6)について説明する。ま
ず、定数aは、微小エッジ除去用のしきい値であって、
定数aより小さなベクトルをゼロベクトルにしているの
は、ノイズ等を除去するためである。次に、xy各成分
が、式(4)のxy各成分の倍角に係る余弦・正弦の従
属関数になっている点について、説明する。ここで、テ
ンプレートの評価ベクトルTと、対象画像の評価ベクト
ルIとのなす角をθとし、その内積、つまりcosθを
類似尺度として用いると、次のような問題がある。例え
ば、テンプレート画像が、図19(a)に示すもので、
対象画像が、同図(b)に示すものであるとする。ここ
で、図19(b)の背景部分の画像は、左半分が対象物
よりも明るく、右半分が対象物よりも暗くなっている。
画像のみで見れば、図19(a)のテンプレート画像の
中心が、同図(b)の対象画像の中心に一致する時、対
象物が完全に一致するので、このとき類似値は最大にな
らなければならない。そして、エッジ法線方向ベクトル
は、対象物の画像から外側に向くものを正とすると、図
19(b)の明るい背景部分でも暗い背景部分でも、対
象物から見て同じ向き(外向き/内向き)でなければな
らない。しかしながら、このとき、図19(b)の背景
部分の輝度が、対象物の左右でばらついていると、図1
9(b)に矢印で示しているように、向きが反対(明る
い背景部分では対象物の外側向き、暗い背景部分では対
象物の内側向き)になってしまう。このような場合、本
来、最大の類似値となるべき場合において、必ずしも類
似値が高い値にならず、誤認識を招き易い。
ず、定数aは、微小エッジ除去用のしきい値であって、
定数aより小さなベクトルをゼロベクトルにしているの
は、ノイズ等を除去するためである。次に、xy各成分
が、式(4)のxy各成分の倍角に係る余弦・正弦の従
属関数になっている点について、説明する。ここで、テ
ンプレートの評価ベクトルTと、対象画像の評価ベクト
ルIとのなす角をθとし、その内積、つまりcosθを
類似尺度として用いると、次のような問題がある。例え
ば、テンプレート画像が、図19(a)に示すもので、
対象画像が、同図(b)に示すものであるとする。ここ
で、図19(b)の背景部分の画像は、左半分が対象物
よりも明るく、右半分が対象物よりも暗くなっている。
画像のみで見れば、図19(a)のテンプレート画像の
中心が、同図(b)の対象画像の中心に一致する時、対
象物が完全に一致するので、このとき類似値は最大にな
らなければならない。そして、エッジ法線方向ベクトル
は、対象物の画像から外側に向くものを正とすると、図
19(b)の明るい背景部分でも暗い背景部分でも、対
象物から見て同じ向き(外向き/内向き)でなければな
らない。しかしながら、このとき、図19(b)の背景
部分の輝度が、対象物の左右でばらついていると、図1
9(b)に矢印で示しているように、向きが反対(明る
い背景部分では対象物の外側向き、暗い背景部分では対
象物の内側向き)になってしまう。このような場合、本
来、最大の類似値となるべき場合において、必ずしも類
似値が高い値にならず、誤認識を招き易い。
【0105】以上の点を図20を用いて、さらに詳しく
説明する。テンプレート画像の評価ベクトルTと、対象
画像の評価ベクトルIとのなす角θの内積cosθを類
似値として用いる場合、上述したように、対象物の周囲
にある背景画像の輝度ばらつきによって、対象画像の評
価ベクトルの方向は、I方向又はその正反対のI’方向
のいずれかになる可能性がある。このため、類似尺度で
ある内積は、cosθとcosθ’との2通りがあり得
ることになる。しかも、θ+θ’=πであり、cosθ
=cos(π−θ’)=−cosθである。つまり、c
osθを類似尺度として用いると、本来、類似値を増や
すように作用しなければならない場合において、逆に類
似値を減らすことになる場合がある。また、類似値を減
らすように作用しなければならない場合において、逆に
類似値を増やすことになる場合がある。
説明する。テンプレート画像の評価ベクトルTと、対象
画像の評価ベクトルIとのなす角θの内積cosθを類
似値として用いる場合、上述したように、対象物の周囲
にある背景画像の輝度ばらつきによって、対象画像の評
価ベクトルの方向は、I方向又はその正反対のI’方向
のいずれかになる可能性がある。このため、類似尺度で
ある内積は、cosθとcosθ’との2通りがあり得
ることになる。しかも、θ+θ’=πであり、cosθ
=cos(π−θ’)=−cosθである。つまり、c
osθを類似尺度として用いると、本来、類似値を増や
すように作用しなければならない場合において、逆に類
似値を減らすことになる場合がある。また、類似値を減
らすように作用しなければならない場合において、逆に
類似値を増やすことになる場合がある。
【0106】そこで、本実施例2では、θの倍角の余弦
(cos2θ)を、類似値の式に使用している。こうす
ると、cosθ’=−cosθとなっていても、式
(5)の倍角公式から、cos2θ’=cos2θとな
る。つまり、類似値を増やすように作用しなければなら
ない場合には、背景部分に影響されずに類似値は高くな
る。従って、背景部分の画像に輝度ばらつきがあって
も、正当に画像のマッチングを評価することができる。
以上の点は、2倍角だけでなく、4倍角や6倍角などで
も同様に成立する。これにより、偶数倍角評価により、
背景の輝度条件にかかわらず、安定してパターンを抽出
できる。なお、この表現の他にもここで、TxとTyの
値の組み合わせからcosθ=Tx,sinθ=Tyと
表現されるθの値(すなわち、エッジ法線方向ベクトル
を極座標表現した場合の位相角)として、Tx,Tyの
2つではなく1つの値で表現することも可能である。ま
た、θを0〜360度でなく、例えば8ビット表現と
し、マイナスの値を2の補数表現として2進数で表現し
た場合(すなわち、−128〜127とした場合)、−
128に1を加算した場合は0となり、循環表現とな
る。このため、θに関する倍角計算及び類似値計算にお
いて、127を超えた場合に−128とする処理が自動
的に行われる。
(cos2θ)を、類似値の式に使用している。こうす
ると、cosθ’=−cosθとなっていても、式
(5)の倍角公式から、cos2θ’=cos2θとな
る。つまり、類似値を増やすように作用しなければなら
ない場合には、背景部分に影響されずに類似値は高くな
る。従って、背景部分の画像に輝度ばらつきがあって
も、正当に画像のマッチングを評価することができる。
以上の点は、2倍角だけでなく、4倍角や6倍角などで
も同様に成立する。これにより、偶数倍角評価により、
背景の輝度条件にかかわらず、安定してパターンを抽出
できる。なお、この表現の他にもここで、TxとTyの
値の組み合わせからcosθ=Tx,sinθ=Tyと
表現されるθの値(すなわち、エッジ法線方向ベクトル
を極座標表現した場合の位相角)として、Tx,Tyの
2つではなく1つの値で表現することも可能である。ま
た、θを0〜360度でなく、例えば8ビット表現と
し、マイナスの値を2の補数表現として2進数で表現し
た場合(すなわち、−128〜127とした場合)、−
128に1を加算した場合は0となり、循環表現とな
る。このため、θに関する倍角計算及び類似値計算にお
いて、127を超えた場合に−128とする処理が自動
的に行われる。
【0107】次に、類似値の計算について説明する。よ
り具体的には、本実施例2では、次式(7)により、類
似値Lを定義する。
り具体的には、本実施例2では、次式(7)により、類
似値Lを定義する。
【数7】 なお、評価ベクトルを(Vx,Vy),(Tx,Ty)
ではなく、Vθ,Tθとした場合は次式(8)となる。
ではなく、Vθ,Tθとした場合は次式(8)となる。
【数8】 なお、ここでは評価ベクトルの要素が1つの場合もベク
トルと標記している。
トルと標記している。
【0108】ここで、式(7)及び式(8)は、加算及
び積算のみからなるので、類似値Lは、対象画像及びテ
ンプレート画像のそれぞれの評価ベクトルについて線形
である。従って、式(7)及び式(8)をフーリエ変換
すると、フーリエ変換の離散相関定理により、
び積算のみからなるので、類似値Lは、対象画像及びテ
ンプレート画像のそれぞれの評価ベクトルについて線形
である。従って、式(7)及び式(8)をフーリエ変換
すると、フーリエ変換の離散相関定理により、
【数9】
【数10】 となる。なお、式(9)及び式(10)において、
“〜”はフーリエ変換値を、“*”は複素共役を表して
いる。
“〜”はフーリエ変換値を、“*”は複素共役を表して
いる。
【0109】また、式(9)又は式(10)を逆フーリ
エ変換すれば、式(7)又は式(8)の類似値Lが得ら
れる。そして、式(9)及び式(10)より、次の2点
が明らかとなる。 1.直交変換した後の変換値においては、テンプレート
画像に係るフーリエ変換値と、対象画像に係るフーリエ
変換値とを、単純に積和すればよい。 2.テンプレート画像に係るフーリエ変換値と、対象画
像に係るフーリエ変換値とを、同時に求める必要はな
く、テンプレート画像に係るフーリエ変換値を対象画像
のフーリエ変換値に先行して求めておいても構わない。
エ変換すれば、式(7)又は式(8)の類似値Lが得ら
れる。そして、式(9)及び式(10)より、次の2点
が明らかとなる。 1.直交変換した後の変換値においては、テンプレート
画像に係るフーリエ変換値と、対象画像に係るフーリエ
変換値とを、単純に積和すればよい。 2.テンプレート画像に係るフーリエ変換値と、対象画
像に係るフーリエ変換値とを、同時に求める必要はな
く、テンプレート画像に係るフーリエ変換値を対象画像
のフーリエ変換値に先行して求めておいても構わない。
【0110】そこで、本実施例2では、テンプレート画
像処理部80に記録部85を設け、対象画像の入力に先
立ち、圧縮部84の出力を記憶しておくことにしてい
る。これにより、対象画像が入力画像処理部90に入力
された後は、テンプレート画像処理部80は、何らテン
プレート画像の処理を行う必要がない。従って、画像通
信端末の処理能力を、入力画像処理部90及び積算部1
01より後段の処理に集中させることができ、一層処理
を高速化できる。
像処理部80に記録部85を設け、対象画像の入力に先
立ち、圧縮部84の出力を記憶しておくことにしてい
る。これにより、対象画像が入力画像処理部90に入力
された後は、テンプレート画像処理部80は、何らテン
プレート画像の処理を行う必要がない。従って、画像通
信端末の処理能力を、入力画像処理部90及び積算部1
01より後段の処理に集中させることができ、一層処理
を高速化できる。
【0111】次に、評価ベクトル生成部82よりも後段
の構成を説明する。図18に示すように、テンプレート
画像処理部80において、評価ベクトル生成部82から
出力されるテンプレート画像の評価ベクトルは、直交変
換部83によりフーリエ変換され、圧縮部84に出力さ
れる。圧縮部84は、フーリエ変換後の評価ベクトルを
削減して、記録部85に格納する。図21に示すよう
に、変換後の評価ベクトルは、xy両方向について高低
さまざまな周波数成分を含んでいる。本発明者らの実験
によれば、全ての周波数成分について処理を行わなくと
も、低周波数成分(例えば、xy両方向について、低周
波側半分ずつ等)について処理を行えば、十分な精度が
得られることがわかっている。なお、図21において、
斜線を付していない領域(−a≦x≦a,−b≦y≦
b)が元の領域であり、斜線を付した領域(−a/2≦
x≦a/2,−b/2≦y≦b/2)が削減後の領域で
ある。すなわち、処理量は1/4となる。このようにす
れば、処理対象を削減して、さらに高速な処理を実現で
きる。なお、圧縮部84及び記録部85は、データ量が
小さい時や高速性が要求されない時は、省略することも
可能である。
の構成を説明する。図18に示すように、テンプレート
画像処理部80において、評価ベクトル生成部82から
出力されるテンプレート画像の評価ベクトルは、直交変
換部83によりフーリエ変換され、圧縮部84に出力さ
れる。圧縮部84は、フーリエ変換後の評価ベクトルを
削減して、記録部85に格納する。図21に示すよう
に、変換後の評価ベクトルは、xy両方向について高低
さまざまな周波数成分を含んでいる。本発明者らの実験
によれば、全ての周波数成分について処理を行わなくと
も、低周波数成分(例えば、xy両方向について、低周
波側半分ずつ等)について処理を行えば、十分な精度が
得られることがわかっている。なお、図21において、
斜線を付していない領域(−a≦x≦a,−b≦y≦
b)が元の領域であり、斜線を付した領域(−a/2≦
x≦a/2,−b/2≦y≦b/2)が削減後の領域で
ある。すなわち、処理量は1/4となる。このようにす
れば、処理対象を削減して、さらに高速な処理を実現で
きる。なお、圧縮部84及び記録部85は、データ量が
小さい時や高速性が要求されない時は、省略することも
可能である。
【0112】次に、入力画像処理部90について説明す
る。図18において、入力画像処理部90は、エッジ抽
出部91と、評価ベクトル生成部92と、直交変換部
(FFT)93と、圧縮部94とを備える。入力画像処
理部90は、テンプレート画像処理部80と同等の処理
を行う。すなわち、エッジ抽出部91は、式(1)及び
式(2)を用いて対象画像のエッジ法線方向ベクトルを
出力する。また、評価ベクトル生成部92は、エッジ抽
出部91から対象画像のエッジ法線方向ベクトルを入力
し、テンプレート画像処理部80の評価ベクトル生成部
82と同等の処理を行い、評価ベクトルを生成する。評
価ベクトル生成部92から出力される対象画像の評価ベ
クトルは、直交変換部93によりフーリエ変換され圧縮
部94に出力される。圧縮部94は、フーリエ変換後の
評価ベクトルを削減して、積算部101へ出力する。こ
こで、圧縮部94は、テンプレート画像処理部80の圧
縮部84と同一の周波数帯に処理対象を削減する。
る。図18において、入力画像処理部90は、エッジ抽
出部91と、評価ベクトル生成部92と、直交変換部
(FFT)93と、圧縮部94とを備える。入力画像処
理部90は、テンプレート画像処理部80と同等の処理
を行う。すなわち、エッジ抽出部91は、式(1)及び
式(2)を用いて対象画像のエッジ法線方向ベクトルを
出力する。また、評価ベクトル生成部92は、エッジ抽
出部91から対象画像のエッジ法線方向ベクトルを入力
し、テンプレート画像処理部80の評価ベクトル生成部
82と同等の処理を行い、評価ベクトルを生成する。評
価ベクトル生成部92から出力される対象画像の評価ベ
クトルは、直交変換部93によりフーリエ変換され圧縮
部94に出力される。圧縮部94は、フーリエ変換後の
評価ベクトルを削減して、積算部101へ出力する。こ
こで、圧縮部94は、テンプレート画像処理部80の圧
縮部84と同一の周波数帯に処理対象を削減する。
【0113】次に、積算部101以降を説明する。テン
プレート画像処理部80及び入力画像処理部90の処理
が完了すると、積算部101は、記録部85と圧縮部9
4とから、テンプレート画像及び対象画像の各評価ベク
トルのフーリエ変換値を入力する。そこで、積算部10
1は、式(9)又は式(10)による積和演算を行い、
結果(類似値Lのフーリエ変換値)を逆直交変換部10
2へ出力する。逆直交変換部102は、類似値Lのフー
リエ変換値を逆フーリエ変換し、類似値LのマップL
(x,y)をマップ処理部103へ出力する。マップ処
理部103は、このマップL(x,y)から、値の高い
点(ピーク)を抽出し、その位置と値とを出力する。な
お、マップ処理部103以降は、必要に応じて自由に構
成することができる。
プレート画像処理部80及び入力画像処理部90の処理
が完了すると、積算部101は、記録部85と圧縮部9
4とから、テンプレート画像及び対象画像の各評価ベク
トルのフーリエ変換値を入力する。そこで、積算部10
1は、式(9)又は式(10)による積和演算を行い、
結果(類似値Lのフーリエ変換値)を逆直交変換部10
2へ出力する。逆直交変換部102は、類似値Lのフー
リエ変換値を逆フーリエ変換し、類似値LのマップL
(x,y)をマップ処理部103へ出力する。マップ処
理部103は、このマップL(x,y)から、値の高い
点(ピーク)を抽出し、その位置と値とを出力する。な
お、マップ処理部103以降は、必要に応じて自由に構
成することができる。
【0114】さて、対象画像のサイズをA(=2γ)と
し、テンプレート画像のサイズをBとすると、テンプレ
ート画像を対象画像上で順次走査させ、各位置での相関
値を求めるためには、 積の回数=2AB の計算回数が必要になる。なお、ここでの計算回数は、
計算コストが高い積の回数で評価する。一方、本実施例
2は、直交変換部83,93による2回のFFT、積算
部101の積和計算、及び逆直交変換部102による1
回の逆FFTが必要で、 積の回数=3{(2γ−4)A+4}+2A の計算回数で済む。これらの計算回数を比較すると、例
えば、A=256×256=216とし、B=60×60
とした場合、本実施例2による積の計算回数は約1/1
00となり、非常に高速な処理が可能になり、処理量の
削減につながる。
し、テンプレート画像のサイズをBとすると、テンプレ
ート画像を対象画像上で順次走査させ、各位置での相関
値を求めるためには、 積の回数=2AB の計算回数が必要になる。なお、ここでの計算回数は、
計算コストが高い積の回数で評価する。一方、本実施例
2は、直交変換部83,93による2回のFFT、積算
部101の積和計算、及び逆直交変換部102による1
回の逆FFTが必要で、 積の回数=3{(2γ−4)A+4}+2A の計算回数で済む。これらの計算回数を比較すると、例
えば、A=256×256=216とし、B=60×60
とした場合、本実施例2による積の計算回数は約1/1
00となり、非常に高速な処理が可能になり、処理量の
削減につながる。
【0115】このように、実施例2の顔抽出部7では、
少ない処理量で顔の位置を抽出できる。そのため、携帯
型の画像通信端末のように限られた処理量が要求される
場面においても、顔の位置及び大きさを抽出することが
可能となる。また、倍角表現を行うことで携帯型の画像
通信端末のように撮影場所や時間が限定されず、あらゆ
る撮影条件を想定しなければならない場面においても、
安定して顔を抽出することが可能になる。
少ない処理量で顔の位置を抽出できる。そのため、携帯
型の画像通信端末のように限られた処理量が要求される
場面においても、顔の位置及び大きさを抽出することが
可能となる。また、倍角表現を行うことで携帯型の画像
通信端末のように撮影場所や時間が限定されず、あらゆ
る撮影条件を想定しなければならない場面においても、
安定して顔を抽出することが可能になる。
【0116】<実施例3>上記実施例1及び実施例2の
顔抽出手法では、対象画像内に顔が存在しない場合で
も、顔に近い部分を強引に顔領域として抽出してしま
う。そこで、次に実施例3として、実施例1及び実施例
2の顔抽出手法によって抽出された顔の位置及び大きさ
が、真に顔であるか否かをさらに判定する手法を説明す
る。
顔抽出手法では、対象画像内に顔が存在しない場合で
も、顔に近い部分を強引に顔領域として抽出してしま
う。そこで、次に実施例3として、実施例1及び実施例
2の顔抽出手法によって抽出された顔の位置及び大きさ
が、真に顔であるか否かをさらに判定する手法を説明す
る。
【0117】これを実現するためには、図12に示す実
施例1の解析部55の後段、又は図18に示す実施例2
のマップ処理部103の後段に、抽出された顔領域が真
の顔であるか否かを判定する構成(顔・非顔判定部)を
設ける。実施例1の解析部55の後段に顔・非顔判定部
を設ける場合、最も簡単には、顔・非顔を判断するため
のしきい値を予め定め、解析部55から出力される領域
の投票値及び顔の大きさから求めた値が、このしきい値
を越えれば当該領域が顔であると判断させる。ここで、
投票値及び顔の大きさから求めた値とは、投票値を顔の
大きさで割った値である。このような処理を行うのは、
顔の大きさに比例する投票値を、顔の大きさで正規化さ
せる理由による。また、実施例2のマップ処理部103
の後段に顔・非顔判定部を設ける場合、最も簡単には、
顔・非顔を判断するためのしきい値を予め定め、マップ
処理部103から出力される領域の類似値が、このしき
い値を越えれば当該領域が顔であると判断させる。な
お、上記実施例1及び実施例2では、顔抽出部7から出
力される顔領域が1つである場合を説明したが、複数の
顔領域が出力される場合であっても、上述した本実施例
3の顔・非顔判定を適用させることができる。
施例1の解析部55の後段、又は図18に示す実施例2
のマップ処理部103の後段に、抽出された顔領域が真
の顔であるか否かを判定する構成(顔・非顔判定部)を
設ける。実施例1の解析部55の後段に顔・非顔判定部
を設ける場合、最も簡単には、顔・非顔を判断するため
のしきい値を予め定め、解析部55から出力される領域
の投票値及び顔の大きさから求めた値が、このしきい値
を越えれば当該領域が顔であると判断させる。ここで、
投票値及び顔の大きさから求めた値とは、投票値を顔の
大きさで割った値である。このような処理を行うのは、
顔の大きさに比例する投票値を、顔の大きさで正規化さ
せる理由による。また、実施例2のマップ処理部103
の後段に顔・非顔判定部を設ける場合、最も簡単には、
顔・非顔を判断するためのしきい値を予め定め、マップ
処理部103から出力される領域の類似値が、このしき
い値を越えれば当該領域が顔であると判断させる。な
お、上記実施例1及び実施例2では、顔抽出部7から出
力される顔領域が1つである場合を説明したが、複数の
顔領域が出力される場合であっても、上述した本実施例
3の顔・非顔判定を適用させることができる。
【0118】そして、顔・非顔判定部で顔でないと判断
された顔領域は、顔抽出部7から表示制御部5及び送信
データ処理部8へは、出力されない。なお、上記第1の
実施形態における送信データ処理部8は、顔抽出部7か
ら顔領域が出力されない場合、送信領域31の位置を移
動させずに前時刻の送信領域31をそのまま用いる。ま
た、一定時間顔領域が出力されない場合には、初期位置
(例えば、撮影領域30の中央)に送信領域31を設定
する。
された顔領域は、顔抽出部7から表示制御部5及び送信
データ処理部8へは、出力されない。なお、上記第1の
実施形態における送信データ処理部8は、顔抽出部7か
ら顔領域が出力されない場合、送信領域31の位置を移
動させずに前時刻の送信領域31をそのまま用いる。ま
た、一定時間顔領域が出力されない場合には、初期位置
(例えば、撮影領域30の中央)に送信領域31を設定
する。
【0119】一方、上述したしきい値による判断方法で
はなく、サポートベクトル関数を用いて顔・非顔を判定
する方法がある。以下に、サポートベクトル関数を用い
た顔・非顔判定を概説する。なお、サポートベクトル自
体は公知の技術であり、文献「Support Vec
tor Machinesによる複数カテゴリの識別
(電子情報通信学会信学技法PRMU98−36(19
98−06))」に詳しく説明されている。
はなく、サポートベクトル関数を用いて顔・非顔を判定
する方法がある。以下に、サポートベクトル関数を用い
た顔・非顔判定を概説する。なお、サポートベクトル自
体は公知の技術であり、文献「Support Vec
tor Machinesによる複数カテゴリの識別
(電子情報通信学会信学技法PRMU98−36(19
98−06))」に詳しく説明されている。
【0120】図22は、実施例3の顔抽出部7の構成の
内、実施例1及び実施例2の構成に追加される構成部分
を示すブロック図である。図22において、実施例3で
の追加構成は、画像サイズ正規化部111と、特徴ベク
トル抽出部112と、顔・非顔判定部113と、顔・非
顔学習辞書114とを備える。この図22の構成は、実
施例1の解析部55の後段、又は実施例2のマップ処理
部103の後段に追加される。
内、実施例1及び実施例2の構成に追加される構成部分
を示すブロック図である。図22において、実施例3で
の追加構成は、画像サイズ正規化部111と、特徴ベク
トル抽出部112と、顔・非顔判定部113と、顔・非
顔学習辞書114とを備える。この図22の構成は、実
施例1の解析部55の後段、又は実施例2のマップ処理
部103の後段に追加される。
【0121】画像サイズ正規化部111は、解析部55
又はマップ処理部103から出力される顔領域部分の画
像を、対象画像から切り出す。そして、画像サイズ正規
化部111は、切り出した画像(以下、顔領域候補画像
という)について、各画素における画像特徴(例えば、
エッジ強度、色の値、輝度値等)を求めた後、一定サイ
ズに正規化を行う。ここでは、顔領域候補画像を10×
10画素の大きさに拡大又は縮小(すなわち正規化)し
た例を説明する。特徴ベクトル抽出部112は、正規化
された顔領域候補画像の輝度情報を特徴データの1つと
して取得する。この例では、10×10画素の画像に正
規化されているので、100次元の特徴ベクトルxi
(0≦i<100)が取得されることとなる。
又はマップ処理部103から出力される顔領域部分の画
像を、対象画像から切り出す。そして、画像サイズ正規
化部111は、切り出した画像(以下、顔領域候補画像
という)について、各画素における画像特徴(例えば、
エッジ強度、色の値、輝度値等)を求めた後、一定サイ
ズに正規化を行う。ここでは、顔領域候補画像を10×
10画素の大きさに拡大又は縮小(すなわち正規化)し
た例を説明する。特徴ベクトル抽出部112は、正規化
された顔領域候補画像の輝度情報を特徴データの1つと
して取得する。この例では、10×10画素の画像に正
規化されているので、100次元の特徴ベクトルxi
(0≦i<100)が取得されることとなる。
【0122】ここで、特徴ベクトル抽出部112は、エ
ッジ法線方向ベクトルを特徴ベクトルとして抽出しても
よい。具体的には、顔領域候補画像に対してX方向so
belフィルタとY方向sobelフィルタとをかけ、
各画素におけるX方向の強度及びY方向の強度を基にし
て方向ベクトルを計算する。この計算では、値として角
度と強さとが算出されるので、強度は無視して角度のみ
を取り出す。そして、256階調を基準として各方向の
正規化を実施し、特徴ベクトルとして使用する。また、
特徴ベクトル抽出部112は、顔領域候補画像内部の正
規化された角度毎のヒストグラムを計算して、エッジ法
線のヒストグラムを特徴ベクトルとして抽出してもよ
い。
ッジ法線方向ベクトルを特徴ベクトルとして抽出しても
よい。具体的には、顔領域候補画像に対してX方向so
belフィルタとY方向sobelフィルタとをかけ、
各画素におけるX方向の強度及びY方向の強度を基にし
て方向ベクトルを計算する。この計算では、値として角
度と強さとが算出されるので、強度は無視して角度のみ
を取り出す。そして、256階調を基準として各方向の
正規化を実施し、特徴ベクトルとして使用する。また、
特徴ベクトル抽出部112は、顔領域候補画像内部の正
規化された角度毎のヒストグラムを計算して、エッジ法
線のヒストグラムを特徴ベクトルとして抽出してもよ
い。
【0123】そして、顔・非顔判定部113は、顔・非
顔学習辞書114に予め用意されている特徴画像及びパ
ラメータを用い、以下の計算式によって顔領域の顔・非
顔判定を行う。
顔学習辞書114に予め用意されている特徴画像及びパ
ラメータを用い、以下の計算式によって顔領域の顔・非
顔判定を行う。
【数11】 ここで、K( )はカーネル関数を、αiは対応するL
agrange係数を、yiは教師データを示し、学習
辞書が顔の時に+1が、非顔の時に−1が適用される。
なお、カーネル関数には、上記した式(12)以外にも
多項式K(Si,Xi)=(Si・Xi+1)や、2層
ニューラルネットワークK(Si,Xi)=tanh
(Si・Xi−δ)を用いることが可能である。
agrange係数を、yiは教師データを示し、学習
辞書が顔の時に+1が、非顔の時に−1が適用される。
なお、カーネル関数には、上記した式(12)以外にも
多項式K(Si,Xi)=(Si・Xi+1)や、2層
ニューラルネットワークK(Si,Xi)=tanh
(Si・Xi−δ)を用いることが可能である。
【0124】顔・非顔判別の結果を図23に示す。顔・
非顔判定部113では、上式(12)の結果が0より大
きい時に顔領域候補画像が顔画像と判定され、0より小
さい時に非顔画像と判定される。同様に他の顔領域候補
画像に対しても顔・非顔判定が行われる。この図23の
例では、画像121が顔画像と判定され、画像122〜
124が非顔画像と判定されている。顔・非顔学習辞書
114では、教師データとして顔画像及び非顔画像が用
意され、識別に使用される同じ特徴データを用いて辞書
の作成が行われる。
非顔判定部113では、上式(12)の結果が0より大
きい時に顔領域候補画像が顔画像と判定され、0より小
さい時に非顔画像と判定される。同様に他の顔領域候補
画像に対しても顔・非顔判定が行われる。この図23の
例では、画像121が顔画像と判定され、画像122〜
124が非顔画像と判定されている。顔・非顔学習辞書
114では、教師データとして顔画像及び非顔画像が用
意され、識別に使用される同じ特徴データを用いて辞書
の作成が行われる。
【0125】このように、実施例3の顔抽出部7では、
実際の顔が顔領域の第1候補以外にある場合でも、安定
した顔領域の抽出が可能になる。また、画像中に顔がな
い場合でも顔がないと判定することができるので、顔の
位置を移動して表示する必要がない場合を自動的に検出
することが可能になる。
実際の顔が顔領域の第1候補以外にある場合でも、安定
した顔領域の抽出が可能になる。また、画像中に顔がな
い場合でも顔がないと判定することができるので、顔の
位置を移動して表示する必要がない場合を自動的に検出
することが可能になる。
【図1】本発明の第1の実施形態に係る画像通信端末の
構成を示すブロック図である。
構成を示すブロック図である。
【図2】送信データ処理部8が行う追従処理の手順を示
すフローチャートである。
すフローチャートである。
【図3】撮影領域30と送信領域31との関係を説明す
る図である。
る図である。
【図4】撮影領域30と送信領域31との関係を説明す
る図である。
る図である。
【図5】撮影領域30と送信領域31との関係を説明す
る図である。
る図である。
【図6】撮影領域30と送信領域31との関係を説明す
る図である。
る図である。
【図7】本発明の第2の実施形態に係る画像通信端末の
構成を示すブロック図である。
構成を示すブロック図である。
【図8】表示部3の画面上に表示される目印の一例を示
す図である。
す図である。
【図9】表示部3の画面上に表示される目印の一例を示
す図である。
す図である。
【図10】入力部22のテンキーを用いて通知される目
印の一例を示す図である。
印の一例を示す図である。
【図11】相手側の情報処理装置の画面上に表示される
利用者1側の画像の一例を示す図である。
利用者1側の画像の一例を示す図である。
【図12】実施例1の顔抽出部7の構成を示すブロック
図である。
図である。
【図13】テンプレート記憶部52に記憶されているテ
ンプレートの一例を示す図である。
ンプレートの一例を示す図である。
【図14】投票部54で行われる投票処理の手順を示す
フローチャートである。
フローチャートである。
【図15】エッジ抽出部51で抽出されるエッジ画像の
一例を説明する図である。
一例を説明する図である。
【図16】投票処理によって投票結果記憶部53の投票
記憶領域に記憶される投票数の概念を説明する図であ
る。
記憶領域に記憶される投票数の概念を説明する図であ
る。
【図17】解析部55で行われる解析処理の手順を示す
フローチャートである。
フローチャートである。
【図18】実施例2の顔抽出部7の構成を示すブロック
図である。
図である。
【図19】エッジ抽出部81及び91に入力されるテン
プレート画像及び対象画像の一例を示す図である。
プレート画像及び対象画像の一例を示す図である。
【図20】内積の正負反転を説明する図である。
【図21】評価ベクトルの圧縮処理を説明する図であ
る。
る。
【図22】実施例3の顔抽出部7の構成の一部を示すブ
ロック図である。
ロック図である。
【図23】顔・非顔判別部113で行われた顔・非顔判
別結果の一例を示す図である。
別結果の一例を示す図である。
1…利用者 2,22…入力部 3…表示部 4…カメラ部 5,25…表示制御部 6…自画像メモリ 7…顔抽出部 8…送信データ処理部 9…通信部 10…受信データ処理部 11…相手画像メモリ 12…通知部 30…撮影領域 31…送信領域 32…有効領域 51,81,91…エッジ抽出部 52…テンプレート記憶部 53…投票結果記憶部 54…投票部 55…解析部 82,92…評価ベクトル生成部 83,93…直交変換部(FFT) 84,94…圧縮部 85…記録部 101…積算部 102…逆直交変換部(逆FFT) 103…マップ処理部 111…画像サイズ正規化部 112…特徴ベクトル抽出部 113…顔・非顔判定部 114…顔・非顔学習辞書 121〜124…画像 R…目印 t1〜tn…円形状
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/46 H04N 7/14 7/14 1/46 Z (72)発明者 高田 雄二 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 吉澤 正文 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 濱崎 省吾 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 吉村 哲也 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 岩佐 克博 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B057 AA20 BA02 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CC01 CE03 CE17 DA07 DB02 DB06 DB09 DC16 DC32 5C064 AA01 AA02 AB02 AB04 AC04 AC12 AC15 AD01 AD08 AD14 5C079 HA01 HB01 LA07 LB11 MA17 5L096 CA02 EA21 FA06 FA59 FA69 JA09
Claims (26)
- 【請求項1】 カメラ部で撮影された利用者の画像を相
手に送信する画像通信端末であって、 利用者からの入力を受け付ける入力部と、 利用者を撮影するカメラ部と、 前記カメラ部で撮影された画像から、利用者の顔の位置
及び大きさ(以下、顔領域という)を抽出する顔抽出部
と、 利用者に画像を表示する表示部と、 相手の情報処理装置に対し、少なくとも画像の通信を行
う通信部と、 前記カメラ部で撮影された画像の領域よりも小さく、か
つ、当該画像の領域内で移動可能に設定される矩形の送
信領域の画像を、前記通信部へ出力する送信データ処理
部とを備え、 前記カメラ部で撮影された画像の領域内に、前記送信領
域と一体的に移動する有効領域が設定され、 前記送信データ処理部は、抽出された前記顔領域が前記
有効領域を逸脱した場合に、当該顔領域の位置に合わせ
て前記送信領域の設定位置を移動させることを特徴とす
る、画像通信端末。 - 【請求項2】 前記有効領域は、前記送信領域よりも小
さく、かつ、前記送信領域内に設定されることを特徴と
する、請求項1に記載の画像通信端末。 - 【請求項3】 前記送信データ処理部は、抽出された前
記顔領域が前記有効領域を逸脱した場合、当該顔領域が
前記送信領域の中心に位置するように、前記送信領域を
移動させることを特徴とする、請求項1に記載の画像通
信端末。 - 【請求項4】 前記送信データ処理部は、抽出された前
記顔領域が前記有効領域を逸脱した場合、当該顔領域が
前記送信領域の中心より上方向に位置するように、前記
送信領域を移動させることを特徴とする、請求項1に記
載の画像通信端末。 - 【請求項5】 前記送信データ処理部は、抽出された前
記顔領域が前記有効領域を逸脱した場合、当該顔領域が
前記送信領域の中心又は中心より上方向に位置するよう
に、前記入力部から入力される送信モード情報に応じて
切り替えて、前記送信領域を移動させることを特徴とす
る、請求項4に記載の画像通信端末。 - 【請求項6】 前記表示部は、前記入力部から入力され
る情報に応じて、前記送信領域内の画像と前記顔領域と
をモニタ表示し、 利用者は、前記モニタ表示を参照して、前記入力部への
入力により前記送信領域の位置を縦横方向に調節可能な
ことを特徴とする、請求項4に記載の画像通信端末。 - 【請求項7】 カメラ部で撮影された利用者の画像を相
手に送信する画像通信端末であって、 利用者からの入力を受け付ける入力部と、 利用者を撮影するカメラ部と、 前記カメラ部で撮影された画像から、利用者の顔の位置
及び大きさ(以下、顔領域という)を抽出する顔抽出部
と、 利用者に画像を表示する表示部と、 相手の情報処理装置に対し、少なくとも画像の通信を行
う通信部と、 前記カメラ部で撮影された画像の領域よりも小さく、か
つ、当該画像の領域内で移動可能に設定される矩形の送
信領域の画像を、前記通信部へ出力する送信データ処理
部とを備え、 前記カメラ部で撮影された画像の領域内に、前記送信領
域と一体的に移動する有効領域が設定され、 前記送信データ処理部は、抽出された前記顔領域が前記
有効領域を逸脱した場合に、当該顔領域の位置に合わせ
て前記送信領域の設定位置を移動させ、かつ、抽出され
た前記顔領域の画像輝度に基づいて、前記カメラ部で撮
影された画像内にある顔の視認性が向上するように、前
記送信領域の画像輝度を補正して前記通信部へ出力する
ことを特徴とする、画像通信端末。 - 【請求項8】 前記送信データ処理部は、前記送信領域
の画像輝度に加え、色調も補正して前記通信部へ出力す
ることを特徴とする、請求項7に記載の画像通信端末。 - 【請求項9】 カメラ部で撮影された利用者の画像を相
手に送信する画像通信端末であって、 利用者からの入力を受け付ける入力部と、 利用者を撮影するカメラ部と、 前記カメラ部で撮影された画像から、利用者の顔の位置
及び大きさ(以下、顔領域という)を抽出する顔抽出部
と、 利用者に画像を表示する表示部と、 相手の情報処理装置に対し、少なくとも画像の通信を行
う通信部と、 前記カメラ部で撮影された画像の領域よりも小さく、か
つ、当該画像の領域内で移動可能に設定される矩形の送
信領域の画像を、前記通信部へ出力する送信データ処理
部とを備え、 前記カメラ部で撮影された画像の領域内に、前記送信領
域と一体的に移動する有効領域が設定され、 前記送信データ処理部は、抽出された前記顔領域が前記
有効領域を逸脱した場合に、当該顔領域の位置に合わせ
て前記送信領域の設定位置を移動させ、かつ、抽出され
た前記顔領域の画像輝度に基づいて、前記カメラ部で撮
影された画像内にある顔の視認性が向上するように、前
記カメラ部の露出レベルの値を設定することを特徴とす
る、画像通信端末。 - 【請求項10】 カメラ部で撮影された利用者の画像を
相手に送信する画像通信端末であって、 利用者を撮影するカメラ部と、 前記カメラ部で撮影された画像から、利用者の顔の位置
を抽出する顔抽出部と、 利用者に相手から受信した画像を表示する表示部と、 抽出された前記顔の位置に基づいて、前記カメラ部で撮
影された画像中における利用者の顔の位置を、利用者に
通知する通知制御部と、 相手の情報処理装置に対し、少なくとも画像の通信を行
う通信部とを備える、画像通信端末。 - 【請求項11】 前記顔抽出部は、利用者の前記顔の位
置と共に顔の大きさも抽出し、 前記通知制御部は、前記カメラ部で撮影された画像中に
おける利用者の前記顔の位置及び大きさを、利用者に通
知することを特徴とする、請求項10に記載の画像通信
端末。 - 【請求項12】 前記通知制御部は、抽出された前記顔
の位置のみ又は位置と大きさとを示す目印を、前記表示
部に表示させることを特徴とする、請求項10に記載の
画像通信端末。 - 【請求項13】 前記目印は、相手から受信した画像上
に表示されることを特徴とする、請求項12に記載の画
像通信端末。 - 【請求項14】 前記目印は、相手から受信した画像外
に表示されることを特徴とする、請求項12に記載の画
像通信端末。 - 【請求項15】 前記通知制御部は、抽出された前記顔
の位置を、前記表示部とは別個に備える位置通知部を介
して通知することを特徴とする、請求項12に記載の画
像通信端末。 - 【請求項16】 前記通知制御部によって行われる利用
者への通知方法を、利用者からの指示に従って切り替え
可能とすることを特徴とする、請求項10に記載の画像
通信端末。 - 【請求項17】 前記顔抽出部は、 前記カメラ部で撮影された画像からエッジ部(人物の外
郭や顔の輪郭等に相当する画素)を抽出して、当該エッ
ジ部だけの画像(以下、エッジ画像という)を生成する
エッジ抽出部と、 予め定めた形状を、相似で大きさを異ならせた種々のサ
イズによって、中心点で同心状に複数設けたテンプレー
トを記憶するテンプレート記憶部と、 前記テンプレートを構成する各サイズの形状毎に、前記
エッジ画像上の座標位置と投票数とを対応付けてそれぞ
れ記憶する投票結果記憶部と、 前記エッジ部の各画素位置に前記テンプレートの中心点
を順次移動させ、移動させた当該画素位置毎に、前記各
サイズの形状を形成する全画素の位置に対応する各座標
位置について、前記投票結果記憶部に記憶されている前
記投票数をそれぞれ増加又は減少させる投票部と、 前記投票結果記憶部に記憶されている前記各投票数に基
づいて、前記対象画像に含まれる顔の位置及び大きさを
求める解析部とを備える、請求項1〜16のいずれかに
記載の画像通信端末。 - 【請求項18】 前記予め定めた形状は、円であること
を特徴とする、請求項17に記載の画像通信端末。 - 【請求項19】 前記顔抽出部は、 所定のテンプレート画像を入力し、当該画像のエッジ法
線方向ベクトルを求め、当該エッジ法線方向ベクトルか
ら評価ベクトルを生成し、当該評価ベクトルを直交変換
するテンプレート画像処理部と、 前記カメラ部で撮影された画像を入力し、当該画像のエ
ッジ法線方向ベクトルを求め、当該エッジ法線方向ベク
トルから評価ベクトルを生成し、当該評価ベクトルを直
交変換する入力画像処理部と、 前記テンプレート画像及び前記撮影された画像のそれぞ
れについて生成された直交変換後の各評価ベクトルにつ
いて、対応スペクトルデータを積和計算する積和部と、 前記積和計算の結果を逆直交変換して類似値のマップを
生成する逆直交変換部とを備え、 前記評価ベクトルは、該当する画像の前記エッジ法線方
向ベクトルを偶数倍角変換した成分を含み、前記類似値
の算出式、直交変換及び逆直交変換は、いずれも線形性
を有するものであることを特徴とする、請求項1〜16
のいずれかに記載の画像通信端末。 - 【請求項20】 前記顔抽出部は、前記評価ベクトルの
表現において、前記エッジ法線方向ベクトルを極座標表
現した場合の角度に基づいて計算した値を用いることを
特徴とする、請求項19に記載の画像通信端末。 - 【請求項21】 前記顔抽出部は、前記カメラ部で撮影
された画像から顔として抽出された位置及び大きさが、
真に顔であるか否かを判定する顔・非顔判定部をさらに
備え、顔と判定した場合にのみ抽出結果を出力すること
を特徴とする、請求項1〜16のいずれかに記載の画像
通信端末。 - 【請求項22】 前記顔抽出部は、前記投票結果記憶部
に記憶されている内容に基づいて、前記カメラ部で撮影
された画像から顔として抽出された位置及び大きさが、
真に顔であるか否かを判定する顔・非顔判定部をさらに
備え、顔と判定した場合にのみ抽出結果を出力すること
を特徴とする、請求項17に記載の画像通信端末。 - 【請求項23】 前記顔抽出部は、前記逆直交変換部で
生成された前記類似値に基づいて、前記カメラ部で撮影
された画像から顔として抽出された位置及び大きさが、
真に顔であるか否かを判定する顔・非顔判定部をさらに
備え、顔と判定した場合にのみ抽出結果を出力すること
を特徴とする、請求項19に記載の画像通信端末。 - 【請求項24】 前記顔・非顔判定部は、前記カメラ部
で撮影された画像から顔として抽出された領域から得ら
れる画像特徴を用いて、サポートベクトル関数の判定結
果に基づいて顔・非顔の判定を行うことを特徴とする、
請求項21に記載の画像通信端末。 - 【請求項25】 前記顔・非顔判定部は、前記カメラ部
で撮影された画像から顔として抽出された領域から得ら
れるエッジ法線方向ベクトルを前記画像特徴とすること
を特徴とする、請求項24に記載の画像通信端末。 - 【請求項26】 前記顔・非顔判定部は、前記カメラ部
で撮影された画像から顔として抽出された領域から得ら
れるエッジ法線のヒストグラムを前記画像特徴とするこ
とを特徴とする、請求項24に記載の画像通信端末。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001152614A JP2002051316A (ja) | 2000-05-22 | 2001-05-22 | 画像通信端末 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-150208 | 2000-05-22 | ||
JP2000150208 | 2000-05-22 | ||
JP2000-150209 | 2000-05-22 | ||
JP2000150209 | 2000-05-22 | ||
JP2001152614A JP2002051316A (ja) | 2000-05-22 | 2001-05-22 | 画像通信端末 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002051316A true JP2002051316A (ja) | 2002-02-15 |
Family
ID=27343457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001152614A Withdrawn JP2002051316A (ja) | 2000-05-22 | 2001-05-22 | 画像通信端末 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002051316A (ja) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003259322A (ja) * | 2002-03-01 | 2003-09-12 | Sumitomo Electric Ind Ltd | 画像表示方法、表示装置及び双方向対話型システム |
JP2004151812A (ja) * | 2002-10-29 | 2004-05-27 | Yokogawa Electric Corp | 顔画像処理装置 |
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
JP2005151430A (ja) * | 2003-11-19 | 2005-06-09 | Nec Corp | テレビ電話装置及びテレビ電話方法 |
WO2005064540A1 (ja) * | 2003-12-26 | 2005-07-14 | Seiko Epson Corporation | 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム |
WO2007077614A1 (ja) * | 2005-12-28 | 2007-07-12 | Fujitsu Limited | Tv電話機能の撮影画像処理切り替え装置 |
JP2009266189A (ja) * | 2008-04-21 | 2009-11-12 | Sharp Corp | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 |
JP2010245950A (ja) * | 2009-04-08 | 2010-10-28 | Toyota Motor Kyushu Inc | 車載用画像制御装置 |
US7920725B2 (en) | 2003-09-09 | 2011-04-05 | Fujifilm Corporation | Apparatus, method, and program for discriminating subjects |
WO2011092848A1 (ja) * | 2010-01-29 | 2011-08-04 | 株式会社日立製作所 | オブジェクト検出装置および顔検出装置 |
JP2011221788A (ja) * | 2010-04-09 | 2011-11-04 | Konica Minolta Holdings Inc | 画像処理装置、画像処理プログラム、情報処理装置及び情報処理プログラム |
JP2019161483A (ja) * | 2018-03-14 | 2019-09-19 | パナソニックIpマネジメント株式会社 | 携帯端末および画像切り出し方法 |
JP2019161482A (ja) * | 2018-03-14 | 2019-09-19 | パナソニックIpマネジメント株式会社 | 携帯端末および画像送信方法 |
CN110703206A (zh) * | 2019-09-19 | 2020-01-17 | 上海船舶电子设备研究所(中国船舶重工集团公司第七二六研究所) | 水下uuv通信定位一体化系统 |
-
2001
- 2001-05-22 JP JP2001152614A patent/JP2002051316A/ja not_active Withdrawn
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003259322A (ja) * | 2002-03-01 | 2003-09-12 | Sumitomo Electric Ind Ltd | 画像表示方法、表示装置及び双方向対話型システム |
JP2004151812A (ja) * | 2002-10-29 | 2004-05-27 | Yokogawa Electric Corp | 顔画像処理装置 |
JP2005108195A (ja) * | 2003-09-09 | 2005-04-21 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
JP4510556B2 (ja) * | 2003-09-09 | 2010-07-28 | 富士フイルム株式会社 | 対象物識別装置および方法並びにプログラム |
US8184870B2 (en) | 2003-09-09 | 2012-05-22 | Fujifilm Corporation | Apparatus, method, and program for discriminating subjects |
US7920725B2 (en) | 2003-09-09 | 2011-04-05 | Fujifilm Corporation | Apparatus, method, and program for discriminating subjects |
JP2005151430A (ja) * | 2003-11-19 | 2005-06-09 | Nec Corp | テレビ電話装置及びテレビ電話方法 |
JP4569737B2 (ja) * | 2003-11-19 | 2010-10-27 | 日本電気株式会社 | テレビ電話装置及びテレビ電話方法 |
WO2005064540A1 (ja) * | 2003-12-26 | 2005-07-14 | Seiko Epson Corporation | 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム |
WO2007077614A1 (ja) * | 2005-12-28 | 2007-07-12 | Fujitsu Limited | Tv電話機能の撮影画像処理切り替え装置 |
US8063938B2 (en) | 2005-12-28 | 2011-11-22 | Fujitsu Limited | Photographed image process changeover apparatus of a video telephone function |
JP2009266189A (ja) * | 2008-04-21 | 2009-11-12 | Sharp Corp | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 |
JP4729601B2 (ja) * | 2008-04-21 | 2011-07-20 | シャープ株式会社 | 画像判別装置、画像検索装置、画像検索プログラムおよび記録媒体 |
JP2010245950A (ja) * | 2009-04-08 | 2010-10-28 | Toyota Motor Kyushu Inc | 車載用画像制御装置 |
WO2011092848A1 (ja) * | 2010-01-29 | 2011-08-04 | 株式会社日立製作所 | オブジェクト検出装置および顔検出装置 |
JPWO2011092848A1 (ja) * | 2010-01-29 | 2013-05-30 | 株式会社日立製作所 | オブジェクト検出装置および顔検出装置 |
JP2011221788A (ja) * | 2010-04-09 | 2011-11-04 | Konica Minolta Holdings Inc | 画像処理装置、画像処理プログラム、情報処理装置及び情報処理プログラム |
JP2019161483A (ja) * | 2018-03-14 | 2019-09-19 | パナソニックIpマネジメント株式会社 | 携帯端末および画像切り出し方法 |
JP2019161482A (ja) * | 2018-03-14 | 2019-09-19 | パナソニックIpマネジメント株式会社 | 携帯端末および画像送信方法 |
JP7113347B2 (ja) | 2018-03-14 | 2022-08-05 | パナソニックIpマネジメント株式会社 | 携帯端末、画像切り出し方法、およびプログラム |
JP7117521B2 (ja) | 2018-03-14 | 2022-08-15 | パナソニックIpマネジメント株式会社 | 携帯端末、画像送信方法、およびプログラム |
JP2022133267A (ja) * | 2018-03-14 | 2022-09-13 | パナソニックIpマネジメント株式会社 | 端末装置、画像切り出し方法、および画像切り出しプログラム |
CN110703206A (zh) * | 2019-09-19 | 2020-01-17 | 上海船舶电子设备研究所(中国船舶重工集团公司第七二六研究所) | 水下uuv通信定位一体化系统 |
CN110703206B (zh) * | 2019-09-19 | 2023-07-25 | 上海船舶电子设备研究所(中国船舶重工集团公司第七二六研究所) | 水下uuv通信定位一体化系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1158801A2 (en) | Image communication terminal | |
US12081352B2 (en) | Mobile information terminal | |
JP2002051316A (ja) | 画像通信端末 | |
KR100730500B1 (ko) | 화상 처리 장치와 화상 처리 방법 및 기록 매체 | |
CN107949863B (zh) | 使用生物体信息的认证装置以及认证方法 | |
CN110807361B (zh) | 人体识别方法、装置、计算机设备及存储介质 | |
CN106462937B (zh) | 图像处理装置以及图像显示装置 | |
US20060120707A1 (en) | Eye image pickup apparatus, iris authentication apparatus and portable terminal device having iris authentication function | |
US20110286640A1 (en) | Rolled fingerprint acquisition apparatus and method for automatically detecting start and end of registration and synthesis | |
KR20120019410A (ko) | 제스처 기반 바이오메트릭 시스템의 방법 및 장치 | |
JP2003108983A (ja) | 目画像撮像装置及び虹彩認証装置並びに虹彩認証機能付き携帯端末装置 | |
CN107944367B (zh) | 人脸关键点检测方法及装置 | |
US20170124383A1 (en) | Face recognition device, face recognition method, and computer-readable recording medium | |
CN111461097A (zh) | 识别图像信息的方法、装置、电子设备及介质 | |
AU2020309094B2 (en) | Image processing method and apparatus, electronic device, and storage medium | |
CN113888548A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
US20180247419A1 (en) | Object tracking method | |
JP2022021537A (ja) | 生体認証装置および生体認証方法 | |
JP2008067321A (ja) | データ登録管理装置 | |
US20210182584A1 (en) | Methods and systems for displaying a visual aid and enhancing user liveness detection | |
CN114241604A (zh) | 姿态检测的方法、装置、电子设备和存储介质 | |
JP3980464B2 (ja) | 鼻位置の抽出方法、およびコンピュータに当該鼻位置の抽出方法を実行させるためのプログラムならびに鼻位置抽出装置 | |
US11527090B2 (en) | Information processing apparatus, control method, and non-transitory storage medium | |
CN113342157A (zh) | 眼球追踪处理方法及相关装置 | |
JP2019091305A (ja) | 情報処理装置、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060126 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060327 |