JP2005142765A - 撮像装置及び方法 - Google Patents
撮像装置及び方法 Download PDFInfo
- Publication number
- JP2005142765A JP2005142765A JP2003376115A JP2003376115A JP2005142765A JP 2005142765 A JP2005142765 A JP 2005142765A JP 2003376115 A JP2003376115 A JP 2003376115A JP 2003376115 A JP2003376115 A JP 2003376115A JP 2005142765 A JP2005142765 A JP 2005142765A
- Authority
- JP
- Japan
- Prior art keywords
- image
- camera
- cameras
- normal direction
- imaging
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003384 imaging method Methods 0.000 title claims description 39
- 238000000034 method Methods 0.000 title description 20
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000012937 correction Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000009466 transformation Effects 0.000 claims description 20
- 238000003702 image correction Methods 0.000 claims description 16
- 230000003993 interaction Effects 0.000 abstract 1
- 230000003287 optical effect Effects 0.000 description 28
- 238000010606 normalization Methods 0.000 description 18
- 230000006854 communication Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 17
- 238000013459 approach Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】 システム全体を複雑化させることなく、よりリアルで臨場感のある遠隔対話を実現する。
【解決手段】 撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、各カメラにより撮像された各画像の法線方向を仮想的に設定された仮想平面の法線方向に合わせることにより補正処理を施し、この補正処理を施した各画像間において撮影対象と関連させつつ画素位置毎に対応付けを行い、各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成し、互いに対応付けた画素位置並びにその輝度成分から、上記生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める。
【選択図】図2
【解決手段】 撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、各カメラにより撮像された各画像の法線方向を仮想的に設定された仮想平面の法線方向に合わせることにより補正処理を施し、この補正処理を施した各画像間において撮影対象と関連させつつ画素位置毎に対応付けを行い、各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成し、互いに対応付けた画素位置並びにその輝度成分から、上記生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める。
【選択図】図2
Description
本発明は、例えばテレビ会議システム或いはテレビ電話システム等に適用され、ネットワークを介して画像を双方向で送受信する通信システム、送受信する画像を撮像して、ユーザの視線方向に応じてこれを再構成する撮像装置及び方法に関する。
テレビ電話システムやテレビ会議システム等に代表されるように、複数のユーザが互いに離れた場所から相手の表示像を視認しながら遠隔対話するシステムが提案されている。このようなシステムでは、相手の表示像をディスプレイ上に表示するとともに、当該ディスプレイを視認するユーザを撮影対象として撮像し、得られた画像信号を公衆回線、専用回線等のネットワークを介して相手側の端末装置へ送信することにより、双方のユーザに対し臨場感を持たせることが可能となる。
従来におけるテレビ会議システムでは、ディスプレイの中心付近に写し出される相手の表示像を視認するユーザを、ディスプレイ上部にあるカメラにより撮像するため、ユーザが下を向いた状態の画像が相手側のディスプレイ上に表示されることになる。このため、実際にディスプレイを視認するユーザ間において視線が不一致の状態で対話がなされることになり、互いに違和感を与えてしまうという問題がある。
理想的には、相手の表示像が写し出されるディスプレイの中心付近にカメラを設置すれば、双方のユーザの視線を一致させた状態で対話を実現することができる。しかしながら、かかるディスプレイの中心付近にカメラを設置することは物理的に困難である。
このような視線不一致に関する問題点を解決すべく、例えばハーフミラーを用いてカメラの向きと表示画面を合わせるテレビ電話装置(例えば、特許文献1参照。)、光透過状態と光散乱状態を制御できるスクリーンとプロジェクタを用いて時系列で表示と撮像を行う画像表示/制御装置(例えば、特許文献2参照。)、ホログラムスクリーンとプロジェクタを用いることにより、表示と撮像の双方を同時に実現できる撮像機能付き表示装置(例えば、特許文献3参照。)が提案されている。
また、視線と顔の位置に応じて相手側のカメラの光軸を制御することにより、表示画面と視線を一致させる双方向通信システム、端末装置及び制御方法が提案されている(例えば、特許文献4参照。)。
また、ディスプレイの両側に配置された複数のカメラにより撮影された入力画像に基づいて被写体の3次元情報を抽出し、抽出した3次元情報と受信者の視点位置に関する情報に応じて被写体の出力画像を再構成し、これを相手側のディスプレイへ表示させる画像処理装置が提案されている(例えば、特許文献5参照。)。この画像処理装置では、一直線上に配置された複数のカメラ映像から生成されたエピポーラ平面画像を用いて画面中心の仮想視点カメラ映像を合成することにより、利用者の視線を一致させて臨場感の高いコミュニケーションを実現することができる。
また、観察者の視点位置に合わせた画像を入力された画像群より切り替えて表示し、観察者の視点位置に応じた画像を表示する画像処理方法及びその装置(例えば、特許文献6参照。)も提案されている。この画像処理方法等においても、対応点の探索を容易化すべく、同様にエピポーラ平面画像を用いることができる。
また、TV会議で互いの視線を一致させるべく、画面の左右に設置された2台のカメラで撮影した画像に基づいて3次元位置情報を生成する画像通信装置(例えば、特許文献7参照。)も提案されている。
しかしながら、上述した従来のシステムでは、実際にディスプレイを視認するユーザ間において視線を一致させた状態で対話を実現することができるが、ハーフミラーやホログラムスクリーン、更にはプロジェクタ等のような特殊装置を使用する必要があり、簡易で安価なシステムを構成することができないという問題点があった。
特に近年において、ブロードバンドネットワーク技術の進歩に伴い、このテレビ電話システムやテレビ会議システムに対するニーズがますます高くなる中、ディスプレイを視認するユーザの視線方向を常時抽出することにより、細かい動きや表情までを正確に捉えた、よりリアルで臨場感のある遠隔対話を実現する必要がある。
そこで本発明は上述した問題点を解決すべく案出されたものであり、その目的とするところは、システム全体を複雑化させることなく、よりリアルで臨場感のある遠隔対話を実現することができる通信システム、撮像装置及び方法を提供することにある。
上述した問題点を解決するために、本発明では、撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、各カメラにより撮像された各画像の法線方向を仮想的に設定された仮想平面の法線方向に合わせることにより補正処理を施し、この補正処理を施した各画像間において撮影対象と関連させつつ画素位置毎に対応付けを行い、各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成し、互いに対応付けた画素位置並びにその輝度成分から、上記生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める。
即ち、本発明を適用した撮像装置は、撮影対象を互いに異なる角度から撮像する少なくとも3台のカメラを含む撮像手段と、少なくとも各カメラにより撮像された各画像の法線方向を合わせる画像補正手段と、画像補正手段により補正された各画像間において、撮影対象と関連させつつ画素位置毎に対応付けを行うマッチング手段と、各カメラに対する撮影対象の相対的な位置関係を示す相対位置情報を生成する情報生成手段と、マッチング手段により互いに対応付けされた画素位置並びにその輝度成分から、生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める画像生成手段とを備える。
また、本発明を適用した撮像方法は、撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、各カメラにより撮像された各画像の法線方向を一方向に合わせる補正処理を施し、補正処理を施した各画像間において撮影対象と関連させつつ画素位置毎に対応付けを行い、各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成し、互いに対応付けた画素位置並びにその輝度成分から、生成した相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める。
本発明を適用した撮像装置及び方法では、撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、各カメラにより撮像された各画像の法線方向を仮想的に設定された仮想平面の法線方向に合わせることにより補正処理を施し、この補正処理を施した各画像間において撮影対象と関連させつつ画素位置毎に対応付けを行い、各カメラに対する撮影対象の相対的な位置関係を示す相対位置情報を生成し、互いに対応付けた画素位置並びにその輝度成分から、上記生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める。
これにより、本発明を適用した撮像装置及び方法では、システム全体を複雑化させることなく対話するユーザ間において常時視線を一致させたビジュアルコミュニケーションを実現することができ、よりリアルで臨場感のある遠隔対話を実現することができる。また、撮像した画像につき法線ベクトルを一方向に合わせることによる幾何学的正規化を施し、エピポーラ線を平行化させることによって、画像間の対応付け、並びに画像内挿を利用した仮想視点画像の生成を効果的に行うことができる。
以下、本発明を実施するための最良の形態について図面を参照しながら詳細に説明する。
本発明を適用した通信システム1は、例えば図1に示すように、A地点のユーザaと、B地点のユーザbとの間で、互いに離れた場所から相手の表示像を視認しながら遠隔対話するシステムである。
A地点には、撮影対象としてのユーザaを互いに異なる角度から撮像するカメラ11a、カメラ12a,カメラ13aと、B地点側で撮像されたユーザbの画像をユーザaに対して表示するためのディスプレイ5aと、カメラ11a,12a,13aより撮像された各画像Pa1,Pa2,Pa3に基づいて仮想視点画像Imaを生成し、これをネットワーク7を介してB地点へ送信する端末装置2aが配設されている。
B地点には、撮影対象としてのユーザbを互いに異なる角度から撮像するカメラ11b、カメラ12bと、カメラ13bと、A地点側で撮像されたユーザaの画像をユーザbに対して表示するためのディスプレイ5bと、カメラ11b,12b,13bより撮像された各画像Pb1,Pb2,Pb3に基づいて仮想視点画像Imbを生成し、これをネットワーク7を介してA地点へ送信する端末装置2bが配設されている。
なお、この端末装置2a,2bにより生成される上記仮想視点画像Ima,Imbは、相手の表示像が写し出されるディスプレイ5a,5bの中心付近において仮想的に設置された仮想カメラにより撮像される画像に相当する。
カメラ11a,11bは、それぞれユーザa,b側から見てディスプレイ5a,5bの左側面に設置されてなり、カメラ12a,12bは、それぞれユーザa,b側から見てディスプレイの右側面に設置されてなる。更にカメラ13a,13bは、それぞれユーザa,b側から見てディスプレイの上側面に設置されてなる。
このカメラ11、12、13は、撮影方向、撮影画角が固定された状態で設置されるが、各ユーザa,bからの入力される情報に基づき、これらを自在に変更するようにしてもよい。ちなみに、以下の通信システム1の説明においては、カメラ11、12、13の各々のカメラの焦点で構成される三角形領域が、ユーザの視線の高さに合わせて設置される場合を例に挙げて説明をする。
ディスプレイ5a,5bは、それぞれネットワーク7を介して相手側地点から供給される仮想視点画像Imb,Imaに基づく画像を、例えば液晶表示面を介して表示する。このディスプレイ5a,5bにおける液晶表示面は、多数の液晶表示素子等からなり、各仮想視点画像Imb,Imaに基づく出力信号に応じて液晶表示素子を光変調させてユーザに表示する画像を作り出す。
端末装置2a,2bは、通常、パーソナルコンピュータ(PC)等の電子機器で構成される。これらの端末装置2a,2bは、ネットワーク7を介して互いに通信するための機能を備え、相手側からの要求に応じて画像や音声を送信する。なお、端末装置2a,2bの構成については後述する。
ネットワーク7は、例えば端末装置2と電話回線を介して接続されるインターネット網を始め、TA/モデムと接続されるISDN(Integrated Services Digital Network)/B(broadband)−ISDN等のように、情報の双方向送受信を可能とした公衆通信網である。ちなみにこの通信システム1を、一定の狭いエリア内で運用する場合には、このネットワーク7を、LAN(Local Area Network)で構成してもよい。さらにこのネットワーク7は、動画像を送信する場合には、インターネットプロトコル(IP)に基づき、例えばMPEG(Moving Picture Experts Group)データを始めとする動画像がある一つのチャネルから継続的に送信される。また静止画像を送信する場合には、動画像を送信するチャネルとは別のチャネルから一定時間毎に送信されることになる。なお、このネットワーク7には、さらに図示しないネットワークサーバを接続してもよい。この図示しないネットワークサーバは、例えばインターネット情報を管理し、端末装置2による要求を受けて、自身に格納してある所定の情報を送信する。
次に、端末装置2の構成について、端末装置2aを例にとり図2を用いて説明をする。
端末装置2aは、接続されたカメラ11a,12a,13aより画像Pa1,Pa2,Pa3が供給される補正部20と、この補正部20に接続されるマッチング部29と、さらにこのマッチング部29に接続される仮想視点画像生成部30と、仮想視点画像生成部30により生成された仮想視点画像Imaを相手側の端末装置2bへ送信するための出力制御部31と、各カメラ11a,12a,13aに対するユーザaの相対的な位置関係を示す相対位置情報を生成する情報生成部33とを備えている。
補正部20は、カメラ11a,12a,13aから送信される各画像Pa1,Pa2,Pa3につき幾何学的な画像補正を施すための幾何学的画像補正部21,22,23と、これら幾何学的画像補正部21,22,23により画像補正が施された画像を正規化するための正規化処理部24とを備えている。
幾何学的画像補正部21,22,23は、カメラキャリブレーション部26から送信される、上記カメラ11a,12a,13aの幾何学的な位置関係を含む制御情報に基づいて、各画像Pa1,Pa2,Pa3を補正する。このカメラ11a,12a,13aの幾何学的な位置関係は、上述したカメラキャリブレーション部26から送信される制御情報においてパラメータ化されていてもよい。また、各カメラ11a,12a,13aの撮影方向及び/又は撮影画角を変更しつつ撮像を実行する場合には、カメラキャリブレーション部26においてこれらをパラメータ化し、画像を補正する際にこれらのパラメータを制御情報に含めるようにしてもよい。これにより、幾何学的画像補正部21,22,23は、各カメラ11a,12a,13aの撮影方向及び/又は撮影画角に応じてリアルタイムに画像補正することができる。
なお、このカメラキャリブレーション部26は、同様にカメラ11a,12a,13aの各レンズにおける色収差や歪み、光軸のずれをパラメータ化し、これらを各補正部20へ送信するようにしてもよい。
正規化処理部24は、各幾何学的画像補正部21,22,23において補正された画像がそれぞれ供給され、これらにつき幾何学的正規化処理を施す。この正規化処理部24は、各カメラにより撮像された各画像Pa1,Pa2,Pa3の法線方向を合わせる。即ち、この正規化処理部24は、各画像Pa1,Pa2,Pa3の法線方向を仮想的に設定された仮想平面πの法線方向に合わせることによりこれを正規化し、それぞれ正規化画像Pm1,Pm2,Pm3を生成する。かかる場合において、正規化処理部24は、各カメラ11a,12a,13aにより撮像された各画像Pa1,Pa2,Pa3を上記仮想平面πへ射影するための射影変換行列を求め、求めた射影変換行列に基づいて上記各画像の法線方向を上記仮想平面πの法線方向に合わせる。
ちなみに、カメラキャリブレーション部26は、カメラ11a,12a,13aとしていわゆる固定視点カメラを適用する場合には、予めカメラキャリブレーション部26により画像Pa1,Pa2,Pa3の法線方向を取得するようにしてもよい。また、各カメラ11a,12a,13aの撮影方向及び/又は撮影画角を変更しつつ撮像を実行する場合には、カメラキャリブレーション部26においてこれらをパラメータ化し、画像を正規化する際にこれらのパラメータを制御情報に含めるようにしてもよい。これにより、ユーザa,bの位置に応じて撮影方向等を順次変更しつつ撮像を行う場合においても柔軟に対応することができる。
また、このカメラキャリブレーション部26において、これらのパラメータを図示しないROMやRAMへ格納しておくことにより、補正部20は、状況に応じて随時これらを参照することができ、高速な補正処理を実現することができる。またカメラキャリブレーション部26は、上記カメラ11a,12a,13aから画像Pa1,Pa2,Pa3が供給される度にこれらのパラメータを求めることにより、幾何学的画像補正部21,22,23において精度の高い補正処理を実現することができる。
マッチング部29は、正規化処理部24において生成された正規化画像Pm1,Pm2,Pm3がそれぞれ供給される。このマッチング部29は、これら正規化画像Pm1,Pm2,Pm3につき、互いに対応付けを行う。
この対応付けは、ユーザaの顔を構成する同一の箇所にある画素位置と輝度成分を正規化画像Pm1,Pm2,Pm3間で抽出して対応をとるようにする。例えば図3に示すように、正規化画像Pm1上にある画素位置P11に対して、正規化画像Pm2上において同一の箇所に存在する画素位置P11’をその対応点として特定し、更に正規化画像Pm3上において同一の箇所に存在する画素位置P11’’をその対応点として特定する。かかる場合において、正規化画像Pm1上にある画素位置P11と、正規化画像Pm2上にある画素位置P11’とを対応付けする際に、正規化画像Pm3上の画素情報を参照する形で実行するようにしてもよい。同様の方法に基づき、正規化画像Pm1上にある画素位置P12に対して、正規化画像Pm2上において同一の箇所に存在する画素位置P12’をその対応点として特定し、更に正規化画像Pm3上において同一の箇所に存在する画素位置P12’’をその対応点として特定する。
即ち、このマッチング部29では、正規化処理部24において正規化された正規化画像Pm1,Pm2,Pm3において、撮影対象と関連させつつ、画素位置毎に対応付けを行う。ちなみにマッチング部29は、この対応付けにつき特徴抽出した箇所のみについて実行してもよいし、正規化画像Pm1,Pm2,Pm3を構成する全ての画素に対して実行してもよい。
情報生成部33は、生成すべき相対位置情報をユーザaのディスプレイ5aに対する視線方向に基づいて生成してもよい。かかる場合において情報生成部30は、カメラ11a,12a,13aから供給される画像Pa1,Pa2,Pa3からユーザaの視線方向を取得し、これに基づいて相対位置情報を生成する。これにより、いわば仮想カメラの撮影方向をユーザaの視線方向に合わせ込むことと同様の処理を実現することができる。また、情報生成部33は、各カメラ11a,12a,13aにより生成された画像情報からDepth情報を取得し、当該取得したDepth情報に基づいて相対位置情報を生成するようにしてもよい。また情報生成部33は、図示しないキーボードやマウス等の操作部を介して入力された情報に基づき、相対位置情報を生成するようにしてもよい。
仮想視点画像生成部30は、マッチング部29により互いに対応付けされた画素位置並びにその輝度成分がそれぞれ入力される。また、仮想視点画像生成部30は、互いに対応付けされた画素位置並びにその輝度成分から、情報生成部33より生成された相対位置情報に応じて、新たに生成すべき仮想視点画像Imaを構成する画素位置並びにその輝度成分を求める。仮想視点画像生成部30は、求めた画素位置並びにその輝度成分により構成される仮想視点画像Imaを出力制御部31へ供給する。
出力制御部31は、仮想視点画像生成部30において生成された仮想視点画像Imaを、ネットワーク7を介して端末装置2bへ送信するように制御する。かかる場合において、この出力制御部31は、カメラ11a,12a,13aにより生成された画像Pa1,Pa2,Pa3を単独で端末装置2bへ送信するように制御してもよい。
次に、この端末装置2における具体的な動作につき説明をする。
撮影対象としてのユーザaは、カメラ11a,12a,13aにより互いに異なる角度から撮影される。その結果、カメラ11a,12a,13aにより生成される画像Pa1,Pa2,Pa3上のユーザaの視線方向、顔の向き等は、互いに異なる状態となる。このような画像Pa1,Pa2,Pa3がそれぞれ補正部20における正規化処理部24へ供給されると、これらは、以下に示される方法に基づいて正規化されることになる。
例えば図4に示すように、各カメラ11a,12a,13aの光学中心C1,C2,C3により互いに異なる角度から撮影対象のM点へ光軸を合わせて撮像を行うと、これにより生成される画像Pa1,Pa2,Pa3は、各カメラ11a,12a,13aの撮像面に対して平行となる。ここで各カメラ11a,12a,13aと、M点を結ぶ直線の方向は、各カメラにより撮像された各画像Pa1,Pa2,Pa3の法線方向に一致するが、これらは互いに異なる方向を指している。これら各画像Pa1,Pa2,Pa3の法線方向が同一方向となるように正規化を行うことにより、画像面が互いに平行な正規化画像Pm1,Pm2,Pm3を作り出す。
具体的には、図4に示すように光学中心C1,C2,C3により囲まれる仮想平面πを設定しておき、この仮想平面πの法線方向に対してこれら各画像Pa1,Pa2,Pa3の法線方向が同一方向となるように、射影変換行列Pを用いて正規化する。このため、仮想平面πの設定は、各画像Pa1,Pa2,Pa3の画像面を如何なる方向において平行化させるかを決定付けることとなる。
ちなみに、この射影変換行列と画像面との関係を説明する前提として、以下では、画像上の点をm=[m0,m1]Tとし、また空間中の点をw=[w0,w1,w1]Tとする。ここで、図5に示すように、M点を世界座標系で表したものを上記wで表示し、また各カメラ11a,12a,13aの光学中心C(C1,C2,C3)とM点とを結ぶ直線と各画像Pa1,Pa2,Pa3との交点の座標を上記mにより表示する。即ち、各画像Pa1,Pa2,Pa3における像平面内の位置をm=[m0,m1]Tにより定義する。かかる場合において、各点における斎次座標系での記述をそれぞれ以下のようにおく。
また、空間中の点wiと画像上の点miの関係は以下に示す式で与えられる。
ここで、sは任意の変数であり、Pは上述した射影変換行列である。この射影変換行列は、P=A[R|t]で表される。Rは、画像の回転行列を表し、以下に示す式で与えられる。
またtは、画像の並進行列を表し、以下の式で与えられる。
また、行列Aは、カメラの内部パラメータと呼ばれるものであり、以下の示す式で与えられる。
ここで(u0,v0)は、それぞれ画像中心を表し、α(=−f・ku)、β(=−f・kv/sinθ)は、それぞれm0軸、m1軸のスケール因子を表し、γ(=f・ku・cotθ)は、2つの軸のねじれを表す。
即ち、上記各式に基づいて、画像Pa1,Pa2,Pa3毎に射影変換行列Po1,Po2,Po3を求めることにより、図6(a)に示すように、各画像Pa1,Pa2,Pa3につき、3次元空間から2次元画像平面へ射影変換することができる。換言すれば世界座標系で定義されるmからカメラ座標系で定義されるwへ射影変換することができる。
図6(b)は、この求めた射影変換行列Pox(Po1,Po2,Po3)と像平面との関係を示している。これらカメラ座標系に射影変換された各画像Pa(Pa1,Pa2,Pa3)につき正規化を施すことにより、上記正規化画像Pm(Pm1,Pm2,Pm3)を作り出すことができる。
本発明を適用した通信システム1では、更にこの世界座標系として表される3次元空間から正規化画像Pm1,Pm2,Pm3へ射影変換するための射影変換行列Pnx(Pn1,Pn2,Pn3)を求める。この射影変換行列Pnx(Pn1,Pn2,Pn3)は、上述した画像の回転行列Rを再定義することで実現する。
図7は、この回転行列Rを再定義する手順を示している。ステップS11において、回転行列R=[r0t,r1t,r2t]につき、光学中心C(C1,C2,C3)を通る平面に対して垂直となるようにr2tを調整する。次にステップS12へ移行し、r0tにつき任意の値となるように調整する。更に、ステップS13へ移行し、r0tとr2tの外積からr1tを求める。最後にステップS14へ移行し、上記ステップS11〜S13において各パラメータを調整したR=[r0t,r1t,r2t]に基づき、射影変換行列Pn1,Pn2,Pn3を求める。
ちなみに、この正規化処理部24において射影変換された正規化画像Pm1,Pm2,Pm3は、マッチング部29において上述の如く撮影対象と関連させつつ、画素位置毎に対応付けされる。本発明においては、マッチング部29の前段にある正規化処理部24において予め正規化され、エピポーラ線が平行化されている。これと相俟って、本発明では、正規化画像Pm1〜Pm3のうち任意の2枚の正規化画像の対応付けを実行する。マッチング方法は、例えば下記文献「"A Maximum Likelihood Stereo Algorithm",Ingemar J. Cox, Sunita L. Hingorani, Satish B. Rao, and Bruce M. Maggs, CVIM vol.63, (1996).」に示される方法を用いるようにしてもよい。
上述の如く対応付けされた画素位置は、その輝度成分と共に、仮想視点画像生成部30へ出力される。この仮想視点画像生成部30には、情報生成部33により生成された相対位置情報も送信される。
仮想視点画像生成部30は、上述したマッチング部29における対応付けの結果に基づき仮想視点画像Imaを生成する。ここで、この仮想視点画像生成部30において、光学中心Cqを有する仮想カメラにより撮像される仮想視点画像Imaを生成する場合を考える。かかる場合において光学中心Cqの位置を、図8に示すように光学中心C1,C2,C3との関係で定義するとき、かかる光学中心Cqと、各カメラ11a,12a,13aの光学中心C1,C2,C3の関係は、以下の式(1)により表すことができる。
Cq=(1−α)(1−β)・C1+α(1−β)・C2+β・C3・・・・・(1)
この式(1)においてα、βは、情報生成部33において生成される相対位置情報である。この相対位置情報α、βは、各カメラ11a,12a,13aの光学中心C1,C2,C3に対する仮想カメラの光学中心Cqの位置との関係において決定される。ここでαは、仮想カメラにおける仮想視点がカメラ11aの光学中心C1に近くなるにつれて小さくなり、また仮想視点がカメラ12aの光学中心C2に近くなるにつれて大きくなる。また、βは、仮想カメラにおける仮想視点がカメラ13aの光学中心C3に近くなるにつれて大きくなる。即ち、上述した情報生成部33において、ユーザaのディスプレイ5aに対する視線方向に基づいて相対位置情報α、βを生成することにより、ユーザaの視線に合わせた仮想カメラの光学中心Cqを設定することも可能となる。
Cq=(1−α)(1−β)・C1+α(1−β)・C2+β・C3・・・・・(1)
この式(1)においてα、βは、情報生成部33において生成される相対位置情報である。この相対位置情報α、βは、各カメラ11a,12a,13aの光学中心C1,C2,C3に対する仮想カメラの光学中心Cqの位置との関係において決定される。ここでαは、仮想カメラにおける仮想視点がカメラ11aの光学中心C1に近くなるにつれて小さくなり、また仮想視点がカメラ12aの光学中心C2に近くなるにつれて大きくなる。また、βは、仮想カメラにおける仮想視点がカメラ13aの光学中心C3に近くなるにつれて大きくなる。即ち、上述した情報生成部33において、ユーザaのディスプレイ5aに対する視線方向に基づいて相対位置情報α、βを生成することにより、ユーザaの視線に合わせた仮想カメラの光学中心Cqを設定することも可能となる。
また、仮想カメラにより撮像される仮想視点画像Imaを構成する各画素位置は、以下の式(2)に基づいて決定することができる。なお、この(2)式において、仮想視点画像Imaにおける画素位置をwqとし、仮想視点画像Imaの射影変換行列をPnqとする。また、かかる画素位置wqに対応する各正規化画像Pm1,Pm2,Pm3の画像位置をそれぞれw1,w2,w3とする。なお、これらの画素位置は、全て世界座標で表されているものとし、それぞれ射影変換行列を乗算することにより、像平面内の位置として表されるものとする。
Pnq・wq=(1−α)(1−β)・Pn1・w1+α(1−β)・Pn2・w2+β・Pn3・w3・・・・・(2)
この式(2)に基づいて決定される画素位置wqは、仮想カメラの光学中心Cqがカメラ11aの光学中心C1に近づくにつれてw1へ近づき、カメラ12aの光学中心C2に近づくにつれてw2へ近づき、更にカメラ13aの光学中心C3に近づくにつれてw3へ近づくことになる。即ち、画素位置wqを、仮想カメラの位置に応じて自在に決定することができるため、仮想視点画像Ima上に表示させるユーザaの位置を自在に変化させることができる。
Pnq・wq=(1−α)(1−β)・Pn1・w1+α(1−β)・Pn2・w2+β・Pn3・w3・・・・・(2)
この式(2)に基づいて決定される画素位置wqは、仮想カメラの光学中心Cqがカメラ11aの光学中心C1に近づくにつれてw1へ近づき、カメラ12aの光学中心C2に近づくにつれてw2へ近づき、更にカメラ13aの光学中心C3に近づくにつれてw3へ近づくことになる。即ち、画素位置wqを、仮想カメラの位置に応じて自在に決定することができるため、仮想視点画像Ima上に表示させるユーザaの位置を自在に変化させることができる。
また、画像位置をそれぞれw1,w2,w3における輝度成分をそれぞれJ11, J11',J11''としたとき、仮想視点画像Ima上の画素位置wqにおける輝度成分Ptを以下の式(3)に基づき決定することができる。
Pt=(1−α)(1−β)・J11+α(1−β)・J11'+β・J11''・・・(3)
この式(3)に基づいて決定される輝度成分Ptは、仮想カメラの光学中心Cqがカメラ11aの光学中心C1に近づくにつれてJ11へ近づき、カメラ12aの光学中心C2に近づくにつれてJ11'へ近づき、更にカメラ13aの光学中心C3に近づくにつれてJ11''へ近づくことになる。即ち、輝度成分Ptを、仮想カメラの位置に応じて自在に決定することができるため、仮想視点画像Ima上に表示させるユーザaを構成する画素の輝度を自在に変化させることができる。
Pt=(1−α)(1−β)・J11+α(1−β)・J11'+β・J11''・・・(3)
この式(3)に基づいて決定される輝度成分Ptは、仮想カメラの光学中心Cqがカメラ11aの光学中心C1に近づくにつれてJ11へ近づき、カメラ12aの光学中心C2に近づくにつれてJ11'へ近づき、更にカメラ13aの光学中心C3に近づくにつれてJ11''へ近づくことになる。即ち、輝度成分Ptを、仮想カメラの位置に応じて自在に決定することができるため、仮想視点画像Ima上に表示させるユーザaを構成する画素の輝度を自在に変化させることができる。
このように仮想視点画像生成部30は、仮想視点画像Imaを構成する各画素の座標並びにその輝度成分につき、相対位置情報としてのα、βに基づいて決定することができる。
また、本発明では、上述の如き幾何学的正規化を施しエピポーラ線を平行化させてあるため、このような画像内挿をより効果的に実行することが可能となる。
特に、各カメラ11a,12a,13aは互いに撮影方向が異なるため、同一の画像を示す画像位置w1,w2,w3の輝度成分が互いに異なる。この互いに異なる輝度成分の何れか一方を最小値とし、他方が最大値となるようにして、相対位置情報としてのα、βに応じて輝度成分Ptを線形に増減させることにより、仮想カメラの位置に応じて仮想視点画像Ima上に表示させるユーザaを構成する画素の輝度成分を決定することが可能となる。
例えば、画像位置w1,w2,w3とが、互いにユーザaが着用している眼鏡の縁の部分を捉えている場合に、これらは互いに異なる撮影方向で撮像されているため、その輝度成分は異なる。これらの輝度成分をそれぞれ最小値又は最大値として割り当て、相対位置情報としてのα、βに応じて輝度成分を線形に増減させることにより、輝度成分Ptを決定する。この決定した輝度成分Ptが、新たに生成すべき仮想視点画像Imaにおける眼鏡の縁を示す輝度成分に相当することになる。
また図9は、仮想視点画像Ima並びに各カメラ11a,12a,13aにより生成される画像Pa1,Pa2,Pa3の法線ベクトルを示している。この仮想視点画像生成部33において得られる仮想視点画像Imaの法線ベクトルnxは、画像Pa1,Pa2,Pa3の法線ベクトルn1,n2,n3を用いて以下の式(4)に基づき表すこともできる。
nx=(1−α)(1−β)・n1+α(1−β)・n2+β・n3・・・・・(4)
上述のようにして画素位置wqにおける座標並びにその輝度成分Ptを順次決定することにより、表示されるユーザaの視線方向、顔の向き等は互いに異なっていた画像Pa1,Pa2,Pa3に対して、ユーザaの顔、視線方向が常時正面を向いている状態にある仮想視点画像Imaを作り出すことが可能となる。
nx=(1−α)(1−β)・n1+α(1−β)・n2+β・n3・・・・・(4)
上述のようにして画素位置wqにおける座標並びにその輝度成分Ptを順次決定することにより、表示されるユーザaの視線方向、顔の向き等は互いに異なっていた画像Pa1,Pa2,Pa3に対して、ユーザaの顔、視線方向が常時正面を向いている状態にある仮想視点画像Imaを作り出すことが可能となる。
生成された仮想視点画像Imaは、出力制御部31を介して、ネットワーク7へ送出される。そして相手側の端末装置2bへ送信された仮想視点画像Imaは、端末装置2bにおける制御の下、ディスプレイ5b上へ表示されることになる。ユーザbは、ディスプレイ5bに表示される仮想視点画像Ima上のユーザaを視認しつつ対話をすることになるが、ユーザaの顔、視線方向は常時正面を向いている状態にあるため、あたかも画面中央付近に設置された仮想カメラで撮像されたような画像を視認しているような感覚を味わうことができる。ユーザaについても同様にディスプレイ5aに表示される仮想視点画像Ima上のユーザbを視認しつつ対話をすることになるが、常時正面を向いているユーザbを視認することができる。即ち、この通信システム1では、いわば対話するユーザ間において常時視線を一致させたビジュアルコミュニケーションを実現することができ、よりリアルで臨場感のある遠隔対話を実現することができる。
特にこの通信システム1では、少なくとも3台のカメラ11,12,13をディスプレイ5の両側に配設すれば足り、また被写体の3次元情報をその都度抽出する必要もなくなるため、システム全体が複雑化することがなくなるという利点もある。
また、この通信システム1では、ハーフミラーやホログラムスクリーン、更にはプロジェクタ等のような特殊装置を用いる必要もなく、簡易で安価なシステムを構成することができる。
なお、上述した実施の形態では、3台のカメラにより撮影対象を撮像する場合を例に挙げて説明をしたが、かかる場合に限定されるものではなく、4台以上のカメラをディスプレイの側面に設置して撮像を行うようにしてもよい。図10は、n台(nは4以上)のカメラ11a〜カメラ100が配設される端末装置2aの構成図である。カメラ11a〜カメラ100により撮像された画像は、カメラ選択部101へ送信される。カメラ選択部101は、情報生成部33から送信される相対位置情報に基づき、仮想カメラの光学中心Cqに最も近い光学中心を持つカメラを3台選択し、上述の如く仮想視点画像Imaを生成する。互いに異なる4方向以上からユーザaを撮像することにより、仮にユーザの視線の高さが微妙に変化する場合であっても、細かい視線の動きを捉えた上位3方向から撮像した画像を取得することにより、常時視線を一致させた状態で対話を実現することが可能となる。
なお、本発明を適用した端末装置2とカメラ11,12とを一体化させた撮像装置として適用してもよいことは勿論である。また、これら端末装置2や通信システム1をテレビ会議システム以外の仮想視点画像を生成を必要とする各種映像コンテンツ制作に適用してもよいことは勿論である。
1 通信システム、2 端末装置、5 ディスプレイ、7 ネットワーク、11,12,13 カメラ、21〜24 幾何学的画像補正部、24 正規化処理部、26 カメラキャリブレーション部、29 マッチング部、30 仮想視点画像生成部、31 出力生成部、33 情報生成部
Claims (7)
- 撮影対象を互いに異なる角度から撮像する少なくとも3台のカメラを含む撮像手段と、
少なくとも上記各カメラにより撮像された各画像の法線方向を一方向に合わせる画像補正手段と、
上記画像補正手段により補正された各画像間において、上記撮影対象と関連させつつ画素位置毎に対応付けを行うマッチング手段と、
上記各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成する情報生成手段と、
上記マッチング手段により互いに対応付けされた画素位置並びにその輝度成分から、上記生成された相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求める画像生成手段とを備えること
を特徴とする撮像装置。 - 上記画像補正手段は、上記各カメラにより撮像された各画像の法線方向を仮想的に設定された仮想平面の法線方向に合わせること
を特徴とする請求項1記載の撮像装置。 - 上記情報生成手段により生成された相対位置情報に応じて上記仮想平面を設定する仮想平面設定手段をさらに備えること
を特徴とする請求項2記載の撮像装置。 - 上記画像補正手段は、上記各カメラにより撮像された各画像を上記仮想平面へ射影するための射影変換行列を求め、求めた射影変換行列に基づいて上記各画像の法線方向を上記仮想平面の法線方向に合わせること
を特徴とする請求項2記載の撮像装置。 - 上記画像補正手段は、上記撮像手段におけるカメラが4台以上含まれている場合には、上記情報生成手段により生成された相対位置情報に基づいて3台のカメラを選択し、選択した3台のカメラにより撮像された各画像の法線方向を上記仮想平面の法線方向に合わせること
を特徴とする請求項1記載の撮像装置。 - 上記撮像手段は、上記各カメラの撮影方向及び/又は撮影画角を制御し、
上記画像補正手段は、上記撮影手段により制御された各カメラの撮影方向及び/又は撮影画角に基づいて、上記各カメラにより撮像された各画像の法線方向を上記仮想平面の法線方向に合わせること
を特徴とする請求項1記載の撮像装置。 - 撮影対象を少なくとも3台のカメラにより互いに異なる角度から撮像し、
上記各カメラにより撮像された各画像の法線方向を一方向に合わせる補正処理を施し、
上記補正処理を施した各画像間において、上記撮影対象と関連させつつ画素位置毎に対応付けを行い、
上記各カメラに対する上記撮影対象の相対的な位置関係を示す相対位置情報を生成し、
上記互いに対応付けた画素位置並びにその輝度成分から、上記生成した相対位置情報に応じて、新たに生成すべき仮想視点画像を構成する画素位置並びにその輝度成分を求めること
を特徴とする撮像方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003376115A JP2005142765A (ja) | 2003-11-05 | 2003-11-05 | 撮像装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003376115A JP2005142765A (ja) | 2003-11-05 | 2003-11-05 | 撮像装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005142765A true JP2005142765A (ja) | 2005-06-02 |
Family
ID=34687286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003376115A Withdrawn JP2005142765A (ja) | 2003-11-05 | 2003-11-05 | 撮像装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005142765A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113206A (ja) * | 2009-11-25 | 2011-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 映像コミュニケーションシステム、及び映像コミュニケーション方法 |
JP2011165081A (ja) * | 2010-02-12 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 画像生成方法、画像生成装置、及びプログラム |
JP2013531309A (ja) * | 2010-06-29 | 2013-08-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像捕捉装置のアレイにより得られたデータから仮想出力画像を作るための方法及びシステム |
JP2014138306A (ja) * | 2013-01-17 | 2014-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 画像生成方法、画像生成装置及び画像生成プログラム |
JP2015125493A (ja) * | 2013-12-25 | 2015-07-06 | 日本電信電話株式会社 | 画像生成方法、画像生成装置及び画像生成プログラム |
CN106813595A (zh) * | 2017-03-20 | 2017-06-09 | 北京清影机器视觉技术有限公司 | 三相机组特征点匹配方法、测量方法及三维检测装置 |
JP2019071650A (ja) * | 2018-12-27 | 2019-05-09 | キヤノン株式会社 | 制御装置、制御方法、及び、プログラム |
KR20200060451A (ko) * | 2017-09-26 | 2020-05-29 | 아우디 아게 | 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템 |
JPWO2019050038A1 (ja) * | 2017-09-11 | 2020-10-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像生成方法および画像生成装置 |
-
2003
- 2003-11-05 JP JP2003376115A patent/JP2005142765A/ja not_active Withdrawn
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011113206A (ja) * | 2009-11-25 | 2011-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 映像コミュニケーションシステム、及び映像コミュニケーション方法 |
JP2011165081A (ja) * | 2010-02-12 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 画像生成方法、画像生成装置、及びプログラム |
JP2013531309A (ja) * | 2010-06-29 | 2013-08-01 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像捕捉装置のアレイにより得られたデータから仮想出力画像を作るための方法及びシステム |
JP2014138306A (ja) * | 2013-01-17 | 2014-07-28 | Nippon Telegr & Teleph Corp <Ntt> | 画像生成方法、画像生成装置及び画像生成プログラム |
JP2015125493A (ja) * | 2013-12-25 | 2015-07-06 | 日本電信電話株式会社 | 画像生成方法、画像生成装置及び画像生成プログラム |
WO2018171031A1 (zh) * | 2017-03-20 | 2018-09-27 | 北京清影机器视觉技术有限公司 | 三相机组特征点匹配方法、测量方法及三维检测装置 |
CN106813595A (zh) * | 2017-03-20 | 2017-06-09 | 北京清影机器视觉技术有限公司 | 三相机组特征点匹配方法、测量方法及三维检测装置 |
JPWO2019050038A1 (ja) * | 2017-09-11 | 2020-10-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像生成方法および画像生成装置 |
JP7387434B2 (ja) | 2017-09-11 | 2023-11-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 画像生成方法および画像生成装置 |
KR20200060451A (ko) * | 2017-09-26 | 2020-05-29 | 아우디 아게 | 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템 |
JP2020535489A (ja) * | 2017-09-26 | 2020-12-03 | アウディ アクチェンゲゼルシャフトAudi Ag | 少なくとも第1の人物と第2の人物との間でバーチャル会議を行う方法およびシステム |
US11277584B2 (en) | 2017-09-26 | 2022-03-15 | Audi Ag | Method and system for carrying out a virtual meeting between at least a first person and a second person |
JP7038217B2 (ja) | 2017-09-26 | 2022-03-17 | アウディ アクチェンゲゼルシャフト | 少なくとも第1の人物と第2の人物との間でバーチャル会議を行う方法およびシステム |
KR102445595B1 (ko) * | 2017-09-26 | 2022-09-20 | 아우디 아게 | 적어도 제1 사람과 제2 사람 사이의 가상 미팅을 수행하기 위한 방법 및 시스템 |
JP2019071650A (ja) * | 2018-12-27 | 2019-05-09 | キヤノン株式会社 | 制御装置、制御方法、及び、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7330584B2 (en) | Image processing apparatus and method | |
US7957581B2 (en) | Image processing apparatus and method | |
CN109952759B (zh) | 用于具有hmd的视频会议的改进的方法和系统 | |
JP5843751B2 (ja) | 情報処理装置、情報処理システム、および情報処理方法 | |
JP4057241B2 (ja) | 仮想カメラを有する改善された画像撮影システム | |
US6724417B1 (en) | Method and apparatus maintaining eye contact in video delivery systems using view morphing | |
JP4461739B2 (ja) | 撮像装置 | |
JP2010250452A (ja) | 任意視点画像合成装置 | |
JP5963006B2 (ja) | 画像変換装置、カメラ、映像システム、画像変換方法およびプログラムを記録した記録媒体 | |
JP2004193962A (ja) | 画像通信装置、および画像通信方法、並びにコンピュータ・プログラム | |
WO2017141584A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP2005142765A (ja) | 撮像装置及び方法 | |
JP2010171690A (ja) | テレビ会議システムおよび映像通信方法 | |
JP4595313B2 (ja) | 撮像表示装置及び方法、画像送受信システム | |
CN111246224A (zh) | 一种视频直播方法及视频直播系统 | |
US20240015264A1 (en) | System for broadcasting volumetric videoconferences in 3d animated virtual environment with audio information, and procedure for operating said device | |
KR101158678B1 (ko) | 입체 영상 시스템 및 입체 영상 처리 방법 | |
JP2005117285A (ja) | 情報入力装置、通信端末及び通信方法 | |
JP6004978B2 (ja) | 被写体画像抽出装置および被写体画像抽出・合成装置 | |
JP2014135714A (ja) | 立体映像信号処理装置及び立体映像撮像装置 | |
JPH11298872A (ja) | 映像通信システム | |
JP4586447B2 (ja) | 画像処理装置及び方法、プログラム | |
WO2017092369A1 (zh) | 一种头戴设备、三维视频通话系统和三维视频通话实现方法 | |
CN113301321A (zh) | 成像方法、系统、装置、电子设备及可读存储介质 | |
JP2006024141A (ja) | 画像処理装置及び方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |