JP6891873B2 - 画像処理装置および方法 - Google Patents
画像処理装置および方法 Download PDFInfo
- Publication number
- JP6891873B2 JP6891873B2 JP2018507216A JP2018507216A JP6891873B2 JP 6891873 B2 JP6891873 B2 JP 6891873B2 JP 2018507216 A JP2018507216 A JP 2018507216A JP 2018507216 A JP2018507216 A JP 2018507216A JP 6891873 B2 JP6891873 B2 JP 6891873B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- image
- similarity
- projection
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 108
- 238000000034 method Methods 0.000 title description 110
- 230000036544 posture Effects 0.000 claims description 305
- 238000003384 imaging method Methods 0.000 claims description 229
- 238000011156 evaluation Methods 0.000 claims description 205
- 238000004088 simulation Methods 0.000 claims description 77
- 238000012937 correction Methods 0.000 claims description 29
- 238000003672 processing method Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 58
- 230000008569 process Effects 0.000 description 56
- 230000006870 function Effects 0.000 description 52
- 238000005516 engineering process Methods 0.000 description 30
- 230000008859 change Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000012854 evaluation process Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 8
- 239000003086 colorant Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 229910052724 xenon Inorganic materials 0.000 description 1
- FHNFHKCVQCLJFQ-UHFFFAOYSA-N xenon atom Chemical compound [Xe] FHNFHKCVQCLJFQ-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/12—Picture reproducers
- H04N9/31—Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
- H04N9/3129—Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM] scanning a light beam on the display screen
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/90—Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/12—Picture reproducers
- H04N9/31—Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
- H04N9/3141—Constructional details thereof
- H04N9/3147—Multi-projection systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/12—Picture reproducers
- H04N9/31—Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
- H04N9/3179—Video signal processing therefor
- H04N9/3185—Geometric adjustment, e.g. keystone or convergence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/12—Picture reproducers
- H04N9/31—Projection devices for colour picture display, e.g. using electronic spatial light modulators [ESLM]
- H04N9/3191—Testing thereof
- H04N9/3194—Testing thereof including sensor feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20224—Image subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30244—Camera pose
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Optics & Photonics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Projection Apparatus (AREA)
- Transforming Electric Information Into Light Information (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Description
本開示は、画像処理装置および方法に関し、特に、コンテンツ視聴中の姿勢推定の投影画像に対するロバスト性を向上させることができるようにした画像処理装置および方法に関する。
従来、プロジェクタにより投影された投影画像の歪みの低減や、複数のプロジェクタによる各投影画像の位置合わせのために、カメラによって投影画像を撮像し、その撮像画像を用いて、プロジェクタの位置や姿勢、投影面形状等を推定し、それらに応じた投影画像の幾何補正を行う方法があった。
その際のプロジェクタの位置や姿勢等を推定する方法として、投影中のコンテンツ等の画像の特徴量を利用する方法が考えられた(例えば、非特許文献1参照)。
David G. Lowe, "What and Where: 3D Object Recognition with Accurate Pose",2006
しかしながら、この方法の場合、姿勢推定の性能の投影画像への依存度が高く、投影画像から特徴点を多く抽出できなかったり、抽出した特徴点の位置に偏りがあったりすると、姿勢推定が困難になるおそれがあった。
本開示は、このような状況に鑑みてなされたものであり、コンテンツ視聴中の姿勢推定の投影画像に対するロバスト性を向上させることができるようにするものである。
本技術の一側面の画像処理装置は、投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価する類似度評価部と、前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する姿勢設定部とを備える画像処理装置である。
前記姿勢設定部は、前記類似度評価部により前記類似度が最適となると評価された前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の絶対値の差の総和を、前記類似度を示す評価値として求め、前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の差の2乗の総和を、前記類似度を示す評価値として求め、前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、正規化相互相関を、前記類似度を示す評価値として求め、前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、ゼロ平均正規化相互相関を、前記類似度を示す評価値として求め、前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、前記投影部若しくは前記撮像部、またはその両方の仮想の姿勢を設定し、前記仮想の姿勢において得られる前記シミュレーション画像を生成し、前記撮像画像と前記シミュレーション画像との類似度を評価することができる。
前記類似度評価部は、前記シミュレーション画像を、輝度値または所定の色成分で生成することができる。
前記類似度評価部は、前記撮像画像の縮小画像と前記シミュレーション画像との類似度を評価することができる。
前記類似度評価部は、前記撮像画像の、処理対象とする所定の範囲の部分画像について、前記シミュレーション画像との類似度を評価することができる。
前記類似度評価部は、前記類似度の評価を複数回繰り返すことができる。
前記類似度評価部は、前記撮像画像の解像度、または、前記撮像画像内の処理対象とする部分画像の範囲を可変として各回の前記類似度の評価を行うことができる。
前記撮像画像と前記シミュレーション画像との間で対応点を求め、前記撮像画像と前記シミュレーション画像との間の前記対応点の距離を評価する対応点距離評価部をさらに備えることができる。
前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との両方を行い、前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果と、前記類似度評価部による前記類似度の評価結果との両方に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との内のいずれか一方を行い、前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果、または、前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記類似度評価部は、複数の投影部と複数の撮像部とのそれぞれの間で、前記撮像画像と前記シミュレーション画像との類似度を評価し、前記姿勢設定部は、前記類似度評価部による各投影部と各撮像部との間の前記類似度の評価結果に基づいて、前記複数の投影部若しくは前記複数の撮像部、またはその両方の姿勢を推定結果として設定することができる。
前記姿勢設定部により設定された姿勢に基づいて、投影画像の幾何補正に関する設定を行う設定部をさらに備えることができる。
投影画像を投影する投影部をさらに備えることができる。
投影画像を撮像して撮像画像を得る撮像部をさらに備えることができる。
本技術の一側面の画像処理方法は、投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を設定する画像処理方法である。
本技術の一側面の画像処理装置および方法においては、投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、その投影部により投影された投影画像を撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度が評価され、その類似度の評価結果に基づいて、投影部若しくは撮像部、またはその両方の姿勢が設定される。
本開示によれば、画像を処理することができる。特に、コンテンツ視聴中の姿勢推定の投影画像に対するロバスト性を向上させることができる。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.画像類似度を用いた姿勢推定
2.第1の実施の形態(投影撮像システム)
3.第2の実施の形態(姿勢推定部)
4.第3の実施の形態(投影撮像システム・投影撮像装置)
5.その他
1.画像類似度を用いた姿勢推定
2.第1の実施の形態(投影撮像システム)
3.第2の実施の形態(姿勢推定部)
4.第3の実施の形態(投影撮像システム・投影撮像装置)
5.その他
<1.画像類似度を用いた姿勢推定>
<幾何補正>
プロジェクタの投影面(スクリーンや壁等)に対する姿勢(位置や向き等)や投影面の形状等によって、投影された画像(投影画像とも称する)が歪み、見づらくなってしまう場合がある。このような場合、プロジェクタが投影する画像に対して歪みの補正等の幾何補正を施すことにより、投影画像の歪みを低減し、見やすくすることができる。
<幾何補正>
プロジェクタの投影面(スクリーンや壁等)に対する姿勢(位置や向き等)や投影面の形状等によって、投影された画像(投影画像とも称する)が歪み、見づらくなってしまう場合がある。このような場合、プロジェクタが投影する画像に対して歪みの補正等の幾何補正を施すことにより、投影画像の歪みを低減し、見やすくすることができる。
また、複数のプロジェクタにより画像を投影して、1つの投影画像を形成させるシステムがある。例えば、複数のプロジェクタから互いに同位置に画像を投影することにより、コントラスト比を大きくし、ハイダイナミックレンジを実現する方法がある。また、例えば、各プロジェクタから投影された投影画像を並べることにより、1台のプロジェクタが投影する投影画像よりも大きな投影画像(1台のプロジェクタが投影する投影画像よりも高解像度の投影画像)を実現する方法がある。これらの方法の場合、各投影画像に対する上述した歪み補正だけでなく、投影画像同士の位置合わせ(シフトやズーム等)の補正も必要になる場合がある。さらに、明るさや色等を投影画像間で揃える補正も必要になる場合もある。
本明細書においては、投影画像の変形、移動、拡大、縮小等、投影画像の各画素の投影面における位置が変化する補正を幾何補正と称する。つまり、「幾何補正」には、画像処理によるものだけでなく、シフトやズーム等の光学系の制御によるものや、投影部の姿勢等の制御によるもの等も含まれるものとする。また、本明細書において、投影部や撮像部等の「姿勢」には、それらの「向き」(投影や撮像の向き)だけでなく、それらの「位置」(投影や撮像を行う位置)も含まれるものとする。
このような幾何補正は、プロジェクタを操作する操作者等の手動によって行うこともできるが、煩雑な作業を必要とするおそれがある。そこで、カメラを用いてプロジェクタが投影した投影画像を撮像し、その撮像画像を用いて幾何補正の設定を行う方法が考えられた。この場合、撮像画像に含まれる投影画像から、カメラやプロジェクタの姿勢や、スクリーン形状等が推定され、それらに応じて適切な幾何補正が設定される。
<オンラインセンシング>
このような幾何補正の設定は、コンテンツ(動画像)の投影前だけでなく、コンテンツの投影中に必要になる場合もある。例えば、コンテンツ(動画像)の投影を開始した時点で、投影撮像装置10(投影部11)の姿勢が図1の左側のような状態であるとする。コンテンツ(動画像)の投影を開始する前に、投影撮像装置10は、投影部11からスクリーン21に向かった画像を投影し、その投影画像31を撮像部によって撮像し、得られた撮像画像を用いて、投影撮像装置10(投影部11や撮像部12)の姿勢推定やスクリーン21の再構成(形状の推定)を行い、それらに基づいて幾何補正の設定を行う。つまり、投影撮像装置10のコンテンツ(動画像)の投影を開始した時点の姿勢(RT_t1)は既知であり、投影画像31には、その姿勢に応じた幾何補正が施されている。
このような幾何補正の設定は、コンテンツ(動画像)の投影前だけでなく、コンテンツの投影中に必要になる場合もある。例えば、コンテンツ(動画像)の投影を開始した時点で、投影撮像装置10(投影部11)の姿勢が図1の左側のような状態であるとする。コンテンツ(動画像)の投影を開始する前に、投影撮像装置10は、投影部11からスクリーン21に向かった画像を投影し、その投影画像31を撮像部によって撮像し、得られた撮像画像を用いて、投影撮像装置10(投影部11や撮像部12)の姿勢推定やスクリーン21の再構成(形状の推定)を行い、それらに基づいて幾何補正の設定を行う。つまり、投影撮像装置10のコンテンツ(動画像)の投影を開始した時点の姿勢(RT_t1)は既知であり、投影画像31には、その姿勢に応じた幾何補正が施されている。
コンテンツ(動画像)の投影中に投影撮像装置10の姿勢が変化すると、幾何補正の設定が、投影撮像装置10の姿勢に対応しなくなり、図1の右側に示される投影画像32のように、投影画像に歪みが生じてしまう。この変化後の姿勢(RT_t2)は、未知であるので、幾何補正を適切な設定にするためには、この投影撮像装置10の姿勢を推定し直す必要がある。
しかしながら、そのためにコンテンツ(動画像)の投影を中断するのは、コンテンツを視聴しているユーザにとって、そのコンテンツの視聴を妨げることになり、好ましくない。そこで、コンテンツの投影を継続したまま対応点を検出する方法(オンラインセンシング)が考えられた。
オンラインセンシング技術として、例えば、投影中のコンテンツ(動画像)の画像特徴量を利用する方式が考えられた。例えば、複数の画像からそれぞれSIFT(非特許文献1)を利用して画像特徴量を求め、それらの対応点から姿勢推定を行う方法が考えられた。
<対応点間距離による姿勢推定>
例えば、図1の例のように投影撮像装置10の姿勢が変化すると、投影撮像装置10は、撮像部12により投影画像32を撮像し、図2の右に示されるような撮像画像42を得る。つまり、撮像画像42には、投影画像32が含まれる。そして、投影撮像装置10は、この撮像画像42に含まれる投影画像32の部分より、所定の特徴量を有する部分を特徴点(図中、×印)として検出する。また、投影撮像装置10は、図2の左に示されるような、既知の姿勢RT_t1において同じ画像を投影部11から投影し、撮像部12により撮像した場合に得られる撮像画像をシミュレートしたシミュレーション画像41を生成する。つまり、このシミュレーション画像41には投影画像31が含まれる。そして、投影撮像装置10は、このシミュレーション画像41に含まれる投影画像31の部分より、所定の特徴量を有する部分を特徴点(図中、×印)として検出する。
例えば、図1の例のように投影撮像装置10の姿勢が変化すると、投影撮像装置10は、撮像部12により投影画像32を撮像し、図2の右に示されるような撮像画像42を得る。つまり、撮像画像42には、投影画像32が含まれる。そして、投影撮像装置10は、この撮像画像42に含まれる投影画像32の部分より、所定の特徴量を有する部分を特徴点(図中、×印)として検出する。また、投影撮像装置10は、図2の左に示されるような、既知の姿勢RT_t1において同じ画像を投影部11から投影し、撮像部12により撮像した場合に得られる撮像画像をシミュレートしたシミュレーション画像41を生成する。つまり、このシミュレーション画像41には投影画像31が含まれる。そして、投影撮像装置10は、このシミュレーション画像41に含まれる投影画像31の部分より、所定の特徴量を有する部分を特徴点(図中、×印)として検出する。
投影撮像装置10は、外れ値除去(NNDR(Nearest Neighbor Distance Ratio))やホモグラフィ(Homography)行列推定(射影変換行列推定)等を行って、シミュレーション画像41に含まれる特徴点と撮像画像42に含まれる特徴点との対応関係を求め、互いに対応する特徴点(対応点とも称する)を検出する。
対応点を求めると、投影撮像装置10は、バンドルアジャストメント(Bundle Adjustment)により、対応点間の距離を用いた誤差関数Eの最適化を行う。バンドルアジャストメント(Bundle Adjustment)は、誤差関数Eを最小化する非線形最適化手法である。例えば、図3のように、投影撮像装置10の姿勢を仮想的に微小変化させ、仮想の姿勢RT_t1'についてシミュレーション画像を生成し、そのシミュレーション画像と撮像画像42との間で特徴点の対応点を求め、誤差関数Eを求める。このような処理を既知の姿勢RT_t1を初期値として繰り返し、図4のように、誤差関数Eが最小となる仮想の姿勢RT_t1'を求める。誤差関数Eが最小となる仮想の姿勢RT_t1'が、現在の姿勢RT_t2に最も近い姿勢であり、理想的には、仮想の姿勢RT_t1'が現在の姿勢RT_t2に一致する。そのため、その仮想の姿勢RT_t1'に応じた幾何補正の設定は、現在の姿勢RT_t2に対して最適な設定となり、投影画像32の歪みを最も低減させることができる。
<特徴点の少ない画像>
しかしながら、例えば被写界深度が浅い画像の場合、所謂ボケた領域が多い。このボケた領域のようにエッジが少ない場所では特徴点の検出が困難である。また、例えば図5に示される投影画像51は、背景が無地であるため、その背景の部分においては、ボケた領域と同様、特徴点を検出することは困難である。つまり、このような、被写界深度が浅い画像や、多くの部分を無地の背景が占める画像は、特徴点の数が少ない。このような特徴点の数が少ない画像の場合、対応点の数も低減する可能性がある。上述したように対応点間の距離を用いて誤差関数Eが算出されるので、その対応点の数が十分でないと、姿勢推定の精度が低減する可能性があった。
しかしながら、例えば被写界深度が浅い画像の場合、所謂ボケた領域が多い。このボケた領域のようにエッジが少ない場所では特徴点の検出が困難である。また、例えば図5に示される投影画像51は、背景が無地であるため、その背景の部分においては、ボケた領域と同様、特徴点を検出することは困難である。つまり、このような、被写界深度が浅い画像や、多くの部分を無地の背景が占める画像は、特徴点の数が少ない。このような特徴点の数が少ない画像の場合、対応点の数も低減する可能性がある。上述したように対応点間の距離を用いて誤差関数Eが算出されるので、その対応点の数が十分でないと、姿勢推定の精度が低減する可能性があった。
また、例えば、図5に示される投影画像51は、中央に人物が位置し、その他の部分が背景(無地)といった構図である。被写界深度が浅い画像の場合もよくある構図であるが、このような構図の場合、エッジが画像の一部に偏る。したがって、特徴点も画像の一部に偏る。図5に示される投影画像51の構図の場合、特徴点は画像中央付近(人物の部分)に偏る可能性が高い。特徴点が画像の一部(特に中央部)に偏ると、対応点もその一部に偏ることになり、それらの対応点から画像全体の歪みの傾向を把握することが困難になる可能性があった。つまり、より正確な姿勢推定を行うことが困難になる可能性があった。
例えば、図6のAに示されるように、投影撮像装置の姿勢変化によって、撮像画像53における投影画像52の位置が、中央付近(図6のAの左側の状態)から右側(図6のA右側の状態)にずれたとする。投影画像52の広域において十分な数の特徴点が得られると、点線で示されるように十分な数の対応点が得られ、それらの対応点から正確な姿勢推定を行うことができ、姿勢変化後のスクリーン21の姿勢(形状)も正確に推定することができる。
これに対して、図6のBの例のように、投影画像52において十分な数の特徴点が得られない場合、点線で示されるように、姿勢変化前後(図6のBの左側の状態と右側の状態)で対応関係を求めることが困難になる可能性があった。そのため、正確な姿勢推定を行うことが困難になり、姿勢変化後のスクリーン21の姿勢(形状)も、図6のBの右側の例のように潰れてしまう等、正確な推定が困難になる可能性があった。
このように、従来の対応点間の距離を用いた誤差関数Eによる姿勢推定は、その精度が画像の特徴に依存してしまい、画像によっては十分な精度を得ることが困難になるおそれがあった。
<画像類似度による姿勢推定>
そこで、投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、投影部により投影された投影画像を撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、その評価結果に基づいて投影部若しくは撮像部、またはその両方の姿勢を推定結果として設定するようにする。つまり、対応点を用いるのではなく、画像そのもののマッチング(類似度評価)を行うようにする。
そこで、投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、投影部により投影された投影画像を撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、その評価結果に基づいて投影部若しくは撮像部、またはその両方の姿勢を推定結果として設定するようにする。つまり、対応点を用いるのではなく、画像そのもののマッチング(類似度評価)を行うようにする。
このようにすることにより、姿勢推定精度の、投影画像の特徴に対する依存度を抑制することができる。つまり、コンテンツ視聴中の姿勢推定の投影画像に対するロバスト性を向上させることができる。
<仮想の姿勢>
その類似度の評価の際、投影部若しくは撮像部、またはその両方の仮想の姿勢を設定し、仮想の姿勢において得られるシミュレーション画像を生成し、実際の姿勢において得られる撮像画像とシミュレーション画像との類似度を評価するようにしてもよい。
その類似度の評価の際、投影部若しくは撮像部、またはその両方の仮想の姿勢を設定し、仮想の姿勢において得られるシミュレーション画像を生成し、実際の姿勢において得られる撮像画像とシミュレーション画像との類似度を評価するようにしてもよい。
例えば、図7に示されるように、投影部若しくは撮像部、またはその両方の姿勢が、センシング済みで既知の姿勢(RT_t1)から未知の姿勢(RT_t2)に変化したとする。この場合、仮想の姿勢(RT_t1')でのシミュレーション画像と、未知の姿勢(RT_t2)における撮像画像との類似度を評価するようにしてもよい。
このように仮想の姿勢のシミュレーション画像を用いることにより、実際に姿勢を変化させる必要が無く、容易に姿勢推定を行うことができる。
<シミュレーション画像>
なお、シミュレーション画像は、輝度値または所定の色成分で生成するようにしてもよい。シミュレーション画像には、姿勢推定に必要な情報が含まれていればよく、撮像画像に含まれる情報を全てシミュレートする必要はない。例えば、類似度の算出において、輝度値のみを比較するようにしてもよいし、所定の色成分のみを比較するようにしてもよい。つまり、シミュレーション画像を生成する際に、例えばグレースケール(grayscale)変換等の画像処理を行うようにしてもよい。適宜、情報量を制限することにより、シミュレーション画像の情報量の増大を抑制し、類似度の評価に関する処理の負荷の増大を抑制することができる。
なお、シミュレーション画像は、輝度値または所定の色成分で生成するようにしてもよい。シミュレーション画像には、姿勢推定に必要な情報が含まれていればよく、撮像画像に含まれる情報を全てシミュレートする必要はない。例えば、類似度の算出において、輝度値のみを比較するようにしてもよいし、所定の色成分のみを比較するようにしてもよい。つまり、シミュレーション画像を生成する際に、例えばグレースケール(grayscale)変換等の画像処理を行うようにしてもよい。適宜、情報量を制限することにより、シミュレーション画像の情報量の増大を抑制し、類似度の評価に関する処理の負荷の増大を抑制することができる。
<最適評価の検索手法>
また、姿勢推定において、投影部若しくは撮像部、またはその両方の(仮想の)姿勢を変化させながらシミュレーション画像を複数生成し、各シミュレーション画像と撮像画像とを比較してそれぞれの類似度を求め、類似度が最適となると評価された(仮想の)姿勢を推定結果として設定するようにしてもよい。例えば、図7の場合、仮想の姿勢(RT_t1')を、既知の姿勢(RT_t1)を初期値として、姿勢を微小変化させながら繰り返し設定する。そして、各姿勢でのシミュレーション画像と未知の姿勢(RT_t2)における撮像画像との類似度を評価し、その内の最適と評価した仮想の姿勢(RT_t1')を推定結果とするようにしてもよい。
また、姿勢推定において、投影部若しくは撮像部、またはその両方の(仮想の)姿勢を変化させながらシミュレーション画像を複数生成し、各シミュレーション画像と撮像画像とを比較してそれぞれの類似度を求め、類似度が最適となると評価された(仮想の)姿勢を推定結果として設定するようにしてもよい。例えば、図7の場合、仮想の姿勢(RT_t1')を、既知の姿勢(RT_t1)を初期値として、姿勢を微小変化させながら繰り返し設定する。そして、各姿勢でのシミュレーション画像と未知の姿勢(RT_t2)における撮像画像との類似度を評価し、その内の最適と評価した仮想の姿勢(RT_t1')を推定結果とするようにしてもよい。
このようにすることにより、より正確に姿勢推定を行うことができる。
<誤差関数を用いた類似度評価>
撮像画像とシミュレーション画像との類似度の評価方法は任意である。例えば、図7に示されるように、撮像画像とシミュレーション画像との類似度から誤差関数(評価関数)Eを算出し、その誤差関数Eの値によって類似度を評価するようにしてもよい。例えば、この誤差関数Eの値が最小となることを最適と評価し、その誤差関数Eの値が最小となる仮想の姿勢(RT_t1')を推定結果とするようにしてもよい。
撮像画像とシミュレーション画像との類似度の評価方法は任意である。例えば、図7に示されるように、撮像画像とシミュレーション画像との類似度から誤差関数(評価関数)Eを算出し、その誤差関数Eの値によって類似度を評価するようにしてもよい。例えば、この誤差関数Eの値が最小となることを最適と評価し、その誤差関数Eの値が最小となる仮想の姿勢(RT_t1')を推定結果とするようにしてもよい。
<画素毎のマッチング>
また、撮像画像とシミュレーション画像との類似度の算出方法も任意である。例えば、撮像画像とシミュレーション画像とを画素毎に比較し(画素毎にマッチングを行い)、各画素の類似度を算出し、その各画素の類似度を用いて両画像の類似度(画像としての類似度)を算出するようにしてもよい。例えば、両画像の各画素の画素値を用いて、各画素の類似度を求めるようにしてもよい。
また、撮像画像とシミュレーション画像との類似度の算出方法も任意である。例えば、撮像画像とシミュレーション画像とを画素毎に比較し(画素毎にマッチングを行い)、各画素の類似度を算出し、その各画素の類似度を用いて両画像の類似度(画像としての類似度)を算出するようにしてもよい。例えば、両画像の各画素の画素値を用いて、各画素の類似度を求めるようにしてもよい。
<関数を用いた類似度算出>
例えば、所定の関数を用いて、撮像画像とシミュレーション画像の各画素の画素値から、両画像の類似度を算出するようにしてもよい。この関数は任意である。例えば、SAD(Sum of Absolute Difference)、SSD(Sum of Square Difference)、NCC(Normalized Cross-Correlation)、または、ZNCC(Zero-means Normalized Cross-Correlation)等の関数を用いるようにしてもよい。以下において、これらの関数について説明する。
例えば、所定の関数を用いて、撮像画像とシミュレーション画像の各画素の画素値から、両画像の類似度を算出するようにしてもよい。この関数は任意である。例えば、SAD(Sum of Absolute Difference)、SSD(Sum of Square Difference)、NCC(Normalized Cross-Correlation)、または、ZNCC(Zero-means Normalized Cross-Correlation)等の関数を用いるようにしてもよい。以下において、これらの関数について説明する。
なお、この関数の説明において、シミュレーション(Simulation)画像の位置(i,j)の画素の輝度値、シミュレーション画像の各画素の輝度値の平均、撮像画像(Capture)画像の位置(i,j)の画素の輝度値、および、撮像画像(Capture)画像の各画素の輝度値の平均を、それぞれ、以下の式(1)のように定める。
<関数例1:SAD>
例えば、両画像の各画素の画素値の絶対値差の総和(SAD)を類似度としてもよい。このSADは、例えば、以下の式(2)のように算出される。このSADが小さいほど、両画像の類似度は高くなる。
例えば、両画像の各画素の画素値の絶対値差の総和(SAD)を類似度としてもよい。このSADは、例えば、以下の式(2)のように算出される。このSADが小さいほど、両画像の類似度は高くなる。
<関数例2:SSD>
例えば、両画像の各画素の画素値の差の2乗の総和(SAD)を類似度としてもよい。このSSDは、例えば、以下の式(3)のように算出される。このSSDが小さいほど、両画像の類似度は高くなる。
例えば、両画像の各画素の画素値の差の2乗の総和(SAD)を類似度としてもよい。このSSDは、例えば、以下の式(3)のように算出される。このSSDが小さいほど、両画像の類似度は高くなる。
<関数例3:NCC>
例えば、正規化相互相関(NCC)を類似度としてもよい。このNCCは、例えば、以下の式(4)のように算出される。このNCCの値域は0≦NCC≦1であり、値が大きいほど(値が「1」に近いほど)、両画像の類似度は高くなる。
例えば、正規化相互相関(NCC)を類似度としてもよい。このNCCは、例えば、以下の式(4)のように算出される。このNCCの値域は0≦NCC≦1であり、値が大きいほど(値が「1」に近いほど)、両画像の類似度は高くなる。
<関数例4:ZNCC>
例えば、ゼロ平均正規化相互相関(ZNCC)を類似度としてもよい。このZNCCは、例えば、以下の式(5)のように算出される。
例えば、ゼロ平均正規化相互相関(ZNCC)を類似度としてもよい。このZNCCは、例えば、以下の式(5)のように算出される。
このZNCCの値域は以下の式(6)のようになり、値が大きいほど(値が「1」に近いほど)、両画像の類似度は高くなる。
<誤差関数E>
また、これらのような関数を用いる誤差関数Eもどのような関数であってもよい。例えば、以下の式(7)のような関数であってもよい。
また、これらのような関数を用いる誤差関数Eもどのような関数であってもよい。例えば、以下の式(7)のような関数であってもよい。
この場合、誤差関数Eの値域は以下の式(8)のようになり、値が小さいほど高評価となる(すなわち類似度が高い)。
<縮小画像を用いた類似度評価>
なお、撮像画像とシミュレーション画像との類似度の評価は、縮小画像を用いて行うようにしてもよい。つまり、撮像画像の縮小画像と、シミュレーション画像の縮小画像(すなわち、撮像画像の縮小画像と同じ解像度のシミュレーション画像)とでマッチングを行うようにしてもよい。縮小画像を用いることにより解像度(画素数)が低減するので、マッチング(類似度の算出)がより容易になるが、1画素あたりの面積が広くなる。つまり、姿勢推定の精度が粗くなるが、換言するに、1画素ずらした場合の移動量が大きくなるので姿勢推定をより高速に行うことができる。したがって、例えば姿勢変化が大きい場合(例えば投影画像の移動量が大きい場合)にも、より高速に姿勢推定を行うことができるようになる。
なお、撮像画像とシミュレーション画像との類似度の評価は、縮小画像を用いて行うようにしてもよい。つまり、撮像画像の縮小画像と、シミュレーション画像の縮小画像(すなわち、撮像画像の縮小画像と同じ解像度のシミュレーション画像)とでマッチングを行うようにしてもよい。縮小画像を用いることにより解像度(画素数)が低減するので、マッチング(類似度の算出)がより容易になるが、1画素あたりの面積が広くなる。つまり、姿勢推定の精度が粗くなるが、換言するに、1画素ずらした場合の移動量が大きくなるので姿勢推定をより高速に行うことができる。したがって、例えば姿勢変化が大きい場合(例えば投影画像の移動量が大きい場合)にも、より高速に姿勢推定を行うことができるようになる。
<部分画像を用いた類似度評価>
また、撮像画像の処理対象とする所定の範囲の部分画像について、シミュレーション画像とのマッチングを行う(類似度を評価する)ようにしてもよい。つまり、撮像画像の所定の範囲を処理対象として設定し、その処理対象とする範囲内についてマッチングを行うようにしてもよい。
また、撮像画像の処理対象とする所定の範囲の部分画像について、シミュレーション画像とのマッチングを行う(類似度を評価する)ようにしてもよい。つまり、撮像画像の所定の範囲を処理対象として設定し、その処理対象とする範囲内についてマッチングを行うようにしてもよい。
例えば、図8のAに示されるような画像71がスクリーンに投影される様子を撮像した撮像画像においては、その画像71の端部(画枠付近)は、画枠のエッジの影響や、画枠外のノイズの影響(例えばスクリーンの形状や材質等による影響)を受け易く、類似度の評価に不向きとなり易い。そこで、図8のBに示されるように、ある姿勢でのシミュレーション画像72を生成する場合、投影画像73の、その端部(画枠付近)を除く領域(図8のCに示される領域74)を設定し、その領域74内についてのみマッチングを行うようにしてもよい。
この領域74の大きさ(換言するに、投影画像73の端部から領域74の端部までの幅)は、任意である。ただし、領域74が小さくなり過ぎると姿勢推定の精度が低減する。したがって、領域74は、投影画像73の端部や投影画像73外の影響が十分に低減される範囲で、できるだけ大きくする(すなわち、投影画像73の端部から領域74の端部までの幅はできるだけ狭くする)ことにより、ノイズの影響を抑制しながら、姿勢推定の精度の低減を抑制することができる。
なお、この部分領域は、撮像画像(投影画像)のどの部分にどのような形状で設定するようにしてもよい。また、設定する部分領域の数も任意である。つまり、この部分領域の設定は、上述した投影画像の端部や外部の影響の抑制以外の任意の目的に用いることができる。例えば、設定した部分領域を拡大(高解像度化)してマッチングを行い、姿勢推定をより高精度に行うようにしてもよい。例えば、複数の投影部から投影される投影画像同士の位置合わせ等の為に姿勢推定を行う場合、処理対象を複数の投影画像が重畳するオーバーラップ領域に限定し、そのオーバーラップ領域を高解像度化してマッチングするようにしてもよい。また、例えば、撮像画像(シミュレーション画像)を複数の部分領域に分割し、各部分領域のマッチングを並行して処理するようにしてもよい。このようにすることにより、より高速に類似度の評価を行うことができる。さらに、各部分画像を高解像度化することにより、より高精度な姿勢推定を実現することができる。
<類似度評価の繰り返し>
なお、撮像画像とシミュレーション画像との類似度の評価は、複数回繰り返すようにしてもよい。例えば、1つの仮想の姿勢について、マッチングを複数回繰り返し、各回の評価結果を総合的に評価するようにしてもよい。例えば、各回の類似度(またはその評価結果)の平均値、中央値、合計値等を評価するようにしてもよい。例えば、比較対象とするパラメータ(輝度値や色成分等)を変えてマッチングを複数回繰り返し、それらの評価結果を総合的に判断するようにしてもよい。
なお、撮像画像とシミュレーション画像との類似度の評価は、複数回繰り返すようにしてもよい。例えば、1つの仮想の姿勢について、マッチングを複数回繰り返し、各回の評価結果を総合的に評価するようにしてもよい。例えば、各回の類似度(またはその評価結果)の平均値、中央値、合計値等を評価するようにしてもよい。例えば、比較対象とするパラメータ(輝度値や色成分等)を変えてマッチングを複数回繰り返し、それらの評価結果を総合的に判断するようにしてもよい。
また、例えば、このようなマッチングの繰り返しにおいて、前回の評価結果(姿勢推定結果)を利用して次のマッチングを行うようにしてもよい。
<精度の階層化>
さらに、例えば、図9に示されるように、画像の解像度を変えてマッチングを複数回繰り返し、それらの評価結果を総合的に判断するようにしてもよい。図9の左側は、このように評価を繰り返す様子をコード化したものである。この場合、初回は、図9の右側に示される画像81のような縮小画像を用い、その画像全体を対象としてマッチングを行う。2回目は、画像82のように1回目の縮小画像よりも大きな縮小画像を用い、その画像全体を対象としてマッチングを行う。3回目は、画像83のように元のサイズで画像全体を対象としてマッチングを行う。4回目は、元のサイズの画像84の、部分領域85を対象としてマッチングを行う。
さらに、例えば、図9に示されるように、画像の解像度を変えてマッチングを複数回繰り返し、それらの評価結果を総合的に判断するようにしてもよい。図9の左側は、このように評価を繰り返す様子をコード化したものである。この場合、初回は、図9の右側に示される画像81のような縮小画像を用い、その画像全体を対象としてマッチングを行う。2回目は、画像82のように1回目の縮小画像よりも大きな縮小画像を用い、その画像全体を対象としてマッチングを行う。3回目は、画像83のように元のサイズで画像全体を対象としてマッチングを行う。4回目は、元のサイズの画像84の、部分領域85を対象としてマッチングを行う。
このように画像の解像度を変えることにより、各回の姿勢推定の精度を変えることができる。つまり、姿勢推定の精度を多段階化(階層化)するようにマッチングを繰り返すことができる。一般的に、高精度な姿勢推定は、低精度な姿勢推定に比べて、負荷も処理時間も増大する。つまり、高精度なマッチングを複数回繰り返すと、負荷や処理時間の増大もさらに大きくなる。そこで、このように解像度を上げながらマッチングを繰り返すことにより、姿勢推定の精度を低精度から高精度に上げていくことができる。つまり、高速に低精度な姿勢推定を行った後、その推定結果を利用して、前回より高精度に姿勢推定を行う等、高精度な姿勢推定をより高速に(つまり、より効率よく)行うことができる。
<複数投影部と複数撮像部>
なお、姿勢推定を行う投影部や撮像部の数は任意であり、単数でも、複数でもよい。投影部や撮像部が複数の場合は、投影部と撮像部の全ての組み合わせについて、撮像画像とシミュレーション画像とのマッチングを行うようにしてもよい。例えば、投影部と撮像部とがそれぞれ複数設けられている場合(例えば、投影撮像装置が複数設けられている場合)、各投影部から投影された投影画像を各撮像部により撮像し、それぞれの撮像画像についてシミュレーション画像を生成し、各撮像画像についてシミュレーション画像とのマッチングを行うようにしてもよい。各マッチングの結果(姿勢推定結果)にズレが生じる場合、平均化したり、重心を求めたりする等、総合的に判断するようにしてもよい。また、その際、精度不足の姿勢推定結果を除外する等、一部の撮像画像とシミュレーション画像とのマッチングを省略するようにしてもよい。このように不要な処理を抑制することにより、不要な負荷の増大を抑制することができる。
なお、姿勢推定を行う投影部や撮像部の数は任意であり、単数でも、複数でもよい。投影部や撮像部が複数の場合は、投影部と撮像部の全ての組み合わせについて、撮像画像とシミュレーション画像とのマッチングを行うようにしてもよい。例えば、投影部と撮像部とがそれぞれ複数設けられている場合(例えば、投影撮像装置が複数設けられている場合)、各投影部から投影された投影画像を各撮像部により撮像し、それぞれの撮像画像についてシミュレーション画像を生成し、各撮像画像についてシミュレーション画像とのマッチングを行うようにしてもよい。各マッチングの結果(姿勢推定結果)にズレが生じる場合、平均化したり、重心を求めたりする等、総合的に判断するようにしてもよい。また、その際、精度不足の姿勢推定結果を除外する等、一部の撮像画像とシミュレーション画像とのマッチングを省略するようにしてもよい。このように不要な処理を抑制することにより、不要な負荷の増大を抑制することができる。
<2.第1の実施の形態>
<投影撮像システム>
図10は、本技術を適用した投影撮像システムの一実施の形態の主な構成例を示すブロック図である。図10において、投影撮像システム100は、画像を投影したり、投影画像を撮像したり、本技術を適用した方法で、すなわち、上述した方法で、姿勢推定を行ったりすることができるシステムである。
<投影撮像システム>
図10は、本技術を適用した投影撮像システムの一実施の形態の主な構成例を示すブロック図である。図10において、投影撮像システム100は、画像を投影したり、投影画像を撮像したり、本技術を適用した方法で、すなわち、上述した方法で、姿勢推定を行ったりすることができるシステムである。
図10に示されるように、投影撮像システム100は、制御装置101、並びに、投影撮像装置102−1乃至投影撮像装置102−N(Nは任意の自然数)を有する。投影撮像装置102−1乃至投影撮像装置102−Nは、それぞれ、ケーブル103−1乃至ケーブル103−Nを介して制御装置101に接続されている。
以下において、投影撮像装置102−1乃至投影撮像装置102−Nを互いに区別して説明する必要が無い場合、投影撮像装置102と称する。また、ケーブル103−1乃至ケーブル103−Nを互いに区別して説明する必要が無い場合、ケーブル103と称する。
制御装置101は、ケーブル103を介して各投影撮像装置102を制御する。例えば、制御装置101は、各投影撮像装置102に対して、投影する画像を供給し、その画像を投影させる。また、例えば、制御装置101は、各投影撮像装置102に対して、投影画像等の撮像を指示し、その撮像画像を取得する。さらに、例えば、制御装置101は、撮像画像のシミュレーション画像を生成し、撮像画像とシミュレーション画像のマッチング(類似度評価)を行う。また、例えば、制御装置101は、その類似度の評価結果に基づいて各投影撮像装置102の姿勢を推定したり、スクリーン(投影面)を再構成したり、各投影撮像装置102に投影させる画像に対して幾何補正を行ったりする。
例えば、制御装置101が、この幾何補正として、投影させる画像に対して、例えば、拡大、縮小、変形等の画像処理を行うようにしてもよい。また、例えば、制御装置101が、この幾何補正として、例えば、各投影撮像装置102の光学系に対して、投影方向や撮像方向等の制御等を行うようにしてもよい。もちろん、これらの両方が行われるようにしてもよい。
投影撮像装置102−1乃至投影撮像装置102−Nは、それぞれ、画像を投影する投影部111−1乃至投影部111−N、並びに、被写体を撮像する撮像部112−1乃至撮像部112−Nを有する。以下において、投影部111−1乃至投影部111−Nを互いに区別して説明する必要が無い場合、投影部111と称する。また、撮像部112−1乃至撮像部112−Nを互いに区別して説明する必要が無い場合、撮像部112と称する。
投影部111は、所謂プロジェクタの機能を有する。つまり、投影撮像装置102は、投影部111を用いてプロジェクタとして駆動することができる。例えば、投影撮像装置102は、この投影部111を用いて、制御装置101から供給される画像を任意の投影面に投影することができる。
撮像部112は、所謂カメラの機能を有する。つまり、投影撮像装置102は、撮像部112を用いてカメラとして駆動することができる。例えば、投影撮像装置102は、この撮像部112を用いて、投影部111により画像が投影された投影面の撮像を行い、撮像画像を得ることができる。投影撮像装置102は、さらに、その得られた撮像画像のデータを制御装置101に供給することができる。
投影撮像装置102の数は任意であり、単数でも複数でも良い。投影撮像装置102が複数の場合、各投影撮像装置102は、互いに独立に動作することもできるし、制御装置101の制御の下、互いに協働して動作することもできる。各投影撮像装置102を協働させる場合の投影撮像システム100は、所謂マルチプロジェクションシステムとして機能し、所謂プロジェクションマッピングを実現することができる。
なお、投影部111の、例えば、画像の投影方向や拡大率、投影画像の歪み補正等の、投影に関するパラメータを制御することができるようにしてもよい。また、この投影に関するパラメータの制御のために、例えば、投影部111が有する光学系の姿勢、投影部111全体の姿勢等を制御可能としてもよい。
また、撮像部112の、例えば、画像の撮像方向や画角、撮像画像の歪み補正等の、撮像に関するパラメータを制御することができるようにしてもよい。また、この撮像に関するパラメータの制御のために、例えば、撮像部112が有する光学系の姿勢、撮像部112全体の姿勢等を制御可能としてもよい。
さらに、このような投影部111の制御と撮像部112の制御は、互いに独立して行うことができるようにしてもよい。また、投影撮像装置102の姿勢を制御可能としてもよい。なお、以上のような投影部111の制御、撮像部112の制御、投影撮像装置102の制御は、制御装置101が行うようにしてもよいし、例えば投影撮像装置102等、制御装置101以外の装置が行うようにしてもよい。
ケーブル103は、制御装置101と投影撮像装置102とを通信可能に接続する任意の通信規格の電気通信ケーブルである。つまり、このケーブル103は、制御装置101と投影撮像装置102との間の通信媒体となり得る。なお、投影撮像システム100においては、制御装置101と投影撮像装置102とが互いに通信可能に接続されていればよく、例えば制御装置101と投影撮像装置102とが無線通信により接続されるようにしてもよい。その場合、ケーブル103を省略することができる。
制御装置101は、各投影部111、各撮像部112の姿勢推定を、コンテンツ(例えば動画像)の投影中に行う(オンラインセンシングを行う)。制御装置101は、投影部111の一部または全部が投影した各投影画像を、撮像部112の一部または全部に撮像させ、得られた各撮像画像と、その撮像画像のシミュレーション画像とのマッチングを行うことにより、各投影部111、各撮像部112の姿勢推定を行う。
<制御装置>
図11は、本技術を適用した画像処理装置の一実施の形態である制御装置101の主な構成例を示すブロック図である。
図11は、本技術を適用した画像処理装置の一実施の形態である制御装置101の主な構成例を示すブロック図である。
図11に示されるように、制御装置101は、CPU121、ROM122、RAM123、バス124、入出力インタフェース130、入力部131、出力部132、記憶部133、通信部134、およびドライブ135を有する。
CPU121、ROM122、RAM123は、バス124を介して相互に接続されている。バス124にはまた、入出力インタフェース130も接続されている。入出力インタフェース130には、入力部131、出力部132、記憶部133、通信部134、およびドライブ135が接続されている。
CPU121は、例えば、ROM122や記憶部133に記憶されているプログラム等をRAM123にロードして実行することにより、各種処理を行う。RAM123にはまた、CPU121が各種の処理を実行する上において必要なデータなども適宜記憶される。
例えば、CPU121は、そのようにプログラム等を実行することにより、対応点の検出に関する処理を行うことができる。
入力部131は、例えばユーザ入力等の外部の任意の情報を受け付ける入力デバイスを含む。この入力デバイスはどのようなものであってもよい。例えば、キーボード、マウス、操作ボタン、タッチパネル、カメラ、マイクロホン、バーコードリーダ等であってもよい。また、加速度センサ、光センサ、温度センサ等の各種センサであってもよい。さらに、外部の任意の情報をデータ(信号)として受け付ける入力端子であってもよい。出力部132は、例えば画像や音声等の装置内部の任意の情報を出力する出力デバイスを含む。この出力デバイスはどのようなものであってもよい。例えば、ディスプレイやスピーカ等であってもよい。また、任意の情報をデータ(信号)として外部に出力する出力端子であってもよい。
記憶部133は、プログラムやデータ等の情報を記憶する記憶媒体を含む。この記憶媒体はどのようなものであってもよい。例えば、ハードディスク、RAMディスク、不揮発性メモリ等であってもよい。通信部134は、所定の通信媒体(例えばインターネット等の任意のネットワーク)を介して外部の装置とプログラムやデータ等の情報を授受する通信を行う通信デバイスを含む。この通信デバイスはどのようなものであってもよい。例えば、ネットワークインタフェースであってもよい。この通信部134による通信の通信方法や通信規格は任意である。例えば、通信部134が、有線通信を行うことができるようにしてもよいし、無線通信を行うことができるようにしてもよいし、その両方を行うことができるようにしてもよい。
ドライブ135は、自身に装着されたリムーバブルメディア141に対する情報(プログラムやデータ等)の読み出しや書き込みに関する処理を行う。このリムーバブルメディア141は、どのような記録媒体であってもよい。例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであってもよい。例えば、ドライブ135は、自身に装着されたリムーバブルメディア141に記憶されている情報(プログラムやデータ等)を読み出し、その情報をCPU121やRAM123等に供給する。また、例えば、ドライブ135は、CPU121やRAM123等から供給される情報(プログラムやデータ等)を取得し、その情報を自身に装着されたリムーバブルメディア141に書き込む。
<制御装置の機能ブロック>
図12のAは、制御装置101がプログラム等を実行することにより実現する機能の例を示す機能ブロック図である。図12のAに示されるように、プログラムを実行することにより制御装置101は、例えば、投影処理部151、投影制御部152、撮像制御部153、姿勢推定部154、および設定部155の機能を有する。
図12のAは、制御装置101がプログラム等を実行することにより実現する機能の例を示す機能ブロック図である。図12のAに示されるように、プログラムを実行することにより制御装置101は、例えば、投影処理部151、投影制御部152、撮像制御部153、姿勢推定部154、および設定部155の機能を有する。
投影処理部151は、コンテンツ(動画像)の投影に関する処理を行う。投影制御部152は、各投影部111の制御に関する処理を行う。撮像制御部153は、各撮像部112の制御に関する処理を行う。姿勢推定部154は、各投影撮像装置102(または各投影撮像装置102の投影部111および撮像部112)の姿勢推定等に関する処理を行う。設定部155は、幾何補正等に関するパラメータの設定に関する処理を行う。
なお、各ブロックは、必要に応じて相互に情報(例えば命令やデータ等)を授受することが可能とされている。また、制御装置101がこれら以外の機能を有するようにしてもよい。
<姿勢推定部>
図12のAの姿勢推定部154は、図12のBにおいて機能ブロックとして示される機能を有する。つまり、姿勢推定部154は、例えば、類似度評価部161および姿勢設定部162の機能を有する。
図12のAの姿勢推定部154は、図12のBにおいて機能ブロックとして示される機能を有する。つまり、姿勢推定部154は、例えば、類似度評価部161および姿勢設定部162の機能を有する。
類似度評価部161は、撮像画像とシミュレーション画像との類似度の評価に関する処理を行う。姿勢設定部162は、投影部111や撮像部112の姿勢の設定に関する処理を行う。
なお、各ブロックは、必要に応じて相互に情報(例えば命令やデータ等)を授受することが可能とされている。また、姿勢推定部154がこれら以外の機能を有するようにしてもよい。
<類似度評価部>
図12のBの類似度評価部161は、図12のCにおいて機能ブロックとして示される機能を有する。つまり、類似度評価部161は、例えば、仮想姿勢設定部171、シミュレーション画像生成部172、および画像類似度評価部173の機能を有する。
図12のBの類似度評価部161は、図12のCにおいて機能ブロックとして示される機能を有する。つまり、類似度評価部161は、例えば、仮想姿勢設定部171、シミュレーション画像生成部172、および画像類似度評価部173の機能を有する。
仮想姿勢設定部171は、仮想の姿勢の設定に関する処理を行う。シミュレーション画像生成部172は、シミュレーション画像の生成に関する処理を行う。画像類似度評価部173は、類似度の評価に関する処理を行う。
なお、各ブロックは、必要に応じて相互に情報(例えば命令やデータ等)を授受することが可能とされている。また、類似度評価部161がこれら以外の機能を有するようにしてもよい。
<投影撮像装置>
図13は、投影撮像装置102の主な構成例を示すブロック図である。図13に示されるように、投影撮像装置102は、制御部201、投影部111、撮像部112、入力部211、出力部212、記憶部213、通信部214、およびドライブ215を有する。
図13は、投影撮像装置102の主な構成例を示すブロック図である。図13に示されるように、投影撮像装置102は、制御部201、投影部111、撮像部112、入力部211、出力部212、記憶部213、通信部214、およびドライブ215を有する。
制御部201は、例えば、CPU、ROM、RAM等を有し、装置内の各処理部を制御したり、例えば画像処理等、その制御に必要な各種処理を実行したりする。制御部201は、例えば制御装置101の制御に基づいて、それらの処理を行う。例えば、制御部201は、制御装置101の制御に従って、制御装置101から供給される画像を、通信部214を介して取得し、それを投影部111に供給し、投影させる。また、例えば、制御部201は、制御装置101の制御に従って、撮像部112に投影面を撮像させ、撮像画像を取得し、それを、通信部214を介して制御装置101に供給する。
投影部111は、制御部201により制御されて、画像の投影に関する処理を行う。例えば、投影部111は、制御部201から供給される画像を投影撮像装置102の外部(例えば投影面等)に投影する。投影部111は、レーザ光を光源とし、MEMS(Micro Electro Mechanical Systems)ミラーを用いてそのレーザ光を走査することにより、画像を投影する。もちろん、投影部111の光源は任意であり、レーザ光に限らず、例えばLED(Light Emitting Diode)やキセノン等であってもよい。なお、投影部111は、画像を投影することができるものであればどのようなデバイスであってもよい。
撮像部112は、制御部201により制御されて、装置外部(例えば投影面等)の被写体を撮像し、撮像画像を生成し、その撮像画像を制御部201に供給する。撮像部112は、例えばCMOS(Complementary Metal Oxide Semiconductor)を用いたイメージセンサ、CCD(Charge Coupled Device)を用いたイメージセンサ等を有し、そのイメージセンサによって被写体からの光を光電変換して、撮像画像の電気信号(データ)を生成する。例えば、撮像部112は、投影部111と同期して駆動し、投影部111により投影面に投影された投影画像を撮像する。なお、撮像部112は、投影画像を撮像することができるものであればどのようなデバイスであってもよい。
入力部211は、例えばユーザ入力等の外部の任意の情報を受け付ける入力デバイスを含む。この入力デバイスはどのようなものであってもよい。例えば、操作ボタン、タッチパネル、カメラ、マイクロホン、入力端子、加速度センサ、光センサ、温度センサ等の各種センサ等であってもよい。出力部212は、例えば画像や音声等の装置内部の任意の情報を出力する出力デバイスを含む。この出力デバイスはどのようなものであってもよい。例えば、ディスプレイ、スピーカ、出力端子等であってもよい。
記憶部213は、プログラムやデータ等の情報を記憶する記憶媒体を含む。この記憶媒体はどのようなものであってもよい。例えば、ハードディスク、RAMディスク、不揮発性メモリ等であってもよい。
通信部214は、所定の通信媒体(例えばインターネット等の任意のネットワーク)を介して外部の装置とプログラムやデータ等の情報を授受する通信を行う通信デバイスを含む。この通信デバイスはどのようなものであってもよい。例えば、ネットワークインタフェースであってもよい。例えば、通信部214は、通信ケーブル103に接続され、通信ケーブル103を介して接続される制御装置101と通信を行うことができる。この通信部214による通信の通信方法や通信規格は任意である。例えば、通信部214が、有線通信を行うことができるようにしてもよいし、無線通信を行うことができるようにしてもよいし、その両方を行うことができるようにしてもよい。
ドライブ215は、自身に装着されたリムーバブルメディア221に対する情報(プログラムやデータ等)の読み出しや書き込みに関する処理を行う。このリムーバブルメディア221は、どのような記録媒体であってもよい。例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであってもよい。例えば、ドライブ215は、自身に装着されたリムーバブルメディア221に記憶されている情報(プログラムやデータ等)を読み出し、その情報を制御部201等に供給する。また、例えば、ドライブ215は、制御部201等から供給される情報(プログラムやデータ等)を取得し、その情報を自身に装着されたリムーバブルメディア221に書き込む。
<投影部>
図14は、投影部111の主な構成例を示すブロック図である。図14に示されるように、投影部111は、ビデオプロセッサ231、レーザドライバ232、レーザ出力部233−1、レーザ出力部233−2、レーザ出力部233−3、ミラー234−1、ミラー234−2、ミラー234−3、MEMSドライバ235、および、MEMSミラー236を有する。
図14は、投影部111の主な構成例を示すブロック図である。図14に示されるように、投影部111は、ビデオプロセッサ231、レーザドライバ232、レーザ出力部233−1、レーザ出力部233−2、レーザ出力部233−3、ミラー234−1、ミラー234−2、ミラー234−3、MEMSドライバ235、および、MEMSミラー236を有する。
ビデオプロセッサ231は、制御部201から供給される画像を保持したり、その画像に対して必要な画像処理を行ったりする。ビデオプロセッサ231は、その投影する画像をレーザドライバ232やMEMSドライバ235に供給する。
レーザドライバ232は、ビデオプロセッサ231から供給される画像を投影するように、レーザ出力部233−1乃至レーザ出力部233−3を制御する。レーザ出力部233−1乃至レーザ出力部233−3は、例えば、赤、青、緑等、互いに異なる色(波長域)のレーザ光を出力する。つまり、レーザドライバ232は、ビデオプロセッサ231から供給される画像を投影するように、各色のレーザ出力を制御する。なお、レーザ出力部233−1乃至レーザ出力部233−3を互いに区別して説明する必要が無い場合、レーザ出力部233と称する。
ミラー234−1は、レーザ出力部233−1から出力されるレーザ光を反射し、MEMSミラー236に誘導する。ミラー234−2は、レーザ出力部233−2から出力されるレーザ光を反射し、MEMSミラー236に誘導する。ミラー234−3は、レーザ出力部233−3から出力されるレーザ光を反射し、MEMSミラー236に誘導する。なお、ミラー234−1乃至ミラー234−3を互いに区別して説明する必要が無い場合、ミラー234と称する。
MEMSドライバ235は、ビデオプロセッサ231から供給される画像を投影するように、MEMSミラー236のミラーの駆動を制御する。MEMSミラー236は、MEMSドライバ235の制御に従ってMEMS上に取り付けられたミラー(鏡)を駆動することにより、例えば、図15の例のように各色のレーザ光を走査する。このレーザ光は、投射口から装置外部に出力され、例えば投影面に照射される。これにより、ビデオプロセッサ231から供給される画像が投影面に投影される。
なお、図14の例においては、レーザ出力部233を3つ設け、3色のレーザ光を出力するように説明したが、レーザ光の数(または色数)は任意である。例えば、レーザ出力部233を4つ以上であってもよいし、2つ以下であってもよい。つまり、投影撮像装置102(投影部111)から出力されるレーザ光は、2本以下であってもよいし、4本以上であってもよい。そして、投影撮像装置102(投影部111)から出力されるレーザ光の色数も任意であり、2色以下であってもよいし、4色以上であってもよい。また、ミラー234やMEMSミラー236の構成も任意であり、図14の例に限定されない。もちろん、レーザ光の走査パタンは任意である。
<画像投影処理の流れ>
次に、このような構成の投影撮像システム100において実行される処理について説明する。上述したように、投影撮像システム100の制御装置101は、投影撮像装置102を制御し、コンテンツ(動画像)を投影する。このようなコンテンツの投影を行うために制御装置101において実行される画像投影処理の流れの例を、図16のフローチャートを参照して説明する。
次に、このような構成の投影撮像システム100において実行される処理について説明する。上述したように、投影撮像システム100の制御装置101は、投影撮像装置102を制御し、コンテンツ(動画像)を投影する。このようなコンテンツの投影を行うために制御装置101において実行される画像投影処理の流れの例を、図16のフローチャートを参照して説明する。
画像投影処理が開始されると、ステップS101において、制御装置101の姿勢推定部154は、投影部111、撮像部112の姿勢を設定する。また、設定部155は、その設定された姿勢に基づいて、幾何補正に関するパラメータを設定する。
ステップS102において、投影処理部151は、投影部111から投影する画像を生成する。例えば、投影処理部151は、入力画像(コンテンツ)に対して、ステップS101において設定されたパラメータを用いた幾何補正を行う等して、投影する画像を生成する。
ステップS103において、投影制御部152は、ステップS102において生成された画像を、投影部111に供給し、スクリーン(投影面)に投影させる。
ステップS104において、撮像制御部153は、ステップS103においてスクリーンに投影された投影画像を、撮像部112に撮像させ、その撮像画像を取得する。
ステップS105において、姿勢推定部154は、ステップS104において得られた撮像画像に基づいて姿勢推定を行うか否かを判定する。すなわち、姿勢推定部154は、撮像画像における投影画像の位置や形状の変化等に基づいて、投影部111、撮像部112の姿勢の変化を検出し、姿勢の変化が検出されたか否かによって、姿勢推定を行うか否かを判定する。姿勢の変化が検出され、姿勢推定を行うと判定された場合、処理はステップS106に進む。
ステップS106において、姿勢推定部154は、姿勢推定処理を実行し、撮像画像を用いて姿勢推定を行う。
ステップS107において、設定部155は、ステップS106において推定された姿勢に基づいて、幾何補正に関するパラメータを設定する。つまり、設定部155は、姿勢推定結果に応じて、幾何補正に関するパラメータの設定を更新する。
ステップS107の処理が終了すると処理はステップS108に進む。また、ステップS105において、姿勢の変化が検出されず、姿勢推定を行わないと判定された場合、処理はステップS108に進む。
ステップS108において、投影処理部151は、画像投影、すなわち、コンテンツの投影を終了するか否かを判定する。コンテンツの投影が終了しておらず、かつ、ユーザ等から投影の中止を指示されておらず、画像投影を継続すると判定された場合、処理はステップS102に戻る。すなわち、次のフレームについて、ステップS102移行の処理のが実行される。
また、ステップS108において、コンテンツを最後まで投影した、または、ユーザ等から投影の中止を指示されたと判定された場合、画像投影処理が終了する。
なお、撮像部112が複数存在する場合、制御装置101は、ステップS104乃至ステップS107の各処理を各撮像部112についてそれぞれ実行すればよい。また、投影部111が複数存在する場合、制御装置101は、以上の画像投影処理を各投影部111についてそれぞれ実行すればよい。
<姿勢推定処理の流れ>
次に、図16のステップS106において実行される姿勢推定処理の流れの例を、図17のフローチャートを参照して説明する。
次に、図16のステップS106において実行される姿勢推定処理の流れの例を、図17のフローチャートを参照して説明する。
姿勢推定処理が開始されると、類似度評価部161は、ステップS121において、類似度評価処理を実行して、撮像画像とシミュレーション画像とを比較してそれらの類似度を評価する。
ステップS122において、姿勢設定部162は、ステップS121の類似度評価処理結果に基づいて、投影部111若しくは撮像部112、またはその両方の姿勢を設定する。つまり、姿勢設定部162は、これらの姿勢を、類似度の評価が最適となる姿勢に設定する。
ステップS122の処理が終了すると、姿勢推定処理が終了し、処理は図16に戻る。
<類似度評価処理の流れ>
次に、図17のステップS121において実行される類似度評価処理の流れの例を、図18のフローチャートを参照して説明する。
次に、図17のステップS121において実行される類似度評価処理の流れの例を、図18のフローチャートを参照して説明する。
類似度評価処理が開始されると、仮想姿勢設定部171は、ステップS141において、投影部111や撮像部112の仮想の姿勢(仮想姿勢とも称する)を初期値に設定する。この初期値は任意であるが、例えば、既知の姿勢、すなわち、姿勢変化前の姿勢としてもよい。
ステップS142において、シミュレーション画像生成部172は、ステップS141において設定された仮想姿勢における撮像画像のシミュレーション画像を生成する。
ステップS143において、画像類似度評価部173は、図16のステップS104において得られた撮像画像と、ステップS142において生成されたシミュレーション画像とを比較し、それらの類似度を求め、評価する。画像類似度評価部173は、<1.画像類似度を用いた姿勢推定>において説明したような手法で、この類似度の算出や評価を行う。
ステップS144において、画像類似度評価部173は、全ての仮想姿勢について類似度を評価したか否かを判定する。他の仮想姿勢についても類似度を評価すると判定された場合、処理はステップS145に進む。
ステップS145において、仮想姿勢設定部171は、仮想姿勢の設定を新たな姿勢に更新する。ステップS145の処理が終了すると、処理はステップS142に戻る。すなわち、更新された仮想姿勢について、ステップS142移行の処理が実行される。
ステップS144において、全ての仮想姿勢について類似度を評価し、これ以上他の仮想姿勢について類似度を評価しないと判定された場合、類似度評価処理が終了し、処理は図17に戻る。
以上のように各処理を実行することにより、撮像画像とそのシミュレーション画像の類似度の評価結果に基づいて姿勢推定を行うことができ、コンテンツ視聴中の姿勢推定の投影画像に対するロバスト性を向上させることができる。
<最適な評価の求め方>
なお、類似度の評価が最適となる姿勢(例えば誤差関数Eの値が最小となる姿勢)の求め方は任意である。例えば、図18の類似度評価処理において仮想姿勢を網羅的に設定し、全ての仮想姿勢において類似度を評価し、その中で評価が最適となる姿勢を求めるようにしてもよい。また、例えば、仮想姿勢を所定の範囲内で網羅的に設定し、類似度を評価し、その中で最適な評価結果が得られる姿勢を求める処理を、より好適な評価結果が得られなくなるまで繰り返すようにしてもよい。さらに、例えば、姿勢変化前後の撮像画像間における変化(例えば撮像画像に含まれる投影画像の位置や形状の変化)等を解析して、姿勢変化の大まかな傾向(例えば、どの方向に位置や向きがどのくらい変化したか等)を特定し、その傾向に従って仮想姿勢を設定するようにしてもよい。また、例えば、上述したように解像度を変化させながら姿勢推定を繰り返し、最適な評価結果が得られる姿勢を高精度に求めるようにしてもよい。さらに、例えば、複数のフレームについて姿勢推定を行うようにしてもよい。つまり、例えば、上述したような姿勢推定の繰り返しを複数のフレームに亘って行う(例えば、各回の姿勢推定を互いに異なるフレームにおいて行う)ようにしてもよい。
なお、類似度の評価が最適となる姿勢(例えば誤差関数Eの値が最小となる姿勢)の求め方は任意である。例えば、図18の類似度評価処理において仮想姿勢を網羅的に設定し、全ての仮想姿勢において類似度を評価し、その中で評価が最適となる姿勢を求めるようにしてもよい。また、例えば、仮想姿勢を所定の範囲内で網羅的に設定し、類似度を評価し、その中で最適な評価結果が得られる姿勢を求める処理を、より好適な評価結果が得られなくなるまで繰り返すようにしてもよい。さらに、例えば、姿勢変化前後の撮像画像間における変化(例えば撮像画像に含まれる投影画像の位置や形状の変化)等を解析して、姿勢変化の大まかな傾向(例えば、どの方向に位置や向きがどのくらい変化したか等)を特定し、その傾向に従って仮想姿勢を設定するようにしてもよい。また、例えば、上述したように解像度を変化させながら姿勢推定を繰り返し、最適な評価結果が得られる姿勢を高精度に求めるようにしてもよい。さらに、例えば、複数のフレームについて姿勢推定を行うようにしてもよい。つまり、例えば、上述したような姿勢推定の繰り返しを複数のフレームに亘って行う(例えば、各回の姿勢推定を互いに異なるフレームにおいて行う)ようにしてもよい。
<3.第2の実施の形態>
<対応点距離評価の併用>
なお、上述した本技術を適用した画像の類似度に基づく姿勢推定の方法と、<1.画像類似度を用いた姿勢推定>において説明した、対応点間の距離に基づく姿勢推定の方法とを併用してもよい。
<対応点距離評価の併用>
なお、上述した本技術を適用した画像の類似度に基づく姿勢推定の方法と、<1.画像類似度を用いた姿勢推定>において説明した、対応点間の距離に基づく姿勢推定の方法とを併用してもよい。
一般的に、類似度に基づく姿勢推定の方が、対応点間の距離に基づく姿勢推定よりも投影画像に対するロバスト性を向上させることができるが、対応点間の距離に基づく姿勢推定の方が、類似度に基づく姿勢推定よりも処理の負荷が小さい。両手法を併用することにより、各手法の特徴を生かしてより効率の良い姿勢推定を実現することができる。
<姿勢推定部>
この場合、姿勢推定部154は、図19において機能ブロックとして示される機能を有する。つまり、姿勢推定部154は、例えば、類似度評価部161および姿勢設定部162の機能に加え、対応点距離評価部301の機能を有する。
この場合、姿勢推定部154は、図19において機能ブロックとして示される機能を有する。つまり、姿勢推定部154は、例えば、類似度評価部161および姿勢設定部162の機能に加え、対応点距離評価部301の機能を有する。
対応点距離評価部301は、対応点間の距離の評価に関する処理を行う。この場合、姿勢設定部162は、対応点距離評価部301において得られる評価結果や、類似度評価部161において得られる評価結果に基づいて姿勢の設定に関する処理を行う。
なお、各ブロックは、必要に応じて相互に情報(例えば命令やデータ等)を授受することが可能とされている。また、姿勢推定部154がこれら以外の機能を有するようにしてもよい。
<姿勢推定処理の流れ1>
例えば姿勢推定において、必ず、画像の類似度に基づく方法と、対応点間の距離に基づく方法の両方を行うようにし、その両方の推定結果に基づいて姿勢を決定するようにしてもよい。その場合の姿勢推定処理の流れの例を、図20のフローチャートを参照して説明する。
例えば姿勢推定において、必ず、画像の類似度に基づく方法と、対応点間の距離に基づく方法の両方を行うようにし、その両方の推定結果に基づいて姿勢を決定するようにしてもよい。その場合の姿勢推定処理の流れの例を、図20のフローチャートを参照して説明する。
この場合、姿勢推定処理が開始されると、ステップS301において、対応点距離評価部301は、撮像画像に含まれる投影画像の特徴点とシミュレーション画像に含まれる投影画像の特徴点との対応関係を求めることにより、それぞれの対応点を求める。そして、対応点距離評価部301は、その対応点間の距離を求め、誤差関数E等を用いて評価する。
ステップS302において、類似度評価部161は、類似度評価処理を実行し、撮像画像とシミュレーション画像とを比較し、それらの類似度を評価する。なお、この類似度評価処理は、第1の実施の形態において図18のフローチャートを参照して説明した場合と基本的に同様に実行される。
ステップS303において、姿勢設定部162は、ステップS301およびステップS302の評価結果に基づいて、最適とされる評価が得られた仮想姿勢を、投影部111若しくは撮像部112、またはその両方の姿勢として設定する。ステップS303の処理が終了すると、姿勢推定処理が終了し、処理は図16に戻る。
このように複数の方法で姿勢推定を行うことにより、より多様な条件下においてより正確に姿勢推定を行うことができる。したがって、姿勢推定の投影画像に対するロバスト性をさらに向上させることができる。
なお、この場合、対応点間の距離に基づく姿勢推定と、画像の類似度に基づく姿勢推定のどちらを先に行うようにしてもよい。また、例えば、比較的負荷の軽い対応点間の距離に基づく方法で姿勢推定を行ってから、その推定結果を初期値として、比較的精度の高い画像の類似度に基づく方法で姿勢推定を行うようにしてもよい。つまり、図20の例の場合、ステップS301の処理結果をステップS302の初期値として反映して、ステップS302の処理を行うようにしてもよい。このようにすることにより、この2つの方法の姿勢推定をより効率よく行うことができる。
<姿勢推定処理の流れ2>
また、姿勢推定において、画像の類似度に基づく方法と、対応点間の距離に基づく方法とを選択的に行うようにしてもよい。この選択の根拠となる情報は任意であるが、例えば、投影画像の内容や検出された対応点の傾向等の所定の条件に応じていずれか一方を選択し、実行するようにしてもよい。例えば、検出された対応点の数が多く、かつ、対応点の位置に偏りが少ない場合、対応点間の距離に基づく方法を選択し、そうでない場合、画像の類似度に基づく方法を選択するようにしてもよい。
また、姿勢推定において、画像の類似度に基づく方法と、対応点間の距離に基づく方法とを選択的に行うようにしてもよい。この選択の根拠となる情報は任意であるが、例えば、投影画像の内容や検出された対応点の傾向等の所定の条件に応じていずれか一方を選択し、実行するようにしてもよい。例えば、検出された対応点の数が多く、かつ、対応点の位置に偏りが少ない場合、対応点間の距離に基づく方法を選択し、そうでない場合、画像の類似度に基づく方法を選択するようにしてもよい。
その場合の姿勢推定処理の流れの例を、図21のフローチャートを参照して説明する。この場合、姿勢推定処理が開始されると、対応点距離評価部301は、ステップS321において、撮像画像に含まれる投影画像の特徴点を検出する。
ステップS322において、対応点距離評価部301は、既知の姿勢でシミュレーション画像を生成する。
ステップS323において、対応点距離評価部301は、そのシミュレーション画像の特徴点を検出する。
ステップS324において、対応点距離評価部301は、ステップS321において検出した撮像画像の特徴点と、ステップS323において検出したシミュレーション画像の特徴点との間の対応関係(すなわち、特徴点同士の対応関係)を求める。つまり、対応点距離評価部301は、対応点を検出する。
ステップS325において、対応点距離評価部301は、ステップS324において検出した対応点の数が十分に多く、かつ、その対応点の位置の偏りが十分に少ないか否かを判定する。例えば、対応点距離評価部301は、検出した対応点の数や分布を所定の閾値と比較してこの判定を行う。対応点の数が十分に多く、かつ、その対応点の位置の偏りが十分に少ないと判定された場合、処理はステップS326に進む。
ステップS326において、対応点距離評価部301は、各対応点間の距離を求め、誤差関数E等を用いてそれを評価する。ステップS326の処理が終了すると処理はステップS328に進む。
また、ステップS325において、対応点の数が少ない、または、対応点の位置の偏りが大きいと判定された場合、処理はステップS327に進む。ステップS327において、類似度評価部161は、類似度評価処理を実行し、撮像画像とシミュレーション画像とを比較し、それらの類似度を評価する。なお、この類似度評価処理は、第1の実施の形態において図18のフローチャートを参照して説明した場合と基本的に同様に実行される。ステップS327の処理が終了すると処理はステップS328に進む。
ステップS328において、姿勢設定部162は、ステップS326またはステップS327の評価結果に基づいて、最適とされる評価が得られた仮想姿勢を、投影部111若しくは撮像部112、またはその両方の姿勢として設定する。ステップS328の処理が終了すると、姿勢推定処理が終了し、処理は図16に戻る。
このようにすることにより、対応点間距離に基づく方法で十分な精度の姿勢推定が可能な場合に、比較的負荷の軽い対応点間距離に基づく方法を選択し、対応点間距離に基づく方法では十分な精度が得られない場合に、比較的精度の高い画像の類似度に基づく方法を選択することができる。したがって、より多様な画像に対してより正確な姿勢推定を行うことができる。つまり、姿勢推定の投影画像に対するロバスト性を向上させることができる。
なお、本技術を適用した姿勢推定の方法である画像の類似度に基づく方法と併用する姿勢推定の方法は任意であり、上述した対応点間距離に基づく方法以外であってもよい。
<4.第3の実施の形態>
<投影撮像システム、投影撮像装置の他の構成例>
なお、本技術を適用した投影撮像システムの構成例は、上述した例に限定されない。例えば図22のAに示される投影撮像システム400のように、制御装置101並びに各投影撮像装置102がネットワーク401を介して互いに接続されるようにしてもよい。
<投影撮像システム、投影撮像装置の他の構成例>
なお、本技術を適用した投影撮像システムの構成例は、上述した例に限定されない。例えば図22のAに示される投影撮像システム400のように、制御装置101並びに各投影撮像装置102がネットワーク401を介して互いに接続されるようにしてもよい。
ネットワーク401は、任意の通信網である。ネットワーク401において採用される通信方法は任意である。例えば、有線通信であってもよいし、無線通信であってもよいし、それらの両方であってもよい。また、ネットワーク401は、1の通信網により構成されるようにしてもよいし、複数の通信網により構成されるようにしてもよい。例えば、インターネット、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、WAN(Wide Area Network)、LAN(Local Area Network)、Bluetooth(登録商標)規格に準拠した通信を行う無線通信網、NFC(Near Field Communication)等の近距離無線通信の通信路、赤外線通信の通信路、HDMI(登録商標)(High-Definition Multimedia Interface)やUSB(Universal Serial Bus)等の規格に準拠した有線通信の通信網等、任意の通信規格の通信網や通信路がネットワーク401に含まれるようにしてもよい。
制御装置101並びに各投影撮像装置102は、このネットワーク401に通信可能に接続されている。なお、この接続は有線(すなわち、有線通信を介した接続)であってもよいし、無線(すなわち、無線通信を介した接続)であってもよいし、その両方であってもよい。なお、各装置の数、筐体の形状や大きさ、配置位置等は任意である。
制御装置101並びに各投影撮像装置102は、ネットワーク401を介して互いに通信を行う(情報の授受等を行う)ことができる。換言するに、制御装置101並びに各投影撮像装置102は、他の設備(装置や伝送路等)を介して互いに通信可能に接続されるようにしてもよい。
このような構成の投影撮像システム400の場合も、投影撮像システム100の場合と同様に本技術を適用することができ、上述した作用効果を奏することができる。
また、例えば図22のBに示される投影撮像システム410のように、投影部111と撮像部112とが互いに異なる装置として構成されるようにしてもよい。投影撮像システム410は、投影撮像装置102の代わりに、投影装置411−1乃至投影装置411−N(Nは任意の自然数)、並びに、撮像装置412−1乃至撮像装置412−M(Mは任意の自然数)を有する。投影装置411−1乃至投影装置411−Nは、それぞれ、投影部111(投影部111−1乃至投影部111−N)を有し、画像の投影を行う。撮像装置412−1乃至撮像装置412−Mは、それぞれ、撮像部112(撮像部112−1乃至撮像部112−M)を有し、投影面(投影部111が投影した投影画像)の撮像を行う。
投影装置411−1乃至投影装置411−Nを互いに区別して説明する必要が無い場合、投影装置411と称する。撮像装置412−1乃至撮像装置412−Mを互いに区別して説明する必要が無い場合、撮像装置412と称する。
各投影装置411並びに各撮像装置412は、それぞれ制御装置101と通信可能に接続されており、有線通信または無線通信またはその両方により制御装置101と通信を行う(情報を授受する)ことができる。なお、各投影装置411並びに各撮像装置412が、制御装置101を介して、他の投影装置411若しくは他の撮像装置412またはその両方と通信を行うことができるようにしてもよい。
また、各装置の数、筐体の形状や大きさ、配置位置等は任意である。また、図22のAの例のように、各装置が、ネットワーク401等のような他の設備(装置や伝送路)を介して互いに通信可能に接続されるようにしてもよい。
このような構成の投影撮像システム410の場合も、投影撮像システム100の場合と同様に本技術を適用することができ、上述した作用効果を奏することができる。
また、例えば図23のAに示される投影撮像システム420のように、制御装置101を省略するようにしてもよい。図23のAに示されるように、投影撮像システム420は、投影撮像装置421−1乃至投影撮像装置421−N(Nは任意の自然数)を有する。投影撮像装置421−1乃至投影撮像装置421−Nを互いに区別して説明する必要が無い場合、投影撮像装置421と称する。各投影撮像装置421は、通信ケーブル422を介して互いに通信可能に接続されている。なお、各投影撮像装置421が無線通信によって互いに通信可能に接続されるようにしてもよい。
投影撮像装置421−1乃至投影撮像装置421−Nは、それぞれ、制御部423−1乃至制御部423−Nを有する。制御部423−1乃至制御部423−Nを互いに区別して説明する必要が無い場合、制御部423と称する。制御部423は、制御装置101と同様の機能を有し、同様の処理を行うことができる。
つまり、この投影撮像システム420の場合、上述した制御装置101において行われる処理が、投影撮像装置421(の制御部423)において実行される。なお、いずれかの投影撮像装置421(の制御部423)が、制御装置101において行われる処理の全てを実行するようにしてもよいし、複数の投影撮像装置421(の制御部423)が、情報を授受し合う等して協働して処理を実行するようにしてもよい。
このような構成の投影撮像システム420の場合も、投影撮像システム100の場合と同様に本技術を適用することができ、上述した作用効果を奏することができる。
また、例えば図23のBに示されるように、投影撮像システム100が1つの装置として構成されるようにしてもよい。図23のBに示される投影撮像装置430は、投影部111(投影部111−1乃至投影部111−N(Nは任意の自然数))、撮像部112(撮像部112−1乃至撮像部112−M(Mは任意の自然数))、並びに、制御部423を有する。
投影撮像装置430において、制御部423は、上述した制御装置101において行われる処理を実行することにより、各投影部111並びに各撮像部112を制御して姿勢推定等を行う。
したがって、このような構成の投影撮像装置430の場合も、投影撮像システム100の場合と同様に本技術を適用することができ、上述した作用効果を奏することができる。
<5.その他>
<本技術の適用例>
上述した実施形態に係るシステムや装置は、任意のシステムや電子機器に応用され得る。また、本技術は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野の画像処理システムや画像処理装置に適用することができる。
<本技術の適用例>
上述した実施形態に係るシステムや装置は、任意のシステムや電子機器に応用され得る。また、本技術は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野の画像処理システムや画像処理装置に適用することができる。
例えば、本技術は、鑑賞の用に供される画像を投影・撮像するシステムにも適用することができる。また、例えば、本技術は、交通の用に供されるシステムにも適用することができる。さらに、例えば、本技術は、セキュリティの用に供されるシステムにも適用することができる。また、例えば、本技術は、スポーツの用に供されるシステムにも適用することができる。さらに、例えば、本技術は、農業の用に供されるシステムにも適用することができる。また、例えば、本技術は、畜産業の用に供されるシステムにも適用することができる。さらに、本技術は、例えば火山、森林、海洋等の自然の状態を監視するシステムや、例えば天気、気温、湿度、風速、日照時間等を観測する気象観測システムや、例えば鳥類、魚類、ハ虫類、両生類、哺乳類、昆虫、植物等の野生生物の生態を観測するシステム等にも適用することができる。
<ソフトウェア>
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
例えば図11の制御装置101の場合、この記録媒体は、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されているリムーバブルメディア141により構成される。その場合、例えば、リムーバブルメディア141をドライブ135に装着することにより、そのリムーバブルメディア141に記憶されているこのプログラムを読み出させ、記憶部133にインストールさせることができる。
また例えば図13の投影撮像装置102の場合、この記録媒体は、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されているリムーバブルメディア221により構成される。その場合、例えば、リムーバブルメディア221をドライブ215に装着することにより、そのリムーバブルメディア221に記憶されているこのプログラムを読み出させ、記憶部213にインストールさせることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。例えば図11の制御装置101の場合、プログラムは、通信部134で受信し、記憶部133にインストールすることができる。また、例えば図13の投影撮像装置102の場合、プログラムは、通信部214で受信し、記憶部213にインストールすることができる。
その他、このプログラムは、記憶部やROM等に、予めインストールしておくこともできる。例えば図11の制御装置101の場合、プログラムは、記憶部133やROM122等に予めインストールしておくこともできる。また、例えば図13の投影撮像装置102の場合、プログラムは、記憶部213や制御部201に内蔵されるROM(図示せず)等に予めインストールしておくこともできる。
なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。
また、上述した各ステップの処理は、上述した各装置、または、上述した各装置以外の任意の装置において、実行することができる。その場合、その処理を実行する装置が、上述した、その処理を実行するのに必要な機能(機能ブロック等)を有するようにすればよい。また、処理に必要な情報を、適宜、その装置に伝送するようにすればよい。
<その他>
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、例えば、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
また、例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、例えば、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本技術は、装置やシステムとして実施するだけでなく、装置またはシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI(Large Scale Integration)等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等(すなわち、装置の一部の構成)として実施することもできる。
なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。
なお、本技術は以下のような構成も取ることができる。
(1) 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価する類似度評価部と、
前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する姿勢設定部と
を備える画像処理装置。
(2) 前記姿勢設定部は、前記類似度評価部により前記類似度が最適となると評価された前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)に記載の画像処理装置。
(3) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の絶対値の差の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)または(2)に記載の画像処理装置。
(4) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の差の2乗の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(3)のいずれかに記載の画像処理装置。
(5) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(4)のいずれかに記載の画像処理装置。
(6) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、ゼロ平均正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(5)のいずれかに記載の画像処理装置。
(7) 前記類似度評価部は、前記投影部若しくは前記撮像部、またはその両方の仮想の姿勢を設定し、前記仮想の姿勢において得られる前記シミュレーション画像を生成し、前記撮像画像と前記シミュレーション画像との類似度を評価する
(1)乃至(6)のいずれかに記載の画像処理装置。
(8) 前記類似度評価部は、前記シミュレーション画像を、輝度値または所定の色成分で生成する
(1)乃至(7)のいずれかに記載の画像処理装置。
(9) 前記類似度評価部は、前記撮像画像の縮小画像と前記シミュレーション画像との類似度を評価する
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 前記類似度評価部は、前記撮像画像の、処理対象とする所定の範囲の部分画像について、前記シミュレーション画像との類似度を評価する
(1)乃至(9)のいずれかに記載の画像処理装置。
(11) 前記類似度評価部は、前記類似度の評価を複数回繰り返す
(1)乃至(10)のいずれかに記載の画像処理装置。
(12) 前記類似度評価部は、前記撮像画像の解像度、または、前記撮像画像内の処理対象とする部分画像の範囲を可変として各回の前記類似度の評価を行う
(1)乃至(11)のいずれかに記載の画像処理装置。
(13) 前記撮像画像と前記シミュレーション画像との間で対応点を求め、前記撮像画像と前記シミュレーション画像との間の前記対応点の距離を評価する対応点距離評価部をさらに備える
(1)乃至(12)のいずれかに記載の画像処理装置。
(14) 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との両方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果と、前記類似度評価部による前記類似度の評価結果との両方に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(13)のいずれかに記載の画像処理装置。
(15) 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との内のいずれか一方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果、または、前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(14)のいずれかに記載の画像処理装置。
(16) 前記類似度評価部は、複数の投影部と複数の撮像部とのそれぞれの間で、前記撮像画像と前記シミュレーション画像との類似度を評価し、
前記姿勢設定部は、前記類似度評価部による各投影部と各撮像部との間の前記類似度の評価結果に基づいて、前記複数の投影部若しくは前記複数の撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(15)のいずれかに記載の画像処理装置。
(17) 前記姿勢設定部により設定された姿勢に基づいて、投影画像の幾何補正に関する設定を行う設定部をさらに備える
(1)乃至(16)のいずれかに記載の画像処理装置。
(18) 投影画像を投影する投影部をさらに備える
(1)乃至(17)のいずれかに記載の画像処理装置。
(19) 投影画像を撮像して撮像画像を得る撮像部をさらに備える
(1)乃至(18)のいずれかに記載の画像処理装置。
(20) 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、
前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を設定する
画像処理方法。
(1) 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価する類似度評価部と、
前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する姿勢設定部と
を備える画像処理装置。
(2) 前記姿勢設定部は、前記類似度評価部により前記類似度が最適となると評価された前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)に記載の画像処理装置。
(3) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の絶対値の差の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)または(2)に記載の画像処理装置。
(4) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の差の2乗の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(3)のいずれかに記載の画像処理装置。
(5) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(4)のいずれかに記載の画像処理装置。
(6) 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、ゼロ平均正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(5)のいずれかに記載の画像処理装置。
(7) 前記類似度評価部は、前記投影部若しくは前記撮像部、またはその両方の仮想の姿勢を設定し、前記仮想の姿勢において得られる前記シミュレーション画像を生成し、前記撮像画像と前記シミュレーション画像との類似度を評価する
(1)乃至(6)のいずれかに記載の画像処理装置。
(8) 前記類似度評価部は、前記シミュレーション画像を、輝度値または所定の色成分で生成する
(1)乃至(7)のいずれかに記載の画像処理装置。
(9) 前記類似度評価部は、前記撮像画像の縮小画像と前記シミュレーション画像との類似度を評価する
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 前記類似度評価部は、前記撮像画像の、処理対象とする所定の範囲の部分画像について、前記シミュレーション画像との類似度を評価する
(1)乃至(9)のいずれかに記載の画像処理装置。
(11) 前記類似度評価部は、前記類似度の評価を複数回繰り返す
(1)乃至(10)のいずれかに記載の画像処理装置。
(12) 前記類似度評価部は、前記撮像画像の解像度、または、前記撮像画像内の処理対象とする部分画像の範囲を可変として各回の前記類似度の評価を行う
(1)乃至(11)のいずれかに記載の画像処理装置。
(13) 前記撮像画像と前記シミュレーション画像との間で対応点を求め、前記撮像画像と前記シミュレーション画像との間の前記対応点の距離を評価する対応点距離評価部をさらに備える
(1)乃至(12)のいずれかに記載の画像処理装置。
(14) 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との両方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果と、前記類似度評価部による前記類似度の評価結果との両方に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(13)のいずれかに記載の画像処理装置。
(15) 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との内のいずれか一方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果、または、前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(14)のいずれかに記載の画像処理装置。
(16) 前記類似度評価部は、複数の投影部と複数の撮像部とのそれぞれの間で、前記撮像画像と前記シミュレーション画像との類似度を評価し、
前記姿勢設定部は、前記類似度評価部による各投影部と各撮像部との間の前記類似度の評価結果に基づいて、前記複数の投影部若しくは前記複数の撮像部、またはその両方の姿勢を推定結果として設定する
(1)乃至(15)のいずれかに記載の画像処理装置。
(17) 前記姿勢設定部により設定された姿勢に基づいて、投影画像の幾何補正に関する設定を行う設定部をさらに備える
(1)乃至(16)のいずれかに記載の画像処理装置。
(18) 投影画像を投影する投影部をさらに備える
(1)乃至(17)のいずれかに記載の画像処理装置。
(19) 投影画像を撮像して撮像画像を得る撮像部をさらに備える
(1)乃至(18)のいずれかに記載の画像処理装置。
(20) 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、
前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を設定する
画像処理方法。
100 投影撮像システム, 101 制御装置, 102 投影撮像装置, 111 投影部, 112 撮像部, 151 投影処理部, 152 投影制御部, 153 撮像制御部, 154 姿勢推定部, 155 設定部, 161 類似度評価部, 162 姿勢設定部, 171 仮想姿勢設定部, 172 シミュレーション画像生成部, 173 画像類似度評価部, 201 制御部, 301 対応点距離評価部, 400 投影撮像システム, 401 ネットワーク, 410 投影撮像システム, 411 投影装置, 412 撮像装置, 420 投影撮像システム, 421 投影撮像装置, 423 制御部, 430 投影撮像装置
Claims (20)
- 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価する類似度評価部と、
前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する姿勢設定部と
を備える画像処理装置。 - 前記姿勢設定部は、前記類似度評価部により前記類似度が最適となると評価された前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項1に記載の画像処理装置。 - 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の絶対値の差の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項2に記載の画像処理装置。 - 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、各画素の輝度値の差の2乗の総和を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最小となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項2に記載の画像処理装置。 - 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項2に記載の画像処理装置。 - 前記類似度評価部は、前記シミュレーション画像と前記撮像画像との間の、ゼロ平均正規化相互相関を、前記類似度を示す評価値として求め、
前記姿勢設定部は、前記評価値が最大となる前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項2に記載の画像処理装置。 - 前記類似度評価部は、前記投影部若しくは前記撮像部、またはその両方の仮想の姿勢を設定し、前記仮想の姿勢において得られる前記シミュレーション画像を生成し、前記撮像画像と前記シミュレーション画像との類似度を評価する
請求項1に記載の画像処理装置。 - 前記類似度評価部は、前記シミュレーション画像を、輝度値または所定の色成分で生成する
請求項7に記載の画像処理装置。 - 前記類似度評価部は、前記撮像画像の縮小画像と前記シミュレーション画像との類似度を評価する
請求項1に記載の画像処理装置。 - 前記類似度評価部は、前記撮像画像の、処理対象とする所定の範囲の部分画像について、前記シミュレーション画像との類似度を評価する
請求項1に記載の画像処理装置。 - 前記類似度評価部は、前記類似度の評価を複数回繰り返す
請求項1に記載の画像処理装置。 - 前記類似度評価部は、前記撮像画像の解像度、または、前記撮像画像内の処理対象とする部分画像の範囲を可変として各回の前記類似度の評価を行う
請求項11に記載の画像処理装置。 - 前記撮像画像と前記シミュレーション画像との間で対応点を求め、前記撮像画像と前記シミュレーション画像との間の前記対応点の距離を評価する対応点距離評価部をさらに備える
請求項1に記載の画像処理装置。 - 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との両方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果と、前記類似度評価部による前記類似度の評価結果との両方に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項13に記載の画像処理装置。 - 前記対応点距離評価部による前記対応点の距離の評価と、前記類似度評価部による前記類似度の評価との内のいずれか一方を行い、
前記姿勢設定部は、前記対応点距離評価部による前記対応点の距離の評価結果、または、前記類似度評価部による前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を推定結果として設定する
請求項13に記載の画像処理装置。 - 前記類似度評価部は、複数の投影部と複数の撮像部とのそれぞれの間で、前記撮像画像と前記シミュレーション画像との類似度を評価し、
前記姿勢設定部は、前記類似度評価部による各投影部と各撮像部との間の前記類似度の評価結果に基づいて、前記複数の投影部若しくは前記複数の撮像部、またはその両方の姿勢を推定結果として設定する
請求項1に記載の画像処理装置。 - 前記姿勢設定部により設定された姿勢に基づいて、投影画像の幾何補正に関する設定を行う設定部をさらに備える
請求項1に記載の画像処理装置。 - 投影画像を投影する投影部をさらに備える
請求項1に記載の画像処理装置。 - 投影画像を撮像して撮像画像を得る撮像部をさらに備える
請求項1に記載の画像処理装置。 - 投影部により投影された投影画像を撮像部が撮像して得た撮像画像と、前記投影部により投影された投影画像を前記撮像部が撮像することにより得られる撮像画像をシミュレートしたシミュレーション画像との類似度を評価し、
前記類似度の評価結果に基づいて、前記投影部若しくは前記撮像部、またはその両方の姿勢を設定する
画像処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016059980 | 2016-03-24 | ||
JP2016059980 | 2016-03-24 | ||
PCT/JP2017/009671 WO2017163928A1 (ja) | 2016-03-24 | 2017-03-10 | 画像処理装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017163928A1 JPWO2017163928A1 (ja) | 2019-01-31 |
JP6891873B2 true JP6891873B2 (ja) | 2021-06-18 |
Family
ID=59900157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018507216A Active JP6891873B2 (ja) | 2016-03-24 | 2017-03-10 | 画像処理装置および方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10872434B2 (ja) |
JP (1) | JP6891873B2 (ja) |
CN (1) | CN108781267B (ja) |
WO (1) | WO2017163928A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10540562B1 (en) * | 2016-12-14 | 2020-01-21 | Revenue Management Solutions, Llc | System and method for dynamic thresholding for multiple result image cross correlation |
US20200021787A1 (en) * | 2017-03-23 | 2020-01-16 | Sony Corporation | Projector, projection method, image processing system, and method |
CN107734271B (zh) * | 2017-10-16 | 2019-09-06 | 深圳市未来媒体技术研究院 | 高动态范围十亿像素视频生成方法 |
JP2019154002A (ja) * | 2018-03-06 | 2019-09-12 | キヤノン株式会社 | 制御装置およびその制御方法、投写装置および投写システム |
CN109459873A (zh) * | 2018-11-12 | 2019-03-12 | 广州小鹏汽车科技有限公司 | 一种测试方法、装置、自动测试系统及存储介质 |
CN109615187B (zh) * | 2018-11-20 | 2023-06-02 | 创新先进技术有限公司 | 一种od矩阵的评估方法、公交负载模拟方法及装置 |
US11146765B2 (en) * | 2019-12-20 | 2021-10-12 | Everseen Limited | System and method for displaying video data in a target environment |
CN111010556B (zh) | 2019-12-27 | 2022-02-11 | 成都极米科技股份有限公司 | 投影双向热失焦补偿的方法、装置及可读存储介质 |
CN112991179B (zh) * | 2021-03-25 | 2023-06-27 | 北京百度网讯科技有限公司 | 用于输出信息的方法、装置、设备以及存储介质 |
JP2022185342A (ja) * | 2021-06-02 | 2022-12-14 | セイコーエプソン株式会社 | プロジェクターおよびプロジェクターの制御方法 |
CN113705455B (zh) * | 2021-08-30 | 2024-03-19 | 平安银行股份有限公司 | 身份核查方法、装置、电子设备及可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7133083B2 (en) * | 2001-12-07 | 2006-11-07 | University Of Kentucky Research Foundation | Dynamic shadow removal from front projection displays |
US8066384B2 (en) * | 2004-08-18 | 2011-11-29 | Klip Collective, Inc. | Image projection kit and method and system of distributing image content for use with the same |
JP3925521B2 (ja) * | 2004-08-19 | 2007-06-06 | セイコーエプソン株式会社 | スクリーンの一部の辺を用いたキーストーン補正 |
DE102005037841B4 (de) * | 2005-08-04 | 2010-08-12 | Gesellschaft zur Förderung angewandter Informatik e.V. | Verfahren und Anordnung zur Bestimmung der relativen Lage eines ersten Objektes bezüglich eines zweiten Objektes, sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium |
JP4148281B2 (ja) * | 2006-06-19 | 2008-09-10 | ソニー株式会社 | モーションキャプチャ装置及びモーションキャプチャ方法、並びにモーションキャプチャプログラム |
US20080007700A1 (en) * | 2006-07-10 | 2008-01-10 | Vanbaar Jeroen | Method and system for aligning an array of rear-projectors |
US8315356B2 (en) * | 2010-09-17 | 2012-11-20 | Accuray Incorporated | Image alignment |
JP5924862B2 (ja) * | 2010-12-15 | 2016-05-25 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP6228469B2 (ja) * | 2014-01-20 | 2017-11-08 | 株式会社東芝 | 画像処理装置、画像処理方法、および画像投影装置 |
JP2016014720A (ja) * | 2014-07-01 | 2016-01-28 | ソニー株式会社 | 情報処理装置および方法 |
-
2017
- 2017-03-10 WO PCT/JP2017/009671 patent/WO2017163928A1/ja active Application Filing
- 2017-03-10 US US16/085,707 patent/US10872434B2/en active Active
- 2017-03-10 CN CN201780017817.1A patent/CN108781267B/zh not_active Expired - Fee Related
- 2017-03-10 JP JP2018507216A patent/JP6891873B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2017163928A1 (ja) | 2017-09-28 |
JPWO2017163928A1 (ja) | 2019-01-31 |
US10872434B2 (en) | 2020-12-22 |
US20190122383A1 (en) | 2019-04-25 |
CN108781267A (zh) | 2018-11-09 |
CN108781267B (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6891873B2 (ja) | 画像処理装置および方法 | |
KR101192893B1 (ko) | 촬영 장치, 컴퓨터 판독 가능한 기록 매체, 및 제어 방법 | |
JP5035372B2 (ja) | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム | |
JP5158223B2 (ja) | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム | |
JP5024410B2 (ja) | 三次元モデリング装置、三次元モデリング方法、ならびに、プログラム | |
JP5882455B2 (ja) | 高解像度マルチスペクトル画像キャプチャ | |
JP7074052B2 (ja) | 画像処理装置および方法 | |
WO2014083721A1 (ja) | 情報処理装置および情報処理方法 | |
JP2017531976A (ja) | アレイカメラを動的に較正するためのシステム及び方法 | |
RU2603357C2 (ru) | Устройство обработки изображений и способ управления устройством обработки изображений | |
JP6521626B2 (ja) | 被写体追跡装置、方法およびプログラム | |
CN108781268B (zh) | 图像处理装置和方法 | |
JP2013025649A (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP7243623B2 (ja) | 画像処理装置および方法 | |
JP7040511B2 (ja) | 情報処理装置および方法 | |
JP7451465B2 (ja) | 学習方法、プログラム及び画像処理装置 | |
CN115867861A (zh) | 信息处理装置和方法 | |
JP2017215851A (ja) | 画像処理装置および画像処理方法、造形システム | |
JP6478492B2 (ja) | 画像処理装置およびその方法 | |
JP2021093694A (ja) | 情報処理装置およびその制御方法 | |
JP6459745B2 (ja) | 自己位置算出装置及び自己位置算出方法 | |
WO2022014148A1 (ja) | 画像処理方法、プログラム、画像処理装置、学習済みモデルの製造方法、および、画像処理システム | |
JP2013157729A (ja) | 画像処理装置、撮像装置及び画像処理方法 | |
KR20240068029A (ko) | 기계 학습 모델을 이용하여 영상을 획득하는 전자 장치 및 그 동작 방법 | |
JP2022142532A (ja) | 学習方法、プログラム及び画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210427 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210510 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6891873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |