[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2017103564A - 制御装置、制御方法、およびプログラム - Google Patents

制御装置、制御方法、およびプログラム Download PDF

Info

Publication number
JP2017103564A
JP2017103564A JP2015234267A JP2015234267A JP2017103564A JP 2017103564 A JP2017103564 A JP 2017103564A JP 2015234267 A JP2015234267 A JP 2015234267A JP 2015234267 A JP2015234267 A JP 2015234267A JP 2017103564 A JP2017103564 A JP 2017103564A
Authority
JP
Japan
Prior art keywords
image
frame
distance image
frame rate
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015234267A
Other languages
English (en)
Other versions
JP6622575B2 (ja
Inventor
智一 佐藤
Tomokazu Sato
智一 佐藤
正輝 北郷
Masateru Kitago
正輝 北郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015234267A priority Critical patent/JP6622575B2/ja
Publication of JP2017103564A publication Critical patent/JP2017103564A/ja
Application granted granted Critical
Publication of JP6622575B2 publication Critical patent/JP6622575B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 3次元形状を生成するために取得する動画のフレームレートを被写体に応じて適切に制御する。【解決手段】 被写体の距離画像を生成するための動画を撮像する撮像装置からフレームを取得し、動画の出力を制御する制御装置であって、前記撮像装置が撮像した動画を構成するフレームに対応する距離画像を取得する取得手段と、前記距離画像に基づいて、前記距離画像における被写体の形状の複雑度を算出する算出手段と、前記複雑度に応じて、出力する動画のフレームレートを決定する決定手段と、前記決定手段が取得したフレームレートに従って前記撮像装置が撮像した動画からフレームを取得し、前記フレームレートの動画を生成する生成手段とを有する。【選択図】 図1

Description

本発明は、カメラで撮影した複数枚の画像を用いて被写体の3次元形状を生成ための撮影を制御する技術に関する。
従来、被写体に対して視点の異なる複数枚の画像を取得し、撮影した画像から被写体の3次元形状を復元する技術(Structure from motion)が知られている。被写体の三次元形状を動画として生成するためには、被写体に対して視点の異なる複数の画像を連続的に撮影する必要がある。そこで、被写体に対して動画を撮影した結果に基づいて、被写体の3次元形状を生成する技術がある。ただし、3次元形状を生成するために撮影する動画のフレームレートは、3次元形状の生成精度とのトレードオフを考えなければならない。動画のフレームレートが高い(取得できる画像の枚数が多い)ほど、3次元形状の生成精度は上がる。一方、データ量や処理負荷は増大する。データ量や処理負荷を優先して、フレームレートを下げる(取得する画像の枚数を減らす)と、3次元形状を生成するために必要な情報が欠落してしまう場合がある。
特許文献1には、車載カメラから撮影した動画から自動車から見える被写体の3次元情報を取得する方法において、動的に動画のフレームレートを制御する方法を開示している。具体的には、車両の速度や視野変化量などに基づいて衝突の危険があると判定された場合には、高フレームレートで動画を撮影し、それ以外の場合は低フレームレートで動画を撮影する。これにより、状況把握に必要な情報を確保しながら、保存するデータ量を削減している。
特開2010−273178号公報
しかしながら特許文献1に開示された方法では、適切にフレームレートを制御できない場合がある。低フレームレートの動画でも3次元形状を生成できる被写体を高フレームレートで動画を撮影してしまったり、高フレームレートで撮影しなければ3次元形状を生成できない被写体に対いて低フレームレートで動画を撮影してしまったりすることがある。
そこで本発明は、3次元形状を生成するために取得する動画のフレームレートを被写体に応じて適切に制御することを目的とする。
上記課題を解決するため本発明は、被写体の距離画像を生成するための動画を撮像する撮像装置からフレームを取得し、動画の出力を制御する制御装置であって、前記撮像装置が撮像した動画を構成するフレームに対応する距離画像を取得する取得手段と、前記距離画像に基づいて、前記距離画像における被写体の形状の複雑度を算出する算出手段と、
前記複雑度に応じて、出力する動画のフレームレートを決定する決定手段と、前記決定手段が取得したフレームレートに従って前記撮像装置が撮像した動画からフレームを取得し、前記フレームレートの動画を生成する生成手段とを有することを特徴とする。
本発明の効果は、3次元形状を生成するために取得する動画のフレームレートを被写体に応じて適切に制御することができる。
第1の実施形態の3次元形状生成を行う撮影制御装置のブロック図 第1の実施形態の被写体の撮影処理のフローチャート 第1の実施形態の形状生成のフローチャート 第1の実施形態の複雑度算出処理及びフレームレート算出処理のフローチャート 並進移動しながら平面を撮影するカメラ カメラの撮影範囲を表す図 凹凸のある平面を撮影するカメラとオクルージョンの様子 凹凸のある平面を撮影するカメラとオクルージョンの様子の詳細 符号化におけるGOPの構成 コンピュータのブロック構成図 第2の実施形態の3次元形状生成を行う撮影制御装置のブロック図 第2の実施形態の3次元形状生成を行う撮影制御装置のフローチャート 凹領域を検出するためのフィルタの一例を示す図
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下の実施形態において示す各構成は、一例にすぎず、本発明は図示された構成に限定されるものではない。
[第1の実施形態]
第1の実施形態では、被写体に対してカメラを一定の速度で並進移動させながら動画を撮影し、撮影した動画のうち少なくとも一部をストレージに記録する。撮影した動画に基づいて、撮影したシーンにおける距離画像を生成し、距離画像に基づいてシーンに含まれる被写体の3次元形状を生成する。特に本実施形態では、動画撮影時に簡易的に算出したシーンの距離画像に基づいて、動的に取得する動画のフレームレートを制御する。なお、本実施形態において動画とは、連続した時刻で撮影された複数の画像をフレームとした画像列を意味する。具体的なユースケースとしては、ゴンドラにカメラを載せてビルの壁面を撮影したり、車にカメラを積んで道路を撮影したりするなど、様々な用途が考えられる。
図1は、第1の実施形態に適用可能な撮像装置109と撮像装置109から得られたカラー画像を利用して3次元形状を生成する画像処理装置112のブロック図である。本実施形態において撮像装置109は、多視点撮影が可能なカメラである。具体的には、プレノプティックカメラを用いる。プレノプティックカメラは、撮像センサの前にマイクロレンズアレイを設置することで入射光を分離し、同時に多視点画像を撮影できるカメラである。なお、多視点撮影が可能なカメラとしては、複数の撮像部が配置された多眼カメラを用いてもよい。撮像部111は、撮像センサやマイクロレンズアレイなど光学系である。さらに撮像装置109には、撮像部111が撮像して得られる画像に対して、各種処理やフレームレートを制御する制御装置110が内蔵されている。一方画像処理装置112は、撮像装置109とは異なる装置であり、撮像装置109から取得したデータに基づいて画像処理を行い、3次元形状を生成する。画像処理装置112としては、例えばパーソナルコンピュータなどにより実現される。
まず、撮像装置109について説明する。撮像部111は、動画撮影開始の指示を受けて、所定のフレームレートで被写体を動画撮影する。なおここでは、レッド(R),ブルー(B),グリーン(G)からなるカラーのデジタル画像によって構成された動画を撮影する。また、多視点で画像を取得できるため、実質的には互いに異なる視点からの複数の動画を取得していることになる。多視点画像取得部101は、撮像部111から動画を構成する各フレームの画像を順次、取得する。また、多視点画像取得部101は、フレームレート決定部103から入力されるフレームレートに従って、撮像部111が取得した動画から一部のフレームを取得し、距離画像生成部102及び単視点画像生成部104に出力する。
距離画像生成部102は、取得した多視点画像から距離画像を生成する。距離画像とは、画素単位でカメラ位置から被写体までの距離を表す距離情報を格納した画像である。距離情報は、メートル単位系で表わされる距離そのものでもよいし、視差などの距離に変換可能な値であってもよい。距離画像生成部102は、取得した動画のうち、同時刻に撮影された複数の互いに異なる視点の画像(フレーム)から、1つの距離画像を生成する。ここでは、例えばステレオマッチングによる視差推定を行い視差画像(ディスパリティマップ)を、距離画像として生成する。なおここで算出した距離画像を、第一の距離画像とする。距離画像生成部102は、距離画像をフレームレート決定部103に出力する。
フレームレート決定部103は、距離画像から被写体の複雑度を算出する。被写体の複雑度とは、カメラから撮影可能な被写体領域において、被写体の形状の複雑さを表す指標である。フレームレート決定部103は、被写体の複雑度に応じて、多視点画像取得部101が取得すべき動画のフレームレートを決定する。複雑度及びフレームレートの算出処理については後述する。
単視点画像生成部104は、取得した動画において、対応するフレームである互いに視点の異なる複数の画像から単視点の画像を順に生成し、符号化画像ストレージ106に出力する。ここでは、単視点画像生成部104は、同時刻に対応する視点の異なる複数の画像を、対応する画素毎に画素値を平均した値を算出することにより、単視点画像を生成する。単視点画像生成部104が生成する単視点画像も、多視点画像同様、RGBからなるカラー画像である。単視点画像生成部104は、動画を構成する複数のフレームから順に、単視点画像を生成し、出力されるため、単視点画像生成部104から出力される画像は、単視点における動画を構成する画像(フレーム)列とも言える。さらに単視点画像生成部104から出力される動画は、被写体の形状に応じて動的にフレームレートが変更された動画である。ここで生成された単視点画像は、後段の3次元形状生成処理に利用される。なお、単視点画像の生成方法は、複数の多視点画像から1視点の画像を選ぶ方法でもよいし、多視点画像における各画素の画素値の平均ではなく、各画像の画素値の和を単視点画像における画素値として算出する方法を取ってもよい。
画像符号化部105は、単視点画像生成部104から出力される単視点画像を順次、所定の符号化方式により符号化し、符号化画像ストレージ106へ送る。ここでは、前述の通り多視点画像生成部104からは単視点画像をフレームとして順に出力されるため、フレーム間の時間相関を利用するH.264を用いて符号化する。なお、符号化方法は前記単視点カラー画像を効率的に符号化できるものであれよく、例えば各単視点画像を独立にJPEGを用いて符号化してもよい。
次に、画像処理装置112を説明する。画像復号部107は、符号化画像ストレージ106から符号化されたデータを取得し、復号し、単視点の動画を出力する。3次元形状生成部108は入力された複数の単視点画像から距離画像を生成する。前述の通り、撮像装置109は、一定の速度で並進移動しているため、複数の単視点画像は、撮影した時刻は異なるものの互いに異なる視点から撮影した画像とみなすことができる。そこで3次元形状生成部108は、カメラが移動したことにより撮影された多視点画像を用いて、距離画像を生成する。なおここで算出された距離画像は、第二の距離画像とする。さらに、第二の距離画像に基づいて、被写体の3次元形状を生成する。
次に、撮像装置109における処理の流れについて説明する。図2は、撮像装置109を実現するための処理フローを示す。ステップS201において多視点画像取得部101は、撮像部111から撮像部111が撮影した被写体の動画から着目するフレームの画像を取得する。ここで取得する画像は、同時刻に異なる複数の視点から撮影した多視点画像である。ステップS202において距離画像生成102は、同時刻に撮影された互いに視点の異なる複数の画像に基づいて、距離画像を生成する。
ステップS203においてフレームレート決定部103は、距離画像から被写体の複雑度を算出する。ステップS204においてフレームレート決定部104は、被写体の複雑度に応じて次に距離画像を生成するまで間に取得すべき多視点画像のフレーム数Mを算出する。これは、多視点画像のフレームレートが距離画像のフレームレートのM倍であることを意味する。なお、ステップS203とステップS204の詳細な説明は後述する。ステップS205において単視点画像生成部104は、互いに視点の異なる複数の画像から1つの単視点画像を生成する。
ステップS206において画像符号化部105は、単視点画像を符号化し、符号化画像ストレージ106へ出力する。本実施形態では、撮像装置109が出力する動画のフレームレートが動的に変化することを鑑みて、以下のように符号化を行う。上述したように、距離画像はすべてのフレーム画像に対して算出されるのではなく、時間的に一定のフレーム周期で生成される。距離画像は、取得したカラーの多視点画像から生成される一方、全てのフレームの多視点画像から単視点画像が生成されている。そのため、必ず距離画像と同じ時刻に対応するカラーの単視点画像が存在し、かつ距離画像が対応する時刻間でフレーム数が変動する。そこで、距離画像が生成されるタイミングで、動画の符号化単位であるGOP(Group Of Picture)を区切り、距離画像と同時刻に対応する単視点画像を、GOPのIフレーム(先頭フレーム)とする。この時、GOPを構成するフレーム数はIフレームを入れてMとなる。GOPの様子を図9に示す。図9において、単視点画像のI、P、BはそれぞれH.264符号化のIフレーム、Pフレーム、Bフレームを表している。通常、動画のフレームレートは、シーケンスレイヤのシーケンスヘッダに記述されるが、ここではGOP毎にフレームレートが異なるため、GOPレイヤのGOPヘッダに構成フレーム数Mを記述しておく。また、フレームレートが低下すると、フレーム間の時間相関が低下する。そのためフレーム数Mが所定の閾値を下回ると、同GOP内の全フレームをイントラ符号化する。
ステップS207、ステップS208、ステップS209はそれぞれ、ステップS201、ステップS205、ステップS206と同様の処理である。ステップS207〜ステップS209の処理は、多視点画像が取得されるフレームレートに合わせて、M−1回繰り返される。ステップS210において撮像装置109は、外部から入力される撮影終了信号を確認し、撮影が終了されていれば処理フローを終了し、終了されていなければステップS201に戻る。
さらに、ステップS203およびステップS204の処理の流れを詳細に説明する。図3は、フレームレート決定部103を実現するための処理フローである。なお、ステップS203はステップS302〜S304、ステップS204はステップS305、S306に対応している。
まずステップS301において複雑度nを0により初期化する。ステップS302において、距離画像における測距不能画素の数をnに加算する。測距不能画素とは、距離情報を算出できなかった画素を意味する。距離画像を生成する際、オクルージョン領域など多視点画像のうち1視点の画像にしか撮像されなかった領域は、多視点画像間で対応点を検出することができず、測距不能となる。オクルージョン領域が多い被写体は、その分被写体形状が複雑である可能性が高く、測拒不能画素の数は、被写体形状の複雑度と相関がある。そこで、測拒不能画素数を検出し、複雑度nに加算する。
ステップS303において、距離画像におけるエッジ画素を検出する。エッジ画素の検出には、距離画像に対してソーベルフィルタなどを用いることで実現できる。距離画像のエッジとは、距離が不連続な境界を表すものである。距離画像においてエッジ画素が多いということは、存在位置の異なる被写体が様々存在している、あるいは、被写体自体に、急峻な表面凹凸が多数存在している可能性が高い。このような場合、オクルージョン領域が発生しやすく、被写体が複雑な形状であるとみなすことができる。そこでステップS304において、算出されたエッジ画素の数をカウントし、複雑度nに加算する。
ステップS305において、算出した複雑度nに基づいて、フレームレートFを算出する。まず、3次元形状を生成するために最低限必要なフレームレートFminを、図5を用いて説明する。図5は、平面を被写体として、平面に対してカメラが一定の距離を保って一定の速さで移動しながら撮影する様子を示している。図5においてカメラの位置は撮像した視点を、カメラから延びた破線は各視点位置におけるカメラの画角を表している。運動視差を利用して3次元形状を生成する場合、被写体である表面の全ての位置において、2フレーム以上で撮影されている必要がある。そこで、平面全体が常に2フレームの画角に収まるように撮影した様子を図5(a)に示している。原理的には図5(a)に示した撮像間隔であれば3次元形状を生成することは可能であるが、カメラの光学的性質上、画像端付近では空間解像度が低下することや画角の境界部分で対応点を検出できない場合がある。そこで、図5(b)に示すように平面全体が常に3フレームの画角に収まるように撮像するフレームレートが、安定した3次元形状生成に最低限必要なフレームレートであると設定する。
次に具体的なパラメータを用いて、最低限必要なフレームレートFminを算出する。ここで、カメラと平面の間の距離をL[m]、カメラの移動速度をV[m/s]、カメラの画角をθ[°]とする。図6から(2/3)Ltan(θ/2)[m]に一回の撮像が必要であることが分かるので、撮像周期は(2/3V)Ltan(θ/2)[s]であり、フレームレートFmin[fps]は、式1に従って算出できる。
Fmin=3V/(2Ltan(θ/2)) ・・・式1
ここで、式1のパラメータL、V、θの求め方を説明する。距離Lは距離画像からカメラ被写体間のおおよその値を知ることができる。カメラの運動速度Vは、距離Lと動画符号化で利用される動きベクトルと組み合わせることで推定する。また、カメラの画角θは撮影装置の焦点距離と撮影素子の大きさから取得することができる。以上の通り、撮像装置109の撮像条件や取得した情報に基づいて、フレームレートFminを算出する。なお、事前にパラメータV,L,θを一定に保って撮影を行う環境がある場合は、事前にパラメータを入力して撮影を行ってもよい。
さらに、被写体の形状が複雑な場合には、高フレームレートな画像列を生成することにより被写体の形状を生成するために必要な情報を取得する。例えば、被写体である平面上に図7(a)に示したような凹凸がある場合、図5(b)に示す条件で撮影すると平面の面Bや面C、面E、面Fには1視点のカメラでしか撮像されない領域が存在する。従って面Bや面C、面E、面Fの領域では第二の距離画像を得ることができない。しかし、図7(b)に示すように、被写体に対して一様に高フレームレートな画像列の動画として出力することは無駄が大きい。
そこでステップS305では、プレノプティックカメラで得られた第一の距離画像を利用して算出した被写体の複雑度に応じてフレームレートFを動的に調節する。フレームレートの最低値は、式1に示される最低限必要なフレームレートFminとする。また、最大値は撮影に用いたカメラが撮影可能な最大フレームレートFmaxである。ステップS302からステップS304において算出した複雑度nは、測距不能画素やエッジ画素といった被写体の構造が複雑である部分を表す画素の数を示す。従って複雑度の最大値は、画像全体の画素数Nである。本実施形態ではフレームレートF-を式2に示すように設定する。

ただしP(P≧1)はパラメータであり、ここで求めたFがFmaxを超える場合はF=Fmaxとする。ステップS306において距離画像のフレームレートと撮影している動画のフレームレートFとに基づいて、フレーム数Mを算出する。まず、距離画像のフレームレートをFdとすると、フレーム数Mは、式3に従って算出できる。

本実施形態では、Fd=Fminとする。従って式3は式4のように変形される。

以上で、ステップS203およびステップS204の詳細な説明を終了する。
次に、画像処理装置112が実行する3次元形状生成処理を、図4を用いて説明する。ステップS401において画像復号部107は、符号化されたデータを復号する。復号の結果、動画を構成する画像(フレーム)が得られ、1つの視点が一定の速度で並進移動しながら撮像した動画を取得できる。
ステップS402において3次元形状生成部108は、ステップS401におおいて取得した画像から局所特徴量を抽出し、画像上の対応する特徴量を探索する。さらに対応する特徴量の位置に基づいて、それぞれのフレームにおけるカメラの外部パラメータを推定する。ただし、内部パラメータは予め求められており、全フレームで共通であるものとする。内部パラメータは一般にカメラの焦点距離、画像の原点の位置、レンズ歪みの特性などを表す。外部パラメータはグローバル座標系におけるカメラ姿勢であり、一般的にはカメラのグローバル座標Tと光軸方向Rで表される。また、ここでは局所特徴量として、SIFT(Scale−Invariant Feature Transform)を用いる。なお、特徴量は画像における局所的な対応を探索できる方法であればよく、SURF(Speeded Up Robust Features)やその他の方法を用いてもよい。なおここでは、局所特徴量の計算及び対応点探索に加えて、Ransac(random sample consensus)などを用いて、誤った対応点を除くことが望ましい。
ステップS403において3次元形状生成部108は、推定された内部/外部パラメータに基づいて、局所特徴量が対づいた複数の視点画像の組から視差を推定し、第二の距離画像を生成する。ここで得た第二の距離画像の距離値を、グローバルな座標系に投影し、被写体の表面を表す点群を生成する。ステップS404においてさらに、得られた点群から、被写体の3次元形状モデルを生成する。3次元形状モデルの生成方法は、ドロネー三角形分割など陽的にモデリングする方法を用いても構わないし、ポアソン法など陰的にモデリングする方法を用いても構わない。以上で被写体の3次元形状を生成する処理を完了する。
以上の通り第1の実施形態によれば、被写体の形状に基づいて、距離画像を生成するための動画のフレームレートを制御する。被写体の形状が複雑であることが予測される場合には、高いフレームレートで動画を作成し、それ以外の場合には低いフレームレートで動画を作成する。これにより、距離画像の算出に必要な情報を取得しつつ、保存するデータ量を適切に抑制することができる。
また、第1の実施形態では、同時刻に撮影された複数の視点における画像に基づいて生成される第一の距離画像を用いて、被写体の複雑度を算出した。プレノプティックカメラの基線長は、カメラの絞る幅に依存し、比較的短い。そのため、算出される距離情報の精度は低い。一方、カメラ運動を推定する必要がないため、比較的簡易に距離情報を得ることができる。そこで簡易な方法で生成した第一の距離画像を用いてフレームレートを制御しつつ、3次元形状の生成にはより高精度な運動視差に基づいて算出される第二の距離画像を用いた。これにより、画像処理装置110は多視点画像ではなく単視点画像からなる動画を取得すればよく、撮像装置109からの出力データ量および画像処理装置110が取得する入力データ量を抑えることができる。
また、距離画像を出力可能な撮像装置109には、距離画像における各画素の測距値の正確さを表す信頼度を別途出力する形態の装置もある。この場合、出力される信頼度が小さい画素を測距不能画素として扱ってもよい。さらに、測拒不能画素の数やエッジ画素の数は、それぞれいずれか一方のみに基づいて複雑度を算出してもよい。
さらに、測拒不能画素の数やエッジ画素の数以外の指標を用いて、被写体の複雑度を算出してもよい。測拒不能画素の数やエッジ画素の数以外の指標として、以下に3つの例を説明する。まず、エッジ画素の全てではなく、特定の方向を持ったエッジ領域の画素数に基づいて複雑度を算出してもよい。図8は、被写体とカメラの位置関係を示す図である。図8(a)(b)(c)はそれぞれ、図7の視点706,707,708それぞれの画角に映っている領域を太線で表現している。面Eと面Fの接合部が画角に映っているのは、図8(b)に示す視点707のみである。従って、面Eと面Fの接合部は、第二の距離情報を得ることができない。そこで面Eと面Fを含む凹部を撮影可能な視点707付近では、高いフレームレートで撮影することが望ましい。
面Eと面Fの接合部の特徴として、カメラの運動方向に対してエッジ方向が垂直であることがあげられる。このようなエッジの場合、このエッジを含むように撮影可能な視点位置は少ないため、面Eと面Fの接合部は複雑度を比較的大きい値にするとよい。そこで、カメラの動き方向に基づいて、特定の方向のエッジを構成する画素の数を複雑度として検出する。具体的には、距離画像を取得した直前の単視点画像を符号化した結果得られる動きベクトルから、以降のカメラの運動方向を推定する。符号化方式がH.264を用いている場合の具体的な処理を説明する。H.264ではマクロブロック及びサブブロック単位に動きベクトルが設定され、ブロックによっては動きベクトルが与えられない場合もある。画面全体の動きを得るには、各動きベクトルのブロックサイズに応じた重み付き平均をとればよい。つまり、動きベクトルが設定されたブロックの動きベクトルとそのブロックサイズをそれぞれCi、Siとすると、画面全体の平均動きベクトルMCは、式5に従って算出できる。

式5により得られた平均動きベクトルの方向を利用して、平均動きベクトルと反対に近いエッジ画素のみを検出し、検出した画素数を複雑度に加算する。これにより、カメラの運動方向に応じてオクルージョンが発生しやすい形状について、より適切に複雑度を導出することができる。
なお前述の実施形態において説明した全てのエッジ画素の数を算出することなく、特定の方向のエッジ画素の数のみを複雑度に加算してもよい。全てのエッジ画素を検出する場合、あらゆる方向のエッジを検出するため、少なくとも垂直と水平の2方向に対してフィルタをかける必要がある。これに対して、検出したいエッジ方向が限定されている場合は、その方向に合わせた一回のフィルタリングで十分であるため、検出の処理にかかる演算量を軽減することができる。
次に、凹領域の検出し、複雑度を算出する例を説明する。オクルージョン領域は、被写体自信の凹凸に起因するものであり、特に凹部でオクルージョンが発生しやすい。そこで、距離画像に対して凹部を検出するフィルタ処理を施し、検出した凹部の画素数を複雑度として定義する。凹領域の検出には、フィルタ中心からの距離が遠くなるほど係数が小さくなるようなフィルタを用いる。凹領域の検出に用いるフィルタの例を図13に示す。図13(a)は3画素×3画素の場合、(b)は5画素×5画素の場合である。検出できる凹領域の大きさはフィルタサイズに依存する。例えば、画像上で100×100ピクセルの大きな凹領域に対して、3×3のフィルタを用いても凹領域として検出することはできない。逆に、ピクセル数の小さな凹領域に対してサイズの大きなフィルタを利用しても検出することはできない。この性質を利用して、検出するべき凹みのサイズを決定することができる。また、どの程度の凹みを凹領域と判定するかはフィルタ処理後の値の絶対値に対して閾値を定めて決めることができ、閾値を大きくするほど深い凹みしか検出しなくなる。
さらに、距離画像における分散を算出し、分散に基づいて複雑度を算出してもよい。距離画像における分散が大きい場合、被写体とカメラとの距離が一様ではなく、被写体の形状が複雑であることが予測される。そこで、距離画像における分散の値が大きいほど、複雑度が大きくなるように、分散値と複雑度を対応づけておき、分散に基づいて複雑度を算出してもよい。特に分散のみに基づいて複雑度を算出する場合、複雑度の算出にフィルタ処理を必要としないため、より簡易な構成により実現することができる。なお、エッジ画素の数や測拒不能画素の数などと組み合わせて複雑度を算出する場合は、算出した分散は正規化することが好ましい。
[第1の実施形態の変形例]
図1に示した制御装置111の各部は、撮像装置109に内蔵されたハードウェアで構成しても良いが、撮像装置109の外部装置として、ソフトウェア(コンピュータプログラム)として実装しても良い。この場合、このソフトウェアは、PC(パーソナルコンピュータ)等、一般のコンピュータのメモリにインストールされることになる。そしてこのコンピュータのCPUがこのインストールされたソフトウェアを実行することで、このコンピュータは、上述の撮影部111の制御装置としての機能を実現することになる。第1の実施形態の撮影装置の制御装置に適用可能なコンピュータのハードウェア構成例について、図10のブロック図を用いて説明する。
CPU1001は、RAM1002やROM1003に格納されているコンピュータプログラムやデータを用いて、コンピュータ全体の制御を行うと共に、撮影制御装置が行うものとして説明した上述の各処理を実行する。
RAM1002は、コンピュータ読み取り可能な記憶媒体の一例である。RAM1002は、外部記憶装置1007や記憶媒体ドライブ1008、更にはネットワークインタフェース1010からロードされたコンピュータプログラムやデータを一時的に記憶するためのエリアを、有する。更に、RAM1002は、CPU1001が各種の処理を実行する際に用いるワークエリアを有する。即ち、RAM1002は、各種のエリアを適宜提供することができる。ROM1003は、コンピュータ読み取り可能な記憶媒体の一例であり、コンピュータの設定データや、ブートプログラムなどが格納されている。
キーボード1004、マウス1005は、コンピュータの操作者が操作することで、各種の指示をCPU1001に対して入力することができる。表示装置1006は、CRTや液晶画面などにより構成されており、CPU1001による処理結果を画像や文字などでもって表示することができる。
外部記憶装置1007は、コンピュータ読み取り記憶媒体の一例であり、ハードディスクドライブ装置に代表される大容量情報記憶装置である。外部記憶装置1007には、OS(オペレーティングシステム)や、図1に示した各処理をCPU1001に実現させるためのコンピュータプログラムやデータ、上記の各種テーブル、データベース等が保存されている。外部記憶装置1007に保存されているコンピュータプログラムやデータは、CPU1001による制御に従って適宜RAM1002にロードされ、CPU1001による処理対象となる。
記憶媒体ドライブ1008は、CD−ROMやDVD−ROMなどの記憶媒体に記録されているコンピュータプログラムやデータを読み出し、読み出したコンピュータプログラムやデータを外部記憶装置1007やRAM1002に出力する。なお、外部記憶装置1007に保存されているものとして説明した情報の一部若しくは全部をこの記憶媒体に記録させておき、この記憶媒体ドライブ1008に読み取らせても良い。
I/F1009は、外部からカラー画像、距離画像、等を入力したり、フレームレートを出力したりするためのインタフェースであり、一例として示すのであればUSB(Universal Serial Bus)である。外部装置としては撮像装置109が接続されており、I/F1007を通して、カラー画像や距離画像を出力する。1010は、上述の各部を繋ぐバスである。
上述構成において、本コンピュータの電源がONになると、CPU1001はROM1003に格納されているブートプログラムに従って、外部記憶装置1007からOSをRAM1002にロードする。この結果、キーボード1004、マウス1005を介した情報入力操作が可能となり、表示装置1006にGUIを表示することが可能となる。ユーザが、キーボード1004やマウス1005を操作し、外部記憶装置1007に格納された符号化アプリケーションの起動指示を入力すると、CPU1001はこのプログラムをRAM1002にロードし、実行する。これにより、本コンピュータが撮影制御装置として機能することになる。
なお、CPU1001が実行する符号化アプリケーションプログラムは、図2に示すフローチャートを実現するプログラムである。出力される符号化データは、外部記憶装置1007に保存することになる。なお、このコンピュータは、以降の各実施形態に係る撮影制御装置にも同様に適用可能である。
[第2の実施形態]
第1の実施形態では、プレノプティックカメラを用いて多視点画像を取得する場合を例に説明した。第2の実施形態では、単視点カメラを手に持って撮影する場合を例に説明する。ユースケースとしては、非常に複雑な形状を持った被写体に対して様々なカメラ姿勢で撮影する必要がある場合や、建物の中を巡回しながら内部の3次元形状を生成する等が考えられる。第2の実施形態では、距離画像を取得するため、カラー画像を取得する単視点カメラとは別途、赤外線照射型カメラを用いる。第1の実施形態では距離画像を一定の時間的周期で取得して、出力する単視点画像のフレームレートを制御し、出力する単視点画像のフレームレートは距離画像のフレームレート以上としていた。第2の実施形態では、単視点画像と距離画像は同じフレームレートで同期して取得されるものとし、フレームレート決定部は単視点画像と距離画像の両方のフレームレートを制御する。
図11は、第2の実施形態に適用可能な撮影装置1109と画像処理装置1112の構成を示すブロック図である。以降では、図1と異なる部分を説明する。
単視点画像取得部1101は、フレームレート決定部1105から得られたフレームレートに従って、撮像部1111から単視点画像を順次取得する。ここで取得する単視点画像は、RGBからなる画像データである。単視点画像取得部1101は、単視点画像を画像符号化部1104に出力する。距離画像取得部1102はフレームレート決定部1105から得られたフレームレートに従って、撮像部1111から赤外線画像を取得する。距離画像取得部102は、赤外線画像に基づいて距離画像を生成する。赤外線画像から距離画像を生成する方法は、例えばStructured Light方式や、Time Of Flight(TOF)方式等がある。なお単視点画像取得部1101が取得する単視点画像と、距離画像取得部1102が取得する赤外線画像は、ほぼ同じタイミングで撮像されたもので、フレームレートは対応している。距離画像取得部1102は、距離画像をフレームレート決定部1103及び、画像符号化部1104に出力する。画像符号化部1104は、単視点画像と距離画像の両方を符号化する。赤外線照射型の距離画像は、第1の実施形態の多視点型の距離画像よりも距離の精度がよく、後段の3次元形状の生成に利用できるように符号化した。3次元形状生成部1107は多視点画像と同時に取得された距離画像を利用して、より簡易に3次元形状を生成する。
次に、本実施形態における撮像装置1109が実行する処理のフローを示す。ステップS1201において単視点画像取得部1101と距離画像取得部1102はそれぞれ、同じタイミングの単視点画像及び距離画像を撮像部1111から取得する。ステップS1202において画像符号化部1104は、単視点画像を符号化する。ステップS1203においてフレームレート決定部1103は、距離画像から距離画像に映る被写体の複雑度を算出する。ステップS1204においてフレームレート決定部1103は、次のカラー画像及び距離画像を取得するまでの遅延時間を算出する。これは、フレームレートが1フレーム単位で変化することを意味する。なお、遅延時間の更新は必ずしも1フレーム毎に行われる必要はなく、例えば定数時間毎に一度行ってもよいし、一定フレーム毎に一度の頻度で行ってもよい。ステップS1205において画像符号化部1104は、距離画像を符号化する。ステップS1206において撮像装置1109は、撮影終了信号を確認し、終了であれば処理を終了し、そうでなければステップS1201に戻る。
次に、第2の実施形態における画像処理装置1112について説明する。第2の実施形態における画像処理装置1112は、撮像装置1109から距離画像を取得する。外部パラメータの推定S302は第1の実施形態と同様にカラー画像間の局所特徴量のマッチングにより運動情報を推定することができるが、距離画像から得られる点群同士の位置合わせによって推定することもできる。
被写体の表面を表す密な点群の生成S303は、外部パラメータを用いて第一の距離情報をグローバル座標系に投影することで、点群の生成を簡易に行うことができる。ただしこの時、第一の距離画像からは信頼度の低い点や被写体の素材の問題で距離情報が得られなかった領域の点群を補完するのに、第二の距離情報おw必要な部分のみ生成して用いることも可能である。
以上で本実施形態の説明を終える。以上の構成により、第1の実施形態と同様に被写体の形状の複雑度に応じて動的にフレームレートを制御しながら、被写体の撮影をする。これにより、距離画像の算出に必要な情報を取得しつつ、保存するデータ量を適切に抑制することができる。更に、本実施形態では、第1の実施形態で必要だった被写体表面を表す点群を生成する処理を大幅に削減することができるようになった。
101 多視点画像取得部
102 距離画像生成部
103 フレームレート決定部
104 単視点画像生成部
105 画像符号化部
110 制御装置

Claims (13)

  1. 被写体の距離画像を生成するための動画を撮像する撮像装置からフレームを取得し、動画の出力を制御する制御装置であって、
    前記撮像装置が撮像した動画を構成するフレームに対応する距離画像を取得する取得手段と、
    前記距離画像に基づいて、前記距離画像における被写体の形状の複雑度を算出する算出手段と、
    前記複雑度に応じて、出力する動画のフレームレートを決定する決定手段と、
    前記決定手段が取得したフレームレートに従って前記撮像装置が撮像した動画からフレームを取得し、前記フレームレートの動画を生成する生成手段とを有することを特徴とする制御装置。
  2. 前記決定手段は、前記複雑度が高いほど、前記動画のフレームレートを高いフレームレートに決定することを特徴とする請求項1に記載の制御装置。
  3. 前記決定手段は、前記複雑度に基づいて、前記取得手段が取得した距離画像に対応するフレームの後、前記撮像装置から取得するフレーム数を決定し、
    前記生成手段は、前記取得手段が取得した距離画像に対応するフレームから前記フレーム数のフレームを取得することを特徴とする請求項1または2に記載の制御装置。
  4. 前記取得手段は、前記撮像装置が撮像した動画を構成するフレームに対応する距離画像のうち、所定の時刻ごとに距離画像を取得し、
    前記決定手段は、前記取得手段が距離画像を取得するたびに、前記フレーム数を決定し、
    前記生成手段は、前記取得手段が距離画像を取得した時刻間において、前記フレーム数のフレームを取得し、前記フレーム数が動的に変動する動画を生成することを特徴とする請求項3に記載の制御装置。
  5. 前記算出手段は、前記距離画像における測拒不能画素の数に基づいて、前記複雑度を算出することを特徴とする請求項1乃至4のいずれか一項に記載の制御装置。
  6. 前記算出手段は、前記距離画像におけるエッジ画素を検出し、前記エッジ画素の数に基づいて前記複雑度を算出することを特徴とする請求項1乃至5のいずれか一項に記載の制御装置。
  7. 前記算出手段は、前記撮像装置の運動方向を推定し、前記運動方向に応じて特定の方向のエッジ画素を検出することを特徴とする請求項1乃至6のいずれか一項に記載の制御装置。
  8. 前記生成手段は、前記取得手段が取得した距離画像と、前記撮像装置が撮像した動画からフレームとを符号化し、動画として出力することを特徴とする請求項1乃至7のいずれか一項に記載の制御装置。
  9. 前記生成手段は、前記取得手段が取得した前記距離画像と同時に撮像されたフレームから、前記取得手段が次に取得した距離画像と同時に撮像されるフレームの直前のフレームまでを1つのGOPとし、該距離画像と同時に取得された画像をIフレームとして符号化することを特徴とする請求項8に記載の制御装置。
  10. 前記生成手段は、前記GOPのヘッダに前記算出手段が算出された前記フレームレートを示す情報を格納することを特徴とする請求項9に記載の制御装置。
  11. 前記取得手段は、前記撮像装置から互いに異なる視点で撮像した複数の画像を取得し、前記複数の画像に基づいて前記距離画像を生成することを特徴とする請求項1乃至10のいずれか一項に記載の制御装置。
  12. コンピュータに読み込ませ実行させることで、前記コンピュータを請求項1乃11の何れか一項に記載された制御装置として機能させることを特徴とするコンピュータプログラム。
  13. 被写体の距離画像を生成するための動画を撮像する撮像装置からフレームを取得し、動画の出力を制御する制御方法であって、
    前記撮像装置が撮像した動画を構成するフレームに対応する距離画像を取得し、
    前記距離画像に基づいて、前記距離画像における被写体の形状の複雑度を算出し、
    前記複雑度に応じて、出力する動画のフレームレートを決定し、
    前記フレームレートに従って前記撮像装置が撮像した動画からフレームを取得し、前記フレームレートの動画を生成することを特徴とする制御方法。
JP2015234267A 2015-11-30 2015-11-30 制御装置、制御方法、およびプログラム Active JP6622575B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015234267A JP6622575B2 (ja) 2015-11-30 2015-11-30 制御装置、制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015234267A JP6622575B2 (ja) 2015-11-30 2015-11-30 制御装置、制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2017103564A true JP2017103564A (ja) 2017-06-08
JP6622575B2 JP6622575B2 (ja) 2019-12-18

Family

ID=59017109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015234267A Active JP6622575B2 (ja) 2015-11-30 2015-11-30 制御装置、制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6622575B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019239715A1 (ja) * 2018-06-11 2019-12-19 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
JP2020167477A (ja) * 2019-03-28 2020-10-08 株式会社フジタ 監視システム
CN112929704A (zh) * 2021-01-26 2021-06-08 游密科技(深圳)有限公司 数据传输方法、装置、电子设备以及存储介质
WO2024053522A1 (ja) * 2022-09-06 2024-03-14 キヤノン株式会社 画像処理装置および画像処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193530A (ja) * 2007-02-06 2008-08-21 Canon Inc 画像記録装置、画像記録方法、及びプログラム
JP2014127847A (ja) * 2012-12-26 2014-07-07 Panasonic Corp 画像監視システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193530A (ja) * 2007-02-06 2008-08-21 Canon Inc 画像記録装置、画像記録方法、及びプログラム
JP2014127847A (ja) * 2012-12-26 2014-07-07 Panasonic Corp 画像監視システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019239715A1 (ja) * 2018-06-11 2019-12-19 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
JP6851551B2 (ja) * 2018-06-11 2021-03-31 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
JPWO2019239715A1 (ja) * 2018-06-11 2021-04-22 富士フイルム株式会社 撮像装置、撮像方法、及びプログラム
JP2020167477A (ja) * 2019-03-28 2020-10-08 株式会社フジタ 監視システム
JP7228443B2 (ja) 2019-03-28 2023-02-24 株式会社フジタ 監視システム
CN112929704A (zh) * 2021-01-26 2021-06-08 游密科技(深圳)有限公司 数据传输方法、装置、电子设备以及存储介质
CN112929704B (zh) * 2021-01-26 2023-06-30 游密科技(深圳)有限公司 数据传输方法、装置、电子设备以及存储介质
WO2024053522A1 (ja) * 2022-09-06 2024-03-14 キヤノン株式会社 画像処理装置および画像処理方法

Also Published As

Publication number Publication date
JP6622575B2 (ja) 2019-12-18

Similar Documents

Publication Publication Date Title
US10893251B2 (en) Three-dimensional model generating device and three-dimensional model generating method
JP5954668B2 (ja) 画像処理装置、撮像装置および画像処理方法
US10789765B2 (en) Three-dimensional reconstruction method
Vo et al. Spatiotemporal bundle adjustment for dynamic 3d reconstruction
JP5887267B2 (ja) 3次元画像補間装置、3次元撮像装置および3次元画像補間方法
US9210405B2 (en) System and method for real time 2D to 3D conversion of video in a digital camera
KR101669820B1 (ko) 볼륨 예측 기반 폐색 영역 양방향 복원 장치 및 방법
KR102397343B1 (ko) 비디오에서 가상 오브젝트를 블러링하기 위한 방법 및 디바이스
JP2015035658A (ja) 画像処理装置、画像処理方法、および撮像装置
CN107517346B (zh) 基于结构光的拍照方法、装置及移动设备
JP6622575B2 (ja) 制御装置、制御方法、およびプログラム
WO2019124248A1 (ja) 画像処理装置、コンテンツ処理装置、コンテンツ処理システム、および画像処理方法
CN107820019B (zh) 虚化图像获取方法、装置及设备
JP6694234B2 (ja) 距離測定装置
WO2018032841A1 (zh) 绘制三维图像的方法及其设备、系统
CN107360354B (zh) 拍照方法、装置、移动终端和计算机可读存储介质
US9872011B2 (en) High-speed depth sensing with a hybrid camera setup
JP6305232B2 (ja) 情報処理装置、撮像装置、撮像システム、情報処理方法およびプログラム。
JP2013150071A (ja) 符号化装置、符号化方法、プログラム及び記憶媒体
JP6602412B2 (ja) 情報処理装置及び方法、情報処理システム、ならびにプログラム。
JP6625654B2 (ja) 投影装置、投影方法、および、プログラム
CN106331672B (zh) 视点图像的获得方法、装置及系统
WO2018235256A1 (ja) ステレオ計測装置及びシステム
KR101866106B1 (ko) 깊이 영상의 프레임간의 평면 예측 방법 및 평면 예측 장치
JP2016072924A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191122

R151 Written notification of patent or utility model registration

Ref document number: 6622575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151