JP2024021218A - カメラ校正装置、カメラ校正方法及びプログラム - Google Patents
カメラ校正装置、カメラ校正方法及びプログラム Download PDFInfo
- Publication number
- JP2024021218A JP2024021218A JP2022123909A JP2022123909A JP2024021218A JP 2024021218 A JP2024021218 A JP 2024021218A JP 2022123909 A JP2022123909 A JP 2022123909A JP 2022123909 A JP2022123909 A JP 2022123909A JP 2024021218 A JP2024021218 A JP 2024021218A
- Authority
- JP
- Japan
- Prior art keywords
- camera
- dimensional
- person
- cameras
- posture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000012545 processing Methods 0.000 claims abstract description 34
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 230000036544 posture Effects 0.000 claims description 69
- 230000009466 transformation Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 abstract 2
- 230000000875 corresponding effect Effects 0.000 description 15
- 230000015654 memory Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 4
- 210000001503 joint Anatomy 0.000 description 3
- 210000000544 articulatio talocruralis Anatomy 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 210000003423 ankle Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】レンズ特性に関わらず複数台のカメラを安定的に校正する。【解決手段】実施形態に係るカメラ校正装置10は、3次元姿勢推定部11、対応付け処理部12、最適化部13を含む。3次元姿勢推定部11は、共通の人物を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢から人物の3次元姿勢を推定する。対応付け処理部12は、カメラ毎に推定された3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、相似変換パラメータから各カメラの外部パラメータを決定する。最適化部13は、対応付けられた3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と2次元姿勢との再投影誤差が最小となるように、3次元姿勢、カメラパラメータを最適化する。【選択図】図2
Description
本開示は、カメラ校正装置、カメラ校正方法及びプログラムに関する。
複数台のカメラを用いて同一の物体(被写体)を撮影した複数の画像を含む画像列から、カメラパラメータとその物体の3次元情報とを復元する問題は、Structure-from-Motion(SfM)や多視点幾何学問題と呼ばれている。カメラパラメータは、「内部パラメータ」及び「外部パラメータ」の2種類を含む。内部パラメータは、焦点距離、レンズ歪、光学中心座標などのレンズ固有のパラメータであり、外部パラメータは、カメラ間の3次元的な回転行列及び並進ベクトルである。内部パラメータは、レンズが固定ならば事前に計測が可能である。内部パラメータのみ、もしくは、内部パラメータと外部パラメータとが既知のカメラは、校正済みカメラと呼ばれる。一方、それらが未知のカメラは未校正カメラと呼ばれる。
1台のカメラの内部パラメータを算出する方法として、平面のチェスボードパターンを用いるZhangの手法が広く知られている。また、1台の校正済みカメラの外部パラメータを算出する方法として、レーザーレンジファインダーで空間内の物体の3次元座標を計測し、3次元点が画像内の2次元点として観測される射影関係よりPerspective-n-point問題を解く手法も広く知られている。
複数台のカメラの内部パラメータと外部パラメータを同時に校正する方法として、SfMと呼ばれる手法が広く知られている。SfMでは、まず2台のカメラで共通の物体を撮影し、物体表面上の同一の3次元点が画像へと射影された2次元点(以下、対応点)の組を生成する。次に、複数の対応点(一般的に数十から数千個)を用いて、エピポーラ制約と呼ばれる、2台のカメラと対応点の幾何的な関係を表す制約式を解く。そして、全カメラから2台ずつ選択して、対応点の生成とエピポーラ制約式の求解を行い、全カメラのカメラパラメータと3次元点の暫定的な値を取得する。
最後に、観測した対応点と、推定した全カメラパラメータで3次元点を画像上に投影した点との再投影誤差が最小になるように最適化する(以下、バンドル調整)。SfMを安定的に実行するためには、1つの対応点が、複数のカメラで観測されていることが望ましい。しかしながら、物体を取り囲むようにカメラが配置されている場合、相対するカメラ同士では対応点が物体自身により隠れてしまい、隣り合うカメラでしか観測できないということが生じる。そのような環境でSfMを実行すると、一部のカメラパラメータが推定できなかったり、全カメラパラメータが求められたとしても精度が低かったりするという課題がある。
どのカメラから見ても対応点を生成するために、画像上における人体の関節位置を対応点として用いる方法が提案されている。例えば、人体を正面から見ても背面から見ても首、肘、膝などの関節は観測できる。特許文献1では、歩行者の足首関節を地面における対応点と見なしてSfMを実行し、カメラパラメータと人体関節の3次元座標(以下、3次元姿勢)を推定する方法が記載されている。特許文献2では、複数人の全身の関節位置を対応点と見なしてSfMを実行し、望遠レンズと広角レンズで構成されたカメラの校正と3次元姿勢の推定を行う方法が記載されている。
また、人体の関節情報を用いる場合は必ずしも複数台のカメラを用いる必要はない。非特許文献1では、歩行者の背骨関節を地面に対する垂直線と見なして、1台のカメラの校正と人の身長を推定する方法が記載されている。非特許文献2では、ニューラルネットワークを用いて、1台のカメラから見た被写体の3次元姿勢を推定する方法が記載されている。
Nakano, Gaku. "Camera Calibration Using Parallel Line Segments." 2020 25th International Conference on Pattern Recognition (ICPR). IEEE, 2021.
Yang, Wei, et al. "3d human pose estimation in the wild by adversarial learning." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.
しかしながら、上述した方法には、以下のような問題がある。
まず、特許文献1に記載された方法は、足首関節は上半身や他の歩行者で隠れやすく、常にカメラで観測されるとは限らない。次に、特許文献2に記載された方法は、望遠レンズと広角レンズを同時に用いる必要があるため、街中の監視カメラシステムのような同じレンズ特性で構成される複数台のカメラを校正できない。そして、非特許文献1に記載された方法は、1台のカメラパラメータを独立して算出するため、複数台のカメラを同時に校正できない。また、非特許文献2に記載された方法は、人体関節の3次元座標のみを推定し、カメラパラメータは学習データに依存してニューラルネットワークの中で暗黙的に決定されるため、カメラを校正することはできない。
まず、特許文献1に記載された方法は、足首関節は上半身や他の歩行者で隠れやすく、常にカメラで観測されるとは限らない。次に、特許文献2に記載された方法は、望遠レンズと広角レンズを同時に用いる必要があるため、街中の監視カメラシステムのような同じレンズ特性で構成される複数台のカメラを校正できない。そして、非特許文献1に記載された方法は、1台のカメラパラメータを独立して算出するため、複数台のカメラを同時に校正できない。また、非特許文献2に記載された方法は、人体関節の3次元座標のみを推定し、カメラパラメータは学習データに依存してニューラルネットワークの中で暗黙的に決定されるため、カメラを校正することはできない。
上述したように、人体の関節位置を対応点として用いる従来の方法は、レンズ特性に関わらず複数台のカメラを安定的に校正することが困難である。
本発明の目的の一例は、上述した課題を鑑み、レンズ特性に関わらず複数台のカメラを安定的に校正し得るカメラ校正装置、カメラ校正方法及びプログラムを提供することにある。
本開示の一態様に係るカメラ校正装置は、3次元姿勢推定部、対応付け処理部、最適化部を含む。3次元姿勢推定部は、一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得する。また、3次元姿勢推定部は、該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する。対応付け処理部は、カメラ毎に推定された3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、相似変換パラメータから各カメラの外部パラメータを決定する。最適化部は、対応付けられた3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と2次元姿勢との再投影誤差が最小となるように、3次元姿勢、カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する。
本開示の一態様に係るカメラ校正方法は、コンピュータが、以下の処理を実行する。
一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理。
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理。
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理。
一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理。
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理。
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理。
本開示の一態様に係るプログラムは、コンピュータに以下の処理を実行させるものである。
一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理。
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理。
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理。
一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理。
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理。
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理。
本開示により、レンズ特性に関わらず複数台のカメラを安定的に校正し得るカメラ校正装置、カメラ校正方法、及び、プログラムを提供することができる。
以下、図面を参照しつつ、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明は省略される。
<撮影システム>
実施形態は、複数台のカメラを校正するカメラ校正装置、カメラ校正方法、及び、カメラ校正プログラムに関する。図1は、実施形態に係るカメラ校正装置による処理が適用される、撮影システムにおける複数台のカメラの配置の一例を示す図である。図1に示すように、N台(Nは2以上の整数)のカメラC1、C2、…、Cnはそれぞれ異なる場所に設置されており、一人以上の共通の人物含む共通の場所(以下、撮影エリアとする)を撮影する。図1に示す例では、撮影エリアに3人の人物T1、T2、T3が存在しており、各カメラC1、C2、…、Cnそれぞれによって撮影されたカメラ映像には人物T1、T2、T3の人物画像が含まれることとなる。
実施形態は、複数台のカメラを校正するカメラ校正装置、カメラ校正方法、及び、カメラ校正プログラムに関する。図1は、実施形態に係るカメラ校正装置による処理が適用される、撮影システムにおける複数台のカメラの配置の一例を示す図である。図1に示すように、N台(Nは2以上の整数)のカメラC1、C2、…、Cnはそれぞれ異なる場所に設置されており、一人以上の共通の人物含む共通の場所(以下、撮影エリアとする)を撮影する。図1に示す例では、撮影エリアに3人の人物T1、T2、T3が存在しており、各カメラC1、C2、…、Cnそれぞれによって撮影されたカメラ映像には人物T1、T2、T3の人物画像が含まれることとなる。
<カメラ校正装置>
図2は、実施形態に係るカメラ校正装置10の構成の一例を示すブロック図である。図2に示すカメラ校正装置10は、図1に示すようなN台のカメラから構成される撮影システムの、各カメラC1、C2、…、Cnのカメラパラメータと被写体(人物T1、T2、T3)の3次元姿勢を推定する装置である。本実施形態において、N台のカメラは時間同期が取れているものとする。すなわち、あるカメラのi番目のフレームと、別のカメラのi番目のフレームとは同一のタイムスタンプを持つ。
図2は、実施形態に係るカメラ校正装置10の構成の一例を示すブロック図である。図2に示すカメラ校正装置10は、図1に示すようなN台のカメラから構成される撮影システムの、各カメラC1、C2、…、Cnのカメラパラメータと被写体(人物T1、T2、T3)の3次元姿勢を推定する装置である。本実施形態において、N台のカメラは時間同期が取れているものとする。すなわち、あるカメラのi番目のフレームと、別のカメラのi番目のフレームとは同一のタイムスタンプを持つ。
カメラ校正装置10は、3次元姿勢推定部11、対応付け処理部12、最適化部13を含む。3次元姿勢推定部11は、カメラC1、C2、…、Cnにより生成されたカメラ映像の各フレーム画像における人物T1、T2、T3それぞれの関節位置のフレーム画像上における2次元座標を表す2次元姿勢を取得し、各人物の3次元姿勢を推定する。ここで、3次元姿勢とは、人物の3次元的な関節位置を表す3次元座標である。
具体的には、3次元姿勢推定部11は、互いに異なる位置に設置された複数のカメラC1、C2、…、Cnによって共通の場所(撮影エリア)を撮影したカメラ映像を取得する。そして、3次元姿勢推定部11は、まず、取得したカメラ映像の各フレーム画像における各人物の関節位置の2次元座標を取得し、次に3次元姿勢を推定する。
なお、各カメラで推定される3次元姿勢は、各カメラの視野角に応じて異なった関節位置で構成されてもよい。例えば、カメラC1で人物T1の全身が映っていれば、その全身の関節位置について3次元座標が推定される。また、カメラC2で人物T2の上半身しか映っていなければ、その上半身の関節位置について3次元座標が推定される。各カメラ映像から取得される2次元姿勢についても同様に、各カメラの視野角に応じて異なった関節位置で構成されてもよい。
対応付け処理部12は、3次元姿勢推定部11にて推定された各カメラ映像の3次元姿勢を用いて、まず、それらの3次元座標が一致する3次元相似変換を探索し、異なるカメラ映像中における同一人物の3次元姿勢を対応付ける。次に、対応付け処理部12は、一致した相似変換パラメータから各カメラの外部パラメータを決定する。外部パラメータは、カメラ間の3次元的な回転行列及び並進ベクトルである。ここで、各カメラの外部パラメータのスケールを一意に決定するために、任意の1つのカメラを世界座標系の原点として設定してもよい。
最適化部13は、対応付け処理部12にて対応付けられた3次元姿勢と、3次元姿勢推定部11で取得された2次元姿勢とを用いて、バンドル調整を行う。バンドル調整では、まず、対応付け処理部12にて対応付けられた3次元姿勢を、抽出元の各カメラのフレーム画像(2次元画像)に対応するカメラパラメータを用いて、元のフレーム画像へ再投影して2次元座標が算出される。そして、投影された位置の2次元座標と、3次元姿勢推定部11で取得された2次元姿勢とが比較され、2次元座標と2次元姿勢の差分(再投影誤差)が算出される。最適化部13は、この再投影誤差が最小となるように、3次元姿勢と、カメラの内部パラメータと外部パラメータの少なくともいずれかを最適化する。
<カメラ校正装置の処理動作>
以下、上記の構成を有するカメラ校正装置10の処理動作の一例について、図3を参照して説明する。図3は、実施形態に係るカメラ校正装置の処理動作の一例を示すフロー図である。以下の説明においては、適宜、図1、2を参酌する。また、本実施形態では、カメラ校正装置を動作させることによって、カメラ校正方法が実施される。よって、本実施形態におけるカメラ校正方法の説明は、以下のカメラ校正装置の処理動作の説明に代える。
以下、上記の構成を有するカメラ校正装置10の処理動作の一例について、図3を参照して説明する。図3は、実施形態に係るカメラ校正装置の処理動作の一例を示すフロー図である。以下の説明においては、適宜、図1、2を参酌する。また、本実施形態では、カメラ校正装置を動作させることによって、カメラ校正方法が実施される。よって、本実施形態におけるカメラ校正方法の説明は、以下のカメラ校正装置の処理動作の説明に代える。
まず、図1に示すような状況において、N台(Nは2以上の整数)のカメラC1、C2、…、Cnで共通の撮影エリアが撮影される。すなわち、カメラC1、C2、…、Cnは、視野を共有する場所を撮影している。このような撮影システムは、例えば、交差点や駅構内などの人が往来する場所への設置が想定される。撮影システムは、複数のカメラで撮影エリアを撮影することによりそれぞれカメラ映像を生成する。
これらのカメラは内部パラメータが事前に校正されていてもよいし、未校正であってもよい。各カメラは時刻同期が取れているが、カメラ映像の各フレーム画像に映っている複数の被写体の対応付けはできていない。すなわち、あるカメラにおけるi番目のフレームに映るp番目の人物と、別のカメラにおけるi番目のフレームに映るq番目の人物が同一人物かどうかは不明である。
図1に示す状況では、撮影エリアに3人の人物T1、T2、T3が存在しており、各カメラC1、C2、…、Cnそれぞれによって撮影されたカメラ映像には人物T1、T2、T3の人物画像が含まれる。このような各カメラC1~CnのN個のカメラ映像がカメラ校正装置10に入力されると、図3の処理フローがスタートする。
図3に示すように、3次元姿勢推定部11は、N個のカメラ映像が入力されると、各カメラ映像についてフレーム毎に人物の2次元姿勢を取得し、3次元姿勢を推定する(ステップS11)。ここで、各カメラ映像における3次元姿勢は、ある共通の世界座標系で定義される必要はない。すなわち、カメラ毎に独立の座標系により定義されてよい。2次元姿勢と3次元姿勢を求めるためには、既存の様々な方法を用いることができる。例えば、幾何学に基づく非特許文献1に記載された方法を用いてもよいし、機械学習に基づく非特許文献2に記載された方法を用いてもよい。
次に、対応付け処理部12は、各カメラ映像の3次元姿勢が入力されると、それらの3次元姿勢が一致する3次元相似変換を探索し、異なるカメラ映像中における同一人物の3次元姿勢を対応付ける。また、対応付け処理部12は、一致した相似変換パラメータを各カメラの外部パラメータをして決定する(ステップS12)。
対応付け処理部12は、例えば、あるカメラにおけるi番目のフレームに映るp番目の人物の3次元姿勢が、別のカメラのi番目のフレームにて観測されたかどうかを探索して、3次元姿勢の対応付けを行う。
探索方法としては、例えば、広く知られているICP(Iterative Closest Point)法を相似変換に拡張した方法を用いてもよい。具体的には、探索は以下のように行えばよい。まず、全フレームの3次元姿勢を一塊の3次元点群とみなすと、N個の3次元点群が定義できる。次に、N個から2個の点群を選択し、ICP法を適用して2個の点群が一致する相似変換を推定する。次に、2個のうち1個の点群と、残りのN-2個の点群から1つを選び、ICP法を適用する。この操作をすべての点群に対して行うと、最終的にすべての点群を1個に統合できる。また、相似変換パラメータは各カメラの外部パラメータと一致する。
別の探索方法としては、広く知られている3次元点特徴量による点対応のマッチングを用いてもよい。例えば、ISS(Intrinsic Shape Signatures)や画像特徴として知られるSIFT(Scale-Invariant Feature Transform)を3次元に拡張した3D SIFTなどを用いて対応点組を計算し、次に、RANSAC(Random Sample Consensus)により誤った対応点を除去しながら相似変換パラメータを推定する。
上記の例では全フレームの3次元姿勢を1つの点群としてICP法又はRANSACを適用したが、時刻同期が取れているため、1フレームの3次元姿勢を1つの点群としてもよい。これにより、1つの点群に含まれる3次元座標の数が減少するため、ICP法又はRANSACをより高速に実行できる。なお、カメラ間の3次元姿勢の対応付けが完了すれば、3次元姿勢の画像上での観測値である2次元姿勢も同時に対応付けられる。
最後に、最適化部13は、対応付けられた3次元姿勢と2次元姿勢とを用い、再投影誤差が最小となるようにバンドル調整を実行する(ステップS13)。具体的には、最適化部13は、カメラパラメータと対応付けられた3次元姿勢を変数として、対応付けられた3次元姿勢を再投影した2次元座標と、2次元姿勢との差分が最小となるように、各カメラパラメータと3次元姿勢を最適化する。これにより、3次元姿勢とカメラパラメータをより高精度に推定できる。そして、最適化部13は、カメラパラメータと3次元姿勢を出力して動作を終了する。
なお、外部パラメータは、対応付け処理部12による出力を初期値として用いることができる。内部パラメータが未知の場合は、以下のように初期値を与えればよい。すなわち、各カメラにおいて、3次元姿勢と2次元姿勢と外部パラメータが既知のため、内部パラメータを未知とする最小二乗法を解けばよい。また、より簡易な方法としては、画像サイズの半分をレンズ中心と仮定したり、カメラの仕様から焦点距離を与えたりしてもよい。
以上説明したように、実施形態によれば、レンズ特性に関わらず複数台のカメラを安定的に校正できる。その理由は、以下の通りである。
第1の理由は、3次元姿勢推定部11にて各カメラ映像について独立に3次元姿勢を計算し、対応付け処理部12にてそれらを対応付ける。これにより、望遠レンズと広角レンズの組み合わせが不要になるためである。
第2の理由は、対応付け処理部12にて3次元姿勢は足首に限定されず、検出されたすべての関節点を対応付けに利用可能するためである。
実施形態に係る技術は、画像からの3次元形状復元(Structure-from-Motion)の用途に好適である。
第1の理由は、3次元姿勢推定部11にて各カメラ映像について独立に3次元姿勢を計算し、対応付け処理部12にてそれらを対応付ける。これにより、望遠レンズと広角レンズの組み合わせが不要になるためである。
第2の理由は、対応付け処理部12にて3次元姿勢は足首に限定されず、検出されたすべての関節点を対応付けに利用可能するためである。
実施形態に係る技術は、画像からの3次元形状復元(Structure-from-Motion)の用途に好適である。
上述した例に対して、いわゆる当業者が理解し得る多様な変更を適用することが可能である。実施形態は、以下の変形例に示す形態によっても実施可能である。
上記の説明では、N台のカメラは時間同期が取れていると仮定したが、時刻同期が取れていなくてもよい。すなわち、あるカメラのi番目のフレームと別のカメラのi番目のフレームは同一のタイムスタンプを持つか不明であってもよい。この場合、対応付け処理部12は、1フレームの3次元姿勢を1つの点群として探索範囲を限定することはできなくなるだけで、全フレームの3次元姿勢を一塊の3次元点群とみなせば対応付け可能である。カメラ間で人物の同一動作が撮影できていれば、カメラ映像の時刻ずれを調整することも可能である。
本実施の形態におけるプログラムは、コンピュータに、図3に示すステップS11~S13を実行させるプログラムであればよい。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるカメラパラメータ推定装置とカメラパラメータ推定方法とを実現することができる。
図4は、カメラ校正装置10のハードウェア構成例を示す図である。図4に示すように、カメラ校正装置10は、プロセッサ101と、メモリ102とを有している。プロセッサ101は、例えば、MPU(Micro Processing Unit)、又はCPU(Central Processing Unit)である。プロセッサ101は、複数のプロセッサを含んでもよい。メモリ102は、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。
メモリ102は、プロセッサ101から離れて配置されたストレージを含んでもよい。この場合、プロセッサ101は、図示されていないI/Oインタフェースを介してメモリ102にアクセスしてもよい。第1実施形態のカメラ校正装置10の3次元姿勢推定部11、対応付け処理部12、最適化部13は、プロセッサ101がメモリ102に記憶されたプログラムを読み込んで実行することにより実現されてもよい。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、カメラパラメータ推定装置に供給することができる。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。さらに、非一時的なコンピュータ可読媒体の例は、CD-ROM(Read Only Memory)、CD-R、CD-R/Wを含む。さらに、非一時的なコンピュータ可読媒体の例は、半導体メモリを含む。半導体メモリは、例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory)を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってカメラパラメータ推定装置に供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをカメラ校正装置10に供給できる。
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
10 カメラ校正装置
11 3次元姿勢推定部
12 対応付け処理部
13 最適化部
101 プロセッサ
102 メモリ
11 3次元姿勢推定部
12 対応付け処理部
13 最適化部
101 プロセッサ
102 メモリ
Claims (7)
- 一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する3次元姿勢推定部と、
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する対応付け処理部と、
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する最適化部と、
を備える、カメラ校正装置。 - 複数台のカメラは時刻同期されており、
前記対応付け処理部は、前記相似変換パラメータの探索範囲を、各カメラにより生成された映像の各フレーム画像に記録されたタイムスタンプが同一となる3次元姿勢に限定する、
請求項1に記載のカメラ校正装置。 - 複数台のカメラが時刻同期されていない場合、前記対応付け処理部は、複数台のカメラにより撮影された共通の人物の同一動作に基づいて映像の時刻ずれを調整する、
請求項1に記載のカメラ校正装置。 - 前記対応付け処理部は、複数台のカメラのうち、任意の1つのカメラを世界座標系の原点として設定して、前記カメラの外部パラメータを決定する、
請求項1に記載のカメラ校正装置。 - 複数台のカメラにより生成された映像から推定される3次元姿勢は、各カメラの視野角に応じて異なった関節位置で構成される、
請求項1に記載のカメラ校正装置。 - コンピュータが、
一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理と、
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理と、
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理と、
を実行する、カメラ校正方法。 - 一人以上の共通の人物含む共通の場所を撮影する異なる場所に設置された複数台のカメラにより生成された映像の各フレーム画像上における人物の関節位置の座標を表す2次元姿勢を取得し、当該2次元姿勢から人物の3次元的な関節位置を表す3次元姿勢を推定する処理と、
カメラ毎に推定された前記3次元姿勢を対応付ける相似変換パラメータを探索して、異なるカメラによって生成されたフレーム画像における同一人物を対応付け、前記相似変換パラメータから各カメラの外部パラメータを決定する処理と、
対応付けられた前記3次元姿勢を各カメラのフレーム画像へ再投影した2次元座標と前記2次元姿勢との再投影誤差が最小となるように、前記3次元姿勢、前記カメラの内部パラメータ、外部パラメータの少なくともいずれかを最適化する処理と、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022123909A JP2024021218A (ja) | 2022-08-03 | 2022-08-03 | カメラ校正装置、カメラ校正方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022123909A JP2024021218A (ja) | 2022-08-03 | 2022-08-03 | カメラ校正装置、カメラ校正方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024021218A true JP2024021218A (ja) | 2024-02-16 |
Family
ID=89855209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022123909A Pending JP2024021218A (ja) | 2022-08-03 | 2022-08-03 | カメラ校正装置、カメラ校正方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024021218A (ja) |
-
2022
- 2022-08-03 JP JP2022123909A patent/JP2024021218A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105654464B (zh) | 图像处理装置及图像处理方法 | |
CN107077743B (zh) | 用于阵列相机的动态校准的系统和方法 | |
KR101791590B1 (ko) | 물체 자세 인식장치 및 이를 이용한 물체 자세 인식방법 | |
US5706419A (en) | Image capturing and processing apparatus and image capturing and processing method | |
JP7227969B2 (ja) | 三次元再構成方法および三次元再構成装置 | |
US8447099B2 (en) | Forming 3D models using two images | |
US8452081B2 (en) | Forming 3D models using multiple images | |
WO2018135510A1 (ja) | 三次元再構成方法及び三次元再構成装置 | |
JP5672112B2 (ja) | ステレオ画像較正方法、ステレオ画像較正装置及びステレオ画像較正用コンピュータプログラム | |
JPWO2016181687A1 (ja) | 画像処理装置と画像処理方法およびプログラム | |
JP2019190974A (ja) | キャリブレーション装置、キャリブレーション方法、及びプログラム | |
KR20240089161A (ko) | 촬영 측정 방법, 장치, 기기 및 저장 매체 | |
KR101694651B1 (ko) | 3차원 위치 추정을 이용한 광각 렌즈 영상의 왜곡 보정 장치 및 그 방법 | |
GB2567245A (en) | Methods and apparatuses for depth rectification processing | |
CN114627491A (zh) | 一种基于极线汇聚的单人三维姿态估计方法 | |
JP7489253B2 (ja) | デプスマップ生成装置及びそのプログラム、並びに、デプスマップ生成システム | |
CN115345942A (zh) | 空间标定方法、装置、计算机设备和存储介质 | |
JP2023056466A (ja) | グローバル測位装置及び方法 | |
WO2020194486A1 (ja) | 校正装置、校正方法、及びプログラムが格納された非一時的なコンピュータ可読媒体 | |
JP4701848B2 (ja) | 画像マッチング装置、画像マッチング方法および画像マッチング用プログラム | |
RU2384882C1 (ru) | Способ автоматической компоновки ландшафтных панорамных изображений | |
Zakharov et al. | An algorithm for 3D-object reconstruction from video using stereo correspondences | |
KR20180131743A (ko) | Sift 플로우를 이용한 광각영상의 스테레오 정합 방법 및 장치 | |
JP2024021218A (ja) | カメラ校正装置、カメラ校正方法及びプログラム | |
WO2022180692A1 (ja) | 情報処理装置、位置推定方法、及び非一時的なコンピュータ可読媒体 |