WO2023132269A1

WO2023132269A1 - 情報処理装置、および情報処理方法、並びにプログラム

Info

Publication number: WO2023132269A1
Application number: PCT/JP2022/047534
Authority: WO
Inventors: 友己小野
Original assignee: ソニーグループ株式会社
Priority date: 2022-01-06
Filing date: 2022-12-23
Publication date: 2023-07-13

Abstract

本開示は、複数のクライアント装置でXR技術を適用したアプリケーションプログラムを利用し易くする情報処理装置、および情報処理方法、並びにプログラムに関する。サーバにおいて、クライアント装置で生成されるローカルマップを結合してグローバルマップを生成し、グローバルマップに対するSLAMの初期化処理を実行する際、ローカルマップの結合に失敗した場合、サーバは、失敗の原因に応じた結合の失敗を解消するためのガイド情報をクライアント装置に送信してユーザに提示させる。XR技術を利用したアプリケーションプログラムに適用することができる。

Description

情報処理装置、および情報処理方法、並びにプログラム

　本開示は、情報処理装置、および情報処理方法、並びにプログラムに関し、特に、複数のクライアント装置でXR技術を適用したアプリケーションプログラムを利用し易くする情報処理装置、および情報処理方法、並びにプログラムに関する。

　XR（Extended Reality）に総称されるAR（Augmented Reality）、VR（Virtual Reality）、MR（Mixed Reality）などを利用した技術が一般に普及しつつある。

　このXRを利用する技術の一つであるアプリケーションプログラムにおいて、CG（Computer Graphics）を、クライアント装置を構成するデバイスの位置や姿勢（デバイスの向き）に応じて違和感なく、重畳して表示するために、SLAM（Simultaneous Localization And Mapping）と呼ばれる自己位置推定技術が用いられる。

　このSLAMとVR技術を利用したものとして、例えば、デジタル空間にいるユーザが現実の障害物に衝突する危険を回避する技術が提案されている（特許文献１参照）。

　ところで、従来は、クライアント装置において、個別にSLAMが動作し、個別の自己位置推定結果に基づいて、CGが重畳表示されていた。

　一方で、近年、5G（第5世代移動通信システム）などの通信性能の飛躍的な向上に伴い、複数のクライアント装置が互いの自己位置推定結果を共通化して共有し、共有されている位置情報推定結果に基づいてCGを重畳表示することが可能になってきている。

　これにより、例えば、XR技術を利用したゲームにおいては、複数のユーザのクライアント装置上で、それぞれの位置や姿勢に応じた状態で共通のCGを重畳表示させることが可能となり、複数のユーザが、それぞれのクライアント装置を利用しながら、リアルタイムで共通の体験を実現することが可能となっている。

　また、XR技術を利用したゲームなどでは、物理的に離れたユーザ同士でも、それぞれのクライアント装置において表示されるデジタル空間上で、互いの位置関係を把握しながらインタラクションすることが可能となっている。

　ところで、これらのXR技術を利用したアプリケーションプログラムにおいては、SLAMの初期化が必要とされる。

　SLAMの初期化とは、個々のクライアント装置で生成されるローカルマップを結合し、共通の座標系で利用できるように統一化を図り、複数のクライアント装置における相互の自己位置推定結果を網羅的に表現するグローバルマップを生成する処理である。SLAMの初期化が図られると、その処理で生成されるグローバルマップが順次更新される。

　そこで、XR技術を利用したアプリケーションプログラムによる処理を実現する上で、このSLAMの初期化を高速化する技術が提案されている（特許文献２参照）。

　また、複数のユーザのそれぞれがクライアント装置を利用して、XR技術を利用したアプリケーションプログラムを実行するに当たって、衛星画像を使った世界規模のマップ上に各クライアント装置を接続し、上述したSLAMの初期化に対応する処理を実現する技術が提案されている（特許文献３参照）。

　さらに、複数のユーザのそれぞれがクライアント装置を利用して、XR技術を利用した共有体験をしているときに、環境変化に応じて、共通の座標系で利用可能となったグローバルマップを更新する技術が提案されている（特許文献４参照）。

特開２０２１－２２９０号公報特表２０１６－５０２７１２号公報特開２０２１－１１１３８５号公報特開２０１１－１８６８０８号公報

　上述した複数のクライアント装置で利用するアプリケーションプログラムにおける、グローバルマップに対するSLAMの初期化においては、個々のクライアント装置において、何らかの理由でローカルマップを生成できないといった失敗や、ローカルマップの結合ができないといった失敗など、様々な要因によりグローバルマップの生成ができず、SLAMの初期化が失敗することがある。

　グローバルマップに対するSLAMの初期化が失敗した場合、ユーザは、失敗の原因がわかっていれば、失敗を解消するための行動をとるといった対処が可能である。

　しかしながら、一般に、グローバルマップに対するSLAMの初期化が失敗した場合、XR技術を適用したアプリケーションプログラムの利用ができない状態になるだけであり、その原因は不明であることから、ユーザはなす術がなく、XR技術を適用したアプリケーションプログラムの利用ができない状態を解消させることができなかった。

　本開示は、このような状況に鑑みてなされたものであり、特に、複数のクライアント装置によるXR技術を適用したアプリケーションプログラムの利用にあたって、グローバルマップに対するSLAMの初期化の失敗を、ユーザ自身で、解消し易くする。

　本開示の一側面の情報処理装置およびプログラムは、複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成する生成部を備え、前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる情報処理装置およびプログラムである。

　本開示の一側面の情報処理方法は、複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成し、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させるステップを含む情報処理方法である。

　本開示の一側面においては、複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップが結合されることによりグローバルマップが生成され、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報が提示される。

ローカルマップとグローバルマップを説明する図である。ローカルマップからグローバルマップを生成する例を説明する図である。ローカルマップからグローバルマップを生成する例を説明する図である。本開示のローカルマップからグローバルマップを生成する処理を説明する図である。本開示の概要を説明する図である。本開示の通信システムの好適に実施の形態の構成例を説明するブロック図である。図６のクライアント装置の構成例を説明する図である。図６のサーバの構成例を説明する図である。ローカルマップおよびグローバルマップのデータ構造を説明する図である。キーフレームに基づいた、位置および姿勢の検出方法と、マッピング方法を説明する図である。ローカルマップの結合方法を説明する図である。ローカルマップの結合の失敗の原因と解決法を説明する図である。共通視野が存在しないことが結合失敗の原因であるときのガイド情報の表示例を説明する図である。共通視野が存在しないことが結合失敗の原因であるときのガイド情報の表示例を説明する図である。通信が途切れることが結合失敗の原因であるときのガイド情報の表示例を説明する図である。特徴点となるキーポイントが充分でないことが結合失敗の原因であるときのガイド情報の表示例を説明する図である。移動視差が充分でないことが結合失敗の原因であるときのガイド情報の表示例を説明する図である。図７のクライアント装置によるSLAM初期化処理を説明するフローチャートである。図８のサーバによるSLAM初期化処理を説明するフローチャートである。図１９のフローチャートの失敗通知処理を説明するフローチャートである。本開示の通信システムにおいてクライアント装置に物体認識部を設けるようにしたときに表示されるガイド情報の例を説明する図である。物体認識部を設けるようにした図６のクライアント装置の構成例を説明する図である。図２２のクライアント装置によるSLAM初期化処理を説明するフローチャートである。図１９のフローチャートの失敗通知処理の応用例を説明するフローチャートである。汎用のコンピュータの構成例を示している。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　以下、本技術を実施するための形態について説明する。説明は以下の順序で行う。
　１．好適な実施の形態
　２．応用例
　３．ソフトウェアにより実行させる例

　＜＜１．好適な実施の形態＞＞
　＜本開示の概要＞
　本開示は、特に、グローバルマップの生成に失敗した場合、失敗の原因に応じたガイド情報を提示することで、グローバルマップの生成の失敗をユーザ自身で解消し易くし、複数のクライアント装置によるXR技術を適用したアプリケーションプログラムを利用し易くするものである。

　AR（Augmented Reality）、VR（Virtual Reality）、MR（Mixed Reality）などの総称であるXR（Extended Reality）技術を利用したアプリケーションプログラムにおいては、CG（Computer Graphics）を、クライアント装置を構成するデバイスの位置や姿勢（デバイスの向き）に応じて違和感なく、重畳して表示するために、SLAM(Simultaneous Localization And Mapping)と呼ばれる自己位置推定技術が用いられる。

　従来、複数のクライアント装置は、それぞれが個別にSLAMを動作させ、それぞれの自己位置推定結果に基づいて、個別にCGを重畳表示していた。

　一方で、近年、5G（第5世代移動通信システム）などの通信性能の飛躍的な向上に伴い、複数のクライアント装置が互いの相対的な自己位置推定結果を共通化して共有し、共有された情報に基づいてCGを重畳表示することが可能になってきている。

　これにより、例えば、XR技術を利用したゲームにおいては、複数のユーザのクライアント装置上で、それぞれの位置や姿勢に応じた状態で共通のCGを重畳表示させることで、複数のユーザが、それぞれのクライアント装置を利用しながら、リアルタイムで共通の体験を実現することが可能となっている。

　ところで、これらのXR技術を利用したアプリケーションプログラムにおいては、SLAMの初期化がなされる。

　SLAMの初期化とは、個々のクライアント装置におけるSLAMにより推定された自己位置情報に基づいて生成されるローカルマップを結合し、共通の座標系で利用できるように統一化を図り、複数のクライアント装置の相対的な位置関係を網羅的に表現するグローバルマップを生成する処理である。

　ここで、図１の通信システム１１を参照して、具体的にSLAMの初期化について説明する。

　図１の通信システム１１においては、ユーザ３１－１乃至３１－３のそれぞれが、例えば、スマートフォンやタブレットなどのクライアント装置３２－１乃至３２－３を所持しており、クライアント装置３２－１乃至３２－３のそれぞれが、個別にSLAMを実行して自己位置を推定し、ローカルマップＭ１乃至Ｍ３を生成する。

　尚、ユーザ３１－１乃至３１－３、および、クライアント装置３２－１乃至３２－３のそれぞれを特に区別する必要がない場合、単に、ユーザ３１、およびクライアント装置３２と称するものとし、その他の構成についても同様に称する。

　また、ユーザ３１－１乃至３１－３は、相互の位置関係を認識可能な共通の空間（実空間または仮想空間のいずれでもよい）に存在することを前提する。

　図１においては、クライアント装置３２－１乃至３２－３のそれぞれのローカルマップＭ１乃至Ｍ３が結合されることにより、共通の座標系として利用できるように統一化されることで、グローバルマップ３３が生成されることが表現されている。

　また、グローバルマップ３３上には、ローカルマップＭ１乃至Ｍ３が結合されることにより、ユーザ３１－１乃至３１－３が所持するクライアント装置３２－１乃至３２－３のそれぞれの位置情報３３ａ－１乃至３３ａ－３が登録されていることが表現されている。

　クライアント装置３２－１乃至３２－３は、このグローバルマップ３３を基準として、クライアント装置３２－１乃至３２－３間の位置関係や、それぞれの位置や姿勢に応じて共通のCGを、自然な角度で重畳表示させることが可能となる。

　より具体的には、クライアント装置３２－１乃至３２－３のそれぞれにおいて、図示せぬカメラ（不図示）により現実空間の動画像が撮像されると、撮像結果が表示部（不図示）に表示される。ここで、例えば、現実空間に存在する特定の被写体が撮像されて、表示部に表示されるとき、画像内の特定の被写体上に、クライアント装置３２－１乃至３２－３の位置や姿勢に応じて、自然な角度で特定のキャラクタのCGがAR画像として重畳表示されるような共通のアプリケーションプログラムが実行されている場合について考える。

　この場合、クライアント装置３２－１乃至３２－３のそれぞれにおいて、撮像される画像に基づいて、SLAMが個別に実行されて、自己位置が推定され、ローカルマップが生成される。

　そして、生成されたローカルマップが結合されることによりグローバルマップが生成されて共有されると、クライアント装置３２－１乃至３２－３は、自らが撮像した画像内に、特定の被写体が入り込むとき、特定の被写体上に、グローバルマップに基づいた、自らの位置と姿勢とに対応する角度で、特定のキャラクタのCGをAR画像として重畳表示する。

　これにより、例えば、複数のユーザ３１－１乃至３１－３が、それぞれクライアント装置３２－１乃至３２－３を利用して、動画像を撮像する中で、共通する現実空間内の特定の被写体が画角内に入り込むような画像を撮像すると、自らの位置と姿勢に応じた自然な角度で、特定の被写体上に特定のキャラクタのCGがAR画像として重畳表示された画像を視聴することが可能となる。

　結果として、複数のユーザ３１－１乃至３１－３は、それぞれの位置や姿勢で、撮像する画像内の現実に存在する特定の被写体上にAR画像として重畳表示されるキャラクタのCGを、現実空間の被写体上に実像として存在しているかのように視聴することが可能になる。

　また、複数のユーザ３１－１乃至３１－３は、それぞれの位置と姿勢に加えて、相互の位置関係に対応した、自然な角度で、特定の被写体上にAR画像として重畳表示されるキャラクタのCGを視聴することが可能となる。

　結果として、複数のユーザ３１－１乃至３１－３は、リアルタイムで、共通のキャラクタのCGを、それぞれの位置と姿勢に加えて、相互の位置関係に対応した状態で、あたかも実像として視聴しているかのような体験を実現することが可能となっている。

　グローバルマップ３３は、一度生成された後は、クライアント装置３２－１乃至３２－３から供給されるローカルマップＭ１乃至Ｍ３に基づいて、順次更新される処理が繰り返される。

　ここで、クライアント装置３２－１乃至３２－３からローカルマップＭ１乃至Ｍ３が最初に供給されて、結合されることにより、座標系が統一化されて、グローバルマップ３３が生成される処理が、グローバルマップを生成するためのSLAMの初期化である。

　尚、クライアント装置３２－１乃至３２－３のそれぞれが個別にSLAMを開始して、ローカルマップＭ１乃至Ｍ３の生成を開始する処理は、ローカルマップを生成するためのSLAMの初期化である。

　すなわち、SLAMの初期化には、ローカルマップに対するものと、グローバルマップに対するものとがそれぞれ存在するが、本開示においては、グローバルマップに対する初期化を対象とする。

　＜グローバルマップに対するSLAMの初期化（その１）＞
　グローバルマップを生成するためのSLAMの初期化を実現する手法については、いくつかの手法がある。

　例えば、図２で示されるように、クライアント装置３２－１乃至３２－３のいずれかが生成したローカルマップの座標系を基準座標系として、他のローカルマップの情報を追加していくことによりグローバルマップ３３が生成される手法がある。

　すなわち、図２では、クライアント装置３２－１が生成したローカルマップＭ１上に、クライアント装置３２－２，３２－３において生成されたローカルマップＭ２，Ｍ３の情報が、ローカルマップＭ１の座標系を基準座標にして追加されることにより、グローバルマップ３３が生成される。

　この場合、ローカルマップを結合させる必要がなくなるので、処理は簡易なものとなるが、クライアント装置３２のうちのいずれのローカルマップを基準とするのかを決定する必要がある上、全てのローカルマップが、同一の基準座標を含むようにする必要があることから、全てのクライアント装置３２－１乃至３２－３は、共通の視野が含まれるような画像を利用する必要があり、UX（User eXperience）上の制約が多くなる。

　＜グローバルマップに対するSLAMの初期化（その２）＞
　また、図３で示されるように、クライアント装置３２－１乃至３２－３は、ローカルマップを生成するためのSLAMを実現する上で必要な画像Ｐ１乃至Ｐ３を、サーバ４１に向けて送信する。

　サーバ４１は、クライアント装置３２－１乃至３２－３から送信される画像Ｐ１乃至Ｐ３に基づいて、SfM（Structure-from-Motion:3D再構築）と呼ばれる技術を用いて、グローバルマップ３３を構築する。

　図３の場合、図２を参照して説明したグローバルマップに対するSLAMの初期化と比較すると、UX上の制約はない反面、クライアント装置３２－１乃至３２－３は、画像をサーバ４１に送信するため、送信データ量が大きく、またサーバ４１側の処理負荷が大きい。

　＜本開示のグローバルマップに対するSLAMの初期化＞
　そこで、本開示のグローバルマップに対するSLAMの初期化は、図４の通信システム５１で示されるような構成により実現されるようにする。

　すなわち、図４の通信システム５１においては、ユーザ６１－１乃至６１－３のそれぞれが所持するクライアント装置６２－１乃至６２－３のそれぞれがローカルマップＭ１乃至Ｍ３をSLAMにより生成し、サーバ６４に送信する。

　サーバ６４は、クライアント装置６２－１乃至６２－３のそれぞれから送信されてくるローカルマップＭ１乃至Ｍ３を取得すると、それぞれの座標系を基準座標系に統一し、ローカルマップＭ１乃至Ｍ３を結合することで、グローバルマップ６５を生成する。

　このような構成により、本開示の通信システム５１においては、UXの制約がなく、サーバ６４に送信される情報は、ローカルマップＭ１乃至Ｍ３であり、画像Ｐ１乃至Ｐ３と比較すると送信データ量を小さくすることができる上、サーバ６４に掛かる処理負荷を低減させることが可能となる。

　また、サーバ６４は、複数のローカルマップにおけるそれぞれの共通部分を重ね合わせるように結合することで、グローバルマップを生成する。

　しかしながら、複数のローカルマップの全てにおける共通部分が存在せず、全てのローカルマップが結合できない、十分な移動視差がなくローカルマップに対するSLAMが失敗する等、様々な理由でグローバルマップを構築することができず、グローバルマップに対するSLAMの初期化に失敗することがある。

　これまで、グローバルマップに対するSLAMの初期化が失敗するような状態となるとき、ユーザは、グローバルマップに対するSLAMの初期化に失敗していることは認識できても、何が原因であるのかを認識すること、およびどのようにすればSLAMの初期化を成功させることができるのかを認識することはできなかった。

　そこで、本開示においては、サーバ６４が、グローバルマップに対するSLAMの初期化が失敗している原因に応じて、その対処法を、クライアント装置６２を介してユーザ６１に提示させ、グローバルマップに対するSLAMの初期化を成功できるように誘導する。

　例えば、複数のローカルマップの全てにおける共通部分が存在せず、全てのローカルマップが結合できないことが原因でグローバルマップに対するSLAMの初期化に失敗するような場合、結合しようとするローカルマップに双方の共通部分が構築されるようにすることで、グローバルマップに対するSLAMの初期化を実現可能とすることができる。

　より具体的には、図５で示されるように、ユーザ６１－１１，６１－１２の双方が所持するクライアント装置６２－１１，６２－１２のグローバルマップに対するSLAMの初期化が失敗しており、その原因が、双方のローカルマップにおける共通部分が存在しないことが原因であるようなときについて考える。

　このような場合、サーバ６４は、クライアント装置６２－１１，６２－１２に対して、ローカルマップに双方の共通部分が構築されるような行動を促すように、グローバルマップに対するSLAMの初期化を成功できるようなガイド情報を供給し、クライアント装置６２－１１，６２－１２のそれぞれで提示されるようにする。

　例えば、サーバ６４は、クライアント装置６２－１１，６２－１２に対して、双方のユーザ６１－１１，６１－１２に対してローカルマップにおける共通部分が発生するように、共通の被写体７１を撮像するように促すガイド情報を供給し、ユーザ６１－１１，６１－１２に提示させる。

　ユーザ６１－１１，６１－１２は、このガイド情報の提示に基づいて、クライアント装置６２－１１，６２－１２を用いて共通の被写体７１を撮像すると、双方のローカルマップに共通部分が発生することになるので、双方のローカルマップが結合できるようになり、結果として、グローバルマップに対するSLAMの初期化を成功させることが可能となる。

　このように本開示においては、サーバ６４が、グローバルマップに対するSLAMの初期化が失敗する場合、失敗の原因に応じた対処法となるガイド情報を、クライアント装置６２を介してユーザ６１に提示させ、失敗の原因が解消するようにユーザ６１を誘導することで、グローバルマップに対するSLAMの初期化を成功させる。

　これにより、グローバルマップに対するSLAMの初期化の失敗をユーザ自身で解消し易くできるので、複数のクライアント装置によるXR技術を適用したアプリケーションプログラムを利用し易くすることが可能となる。

　＜本開示の通信システムの構成例＞
　次に、図６を参照して、本開示の通信システムの構成例について説明する。

　図６の通信システム１０１は、クライアント装置１１１－１乃至１１１－ｎ、サーバ１１２、およびネットワーク１１３より構成される。

　クライアント装置１１１－１乃至１１１－ｎ、およびサーバ１１２は、インターネットや公衆回線等からなるネットワーク１１３を介して、相互にデータやプログラムの授受が可能とされる。

　クライアント装置１１１－１乃至１１１－ｎは、ユーザにより所持される、いわゆるスマートフォンやタブレットなどである。

　尚、以降において、クライアント装置１１１－１乃至１１１－ｎを特に区別する必要がない場合、単にクライアント装置１１１と称するものとし、その他の構成についても同様に称する。

　また、クライアント装置１１１－１乃至１１１－ｎのそれぞれのユーザは、相互の位置関係を認識可能な共通の空間（実空間または仮想空間のいずれでもよい）に存在することを前提する。すなわち、例えば、実空間であれば、複数のユーザは、相互に視認可能な位置関係に存在することを前提とする。

　クライアント装置１１１は、撮像部１３８（図７）を備えており、画像を撮像すると共に、撮像した画像に基づいて、例えば、XR技術を利用した各種のアプリケーションプログラムが実行される際、SLAMを実行し、周囲との位置関係から自己位置推定（位置および姿勢の推定）を実現すると共に、求められた位置と姿勢に基づいて、自らの座標系からなるローカルマップを生成する。

　クライアント装置１１１は、生成したローカルマップをサーバ１１２に送信すると共に、他のクライアント装置１１１からのローカルマップが、統一した基準となる座標系で、結合されることで生成されるグローバルマップを基準とした、位置および姿勢の情報を取得する。

　クライアント装置１１１は、XR機能を利用したアプリケーションプログラムにおいて、取得したグローバルマップを基準とした位置および姿勢の情報に基づいて、各種の画像を重畳表示する。

　クライアント装置１１１は、例えば、AR技術を適用して動作するアプリケーションプログラムを実行させているような場合、取得したグローバルマップを基準とした位置および姿勢の情報に基づいて、AR画像を重畳して表示する。

　これにより、クライアント装置１１１－１乃至１１１－ｎは、いずれも統一された基準座標系で構築されたグローバルマップ上の自らの位置と姿勢に基づいてAR画像を表示することになるため、クライアント装置１１１－１乃至１１１－ｎのそれぞれのユーザは、他のユーザとの位置や姿勢に対応したAR画像を視聴することが可能となる。

　結果として、クライアント装置１１１－１乃至１１１－ｎのユーザは、それぞれ基準座標系で構築されたグローバルマップ上の位置と姿勢に基づいて、自然な角度で重畳されたXR画像を視聴することが可能となるので、リアルタイムで共通の体験を実現することが可能となる。

　サーバ１１２は、ネットワーク１１３上において、クライアント装置１１１－１乃至１１１－ｎで実行されるXR技術を利用したアプリケーションプログラムを運営する団体により管理されるものであり、例えば、単体のサーバコンピュータ、または、クラウドコンピューティングにより実現される構成である。

　サーバ１１２は、クライアント装置１１１－１乃至１１１－ｎでXR技術を利用したアプリケーションプログラムが実行される際に、クライアント装置１１１－１乃至１１１－ｎより送信されてくるローカルマップを取得すると、それぞれのローカルマップを結合することで、統一された基準座標系からなるグローバルマップを生成し、生成したグローバルマップを基準としたクライアント装置１１１－１乃至１１１－ｎの位置および姿勢の情報をそれぞれに送信する。

　また、サーバ１１２は、ローカルマップの結合にあたって、何らかの原因でローカルマップを結合できなかった場合、その原因の種別を特定し、原因の種別に応じて、結合の失敗を解消させるように誘導するガイド情報を生成して、クライアント装置１１１に送信する。

　クライアント装置１１１は、サーバ１１２より送信されてくるローカルマップの結合の失敗を解消させるように誘導するガイド情報を取得すると、そのガイド情報をユーザに対して提示する。

　これにより、ユーザは、ローカルマップの結合に失敗しグローバルマップが取得できないことを認識することが可能になると共に、どのようにすればローカルマップの結合の失敗を解消して、グローバルマップを取得できるのかを認識することが可能となる。

　結果として、ユーザ自らでローカルマップの結合が失敗してしまう状況を解消させることが可能となるので、ユーザに対して、XR技術を利用したアプリケーションプログラムを、快適で、利用し易いものとすることが可能となる。

　＜クライアント装置の構成例＞
　次に、図７を参照して、クライアント装置１１１の構成例について説明する。

　クライアント装置１１１は、制御部１３１、入力部１３２、出力部１３３、記憶部１３４、通信部１３５、ドライブ１３６、およびリムーバブル記憶媒体１３７、撮像部１３８より構成されており、相互にバス１３９を介して接続されており、データやプログラムを送受信することができる。

　制御部１３１は、プロセッサやメモリから構成されており、クライアント装置１１１の動作の全体を制御する。また、制御部１３１は、SLAM処理部１５１、およびAR重畳処理部１５２を備えている。

　SLAM処理部１５１は、撮像部１３８により撮像される画像に基づいて、SLAMを実行し、SLAMの処理結果である自己位置推定結果に基づいて、自らの座標系のローカルマップを生成し記憶部１３４に記憶させる。

　SLAM処理部１５１は、通信部１３５を制御して、記憶部１３４に記憶されているローカルマップをサーバ１１２に送信する。

　SLAM処理部１５１は、通信部１３５を制御してサーバ１１２より送信されてくるグローバルマップを基準とした位置および姿勢の情報を取得して、記憶部１３４に記憶させる。

　SLAM処理部１５１は、グローバルマップを基準とした位置および姿勢の情報を取得した後は、各種のXR技術を利用した各種のアプリケーションプログラムの実行にあたっては、取得したグローバルマップを基準とした位置および姿勢の情報に基づいて処理を実行する。

　SLAM処理部１５１は、サーバ１１２よりローカルマップの結合が失敗したときに送信されてくる、ローカルマップの結合の失敗の原因の種別に応じた、結合の失敗を解消させるように誘導するためのガイド情報を取得し、出力部１３３を構成するディスプレイ等に表示する。

　AR重畳処理部１５２は、AR技術を利用して実現されるアプリケーションプログラムが実行される際、記憶部１３４に記憶されているローカルマップ、または、サーバ１１２より供給されるグローバルマップを基準とした位置および姿勢の情報に基づいて、AR画像を自然な角度に加工して重畳して表示する。

　尚、図７のクライアント装置１１１においては、XR技術のうち、AR画像を表示させるアプリケーションプログラムが実行される例について説明するものとするが、XR技術のその他を利用したものであってもよく、同様にローカルマップまたはグローバルマップに基づいた位置および姿勢の情報によりXR画像が重畳表示されるようにしてもよい。

　入力部１３２は、操作コマンドを入力するキーボード、マウス、タッチパネルや音声を入力するマイクロフォンなどの入力デバイスより構成され、入力された各種の信号を制御部１３１に供給する。

　出力部１３３は、制御部１３１により制御され、表示部、および音声出力部を備えている。出力部１３３は、操作画面や処理結果の画像を、LCD（Liquid Crystal Display）や有機EL（Electro Luminescence）などからなる表示デバイスからなる表示部に出力して表示する。また、出力部１３３は、音声出力デバイスからなる音声出力部を制御して、各種の音声を出力する。

　記憶部１３４は、HDD（Hard Disk Drive）、SSD（Solid State Drive）、または、半導体メモリなどからなり、制御部１３１により制御され、コンテンツデータを含む各種のデータおよびプログラムを書き込む、または、読み出す。

　通信部１３５は、制御部１３１により制御され、有線または無線により、LAN（Local Area Network）やブルートゥース（登録商標）等に代表される通信を実現し、必要に応じてネットワーク１１３を介して、各種の装置との間で各種のデータやプログラムを送受信する。

　ドライブ１３６は、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ(Mini Disc)を含む）、もしくは半導体メモリなどのリムーバブル記憶媒体１３７に対してデータを読み書きする。

　撮像部１３８は、CMOS（Complementary Metal Oxide Semiconductor）イメージセンサなどからなり、制御部１３１により制御されて、画像を撮像する。

　＜サーバの構成例＞
　次に、図８を参照して、サーバ１１２の構成例について説明する。

　サーバ１１２は、制御部２０１、入力部２０２、出力部２０３、記憶部２０４、通信部２０５、ドライブ２０６、およびリムーバブル記憶媒体２０７より構成されており、相互にバス２０８を介して接続されており、データやプログラムを送受信することができる。

　制御部２０１は、プロセッサやメモリから構成されており、サーバ１１２の動作の全体を制御する。また、制御部２０１は、ローカルマップ結合部２２１、位置推定部２２２、およびグローバルマップ更新部２２３を備えている。

　ローカルマップ結合部２２１は、グローバルマップに対するSLAMの初期化処理として、複数のクライアント装置１１１より供給されてくる、それぞれの座標系からなるローカルマップを結合し、統一された基準座標系（グローバル座標系）からなるグローバルマップを生成する。

　ローカルマップ結合部２２１は、ローカルマップの結合にあたって、何らかの原因でローカルマップを結合できなかった場合、その原因の種別を特定し、原因の種別に応じて、結合の失敗を解消させるように誘導するガイド情報を生成して、クライアント装置１１１に送信する。

　位置推定部２２２は、グローバルマップに対するSLAMの初期化処理であるローカルマップが結合されて、グローバルマップが生成された後に、クライアント装置１１１より送信されてくるローカルマップにおける位置および姿勢の情報に基づいて、クライアント装置１１１の、グローバルマップを基準とした位置および姿勢を推定する。

　グローバルマップ更新部２２３は、クライアント装置１１１より送信されてくるローカルマップに基づいて、順次グローバルマップを更新し、環境の変化に応じた更新を続ける。

　尚、入力部２０２、出力部２０３、記憶部２０４、通信部２０５、ドライブ２０６、およびリムーバブル記憶媒体２０７については、図７の入力部１３２、出力部１３３、記憶部１３４、通信部１３５、ドライブ１３６、およびリムーバブル記憶媒体１３７と基本的に同様の構成であるので、その説明は省略する。

　＜ローカルマップおよびグローバルマップを構成するデータ構造＞
　次に、図９を参照して、ローカルマップおよびグローバルマップを構成するデータ構造について説明する。

　ローカルマップおよびグローバルマップは、キーフレームと呼ばれる撮像部１３８により撮像される画像より所定の選択基準により選択された画像から抽出される複数の情報の集合体である。

　より具体的には、キーフレームから抽出される画像内における特徴点であるキーポイントと、その特徴量、画像内の特徴点の２次元座標、特徴点における被写体であるランドマークの３次元空間内における座標（３次元座標）、およびキーフレームとなる画像を撮像したときの撮像部１３８の位置および姿勢からなる。

　例えば、図９で示されるキーフレームＫＦの場合、特徴点であるキーポイントＫＰ１，ＫＰ２の特徴量と、それぞれの座標ＫＰ１（ｘ１，ｙ１），ＫＰ２（ｘ２，ｙ２）、それぞれのランドマークの座標ＬＭ１（ｘ１１，ｙ１１，ｚ１１），ＬＭ２（ｘ１２，ｙ１２，ｚ１２）、およびキーフレームＫＦを撮像したときの撮像部１３８の位置および姿勢Ｐからなる。尚、ここでは、位置および姿勢については、併せて１つの符号「Ｐ」で表現するものとする。

　すなわち、SLAM処理部１５１は、撮像部１３８により連続的に撮像される画像に基づいて、所定の選択基準によりキーフレームＫＦを選択し、キーフレームＫＦよりテクスチャに基づいて特徴点となるキーポイントを決定し、特徴量を抽出する。

　SLAM処理部１５１は、キーフレームＫＦ内におけるキーポイントの２次元座標を特定すると共に、移動視差を利用して各キーポイントに対するランドマークの３次元座標を特定する。

　SLAM処理部１５１は、複数のキーポイントのそれぞれの２次元座標と、対応するランドマークの３次元座標とのペア情報を用いて、キーフレームＫＦを撮像したときの撮像部１３８の位置および姿勢、すなわち、実質的にクライアント装置１１１の位置および姿勢を算出する。

　３点以上のキーポイントのそれぞれの２次元座標と、対応するランドマークの３次元座標とのペア情報が取得されていれば、PnP（Perspective-n-Point）推定法を利用したアルゴリズムにより撮像部１３８の姿勢を推定できることが知られている。

　尚、PnP推定法での姿勢推定については、誤差の影響や同一平面上に３点がある状態を回避する必要があるため、一般的には、RANSAC（Random sample consensus）推定法と呼ばれる手法と組み合わせたPnP-RANSAC法が用いられる。

　RANSAC推定法は、n点のペアで、PnP推定法により推定された姿勢を使って、他のペア情報を画像上に投影したときに、それらがキーポイントと十分近い距離にいる数（inlier数）をカウントし、PnP推定法による姿勢推定に使用されるn点のペア情報をランダムに変えたときに最大のinlier数をもつ姿勢を採用する推定法である。

　ただし、撮像部１３８の姿勢推定は、キーフレームＫＦの全体に一様に分布した100点以上のペアを用いることで、精度よく実現される。

　SLAM処理部１５１は、このように求められた複数のキーフレームＫＦを共通のランドマークで接続することにより、自己位置の推定と周囲のマッピングとを実現する。

　＜SLAMによるローカルマップの生成原理＞
　次に、SLAMによるローカルマップの生成原理について説明する。ここで、例えば、図１０で示されるようなキーフレームＫＦＡ，ＫＦＢ，ＫＦＣが時系列に連続して存在するものとする。

　ここで、図１０のキーフレームＫＦＡは、クライアント装置１１１の座標系ＷにおけるランドマークＬ１１，Ｌ１２を備えており、キーフレームＫＦＢは、クライアント装置１１１の座標系ＷにおけるランドマークＬ１１乃至Ｌ１４を備えており、キーフレームＫＦＣは、クライアント装置１１１の座標系ＷにおけるランドマークＬ１３，Ｌ１４を備えているものとする。

　図１０で示されるように、キーフレームＫＦＡ，ＫＦＢは、共通視野となる領域Ｚ１内に共通のランドマークＬＭ１１，ＬＭ１２を備えている。

　これにより、キーフレームＫＦＡの位置および姿勢ＰＡが既知である場合、SLAM処理部１５１は、共通のランドマークＬＭ１１，ＬＭ１２と、キーフレームＫＦＡの位置および姿勢ＰＡとに基づいて、キーフレームＫＦＢの位置および姿勢ＰＢを推定する。

　また、図１０においては、キーフレームＫＦＢ，ＫＦＣは、相互に共通視野となる領域Ｚ２内に共通のランドマークＬＭ１３，ＬＭ１４を備えている。

　これにより、キーフレームＫＦＢの位置および姿勢ＰＢは上述のように既知となったので、SLAM処理部１５１は、共通のランドマークＬＭ１３，ＬＭ１４と、キーフレームＫＦＢの位置および姿勢ＰＢとに基づいて、キーフレームＫＦＣの位置および姿勢ＰＣを特定する。

　このように、SLAM処理部１５１は、連続するキーフレームＫＦＡ，ＫＦＢ，ＫＦＣの情報に基づいて、撮像部１３８の時系列の位置および姿勢ＰＡ，ＰＢ，ＰＣを推定する。

　また、同様に、SLAM処理部１５１は、連続するキーフレームＫＦＡ，ＫＦＢ，ＫＦＣの情報に基づいて、ランドマークＬ１１乃至Ｌ１４を用いて、撮像部１３８の周囲をマッピングする。

　SLAM処理部１５１は、SLAMを実行することで、このように複数のキーフレームの集合体に基づいて、撮像部１３８の位置および姿勢を推定すると共に、周囲をマッピングすることで、ローカルマップを形成する。

　尚、ここでは、複数のキーフレームの集合体に基づいて再現される撮像部１３８の位置および姿勢の推定結果と、周囲のマッピング結果とからなるものをローカルマップと称しているが、実質的に、複数のキーフレームの集合体がローカルマップのデータ構造であるため、以降においては、複数のキーフレームの集合体そのものを、単に、ローカルマップとも称する。

　また、グローバルマップについても、複数のキーフレームの集合体であることに変わりがないが、ローカルマップは、各キーフレームの座標系が、クライアント装置１１１の個別の座標系であるのに対して、グローバルマップは、複数のクライアント装置１１１において共通となる基準座標系で形成される点で異なる。

　＜ローカルマップの結合＞
　次に、図１１を参照して、ローカルマップの結合について説明する。

　例えば、図１１で示されるように、実線で示されるキーフレームＫＦ１，ＫＦ２から構成されているローカルマップＡと、点線で示されるキーフレームＫＦ１１，ＫＦ１２から構成されているローカルマップＢとを結合させる場合について考える。

　ここで、ローカルマップＡは、キーフレームＫＦ１が、座標系ＷＡのランドマークＬＭ３１，ＬＭ３２を備え、キーフレームＫＦ２が、座標系ＷＡのランドマークＬＭ３３，ＬＭ３４を備えるものとする。

　また、ローカルマップＢにおいては、キーフレームＫＦ１１が、座標系ＷＢのランドマークＬＭ３３，ＬＭ３４を備え、キーフレームＫＦ１２が、座標系ＷＢのランドマークＬＭ３５，ＬＭ３６を備えるものとする。

　この時、共通視野となる領域Ｚ１１において、ローカルマップＡのキーフレームＫＦ２とローカルマップＢのキーフレームＫＦ１１とは、共通のランドマークＬＭ３３，ＬＭ３４を備えている。

　そこで、例えば、座標系ＷＡをグローバルマップにおける基準座標系にする場合、ローカルマップ結合部２２１は、座標系ＷＢのランドマークＬＭ３３，ＬＭ３４の３次元座標と、座標系ＷＡのランドマークＬＭ３３，ＬＭ３４の３次元座標との対応関係に基づいて、キーフレームＫＦ１１における、座標系ＷＢの撮像部１３８の位置および姿勢を、座標系ＷＡの撮像部１３８の位置および姿勢に変換すると共に、座標系ＷＢのランドマークＬＭ３３，ＬＭ３４の３次元座標を、座標系ＷＡのランドマークＬＭ３３，ＬＭ３４の３次元座標に変換する。

　このとき、ローカルマップ結合部２２１は、併せて座標系ＷＢのランドマークＬＭ３３，ＬＭ３４の３次元座標と、座標系ＷＡのランドマークＬＭ３３，ＬＭ３４の３次元座標との対応関係に基づいて、キーフレームＫＦ１２における、座標系ＷＢの撮像部１３８の位置および姿勢を、座標系ＷＡの撮像部１３８の位置および姿勢に変換すると共に、座標系ＷＢのランドマークＬＭ３５，ＬＭ３６の３次元座標を、座標系ＷＡのランドマークＬＭ３５，ＬＭ３６の３次元座標に変換する。

　このような処理により、キーフレームＫＦ１，ＫＦ２，ＫＦ１１，ＫＦ１２のランドマークの３次元座標、並びにそれぞれにおける撮像部１３８の位置および姿勢は、いずれも共通の基準座標系ＷＡのものとされ、座標系の共通化が図られ、ローカルマップＡ，Ｂが結合されて、キーフレームＫＦ１，ＫＦ２，ＫＦ１１，ＫＦ１２からなるグローバルマップが生成されて、グローバルマップに対するSLAMの初期化が実現される。

　＜グローバルマップに対するSLAMの初期化の失敗の原因と解決策＞
　次に、図１２を参照して、グローバルマップに対するSLAMの初期化の失敗の原因と解決策について説明する。

　＜共通視野が得られず失敗する場合＞
　グローバルマップに対するSLAMの初期化の失敗は、大きく２つのケースに分けられ、第１のケースは、ローカルマップ結合で失敗するケースであり、第２のケースは、クライアント装置１１１単体で失敗するケースである。

　ローカルマップ結合で失敗するケースについては、他人との共通視野が得られず結合に失敗する場合と、通信が途中で途切れてしまって失敗するケースが挙げられる。

　他人との共通視野が得られない場合とは、例えば、図１１を参照して説明した共通視野となる領域Ｚ１１が得られず、座標系を変換するために使用する同一のランドマークを備えたキーフレームが存在しないことにより、座標系の変換ができないことに起因する失敗である。

　そこで、この場合、解決策としては、誰との共通視野が得られていないのか、それによって、共通視野を形成するようにするにはどこを写せばよいのかを促すことで、ローカルマップの結合の失敗を解消させる。

　例えば、図１３で示されるように、ユーザ２５１－１乃至２５１－５のそれぞれがクライアント装置１１１－１乃至１１１－５を所持している場合であって、クライアント装置１１１－１乃至１１１－３からなるグループと、クライアント装置１１１－４乃至１１１－５からなるグループとは、それぞれのグループ内においてローカルマップの結合が成功しているが、グループ間でのローカルマップが結合されておらず、結果として失敗している場合について考える。

　このような場合、クライアント装置１１１－１乃至１１１－３のグループに属するいずれかの撮像視野が、クライアント装置１１１－４，１１１－５のグループに属するいずれかの撮像視野と同一になるような画像を撮像することで、共通視野を確保することができ、グループ間のローカルマップが結合されて、結合の失敗が解消される。

　または、クライアント装置１１１－４，１１１－５のグループのいずれかの撮像視野が、クライアント装置１１１－１乃至１１１－３のグループのいずれかの撮像視野と同一になるような画像を撮像することで、共通視野を確保することができ、グループ間のローカルマップが結合されて、結合の失敗が解消される。

　そこで、例えば、図１４で示されるようなガイド情報２６１，２６１’が提示されるようにする。

　すなわち、ガイド情報２６１，２６１’は、いずれもクライアント装置１１１－１乃至１１１－３のグループと、クライアント装置１１１－４，１１１－５のグループとが、それぞれのグループ内においてローカルマップの結合に成功しているが、グループ間での結合に失敗していることが示されている。

　さらに、図１４においては、併せて、「背景がグレーのユーザとの共通視野の確保をお願いします」と表示がなされる。

　より具体的には、図１４の左部は、クライアント装置１１１－１乃至１１１－３のそれぞれにおいて提示されるガイド情報２６１の表示例であり、ユーザ２５１－１乃至２５５－５に対応するそれぞれのアイコン２５１ｖ－１乃至２５５ｖ－３とアイコン２５５ｖ’－４，２５５ｖ’－５が表示されている。

　ガイド情報２６１においては、自らのクライアント装置１１１が属するローカルマップの結合が成功している、クライアント装置１１１－１乃至１１１－３のグループに属するユーザのアイコン２５１ｖ－１乃至２５５ｖ－３は、背景が白く表示され、自らのクライアント装置１１１が属していない、自らのグループとはローカルマップの結合が失敗しているユーザに対応するアイコン２５１ｖ’－４，２５５ｖ’－５は、背景がグレー表示されている。

　このようなガイド情報２６１により、クライアント装置１１１－１乃至１１１－３のユーザ２５１－１乃至２５１－３は、自らがクライアント装置１１１－１乃至１１１－３のグループに属しており、ローカルマップの結合が成功しているが、クライアント装置１１１－４，１１１－５のグループとのローカルマップの結合に失敗していることを認識することができる。

　同様に、図１４の右部は、クライアント装置１１１－４，１１１－５において提示されるガイド情報２６１’の表示例が示されており、ユーザ２５１－１乃至２５５－５に対応するそれぞれのアイコン２５１ｖ’－１乃至２５５ｖ’－３とアイコン２５５ｖ－４，２５５ｖ－５が表示されている。

　そして、ガイド情報２６１’においては、自らのクライアント装置１１１が属するローカルマップの結合が成功している、クライアント装置１１１－４，１１１－５のグループに属するユーザのアイコン２５１ｖ－４，２５５ｖ－５は、背景が白く表示され、自らのクライアント装置１１１が属していない、自らのグループとはローカルマップの結合が失敗しているユーザに対応するアイコン２５１ｖ’－１乃至２５５ｖ’－３は、背景がグレー表示されている。

　このようなガイド情報２６１’により、クライアント装置１１１－４，１１１－５のユーザ２５１－４，２５１－５は、自らがクライアント装置１１１－４，１１１－５のグループに属しており、ローカルマップの結合が成功しているが、クライアント装置１１１－１乃至１１１－３のグループとのローカルマップの結合に失敗していることを認識することができる。

　結果として、クライアント装置１１１－１乃至１１１－５のそれぞれのユーザ２５１－１乃至２５１－５は、ローカルマップの結合に失敗しているユーザ２５１のクライアント装置１１１との共通視野の画像を撮像することで、ローカルマップの結合の失敗を解消し易くできることを認識できる。

　尚、図１４においては、ローカルマップの結合に成功しているクライアント装置１１１のグループが2つである場合のガイド情報２６１，２６１’の例が示されているが、それ以上のグループが提示されていてもよく、その場合、それぞれのアイコン２５１ｖ、２５１ｖ’の背景が白色とグレーで色分けされていたが、それ以上の色で区別されるようにしてもよい。また、図１４の例においては、アイコンで表現される他のユーザの背景の色でローカルマップの結合の成功および失敗が表現される例が示されているが、ローカルマップの結合の成功または失敗が表現できれば、図１４の例以外の手法で表現されるようにしてもよい。例えば、ユーザ毎にローカルマップの結合に失敗したユーザのリストが表示されるようにしてもよい。このとき、併せて、ローカルマップの結合に成功したユーザのリストが表示されるようにしてもよい。

　＜通信が途中で途切れてしまった場合＞
　また、通信が途中で途切れてしまった場合、ローカルマップが適切に取得できない状態となり、ローカルマップの結合が失敗することになる。このような場合、通信の再接続を促す必要がある。

　例えば、図１５で示されるように、「通信が途切れたようです。再接続をお願いします。」といった再接続を促すガイド情報２７１が提示されるようにする。

　＜充分な特徴点が得られない場合＞
　クライアント装置１１１単体で失敗するケースについては、充分な特徴点が得られず結合に失敗する場合と、充分な移動視差が得られず失敗するケースが挙げられる。

　充分な特徴点が得られない場合とは、例えば、撮像した画像内においてテクスチャが不足しており、特徴点が得られない状態である。

　このような場合については、テクスチャが十分にあるシーンを撮像するように促すようなガイド情報が表示されることで、テクスチャにより特徴点を得やすくすることで、結合の失敗を解消させる可能性があることをユーザに認識させることが可能となる。

　例えば、図１６で示されるように、「特徴点が不足しています。テクスチャが充分にある画像の撮像をお願いします。」といったコメントガイド２８１ａと、特徴点ゲージ２８１ｂとを備えたガイド情報２８１が示されるようにして、テクスチャが十分にあるシーンの撮像が必要であることを提示すると共に、どの程度特徴点が必要なのかが提示されるようにして、テクスチャが十分にあるシーンを撮像するように促すようにしてもよい。

　図１６の特徴点ゲージ２８１ｂは、特徴点となるキーポイントの数（２次元座標の情報と、対応するランドマークの３次元座標の情報とのペア情報の数であるペア情報数）について、SLAMの処理に最低限必要なキーポイント数に対する、現在検出されているキーポイント数の割合を、全マス目数に対する白色のマス目の数で表現するものである。

　図１６の特徴点ゲージ２８１ｂは、全マス目が１０個であるのに対して、７個のマス目が白色で表示されているため、特徴点であるキーポイント数として最低限必要なキーポイント数に対して7割のキーポイント数しか得られていないので、ローカルマップの結合に失敗していることが示されている。

　この「特徴点が不足しています。テクスチャが充分にある画像の撮像をお願いします。」といったコメントガイド２８１ａと、特徴点ゲージ２８１ｂとからなるガイド情報２８１が表示されることで、テクスチャが十分にあるシーンの撮像を促すことが可能となる。

　また、ユーザは、特徴点ゲージ２８１ｂが表示されることで、テクスチャが十分にあるシーンを撮像することで、ローカルマップの結合の失敗を解消させる可能性があることを認識できる。

　さらに、特徴点ゲージ２８１ｂにおける白色のマス目が示す全体の割合を見ながら、どの程度キーポイント数が不足しているのかを認識することができる。

　尚、以上においては、特徴点となるキーポイント数のみで特徴点ゲージ２８１ｂが表示される例について説明してきたが、特徴点となるキーポイント数と、その全体の分布も考慮されるようにしてもよい。

　例えば、キーフレームを構成する画像を固定サイズのブロックに区切り、ブロック単位での特徴点となるキーポイント数が、最低限必要とされるキーポイント数よりも多い条件を満たすブロック数をカウントし、SLAMの処理に最低限必要とされる、条件を満たしたブロック数に対する割合を、全マス目数に対する白色のマス目の数で表現するようにしてもよい。

　このようにすることで、ユーザは、特徴点となるキーポイントの２次元座標の情報と、対応するランドマークの３次元座標の情報とのペア情報数と、キーフレームを構成する画像全体において、ペア情報数の情報を満たす領域の分布とを考慮した上で、どの程度のペア情報数が必要であるのかを認識することが可能となる。

　＜充分な移動視差が得られない場合＞
　十分な移動視差が得られない場合、キーポイントに対するランドマークの３次元座標を求めることができず、ローカルマップの結合に失敗する。

　このような場合、クライアント装置１１１を水平方向に移動させて、強制的に移動視差が発生するように促すことで、失敗を解消させることができる。

　そこで、例えば、図１７で示されるように、人物がクライアント装置１１１であるスマホを水平方向に動かしているような表示画像と共に、「スマホを水平に動かしてください」と表記されたガイド情報２９１が表示されるようにしてもよい。

　図１７で示されるようなガイド情報２９１により、ユーザは、移動視差が十分に得られていないことが原因でローカルマップの結合が失敗していることを認識することが可能となり、クライアント装置１１１を水平方向に移動させることで失敗を解消させられる可能性があることを認識することが可能となる。

　＜グローバルマップに対するSLAMの初期化処理＞
　次に、図１８，図１９のフローチャートを参照して、クライアント装置１１１とサーバ１２による、グローバルマップに対するSLAMの初期化処理について説明する。

　尚、図１８は、クライアント装置１１１の処理を説明するフローチャートであり、図１９は、サーバ１１２の処理を説明するフローチャートである。

　ステップＳ１１において、SLAM処理部１５１は、撮像部１３８を起動する。

　ステップＳ１２において、SLAM処理部１５１は、撮像部１３８を制御して、撮像を開始させ、順次、撮像結果を供給させる。

　ステップＳ１３において、SLAM処理部１５１は、ローカルマップに対するSLAMを初期化する。

　ステップＳ１４において、SLAM処理部１５１は、撮像された画像に基づいて、SLAMを実行し、キーフレームを抽出する。

　SLAM処理部１５１は、特徴点をキーポイントとして抽出して２次元座標を特定し、特徴量を算出し、移動視差に基づいてキーポイントに対応するランドマークの３次元座標を算出し、キーポイントの２次元座標とランドマークの３次元座標とのペア情報を検出する。そして、SLAM処理部１５１は、キーフレームの集合体としてローカルマップを生成し、記憶部１３４に格納する。

　ステップＳ１５において、SLAM処理部１５１は、記憶部１３４より格納されているローカルマップを、自らを識別する情報と共に、通信部１３５を制御して、ネットワーク１１３を介してサーバ１１２に送信する。

　ステップＳ３１（図１９）において、サーバ１１２のローカルマップ結合部２２１は、通信部２０５を制御して、ネットワーク１１３を介していずれかのクライアント装置１１１からローカルマップが送信されてきたか否かを判定し、送信されてくるまで同様の処理を繰り返す。

　ステップＳ３１において、クライアント装置１１１よりローカルマップが送信されてくると、処理は、ステップＳ３２に進む。

　ステップＳ３２において、ローカルマップ結合部２２１は、通信部２０５を制御して、クライアント装置１１１より送信されてきたローカルマップを取得し、クライアント装置１１１を識別する情報と対応付けて記憶部２０４に格納する。

　ステップＳ３３において、ローカルマップ結合部２２１は、所定時間が経過したか否かを判定し、経過していないと判定された場合、処理は、ステップＳ３１に戻る。すなわち、所定時間が経過するまで、クライアント装置１１１からのローカルマップの送信を受け付ける処理が繰り返される。

　そして、ステップＳ３３において、所定時間が経過したと判定された場合、処理は、ステップＳ３４に進む。尚、ローカルマップが受け付けられる度に、ステップＳ３４の処理に進むようにしてもよく、この場合、ステップＳ３３の処理は、削除されるようにしてもよい。

　ステップＳ３４において、ローカルマップ結合部２２１は、記憶部２０４に格納されている全てのクライアント装置１１１からのローカルマップを結合する。より詳細には、ローカルマップ結合部２２１は、図１１を参照して説明した手法により、記憶部２０４に格納されている全てのクライアント装置１１１からのローカルマップを結合する処理を繰り返す。

　ステップＳ３５において、ローカルマップ結合部２２１は、ローカルマップの結合が失敗し、グローバルマップに対するSLAMの初期化に失敗したか否かを判定する。

　より詳細には、ステップＳ３４の処理において、全てのローカルマップを結合する処理の過程で、何らかの原因で結合できない状態となったとき、その時点で、ローカルマップの結合が失敗であったと判定される。

　逆に、特に失敗もなく全てのローカルマップが結合できたときには、ローカルマップの結合は失敗しなかった、すなわち、成功したとみなされることになる。

　ステップＳ３５において、ローカルマップの結合が失敗し、グローバルマップに対するSLAMの初期化が失敗したと判定された場合、処理は、ステップＳ３６に進む。

　ステップＳ３６において、ローカルマップ結合部２２１は、結合失敗の原因を特定する。

　ステップＳ３７において、ローカルマップ結合部２２１は、失敗通知処理を実行し、結合失敗の原因に対応する失敗を解消させるためのガイド情報を生成して、クライアント装置１１１に通知し、処理は、ステップＳ３１に戻る。この時、ローカルマップ結合部２２１は、ステップＳ３３における経過時間をリセットすると共に、記憶部２０４内に格納されているローカルマップを消去する。

　すなわち、全てのローカルマップが結合されて、グローバルマップに対するSLAMの初期化が完了するまで、ステップＳ３１乃至Ｓ３７の処理が繰り返される。尚、ステップS37の失敗通知処理については、図２０のフローチャートを参照して、詳細を後述する。

　そして、ステップＳ３５において、ローカルマップの結合が失敗せず、グローバルマップに対するSLAMの初期化が成功したと判定された場合、処理は、ステップＳ３８に進む。

　ステップＳ３８において、ローカルマップ結合部２２１は、通信部２０５を制御して、記憶部２０４に格納されているローカルマップに対応付けて記憶されているクライアント装置１１１に対して、ローカルマップの結合が成功し、グローバルマップに対するSLAMの初期化が完了したことを通知する。

　ステップＳ３９において、ローカルマップ結合部２２１は、生成されたグローバルマップを記憶部２０４に格納させる。これに応じて位置推定部２２２は、グローバルマップに基づいて、各クライアント装置１１１のローカルマップの情報から、それぞれの位置および姿勢を推定し、通信部２０５を制御して、クライアント装置１１１のそれぞれの位置情報をクライアント装置１１１に送信し、処理は、終了する。

　この処理によりグローバルマップに対するSLAMの初期化が完了し、グローバルマップが構成されて、記憶部２０４に格納されると共に、それぞれの位置および姿勢が推定されて、各クライアント装置１１１に送信される。

　また、以降においては、グローバルマップの基準座標系の情報としてクライアント装置１１１より送信されてくるローカルマップに基づいて、グローバルマップ更新部２２３が、記憶部２０４に格納されているグローバルマップを順次更新する処理を繰り返す。

　これに対して、クライアント装置１１１においては、ステップＳ１６（図１８）において、SLAM処理部１５１は、通信部１３５を制御して、サーバ１１２からローカルマップの結合成功が連絡されたか否かを判定する。

　ステップＳ１６において、ローカルマップの結合成功が通知されなかった、すなわち、ローカルマップの結合失敗の原因に応じたガイド情報が通知された場合、処理は、ステップＳ１７に進む。

　ステップＳ１７において、SLAM処理部１５１は、通信部１３５を制御して、サーバ１１２より送信されてくるローカルマップ結合失敗の原因に応じたガイド情報を取得する。

　ステップＳ１８において、SLAM処理部１５１は、出力部１３３の表示部を制御して、取得したガイド情報を提示し、処理は、ステップＳ１４に戻る。

　すなわち、ローカルマップの結合が成功するまで、ステップＳ１４乃至Ｓ１８の処理が繰り返されて、サーバ１１２より送信されてくる、結合失敗の原因に応じたガイド情報が取得されて、ユーザに提示させる処理が繰り返される。

　そして、ステップＳ１６において、ローカルマップの結合成功、すなわち、グローバルマップに対するSLAMの初期化が成功したことが通知されると、処理は、ステップＳ１７に進む。

　ステップＳ１９において、SLAM処理部１５１は、通信部１３５を制御して、サーバ１１２より送信されてくる、グローバルマップの基準座標系における自身の位置および姿勢の情報を取得する。

　これにより、以降において、SLAM処理部１５１は、自らのSLAMの処理において生成されるローカルマップをグローバルマップの基準座標系の情報として生成することが可能となり、順次、サーバ１１２に送信することで、サーバ１１２におけるグローバルマップの更新を実現させることが可能となる。

　以上の処理により、ローカルマップの結合が成功するまで、結合の失敗の原因に応じたガイド情報が表示されることになるので、ユーザは、結合失敗の原因を認識することが可能になると共に、失敗を解消させることができる可能性のある動作が、ガイド情報として提示されることで、ユーザ自身の行動により、結合失敗を解消させ易くすることが可能となる。

　＜失敗通知処理＞
　次に、図２０のフローチャートを参照して、失敗通知処理について説明する。

　ステップＳ５１において、ローカルマップ結合部２２１は、ローカルマップの結合失敗の原因が、クライアント装置１１１単体による結合失敗か否かを判定する。

　ステップＳ５１において、クライアント装置１１１単体による結合失敗であると判定された場合、処理は、ステップＳ５２に進む。

　ステップＳ５２において、ローカルマップ結合部２２１は、結合失敗の原因が十分な特徴点が得られないことであるか否かを判定する。

　ステップＳ５２において、結合失敗の原因が十分な特徴点（キーポイント）が得られないことであると判定された場合、処理は、ステップＳ５３に進む。

　ステップＳ５３において、ローカルマップ結合部２２１は、テクスチャが十分にあるシーンを撮像するように促すガイド情報を生成し、通信部２０５を制御して、クライアント装置１１１に送信する。

　テクスチャが十分にあるシーンを撮像するように促すガイド情報とは、例えば、図１６を参照して説明したコメントガイド２８１ａと特徴点ゲージ２８１ｂとを含むガイド情報２８１などであり、特徴点ゲージ２８１ｂが表示されることで、充分な特徴点が得られていないことをユーザに認識させることが可能になる。また、ユーザは、特徴点ゲージ２８１ｂの白色のマス目の割合を見ながら、テクスチャが十分なシーンの撮像がなされているのか否かを認識することができる。

　これによりユーザは、様々な画像を撮像しながら、どのシーンの画像においてテクスチャが充分な画像となるのかを認識しながら、シーンを選んで撮像することが可能となり、結果として、ローカルマップの結合、すなわち、グローバルマップに対するSLAMの初期化を成功へと誘導させることが可能となる。

　ステップＳ５２において、結合失敗の原因が十分な特徴点が得られないことではないと判定された場合、処理は、ステップＳ５４に進む。

　ステップＳ５４において、ローカルマップ結合部２２１は、充分な移動視差が得られず、ランドマークの３次元座標が求められないことが原因であるか否かを判定する。

　ステップＳ５４において、充分な移動視差が得られず、ランドマークの３次元座標が求められないことが原因であると判定された場合、処理は、ステップＳ５５に進む。

　ステップＳ５５において、ローカルマップ結合部２２１は、クライアント装置を水平方向に動かすように促すガイド情報を生成し、通信部２０５を制御して、クライアント装置１１１に送信する。

　クライアント装置を水平方向に動かすように促すガイド情報とは、例えば、図１７を参照して説明したガイド情報２９１などであり、ガイド情報２９１が表示されることで、充分な移動視差が得られず、ランドマークの３次元座標が求められないことが結合失敗の原因であることをユーザに認識させることが可能になる。また、ガイド情報２８１により、ユーザは、クライアント装置１１１を水平方向に移動させることでローカルマップの結合の失敗を解消させられる可能性があることを認識できる。

　これによりユーザは、強制的に移動視差が生じる動作をすることが可能となり、結果として、ローカルマップの結合、すなわち、グローバルマップに対するSLAMの初期化を成功へと誘導させることが可能となる。

　ステップＳ５１において、クライアント装置１１１単体による結合失敗ではないと判定された場合、ローカルマップの結合時の失敗であるとみなされ、処理は、ステップＳ５６に進む。

　ステップＳ５６において、ローカルマップ結合部２２１は、複数のローカルマップ間において、共通視野が得られていないことが結合失敗の原因であるか否かを判定する。

　ステップＳ５６において、複数のローカルマップ間において、共通視野が得られていないことが結合失敗の原因であると判定された場合、処理は、ステップＳ５７に進む。

　ステップＳ５７において、ローカルマップ結合部２２１は、共通視野が得られる画像の撮像を促すガイド情報を生成して、通信部２０５を制御して、クライアント装置１１１に送信する。

　ここで、共通視野が得られる画像の撮像を促すガイド情報とは、例えば、図１４を参照して説明したようなガイド情報２６１，２６１’であり、誰のクライアント装置１１１とのローカルマップの結合が成功しており、誰のクライアント装置１１１のローカルマップとの結合が失敗しているのかが表示されることにより、誰のクライアント装置１１１と同一の共通視野の画像を撮像すればよいのかを認識することが可能となる。

　これにより、ユーザは、例えば、ローカルマップの結合が失敗しているユーザと申し合わせて、同一の被写体を撮像するような動作をすることが可能となり、これにより共通視野を発生させることが可能となる。

　結果として、ローカルマップの結合を成功へと誘導させることが可能となる。

　ステップＳ５６において、複数のローカルマップ間において、共通視野が得られていないことが結合失敗の原因ではないと判定された場合、処理は、ステップＳ５８に進む。

　ステップＳ５８において、ローカルマップ結合部２２１は、ローカルマップの結合失敗の原因が、通信が途絶えたことであるか否かを判定する。

　ステップＳ５８において、ローカルマップの結合失敗の原因が、通信が途絶えたことであると判定された場合、処理は、ステップＳ５９に進む。

　ステップＳ５９において、ローカルマップ結合部２２１は、再接続を促すガイド情報を生成して、通信部２０５を制御して、クライアント装置１１１に送信する。

　ここで、再接続を促すガイド情報とは、例えば、図１５を参照して説明したガイド情報２７１などの表示であり、これにより、原因が、通信が途絶えたことが結合失敗の原因であることを認識させることが可能になる。また、ユーザは、再接続により失敗を解消させられる可能性があることを認識することが可能となる。

　これにより、ユーザは、例えば、通信部１３５を制御させて、再接続するような動作をさせることが可能となる。

　ステップＳ５４において、充分な移動視差が得られないことが原因ではないと判定された場合、または、ステップＳ５８において、通信が途絶えたことが原因ではないと判定された場合、処理は、ステップＳ６０に進む。

　ステップＳ６０において、ローカルマップ結合部２２１は、通信部２０５を制御し、原因が特定できないが、ローカルマップの結合が失敗しており、グローバルマップに対するSLAMの初期化が実現できていないことを通知する。

　これにより、ユーザは、充分な特徴点としてのキーポイントが得られていないこと、充分な移動視差が得られていないこと、共通視野が得られていないこと、および通信が途絶えたこと以外の何等かの原因でローカルマップの結合が失敗していることを認識することが可能となる。

　以上の処理により、ローカルマップの結合が失敗し、グローバルマップに対するSLAMの初期化が失敗したことが原因と共に通知され、さらに、原因に応じた失敗を解消させるためのガイド情報が提示される。

　これにより、ユーザは、ローカルマップの結合、すなわち、グローバルマップに対するSLAMの初期化が失敗したことを、原因と共に認識することが可能になる。

　また、ユーザは、原因に応じた失敗を解消させるためのガイド情報が提示されることにより、ローカルマップの結合が失敗しても、自らの行動によりローカルマップの結合を成功させるようにすることが可能となる。

　結果として、XR技術を適用したアプリケーションプログラムを、より快適に利用することが可能となる。

　＜＜２．応用例＞＞
　以上においては、ローカルマップの結合、すなわち、グローバルマップに対するSLAMの初期化が失敗し、その原因が、共通視野が得られていない場合については、図１４で示されるようなガイド情報により、自らのローカルマップが、誰のローカルマップと結合されて、誰のローカルマップと結合されていないのかを認識することで、ローカルマップが結合されていないユーザと申しわせて、共通視野が得られるように撮像することで、結合失敗を解消させる例について説明してきた。

　しかしながら、自らのローカルマップが結合されていないユーザのクライアント装置１１１において撮像されている画像に対して、物体認識処理を掛け、その物体認識結果から、共通視野を形成する上で必要とされる被写体を特定し、特定した被写体の撮像を促すガイド情報が提示されるようにしてもよい。

　例えば、図２１で示されるように、ユーザ２５１－５１が所持するクライアント装置１１１－５１において、花からなる被写体３０１が撮像され、物体認識処理により「花」であることが認識されると、クライアント装置１１１－５１は、ローカルマップをサーバ１１２に送信する際、「花」という物体認識結果を対応付けて送信する。

　サーバ１１２は、グローバルマップに対するSLAMの初期化処理として、ローカルマップを結合する際、共通視野が得られないことで、クライアント装置１１１－５１とローカルマップを結合できないクライアント装置１１１－５２に対して、物体認識結果である「花」の情報に基づいて、図２１のクライアント装置１１１－５２で示されるような、「花を写してください」といったガイド情報３０２を生成して、送信する。

　クライアント装置１１１－５２は、「花を写してください」といったガイド情報３０２を取得すると、出力部１１３－５２の出力部１３３の表示部を制御して、提示する。

　これにより、ユーザ２５１－５２は、自らが所持するクライアント装置１１１－５２が、どのユーザ２５１が所持したクライアント装置１１１との間でローカルマップの結合が失敗しているのかを認識することはできないが、ローカルマップの結合が失敗していることを認識することができる。

　また、ユーザ２５１－５２は、図２１で示されるようなガイド情報３０２が提示されることにより、自らが所持するクライアント装置１１１－５２で、「花」からなる被写体３０１を撮像することで、結合の失敗を解消させられる可能性があることを認識することが可能となる。

　＜クライアント装置の応用例＞
　次に、図２２を参照して、共通視野を形成する上で必要とされる被写体の撮像を促すガイド情報が提示されるようにしたクライアント装置の構成例について説明する。

　図２２のクライアント装置１１１’は、基本的には、図７のクライアント装置１１１と同一の機能を備えているが、新たに物体認識部３１１を備えている点で異なる。

　物体認識部３１１は、例えば、ディープラーニングなどの機械学習により画像に基づいて物体を認識する構成であり、SLAM処理部１５１においてキーフレームとして使用される画像内の物体認識処理を実行し、物体認識結果をSLAM処理部１５１に供給する。

　SLAM処理部１５１は、ローカルマップを生成すると共に、対応する物体認識結果を付与して、通信部１３５を制御して、サーバ１１２に送信する。また、サーバ１１２から図２１のようなガイド情報３０２送信されてくると、SLAM処理部１５１は、ガイド情報３０２を取得して、出力部１３３の表示部を制御して、提示する。

　ここでは、サーバ１１２のローカルマップ結合部２２１は、共通視野が得られず結合に失敗する場合、例えば、図２１で示されるように、物体認識結果と共にローカルマップを送信してくるクライアント装置１１１－５１との共通視野が得られていないクライアント装置１１１－５２に対して、物体認識結果に基づいて、図２１のガイド情報３０２を生成して、送信する。

　＜SLAM初期化処理の応用例＞
　次に、図２３のフローチャートを参照して、図２２のクライアント装置１１１’によるSLAM初期化処理について説明する。尚、図２３のフローチャートのステップＳ１１１乃至Ｓ１１４，Ｓ１１７乃至Ｓ１２０の処理は、図１８のステップＳ１１乃至Ｓ１４，Ｓ１６乃至Ｓ１９の処理と同様であるので、その説明は省略する。

　すなわち、ステップＳ１１１乃至Ｓ１１４の処理により、ローカルマップが生成されると、処理は、ステップＳ１１５に進む。

　ステップＳ１１５において、物体認識部３１１は、キーフレームとして使用される画像内の物体認識処理を実行し、物体認識結果をSLAM処理部１５１に供給する。

　ステップＳ１１６において、SLAM処理部１５１は、生成したローカルマップと、物体認識結果とを対応付けて、通信部１３５を制御して、サーバ１１２に送信する。

　この処理により、サーバ１１２においては、失敗通知処理において、共通視野が得られず結合に失敗しているときには、図２１で示されるようなガイド情報３０２が生成されて、ステップＳ１１８において、取得され、ステップＳ１１９において提示される。

　尚、サーバ１１２におけるSLAM初期化処理については、図１９のフローチャートを参照して説明した処理と同様であるので、その説明は省略する。

　＜失敗通知処理の応用例＞
　次に、図２４のフローチャートを参照して、サーバ１１２による失敗通知処理の応用例について説明する。

　尚、図２４のフローチャートにおけるステップＳ１５１乃至Ｓ１５６，Ｓ１５８乃至Ｓ１６０の処理については、図２０のステップＳ５１乃至Ｓ５６，Ｓ５８乃至Ｓ６０の処理と同様であるので、その説明は省略する。

　すなわち、ステップＳ１５６において、複数のローカルマップ間において、共通視野が得られていないことが結合失敗の原因であると判定された場合、処理は、ステップＳ１５７に進む。

　ステップＳ１５７において、ローカルマップ結合部２２１は、共通視野が得られる画像の撮像を促すガイド情報を生成して、通信部２０５を制御して、クライアント装置１１１に送信する。

　ここで、共通視野が得られる画像の撮像を促すガイド情報とは、例えば、図２１を参照して説明したようなガイド情報３０２であり、ローカルマップ結合部２２１は、クライアント装置１１１より供給されるローカルマップに付されている物体認識結果に基づいて、ローカルマップの結合が失敗している他のクライアント装置１１１に対して、物体認識結果に対応する被写体の撮像を促すようなガイド情報を生成する。

　ガイド情報３０２が提示されることにより、ユーザは、どのクライアント装置１１１とのローカルマップの結合ができていないのかを認識することはできないが、対象となる被写体を撮像することで同一の共通視野を含む画像が撮像できることを認識することが可能となる。

　これにより、ユーザは、例えば、ローカルマップの結合が失敗している他のクライアント装置１１１と同一の被写体を撮像するような動作をすることが可能となり、これにより共通視野を発生させることが可能となる。

　結果として、ローカルマップの結合、すなわち、グローバルマップに対するSLAMの初期化を成功へと誘導させることが可能となる。

　尚、以上においては、サーバ１１２が、クライアント装置１１１からのローカルマップを取得し、結合してグローバルマップを生成すると共に、結合の失敗が発生した場合に、失敗の原因に応じたガイド情報を送信する例について説明してきた。

　しかしながら、クライアント装置１１１が高機能化して、サーバ１１２と同等の処理を実現できるような場合については、複数のクライアント装置１１１のいずれかが代表し、サーバ１１２としての機能を実現するようにしてもよい。

　＜＜３．ソフトウェアにより実行させる例＞＞
　ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどに、記録媒体からインストールされる。

　図２５は、汎用のコンピュータの構成例を示している。このコンピュータは、CPU(Central Processing Unit)１００１を内蔵している。CPU１００１にはバス１００４を介して、入出力インタフェース１００５が接続されている。バス１００４には、ROM(Read Only Memory)１００２およびRAM(Random Access Memory)１００３が接続されている。

　入出力インタフェース１００５には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部１００６、処理操作画面や処理結果の画像を表示デバイスに出力する出力部１００７、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部１００８、LAN（Local Area Network）アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部１００９が接続されている。また、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ(Mini Disc)を含む）、もしくは半導体メモリなどのリムーバブル記憶媒体１０１１に対してデータを読み書きするドライブ１０１０が接続されている。

　CPU１００１は、ROM１００２に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブル記憶媒体１０１１ら読み出されて記憶部１００８にインストールされ、記憶部１００８からRAM１００３にロードされたプログラムに従って各種の処理を実行する。RAM１００３にはまた、CPU１００１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　以上のように構成されるコンピュータでは、CPU１００１が、例えば、記憶部１００８に記憶されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記憶媒体１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記憶媒体１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記憶部１００８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　尚、図２２におけるCPU１００１が、図７，図８，図２２の制御部１３１，２０１の機能を実現させる。

　また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本開示は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　尚、本開示は、以下のような構成も取ることができる。
＜１＞　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成する生成部を備え、
　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　情報処理装置。
＜２＞　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗の原因の種別に応じて、前記失敗を解決するガイド情報を提示させる
　＜１＞に記載の情報処理装置。
＜３＞　前記ローカルマップの結合の失敗の原因の種別は、前記ローカルマップの結合時に生じる原因と、前記ローカルマップの生成時に生じる原因とを含む
　＜２＞に記載の情報処理装置。
＜４＞　前記ローカルマップの結合の失敗の原因の種別のうち、前記ローカルマップの結合時に生じる原因は、前記ローカルマップを構成するキーフレームに共通視野が含まれていないことで生じる原因と、前記ローカルマップの転送に係る通信が途切れたことで生じる原因とを含む
　＜３＞に記載の情報処理装置。
＜５＞　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの結合時に生じる原因であって、前記ローカルマップを構成するキーフレームに共通視野が含まれていないことで生じる原因である場合、前記生成部は、前記共通視野が含まれる画像を撮像するように促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜４＞に記載の情報処理装置。
＜６＞　前記生成部は、前記ローカルマップの結合が成功している前記他の情報処理装置のグループと、前記ローカルマップの結合が失敗している前記他の情報処理装置のグループとを示し、前記ローカルマップの結合が失敗している前記グループに属する前記他の情報処理装置との前記共通視野を含む画像の撮像を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜５＞に記載の情報処理装置。
＜７＞　前記生成部は、前記ローカルマップの結合が失敗している前記他の情報処理装置が撮像している被写体の情報を示し、前記被写体の撮像を促すことで、前記共通視野を含む画像の撮像を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜５＞に記載の情報処理装置。
＜８＞　前記被写体は、前記ローカルマップの結合が失敗している前記他の情報処理装置により生成されるローカルマップを構成するキーフレームとなる画像の物体認識結果である
　＜７＞に記載の情報処理装置。
＜９＞　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの結合時に生じる原因であって、前記ローカルマップの転送に係る通信が途切れたことで生じる原因である場合、前記生成部は、前記通信の再接続を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜４＞に記載の情報処理装置。
＜１０＞　前記ローカルマップの結合の失敗の原因の種別のうち、前記ローカルマップの生成時に生じる原因は、前記ローカルマップを構成するキーフレームより充分な数のキーポイントが得られないことで生じる原因と、前記キーフレームにおけるランドマークの３次元座標を得るための移動視差が得られないことで生じる原因とを含む
　＜３＞に記載の情報処理装置。
＜１１＞　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの生成時に生じる原因であって、前記ローカルマップを構成するキーフレームより充分な数のキーポイントが得られないことで生じる原因である場合、前記生成部は、テクスチャが充分にある画像を撮像するように促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜１０＞に記載の情報処理装置。
＜１２＞　前記生成部は、前記テクスチャが充分にある画像を撮像するように促す情報と、必要最低限とされるキーポイント数に対する、現在の前記キーフレームより得られているキーポイント数の割合を示す情報とを、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜１１＞に記載の情報処理装置。
＜１３＞　前記生成部は、前記テクスチャが充分にある画像を撮像するように促す情報と、前記キーフレームを固定サイズの領域で分割したときの、領域単位で必要最低限とされるキーポイント数よりも多くのキーポイントが得られている条件を満たす領域数の、必要最低限とされている領域数に対する割合を示す情報とを、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜１１＞に記載の情報処理装置。
＜１４＞　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの生成時に生じる原因であって、前記キーフレームにおけるランドマークの３次元座標を得るための移動視差が得られないことで生じる原因である場合、前記生成部は、水平方向に移動しながら画像を撮像することを促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　＜１０＞に記載の情報処理装置。
＜１５＞　前記生成部は、異なる他の情報処理装置において生成されたローカルマップを構成するキーフレーム間の共通するランドマークの３次元座標に基づいて、共通の座標系に変換することで、前記ローカルマップを結合する
　＜１＞乃至＜１４＞のいずれかに記載の情報処理装置。
＜１６＞　前記ローカルマップは、前記他の情報処理装置において実行されるSLAM（Simultaneous Localization And Mapping）により生成される
　＜１＞乃至＜１５＞のいずれかに記載の情報処理装置。
＜１７＞　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成し、
　前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　ステップを含む情報処理方法。
＜１８＞　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成する生成部としてコンピュータを機能させ、
　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　プログラム。

　１０１　通信システム，　１１１，１１１－１乃至１１１－ｎ　クライアント装置，　１１２　サーバ，　１５１　SLAM処理部，　１５２　AR重畳処理部，　２２１　ローカルマップ結合部，　２２２　位置推定部，　２２３　グローバルマップ更新部，　３１１　物体認識部

Claims

　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成する生成部を備え、
　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　情報処理装置。
　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗の原因の種別に応じて、前記失敗を解決するガイド情報を提示させる
　請求項１に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因の種別は、前記ローカルマップの結合時に生じる原因と、前記ローカルマップの生成時に生じる原因とを含む
　請求項２に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因の種別のうち、前記ローカルマップの結合時に生じる原因は、前記ローカルマップを構成するキーフレームに共通視野が含まれていないことで生じる原因と、前記ローカルマップの転送に係る通信が途切れたことで生じる原因とを含む
　請求項３に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの結合時に生じる原因であって、前記ローカルマップを構成するキーフレームに共通視野が含まれていないことで生じる原因である場合、前記生成部は、前記共通視野が含まれる画像を撮像するように促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項４に記載の情報処理装置。
　前記生成部は、前記ローカルマップの結合が成功している前記他の情報処理装置のグループと、前記ローカルマップの結合が失敗している前記他の情報処理装置のグループとを示し、前記ローカルマップの結合が失敗している前記グループに属する前記他の情報処理装置との前記共通視野を含む画像の撮像を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項５に記載の情報処理装置。
　前記生成部は、前記ローカルマップの結合が失敗している前記他の情報処理装置が撮像している被写体の情報を示し、前記被写体の撮像を促すことで、前記共通視野を含む画像の撮像を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項５に記載の情報処理装置。
　前記被写体は、前記ローカルマップの結合が失敗している前記他の情報処理装置により生成されるローカルマップを構成するキーフレームとなる画像の物体認識結果である
　請求項７に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの結合時に生じる原因であって、前記ローカルマップの転送に係る通信が途切れたことで生じる原因である場合、前記生成部は、前記通信の再接続を促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項４に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因の種別のうち、前記ローカルマップの生成時に生じる原因は、前記ローカルマップを構成するキーフレームより充分な数のキーポイントが得られないことで生じる原因と、前記キーフレームにおけるランドマークの３次元座標を得るための移動視差が得られないことで生じる原因とを含む
　請求項３に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの生成時に生じる原因であって、前記ローカルマップを構成するキーフレームより充分な数のキーポイントが得られないことで生じる原因である場合、前記生成部は、テクスチャが充分にある画像を撮像するように促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項１０に記載の情報処理装置。
　前記生成部は、前記テクスチャが充分にある画像を撮像するように促す情報と、必要最低限とされるキーポイント数に対する、現在の前記キーフレームより得られているキーポイント数の割合を示す情報とを、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項１１に記載の情報処理装置。
　前記生成部は、前記テクスチャが充分にある画像を撮像するように促す情報と、前記キーフレームを固定サイズの領域で分割したときの、領域単位で必要最低限とされるキーポイント数よりも多くのキーポイントが得られている条件を満たす領域数の、必要最低限とされている領域数に対する割合を示す情報とを、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項１１に記載の情報処理装置。
　前記ローカルマップの結合の失敗の原因が、前記ローカルマップの生成時に生じる原因であって、前記キーフレームにおけるランドマークの３次元座標を得るための移動視差が得られないことで生じる原因である場合、前記生成部は、水平方向に移動しながら画像を撮像することを促す情報を、前記ローカルマップの結合の失敗を解決する前記ガイド情報として提示させる
　請求項１０に記載の情報処理装置。
　前記生成部は、異なる他の情報処理装置において生成されたローカルマップを構成するキーフレーム間の共通するランドマークの３次元座標に基づいて、共通の座標系に変換することで、前記ローカルマップを結合する
　請求項１に記載の情報処理装置。
　前記ローカルマップは、前記他の情報処理装置において実行されるSLAM（Simultaneous Localization And Mapping）により生成される
　請求項１に記載の情報処理装置。
　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成し、
　前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　ステップを含む情報処理方法。
　複数の他の情報処理装置のそれぞれにおいて生成されるローカルマップを結合することによりグローバルマップを生成する生成部としてコンピュータを機能させ、
　前記生成部は、前記ローカルマップの結合に失敗した場合、前記ローカルマップの結合の失敗を解決するガイド情報を提示させる
　プログラム。