JP2024081356A - Information processing device, information processing method, and program - Google Patents
Information processing device, information processing method, and program Download PDFInfo
- Publication number
- JP2024081356A JP2024081356A JP2022194922A JP2022194922A JP2024081356A JP 2024081356 A JP2024081356 A JP 2024081356A JP 2022194922 A JP2022194922 A JP 2022194922A JP 2022194922 A JP2022194922 A JP 2022194922A JP 2024081356 A JP2024081356 A JP 2024081356A
- Authority
- JP
- Japan
- Prior art keywords
- image
- mode
- subject
- information processing
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 78
- 238000003672 processing method Methods 0.000 title claims description 3
- 238000000034 method Methods 0.000 claims description 63
- 230000008569 process Effects 0.000 claims description 52
- 239000002131 composite material Substances 0.000 claims description 40
- 230000015572 biosynthetic process Effects 0.000 claims description 31
- 238000003786 synthesis reaction Methods 0.000 claims description 31
- 239000000203 mixture Substances 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 4
- 230000036544 posture Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 20
- 230000015654 memory Effects 0.000 description 7
- 230000001133 acceleration Effects 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Processing Or Creating Images (AREA)
- Transforming Electric Information Into Light Information (AREA)
- Editing Of Facsimile Originals (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、撮像された画像にオブジェクト情報を重畳する情報処理技術に関する。 The present invention relates to an information processing technology that superimposes object information onto a captured image.
AR(オーグメンテッドリアリティ、拡張現実感)技術を利用した仮想試着のサービスが展開されている。仮想試着サービスでは、カメラで撮像された人物画像の位置姿勢を推定し、その推定した位置姿勢に応じた衣料品画像を生成して人物画像に重畳して表示することにより、その人物が衣料品を着用した際の見えを表現する。近年、CG(コンピュータグラフィックス)技術や撮像技術、計算機性能の向上によって、仮想試着サービスはスマートフォン等の携帯端末上のアプリケーションプログラム(以下、アプリケーションとする)でも提供されるようになっている。スマートフォンにおいて仮想試着サービスを用いる場合には、内蔵カメラで撮像された人物画像に衣料品画像を重畳して内蔵ディスプレイに表示するようなことが行われる。 Virtual try-on services that use AR (Augmented Reality) technology are being developed. In virtual try-on services, the position and orientation of a person's image captured by a camera are estimated, and a clothing image corresponding to the estimated position and orientation is generated and displayed superimposed on the person's image, thereby expressing how the person will look when wearing the clothing. In recent years, with improvements in CG (computer graphics) technology, imaging technology, and computer performance, virtual try-on services are also being provided through application programs (hereinafter referred to as applications) on mobile devices such as smartphones. When using a virtual try-on service on a smartphone, a clothing image is superimposed on a person's image captured by a built-in camera and displayed on the built-in display.
ここで、スマートフォンは、内蔵カメラとして、表示画面と同じ面側に配されたインカメラと、表示画面に対して背面側に配されたアウトカメラとを備えていることが多い。そしてスマートフォンにおいてインカメラで撮像した画像を表示する際には、鏡に映る被写体の見え方を再現するために、撮像された画像の左右を反転させて表示するのが一般的である。つまり実在の鏡に映る被写体の像は左右が反転した鏡像であるため、インカメラで撮像された画像は、左右が反転された画像として表示される。一方、アウトカメラにて撮像された画像を表示する際には、その撮像画像の左右を反転させることなくそのまま表示される。このため、スマートフォンにおいて仮想試着サービスを用いた場合、インカメラで撮像された被写体画像には左右反転させた衣料品画像が重畳され、一方、アウトカメラで撮像された被写体画像には左右反転していない衣料品画像が重畳される。 Here, a smartphone often has built-in cameras, an in-camera arranged on the same side as the display screen, and an out-camera arranged on the rear side of the display screen. When displaying an image captured by the in-camera on a smartphone, the captured image is generally displayed with left and right inverted to reproduce the way the subject appears in a mirror. In other words, since the image of the subject reflected in a real mirror is a mirror image with left and right inverted, the image captured by the in-camera is displayed as an inverted image. On the other hand, when displaying an image captured by the out-camera, the captured image is displayed as is without being inverted. For this reason, when using a virtual fitting service on a smartphone, a left-right inverted clothing image is superimposed on the subject image captured by the in-camera, while a non-left-right inverted clothing image is superimposed on the subject image captured by the out-camera.
特許文献1には、外側撮像装置で撮像された画像であるか、或いは内側撮像装置で撮像された画像であるかに応じて、オブジェクトの画像を自動的に左右反転して撮像画像に重畳する手法が開示されている。
しかしながら、特許文献1は、実在の鏡に映っている被写体像を撮像することを考慮していないため、被写体に対してオブジェクトの左右関係が適切に整合していない重畳画像が表示される場合がある。
However, since
そこで、本発明は、被写体に対して左右関係が整合したオブジェクト情報を重畳した画像の表示を可能にすることを目的とする。 The present invention aims to make it possible to display an image in which object information that is consistent with the left-right relationship of the subject is superimposed.
本発明の情報処理装置は、被写体の画像を取得する画像取得手段と、前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得手段と、前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成手段と、前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付手段と、前記合成手段にて生成された合成画像を表示する表示制御手段と、を有することを特徴とする。 The information processing device of the present invention is characterized by having an image acquisition means for acquiring an image of a subject, an object acquisition means for acquiring object information to be superimposed on the image of the subject, a synthesis means including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without left-right inversion, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information that has been left-right inverted, a reception means for receiving an instruction to switch to either the first mode or the second mode, and a display control means for displaying the synthetic image generated by the synthesis means.
本発明によれば、被写体に対して左右関係が整合したオブジェクト情報を重畳した画像の表示が可能となる。 The present invention makes it possible to display an image in which object information that is aligned with the left-right relationship of the subject is superimposed.
以下、本発明に係る実施形態を、図面を参照しながら説明する。以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。実施形態の構成は、本発明が適用される装置の仕様や各種条件(使用条件、使用環境等)によって適宜修正又は変更され得る。また、以下の実施形態において、同一の構成には同じ参照符号を付し、重複する説明は省略する。 The following describes an embodiment of the present invention with reference to the drawings. The following embodiment does not limit the present invention, and not all of the combinations of features described in the present embodiment are necessarily essential to the solution of the present invention. The configuration of the embodiment may be modified or changed as appropriate depending on the specifications of the device to which the present invention is applied and various conditions (conditions of use, environment of use, etc.). In the following embodiments, the same components are given the same reference symbols, and duplicated descriptions are omitted.
<第1の実施形態>
本実施形態では、情報処理装置としてスマートフォン型の情報端末を例に挙げる。本実施形態の情報処理装置には、被写体を撮像した画像に対して所定のオブジェクト画像を重畳した合成画像を生成して表示するアプリケーションプロブラムが実装されている。本実施形態では、被写体の一例として人物を挙げ、また所定のオブジェクト画像の一例として衣料品のオブジェクト画像を挙げる。すなわち本実施形態では、被写体である人物を撮像した画像に対して衣料品オブジェクト画像を重畳した合成画像を生成して表示する仮想試着アプリケーションプロブラム(以下、試着アプリケーションとする)を例に挙げる。本実施形態の試着アプリケーションでは、被写体の人物を撮像した画像からその人物の位置姿勢を推定し、当該推定した位置姿勢に沿うような衣料品オブジェクト画像を生成して被写体の画像に重畳した合成画像を生成して表示する。これにより、その被写体の人物が仮想的に衣料品を着用した際の見えを提供可能とする。
スマートフォンのインカメラでは被写体の全身が画角内に収まらない場合や、衣料品を着用した状態が他人からどのように見えるのかを確認したい場合、ユーザは、実在の鏡に映っている被写体像をアウトカメラで撮像することがある。実在の鏡に映っている被写体像は左右が反転した鏡像であり、一方、アウトカメラで撮像された被写体の画像は左右を反転させていない画像となる。このため仮想試着サービスを用いた場合、鏡に映っている被写体像をアウトカメラで撮影した被写体の画像に衣料品画像が重畳された画像は、被写体に対して衣料品の左右関係が適切に整合していない画像になってしまう。このため、鏡に映った左右反転した鏡像を撮像した画像を用いた場合であっても、被写体に対して左右関係が整合した衣料品等のオブジェクト情報を重畳した画像の表示を可能にすることが望まれる。
そこで本実施形態の試着アプリケーションは、被写体の画像にオブジェクト画像を重畳して合成画像を生成する際の生成モードとして、第1の生成モードと第2の生成モードを有している。第1の生成モードは、被写体を撮像して得られた画像に対して、被写体の位置姿勢に応じたオブジェクト画像を重畳して合成画像を生成するモード(以下、通常モードとする)である。第2の生成モードは、被写体の位置姿勢に応じた所定のオブジェクト画像を左右反転させ、その左右反転したオブジェクト画像を被写体の画像に重畳して合成画像を生成するモード(以下、左右反転モードとする)である。なお本実施形態において、画像を左右反転させる処理とは、鏡に映った鏡像のような画像を生成する処理であり、これは公知の処理であるためその詳細な説明は省略する。
さらに本実施形態の試着アプリケーションは、人物の画像に衣料品オブジェクト画像を重畳した合成画像の表示とともに所定の通知アイコンをも表示することによって、その合成画像がどちらの生成モードに属しているかをユーザに通知可能とする。そして試着アプリケーションは、その通知アイコンに対してユーザが所定の操作(例えばタップ操作)を行った場合には生成モードの切り替えを行う。これにより、ユーザは、実在の鏡に映っている被写体の人物の鏡像を撮像しているような場合に、その人物の画像に対して、左右関係が整合した状態の衣料品オブジェクト画像が重畳された合成画像の表示を選択することができる。すなわち本実施形態では、鏡に映った鏡像ではない被写体を撮像した画像だけでなく、鏡に映った左右反転した被写体の鏡像を撮像した画像のいずれであっても、被写体に対して左右関係が整合したオブジェクト画像を重畳した合成画像の表示を実現可能とする。
First Embodiment
In this embodiment, a smartphone-type information terminal is taken as an example of the information processing device. The information processing device of this embodiment is equipped with an application program that generates and displays a composite image in which a predetermined object image is superimposed on an image of a subject. In this embodiment, a person is taken as an example of a subject, and a clothing object image is taken as an example of a predetermined object image. That is, in this embodiment, a virtual try-on application program (hereinafter, referred to as a try-on application) that generates and displays a composite image in which a clothing object image is superimposed on an image of a subject person is taken as an example. In the try-on application of this embodiment, the position and orientation of a subject person is estimated from an image of the subject person, a clothing object image is generated in accordance with the estimated position and orientation, and a composite image is generated and displayed by superimposing it on the image of the subject. This makes it possible to provide an appearance when the subject person is virtually wearing the clothing.
When the entire body of a subject does not fit within the angle of view of the smartphone's front camera, or when a user wants to check how the subject looks to others wearing the clothing, the user may use the rear camera to capture the image of the subject reflected in a real mirror. The image of the subject reflected in a real mirror is a mirror image with the left and right reversed, whereas the image of the subject captured by the rear camera is an image that is not reversed left and right. For this reason, when using a virtual fitting service, an image of the subject reflected in the mirror captured by the rear camera with a clothing image superimposed thereon is an image in which the left and right relationship of the clothing is not properly matched with respect to the subject. For this reason, it is desirable to be able to display an image in which object information such as clothing that is matched with the left and right relationship with respect to the subject is superimposed, even when an image of a mirror image with the left and right reversed is used.
Therefore, the fitting application of this embodiment has a first generation mode and a second generation mode as generation modes when generating a composite image by superimposing an object image on an image of a subject. The first generation mode is a mode (hereinafter referred to as a normal mode) in which an object image corresponding to the position and orientation of the subject is superimposed on an image obtained by capturing an image of the subject to generate a composite image. The second generation mode is a mode (hereinafter referred to as a left-right inversion mode) in which a predetermined object image corresponding to the position and orientation of the subject is inverted left-right and the inverted object image is superimposed on the image of the subject to generate a composite image. Note that in this embodiment, the process of inverting an image left-right is a process of generating an image like a mirror image reflected in a mirror, and since this is a well-known process, a detailed description thereof will be omitted.
Furthermore, the try-on application of the present embodiment can notify the user of which generation mode the composite image belongs to by displaying a composite image in which a clothing object image is superimposed on an image of a person and also displaying a predetermined notification icon. The try-on application switches the generation mode when the user performs a predetermined operation (e.g., a tap operation) on the notification icon. This allows the user to select the display of a composite image in which a clothing object image in a state where the left-right relationship is consistent is superimposed on the image of the person when capturing an image of a mirror image of a subject reflected in a real mirror. That is, in the present embodiment, it is possible to realize the display of a composite image in which an object image in a state where the left-right relationship is consistent with respect to the subject is superimposed not only in an image of a subject that is not a mirror image reflected in a mirror, but also in an image of a mirror image of a subject that is reversed in a mirror.
図1(a)と図1(b)はスマートフォンに本実施形態の情報処理装置1を適用した場合の外観の一例を示した図であり、情報処理装置1は、ディスプレイ204、背面カメラ208、前面カメラ209等を備えている。図1(a)は情報処理装置1においてディスプレイ2が配されている前面側を示し、一方、図1(b)は情報処理装置1の背面側を示している。ディスプレイ204は、液晶や有機EL等の表示パネルにいわゆるタッチパネル機能が付加された表示画面を備えた表示装置である。前面カメラ209は、ディスプレイ204が配されている面と同じ面(前面)に配置されている前面撮像装置(いわゆるインカメラ)である。背面カメラ208は、ディスプレイ204が配されている前面側に対して、背面側に配置されている背面撮像装置(いわゆるアウトカメラ)である。背面カメラ208と前面カメラ209は、撮像素子として例えばCMOSセンサを有し、例えば1080×1920ピクセルの2次元8ビットRGB画像を取得する。なお、図1(b)に示されている座標軸10は、情報処理装置1において設定されている固定座標軸であり、x,y,zの3軸方向を示している。
1(a) and 1(b) are diagrams showing an example of the appearance of the
図2は、情報処理装置1の内部ハードウェア構成例を示したブロック図である。
情報処理装置1は、前述したディスプレイ204、背面カメラ208、前面カメラ209に加え、CPU(中央演算処理装置)201、ROM(リードオンリーメモリー)202、RAM(ランダムアクセスメモリ)203等を備える。さらに情報処理装置1は、大容量メモリ205、加速度センサ206、方位センサ207、NIC(ネットワークインターフェースカード)210、マイクロフォン211等をも備えている。なお本実施形態ではスマートフォンへの適用を想定しているため、情報処理装置1は、図2に示した各構成に加えて、一般的なスマートフォンが有している各構成(不図示)をも備えている。
FIG. 2 is a block diagram showing an example of the internal hardware configuration of the
The
CPU201は、RAM203をワークメモリとして、ROM202や大容量メモリ205などに格納されたOS(オペレーティングシステム)と各種プログラムを実行する。CPU201は、シリアルバス212を介して各構成を制御する。またCPU201は、大容量メモリ205やROM202、インターネット上の記録メディアを、データ格納領域として使用する。またCPU201は、プログラムによって提供されるUI(ユーザーインターフェース)をディスプレイ204に表示する表示制御を行い、ディスプレイ204のタッチパネルを介してユーザからの入力を受け付ける。
The
NIC210は、インターネットに接続し、外部装置との間で情報の入力および出力を行う。
加速度センサ206は、例えば静電容量方式等により、図1(b)に示した情報処理装置1の座標軸10のx,y,zの3軸方向の加速度を検出する。
方位センサ207は、地磁気を計測するセンサであり、図1(b)に示した3軸のx,y,z座標系において北の方向を示す3次元ベクトルを出力する。
マイクロフォン211は、音声取得装置であり、例えばムービングコイル方式等により、音声を電気信号として出力する。
The
The
The
The
図3は、本実施形態の情報処理装置1の機能ブロック構成を示した図である。
OS3は、オペレーティングシステムであり、入出力の制御及び各種アプリケーションの起動や切り替えを行う命令群である。デバイスドライバ307は、OS3に含まれる命令群であり、情報処理装置1のディスプレイ204、背面カメラ208、前面カメラ209、および各種センサを制御する。各種アプリケーションは、OS3に所定の命令を送ることによりこれらに機器を制御することができる。
FIG. 3 is a diagram showing a functional block configuration of the
The OS3 is an operating system, and is a set of commands that control input/output and launch and switch various applications. The
試着アプリケーション2は、本実施形態の情報処理装置1において、被写体を撮像した画像に衣料品オブジェクト画像を重畳した合成画像を生成して表示する仮想試着アプリケーションプロブラムである。試着アプリケーション2は、大容量メモリ205やインターネット上の記録メディアからオブジェクト情報を取得し、そのオブジェクト情報を基に生成したオブジェクト画像を、被写体の画像に重畳した合成画像を生成してディスプレイ204に表示する命令群である。本実施形態では、衣料品のオブジェクト画像を用いる例を挙げているため、以下、オブジェクト情報は衣料品情報とする。すなわち、試着アプリケーション2は、衣料品情報を取得し、その衣料品情報を基に生成した衣料品オブジェクト画像を、被写体の画像に重畳した合成画像を生成してディスプレイ204に表示する。図2に示されたCPU201は、試着アプリケーション2の実行により、画像取得部301、操作受付部302、オブジェクト取得部303、姿勢推定部304、合成部305、表示部306の各機能部を実現する。なお、試着アプリケーション2による各機能部の幾つか若しくは全ては回路等により実現されてもよい。
The try-on
画像取得部301は、前述した前面カメラ209と背面カメラ208のうち、例えば背面カメラ208が被写体の人物等を撮像したRGB画像(以下、被写体画像I1とする)を取得する。
オブジェクト取得部303は、例えばインターネット上の記録メディアなどから、衣料品情報を取得する。オブジェクト取得部303は、例えば、複数の衣料品情報の中からユーザが操作受付部302を通じて選択した衣料品情報を取得する。衣料品情報は、被写体画像I1内の被写体(人物の画像)に対して重畳される衣料品オブジェクト画像の基になる情報であり、衣料品の3次元形状を表す3次元オブジェクトモデル情報とその衣料品が装着される部位などを示す情報を含む。以下、3次元オブジェクトモデル情報を3次元モデル情報とする。
The
The
姿勢推定部304は、画像取得部301で取得された被写体画像I1から、その被写体である人物の位置姿勢を推定する。ここでの位置姿勢には、被写体である人物の向きや姿勢のみならず、腕や脚等の人体を構成する各部位の位置姿勢も含まれる。
The
操作受付部302は、ディスプレイ204に表示されたアイコン領域に対するタップ操作などのユーザ操作を受け付ける。詳細は後述するが、本実施形態の場合、操作受付部302は、試着アプリケーション2における生成モードを左右反転モードあるいは通常モードのいずれにするかのモード選択指示の操作などを受け付ける。つまり試着アプリケーション2では、操作受付部302を介したユーザからのモード選択指示に応じて生成モードの切り替えが行われる。
The
合成部305は、姿勢推定部304で推定された被写体の位置姿勢を基に、前述した衣料品情報の3次元モデル情報に基づく3次元モデルを回転、変形、拡大・縮小等し、被写体が衣料品を着用した際の衣料品の見えを表す衣料品オブジェクト画像I2を生成する。また合成部305は、操作受付部302を介してユーザから受け付けたモード選択指示によって左右反転モードまたは通常モードのいずれが選択されたかに応じて、衣料品オブジェクト画像I2を左右反転させるか、あるいは左右反転させないかを決定する。前述したように、左右反転モードは左右反転させた衣料品を被写体が着用した際の見えを表す生成モードであり、通常モードは左右反転させていない衣料品を被写体が着用した際の見えを表す生成モードである。したがって合成部305は、いずれか選択された方の生成モードに応じた衣料品オブジェクト画像I2を生成し、画像取得部301で取得された被写体画像I1内の人物の画像に当該衣料品オブジェクト画像I2を重畳した合成画像I3を生成する。
Based on the position and orientation of the subject estimated by the
表示部306は、合成部305によって生成された合成画像I3と、試着アプリケーション2における生成モードが左右反転モードと通常モードのどちらであるかを示す所定の通知アイコン等を、ディスプレイ204に表示する。
The
図4は、試着アプリケーション2の実行による本実施形態の情報処理の流れを示したフローチャートである。以降の各フローチャートの説明では、各処理ステップの工程を符号の前に付した「S」により表す。
まずS401の処理として、画像取得部301は、ユーザからの取得指示に基づいて被写体画像I1を取得する。被写体画像I1は、前述したように背面カメラ208によって撮像された画像であるとする。なお背面カメラ208では、被写体をそのまま撮像する場合の他、実在の鏡に映った被写体の鏡像を撮像する場合も想定される。背面カメラ208で鏡に映った被写体の鏡像を撮像する想定例としては、前面カメラ209では画角内に収まらない場合や、衣料品を着用した状態の他人からの見えを確認したい場合などが考えられる。なお本実施形態において、背面カメラ208から取得される画像は、1080×1920ピクセルの2次元画像とし、各ピクセルがR,G,Bの色信号をそれぞれ8ビットの深度を保持しているとする。
4 is a flowchart showing the flow of information processing in this embodiment by executing the
First, in the process of S401, the
また、被写体画像I1の取得方法は一例であり、被写体画像I1は例えば連続的に撮像された動画像のうちの1フレームでもよいし、予め撮像して大容量メモリ205やインターネット上の記録メディアに保存されている画像や動画像のうちの1フレームでもよい。図5は、画像取得部301にて取得された被写体画像I1の例に示した図である。図5に例示しているように、被写体画像I1中には人物の被写体501が写っている。もちろん画像取得部301は、前面カメラ209によって撮像された画像や動画像のうちの1フレームを取得することも可能である。
The method of acquiring subject image I1 is just one example, and subject image I1 may be, for example, one frame of a continuously captured video, or one frame of an image or video that has been captured in advance and stored in large-
次にS402において、オブジェクト取得部303は衣料品情報を取得し、姿勢推定部304は画像取得部301にて取得された被写体画像I1から被写体501の位置姿勢を推定する。またS402において、合成部305は、生成モードが通常モードまたは左右反転モードのいずれであるかを判定し、その判定結果を基に、衣料品情報から被写体の位置姿勢に沿うような衣料品オブジェクト画像I2を生成する。そして合成部305は、その衣料品オブジェクト画像I2を、S401で取得された被写体画像I1内の被写体(人物)に重畳した合成画像I3を生成する。
Next, in S402, the
図6は、S402における衣料品情報の取得から合成画像の生成までの情報処理の詳細な流れを示したフローチャートである。
S601において、オブジェクト取得部303は、衣料品オブジェクト画像I2の基になる衣料品情報を取得する。例えば、オブジェクト取得部303は、大容量メモリ205やインターネット上の記録メディアに用意されている複数の衣料品情報の中から、例えばユーザが操作受付部302を通じて選択した衣料品情報を取得する。
FIG. 6 is a flowchart showing a detailed flow of information processing from obtaining clothing information in S402 to generating a composite image.
In S601, the
図7は、衣料品情報の一例の説明に用いる図である。前述したように、衣料品情報は、衣料品の3次元形状を表す3次元モデル情報と、その衣料品が装着される人体部位を示す情報とを含む。衣料品の3次元形状を表す3次元モデル情報により、衣料品オブジェクト画像701が生成される。図7の例では、衣料品が装着される人体部位として、胴体、右袖、左袖の各部位を示す情報が含まれている。 Figure 7 is a diagram used to explain an example of clothing information. As described above, clothing information includes three-dimensional model information that represents the three-dimensional shape of the clothing item, and information indicating the body part on which the clothing item is to be worn. A clothing object image 701 is generated from the three-dimensional model information that represents the three-dimensional shape of the clothing item. In the example of Figure 7, information indicating the torso, right sleeve, and left sleeve as the body parts on which the clothing item is to be worn is included.
なお、オブジェクト取得部303が取得する衣料品情報は、図5に例示した被写体501の人物の位置姿勢に応じて見えを変更することができる情報であればよく、必ずしも3次元形状を表す3次元モデル情報を含んでいなくてもよい。例えば、3次元モデル情報に代えて、例えば衣料品を複数の角度から撮像した2次元画像の配列や、衣料品を正面から撮像した2次元画像1枚の情報が含まれていてもよい。すなわちオブジェクト取得部303は、それら2次元画像のオブジェクト画像を取得してもよい。このようにオブジェクト取得部303においてオブジェクト画像が取得される場合、合成部305ではオブジェクト情報の3次元モデル情報からオブジェクト画像を生成するような処理を行わなくてもよい。
The clothing information acquired by the
次にS602において、合成部305は、生成モードが通常モードか否かを判定する。そして、生成モードが通常モードではないと判定された場合、つまり左右反転モードであると判定された場合、試着アプリケーション2の処理は、S603に進む。一方、S602において通常モードであると判定された場合、試着アプリケーション2の処理は、S604の処理に進む。なお、生成モードは、試着アプリケーション2の開始時点では例えば通常モードに設定されているとするが、もちろん試着アプリケーション開始時点で左右反転モードに設定されてもよい。また本実施形態の場合、生成モードは、後述するS404において操作受付部302に対するユーザからの指示に応じて切り替え可能となされている。
Next, in S602, the
S603の処理に進むと、姿勢推定部304は、画像取得部301にて取得された被写体画像I1から被写体501の位置姿勢を推定する。S603において、姿勢推定部304は、画像取得部301で取得された被写体画像I1を左右反転させる処理を行い、その左右反転処理後の被写体画像から被写体501の位置姿勢を推定する。なお図1(a)に示したような状態で情報処理装置1が使用される例を挙げた場合、姿勢推定部304は、被写体画像I1を、ディスプレイ204の短辺方向の画素の並び順を左右反転させた画像とする。また例えば、加速度センサ206によって情報処理装置1が横向きの状態であることを検知した場合、姿勢推定部304は、被写体画像I1を、ディスプレイ204の長辺方向の画素の並び順を左右反転させた画像とする。そして、姿勢推定部304は、左右反転処理後の被写体画像I1から、公知の深層学習を使った手法等によって被写体501の位置姿勢を推定する。深層学習を使った手法等による位置姿勢推定処理の説明は省略する。このS603の処理後、試着アプリケーション2はS605の処理に進む。
When the process proceeds to S603, the
一方、S604に進んだ場合、姿勢推定部304は、画像取得部301にて取得された被写体画像I1から、その画像内の被写体501の位置姿勢を推定する。すなわちS603において、姿勢推定部304は、S603のような被写体画像I1の左右反転処理は行わずに、画像取得部301にて取得された被写体画像I1内の被写体501の位置姿勢を推定する。S604での位置姿勢推定処理は、被写体画像I1の左右反転処理が行われていないこと以外、S603での位置姿勢推定処理と同様であるため、その説明は省略する。このS604の処理後、試着アプリケーション2の処理はS605に進む。
On the other hand, if the process proceeds to S604, the
S605に進むと、合成部305は、S603又はS604で推定された被写体の位置姿勢に沿うように、衣料品情報の3次元モデルを回転、変形、拡大・縮小等して、衣料品の見えを表す衣料品オブジェクト画像I2を生成する。
When the process proceeds to S605, the
図8(a)と図8(b)は、S605において合成部305により生成される衣料品オブジェクト画像I2を示した図である。図8(a)は、生成モードが通常モードである場合の被写体501の位置姿勢に沿うように生成された衣料品オブジェクト画像701を示した図である。図8(b)は、生成モードが左右反転モードである場合の被写体の位置姿勢、すなわち例えば左右反転させた被写体画像I1における被写体の位置姿勢に沿うように生成された衣料品オブジェクト画像701を示した図である。なお、衣料品情報として前述したような2次元画像を取得した場合、合成部305は、被写体501の位置姿勢に沿うように2次元変形を行ってもよいし、被写体501の位置姿勢に沿うような2次元画像を2次元画像の配列から選択してもよい。
8(a) and 8(b) are diagrams showing clothing object image I2 generated by
さらに次のS606において、合成部305は、生成モードが通常モードか否かに応じて処理を分岐させる。合成部305は、例えば通常モードでない場合つまり左右反転モードである場合にはS607に処理を進め、一方、通常モードである場合にはS608に処理を進める。
Furthermore, in the next step S606, the
左右反転モードであるためS607に進むと、合成部305は、S605で生成した衣料品オブジェクト画像I2を左右反転させる。S607における左右反転処理は、S603において姿勢推定部304で行われる左右反転処理と同様な処理である。そして、S607の後、合成部305はS608に処理を進める。
Because the left-right flip mode is selected, the process proceeds to S607, where the
S608に進むと、合成部305は、被写体画像I1内の被写体(人物)の画像に対して衣料品オブジェクト画像I2を重畳した合成画像I3を生成する。すなわちS608で通常モードであると判定されてS608に進んだ場合、合成部305では、画像取得部301で取得された被写体画像I1内の被写体の画像に対し、S605で生成された衣料品オブジェクト画像I2を重畳した合成画像I3が生成される。一方、S606で左右反転モードと判定され、S607で衣料品オブジェクト画像I2が左右反転されてS608に進んだ場合、合成部305では、被写体画像I1内の被写体の画像に左右反転した衣料品オブジェクト画像I2を重畳した合成画像I3が生成される。
When the process proceeds to S608, the
図9(a)と図9(b)は、S608の処理によって生成された合成画像の例を示した図である。図9(a)は通常モードである場合に生成される合成画像の例を示し、図9(b)は左右反転モードである場合に生成される合成画像の例を示している。特に図9(b)の合成画像では、鏡に映った被写体501を背面カメラ208で撮像した場合において、衣料品オブジェクト画像701の右袖が鏡像である被写体501の右腕側に重畳され、被写体501が衣料品を装着した際の見えが再現されている。一方、図9(a)の合成画像では、鏡に映った被写体501を背面カメラ208で撮像した場合、衣料品オブジェクト画像701の左袖が鏡像である被写体501の右腕側に重畳されており、被写体501が衣料品を装着した際の見えが左右で整合していない。
9(a) and 9(b) are diagrams showing examples of composite images generated by the processing of S608. FIG. 9(a) shows an example of a composite image generated in normal mode, and FIG. 9(b) shows an example of a composite image generated in left-right inversion mode. In particular, in the composite image of FIG. 9(b), when the subject 501 reflected in the mirror is imaged by the
図4のフローチャートに説明を戻す。
S403の合成画像の表示処理の際、表示部306は、合成画像I3とともに図10に示すようなUIを描画し、ディスプレイ204に表示する。
図10(a)と図10(b)は、被写体501に衣料品オブジェクト画像701が重畳された合成画像が表示されたディスプレイ204の画面例を示した図である。図10(a)は通常モードである場合の画面例を示し、図10(b)は左右反転モードである場合の画面例を示している。
Returning to the flowchart of FIG.
When performing the composite image display process in S403, the
10A and 10B are diagrams showing example screens of the
表示部306は、被写体501に衣料品オブジェクト画像I2が重畳された合成画像I3に加えて、生成モードが左右反転モードと通常モードのどちらであるかを示す所定の通知アイコンとしてのモード通知アイコン1001をも表示する。モード通知アイコン1001は、生成モードが通常モードである場合と左右反転モードである場合とで、その表示形態が変えられて表示される。本実施形態の場合、モード通知アイコン1001は、生成モードが通常モードにあるときには例えばグレー色で表示され、左右反転モードにあるときには白色で表示されるとする。これにより、ユーザに対して、現時点の生成モードが通常モードか左右反転モードのいずれであるかを通知することができる。なお、表示部306はモード通知アイコン1001の表示とともに、終了ボタン1002をも表示させる。終了ボタン1002は、ユーザが試着アプリケーション2を終了させる際に例えばタップされるボタンである。この終了ボタン1002がタップされた場合、試着アプリケーション2は、後述するS406において終了処理を行う。
In addition to the composite image I3 in which the clothing object image I2 is superimposed on the subject 501, the
前述のようなS403の処理後、試着アプリケーション2の処理はS404に進む。
S404に進むと、操作受付部302は、ユーザからモード切替指示を受け付けたか否かを判定する。本実施形態の場合、操作受付部302は、ディスプレイ204の画面上でモード通知アイコン1001がユーザによりタップされたか否かによって、モード切替指示が行われたか否かを判定する。そして、操作受付部302がユーザからのモード切替指示を受け付けた場合、試着アプリケーション2の処理は、S405に進む。
After the process of S403 as described above, the process of the try-on
When the process proceeds to S404, the
S405に進むと、合成部305は、生成モードを切り替える。すなわちS404において操作受付部302がユーザからモード切替指示を受け付ける前の時点で通常モードであった場合、合成部305は、生成モードを左右反転モードへ切り替える。一方、S404において操作受付部302がユーザからモード切替指示を受け付ける前の時点で左右反転モードであった場合、合成部305は、生成モードを通常モードへ切り替える。
When the process proceeds to S405, the
その後、S406において、操作受付部302は、ディスプレイ204上の終了ボタン1002がユーザによりタップされたか否かを判定する。そして、操作受付部302において終了ボタン1002がタップされたと判定された場合、試着アプリケーション2は、図4のフローチャートの処理を終了し、そうでない場合にはS401に処理を戻して以降の処理を繰り返す。すなわち例えばS405で生成モードの切り替えが行われた場合、S401からS403では、その切り替え後の生成モードに応じた処理が行われることになる。
Then, in S406, the
以上説明したように、第1の実施形態によれば、鏡に映った被写体人物の鏡像が背面カメラ208で撮像されて被写体人物と衣料品との左右関係が整合していない場合、ユーザからのモード切替指示に応じて、それらの左右関係が整合した画像を表示可能となる。
As described above, according to the first embodiment, when a mirror image of a subject person reflected in a mirror is captured by the
<第1の実施形態の変形例>
上述した第1の実施形態では、ユーザから受け付けるモード切替指示として、モード通知アイコン1001へのタップ操作を例に挙げたが、モード通知アイコン1001とは別の一部画面領域へのタップ操作をモード切替指示として受け付けてもよい。或いは、ユーザが情報処理装置1を振る動作を加速度センサ206にて検知可能とし、当該情報処理装置1を振る操作がなされた場合に、それをモード切替指示として受け付けるようにしてもよい。この例の場合、ユーザは、例えば片手で情報処理装置1を振るような動作のみで生成モードの切り替えを指示することができ、生成モードを切り替えるために情報処理装置1を持ち替えるなどのような姿勢を大きく変更する動作を行わなくてもよくなる。また例えば、ユーザが発する音声をマイクロフォン211にて検知し、ユーザからの所定の音声が入力された場合、それを以てモード切替指示の受け付けとしてもよい。この例の場合も、ユーザは、生成モードを切り替えるために姿勢を大きく変更する動作などを行わなくてもよくなる。これらの変形例は適宜組み合わせて使用することも可能である。
<Modification of the first embodiment>
In the first embodiment described above, a tap operation on the mode notification icon 1001 is given as an example of a mode switching instruction received from the user, but a tap operation on a partial screen area other than the mode notification icon 1001 may be received as a mode switching instruction. Alternatively, the
<第2の実施形態>
第1の実施形態では、ユーザからのモード切替指示を受け付けた場合に、生成モードを切り替える例を挙げた。第2の実施形態では、画像取得部301にて取得された画像に実在の鏡が映っている場合に生成モードを自動的に切り替える処理と、第1の実施形態と同様にユーザからのモード切替指示に応じて生成モードを切り替える処理との両方を含む例について説明する。第2の実施形態の場合、画像取得部301で取得された画像に鏡が映っている場合、つまり画像が鏡像である可能性が高い場合には、左右反転モードに自動的に移行する。また第2の実施形態では、左右反転モードに移行して、衣料品オブジェクト画像の左右を反転させて表示したくない場合、ユーザは、モード切替指示を行うことで左右反転していない衣料品オブジェクト画像を重畳した合成画像が生成されるようにすることもできる。なお、衣料品オブジェクト画像を左右反転させて表示したくないユースケースとしては、例えば、衣料品に文字が記載されており、左右反転すると読み難くなる場合などが考えられる。第2の実施形態の情報処理装置1のハードウェア外観構成、ハードウェア構成は、前述した図1、図2と同じであるため、それらの図示と説明は省略する。
Second Embodiment
In the first embodiment, an example of switching the generation mode when a mode switching instruction from a user is received is given. In the second embodiment, an example including both a process of automatically switching the generation mode when an actual mirror is reflected in the image acquired by the
図11は、第2の実施形態の情報処理装置1における機能構成例を示した図である。図11の機能構成において、鏡像判定部1101とモード選択部1102以外の各機能部は第1の実施形態の図3に示した各機能部と同じ構成であるため、それらの説明は省略する。
Fig. 11 is a diagram showing an example of the functional configuration of the
鏡像判定部1101は、画像取得部301で取得された被写体画像内に鏡が写っているか否か、より詳細には被写体の画像が鏡像であるか否かを判定する。本実施形態では、公知の深層学習等を用いた方法により、画像に鏡が写っているか否かの処理を行うとする。
The mirror
モード選択部1102は、鏡像判定部1101において画像内に鏡が写っていると判定された場合には生成モードを左右反転モードに設定し、一方、鏡が写っていないと判定された場合には生成モードを通常モードに設定する。そしてモード選択部1102は、その生成モードの設定情報を姿勢推定部304と合成部305に知らせる。このため第2の実施形態の場合、姿勢推定部304と合成部305では、モード選択部1102にて設定された生成モードに応じた処理を行う。
When the mirror
図12は、第2の実施形態の試着アプリケーション2において実行される情報処理の流れを示したフローチャートである。なお、S1201からS1203までの処理は、第1の実施形態のS401からS403までと同じ処理であるため、それらの説明は省略する。
Figure 12 is a flowchart showing the flow of information processing executed in
S1203の処理後、S1204に進むと、鏡像判定部1101は、画像取得部301で取得された被写体画像I1に鏡が写っているか否か、より詳細には被写体の画像が鏡像であるか否かを判定する。そして鏡像判定部1101において鏡像判定処理で被写体画像I1に鏡が写っていると判定された場合、試着アプリケーション2の処理はS1205に進み、一方、鏡が写っていないと判定された場合にはS1206に進む。すなわち鏡像判定部1101は、被写体画像I1内に写っている鏡の領域の中に、被写体が写っているか否かを判定する。そして、鏡の領域の中に被写体が写っていると判定された場合、試着アプリケーション2の処理はS1205に進み、一方、鏡の中に被写体が写っていないと判定された場合にはS1206に進むようにする。
After processing S1203, the process proceeds to S1204, where the mirror
S1205に進むと、モード選択部1102は、生成モードを自動的に左右反転モードに設定する。一方、S1206に進んだ場合、モード選択部1102は、生成モードを通常モードに設定する。そして、S1205またはS1206の後、試着アプリケーション2の処理はS1207に進む。
S1207からS1209までの処理は、第1の実施形態のS404からS406までと概ね同様の処理であるため、それらの説明は省略する。なお、第2の実施形態の場合、S1207において、操作受付部302は、モード通知アイコン1001を例えばオンとオフの2状態を備えるスイッチとして扱ってもよい。例えば、操作受付部302は、ユーザによってモード通知アイコン1001がタップされたときに生成モード切替指示の受け付けを可能とし、再びタップがなされた場合にはモード切替指示を受け付けないようにしてもよい。
If the process proceeds to S1205, the
The processes from S1207 to S1209 are generally similar to those from S404 to S406 in the first embodiment, and therefore their description will be omitted. In the case of the second embodiment, in S1207, the
以上説明したように第2の実施形態の情報処理装置1によれば、画像に鏡が写っている場合に、自動的に左右反転モードに移行する。また第2の実施形態では、衣料品オブジェクト画像を左右反転させて表示したくない場合には、ユーザからのモード切替指示に応じて左右反転していない衣料品オブジェクト画像を表示させることができる。
As described above, according to the
<第2の実施形態の変形例>
第2の実施形態において、画像取得部301で取得する被写体画像I1は、前面カメラ209で撮像した画像であってもよい。その際、モード選択部1102は、鏡像判定部1101にて画像内に鏡が写っていると判定された場合には生成モードを通常モードに設定し、一方、鏡が写っていないと判定された場合には左右反転モードに設定してもよい。
また、第2の実施形態において、鏡像判定部1101は、画像取得部301にて取得された被写体画像I1の一部領域に鏡が写っているかを判定してもよい。なお、被写体画像I1中で被写体501が写っている領域を、被写体画像I1の一部領域としてもよい。
<Modification of the second embodiment>
In the second embodiment, the subject image I1 acquired by the
In the second embodiment, the mirror
また例えば、不図示の視線追跡装置等を用いて被写体画像I1中でユーザが注目して見ている注視領域を取得可能とし、それを前述した被写体画像I1の一部領域つまり鏡の領域としてもよい。すなわちユーザが鏡の領域を注視している場合、モード選択部1102は左右反転モードを選択する。これにより、ユーザが鏡の領域を注視している場合には左右反転モードになることで、鏡に映った被写体人物と衣料品との左右関係が整合した画像を表示可能となる。一方、ユーザが鏡の領域を注視していない場合、モード選択部1102は、生成モードの選択を行わずに、現時点の生成モードを維持するようにする。これにより被写体画像I1中に鏡は写っているが、ユーザがその鏡を注視していない場合、つまりユーザが鏡に注意を払っていない場合には、ユーザが意図していないときに生成モードが自動的に切り替えられてしまうのを防止することが可能となる。これらの各変形例は、適宜組み合わせて使用することも可能である。
For example, a gaze tracking device (not shown) may be used to obtain the gaze area in the subject image I1 that the user is focusing on, and this may be used as a partial area of the subject image I1, i.e., the mirror area. That is, when the user is gazing at the mirror area, the
なお前述した第1、第2の実施形態において、情報処理装置1のハードウェア構成のうち入出力に関連するディスプレイ204、加速度センサ206、背面カメラ208等は、外部装置として情報処理装置1とは別に構成されていてもよい。その場合、外部装置と情報処理装置1は、例えばシリアルバス等で接続される。
In the first and second embodiments described above, the
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。 The present invention can also be realized by supplying a program that realizes one or more of the functions of the above-mentioned embodiments to a system or device via a network or storage medium, and having one or more processors in the computer of the system or device read and execute the program. It can also be realized by a circuit (e.g., an ASIC) that realizes one or more functions. The above-mentioned embodiments are merely examples of concrete implementations of the present invention, and the technical scope of the present invention should not be interpreted in a limiting manner by them. In other words, the present invention can be implemented in various forms without departing from its technical concept or main features.
各実施形態の開示は、以下の構成、方法、およびプログラムを含む。
(構成1)
被写体の画像を取得する画像取得手段と、
前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得手段と、
前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成手段と、
前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付手段と、
前記合成手段にて生成された合成画像を表示する表示制御手段と、
を有することを特徴とする情報処理装置。
(構成2)
前記被写体の画像を基に前記被写体の位置姿勢を推定する推定手段をさらに有し、
前記合成手段は、前記推定された被写体の位置姿勢に基づいて、前記合成画像を生成することを特徴とする構成1に記載の情報処理装置。
(構成3)
前記受付手段は、ユーザからの所定の操作を、前記切替指示として受け付けることを特徴とする構成1または2に記載の情報処理装置。
(構成4)
前記表示制御手段は、前記合成手段が前記第2のモードにある場合には、前記左右反転させたオブジェクト情報を表示していることをユーザに通知することを特徴とする構成1乃至3のいずれか1構成に記載の情報処理装置。
(構成5)
前記受付手段は、前記合成手段で生成された合成画像の一部領域に対するユーザからの所定の操作を、前記切替指示として受け付けることを特徴とする構成1乃至4のいずれか1構成に記載の情報処理装置。
(構成6)
前記受付手段は、音声を取得する音声取得手段を含み、前記音声取得手段により取得した所定の音声を、前記切替指示として受け付けることを特徴とする構成1乃至5のいずれか1構成に記載の情報処理装置。
(構成7)
前記受付手段は、ユーザによる当該情報処理装置を振る動作を検知する検知手段を含み、前記検知手段による情報処理装置を振る動作の検知を、前記切替指示として受け付けることを特徴とする構成1乃至6のいずれか1構成に記載の情報処理装置。
(構成8)
前記被写体の画像が鏡像であるか否かを判定する判定手段と、
前記判定手段による判定の結果を基に、前記合成手段の前記第1のモードと前記第2のモードのいずれかを選択するモード選択手段と、
をさらに有し、
前記モード選択手段は、前記判定手段で前記被写体の画像が鏡像でないと判定した場合には前記第1のモードを選択し、前記判定手段で前記被写体の画像が鏡像であると判定した場合には前記第2のモードを選択することを特徴とする構成1乃至7のいずれか1構成に記載の情報処理装置。
(構成9)
前記受付手段は、前記モード選択手段にて前記選択されたモードを、前記切替指示に応じて切り替えることを特徴とする構成8に記載の情報処理装置。
(構成10)
前記判定手段は、ユーザが注視している画像の領域が鏡像であるか否か判定し、
前記モード選択手段は、前記判定手段によってユーザが注視している画像の領域が鏡像であると判定された場合に前記第2のモードを選択することを特徴とする構成8または9に記載の情報処理装置。
(構成11)
前記判定手段は、ユーザが注視している画像の領域が鏡像であるか否か判定し、
前記モード選択手段は、前記判定手段によってユーザが注視している画像の領域が鏡像でないと判定された場合にはモードの選択を行わないことを特徴とする構成8乃至10のいずれか1構成に記載の情報処理装置。
(構成12)
前記オブジェクト情報は、3次元オブジェクトモデルと2次元画像との少なくとも1つであることを特徴とする構成1乃至11のいずれか1構成に記載の情報処理装置。
(構成13)
ディスプレイと、
前記ディスプレイの画面が配された側に設けられる前面カメラと、
前記ディスプレイの画面に対して背面側に設けられる背面カメラと、
を備え、
前記画像取得手段が取得する前記被写体の画像は、前記背面カメラにて撮像された画像であり、
前記表示制御手段は、前記ディスプレイの画面に前記合成画像を表示することを特徴とする構成1乃至12のいずれか1構成に記載の情報処理装置。
(方法1)
被写体の画像を取得する画像取得工程と、
前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得工程と、
前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成工程と、
前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付工程と、
前記合成工程にて生成された合成画像を表示する表示制御工程と、
を有することを特徴とする情報処理方法。
(プログラム1)
コンピュータを、構成1乃至13のいずれか1構成に記載の情報処理装置として機能させるプログラム。
The disclosure of each embodiment includes the following configurations, methods, and programs.
(Configuration 1)
An image acquisition means for acquiring an image of a subject;
an object acquisition means for acquiring object information to be superimposed on the image of the subject;
a synthesis means including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without being inverted horizontally, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information inverted horizontally;
a receiving means for receiving an instruction to switch to either the first mode or the second mode;
A display control means for displaying a composite image generated by the composite means;
13. An information processing device comprising:
(Configuration 2)
The method further includes estimating a position and orientation of the object based on an image of the object,
2. The information processing apparatus according to
(Configuration 3)
3. The information processing apparatus according to
(Configuration 4)
The information processing device according to any one of
(Configuration 5)
5. The information processing apparatus according to any one of
(Configuration 6)
6. The information processing device according to any one of
(Configuration 7)
The information processing device described in any one of
(Configuration 8)
a determination means for determining whether the image of the subject is a mirror image;
a mode selection means for selecting either the first mode or the second mode of the synthesis means based on a result of the determination by the determination means;
and
The information processing device described in any one of
(Configuration 9)
9. The information processing apparatus according to configuration 8, wherein the reception means switches the mode selected by the mode selection means in response to the switching instruction.
(Configuration 10)
The determination means determines whether or not an area of the image that the user is gazing at is a mirror image;
10. The information processing device according to configuration 8 or 9, wherein the mode selection means selects the second mode when the determination means determines that the area of the image on which the user is gazing is a mirror image.
(Configuration 11)
The determination means determines whether or not an area of the image that the user is gazing at is a mirror image;
11. The information processing device according to any one of configurations 8 to 10, wherein the mode selection means does not select a mode when the determination means determines that the area of the image the user is gazing at is not a mirror image.
(Configuration 12)
12. The information processing apparatus according to any one of
(Configuration 13)
A display and
A front camera provided on the side where the screen of the display is disposed;
A rear camera provided on the rear side of the screen of the display;
Equipped with
the image of the subject acquired by the image acquisition means is an image captured by the rear camera,
13. The information processing apparatus according to any one of
(Method 1)
an image acquisition step of acquiring an image of a subject;
an object acquiring step of acquiring object information to be superimposed on the image of the subject;
a synthesis process including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without being inverted horizontally, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information inverted horizontally;
a receiving step of receiving an instruction to switch to either the first mode or the second mode;
a display control step of displaying the composite image generated in the composition step;
13. An information processing method comprising:
(Program 1)
A program that causes a computer to function as the information processing device according to any one of
1:情報処理装置、2:試着アプリケーション、301:画像取得部、302:操作受付部、303:オブジェクト取得部、304:姿勢推定部、305:合成部、306:表示部 1: Information processing device, 2: Try-on application, 301: Image acquisition unit, 302: Operation reception unit, 303: Object acquisition unit, 304: Pose estimation unit, 305: Synthesis unit, 306: Display unit
Claims (15)
前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得手段と、
前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成手段と、
前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付手段と、
前記合成手段にて生成された合成画像を表示する表示制御手段と、
を有することを特徴とする情報処理装置。 An image acquisition means for acquiring an image of a subject;
an object acquisition means for acquiring object information to be superimposed on the image of the subject;
a synthesis means including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without being inverted horizontally, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information inverted horizontally;
a receiving means for receiving an instruction to switch to either the first mode or the second mode;
A display control means for displaying a composite image generated by the composite means;
13. An information processing device comprising:
前記合成手段は、前記推定された被写体の位置姿勢に基づいて、前記合成画像を生成することを特徴とする請求項1に記載の情報処理装置。 The method further includes estimating a position and orientation of the object based on an image of the object,
The information processing apparatus according to claim 1 , wherein the synthesis means generates the synthetic image based on the estimated position and orientation of the subject.
前記判定手段による判定の結果を基に、前記合成手段の前記第1のモードと前記第2のモードのいずれかを選択するモード選択手段と、
をさらに有し、
前記モード選択手段は、前記判定手段で前記被写体の画像が鏡像でないと判定した場合には前記第1のモードを選択し、前記判定手段で前記被写体の画像が鏡像であると判定した場合には前記第2のモードを選択することを特徴とする請求項1に記載の情報処理装置。 a determination means for determining whether the image of the subject is a mirror image;
a mode selection means for selecting either the first mode or the second mode of the synthesis means based on a result of the determination by the determination means;
and
2. The information processing device according to claim 1, wherein the mode selection means selects the first mode when the determination means determines that the image of the subject is not a mirror image, and selects the second mode when the determination means determines that the image of the subject is a mirror image.
前記モード選択手段は、前記判定手段によってユーザが注視している画像の領域が鏡像であると判定された場合に前記第2のモードを選択することを特徴とする請求項8に記載の情報処理装置。 The determination means determines whether or not an area of the image that the user is gazing at is a mirror image;
9. The information processing apparatus according to claim 8, wherein the mode selection means selects the second mode when the determination means determines that the area of the image on which the user is gazing is a mirror image.
前記モード選択手段は、前記判定手段によってユーザが注視している画像の領域が鏡像でないと判定された場合にはモードの選択を行わないことを特徴とする請求項8に記載の情報処理装置。 The determination means determines whether or not an area of the image that the user is gazing at is a mirror image;
9. The information processing apparatus according to claim 8, wherein the mode selection means does not select a mode when the determination means determines that the area of the image on which the user is gazing is not a mirror image.
前記ディスプレイの画面が配された側に設けられる前面カメラと、
前記ディスプレイの画面に対して背面側に設けられる背面カメラと、
を備え、
前記画像取得手段が取得する前記被写体の画像は、前記背面カメラにて撮像された画像であり、
前記表示制御手段は、前記ディスプレイの画面に前記合成画像を表示することを特徴とする請求項1に記載の情報処理装置。 A display and
A front camera provided on the side where the screen of the display is disposed;
A rear camera provided on the rear side of the screen of the display;
Equipped with
the image of the subject acquired by the image acquisition means is an image captured by the rear camera,
2. The information processing apparatus according to claim 1, wherein said display control means displays said composite image on a screen of said display.
前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得工程と、
前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成工程と、
前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付工程と、
前記合成工程にて生成された合成画像を表示する表示制御工程と、
を有することを特徴とする情報処理方法。 an image acquisition step of acquiring an image of a subject;
an object acquiring step of acquiring object information to be superimposed on the image of the subject;
a synthesis process including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without being inverted horizontally, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information inverted horizontally;
a receiving step of receiving an instruction to switch to either the first mode or the second mode;
a display control step of displaying the composite image generated in the composition step;
13. An information processing method comprising:
被写体の画像を取得する画像取得手段と、
前記被写体の画像に重畳するオブジェクト情報を取得するオブジェクト取得手段と、
前記オブジェクト情報を左右反転させずに前記被写体の画像に重畳した合成画像を生成する第1のモードと、左右反転させた前記オブジェクト情報を前記被写体の画像に重畳した合成画像を生成する第2のモードとを含む合成手段と、
前記第1のモードと前記第2のモードのいずれかへの切替指示を受け付ける受付手段と、
前記合成手段にて生成された合成画像を表示する表示制御手段と、
を有する情報処理装置として機能させるプログラム。 Computer,
An image acquisition means for acquiring an image of a subject;
an object acquisition means for acquiring object information to be superimposed on the image of the subject;
a synthesis means including a first mode for generating a synthetic image in which the object information is superimposed on the image of the subject without being inverted horizontally, and a second mode for generating a synthetic image in which the object information is superimposed on the image of the subject with the object information inverted horizontally;
a receiving means for receiving an instruction to switch to either the first mode or the second mode;
A display control means for displaying a composite image generated by the composite means;
A program that causes the device to function as an information processing device having the above-mentioned configuration.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022194922A JP2024081356A (en) | 2022-12-06 | 2022-12-06 | Information processing device, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022194922A JP2024081356A (en) | 2022-12-06 | 2022-12-06 | Information processing device, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024081356A true JP2024081356A (en) | 2024-06-18 |
Family
ID=91486767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022194922A Pending JP2024081356A (en) | 2022-12-06 | 2022-12-06 | Information processing device, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024081356A (en) |
-
2022
- 2022-12-06 JP JP2022194922A patent/JP2024081356A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3926837B2 (en) | Display control method and apparatus, program, and portable device | |
US20210058612A1 (en) | Virtual reality display method, device, system and storage medium | |
RU2638776C1 (en) | Image generating device and method | |
JP4262014B2 (en) | Image photographing apparatus and image processing method | |
CN109040600B (en) | Mobile device, system and method for shooting and browsing panoramic scene | |
JP5871345B2 (en) | 3D user interface device and 3D operation method | |
US20160049011A1 (en) | Display control device, display control method, and program | |
JP2018046430A (en) | Information processing device, method, and program | |
JP2019125929A (en) | Image processing apparatus, image processing method, and program | |
JP2016062486A (en) | Image generation device and image generation method | |
JP2011090400A (en) | Image display device, method, and program | |
JP2006209664A (en) | System, image processor and image processing method | |
CN110839174A (en) | Image processing method and device, computer equipment and storage medium | |
JP2016105534A (en) | Imaging apparatus and imaging apparatus system | |
CN108965769B (en) | Video display method and device | |
JP6306083B2 (en) | Method, program, and recording medium for providing virtual space | |
US20200005507A1 (en) | Display method and apparatus and electronic device thereof | |
JP2022058753A (en) | Information processing apparatus, information processing method, and program | |
JP6518645B2 (en) | INFORMATION PROCESSING APPARATUS AND IMAGE GENERATION METHOD | |
JP2024081356A (en) | Information processing device, information processing method, and program | |
US12026826B2 (en) | Information processing system displaying images of a mixed reality space | |
JP2018063567A (en) | Image processing device, image processing method and program | |
JP2019074881A (en) | Image generation device and image generation method | |
JP2019008494A (en) | Image processing device | |
CN115606173A (en) | Remote control system, remote operation device, image processing device, and program |