JP5742886B2 - Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program - Google Patents
Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program Download PDFInfo
- Publication number
- JP5742886B2 JP5742886B2 JP2013128401A JP2013128401A JP5742886B2 JP 5742886 B2 JP5742886 B2 JP 5742886B2 JP 2013128401 A JP2013128401 A JP 2013128401A JP 2013128401 A JP2013128401 A JP 2013128401A JP 5742886 B2 JP5742886 B2 JP 5742886B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- stereoscopic video
- eye image
- eye
- parallax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムに関し、例えば、左目用画像、右目用画像(本明細書においては、画像データを単に画像と呼んでいることもある)をそれぞれの目に投影することで立体感が得られる動画像データを送受信する場合に適用し得るものである。 The present invention relates to a stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program. For example, the left-eye image and the right-eye image (in this specification, The image data may be simply referred to as an image), and can be applied to transmission / reception of moving image data in which a stereoscopic effect can be obtained by projecting each eye.
人の視覚に立体的な動画像を認知させるための方法として、それぞれ異なる方向から撮影した右目用画像(動画像)及び左目用画像(動画像)を用意し、右目用画像を右目に、左目用画像を左目に投影するような表示機器を用いて、観察者に立体感を認識させる方法が広く知られている(例えば、特許文献1参照)。このような視差を持った動画像を伝送する方法として、右目用画像及び左目用画像を符号化かつ多重化したデータを作成して伝送する方法がある。 As a method for recognizing a three-dimensional moving image to human vision, a right eye image (moving image) and a left eye image (moving image) taken from different directions are prepared, and the right eye image is used as the right eye and the left eye. A method of causing an observer to recognize a stereoscopic effect using a display device that projects a commercial image to the left eye is widely known (see, for example, Patent Document 1). As a method of transmitting a moving image having such parallax, there is a method of generating and transmitting data obtained by encoding and multiplexing a right-eye image and a left-eye image.
右目用画像及び左目用画像を多重化かつ符号化する従来方法として、右目用画像及び左目用画像をそれぞれ、横方向(若しくは縦方向)に半分に圧縮した後、横方向(若しくは縦方向)に並置して1枚の画像に合成し、その合成画像を符号化する方法があった。この従来方法では、1枚の符号化データの中に同時刻の右目用画像及び左目用画像の情報が含まれるので、伝送中のエラーによりパケットロスが発生したとしても、左右視点間(右目用画像及び左目用画像間)の同期を確保することができる。 As a conventional method of multiplexing and encoding a right-eye image and a left-eye image, the right-eye image and the left-eye image are each compressed in half in the horizontal direction (or vertical direction) and then in the horizontal direction (or vertical direction). There is a method in which the images are combined and combined into one image, and the combined image is encoded. In this conventional method, information on the right-eye image and the left-eye image at the same time is included in one piece of encoded data, so even if a packet loss occurs due to an error during transmission, the left-right viewpoint (for the right eye) Synchronization between the image and the left-eye image) can be ensured.
しかしながら、上述した従来の方法では、合成画像内で、対応する点同士の距離が離れているため、パケットロスが発生した場合、エラーの伝播により、復号画像の対応する領域同士の差が大きくなることが起こり得る。ここで、対応する点又は領域とは、立体視した場合(右目用画像及び左目用画像をそれぞれ、それようの表示機器で見た場合)に同じ位置に知覚される点又は領域のことを指す。合成画像は、右目用画像及び左目用画像を合成しているため、合成画像中に対応する点や領域が存在することになる。 However, in the conventional method described above, the distance between corresponding points in the composite image is far away, so that when a packet loss occurs, the difference between corresponding regions in the decoded image increases due to error propagation. Can happen. Here, the corresponding point or region refers to a point or region that is perceived at the same position when viewed stereoscopically (when the image for the right eye and the image for the left eye are viewed with such a display device, respectively). . Since the composite image combines the right-eye image and the left-eye image, there are corresponding points and regions in the composite image.
図13を用いて、エラーの伝播により、対応する領域同士に大きな差が生じ得ることを説明する。今、右目用画像の縮小画像と左目用画像の縮小画像とが並置合成された、図13(A)に示すnフレーム目の合成画像において、パケットロスにより、領域Yが欠落したとする。なお、図13(A)及び(B)における領域XL及びXRは左目用画像と右目用画像の対応する領域とする。 With reference to FIG. 13, it will be described that a large difference may occur between corresponding regions due to error propagation. Assume that the region Y is lost due to packet loss in the composite image of the nth frame shown in FIG. 13A, in which the reduced image of the right-eye image and the reduced image of the left-eye image are combined in parallel. Note that regions XL and XR in FIGS. 13A and 13B are regions corresponding to the left-eye image and the right-eye image.
nフレーム目において、パケットロスによる領域Yの欠落により、この領域Yのデータは、補間処理や前フレームのデータ流用などが行われ、その結果、復号で得られる本来のデータとは異なったものとなる。すなわち、ノイズが混入したものとなる。n+1フレーム目において、復号の際、左目用画像の領域XLは領域Yを参照しており、右目用画像の領域XRは領域Yを参照していなかった場合、領域XLの復号データにはノイズが混入することになるが、領域XRの復号データにはノイズが混入しないことになる。この場合、対応する領域にも拘わらず、左右の視点間(右目用画像及び左目用画像間)で差が生じることになる。 In the nth frame, due to the lack of the area Y due to packet loss, the data in this area Y is subjected to interpolation processing, data diversion of the previous frame, etc. As a result, it differs from the original data obtained by decoding Become. That is, noise is mixed. In the (n + 1) th frame, when decoding, if the region XL of the left-eye image refers to the region Y and the region XR of the right-eye image does not refer to the region Y, the decoded data in the region XL has noise. Although mixed, noise is not mixed in the decoded data in the region XR. In this case, a difference occurs between the left and right viewpoints (between the right-eye image and the left-eye image) regardless of the corresponding region.
立体映像において、左右視点間で対応する領域間で差が大きい場合、立体感が感じられないものとなってしまう。さらに、視点間での画像の差が大きい場合、観察者の脳内で、視野闘争と呼ばれる現象が起こる。これは、右目に入る映像と左目に入る映像に大きな差がある場合、どちらかの視点の映像のみを脳が認識し、それが短時間で入れ替わって知覚されるという現象である。このような現象が起こると、ちらつきが感じられ、不快な立体映像となってしまう。 In a stereoscopic image, when there is a large difference between corresponding regions between the left and right viewpoints, the stereoscopic effect is not felt. Furthermore, when the image difference between the viewpoints is large, a phenomenon called visual field struggle occurs in the observer's brain. This is a phenomenon in which, when there is a large difference between the video entering the right eye and the video entering the left eye, the brain recognizes only the video from either viewpoint and perceives it by switching in a short time. When such a phenomenon occurs, flickering is felt, resulting in an unpleasant stereoscopic image.
そのため、右目用画像及び左目用画像を多重化かつ符号化した情報の一部が欠落しても、復号された右目用画像及び左目用画像が立体感を感じられ、かつ、視野闘争を引き起こさない立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムが望まれている。 Therefore, even if a part of information obtained by multiplexing and encoding the right-eye image and the left-eye image is lost, the decoded right-eye image and left-eye image can feel a three-dimensional effect and do not cause a visual field conflict. A stereoscopic video encoding apparatus, a stereoscopic video decoding apparatus, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program are desired.
第1の本発明の立体映像符号化装置は、(1)縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成する画像多重手段と、(2)生成された多重画像を符号化する符号化手段とを備え、(3)上記画像多重手段は、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成し、(4)上記横方向ラインの所定範囲が、全ての横方向ラインで同じであって、上記左目用画像及び上記右目用画像の視差量に応じて定まり、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であることを特徴とする。
第2の本発明の立体映像符号化装置は、(1)縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成する画像多重手段と、(2)生成された多重画像を符号化する符号化手段とを備え、(3)上記画像多重手段は、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成し、(4)上記横方向ラインの所定範囲が、横方向ライン毎、若しくは、数ラインでなる横方向ラインの組毎に相違し、処理対象の横方向ライン若しくは横方向ライン組の、上記左目用画像及び上記右目用画像の視差量に応じて定まり、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であり、(5)上記左目用画像及び上記右目用画像の相関が高い領域の探索を行い、その探索により得られた複数の視差量のうち、最大の視差量若しくは最大頻度の視差量を、上記左目用画像及び上記右目用画像の視差量とする視差パラメータ算出手段を備えることを特徴とする。
The stereoscopic video encoding apparatus according to the first aspect of the present invention includes (1) image multiplexing means for generating a multiplexed image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels, and (2) generated multiplexing And (3) the image multiplexing unit is configured to store information on a predetermined range of horizontal lines of the left-eye image and the right-eye image in the same vertical direction with a predetermined number of pixels. By alternately mixing in the horizontal direction in units, information on the horizontal lines of the multiple images having the same vertical direction is generated . (4) The predetermined range of the horizontal lines is the same for all the horizontal lines. It is determined according to the amount of parallax between the left-eye image and the right-eye image, and is a range in which there are areas corresponding to the left-eye image and the right-eye image .
The stereoscopic video encoding apparatus according to the second aspect of the present invention includes (1) image multiplexing means for generating a multiplexed image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels, and (2) generated multiplexing And (3) the image multiplexing means stores information on a predetermined range of horizontal lines of the left-eye image and the right-eye image having the same vertical direction in a predetermined number of pixels. The horizontal line information of the multiple images having the same vertical direction is generated by alternately mixing in the horizontal direction in units. (4) The predetermined range of the horizontal line is set for each horizontal line or several lines. The left-eye image and the right-eye image, which are different for each set of horizontal lines, are determined according to the amount of parallax between the left-eye image and the right-eye image of the horizontal line or the horizontal line set to be processed. Is a range where there is an area corresponding to ( ) A search is performed for a region having a high correlation between the left-eye image and the right-eye image, and among the plurality of parallax amounts obtained by the search, the maximum parallax amount or the highest-frequency parallax amount is determined as the left-eye image and Disparity parameter calculation means for setting the amount of parallax for the right-eye image is provided.
第3の本発明の立体映像復号装置は、第1の本発明の立体映像符号化装置が形成した多重画像の符号化データが入力されると共に第1の本発明の立体映像符号化装置から視差量の情報が入力されるものであって、(1)入力された多重画像の符号化データを復号する復号手段と、(2)復号により得られた多重画像に対して、入力された視差量の情報を適用して、第1の本発明の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段とを備えることを特徴とする。
第4の本発明の立体映像復号装置は、第2の本発明の立体映像符号化装置が形成した多重画像の符号化データが入力されると共に第2の本発明の立体映像符号化装置から視差量の情報が入力されるものであって、(1)入力された多重画像の符号化データを復号する復号手段と、(2)復号により得られた多重画像に対して、入力された視差量の情報を適用して、第2の本発明の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段とを備えることを特徴とする。
The stereoscopic video decoding apparatus according to the third aspect of the present invention receives the encoded data of the multiplexed image formed by the stereoscopic video encoding apparatus according to the first aspect of the present invention and receives the parallax from the stereoscopic video encoding apparatus of the first aspect of the present invention. be one amount of information is input, (1) decoding means for decoding the encoded data of the input multiplexed image, (2) for multiple image obtained by decoding, parallax amount inputted The image demultiplexing means for separating and extracting the left-eye image and the right-eye image by performing demultiplexing of the inverse processing of the image multiplexing means in the stereoscopic video encoding device of the first aspect of the present invention by applying the above information It is characterized by providing.
The stereoscopic video decoding apparatus according to the fourth aspect of the present invention receives the encoded data of the multiplexed image formed by the stereoscopic video encoding apparatus according to the second aspect of the present invention and receives the parallax from the stereoscopic video encoding apparatus of the second aspect of the present invention. (1) decoding means for decoding the encoded data of the input multiple image, and (2) the amount of parallax input to the multiple image obtained by decoding. The image demultiplexing means for separating and extracting the left-eye image and the right-eye image by performing demultiplexing of the inverse processing of the image multiplexing means in the stereoscopic video encoding device of the second aspect of the present invention by applying the above information It is characterized by providing.
第5の本発明の立体映像符号化システムは、第1の本発明の立体映像符号化装置と、第3の本発明の立体映像復号装置とを有することを特徴とする。
第6の本発明の立体映像符号化システムは、第2の本発明の立体映像符号化装置と、第4の本発明の立体映像復号装置とを有することを特徴とする。
Fifth stereoscopic video encoding system of the present invention is characterized by having a three-dimensional video encoding apparatus of the first aspect of the present invention, a stereoscopic video decoding apparatus of the third invention.
The stereoscopic video encoding system of the sixth aspect of the present invention includes the stereoscopic video encoding apparatus of the second aspect of the present invention and the stereoscopic video decoding apparatus of the fourth aspect of the present invention.
第7の本発明の立体映像符号化プログラムは、コンピュータを、(1)縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成するものであって、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成する画像多重手段と、(2)生成された多重画像を符号化する符号化手段として機能させる立体映像符号化プログラムであって、(3)上記横方向ラインの所定範囲が、全ての横方向ラインで同じであって、上記左目用画像及び上記右目用画像の視差量に応じて定まり、視差に拘わらず、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であることを特徴とする。
第8の本発明の立体映像符号化プログラムは、コンピュータを、(1)縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成するものであって、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成する画像多重手段と、(2)生成された多重画像を符号化する符号化手段と、(3)上記左目用画像及び上記右目用画像の相関が高い領域の探索を行い、その探索により得られた複数の視差量のうち、最大の視差量若しくは最大頻度の視差量を、上記左目用画像及び上記右目用画像の視差量とする視差パラメータ算出手段として機能させる立体映像符号化プログラムであって、(4)上記横方向ラインの所定範囲が、横方向ライン毎、若しくは、数ラインでなる横方向ラインの組毎に相違し、処理対象の横方向ライン若しくは横方向ライン組の、上記左目用画像及び上記右目用画像の視差量に応じて定まり、視差に拘わらず、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であることを特徴とする。
According to a seventh aspect of the present invention, there is provided a three-dimensional video encoding program for generating a multiple image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels, and having the same vertical direction. The information of the predetermined range of the horizontal line of the left eye image and the right eye image of the left eye image and the right eye image is alternately mixed in the horizontal direction in units of a predetermined number of pixels, and the horizontal line information of the multiple images having the same vertical direction is obtained. And (2) a stereoscopic video encoding program that functions as an encoding unit that encodes the generated multiplexed image , and (3) a predetermined range of the horizontal line includes all horizontal directions It is the same in the line, and is determined according to the amount of parallax between the left-eye image and the right-eye image, and the range corresponding to the left-eye image and the right-eye image exists regardless of the parallax. Features.
According to an eighth aspect of the present invention, there is provided a stereoscopic video encoding program for generating a multiple image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels and having the same vertical direction. The information of the predetermined range of the horizontal line of the left eye image and the right eye image of the left eye image and the right eye image is alternately mixed in the horizontal direction in units of a predetermined number of pixels, and the horizontal line information of the multiple images having the same vertical direction is obtained. (2) encoding means for encoding the generated multiplexed image; and (3) searching for a region having a high correlation between the left-eye image and the right-eye image, and obtaining by the search. A stereoscopic video encoding program that functions as a parallax parameter calculation unit that uses a parallax amount of the left-eye image and the right-eye image as a parallax amount of the left-eye image and the right-eye image among a plurality of parallax amounts obtained. , (4) The predetermined range of horizontal lines is different for each horizontal line or for each set of horizontal lines consisting of several lines, and the left eye image and the right eye of the horizontal line or horizontal line set to be processed It is determined according to the amount of parallax of the image for use, and is a range in which areas corresponding to the image for the left eye and the image for the right eye exist regardless of the parallax.
第9の本発明の立体映像復号プログラムは、第1の本発明の立体映像符号化装置が形成した多重画像の符号化データが入力されると共に第1の本発明の立体映像符号化装置から視差量の情報が入力される装置に搭載されるコンピュータを、(1)入力された多重画像の符号化データを復号する復号手段と、(2)復号により得られた多重画像に対して、入力された視差量の情報を適用して、第1の本発明の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段として機能させることを特徴とする。
第10の本発明の立体映像復号プログラムは、第2の本発明の立体映像符号化装置が形成した多重画像の符号化データが入力されると共に第2の本発明の立体映像符号化装置から視差量の情報が入力される装置に搭載されるコンピュータを、(1)入力された多重画像の符号化データを復号する復号手段と、(2)復号により得られた多重画像に対して、入力された視差量の情報を適用して、第2の本発明の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段として機能させることを特徴とする。
The stereoscopic video decoding program of the ninth aspect of the present invention receives the encoded data of the multiplexed image formed by the stereoscopic video encoding apparatus of the first aspect of the present invention, and receives the parallax from the stereoscopic video encoding apparatus of the first aspect of the present invention. A computer mounted on a device to which the quantity information is input is input to (1) decoding means for decoding encoded data of the input multiple image, and (2) input to the multiple image obtained by decoding. Image demultiplexing that separates and extracts a left-eye image and a right-eye image by performing demultiplexing by inverse processing of the image multiplexing means in the stereoscopic video encoding device of the first aspect of the present invention by applying the parallax information It is made to function as a means.
The stereoscopic video decoding program according to the tenth aspect of the present invention receives encoded data of a multiplexed image formed by the stereoscopic video encoding apparatus according to the second aspect of the present invention and receives parallax from the stereoscopic video encoding apparatus according to the second aspect of the present invention. A computer mounted on a device to which the quantity information is input is input to (1) decoding means for decoding encoded data of the input multiple image, and (2) input to the multiple image obtained by decoding. Image demultiplexing that separates and extracts a left-eye image and a right-eye image by performing demultiplexing of inverse processing of the image multiplexing means in the stereoscopic video encoding device of the second aspect of the present invention by applying the information on the amount of parallax It is made to function as a means.
本発明によれば、右目用画像及び左目用画像を多重化かつ符号化した情報の一部が欠落しても、復号された右目用画像及び左目用画像が立体感を感じられ、かつ、視野闘争を引き起こさない立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムを提供できる。 According to the present invention, even if a part of information obtained by multiplexing and encoding the right-eye image and the left-eye image is lost, the decoded right-eye image and left-eye image can feel a stereoscopic effect, and the field of view A stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program that do not cause a conflict can be provided.
(A)第1の実施形態
以下、本発明による立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムの第1の実施形態を、図面を参照しながら説明する。
(A) First Embodiment Hereinafter, a first embodiment of a stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program according to the present invention will be described. This will be described with reference to the drawings.
第1の実施形態の立体映像符号化システムは、立体映像通信システムに組み込まれたものである。 The stereoscopic video encoding system of the first embodiment is incorporated in a stereoscopic video communication system.
(A−1)第1の実施形態の構成
図1は、第1の実施形態の立体映像符号化システムを含む立体映像通信システムの構成を示すブロック図である。
(A-1) Configuration of First Embodiment FIG. 1 is a block diagram showing a configuration of a stereoscopic video communication system including the stereoscopic video encoding system of the first embodiment.
図1において、立体映像通信システム1は、立体映像送信装置10及び立体映像受信装置20を有する。
In FIG. 1, the stereoscopic
立体映像送信装置10は、画像多重部11、符号化部12及び送信部13を有する。ここで、画像多重部11及び符号化部12は、第1の実施形態の立体映像符号化装置の構成要素である。少なくとも画像多重部11及び符号化部12の部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良い。
The stereoscopic
画像多重部11は、入力された左目用画像PICL及び右目用画像PICRを多重(合成)し、多重画像を符号化部12に出力するものである。ここで、一対の左目用画像PICL及び右目用画像PICRは同時刻の視点(撮影を行った位置)が異なる立体視用の画像である。
The
左目用画像PICL及び右目用画像PICRは、撮像装置が得たばかりのものであっても良く、記録媒体等から読み出したものであっても良く、他の装置から送信されて受信したものであっても良い。すなわち、左目用画像PICL及び右目用画像PICRの入力方法は、問われないものである。 The left-eye image PICL and the right-eye image PICR may be those just obtained by the imaging device, may be read from a recording medium or the like, and are transmitted and received from other devices. Also good. That is, the input method of the left-eye image PICL and the right-eye image PICR is not limited.
また、一対の左目用画像PICL及び右目用画像PICRは、同じ種類の画像であれば、輝度信号(Y)の画像であっても良く、いずれかの色差信号(Cb、Cr)の画像であっても良く、いずれかの色信号(R、G、B)の画像であっても良い。左目用画像PICL及び右目用画像PICRの大きさは限定されるものではない。例えば、縦横1080ライン×1920画素、縦横540ライン×960画素、縦横480ライン×720画素、縦横288ライン×360画素、縦横240ライン×360画素、縦横144ライン×180画素、縦横120ライン×180画素、縦横72ライン×90画素などのいずれの大きさであっても良い。また、1画素当たりのビット数も限定されるものではない。 Further, the pair of left-eye image PICL and right-eye image PICR may be images of luminance signals (Y) as long as they are the same type of image, and may be images of one of the color difference signals (Cb, Cr). It may be an image of any color signal (R, G, B). The sizes of the left-eye image PICL and the right-eye image PICR are not limited. For example, vertical and horizontal 1080 lines × 1920 pixels, vertical and horizontal 540 lines × 960 pixels, vertical and horizontal 480 lines × 720 pixels, vertical and horizontal 288 lines × 360 pixels, vertical and horizontal 240 lines × 360 pixels, vertical and horizontal 144 lines × 180 pixels, vertical and horizontal 120 lines × 180 pixels Any size such as vertical and horizontal 72 lines × 90 pixels may be used. Also, the number of bits per pixel is not limited.
画像多重部11は、図2(A1)及び(A2)に示すように、左目用画像PICL及び右目用画像PICRをそれぞれ、縦方向の分割線に沿って、複数の縦縞画像部分SL−1〜SL−N、SR−1〜SR−N(Nは2以上の整数)に分割した後、図2(B)に示すように、左目用画像PICLの縦縞画像部分SL−1〜SL−Nと右目用画像PICRの縦縞画像部分SR−1〜SR−Nとを横方向に交互に配置した多重画像CPICを形成して出力する。
As shown in FIGS. 2A1 and 2A, the
多重画像CPICは、左目用画像PICLの縦縞画像部分SL−1〜SL−Nと右目用画像PICRの縦縞画像部分SR−1〜SR−Nとを横方向に交互に配置している画像であるため、左右視点の対応する領域の画素同士の距離は短いものとなっている(左右視点の対応する領域の画素同士が近付いたものとなっている)。そのため、通信時のパケットロス等が生じた場合であっても、左右視点の対応する領域が共に欠落する可能性が高くなる。 The multiple image CPIC is an image in which the vertical stripe image portions SL-1 to SL-N of the left eye image PICL and the vertical stripe image portions SR-1 to SR-N of the right eye image PICR are alternately arranged in the horizontal direction. Therefore, the distance between the pixels in the corresponding region of the left and right viewpoints is short (the pixels in the corresponding region of the left and right viewpoints are close to each other). For this reason, even when packet loss or the like occurs during communication, there is a high possibility that the corresponding areas of the left and right viewpoints are lost.
左目用画像PICL及び右目用画像PICRを、縦方向の分割線に沿って、複数の縦縞画像部分SL−1〜SL−N、SR−1〜SR−Nに分割するようにしたのは、以下の考え方による。人間の2つの目は横方向(左右方向)に離間しており、その左右の目で立体感を感じるため、立体視画像においては横方向が縦方向より重みが大きく、横縞画像部分を縦方向に交互に配置した場合であれば、通信時のパケットロス等が生じた場合に生じる、左右視点の対応する欠落した領域が縦方向に存在するが、上記のように、縦縞画像部分を横方向に交互に配置した場合であれば、通信時のパケットロス等が生じた場合に生じる、左右視点の対応する欠落した領域が横方向に存在し、後述する効果が有効なものとなる。 The left-eye image PICL and the right-eye image PICR are divided into a plurality of vertical stripe image portions SL-1 to SL-N and SR-1 to SR-N along the vertical dividing line as follows. According to the idea. The two human eyes are separated in the horizontal direction (left and right direction), and the left and right eyes feel a three-dimensional effect. Therefore, in a stereoscopic image, the horizontal direction has a higher weight than the vertical direction, and the horizontal stripe image portion is If there is an alternating arrangement, the missing areas corresponding to the left and right viewpoints exist in the vertical direction, which occurs when packet loss or the like occurs during communication. In the case where they are alternately arranged, there is a corresponding missing region in the left and right viewpoints that occurs when packet loss or the like during communication occurs, and the effects described later are effective.
ここで、各縦縞画像部分SL−1〜SL−N、SR−1〜SR−Nの幅は限定されるものではない。例えば、縦縞画像部分SL−1〜SL−N、SR−1〜SR−Nの幅が1画素であっても良く、また、複数画素であっても良い。複数画像の場合、欠落領域の補間処理や符号化などで定まっているブロックの大きさを考慮して具体的な画素数を定めるようにしても良い。例えば、動きベクトルの探索で用いるブロックの一辺の半分の画素数を縦縞画像部分の幅に選定しても良い。後述する動作の項では、縦縞画像部分SL−1〜SL−N、SR−1〜SR−Nの幅が1画素であるとして説明する。 Here, the widths of the vertical stripe image portions SL-1 to SL-N and SR-1 to SR-N are not limited. For example, the vertical stripe image portions SL-1 to SL-N and SR-1 to SR-N may have a width of one pixel or a plurality of pixels. In the case of a plurality of images, the specific number of pixels may be determined in consideration of the block size determined by interpolation processing or encoding of the missing region. For example, half the number of pixels on one side of the block used for motion vector search may be selected as the width of the vertical stripe image portion. In the section of the operation described later, the description will be made assuming that the vertical stripe image portions SL-1 to SL-N and SR-1 to SR-N have a width of one pixel.
符号化部12は、画像多重部11から出力された、左目用画像PICL及び右目用画像PICRの多重画像CPICを所定の符号化方式に従って符号化するものである。ここで、符号化方式は限定されないが、例えば、H.264/MPEG−4 AVCのような符号化方式を適用できる。
The
送信部13は、符号化部12から出力された符号化データから、送信データ(例えばパケット)を形成して立体映像受信装置20に向けて送信するものである。
The
ここで、立体映像送信装置10及び立体映像受信装置20間の伝送路は、専用回線であっても良く、また、多くの人が利用できる通信網であっても良い。立体映像送信装置10及び立体映像受信装置20間の通信方式(例えば、暗号化の有無、通信速度、伝送路符号化方式、有線・無線通信など)は限定されるものではない。また、送信部13は、例えば、輝度信号用の符号化データ、色差信号用の2つの符号化データから送信データを形成するものであっても良い。また、送信データに、複数フレームに係る符号化データを挿入するようにしても良い。
Here, the transmission path between the stereoscopic
立体映像受信装置20は、受信部21、復号部22及び画像多重分離部23を有する。ここで、復号部22及び画像多重分離部23は、第1の実施形態の立体映像復号装置の構成要素である。少なくとも復号部22及び画像多重分離部23の部分は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置若しくはユニットが所定のプログラムを実行することで該当する機能を実現するように構築されても良い。
The stereoscopic
受信部21は、立体映像送信装置10からの送信データを受信処理して符号化データを取り出して復号部22に与えるものである。
The receiving
復号部22は、符号化データに対して復号を行って、図2(B)に示す多重画像CPICを得て画像多重分離部23に与えるものである。
The
画像多重分離部23は、多重画像CPICを縦縞部分SL−1、SR−1、…、SL−N、SR−Nに分解しつつ、奇数番目の縦縞部分SL−1、…、SL−Nを横方向に並置して左目用画像PICLを再生すると共に、偶数番目の縦縞部分SR−1、…、SR−Nを横方向に並置して右目用画像PICRを再生するものである。
The
再生された左目用画像PICL及び右目用画像PICRは、例えば、表示機器30に与えられて立体視映像の表示に供される。
The reproduced left-eye image PICL and right-eye image PICR are provided to the
(A−2)第1の実施形態の動作
次に、第1の実施形態の立体映像符号化システムを含む立体映像通信システム1の動作を説明する。
(A-2) Operation of the First Embodiment Next, the operation of the stereoscopic
初めに、立体映像送信装置10の動作を、図3のフローチャートを参照しながら説明する。図3は、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重して送信する動作を示しており、この図3に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。
First, the operation of the stereoscopic
まず、画像多重部11は、撮影カメラや記録ファイルといった映像ソースから、同期している一対の左目用画像PICL及び右目用画像PICR(左右の視点画像)を取得する(ステップS101)。ここで、左目用画像PICL及び右目用画像PICRの取得は、並行して行っても良く、順次行っても良い。
First, the
次に、画像多重部11は、図2に示したように、左目用画像PICL及び右目用画像PICRの縦方向の画素列(縦縞画像部分)SL−1〜SL−N、SR−1〜SR−Nが横方向に交互に並ぶような形式で左目用画像PICL及び右目用画像PICRを多重する(ステップS102)。すなわち、左目用画像PICLから得られた縦方向画素列SL−1〜SL−Nが多重画像CPICの奇数列に並び、右目用画像PICRから得られた縦方向画素列SR−1〜SR−Nが多重画像CPICの偶数列に並ぶように多重処理を行う。上述したように、多重画像CPICは、左目用画像PICL及び右目用画像PICRの対応する領域同士が近い位置に存在するものとなっている。
Next, as illustrated in FIG. 2, the
画像多重部11は、得られた多重画像CPICを符号化部12に与える(ステップS103)。このとき、符号化部12は、多重画像CPICを所定の符号化方式に従って符号化し(ステップS104)、得られた符号化データを送信部13に与える(ステップS105)。
The
送信部13は、与えられた符号化データから送信データを組み立て(ステップS106)、その送信データを立体映像受信装置20へ向けて送信する(ステップS107)。送信部13は、例えば、ステップS106では、与えられた符号化データを伝送路へ送信できるサイズへ分割し、RTP(Real−time Transport Protocol)に従ってパケット化し、送信データとなるパケットを形成する。このような場合であれば、1フレーム分の左目用画像PICL及び右目用画像PICRから、複数のパケットが形成されて送信されることとなる。
The
次に、立体映像受信装置20の動作を、図4のフローチャートを参照しながら説明する。図4は、受信データに基づき、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重分離する動作を示しており、この図4に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。以下では、送信データがパケットであるとして説明する。
Next, the operation of the stereoscopic
受信部21は、送信側より送られたパケットを受信し(ステップS201)、
受信したパケットから、ヘッダ情報などを取り除いて符号化データを得て(ステップS202)、得られた符号化データを復号部22に与える(ステップS203)。
The receiving
Header data and the like are removed from the received packet to obtain encoded data (step S202), and the obtained encoded data is provided to the decoding unit 22 (step S203).
復号部22は、入力された符号化データを復号した後(ステップS204)、今回の復号情報を含めて1フレーム分の復号画像が得られたか否かを判別する(ステップS205)。1フレーム分の復号画像が得られなかった場合には、ステップS201へ戻り、1フレーム分の復号画像が得られた場合には、復号部22は、得られた復号画像を画像多重分離部23に与える(ステップS206)。ここで、送信側において、1フレーム分の符号化データを複数のパケットに振り分けて挿入している場合には、ステップS205からステップS201へ戻る処理が実行されることとなる。
After decoding the input encoded data (step S204), the
画像多重分離部23は、復号画像(復号された多重画像)から、左目用画像及び右目用画像を多重分離する(ステップS207)。この多重分離処理は、画像多重部11で行った多重処理の逆の処理である(図2参照)。すなわち、復号された多重画像CPICの奇数列の縦方向画素列のみを集めて左目用画像PICLを得ると共に、多重画像CPICの偶数列の縦方向画素列のみを集めて右目用画像PICRを得る。
The
画像多重分離部23は、得られた左目用画像及び右目用画像を表示機器30に与え(ステップS208)、立体視表示させる。
The
(A−3)第1の実施形態の効果
第1の実施形態においては、左目用画像及び右目用画像の縦1列を交互に並べることにより多重画像を形成したので、左目用画像及び右目用画像間の対応する領域同士が多重画像において近傍に位置する。
(A-3) Effects of the First Embodiment In the first embodiment, since the multiple images are formed by alternately arranging the vertical columns of the left-eye image and the right-eye image, the left-eye image and the right-eye image Corresponding regions between images are located in the vicinity of the multiple images.
そのため、この多重画像を符号化した符号化データ中でも近い位置にある。仮に、伝送途中に、パケットロスが発生したとしても、片方の視点映像のみ正しく復号され、もう片方が正しく復号できない、ということが起こりにくくなる。 Therefore, it is in a close position in the encoded data obtained by encoding this multiplexed image. Even if a packet loss occurs in the middle of transmission, it is less likely that only one viewpoint video is correctly decoded and the other cannot be decoded correctly.
また、ノイズの伝播に関しても、対応する領域が近傍に存在するため、片方の視点のある点が存在する領域(例えばマクロブロック)が、復号の際に、誤りのある復号画像を参照していたとしても、もう片方の視点の対応する点が同じ領域(マクロブロック)に存在していれば、同様に誤りを参照することになるため、対応点同士は同じようなノイズとなる。そのため、立体映像受信装置から出力された映像を立体表示した場合、対応する領域には、ノイズが乗っているものの、視点間の差が小さいため、視野闘争が起きて不快な立体映像となることを回避することができる。 Also, with respect to noise propagation, since a corresponding region exists in the vicinity, a region where a point with one viewpoint exists (for example, a macroblock) referred to a decoded image having an error at the time of decoding. However, if the corresponding point of the other viewpoint exists in the same region (macroblock), an error is referred to in the same manner, so that the corresponding points have the same noise. For this reason, when the video output from the stereoscopic video receiver is stereoscopically displayed, although the corresponding area is noisy, the difference between the viewpoints is small, resulting in an uncomfortable stereoscopic video due to a visual field conflict. Can be avoided.
(B)第2の実施形態
次に、本発明による立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムの第2の実施形態を、図面を参照しながら説明する。
(B) Second Embodiment Next, a stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, and a stereoscopic video encoding program and a stereoscopic video decoding program according to a second embodiment of the present invention will be described. This will be described with reference to the drawings.
第2の実施形態の立体映像符号化システムは、立体映像通信システムに組み込まれたものである。 The stereoscopic video encoding system of the second embodiment is incorporated in a stereoscopic video communication system.
(B−1)第2の実施形態の構成
第1の実施形態の立体映像符号化方式では、符号化前の多重処理において、左目用画像及び右目用画像のそれぞれの所定幅(例えば1画素)の縦縞画像部分を横方向に交互に並べることにより、左目用画像及び右目用画像(左右視点)間の対応する領域同士が近傍となるようにしていた。
(B-1) Configuration of the Second Embodiment In the stereoscopic video encoding system of the first embodiment, the predetermined width (for example, one pixel) of each of the left-eye image and the right-eye image in the multiplex processing before encoding. By alternately arranging the vertical stripe image portions in the horizontal direction, corresponding regions between the left-eye image and the right-eye image (left and right viewpoints) are arranged in the vicinity.
しかしながら、写されている物体の撮影カメラからの距離によっては、第1の実施形態のような多重処理では、対応する領域同士が近傍に存在しないこともあり得る。例えば、撮影カメラから物体までの距離が近付くほど、左目用画像におけるその物品領域と右目用画像におけるその物品領域との横方向の距離が離れ、視差量が大きくなる。図5(A1)及び(A2)に示す左目用画像PICL及び右目用画像PICRは、このような視差領域が大きい画像の対となっている。左目用画像PICLにおいて、二等辺三角形形状の物品は左端から距離LLだけ離れた位置にあり、右目用画像PICRにおいて、二等辺三角形形状の物品は左端から距離LRだけ離れた位置にあり、2つの距離LL及びLRの差n=LL−LRはかなり大きい。以上のように、撮影カメラからの距離が近い物体が位置している、左目用画像PICL及び右目用画像PICRにおける領域に関しては、第1の実施形態の多重処理を施しても、多重画像CPICにおいて、左目用画像PICL及び右目用画像PICRにおける対応領域同士の距離が離れている。図5の例で言えば、差nの距離だけ離れている。 However, depending on the distance of the object being photographed from the camera, the corresponding regions may not exist in the vicinity in the multiplex processing as in the first embodiment. For example, as the distance from the photographing camera to the object gets closer, the lateral distance between the article region in the left-eye image and the article region in the right-eye image increases, and the amount of parallax increases. The left-eye image PICL and the right-eye image PICR shown in FIGS. 5A1 and 5A2 are a pair of images having such a large parallax region. In the left-eye image PICL, the isosceles triangle-shaped article is at a position away from the left end by a distance LL, and in the right-eye image PICR, the isosceles triangle-shaped article is at a position away from the left end by a distance LR. The difference n = LL−LR between the distances LL and LR is quite large. As described above, regarding the regions in the left-eye image PICL and the right-eye image PICR where an object that is close to the photographing camera is located, even if the multiple processing of the first embodiment is performed, in the multiple image CPIC The distances between the corresponding regions in the left-eye image PICL and the right-eye image PICR are increased. In the example of FIG. 5, it is separated by a distance n.
そのため、パケットロスによるノイズの影響が、各視点(左目用画像PICL及び右目用画像PICR)で異なるということが起こり得る。また、左右視点(左目用画像PICL及び右目用画像PICR)の縦縞画像部分を横方向に交互に並べても、撮影カメラからの距離が近い場合には、対応しない領域の縦縞画像部分が交互に並んで相関の低い領域となるため、符号化効率が悪くなってしまう。 Therefore, it is possible that the influence of noise due to packet loss is different at each viewpoint (left-eye image PICL and right-eye image PICR). Even if the vertical stripe image portions of the left and right viewpoints (left eye image PICL and right eye image PICR) are alternately arranged in the horizontal direction, if the distance from the photographing camera is short, the vertical stripe image portions of the non-corresponding region are alternately arranged. Therefore, the coding efficiency is deteriorated.
第2の実施形態〜後述する第4の実施形態の立体映像符号化システムは、以上の点に鑑み、撮影対象の物品の撮影カメラからの距離が近い場合でも、左目用画像PICL及び右目用画像PICRにおける対応領域同士が多重画像CPICで隣接するように多重しようとしたものである。 In view of the above points, the stereoscopic video encoding system according to the second embodiment to the fourth embodiment described later takes the image PICL for the left eye and the image for the right eye even when the article to be photographed is close to the photographing camera. This is an attempt to multiplex so that corresponding areas in the PICR are adjacent to each other in the multiplex image CPIC.
図6は、第2の実施形態の立体映像符号化システムを含む立体映像通信システムの構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。 FIG. 6 is a block diagram illustrating a configuration of a stereoscopic video communication system including the stereoscopic video encoding system according to the second embodiment. The configuration is the same as that of FIG. 1 according to the first embodiment, and the corresponding parts are the same. A reference numeral is attached.
図6において、立体映像通信システム1Aは、立体映像送信装置10A及び立体映像受信装置20Aを有する。
In FIG. 6, the stereoscopic
立体映像送信装置10Aは、画像多重部11A、符号化部12、送信部13A及び多重設定情報部14を有する。符号化部12は、第1の実施形態のものと同様である。ここで、画像多重部11A、符号化部12及び多重設定情報部14が、第2の実施形態の立体映像符号化装置の構成要素である。
The stereoscopic
第2の実施形態で新たに設けられた多重設定情報部14は、ユーザの指定などの形で指定された視差パラメータを保持するものである。視差パラメータは、例えば、左目用画像PICL及び右目用画像PICRにおける対応領域同士の横方向の位置ずれ量nである(図5参照)。視差パラメータの設定は、フレーム毎に行うものであっても良く、動画像の同一シーン毎に設定するものであっても良く、動画像のフレーム全体に共通するように設定するものであっても良い。後述する動作説明では、視差パラメータの設定はフレーム毎に行うものとして説明する。
The multiple
第2の実施形態に係る画像多重部11Aは、多重設定情報部14に保持されている視差パラメータを参照し、視差パラメータに応じて、入力された左目用画像PICLに対して、横方向に、非交互多重領域ARL1と交互多重領域ARL2とに区分すると共に、入力された右目用画像PICRに対して、横方向に、交互多重領域ARR2と非交互多重領域ARR1とに区分し、さらに、図5(A1)及び(A2)に示すように、縦方向の分割線に沿って、複数の縦縞画像部分ARL2−1〜ARL2−M、ARR2−1〜ARR2−M(Mは2以上の整数)に分割し、その後、図5(B)に示すように、左目用画像PICLの非交互多重領域ARL1、左目用画像PICLの縦縞画像部分ARL2−1〜ARL2−Mと右目用画像PICRの縦縞画像部分ARR2−1〜ARR2−Mとの横方向の交互配置領域、右目用画像PICRの非交互多重領域ARR1とを左側から配置することにより、多重画像CPICAを形成して出力する。
The
なお、左目用画像PICLの非交互多重領域ARL1は、左目用画像PICLでは写っているが、右目用画像PICRでは写っていない領域に相当し、右目用画像PICRの非交互多重領域ARR1は、右目用画像PICRでは写っているが、左目用画像PICLでは写っていない領域に相当し、左目用画像PICLの交互多重領域ARL2及び右目用画像PICRの交互多重領域ARR2は、左目用画像PICLでも右目用画像PICRでも写っている領域に相当する。 Note that the non-alternate multiple region ARL1 of the left-eye image PICL corresponds to a region that is captured in the left-eye image PICL but not in the right-eye image PICR, and the non-alternate multiple region ARR1 of the right-eye image PICR is the right-eye image. It corresponds to a region that is captured in the image PICR for the image but is not captured in the image PICL for the left eye. This corresponds to a region that is also shown in the image PICR.
第2の実施形態に係る送信部13Aは、符号化部12から出力された符号化データと多重設定情報部14で保持されている視差パラメータとを多重した後、送信データ(例えばパケット)を形成して立体映像受信装置20Aに向けて送信するものである。上記では、視差パラメータの情報は全てのフレームの送信データに多重するように説明したが、設定された視差パラメータの有効期間によっては、他の方法によって、視差パラメータの情報を立体映像受信装置20Aに与えるようにしても良い。例えば、一連の動画像データの最初のフレームの符号化データのみに視差パラメータを多重して立体映像受信装置20Aに与えるようにしても良い。また例えば、立体映像送信装置10A及び立体映像受信装置20A間で、画像データを授受し合う動作の開始前に行うネゴシエーション期間で視差パラメータを立体映像送信装置10Aから立体映像受信装置20Aへ与えるようにしても良い。
13 A of transmission parts which concern on 2nd Embodiment form transmission data (for example, packet), after multiplexing the encoding data output from the
立体映像受信装置20Aは、受信部21A、復号部22、画像多重分離部23A及び多重分離設定情報部24を有する。復号部22は、第1の実施形態のものと同様である。ここで、復号部22、画像多重分離部23A及び多重分離設定情報部24が、第2の実施形態の立体映像復号装置の構成要素である。
The stereoscopic
第2の実施形態に係る受信部21Aは、立体映像送信装置10Aが送信したデータを受信し、視差パラメータと符号化データとに多重分離し、視差パラメータを多重分離設定情報部24に与え、符号化データを復号部22に与えるものである。
The receiving
第2の実施形態で新たに設けられた多重分離設定情報部24は、受信部21Aから与えられた視差パラメータを保持するものである。
The demultiplexing setting
第2の実施形態に係る画像多重分離部23Aは、多重分離設定情報部24に設定されている視差パラメータを参照し、図5を用いて説明した、上述した画像多重部11Aによる多重処理の逆処理(多重分離処理)を行い、左目用画像PICL及び右目用画像PICR(すなわち、左右視点画像)を再生するものである。
The
(B−2)第2の実施形態の動作
次に、第2の実施形態の立体映像符号化システムを含む立体映像通信システム1Aの動作を説明する。
(B-2) Operation of the Second Embodiment Next, the operation of the stereoscopic
初めに、立体映像送信装置10Aの動作を、図7のフローチャートを参照しながら説明する。図7において、第1の実施形態に係る図3との同一ステップには同一符号を付して示している。図7は、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重して送信する動作を示しており、この図7に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。
First, the operation of the stereoscopic
まず、多重設定情報部14に保持されている視差パラメータの情報が、ユーザからの指示など、外部からの指定によって更新される(ステップS301)。
First, the parallax parameter information held in the multiple
そして、画像多重部11は、撮影カメラや記録ファイルといった映像ソースから、同期している一対の左目用画像PICL及び右目用画像PICR(左右の視点画像)を取得し(ステップS101)、図5に示したように、視差パラメータに応じて、入力された左目用画像PICL及び右目用画像PICRに対して、横方向に、非交互多重領域ARL1及びARR1と、交互多重領域ARL2及びARR2とに区分し、左目用画像PICLの非交互多重領域ARL1、左目用画像PICLの縦縞画像部分ARL2−1〜ARL2−Mと右目用画像PICRの縦縞画像部分ARR2−1〜ARR2−Mとの横方向の交互配置領域、右目用画像PICRの非交互多重領域ARR1とを左側から配置するように、左目用画像PICL及び右目用画像PICRを多重する(ステップS302)。
Then, the
画像多重部11は、得られた多重画像CPICAを符号化部12に与え(ステップS103)、符号化部12は、多重画像CPICAを所定の符号化方式に従って符号化し(ステップS104)、得られた符号化データを送信部13Aに与える(ステップS105)。
The
送信部13Aは、多重設定情報部14から視差パラメータを取得した後(ステップS303)、例えば、符号化部12から出力された符号化データのヘッダ部分の末尾へ、視差パラメータの情報を追加することにより、符号化データ及び視差パラメータの多重化を行う(ステップS304)。符号化データのヘッダとしては、シーケンス全体の符号化情報(シーケンスヘッダ)、各フレームに関する符号化情報(フレームヘッダ)、動画像の符号化単位であるマクロブロックを何個か合わせた各スライスに関する符号化情報(スライスヘッダ)などがあり、いずれのヘッダの末尾に追加しても良いが、以下では、フレームヘッダの末尾へ視差パラメータを含めるとして説明する。なお、符号化データの先頭に固定長の符号で視差パラメータを追加する、というような他の形式で多重しても構わない。
After acquiring the disparity parameter from the multiplex setting information unit 14 (step S303), the
送信部13Aは、与えられた視差パラメータが追加された符号化データから送信データを組み立て(ステップS106)、その送信データを立体映像受信装置20Aへ向けて送信する(ステップS107)。
The
次に、立体映像受信装置20Aの動作を、図8のフローチャートを参照しながら説明する。図8において、第1の実施形態に係る図4との同一ステップには同一符号を付して示している。図8は、受信データに基づき、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重分離する動作を示しており、この図8に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。以下では、送信データがパケットであるとして説明する。
Next, the operation of the stereoscopic
受信部21Aは、送信側より送られたパケットを受信し(ステップS201)、受信したパケットから、視差パラメータと符号化データを多重分離し(ステップS401)、多重分離設定情報部24に保持されている視差パラメータの情報を、受信した視差パラメータの値に更新すると共に(ステップS402)、得られた符号化データを復号部22に与える(ステップS203)。
The receiving
復号部22は、入力された符号化データを復号した後(ステップS204)、今回の復号情報を含めて1フレーム分の復号画像が得られたか否かを判別する(ステップS205)。1フレーム分の復号画像が得られなかった場合には、ステップS201へ戻り、1フレーム分の復号画像が得られた場合には、復号部22は、得られた復号画像を画像多重分離部23Aに与える(ステップS206)。
After decoding the input encoded data (step S204), the
画像多重分離部23Aは、多重分離設定情報部24に保持されている視差パラメータを参照し、復号画像(復号された多重画像)に対して、画像多重部11Aの多重処理に対応した多重分離処理を行って(図5参照)、左目用画像及び右目用画像を得る(ステップS403)。
The
画像多重分離部23Aは、得られた左目用画像及び右目用画像を表示機器30に与え(ステップS208)、立体視表示させる。
The
(B−3)第2の実施形態の効果
第2の実施形態によれば、利用者が視差パラメータを指定することにより、指定された視差を持つ対応点が隣接するような、左目用画像及び右目用画像の多重処理を行うので、指定された視差を持つ領域が隣接するため、この領域に対しては、パケットロスによるノイズの視点間の差が生じない。そのため、視差パラメータとして、人が注目する領域の視差量を指定した場合、その注目領域に対する、視点間の差が生じないため、主観的な画質の低下を抑えることが可能となる。また、指定された視差を持つ領域の空間的な相関性が高くなるため、この部分の符号化効率が向上し、主観品質が向上することが期待できる。このように、任意の視差量を持つ領域に関して、左右差に視野闘争を抑制し、符号化効率を向上させる効果がある。
(B-3) Effects of the Second Embodiment According to the second embodiment, the left eye image and the corresponding points having the designated parallax are adjacent to each other when the user designates the parallax parameter. Since the right-eye image is multiplexed, an area having the designated parallax is adjacent to the area, so that no difference between noise viewpoints due to packet loss occurs in this area. For this reason, when the amount of parallax of a region that a person is interested in is specified as a parallax parameter, there is no difference between viewpoints with respect to the region of interest, so that it is possible to suppress a deterioration in subjective image quality. In addition, since the spatial correlation of the area having the designated parallax becomes high, it can be expected that the coding efficiency of this part is improved and the subjective quality is improved. As described above, there is an effect of suppressing the field-of-view struggle in the left-right difference and improving the coding efficiency with respect to the region having an arbitrary amount of parallax.
(C)第3の実施形態
次に、本発明による立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムの第3の実施形態を、図面を参照しながら説明する。
(C) Third Embodiment Next, a third embodiment of a stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program according to the present invention will be described. This will be described with reference to the drawings.
第3の実施形態の立体映像符号化システムは、立体映像通信システムに組み込まれたものである。 The stereoscopic video encoding system of the third embodiment is incorporated in a stereoscopic video communication system.
上述した第2の実施形態では、視差パラメータを指定することにより、指定した視差をもつ領域の、パケットロスによるノイズの影響を低減するようにしていた。しかし、視差パラメータを指定する必要がある上、映像は時間と共に変化するため、適切な視差パラメータも変化する。この第3の実施形態では、入力画像から視差パラメータを推定する機能を追加している。 In the second embodiment described above, by specifying a parallax parameter, the influence of noise due to packet loss in an area having the designated parallax is reduced. However, since it is necessary to specify a parallax parameter and the video changes with time, an appropriate parallax parameter also changes. In the third embodiment, a function for estimating a parallax parameter from an input image is added.
図9は、第3の実施形態の立体映像符号化システムを含む立体映像通信システムの構成を示すブロック図であり、第2の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。 FIG. 9 is a block diagram illustrating a configuration of a stereoscopic video communication system including the stereoscopic video encoding system according to the third embodiment. The configuration is the same as that of FIG. 1 according to the second embodiment, and the corresponding parts are the same. A reference numeral is attached.
図9において、立体映像通信システム1Bは、立体映像送信装置10B及び立体映像受信装置20Aを有する。立体映像受信装置20Aは、第2の実施形態のものと同一であり、その機能説明は省略する。
In FIG. 9, the stereoscopic
立体映像送信装置10Bは、画像多重部11A、符号化部12、送信部13A及び多重設定情報部14に加え、視差パラメータ計算部15を有する。画像多重部11A、符号化部12、送信部13A及び多重設定情報部14は、第2の実施形態のものと同一であり、その機能説明は省略する。
The stereoscopic
視差パラメータ計算部15は、入力された左目用画像PICL及び右目用画像PICRに基づいて、視差パラメータを計算して多重設定情報部14に与えるものである。視差パラメータ計算部15は、例えば、左目用画像PICL及び右目用画像PICRの対応する点をブロックマッチング法などの方法で推定する。左目用画像PICL及び右目用画像PICRで対応する点の画素位置を比較することで、各点の視差量を推定する。そして、得られた複数の視差量から、例えば、以下のようにして多重設定情報部14に与える視差量(視差パラメータ)を決定する。第1に、最も大きい視差量を、多重設定情報部14に与える視差量(視差パラメータ)に決定する。第2に、最大頻度の視差量を、多重設定情報部14に与える視差量(視差パラメータ)に決定する。
The parallax
以上では、入力された左目用画像PICL及び右目用画像PICRから、多重設定情報部14に与える視差量(視差パラメータ)を決定する場合を説明したが、左目用画像PICL及び右目用画像PICRに加えて、他の情報(以下、補助情報と呼ぶ)をも、視差量(視差パラメータ)の決定に利用するようにしても良い。補助情報として、奥行き情報を利用できる。例えば、撮像カメラの焦点距離や、ズーム時の倍率などを、奥行情報として取込んで用いることができる。左目用画像PICL及び右目用画像PICRに加えて、奥行き情報を利用することにより、視差量の探索処理を迅速化できる。例えば、視差パラメータの第1の決定方法に係る最も視差量の大きい点というのは、奥行きが最も短い点ということであるので、左目用画像PICL及び右目用画像PICRの一方の点に対応する他方の画像の点は、奥行き情報で定まる視差量、若しくは、その近傍の値だけずれて存在する。従って、探索範囲を、奥行き情報に応じて定まる狭い範囲に限定し、視差量を計算するようにしても良い。
In the above, the case where the parallax amount (parallax parameter) to be given to the multiple
第3の実施形態によれば、フレーム毎に視差パラメータを入力画像から推定するようにしたので、時間の変化に伴い、奥行きの変化が起こる立体映像に対しても、視差パラメータを動的に設定することができる。 According to the third embodiment, since the parallax parameter is estimated from the input image for each frame, the parallax parameter is dynamically set even for a stereoscopic image in which a change in depth occurs with a change in time. can do.
ここで、設定する視差パラメータを左右視点画像内の最大視差とした場合には、最も拒離の近い領域に対して、ノイズの影響を低減し、符号化効率を向上させる効果がある。また、このような視差量の大きい領域は、手前に写る領域となるため、この領域の符号化効率の向上と、視野闘争の抑制により、主観画質の向上が期待できる。また、設定する視差パラメータを左右視点画像内の視差量で最も多いものとした場合には、左右視点画像間の全体的な相関を高めることとなり、符号化効率が向上する。 Here, when the parallax parameter to be set is the maximum parallax in the left and right viewpoint images, there is an effect of reducing the influence of noise and improving the coding efficiency for the region closest to rejection. Moreover, since such a region with a large amount of parallax is a region that appears in the foreground, an improvement in subjective image quality can be expected by improving the coding efficiency of this region and suppressing the binocular rivalry. Further, when the parallax parameter to be set is the largest in the amount of parallax in the left and right viewpoint images, the overall correlation between the left and right viewpoint images is increased, and the coding efficiency is improved.
(D)第4の実施形態
次に、本発明による立体映像符号化装置、立体映像復号装置及び立体映像符号化システム、並びに、立体映像符号化プログラム及び立体映像復号プログラムの第4の実施形態を、図面を参照しながら説明する。
(D) Fourth Embodiment Next, a fourth embodiment of a stereoscopic video encoding device, a stereoscopic video decoding device, a stereoscopic video encoding system, a stereoscopic video encoding program, and a stereoscopic video decoding program according to the present invention will be described. This will be described with reference to the drawings.
第4の実施形態の立体映像符号化システムは、立体映像通信システムに組み込まれたものである。 The stereoscopic video encoding system of the fourth embodiment is incorporated in a stereoscopic video communication system.
(D−1)第4の実施形態の構成
第1〜第3の実施形態では、画像全体に対して全て同一の多重処理を行っていた。しかし、左右視点画像内の視差量は領域によって異なる。例えば、画像の上部には、視差量が小さい領域、すなわち、背景となるような奥行きが深い領域が広く写っており、画像の下部には、視差量が大きい領域、すなわち、手前に存在する物体の領域が広く写っている、ということがある。
(D-1) Configuration of Fourth Embodiment In the first to third embodiments, the same multiple processing is performed on the entire image. However, the amount of parallax in the left and right viewpoint images varies depending on the region. For example, a region with a small amount of parallax, that is, a region with a deep depth as a background is widely shown in the upper part of the image, and a region with a large amount of parallax, that is, an object existing in the foreground at the lower part of the image. There are times when the area of is widely reflected.
第4の実施形態の立体映像符号化システムは、このような点に鑑み、横方向のライン毎(1ライン毎に限定されず、複数ライン毎であっても良い)に視差パラメータを設定して多重処理を行う。以下では、1ライン毎に視差パラメータを設定する場合を説明する。 In view of such a point, the stereoscopic video encoding system according to the fourth embodiment sets a parallax parameter for each line in the horizontal direction (not limited to one line but may be a plurality of lines). Perform multiple processing. Hereinafter, a case where the parallax parameter is set for each line will be described.
図10は、第4の実施形態の立体映像符号化システムを含む立体映像通信システムの構成を示すブロック図であり、既述した図面との同一、対応部分には同一、対応符号を付して示している。 FIG. 10 is a block diagram illustrating a configuration of a stereoscopic video communication system including the stereoscopic video encoding system according to the fourth embodiment. The same reference numerals are assigned to the same or corresponding parts as those in the above-described drawings. Show.
図10において、立体映像通信システム1Cは、立体映像送信装置10C及び立体映像受信装置20Cを有する。
In FIG. 10, the stereoscopic
立体映像送信装置10Cは、画像多重部11C、符号化部12、送信部13C、多重設定情報部14C及び視差パラメータ計算部15Cを有する。符号化部12は、第1の実施形態のものと同様である。ここで、画像多重部11C、符号化部12、多重設定情報部14C及び視差パラメータ計算部15Cが、第4の実施形態の立体映像符号化装置の構成要素である。
The stereoscopic
第4の実施形態における視差パラメータ計算部15Cは、入力された左目用画像PICL及び右目用画像PICRに基づいて(さらに、第3の実施形態で言及したように、補助情報を利用しても良い)、ライン毎の視差パラメータを計算し、ライン毎の視差パラメータを多重設定情報部14Cに与えるものである。ライン毎の視差パラメータの計算方法も、第3の実施形態で説明した画像全体の視差パラメータの計算方法とほぼ同様である。すなわち、左目用画像PICL及び右目用画像PICRの対応する点をブロックマッチング法などの方法で推定し、左目用画像PICL及び右目用画像PICRで対応する点の画素位置を比較することで、各点の視差量を推定する。そして、1ラインについて得られた複数の視差量から、例えば、最も大きい視差量を、多重設定情報部14に与えるライン毎の視差量(視差パラメータ)に決定したり、最大頻度の視差量を、多重設定情報部14に与えるライン毎の視差量(視差パラメータ)に決定したりする。
The parallax parameter calculation unit 15C in the fourth embodiment may use auxiliary information based on the input left-eye image PICL and right-eye image PICR (as described in the third embodiment). ), The parallax parameter for each line is calculated, and the parallax parameter for each line is given to the multiplex setting
第4の実施形態における多重設定情報部14Cは、視差パラメータ計算部15Cから与えられたライン毎の視差パラメータを保持する。
The multiplex setting
第4の実施形態における画像多重部11Cは、多重設定情報部14Cに保持されているライン毎の視差パラメータに基づいて、ライン毎に多重方法を切り替えながら、左目用画像PICL及び右目用画像PICRをライン毎に多重し、多重画像CPICCを符号化部12に与えるものである。画像多重部11Cは、あるラインが多重処理の対象ラインとなったときには、多重設定情報部14に保持されているそのラインの視差パラメータを参照し、視差パラメータに応じて、入力された左目用画像PICLの処理対象ラインに対して、横方向に、非交互多重領域と交互多重領域とに区分すると共に、入力された右目用画像PICRの処理対象ラインに対して、横方向に、交互多重領域と非交互多重領域とに区分し、その後、左目用画像PICLの処理対象ラインの非交互多重領域、左目用画像PICLの処理対象ラインの交互多重領域の画素と右目用画像PICRの処理対象ラインの交互多重領域の画素とを交互に配置させた領域、右目用画像PICRの処理対象ラインの非交互多重領域とを左側から配置することにより、多重画像CPICAにおける処理対象ラインを形成する。
The image multiplexing unit 11C according to the fourth embodiment displays the left-eye image PICL and the right-eye image PICR while switching the multiplexing method for each line based on the parallax parameter for each line held in the multiplexing setting
第4の実施形態に係る送信部13Cは、符号化部12から出力された符号化データと多重設定情報部14Cで保持されているライン毎の視差パラメータとを多重した後、送信データ(例えばパケット)を形成して立体映像受信装置20Cに向けて送信するものである。
The transmission unit 13C according to the fourth embodiment multiplexes the encoded data output from the
立体映像受信装置20Cは、受信部21C、復号部22、画像多重分離部23C及び多重分離設定情報部24Cを有する。復号部22は、第1の実施形態のものと同様である。ここで、復号部22、画像多重分離部23C及び多重分離設定情報部24Cが、第4の実施形態の立体映像復号装置の構成要素である。
The stereoscopic video receiving device 20C includes a receiving unit 21C, a
第4の実施形態に係る受信部21Cは、立体映像送信装置10Cが送信したデータを受信し、ライン毎の視差パラメータと符号化データとに多重分離し、ライン毎の視差パラメータを多重分離設定情報部24Cに与え、符号化データを復号部22に与えるものである。
The receiving unit 21C according to the fourth embodiment receives the data transmitted by the stereoscopic
第4の実施形態における多重分離設定情報部24Cは、受信部21Cから与えられたライン毎の視差パラメータを保持するものである。 The demultiplexing setting information unit 24C according to the fourth embodiment holds a parallax parameter for each line given from the receiving unit 21C.
第4の実施形態に係る画像多重分離部23Cは、多重分離設定情報部24Cに設定されているライン毎の視差パラメータを参照し、上述した画像多重部11Cによるライン毎の多重処理の逆処理(ライン毎の多重分離処理)を行い、左目用画像PICL及び右目用画像PICR(すなわち、左右視点画像)を再生するものである。
The
(D−2)第4の実施形態の動作
次に、第4の実施形態の立体映像符号化システムを含む立体映像通信システム1Cの動作を説明する。
(D-2) Operation of the Fourth Embodiment Next, the operation of the stereoscopic
初めに、立体映像送信装置10Cの動作を、図11のフローチャートを参照しながら説明する。図11において、第2の実施形態に係る図7との同一ステップには同一符号を付して示している。図11は、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重して送信する動作を示しており、この図11に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。
First, the operation of the stereoscopic
まず、入力された左目用画像PICL及び右目用画像PICRに基づいて(補助情報を利用する場合には補助情報にも基づく)、視差パラメータ計算部15Cが、ライン毎の視差パラメータを計算し、多重設定情報部14Cに保持されているライン毎の視差パラメータの情報が、計算によって得られたライン毎の視差パラメータに更新される(ステップS501)。
First, based on the input left-eye image PICL and right-eye image PICR (based on auxiliary information when auxiliary information is used), the parallax parameter calculation unit 15C calculates a parallax parameter for each line and performs multiplexing. The parallax parameter information for each line held in the setting
そして、画像多重部11Cは、一対の左目用画像PICL及び右目用画像PICR(左右の視点画像)を取得し(ステップS101)、ライN毎の視差パラメータに応じて、入力された左目用画像PICL及び右目用画像PICRに対して、上述したライン毎の多重処理を行い、左目用画像PICL及び右目用画像PICRの多重画像CPICCを形成する(ステップS502)。 Then, the image multiplexing unit 11C acquires a pair of left-eye images PICL and right-eye images PICR (left and right viewpoint images) (step S101), and the input left-eye image PICL according to the parallax parameter for each line N Then, the above-mentioned multiplexing processing for each line is performed on the image PICR for the right eye and the multiple image CPICCC of the image PICL for the left eye and the image PICR for the right eye is formed (step S502).
画像多重部11Cは、得られた多重画像CPICCを符号化部12に与え(ステップS103)、符号化部12は、多重画像CPICCを所定の符号化方式に従って符号化し(ステップS104)、得られた符号化データを送信部13Cに与える(ステップS105)。
The image multiplexing unit 11C gives the obtained multiple image CPICCC to the encoding unit 12 (step S103), and the
送信部13Cは、多重設定情報部14Cからライン毎の視差パラメータを取得した後(ステップS503)、例えば、符号化部12から出力された符号化データのヘッダ部分の末尾へ、ライン毎の視差パラメータの情報を追加することにより、符号化データ及びライン毎の視差パラメータの多重化を行う(ステップS504)。
After acquiring the disparity parameter for each line from the multiplex setting
送信部13Cは、与えられたライン毎の視差パラメータが追加された符号化データから、送信データを組み立て(ステップS106)、その送信データを立体映像受信装置20Cへ向けて送信する(ステップS107)。 The transmission unit 13C assembles transmission data from the encoded data to which the given parallax parameter for each line is added (step S106), and transmits the transmission data to the stereoscopic video reception device 20C (step S107).
次に、立体映像受信装置20Cの動作を、図12のフローチャートを参照しながら説明する。図12において、第2の実施形態に係る図8との同一ステップには同一符号を付して示している。図12は、受信データに基づき、同期している1フレーム分の左目用画像PICL及び右目用画像PICRを多重分離する動作を示しており、この図12に示す動作が立体視の動画像を構成しているフレーム数分だけ繰り返される。以下では、送信データがパケットであるとして説明する。 Next, the operation of the stereoscopic video reception device 20C will be described with reference to the flowchart of FIG. In FIG. 12, the same steps as those in FIG. 8 according to the second embodiment are denoted by the same reference numerals. FIG. 12 shows an operation of demultiplexing the left-eye image PICL and the right-eye image PICR for one frame in synchronization based on the received data, and the operation shown in FIG. 12 forms a stereoscopic moving image. It is repeated as many times as the number of frames. In the following description, it is assumed that the transmission data is a packet.
受信部21Cは、送信側より送られたパケットを受信し(ステップS201)、受信したパケットから、ライン毎の視差パラメータと符号化データを多重分離し(ステップS601)、多重分離設定情報部24Cに保持されているライン毎の視差パラメータの情報を、受信したライン毎の視差パラメータの値に更新すると共に(ステップS602)、得られた符号化データを復号部22に与える(ステップS203)。 The receiving unit 21C receives the packet sent from the transmitting side (step S201), demultiplexes the parallax parameter and the encoded data for each line from the received packet (step S601), and sends the demultiplexing setting information unit 24C to the demultiplexing setting information unit 24C. The stored parallax parameter information for each line is updated to the received parallax parameter value for each line (step S602), and the obtained encoded data is provided to the decoding unit 22 (step S203).
復号部22は、入力された符号化データを復号した後(ステップS204)、今回の復号情報を含めて1フレーム分の復号画像が得られたか否かを判別する(ステップS205)。1フレーム分の復号画像が得られなかった場合には、ステップS201へ戻り、1フレーム分の復号画像が得られた場合には、復号部22は、得られた復号画像を画像多重分離部23Cに与える(ステップS206)。
After decoding the input encoded data (step S204), the
画像多重分離部23Cは、多重分離設定情報部24Cに保持されているライン毎の視差パラメータを参照し、復号画像(復号された多重画像)に対して、画像多重部11Cによるライン毎の多重処理に対応したライン毎の多重分離処理を行って、左目用画像及び右目用画像を得る(ステップS603)。
The
画像多重分離部23Cは、得られた左目用画像及び右目用画像を表示機器30に与え(ステップS208)、立体視表示させる。
The
(D−3)第4の実施形態の効果
第4の実施形態によれば、ライン毎に視差パラメータを設定し、ライン毎の視差パラメータに応じてライン毎に多重処理を切り替えるようにしたので、様々な奥行きを持つ左右視点画像に対して、パケットロスによるノイズの影響による視野闘争の発生を抑えることができる。また、ライン毎に適切な視差パラメータを設定するため、ライン内での相関が高くなり、符号化効率の向上が期待できる。
(D-3) Effect of the fourth embodiment According to the fourth embodiment, the parallax parameter is set for each line, and the multiplexing process is switched for each line according to the parallax parameter for each line. It is possible to suppress the occurrence of a field-of-view struggle due to the influence of noise due to packet loss on left and right viewpoint images having various depths. Moreover, since an appropriate parallax parameter is set for each line, the correlation within the line is increased, and an improvement in coding efficiency can be expected.
(E)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
(E) Other Embodiments In the description of each of the above embodiments, various modified embodiments have been referred to, but further modified embodiments as exemplified below can be given.
上記各実施形態では、入力された左目用画像及び右目用画像をそのまま多重し、多重画像の横方向の長さが、左目用画像、右目用画像の横方向の長さの2倍になるものを示したが、入力された左目用画像及び右目用画像をそれぞれ、横方向に1/2に縮小した後、2つの縮小画像に対して、上記各実施形態で説明した多重処理を行って、左目用画像、右目用画像の横方向の長さと同じ多重画像を形成するようにしても良い。 In each of the above embodiments, the input left-eye image and right-eye image are multiplexed as they are, and the horizontal length of the multiplexed image is twice the horizontal length of the left-eye image and right-eye image. However, after the input left-eye image and right-eye image are each reduced by half in the horizontal direction, the multiple processing described in the above embodiments is performed on the two reduced images. Multiple images having the same horizontal length as the left-eye image and the right-eye image may be formed.
第4の実施形態では、1又は複数の画素ライン単位に、その単位毎の視差パラメータに応じた多重処理を行うものを示したが、マクロブロックの縦方向の幅(例えば、8画素×8画素のマクロブロックであれば、縦方向の8画素)を単位に視差パラメータを計算し、その幅を単位に多重処理を行うようにしても良い。 In the fourth embodiment, one or a plurality of pixel line units is subjected to multiple processing according to the parallax parameter for each unit. However, the vertical width of the macroblock (for example, 8 pixels × 8 pixels) In the case of a macroblock, the parallax parameter may be calculated in units of 8 pixels in the vertical direction), and multiple processing may be performed in units of the width.
上記各実施形態では、左右視点画像の多重画像の符号化データを、2つの装置間で送受信するものを示したが、左右視点画像の多重画像の符号化データを記録媒体に記録し、その記録媒体から再生した符号化データを復号する場合にも、本発明の技術思想を適用することができる。
In each of the above embodiments, the encoded data of the multiplexed image of the left and right viewpoint images is transmitted and received between the two devices . However, the encoded data of the multiplexed image of the left and right viewpoint images is recorded on the recording medium, and the recording is performed. The technical idea of the present invention can also be applied when decoding encoded data reproduced from a medium.
輝度信号の左右視点画像を多重化した後、符号化して輝度符号化データを得ると共に、色差信号の左右視点画像を多重化した後、符号化して色差符号化データを得る装置に、上記第3や第4の実施形態の技術思想を適用する場合であれば、例えば、輝度信号について得た視差パラメータやライン毎の視差パラメータを、色差信号の処理系でそのまま流用するようにしても良い。 After the left and right viewpoint images of the luminance signal are multiplexed, encoding is performed to obtain luminance encoded data, and the left and right viewpoint images of the color difference signal are multiplexed and then encoded to obtain the color difference encoded data. If the technical idea of the fourth embodiment is applied, for example, the parallax parameter obtained for the luminance signal and the parallax parameter for each line may be used as they are in the color difference signal processing system.
1、1A、1B、1C…立体映像通信システム、
10、10A、10B、10C…立体映像送信装置、
11、11A、11C…画像多重部、12…符号化部、13、13A、13C…送信部、14、14C…多重設定情報部、15、15C…視差パラメータ計算部、
20、20A、20C…立体映像受信装置、
21、21A、21C…受信部、22…復号部、23、23A、23C…画像多重分離部、24、24C…多重分離設定情報部。
1, 1A, 1B, 1C ... stereoscopic video communication system,
10, 10A, 10B, 10C ... stereoscopic video transmission device,
11, 11A, 11C ... image multiplexing unit, 12 ... encoding unit, 13, 13A, 13C ... transmission unit, 14, 14C ... multiple setting information unit, 15, 15C ... parallax parameter calculation unit,
20, 20A, 20C ... stereoscopic video receiver,
21, 21 </ b> A, 21 </ b> C... Receiving unit, 22... Decoding unit, 23, 23 </ b> A, 23 </ b> C image demultiplexing unit, 24, 24C.
Claims (12)
生成された多重画像を符号化する符号化手段とを備え、
上記画像多重手段は、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成し、
上記横方向ラインの所定範囲が、全ての横方向ラインで同じであって、上記左目用画像及び上記右目用画像の視差量に応じて定まり、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲である
ことを特徴とする立体映像符号化装置。 Image multiplexing means for generating a multiple image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels;
Encoding means for encoding the generated multiple images,
The image multiplexing means mixes the information of the predetermined range of the horizontal line of the left-eye image and the right-eye image having the same vertical direction alternately in the horizontal direction in a predetermined number of pixels, and the vertical direction is the same. Generate information on the horizontal lines of the multiple images ,
The predetermined range of the horizontal line is the same for all horizontal lines, and is determined according to the amount of parallax between the left-eye image and the right-eye image, and corresponds to the left-eye image and the right-eye image. A stereoscopic video encoding apparatus characterized by being in a range in which there exists .
生成された多重画像を符号化する符号化手段とを備え、
上記画像多重手段は、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成し、
上記横方向ラインの所定範囲が、横方向ライン毎、若しくは、数ラインでなる横方向ラインの組毎に相違し、処理対象の横方向ライン若しくは横方向ライン組の、上記左目用画像及び上記右目用画像の視差量に応じて定まり、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であり、
上記左目用画像及び上記右目用画像の相関が高い領域の探索を行い、その探索により得られた複数の視差量のうち、最大の視差量若しくは最大頻度の視差量を、上記左目用画像及び上記右目用画像の視差量とする視差パラメータ算出手段を備える
ことを特徴とする立体映像符号化装置。 Image multiplexing means for generating a multiple image by multiplexing a left-eye image and a right-eye image having the same number of vertical and horizontal pixels;
Encoding means for encoding the generated multiple images,
The image multiplexing means mixes the information of the predetermined range of the horizontal line of the left-eye image and the right-eye image having the same vertical direction alternately in the horizontal direction in a predetermined number of pixels, and the vertical direction is the same. Generate information on the horizontal lines of the multiple images,
The predetermined range of the horizontal line is different for each horizontal line or for each set of horizontal lines consisting of several lines, and the left eye image and the right eye of the horizontal line or horizontal line set to be processed Is determined according to the amount of parallax of the image for use, and is a range where there are regions corresponding to the image for the left eye and the image for the right eye,
There row the search for high correlation region of the left eye image and the right-eye image, among the plurality of parallax amounts obtained by the search, the parallax amount of the maximum parallax amount or maximum frequency, the image and for the left eye A stereoscopic video encoding apparatus, comprising: a parallax parameter calculating unit that sets a parallax amount of the right-eye image .
入力された多重画像の符号化データを復号する復号手段と、
復号により得られた多重画像に対して、入力された視差量の情報を適用して、請求項1に記載の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段とを備える
ことを特徴とする立体映像復号装置。 A stereoscopic video decoding device to which encoded data of a multiplexed image formed by the stereoscopic video encoding device according to claim 1 is input and parallax information is input from the stereoscopic video encoding device according to claim 1 . ,
Decoding means for decoding the encoded data of the input multiple images;
The left eye is demultiplexed by performing reverse processing of the image multiplexing means in the stereoscopic video encoding device according to claim 1 by applying the input parallax information to the multiplexed image obtained by decoding. A stereoscopic video decoding apparatus comprising: an image demultiplexing unit that separates and extracts the image for use and the image for the right eye.
入力された多重画像の符号化データを復号する復号手段と、Decoding means for decoding the encoded data of the input multiple images;
復号により得られた多重画像に対して、入力された視差量の情報を適用して、請求項4に記載の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段とを備えるThe left eye is demultiplexed by performing reverse processing of the image multiplexing means in the stereoscopic video encoding device according to claim 4 by applying the input parallax information to the multiplexed image obtained by decoding. And image demultiplexing means for separating and extracting the image for the right eye and the image for the right eye
ことを特徴とする立体映像復号装置。A stereoscopic video decoding apparatus characterized by that.
縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成するものであって、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成する画像多重手段と、
生成された多重画像を符号化する符号化手段として機能させる立体映像符号化プログラムであって、
上記横方向ラインの所定範囲が、全ての横方向ラインで同じであって、上記左目用画像及び上記右目用画像の視差量に応じて定まり、視差に拘わらず、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲である
ことを特徴とする立体映像符号化プログラム。 Computer
A left-eye image and a right-eye image having the same number of vertical and horizontal pixels are multiplexed to generate a multiplexed image, and information on a predetermined range of horizontal lines of the left-eye image and the right-eye image having the same vertical direction Are multiplexed alternately in the horizontal direction in units of a predetermined number of pixels, and image multiplexing means for generating information on the horizontal lines of the multiple images having the same vertical direction;
A stereoscopic video encoding program for functioning as an encoding means for encoding a generated multiple image ,
The predetermined range of the horizontal line is the same for all the horizontal lines, and is determined according to the amount of parallax of the left-eye image and the right-eye image. Regardless of the parallax, the left-eye image and the right-eye line A stereoscopic video encoding program characterized in that a region corresponding to an image is present .
縦横の画素数が同じ左目用画像及び右目用画像を多重して多重画像を生成するものであって、縦方向が同一の上記左目用画像及び上記右目用画像の横方向ラインの所定範囲の情報を、所定の画素数単位で横方向に交互に混在させて、縦方向が同じ上記多重画像の横方向ラインの情報を生成する画像多重手段と、A left-eye image and a right-eye image having the same number of vertical and horizontal pixels are multiplexed to generate a multiplexed image, and information on a predetermined range of horizontal lines of the left-eye image and the right-eye image having the same vertical direction Are multiplexed alternately in the horizontal direction in units of a predetermined number of pixels, and image multiplexing means for generating information on the horizontal lines of the multiple images having the same vertical direction;
生成された多重画像を符号化する符号化手段と、Encoding means for encoding the generated multiple images;
上記左目用画像及び上記右目用画像の相関が高い領域の探索を行い、その探索により得られた複数の視差量のうち、最大の視差量若しくは最大頻度の視差量を、上記左目用画像及び上記右目用画像の視差量とする視差パラメータ算出手段として機能させる立体映像符号化プログラムであって、The left eye image and the right eye image are searched for a region having a high correlation, and among the plurality of parallax amounts obtained by the search, the maximum parallax amount or the highest frequency parallax amount is determined as the left eye image and the above-described parallax amount. A stereoscopic video encoding program that functions as a parallax parameter calculation unit that sets a parallax amount of a right-eye image,
上記横方向ラインの所定範囲が、横方向ライン毎、若しくは、数ラインでなる横方向ラインの組毎に相違し、処理対象の横方向ライン若しくは横方向ライン組の、上記左目用画像及び上記右目用画像の視差量に応じて定まり、視差に拘わらず、上記左目用画像及び上記右目用画像に対応する領域が存在する範囲であるThe predetermined range of the horizontal line is different for each horizontal line or for each set of horizontal lines consisting of several lines, and the left eye image and the right eye of the horizontal line or horizontal line set to be processed It is determined in accordance with the amount of parallax of the image for use, and is a range in which areas corresponding to the image for the left eye and the image for the right eye exist regardless of the parallax.
ことを特徴とする立体映像符号化プログラム。A stereoscopic video encoding program characterized by the above.
入力された多重画像の符号化データを復号する復号手段と、
復号により得られた多重画像に対して、入力された視差量の情報を適用して、請求項1に記載の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段と
して機能させることを特徴とする立体映像復号プログラム。 The encoded data of the multiplexed image formed by the stereoscopic video encoding device according to claim 1 is input and mounted on a device to which information on the amount of parallax is input from the stereoscopic video encoding device according to claim 1. Computer
Decoding means for decoding the encoded data of the input multiple images;
The left eye is demultiplexed by performing reverse processing of the image multiplexing means in the stereoscopic video encoding device according to claim 1 by applying the input parallax information to the multiplexed image obtained by decoding. A stereoscopic video decoding program that functions as an image demultiplexing unit that separates and extracts a for-image and a right-eye image.
入力された多重画像の符号化データを復号する復号手段と、
復号により得られた多重画像に対して、入力された視差量の情報を適用して、請求項4に記載の立体映像符号化装置における画像多重手段の逆処理の多重分離を行うことにより、左目用画像及び右目用画像を分離抽出する画像多重分離手段と
して機能させることを特徴とする立体映像復号プログラム。 The encoded data of the multiplexed image formed by the stereoscopic video encoding device according to claim 4 is input and mounted on a device to which information on the amount of parallax is input from the stereoscopic video encoding device according to claim 4. Computer
Decoding means for decoding the encoded data of the input multiple images;
The left eye is demultiplexed by performing reverse processing of the image multiplexing means in the stereoscopic video encoding device according to claim 4 by applying the input parallax information to the multiplexed image obtained by decoding. And image demultiplexing means for separating and extracting the image for the right eye and the image for the right eye
3D video decoding program characterized by being made to function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128401A JP5742886B2 (en) | 2013-06-19 | 2013-06-19 | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013128401A JP5742886B2 (en) | 2013-06-19 | 2013-06-19 | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015005807A JP2015005807A (en) | 2015-01-08 |
JP5742886B2 true JP5742886B2 (en) | 2015-07-01 |
Family
ID=52301387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013128401A Expired - Fee Related JP5742886B2 (en) | 2013-06-19 | 2013-06-19 | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5742886B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7014122B2 (en) * | 2018-10-03 | 2022-02-01 | 株式会社豊田自動織機 | Object detection device and object detection method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4222817B2 (en) * | 2002-09-27 | 2009-02-12 | シャープ株式会社 | Stereoscopic image display apparatus, recording method, and transmission method |
JP2007318184A (en) * | 2004-08-18 | 2007-12-06 | Sharp Corp | Three-dimensional image creating device, and creation method of the three-dimensional image |
KR100813961B1 (en) * | 2005-06-14 | 2008-03-14 | 삼성전자주식회사 | Method and apparatus for transmitting and receiving of video, and transport stream structure thereof |
JP4751116B2 (en) * | 2005-07-20 | 2011-08-17 | 株式会社リコー | Image processing apparatus and image processing method |
JP5479264B2 (en) * | 2009-10-30 | 2014-04-23 | 三菱電機株式会社 | Video display control method and apparatus |
JP5424926B2 (en) * | 2010-02-15 | 2014-02-26 | パナソニック株式会社 | Video processing apparatus and video processing method |
-
2013
- 2013-06-19 JP JP2013128401A patent/JP5742886B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015005807A (en) | 2015-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101185870B1 (en) | Apparatus and method for processing 3 dimensional picture | |
EP2163103B1 (en) | Method and system for encoding a 3d video signal, enclosed 3d video signal, method and system for decoder for a 3d video signal | |
US20150341614A1 (en) | Stereoscopic video encoding device, stereoscopic video decoding device, stereoscopic video encoding method, stereoscopic video decoding method, stereoscopic video encoding program, and stereoscopic video decoding program | |
JP4181446B2 (en) | Stereoscopic image display device | |
KR100375708B1 (en) | 3D Stereosc opic Multiview Video System and Manufacturing Method | |
JP5299111B2 (en) | Image processing apparatus, image processing method, and program | |
JP2009044722A (en) | Pseudo-3d-image generating device, image-encoding device, image-encoding method, image transmission method, image-decoding device and image image-decoding method | |
JP2004208255A (en) | Stereoscopic image display device, recording method, and transmission method | |
US11240479B2 (en) | Viewer-adjusted stereoscopic image display | |
JP2008034892A (en) | Multi-viewpoint image encoder | |
JP2009004940A (en) | Multi-viewpoint image encoding method, multi-viewpoint image encoding device, and multi-viewpoint image encoding program | |
KR100704938B1 (en) | Method and apparatus for encoding/decoding stereoscopic images | |
JP4657258B2 (en) | Stereoscopic image display apparatus and method | |
JP2009004939A (en) | Multi-viewpoint image decoding method, multi-viewpoint image decoding device, and multi-viewpoint image decoding program | |
JP2015019326A (en) | Encoding device, encoding method, decoding device, and decoding method | |
JP5742886B2 (en) | Stereoscopic video encoding apparatus, stereoscopic video decoding apparatus, stereoscopic video encoding system, stereoscopic video encoding program, and stereoscopic video decoding program | |
KR20170075349A (en) | Transmitter and receiver for multi-image having multi-view and method for multiplexing multi-image | |
Rusanovskyy et al. | Depth-based coding of MVD data for 3D video extension of H. 264/AVC | |
JP4173684B2 (en) | Stereoscopic image creation device | |
WO2008023917A1 (en) | Method and apparatus for encoding/decoding stereoscopic images/videos | |
CN102447863A (en) | Multi-view stereo video subtitle processing method | |
JP2009004942A (en) | Multi-viewpoint image transmitting method, multi-viewpoint image transmitting device, and multi-viewpoint image transmitting program | |
Banitalebi-Dehkordi et al. | 3D video quality metric for 3D video compression | |
JP4815004B2 (en) | Multi-view image encoding device | |
Kim et al. | Object-based stereoscopic conversion of MPEG-4 encoded data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5742886 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |