WO2013105401A1

WO2013105401A1 - 送信装置、送信方法、受信装置および受信方法

Info

Publication number: WO2013105401A1
Application number: PCT/JP2012/082710
Authority: WO
Inventors: 塚越　郁夫
Original assignee: ソニー株式会社
Priority date: 2012-01-13
Filing date: 2012-12-17
Publication date: 2013-07-18
Also published as: EP2672713A1; CN103416069A; JPWO2013105401A1; EP2672713A4; US20140078248A1

Abstract

　受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を良好に行う。　画像データのピクチャ毎に取得された視差情報をビデオストリームに挿入して送信する。受信側における立体画像に重畳表示されるグラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。コンテナのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報を挿入する。この識別情報により、受信側では、ビデオストリームに視差情報の挿入があるか否かを容易に識別でき、グラフィクスの奥行き制御を的確に行うことが可能となる。

Description

送信装置、送信方法、受信装置および受信方法

　本技術は、送信装置、送信方法、受信装置および受信方法に関し、特に、立体画像へのグラフィクスの重畳表示を良好に行い得るようにするための送信装置等に関する。

　例えば、特許文献１には、立体画像データのテレビ放送電波を用いた伝送方式について提案されている。この場合、立体画像を構成する左眼画像データおよび右眼画像データが送信され、テレビ受信機において、両眼視差を利用した立体画像表示が行われる。

　図３５は、両眼視差を利用した立体画像表示において、スクリーン上におけるオブジェクト（物体）の左右像の表示位置と、その立体像の再生位置との関係を示している。例えば、スクリーン上に図示のように左像Ｌａが右側に右像Ｒａが左側にずれて表示されているオブジェクトＡに関しては、左右の視線がスクリーン面より手前で交差するため、その立体像の再生位置はスクリーン面より手前となる。

　また、例えば、スクリーン上に図示のように左像Ｌｂおよび右像Ｒｂが同一位置に表示されているオブジェクトＢに関しては、左右の視線がスクリーン面で交差するため、その立体像の再生位置はスクリーン面上となる。さらに、例えば、スクリーン上に図示のように左像Ｌｃが左側に右像Ｒｃが右側にずれて表示されているオブジェクトＣに関しては、左右の視線がスクリーン面より奥で交差するため、その立体像の再生位置はスクリーン面より奥となる。

特開２００５－６１１４号公報

　上述したように、立体画像表示において、視聴者は、両眼視差を利用して、立体画像の遠近感を認知する。テレビ受信機などにおいて画像に重畳表示されるグラフィクスに関しても、２次元空間的のみならず、３次元の奥行き感としても、立体画像表示と連動してレンダリングされることが期待される。ＯＳＤ（On-Screen Display）あるいはアプリケーションなどのグラフィクスを画像に重畳表示する場合、画像内の各物体の遠近感に応じて視差調整を施し、遠近感の整合性を維持することが期待される。

　本技術の目的は、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を良好に行い得るようにすることにある。

　本技術の概念は、
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部と、
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報を挿入する識別情報挿入部とを備える
　送信装置にある。

　本技術において、画像データ取得部により、立体画像を構成する左眼画像データおよび右眼画像データが取得される。この場合の画像データは、例えば、カメラで撮像されて得られたもの、あるいは記憶媒体から読み出されて得られたものなどである。

　視差情報取得部により、画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報が取得される。この場合の視差情報は、例えば、左眼画像データおよび右眼画像データに基づいて生成されたもの、あるいは記憶媒体から読み出されて得られたものなどである。

　視差情報挿入部により、取得された画像データが符号化されて得られたビデオストリームに、取得された視差情報が挿入される。例えば、視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ（Group of Picture）単位で挿入される。さらには、その他の単位、例えばシーン単位で挿入されてもよい。

　画像データ送信部により、視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナが送信される。例えば、コンテナは、デジタル放送規格で採用されているトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）であってもよい。また、例えば、コンテナは、インターネットの配信などで用いられるＭＰ４、あるいはそれ以外のフォーマットのコンテナであってもよい。

　識別情報挿入部により、コンテナのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。例えば、コンテナはトランスポートストリームであり、識別情報挿入部は、識別情報をプログラム・マップ・テーブル、あるいはイベント・インフォメーション・テーブルの配下に挿入する、ようにされてもよい。例えば、識別情報挿入部は、プログラム・マップ・テーブル、あるいはイベント・インフォメーション・テーブルの配下に挿入されるデスクリプタに、識別情報を記述する、ようにされる。

　このように本技術においては、画像データのピクチャ毎に取得された視差情報がビデオストリームに挿入されて送信されるものであり、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。また、本技術においては、コンテナのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入されるものであり、この識別情報により、受信側では、ビデオストリームに視差情報の挿入があるか否かを容易に識別でき、グラフィクスの奥行き制御を的確に行うことが可能となる。

　なお、本技術において、例えば、視差情報取得部は、ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の視差情報を取得する、ようにされてもよい。この場合、例えば、視差情報取得部は、ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、ピクチャ毎に、各分割領域の視差情報を取得する、ようにされる。

　また、この場合、例えば、視差情報挿入部がビデオストリームに挿入するピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する、ものとされる。この場合、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を、グラフィクスの表示位置に応じて良好に行うことができる。

　また、本技術において、例えば、画像データ送信部は、表示位置に対応した視差情報を持つ字幕データが符号化されて得られた字幕ストリームをコンテナに含めて送信する、ようにされてもよい。この場合、受信側において、字幕に関しては、字幕データが持つ視差情報に基づいて奥行き制御が行われる。例えば、ビデオストリームへの上述した視差情報の挿入がない場合、字幕データが存在する場合には、この字幕データが持つ視差情報を、グラフィクスの奥行き制御に利用することも可能である。

　また、本技術の他の概念は、
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備え、
　上記視差情報取得部は、上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の上記視差情報を取得し、
　上記視差情報挿入部が上記ビデオストリームに挿入するピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する
　送信装置にある。

　この視差情報取得部では、ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の視差情報が取得される。この場合、例えば、視差情報取得部は、ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、ピクチャ毎に、各分割領域の視差情報を取得する、ようにされる。

　視差情報挿入部により、取得された画像データが符号化されて得られたビデオストリームに、取得された視差情報が挿入される。このように、視差情報挿入部がビデオストリームに挿入するピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなるものとされる。

　このように本技術においては、画像データのピクチャ毎に取得された視差情報がビデオストリームに挿入されて送信されるものであり、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。また、本技術において、ビデオストリームに挿入するピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有するものであり、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を、グラフィクスの表示位置に応じて良好に行うことができる。

　なお、本技術において、例えば、画像データ送信部は、表示位置に対応した視差情報を持つ字幕データが符号化されて得られた字幕ストリームをコンテナに含めて送信する、ようにされてもよい。この場合、受信側において、字幕に関しては、字幕データが持つ視差情報に基づいて奥行き制御が行われる。例えば、ビデオストリームへの上述した視差情報の挿入がない場合、字幕データが存在する場合には、この字幕データが持つ視差情報を、グラフィクスの奥行き制御に利用することも可能である。

　また、本技術のさらに他の概念は、
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから、上記左眼画像データおよび右眼画像データを取得すると共に、該画像データの各ピクチャの分割領域毎の視差情報を取得する情報取得部と、
　画像上にグラフィクスを表示するためのグラフィクスデータを発生するグラフィクスデータ発生部と、
　上記取得された上記画像データおよび上記視差情報と、上記発生されたグラフィクスデータを用い、左眼画像および右眼画像に重畳する上記グラフィクスに、ピクチャ毎に、該グラフィクスの表示位置に対応した視差を付与し、上記グラフィクスが重畳された左眼画像のデータおよび上記グラフィクスが重畳された右眼画像のデータを得る画像データ処理部とをさらに備える
　受信装置にある。

　本技術において、画像データ受信部により、ビデオストリームを含む所定フォーマットのコンテナが受信される。このビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものである。また、このビデオストリームには、画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されている。

　情報取得部により、コンテナに含まれるビデオストリームから、左眼画像データおよび右眼画像データが取得されると共に、この画像データの各ピクチャの分割領域毎の視差情報が取得される。また、グラフィクスデータ発生部により、画像上にグラフィクスを表示するためのグラフィクスデータが発生される。このグラフィクスは、例えば、ＯＳＤあるいはアプリケーションなどのグラフィクス、あるいは、サービス内容を示すＥＰＧ情報である。

　画像データ処理部により、取得された画像データおよび視差情報と、発生されたグラフィクスデータとが用いられて、グラフィクスが重畳された左眼画像および右眼画像のデータが得られる。この場合、左眼画像および右眼画像に重畳されるグラフィクスに、ピクチャ毎に、このグラフィクスの表示位置に対応した視差が付与されることで、グラフィクスが重畳された左眼画像のデータおよびグラフィクスが重畳された右眼画像のデータが得られる。例えば、画像データ処理部では、グラフィクスの表示位置に対応した所定数の分割領域の視差情報から選択された視差情報、例えば最小値などの最適な視差情報が使用されて、このグラフィクスへの視差付与が行われる。

　このように本技術においては、送信側から送られてくるビデオストリームに挿入されている視差情報に基づいて、立体画像に重畳表示されるグラフィクスの奥行き制御が行われる。この場合、ビデオストリームには画像データのピクチャ毎に取得された視差情報が挿入されており、グラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。また、この場合、ビデオストリームに挿入されているピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなるものであり、グラフィクスの奥行き制御を、グラフィクスの表示位置に応じて良好に行うことができる。

　なお、本技術において、例えば、コンテナのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入されており、コンテナから識別情報を取得する識別情報取得部をさらに備え、情報取得部は、取得された識別情報が視差情報の挿入があることを示すとき、コンテナに含まれるビデオストリームから視差情報を取得する、ようにされてもよい。例えば、取得された識別情報が視差情報の挿入がないことを示すとき、画像データ処理部は、予め算出された視差情報を用いる、ようにされる。この場合、ビデオストリームに視差情報の挿入があるか否かを容易に識別でき、グラフィクスの奥行き制御を的確に行うことが可能となる。

　また、本技術において、例えば、画像データ処理部は、グラフィクスの表示と共に字幕の表示が行われるとき、グラフィクスが字幕よりも手前に表示されるようにグラフィクスに視差を付与する、ようにされてもよい。この場合、グラフィクス表示が字幕表示に遮られることなく良好に行われる。

　また、本技術において、例えば、情報取得部で取得された画像データの各ピクチャの分割領域毎の視差情報を、グラフィクスの画像への重畳に応じて更新する視差情報更新部と、この更新された視差情報を画像データ処理部で得られた画像データが送信される外部機器に送信する視差情報送信部とをさらに備える、ようにされてもよい。

　本技術によれば、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を良好に行うことができる。

実施の形態としての画像送受信システムの構成例を示すブロック図である。ブロック（Block）毎の視差情報（視差ベクトル）の一例を示す図である。ブロック単位の視差情報の生成方法の一例を説明するための図である。ブロック毎の視差情報から所定の分割領域の視差情報を得るためのダウンサイジング処理の一例を説明するための図である。符号化ブロック境界を跨がないようにピクチャ表示画面が分割されることを説明するための図である。ピクチャ毎の各分割領域の視差情報の推移例を模式的に示す図である。画像データのピクチャ毎に取得された視差情報のビデオストリームへの挿入タイミングを説明するための図である。放送局においてトランスポートストリームを生成する送信データ生成部の構成例を示すブロック図である。トランスポートストリームの構成例を示す図である。ＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。ＭＶＣ・エクステンション・デスクリプタ（MVC extension descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。グラフィクス・デプス・インフォ・デスクリプタ（graphics_depth_info_descriptor）の構造例（Syntax）および主要な規定内容（semantics）を示す図である。符号化方式がＡＶＣである場合におけるＧＯＰの先頭のアクセスユニットおよびＧＯＰの先頭以外のアクセスユニットの一例を示している。「depth_information_for_graphics SEI message」の構造例(Syntax)および「depth_information_for_graphics_data()」の構造例(Syntax)を示す図である。ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_for_graphics()」の構造例(Syntax)を示す図である。「depth_information_for_graphics()」の構造例(Syntax)における主要な情報の内容（Semantics）を示す図である。ピクチャ表示画面の分割例を示す図である。ピクチャ毎の視差情報を複数のピクチャをまとめて符号化する場合における、「depth_information_for_graphics()」の構造例(Syntax)を示す図である。「depth_information_for_graphics()」の構造例(Syntax)における主要な情報の内容（Semantics）を示す図である。「user_data()」の構造例(Syntax)および「depth_information_for_graphics_data()」の構造例(Syntax)を示す図である。視差情報によるグラフィクスの奥行き制御の概念を示す図である。ビデオストリームにピクチャ単位で視差情報が挿入されている場合に画像データのピクチャタイミングで順次視差情報が取得されることを示す図である。ビデオストリームにＧＯＰ単位で視差情報が挿入されている場合に画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報がまとめて取得されることを示す図である。画像上における字幕（サブタイトル）およびＯＳＤグラフィクスの表示例を示す図である。テレビ受信機のデコード部の構成例を示すブロック図である。奥行き制御部の制御を説明するためのブロック図である。奥行き制御部の制御処理の手順の一例を示すフローチャート（１／２）である。奥行き制御部の制御処理の手順の一例を示すフローチャート（２／２）である。テレビ受信機におけるグラフィクスの奥行き制御例を示す図である。テレビ受信機におけるグラフィクスの他の奥行き制御例を示す図である。画像送受信システムの他の構成例を示すブロック図である。セットトップボックスの構成例を示すブロック図である。テレビ受信機のＨＤＭＩによる系の構成例を示すブロック図である。テレビ受信機におけるグラフィクスの奥行き制御例を示す図である。両眼視差を利用した立体画像表示において、スクリーン上におけるオブジェクトの左右像の表示位置と、その立体像の再生位置との関係を示す図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明は以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［画像送受信システム］
　図１は、実施の形態としての画像送受信システム１０の構成例を示している。この画像送受信システム１０は、放送局１００およびテレビ受信機２００により構成されている。

　「放送局の説明」
　放送局１００は、コンテナとしてのトランスポートストリームＴＳを放送波に載せて送信する。このトランスポートストリームＴＳには、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたビデオストリームが含まれる。例えば、左眼画像データおよび右眼画像データは、１つのビデオストリームにより伝送される。この場合、例えば、左眼画像データおよび右眼画像データは、インターリーブ処理され、サイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データとして構成され、１つのビデオストリームに含まれる。

　また、例えば、左眼画像データおよび右眼画像データは、それぞれ、別個のビデオストリームにより伝送される。この場合、例えば、左眼画像データＭＶＣのベースビュー(base view)のストリームに含まれ、右眼画像データはＭＶＣのノンベースビュー（Nonbase view）のストリームに含まれる。

　ビデオストリームには、画像データのピクチャ毎に取得された、左眼画像および右眼画像の一方に対する他方の視差情報（Disparity data）が挿入される。ピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域（Partition）の視差情報とからなっている。オブジェクトの再生位置がスクリーンより手前にある場合、この視差情報はマイナス値で得られる（図３５のＤＰａ参照）。一方、オブジェクトの再生位置がスクリーンより奥にある場合、この視差情報はプラス値で得られる（図３５のＤＰｃ参照）。

　各分割領域の視差情報は、ブロック（Block）毎の視差情報に対して、ダウンサイジング処理を施すことで、取得される。図２は、ブロック（Block）毎の視差情報（視差ベクトル）の一例を示している。

　図３は、ブロック単位の視差情報の生成方法の一例を示している。この例は、左眼ビュー（Left-View）から右眼ビュー（Right-View）を指し示す視差情報を求める例である。この場合、左眼ビューのピクチャに、例えば４＊４、８＊８あるいは１６＊１６などの画素ブロック（視差検出ブロック）が設定される。

　図示のように、左眼ビューのピクチャが検出画像とされ、右眼ビューのピクチャが参照画像とされて、左眼ビューのピクチャのブロック毎に、画素間の差分絶対値和が最小となるように、右眼ビューのピクチャのブロック探索がされて、視差データが求められる。

　すなわち、Ｎ番目のブロックの視差情報ＤＰｎは、例えば、以下の（１）式に示すように、このＮ番目のブロックにおける差分絶対値和が最小となるようにブロック探索されて求められる。なお、この（１）式において、Ｄｊは右眼ビューのピクチャにおける画素値、Ｄｉは左眼ビューのピクチャにおける画素値を示している。
　ＤＰｎ＝ min ( Σ abs( differ (Dj - Di)))　　・・・（１）

　図４は、ダウンサイジング処理の一例を示している。図４（ａ）は、上述したように求められたブロック毎の視差情報を示している。このブロック毎の視差情報に基づいて、図４（ｂ）に示すように、グループ（Group Of Block）毎の視差情報が求められる。グループは、ブロックの上位層に当たり、複数個の近接するブロックをまとめてグループ化することで得られる。図４（ｂ）の例では、各グループは、破線枠で括られる４個のブロックにより構成されている。そして、各グループの視差ベクトルは、例えば、そのグループ内の全ブロックの視差情報から最小の値の視差情報が選択されることで得られる。

　次に、このグループ毎の視差ベクトルに基づいて、図４（ｃ）に示すように、パーティション(Partition)毎の視差情報が求められる。パーティションは、グループの上位層に当たり、複数個の近接するグループをまとめてグループ化することで得られる。図４（ｃ）の例では、各パーティションは、破線枠で括られる２個のグループにより構成されている。そして、各パーティションの視差情報は、例えば、そのパーティション内の全グループの視差情報から、最小の値の視差情報が選択されることで得られる。

　次に、このパーティション毎の視差情報に基づいて、図４（ｄ）に示すように、最上位層に位置するピクチャ全体（画像全体）の視差情報が求められる。図４（ｄ）の例では、ピクチャ全体には、破線枠で括られる４個のパーティションが含まれている。そして、ピクチャ全体の視差情報は、例えば、ピクチャ全体に含まれる全パーティションの視差情報から、最小の値の視差情報が選択されることで得られる。

　ピクチャ表示画面は、分割情報に基づいて分割され、上述したように各分割領域の視差情報が取得される。この場合、符号化ブロック境界を跨がないようにピクチャ表示画面が分割される。図５は、ピクチャ表示画面の分割詳細例を示している。この例は、１９２０＊１０８０のピクセルフォーマットの例であって、水平、垂直にそれぞれ２分割され、Partition A，Partition B，Partition C，Partition Dの４つの分割領域が得られる例である。送信側では、１６×１６のブロック毎に符号化が行われるために、ブランクデータからなる８ラインが付加されて、１９２０画素＊１０８８ラインの画像データとして符号化が行われる。そこで、垂直方向に関しては、１０８８ラインを元に２分割されている。

　上述したように、ビデオストリームには、画像データのピクチャ（フレーム）毎に取得された、各分割領域（Partition）の視差情報が挿入される。図６は、各分割領域の視差情報の推移例を模式的に示している。この例は、水平、垂直にそれぞれ４分割され、Partition 0 ～ Partition 15 までの１６個の分割領域が存在する例である。この例では、図面の簡単化のため、Partition 0，Partition 3，Partition 9，Partition 15の視差情報Ｄ0，Ｄ3，Ｄ9，Ｄ15の推移のみを示している。各視差情報の値は、時間と共に値が変化する場合（Ｄ0，Ｄ3，Ｄ9）と固定である場合（Ｄ15）とがある。

　画像データのピクチャ毎に取得された視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ単位などの単位で挿入される。図７（ａ）は、ピクチャの符号化に同期させる例、つまりビデオストリームに視差情報をピクチャ単位で挿入する例を示している。この例においては、画像データを送信する際の遅延が少なくて済み、カメラで撮像した画像データを送信するライブ放送に適するものとなる。

　図７（ｂ）は、符号化ビデオのＩピクチャ(Intra picture)、またはＧＯＰ（Group Of Pictures）に同期させる例、つまりビデオストリームに視差情報をＧＯＰ単位で挿入する例を示している。この例においては、図７（ａ）の例に比べて、画像データを送信する際の遅延が大きくなるが、複数のピクチャ（フレーム）の視差情報がまとめて送信されるので、受信側における視差情報の取得処理の回数を低減できる。図７（ｃ）は、ビデオのシーンに同期させる例、つまりビデオストリームに視差情報をシーン単位で挿入する例を示している。なお、図７（ａ）～（ｃ）は一例であって、その他の単位で挿入することも考えられる。

　また、トランスポートストリームＴＳのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。この識別情報は、例えば、トランスポートストリームＴＳに含まれるプログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下、あるいはイベント・インフォメーション・テーブル（ＥＩＴ：Event Information Table）の配下に挿入される。この識別情報により、受信側では、ビデオストリームに視差情報の挿入があるか否かを容易に識別可能となる。この識別情報の詳細については後述する。

　「送信データ生成部の構成例」
　図８は、放送局１００において、上述したトランスポートストリームＴＳを生成する送信データ生成部１１０の構成例を示している。この送信データ生成部１１０は、画像データ出力部１１１Ｌ，１１１Ｒと、スケーラ１１２Ｌ，１１２Ｒと、ビデオエンコーダ１１３と、マルチプレクサ１１４と、視差データ生成部１１５を有している。また、この送信データ生成部１１０は、サブタイトルデータ出力部１１６と、サブタイトルエンコーダ１１７と、音声データ出力部１１８と、オーディオエンコーダ１１９を有している。

　画像データ出力部１１１Ｌ，１１１Ｒは、それぞれ、立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲを出力する。画像データ出力部１１１Ｌ，１１１Ｒは、例えば、被写体を撮像して画像データを出力するカメラ、あるいは記憶媒体から画像データを読み出して出力する画像データ読み出し部などにより構成される。画像データＶＬ，ＶＲは、例えば、１９２０＊１０８０のフルＨＤのサイズの画像データである。

　スケーラ１１２Ｌ，１１２Ｒは、それぞれ、画像データＶＬ，ＶＲに対して、必要に応じて、水平方向や垂直方向のスケーリング処理を行う。例えば、画像データＶＬ，ＶＲを１つのビデオストリームで伝送するために、サイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データを構成する場合には、水平方向あるいは垂直方向に１／２にスケールダウンして出力する。また、例えば、画像データＶＬ，ＶＲを、ＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで伝送する場合には、スケーリング処理を行うことなく、画像データＶＬ，ＶＲをそのまま出力する。

　ビデオエンコーダ１１３は、スケーラ１１２Ｌ，１１２Ｒから出力される左眼画像データ、右眼画像データに対して、例えば、ＭＰＥＧ４－ＡＶＣ（ＭＶＣ）、ＭＰＥＧ２ｖｉｄｅｏ、あるいはＨＥＶＣなどの符号化を施して、符号化ビデオデータを得る。また、このビデオエンコーダ１１３は、後段に備えるストリームフォーマッタ（図示せず）により、この符号化データを含むビデオストリームを生成する。この場合、ビデオエンコーダ１１３は、左眼画像データ、右眼画像データの符号化ビデオデータを含む１つあるいは２つのビデオストリーム（ビデオエレメンタリストリーム）を生成する。

　視差データ生成部１１５は、画像データ出力部１１１Ｌ，１１１Ｒから出力される左眼画像データＶＬ、右眼画像データＶＲに基づいて、ピクチャ（フレーム）毎に、視差情報を生成する。視差データ生成部１１５は、ピクチャ毎に、上述したようにブロック（Block）毎の視差情報を取得する。なお、視差データ生成部１１５は、画像データ出力部１１１Ｌ，１１１Ｒが記憶媒体を有する画像データ読み出し部である場合、ブロック（Block）毎の視差情報を、画像データと共に記憶媒体から読み出して取得する構成も考えられる。また、視差データ生成部１１５は、例えばユーザ操作により与えられるピクチャ表示画面の分割情報に基づき、ブロック（Block）毎の視差情報に対してダウンサイジング処理を行って、各分割領域（Partition）の視差情報を生成する。

　ビデオエンコーダ１１３は、視差データ生成部１１５で生成されたピクチャ毎の視差情報を、ビデオストリームに挿入する。ここで、ピクチャ毎の視差情報は、ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなっている。この場合、例えば、ピクチャ毎の視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ単位で挿入される（図７参照）。なお、左眼画像データおよび右眼画像データがそれぞれ別個のビデオデータで伝送されるには、いずれかのビデオストリームにのみ挿入されてもよい。

　サブタイトルデータ出力部１１６は、画像に重畳するサブタイトル（字幕）のデータを出力する。このサブタイトルデータ出力部１１６は、例えば、パーソナルコンピュータなどにより構成される。サブタイトルエンコーダ１１７は、サブタイトルデータ出力部１１６から出力されたサブタイトルデータを含むサブタイトルストリーム（サブタイトルエレメンタリストリーム）を生成する。なお、サブタイトルエンコーダ１１７は、視差データ生成部１１５で生成されるブロック毎の視差情報を参照し、サブタイトルデータに、サブタイトルの表示位置に対応した視差情報を付加する。すなわち、サブタイトルストリームに含まれるサブタイトルデータは、サブタイトルの表示位置に対応した視差情報を持つものとなる。

　音声データ出力部１１８は、画像データに対応した音声データを出力する。この音声データ出力部１１８は、例えば、マイクロホン、あるいは記憶媒体から音声データを読み出して出力する音声データ読み出し部などにより構成される。オーディオエンコーダ１１９は、音声データ出力部１１８から出力される音声データに対して、ＭＰＥＧ－２Ａｕｄｉｏ、ＡＡＣ等の符号化を施し、オーディオストリーム（オーディオエレメンタリストリーム）を生成する。

　マルチプレクサ１１４は、ビデオエンコーダ１１３、サブタイトルエンコーダ１１７およびオーディオエンコーダ１１９で生成された各エレメンタリストリームをＰＥＳパケット化して多重し、トランスポートストリームＴＳを生成する。この場合、それぞれのＰＥＳ(Packetized Elementary Stream)パケットのヘッダには、受信側における同期再生のために、ＰＴＳ（Presentation Time Stamp）が挿入される。

　マルチプレクサ１１４は、トランスポートストリームＴＳのレイヤに、上述した識別情報を挿入する。この識別情報は、ビデオストリームに視差情報の挿入があるか否かを識別するための情報である。この識別情報は、例えば、トランスポートストリームＴＳに含まれるプログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下、あるいはイベント・インフォメーション・テーブル（ＥＩＴ：Event Information Table）の配下などに挿入される。

　図８に示す送信データ生成部１１０の動作を簡単に説明する。画像データ出力部１１１Ｌ，１１１Ｒから出力される立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲは、それぞれ、スケーラ１１２Ｌ，１１２Ｒに供給される。スケーラ１１２Ｌ，１１２Ｒでは、それぞれ、画像データＶＬ，ＶＲに対して、必要に応じて、水平方向や垂直方向のスケーリング処理が行われる。スケーラ１１２Ｌ，１１２Ｒから出力される左眼画像データ、右眼画像データは、ビデオエンコーダ１１３に供給される。

　ビデオエンコーダ１１３では、左眼画像データ、右眼画像データに対して、例えば、ＭＰＥＧ４－ＡＶＣ（ＭＶＣ）、ＭＰＥＧ２ｖｉｄｅｏ、あるいはＨＥＶＣなどの符号化が施されて、符号化ビデオデータが得られる。また、このビデオエンコーダ１１３では、後段に備えるストリームフォーマッタにより、この符号化データを含むビデオストリームが生成される。この場合、左眼画像データ、右眼画像データの符号化ビデオデータを含む１つあるいは２つのビデオストリームが生成される。

　また、画像データ出力部１１１Ｌ，１１１Ｒから出力される立体画像を構成する左眼画像データＶＬ、右眼画像データＶＲは、視差データ生成部１１５に供給される。この視差データ生成部１１５では、左眼画像データＶＬ、右眼画像データＶＲに基づいて、ピクチャ（フレーム）毎に、視差情報が生成される。視差データ生成部１１５では、ピクチャ毎に、ブロック（Block）毎の視差情報が取得される。そして、この視差データ生成部１１５では、さらに、例えばユーザ操作により与えられるピクチャ表示画面の分割情報に基づき、ブロック（Block）毎の視差情報に対してダウンサイジング処理が行われて、各分割領域（Partition）の視差情報が生成される。

　視差データ生成部１１５で生成されるピクチャ毎の視差情報（ピクチャ表示画面の分割情報を含む）は、ビデオエンコーダ１１３に供給される。ビデオエンコーダ１１３では、ビデオストリームに、ピクチャ毎の視差情報が挿入される。この場合、ピクチャ毎の視差情報は、ビデオストリームに、ピクチャ単位、あるいはＧＯＰ単位で挿入される。

　また、サブタイトルデータ出力部１１６では、画像に重畳するサブタイトル（字幕）のデータが出力される。このサブタイトルデータは、サブタイトルエンコーダ１１７に供給される。サブタイトルエンコーダ１１７では、サブタイトルデータを含むサブタイトルストリームが生成される。この場合、サブタイトルエンコーダ１１７では、視差データ生成部１１５で生成されるブロック毎の視差情報が参照され、サブタイトルデータに、表示位置に対応した視差情報が付加される。

　また、音声データ出力部１１８では、画像データに対応した音声データが出力される。この音声データは、オーディオエンコーダ１１９に供給される。このオーディオエンコーダ１１９では、音声データに対して、ＭＰＥＧ－２Ａｕｄｉｏ、ＡＡＣ等の符号化が施され、オーディオストリームが生成される。

　ビデオエンコーダ１１３で得られるビデオストリーム、サブタイトルエンコーダ１１７で得られるサブタイトルストリームおよびオーディオエンコーダ１１９で得られるオーディオストリームは、それぞれ、マルチプレクサ１１４に供給される。マルチプレクサ１１４では、各エンコーダから供給されるエレメンタリストリームがＰＥＳパケット化されて多重され、トランスポートストリームＴＳが生成される。この場合、それぞれのＰＥＳヘッダには、受信側における同期再生のために、ＰＴＳが挿入される。また、マルチプレクサ１１４では、ＰＭＴの配下、あるいはＥＩＴの配下などに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。

　［識別情報、視差情報の構造、ＴＳ構成］
　図９は、トランスポートストリームＴＳの構成例を示している。この構成例では、左眼画像データおよび右眼画像データがそれぞれ別個のビデオストリームで伝送される例を示している。すなわち、左眼画像データが符号化されているビデオストリームのＰＥＳパケット「video PES1」および右眼画像データが符号化されているビデオストリームのＰＥＳパケット「video PES2」が含まれている。また、この構成例では、サブタイトルデータ（視差情報を含む）が符号化されているサブタイトルストリームのＰＥＳパケット「video PES3」および音声データが符号化されているオーディオストリームのＰＥＳパケット「video PES4」が含まれている。

　ビデオストリームのユーザデータ領域には、ピクチャ毎の視差情報を含むデプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）が挿入されている。例えば、ピクチャ毎の視差情報がピクチャ単位で挿入される場合、このデプス・インフォメーション・フォー・グラフィクスは、ビデオストリームの各ピクチャのユーザデータ領域に挿入される。また、例えば、ピクチャ毎の視差情報がＧＯＰ単位で挿入される場合、このデプス・インフォメーション・フォー・グラフィクスは、ビデオストリームのＧＯＰの先頭のピクチャのユーザデータ領域に挿入される。なお、この構成例では、２つのビデオストリームの双方にデプス・インフォメーション・フォー・グラフィクスが挿入されるように示しているが、一方のビデオストリームのみに挿入されてもよい。

　トランスポートストリームＴＳには、ＰＳＩ（Program Specific Information）として、ＰＭＴ（Program Map Table）が含まれている。このＰＳＩは、トランスポートストリームＴＳに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。また、トランスポートストリームＴＳには、イベント単位の管理を行うＳＩ（Serviced Information）としてのＥＩＴ(Event Information Table)が含まれている。

　ＰＭＴの配下に、各エレメンタリストリームに関連した情報を持つエレメンタリ・ループが存在する。このエレメンタリ・ループには、ストリーム毎に、パケット識別子（PID）などの情報が配置されると共に、そのエレメンタリストリームに関連する情報を記述するデスクリプタも配置される。

　上述したビデオストリームに視差情報が挿入されているか否かを示す識別情報は、例えば、プログラム・マップ・テーブルのビデオエレメンタリ・ループの配下に挿入されるデスクリプタ（descriptor）に記述される。このデスクリプタは、例えば、既存のＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）あるいはＭＶＣ・エクステンション・デスクリプタ（MVC_extension_descriptor）、または、新規に定義されるグラフィクス・デプス・インフォ・デスクリプタ（graphics_depth_info_descriptor）である。なお、グラフィクス・デプス・インフォ・デスクリプタに関しては、破線図示するように、ＥＩＴの配下に挿入することも考えられる。

　図１０（ａ）は、識別情報が記述されたＡＶＣ・ビデオ・デスクリプタ（AVC video descriptor）の構造例（Syntax）を示している。このデスクリプタは、ビデオがＭＰＥＧ４－ＡＶＣ Frame compatible フォーマットの場合に適用できる。このデスクリプタ自体は、既にＨ．２６４／ＡＶＣの規格に入っている。ここでは、このデスクリプタに、「graphics_depth_info_not_existed_flag」の１ビットのフラグ情報が、新たに、定義される。

　このフラグ情報は、図１０（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　図１１（ａ）は、識別情報が記述されたＭＶＣ・エクステンション・デスクリプタ（MVC extension descriptor）の構造例（Syntax）を示している。このデスクリプタは、ビデオがＭＰＥＧ４－ＡＶＣＡｎｎｅｘＨＭＶＣフォーマットの場合に適用できる。このデスクリプタ自体は、既にＨ．２６４／ＡＶＣの規格に入っている。ここでは、このデスクリプタに、「graphics_depth_info_not_existed_flag」の１ビットのフラグ情報が、新たに、定義される。

　このフラグ情報は、図１１（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　図１２（ａ）は、グラフィクス・デプス・インフォ・デスクリプタ（graphics_depth_info_descriptor）の構造例（Syntax）を示している。「descriptor_tag」の８ビットフィールドは、このデスクリプタが「graphics_depth_info_descriptor」であることを示す。「descriptor_length」の８ビットフィールドは、以降のデータバイト数を示す。そして、このデスクリプタに、「graphics_depth_info_not_existed_flag」の１ビットのフラグ情報が記述されている。

　このフラグ情報は、図１２（ｂ）の規定内容（semantics）に示すように、対応するビデオストリームに、ピクチャ毎の視差情報を含むデプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）が挿入されているか否かを示す。このフラグ情報が“０”であるときは挿入されていることを示す。一方、このフラグ情報が“１”であるときは挿入されていないことを示す。

　次に、ピクチャ毎の視差情報を含むデプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）を、ビデオストリームのユーザデータ領域に挿入する場合について説明する。

　例えば、符号化方式がＡＶＣである場合、「depth_information_for_graphics()」は、アクセスユニットの“ＳＥＬｓ”の部分に、「depth_information_for_graphics SEI message」として、挿入される。図１３（ａ）は、ＧＯＰ（Group Of Pictures）の先頭のアクセスユニットを示しており、図１３（ｂ）は、ＧＯＰの先頭以外のアクセスユニットを示している。ピクチャ毎の視差情報がＧＯＰ単位で挿入される場合には、ＧＯＰの先頭のアクセスユニットにのみ「depth_information_for_graphics SEI message」が挿入される。

　図１４（ａ）は、「depth_information_for_graphics SEI message」の構造例(Syntax)を示している。「uuid_iso_iec_11578」は、“ISO/IEC 11578:1996 AnnexA.”で示されるUUID値をもつ。「user_data_payload_byte」のフィールドに、「depth_information_for_graphics_data()」が挿入される。図１４（ｂ）は、「depth_information_for_graphics_data()」の構造例(Syntax)を示している。この中に、デプス・インフォメーション・フォー・グラフィクス（depth_information_for_graphics()）が挿入される。「userdata_id」は、符号なし１６ビットで示される「depth_information_for_graphics()」の識別子である。

　図１５は、ピクチャ毎の視差情報をピクチャ単位で挿入する場合における「depth_information_for_graphics()」の構造例(Syntax)を示している。また、図１６は、図１５に示す構造例における主要な情報の内容（Semantics）を示している。

　「partition_type」の３ビットフィールドは、ピクチャ表示画面の分割タイプを示す。“０００”は分割なしを示し、“００１”は水平、垂直を各々２等分することを示し、“０１０”は水平、垂直を各々３等分することを示し、“０１１”は水平、垂直を各々４等分することを示す。

　「partition_count」の４ビットフィールドは、分割領域（Partition）の総数を示し、上述の「partition_type」に依存した値となる。例えば、「partition_type=000」であるとき、図１７（ａ）に示すように分割領域（Partition）の総数は「１」である。また、例えば、「partition_type=001」であるとき、図１７（ｂ）に示すように分割領域（Partition）の総数は「４」である。また、例えば、「partition_type=011」であるとき、図１７（ｃ）に示すように分割領域（Partition）の総数は「１６」である。

　「disparity_in_partition」の８ビットフィールドは、各分割領域（Partition）の代表視差情報（代表disparity値）を示す。該当領域の視差情報の最小値である場合が多い。

　図１８は、ピクチャ毎の視差情報をＧＯＰ単位で挿入する場合のように、複数のピクチャをまとめて符号化する場合における、「depth_information_for_graphics()」の構造例(Syntax)を示している。また、図１９は、図１８に示す構造例における主要な情報の内容（Semantics）を示している。

　「picture_count」の６ビットフィールドは、ピクチャ数を示す。この「depth_information_for_graphics()」には、ピクチャ数分の各分割領域（Partition）の「disparity_in_partition」が含まれる。詳細説明は省略するが、図１８の構造例のその他は、図１５に示す構造例と同様である。

　また、例えば、符号化方式がＭＰＥＧ２ｖｉｄｅｏである場合、「depth_information_for_graphics()」は、ピクチャヘッダ部のユーザデータ領域に、ユーザデータ「user_data()」として挿入される。図２０（ａ）は、「user_data()」の構造例(Syntax)を示している。「user_data_start_code」の３２ビットフィールドは、ユーザデータ（user_data）の開始コードであり、“0x000001B2”の固定値とされる。

　この開始コードに続く３２ビットフィールドは、ユーザデータの内容を識別する識別子である。ここでは、「depth_information_for_graphics_data_identifier」とされ、ユーザデータが、「depth_information_for_graphics_data」であることを識別可能とする。この識別子の後のデータ本体として、「depth_information_for_graphics_data()」が挿入される。図２０（ｂ）は、「depth_information_for_graphics_data()」の構造例(Syntax)を示している。この中に、「depth_information_for_graphics()」が挿入される（図１５、図１８参照）。

　なお、符号化方式がＡＶＣあるいはＭＰＥＧ２ｖｉｄｅｏである場合におけるビデオストリームへの視差情報の挿入例について説明した。詳細説明は省略するが、その他の同様の構造の符号化方式、例えばＨＥＶＣなどにあっても、ビデオストリームへの視差情報の挿入を同様の構造で行うことができる。

　「テレビ受信機の説明」
　テレビ受信機２００は、放送局１００から放送波に載せて送られてくるトランスポートストリームＴＳを受信する。また、テレビ受信機２００は、このトランスポートストリームＴＳに含まれるビデオストリームをデコードして、立体画像を構成する左眼画像データおよび右眼画像データを生成する。また、テレビ受信機２００は、ビデオストリームに挿入されている、画像データのピクチャ毎の視差情報を抽出する。

　テレビ受信機２００は、画像にグラフィクスを重畳表示する際には、画像データおよび視差情報と、グラフィクスデータとを用いて、グラフィクスが重畳された左眼画像および右眼画像のデータを得る。この場合、テレビ受信機２００は、左眼画像および右眼画像に重畳されるグラフィクスに、ピクチャ毎に、このグラフィクスの表示位置に対応した視差を付与し、グラフィクスが重畳された左眼画像のデータおよびグラフィクスが重畳された右眼画像のデータを得る。

　上述のようにグラフィクスに視差を付与することで、立体画像に重畳表示されるグラフィクスを、その表示位置における立体画像のオブジェクトよりも手前に表示させることができる。これにより、ＯＳＤあるいはアプリケーションあるいは番組情報のＥＰＧなどのグラフィクスを画像に重畳表示する場合に、画像内の各オブジェクトに対する遠近感の整合性を維持できる。

　図２１は、視差情報によるグラフィクスの奥行き制御の概念を示している。視差情報がマイナス値である場合、スクリーン上において左眼表示用のグラフィクスが右側に、右眼表示用のグラフィクスが左側にずれるように視差が付与される。この場合、グラフィクスの表示位置はスクリーンよりも手前となる。また、視差情報がプラス値である場合、スクリーン上において左眼表示用のグラフィクスが左側に、右眼表示用のグラフィクスが右側にずれるように視差が付与される。この場合、グラフィクスの表示位置はスクリーンよりも奥となる。

　上述したように、ビデオストリームには、画像データのピクチャ毎に取得された視差情報が挿入されている。そのため、テレビ受信機２００は、視差情報によるグラフィクスの奥行き制御を、グラフィクスの表示タイミングに合った視差情報を用いて精度よく行うことができる。

　図２２は、ビデオストリームにピクチャ単位で視差情報が挿入されている場合の例であって、テレビ受信機２００では、画像データのピクチャタイミングで順次視差情報が取得される。グラフィクスの表示に当たっては、グラフィクスの表示タイミングに合った視差情報が使用され、グラフィクスに適切な視差が付与される。また、図２３は、例えば、ビデオストリームにＧＯＰ単位で視差情報が挿入されている場合の例であって、テレビ受信機２００では、画像データのＧＯＰの先頭タイミングで、ＧＯＰ内の各ピクチャの視差情報（視差情報セット）がまとめて取得される。グラフィクスの表示に当たっては、グラフィクスの表示タイミングに合った視差情報が使用され、グラフィクスに適切な視差が付与される。

　図２４（ａ）の「Side View」は、画像上における字幕（サブタイトル）およびＯＳＤグラフィクスの表示例を示している。この表示例では、背景、中景オブジェクトおよび近景オブジェクトとからなる画像上に、字幕およびグラフィクスが重畳された例である。図２４（ｂ）の「Top View」は、背景、中景オブジェクト、近景オブジェクト、字幕およびグラフィクスの遠近感を示している。字幕およびグラフィクスは、表示位置に対応するオブジェクトよりも手前にあるように認識されることを示している。なお、図示していないが、字幕とグラフィクスの表示位置が重なる場合には、例えば、グラフィクスが字幕よりも手前に認識されるように、グラフィクスに適切な視差が付与される。

　「テレビ受信機のデコード部の構成例」
　図２５は、テレビ受信機２００の構成例を示している。テレビ受信機２００は、コンテナバッファ２１１と、デマルチプレクサ２１２と、コーデッドバッファ２１３と、ビデオデコーダ２１４と、デコーデッドバッファ２１５と、スケーラ２１６と、重畳部２１７を有している。

　また、テレビ受信機２００は、視差情報バッファ２１８と、テレビ（ＴＶ）グラフィクス発生部２１９と、奥行き制御部２２０と、グラフィクスバッファ２２１を有している。また、テレビ受信機２００は、コーデッドバッファ２３１と、サブタイトルデコーダ２３２と、ピクセルバッファ２３３と、サブタイトル視差情報バッファ２３４と、サブタイトル表示制御部２３５を有している。さらに、テレビ受信機２００は、コーデッドバッファ２４１と、オーディオデコーダ２４２と、オーディオバッファ２４３と、チャネルミキシング部２４４を有している。

　コンテナバッファ２１１は、デジタルチューナ等で受信されたトランスポートストリームＴＳを一時的に記憶する。このトランスポートストリームＴＳには、ビデオストリーム、サブタイトルストリームおよびオーディオストリームが含まれている。ビデオストリームとして、左眼画像データおよび右眼画像データが符号化されて得られた１つあるいは２つのビデオストリームが含まれている。

　例えば、左眼画像データおよび右眼画像データによりサイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データが構成されて１つのビデオストリームで送られてくることがある。また、例えば、左眼画像データおよび右眼画像データが、ＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで送られてくることがある。

　デマルチプレクサ２１２は、コンテナバッファ２１１に一時的に蓄積されたトランスポートストリームＴＳから、ビデオ、サブタイトルおよびオーディオの各ストリームを抽出する。また、デマルチプレクサ２１２は、このトランスポートストリームＴＳから、ビデオストリームに視差情報が挿入されているか否かを示す識別情報（「graphics_depth_info_not_existed_flag」のフラグ情報）を抽出し、図示しない制御部（ＣＰＵ）に送る。ビデオデコーダ２１４は、制御部（ＣＰＵ）の制御のもと、識別情報が視差情報の挿入を示すとき、後述するように、ビデオストリームから視差情報を取得する。

　コーデッドバッファ２１３は、デマルチプレクサ２１２で抽出されるビデオストリームを一時的に記憶する。ビデオデコーダ２１４は、コーデッドバッファ２１３に記憶されているビデオストリームにデコード処理を行って、左眼画像データおよび右眼画像データを取得する。また、ビデオデコーダ２１４は、ビデオストリームに挿入されている画像データのピクチャ毎の視差情報を取得する。各ピクチャの視差情報には、ピクチャ表示画面の分割情報と、各分割領域（Partition）の視差情報（disparity）が含まれている。デコーデッドバッファ２１５は、ビデオデコーダ２１４で取得された左眼画像データおよび右眼画像データを一時的に記憶する。また、視差情報バッファ２１８は、ビデオデコーダ２１４で取得された画像データのピクチャ毎の視差情報を一時的に記憶する。

　スケーラ２１６は、デコーデッドバッファ２１５から出力される左眼画像データおよび右眼画像データに対して、必要に応じて、水平方向や垂直方向のスケーリング処理を行う。例えば、左眼画像データおよび右眼画像データがサイド・バイ・サイド方式あるいはトップ・アンド・ボトム方式の画像データとして１つのビデオストリームで送られてくる場合には、水平方向あるいは垂直方向に１／２にスケールアップして出力する。また、例えば、左眼画像データおよび右眼画像データがＭＶＣのベースビューストリーム、ノンベースビューストリームのように、それぞれ、別個のビデオストリームで送られてくる場合には、スケーリング処理を行うことなく、左眼画像データおよび右眼画像データをそのまま出力する。

　コーデッドバッファ２３１は、デマルチプレクサ２１４で抽出されるサブタイトルストリームを一時的に記憶する。サブタイトルデコーダ２３２は、上述の送信データ生成部１１０のサブタイトルエンコーダ１１７（図８参照）とは逆の処理を行う。すなわち、サブタイトルデコーダ２３２は、コーデッドバッファ２３１に記憶されているサブタイトルストリームのデコード処理を行って、サブタイトルデータを得る。

　このサブタイトルデータには、サブタイトル（字幕）のビットマップデータと、このサブタイトルの表示位置情報「Subtitle rendering position (x2,y2）」と、サブタイトル（字幕）の視差情報「Subtitle disparity」が含まれている。ピクセルバッファ２３３は、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）のビットマップデータおよびサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」を一時的に記憶する。サブタイトル視差情報バッファ２３４は、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）の視差情報「Subtitle disparity」を一時的に記憶する。

　サブタイトル表示制御部２３５は、サブタイトル（字幕）のビットマップデータと、このサブタイトル（字幕）の表示位置情報および視差情報に基づいて、視差が付与された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」を生成する。テレビグラフィクス発生部２１９は、ＯＳＤあるいはアプリケーションなどのグラフィクスデータを発生する。このグラフィクスデータには、グラフィクスビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」が含まれている。

　グラフィクスバッファ２２１は、テレビグラフィクス発生部２１９で発生されたグラフィクスビットマップデータ「Graphics data」を一時的に記憶する。重畳部２１７は、左眼画像データおよび右眼画像データに、それぞれ、サブタイトル表示制御部２３５で生成された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」を重畳する。

　また、重畳部２１７は、左眼画像データおよび右眼画像データに、それぞれ、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」を重畳する。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、後述する奥行き制御部２２０により、視差が付与される。ここで、グラフィクスビットマップデータ「Graphics data」がサブタイトルのビットマップデータ「Subtitledata」と同一画素を共有する場合、重畳部２１７は、サブタイトルデータの上にグラフィクスデータを上書きする。

　奥行き制御部２２０は、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」に視差を付与する。そのため、奥行き制御部２２０は、画像データのピクチャ毎に、左眼表示用および右眼表示用のグラフィクスの表示位置情報「Rendering position」を生成し、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」の左眼画像データおよび右眼画像データへの重畳位置のシフト制御を行う。

　奥行き制御部２２０は、図２６に示すように、以下の情報を用いて、表示位置情報「Rendering position」を生成する。すなわち、奥行き制御部２２０は、視差情報バッファ２１８に記憶されている画像データのピクチャ毎の各分割領域（Partition）の視差情報（Disparity）を用いる。また、奥行き制御部２２０は、ピクセルバッファ２３３に記憶されているサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」を用いる。

　また、奥行き制御部２２０は、サブタイトル視差情報バッファ２３４に記憶されているサブタイトル（字幕）の視差情報「Subtitle disparity」を用いる。また、奥行き制御部２２０は、テレビグラフィクス発生部２１９で発生されるグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」を用いる。また、奥行き制御部２２０は、ビデオストリームに視差情報が挿入されているか否かを示す識別情報を用いる。

　図２７、図２８のフローチャートは、奥行き制御部２２０の制御処理の手順の一例を示している。奥行き制御部２２０は、この制御処理を、グラフィクス表示を行う各ピクチャ（フレーム）で実行する。奥行き制御部２２０は、ステップＳＴ１において、制御処理を開始する。その後に、ステップＳＴ２において、識別情報に基づいて、ビデオストリームにグラフィクス向けの視差情報の挿入があるか否かを判断する。

　ビデオストリームに視差情報の挿入があるとき、奥行き制御部２２０は、ステップＳＴ３の処理に移る。このステップＳＴ３において、グラフィクスを重畳表示（overlay）する座標が含まれる分割領域（partition）を全て検査する。そして、奥行き制御部２２０は、ステップＳＴ４において、対象となる分割領域（partition）の視差情報（disparity）を比較し、最適な値、例えば最小値を選択して、グラフィクス視差情報（disparity）の値（graphics_disparity）とする。

　次に、奥行き制御部２２０は、ステップＳＴ５の処理に移る。上述のステップＳＴ２でビデオストリームに視差情報の挿入がないとき、奥行き制御部２２０は、直ちに、ステップＳＴ５の処理に移る。このステップＳＴ５において、奥行き制御部２２０は、視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）があるか否かを判断する。

　視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）があるとき、奥行き制御部２２０は、ステップＳＴ６において、サブタイトル用の視差情報（disparity）の値（subtitle_disparity）と、グラフィクス用の視差情報の値（graphics_disparity）とを比較する。なお、グラフィクス用の視差情報の値（graphics_disparity）は、ビデオストリームにグラフィクス用の視差情報（disparity）の挿入がないときは、例えば、「０」とされる。

　次に、奥行き制御部２２０は、ステップＳＴ７において、「subtitle_disparity＞（graphics_disparity）の条件を満足するか否かを判断する。この条件を満足するとき、奥行き制御部２２０は、ステップＳＴ８において、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、グラフィクス用の視差情報（disparity）の値（graphics_disparity）と同等の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部２２０は、ステップＳＴ８の処理の後、ステップＳＴ９において、制御処理を終了する。

　一方、ステップＳＴ７で条件を満足しないとき、奥行き制御部２２０は、ステップＳＴ１０において、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、サブタイトル用の視差情報（disparity）よりも小さい値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部２２０は、ステップＳＴ１０の処理の後、ステップＳＴ９において、制御処理を終了する。

　また、ステップＳＴ５で視差情報（disparity）を持ったサブタイトルストリーム（Subtitle stream）がないとき、奥行き制御部２２０は、ステップＳＴ１１において、グラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」に対して、テレビ受信機２００で算出される視差情報（disparity）の値を用いて、表示位置がシフトされた左眼表示用および右眼表示用のグラフィクスビットマップデータを得て、それぞれ、左眼画像データおよび右眼画像データに重畳する。奥行き制御部２２０は、ステップＳＴ１１の処理の後、ステップＳＴ９において、制御処理を終了する。

　コーデッドバッファ２４１は、デマルチプレクサ２１２で抽出されるオーディオストリームを一時的に記憶する。オーディオデコーダ２４２は、上述の送信データ生成部１１０のオーディオエンコーダ１１９（図８参照）とは逆の処理を行う。すなわち、オーディオデコーダ２４２は、コーデッドバッファ２４１に記憶されているオーディオストリームの復号化処理を行って、復号化された音声データを得る。オーディオバッファ２４３は、オーディオデコーダ２４２で得られる音声データを一時的に記憶する。チャネルミキシング部２４４は、オーディオバッファ２４３に記憶されている音声データに対して、例えば５．１chサラウンド等を実現するための各チャネルの音声データを生成して出力する。

　なお、デコーデッドバッファ２１５、視差情報バッファ２１８、ピクセルバッファ２３３、サブタイトル視差情報バッファ２３４およびオーディオバッファ２４３からの情報（データ）の読み出しは、ＰＴＳに基づいて行われ、転送同期が取られる。

　図２５に示すテレビ受信２００の動作を簡単に説明する。デジタルチューナ等で受信されたトランスポートストリームＴＳは、コンテナバッファ２１１に一時的に記憶される。このトランスポートストリームＴＳには、ビデオストリーム、サブタイトルストリームおよびオーディオストリームが含まれている。ビデオストリームとしては、左眼画像データおよび右眼画像データが符号化されて得られた１つあるいは２つのビデオストリームが含まれている。

　デマルチプレクサ２１２では、コンテナバッファ２１１に一時的に記憶されたトランスポートストリームＴＳから、ビデオ、サブタイトルおよびオーディオの各ストリームが抽出される。また、デマルチプレクサ２１２では、このトランスポートストリームＴＳから、ビデオストリームに視差情報が挿入されているか否かを示す識別情報（「graphics_depth_info_not_existed_flag」のフラグ情報）が抽出され、図示しない制御部（ＣＰＵ）に送られる。

　デマルチプレクサ２１２で抽出されるビデオストリームはコーデッドバッファ２１３に供給されて一時的に記憶される。そして、ビデオデコーダ２１４では、コーデッドバッファ２１３に記憶されているビデオストリームのデコード処理が行われて、左眼画像データおよび右眼画像データが取得される。この左眼画像データおよび右眼画像データは、デコーデッドバッファ２１５に一時的に記憶される。また、ビデオデコーダ２１４では、ビデオストリームに挿入されている、画像データのピクチャ毎の視差情報が取得される。この視差情報は、視差情報バッファ２１８に一時的に記憶される。

　スケーラ２１６では、デコーデッドバッファ２１５から出力される左眼画像データおよび右眼画像データに対して、必要に応じて、水平方向や垂直方向のスケーリング処理が行われる。このスケーラ２１６からは、例えば、１９２０＊１０８０のフルＨＤのサイズの左眼画像データおよび右眼画像データが得られる。この左眼画像データおよび右眼画像データは、重畳部２１７に供給される。

　また、デマルチプレクサ２１２で抽出されるサブタイトルストリームは、コーデッドバッファ２３１に供給されて一時的に記憶される。サブタイトルデコーダ２３２では、コーデッドバッファ２３１に記憶されているサブタイトルストリームのデコード処理が行われて、サブタイトルデータが得られる。このサブタイトルデータには、サブタイトル（字幕）のビットマップデータと、このサブタイトルの表示位置情報「Subtitle rendering position (x2,y2）」と、サブタイトル（字幕）の視差情報「Subtitle disparity」が含まれている。

　サブタイトルデコーダ２３２で得られるサブタイトル（字幕）のビットマップデータおよびサブタイトル（字幕）の表示位置情報「Subtitle rendering position (x2,y2）」は、ピクセルバッファ２３３に一時的に記憶される。また、サブタイトルデコーダ２３２で得られるサブタイトル（字幕）の視差情報「Subtitle disparity」はサブタイトル視差情報バッファ２３４に一時的に記憶される。

　サブタイトル表示制御部２３５では、サブタイトル（字幕）のビットマップデータと、このサブタイトル（字幕）の表示位置情報および視差情報に基づいて、視差が付与された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」が生成される。このように生成された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」は、重畳部２１７に供給され、それぞれ、左眼画像データおよび右眼画像データに重畳される。

　テレビ（ＴＶ））グラフィクス発生部２１９では、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータが発生される。このグラフィクスデータには、グラフィクスのビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphicsrendering position (x1,y1）」が含まれている。グラフィクスバッファ２２１には、テレビグラフィクス発生部２１９で発生されたグラフィクスデータが一時的に記憶される。

　重畳部２１７では、左眼画像データおよび右眼画像データにグラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」が重畳される。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、奥行き制御部２２０により、グラフィクスの表示位置に対応した視差情報に基づいて視差が付与される。この場合、グラフィクスビットマップデータ「Graphics data」がサブタイトルのビットマップデータ「Subtitledata」と同一画素を共有する場合、重畳部２１７では、サブタイトルデータの上にグラフィクスデータが上書きされる。

　重畳部２１７からは、左眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された右眼画像のデータが得られる。これらの画像データは、立体画像表示のための処理部に送られ、立体画像表示が行われる

　デマルチプレクサ２１２で抽出されるオーディオストリームは、コーデッドバッファ２４１に供給されて一時的に記憶される。オーディオデコーダ２４２では、コーデッドバッファ２４１に記憶されているオーディオスストリームのデコード処理が行われて、復号化された音声データが得られる。この音声データはオーディオバッファ２４３を介してチャネルミキシング部２４４に供給される。チャネルミキシング部２４４では、音声データに対して、例えば５．１chサラウンド等を実現するための各チャネルの音声データが生成される。この音声データは例えばスピーカに供給され、立体画像表示に合わせた音声出力がなされる。

　図２９は、テレビ受信機２００におけるグラフィクスの奥行き制御例を示している。この例において、グラフィクスは、右側の８つの分割領域（Partition 2,3,6,7,10,11,14,15）の視差情報のうち最小の値の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。その結果、グラフィクスは、これら８つの分割領域の画像（ビデオ）オブジェクトより手前に表示される。

　図３０も、テレビ受信機２００におけるグラフィクスの奥行き制御例を示している。この例において、グラフィクスは、右側の８つの分割領域（Partition 2,3,6,7,10,11,14,15）の視差情報のうち最小の値の視差情報、さらにはサブタイトル（字幕）の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。その結果、グラフィクスは、これら８つの分割領域の画像（ビデオ）オブジェクトより手前で、さらに、サブタイトル（字幕）よりも手前に表示される。なお、この場合、サブタイトル（字幕）も、サブタイトル（字幕）の視差情報に基づいて、サブタイトルの表示位置に対応した４つの分割領域（Partition 8,9,10,11）の画像（ビデオ）オブジェクトより手前に表示される。

　以上説明したように、図１に示す画像送受信システム１０においては、画像データのピクチャ毎に取得された視差情報がビデオストリームに挿入されて送信される。そのため、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御をピクチャ（フレーム）精度で良好に行うことができる。

　また、図１に示す画像送受信システム１０においては、トランスポートストリームＴＳのレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報が挿入される。そのため、この識別情報により、受信側では、ビデオストリームに視差情報の挿入があるか否かを容易に識別でき、グラフィクスの奥行き制御を的確に行うことが可能となる。

　また、図１に示す画像送受信システム１０においては、ビデオストリームに挿入されるピクチャ毎の視差情報が、ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなるものとされる。そのため、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を、グラフィクスの表示位置に応じて良好に行うことができる。

　＜２．変形例＞
　なお、上述実施の形態においては、放送局１００と受信機２００からなる画像送受信システム１０を示したが、本技術を適用し得る画像送受信システムの構成は、これに限定されるものではない。例えば、図３１に示すように、テレビ受信機２００の部分が、例えば、（ＨＤＭＩ（High-Definition Multimedia Interface）などのデジタルインタフェースで接続されたセットトップボックス２００Ａおよびテレビ受信機２００Ｂの構成などであってもよい。

　図３２は、セットトップボックス２００Ａの構成例を示している。この図３２において、図２５と対応する部分には同一符号を付し、適宜、その詳細説明を省略する。セットトップボックス（ＳＴＢ）グラフィクス発生部２１９Ａは、ＯＳＤあるいはアプリケーション、あるいはＥＰＧなどのグラフィクスデータを発生する。このグラフィクスデータには、グラフィクスのビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphicsrendering position (x1,y1）」が含まれている。グラフィクスバッファ２２１には、セットトップボックスグラフィクス発生部２１９Ａで発生されたグラフィクスデータが一時的に記憶される。

　重畳部２１７では、サブタイトル表示制御部２３５で生成された左眼表示用および右眼表示用のサブタイトルのビットマップデータ「Subtitle data」が、それぞれ、左眼画像データおよび右眼画像データに重畳される。また、この重畳部２１７では、左眼画像データおよび右眼画像データにグラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」が重畳される。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、奥行き制御部２２０により、グラフィクスの表示位置に対応した視差情報に基づいて視差が付与される。

　重畳部２１７からは、左眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のサブタイトル（字幕）およびグラフィクスが重畳された右眼画像のデータが得られる。これらの画像データは、ＨＤＭＩ送信部に送られる。また、チャネルミキシング部２４４で得られた各チャネルの音声データもＨＤＭＩ送信部に送られる。

　また、視差情報バッファ２１８に記憶されている画像データのピクチャ毎の各分割領域（Partition）の視差情報（Disparity）は、奥行き制御部２２０を通じて、ＨＤＭＩ送信部に送られる。この場合、サブタイトル（字幕）の表示位置およびグラフィクスの表示位置に対応した分割領域（Partition）の視差情報（Disparity）は、サブタイトル（字幕）あるいはグラフィクスの視差付与に用いられた視差情報（Disparity）で更新されたものとされる。

　例えば、上述の図３０の奥行き制御例の場合、まず、サブタイトルの表示位置に対応した４つの分割領域（Partition 8,9,10,11）の視差情報（Disparity）の値が、サブタイトルへの視差付与に使用された視差情報値（subtitle_disparity）で更新される。その後、８つの分割領域（Partition2,3,6,7,10,11,14,15）の視差情報（Disparity）の値が、グラフィクスへの視差付与に使用された視差情報値（graphics_disparity）で更新される。

　詳細説明は省略するが、図３２に示すセットトップボックス２００Ａのその他は、図２５に示すテレビ受信機２００と同様に構成される。

　図３３は、テレビ受信機２００ＢのＨＤＭＩ入力系の構成例を示している。この図３３において、図２５と対応する部分には同一符号を付し、適宜、その詳細説明を省略する。ＨＤＭＩ受信部で受信された左眼画像データおよび右眼画像データは、スケーラ２５１で必要に応じてスケーリング処理された後に、重畳部２１７に供給される。

　また、ＨＤＭＩ受信部で受信された、画像データのピクチャ毎の各分割領域の視差情報（Disparity）は、奥行き制御部２２０に供給される。また、テレビ（ＴＶ））グラフィクス発生部２１９では、ＯＳＤあるいはアプリケーションなどのグラフィクスデータが発生される。このグラフィクスデータには、グラフィクスのビットマップデータ「Graphics data」と、このグラフィクスの表示位置情報「Graphicsrendering position (x1,y1）」が含まれている。グラフィクスバッファ２２１には、テレビグラフィクス発生部２１９で発生されたグラフィクスデータが一時的に記憶される。また、このグラフィクスの表示位置情報「Graphics rendering position (x1,y1）」は、奥行き制御部２２０に供給される。

　重畳部２１７では、左眼画像データおよび右眼画像データにグラフィクスバッファ２２１に記憶されているグラフィクスビットマップデータ「Graphics data」が重畳される。この際、左眼画像データおよび右眼画像データのそれぞれに重畳されるグラフィクスビットマップデータ「Graphics data」には、奥行き制御部２２０により、グラフィクスの表示位置に対応した視差情報に基づいて視差が付与される。重畳部２１７からは、左眼表示用のグラフィクスが重畳された左眼画像のデータが得られると共に、右眼表示用のグラフィクスが重畳された右眼画像のデータが得られる。これらの画像データは、立体画像表示のための処理部に送られ、立体画像表示が行われる

　また、ＨＤＭＩ受信部で受信された各チャネルの音声データは、音質や音量の調整を行うオーディオ処理部２５２を介してスピーカに供給され、立体画像表示に合わせた音声出力がなされる。

　図３４は、テレビ受信機２００Ｂにおけるグラフィクスの奥行き制御例を示している。この例において、ＴＶグラフィクスに関しては、右側の４つの分割領域（Partition 10,11,14,15）の視差情報のうち最小の値の視差情報に基づいて、左眼表示用のグラフィクスおよび右眼表示用のグラフィクスに視差が付与される。その結果、ＴＶグラフィクスは、これら４つの分割領域の画像（ビデオ）オブジェクトより手前に表示される。なお、この場合、サブタイトル（字幕）、さらにはＳＴＢのグラフィクスは、既に画像（ビデオ）に重畳されている。

　また、上述実施の形態においては、コンテナがトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、ＭＰ４やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム（ＭＰＥＧ－２　ＴＳ）、インターネット配信で使用されているＭＰ４などの種々のフォーマットのコンテナが該当する。

　また、本技術は、以下のような構成を取ることもできる。
　（１）立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部と、
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報を挿入する識別情報挿入部とを備える
　送信装置。
　（２）上記視差情報挿入部は、
　上記視差情報を、上記ビデオストリームにピクチャ単位、あるいはＧＯＰ単位で挿入する
　前記（１）に記載の送信装置。
　（３）上記視差情報取得部は、
　上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の視差情報を取得する
　前記（１）または（２）に記載の送信装置。
　（４）上記視差情報取得部は、
　上記ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、上記ピクチャ毎に、各分割領域の視差情報を取得する
　前記（３）に記載の送信装置。
　（５）上記視差情報挿入部が上記ビデオストリームに挿入するピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する
　前記（３）または（４）に記載の送信装置。
　（６）上記画像データ送信部は、
　表示位置に対応した上記視差情報を持つ字幕データが符号化されて得られた字幕ストリームを上記コンテナに含めて送信する
　前記（１）から（５）のいずれかに記載の送信装置。
　（７）上記コンテナは、トランスポートストリームであり、
　上記識別情報挿入部は、
　上記識別情報をプログラム・マップ・テーブル、あるいは、イベント・インフォメーション・テーブルの配下に挿入する
　前記（１）から（６）のいずれかに記載の送信装置。
　（８）上記識別情報挿入部は、
　上記プログラム・マップ・テーブル、あるいは、イベント・インフォメーション・テーブルの配下に挿入されるデスクリプタに、上記識別情報を記述する
　前記（７）に記載の送信装置。
　（９）立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得するステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップと、
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報を挿入するステップとを備える
　送信方法。
　（１０）立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備え、
　上記視差情報取得部は、上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の上記視差情報を取得し、
　上記視差情報挿入部が上記ビデオストリームに挿入するピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する
　送信装置。
　（１１）上記視差情報挿入部は、
　上記視差情報を、上記ビデオストリームにピクチャ単位、あるいはＧＯＰ単位で挿入する
　前記（１０）に記載の送信装置。
　（１２）上記視差情報取得部は、
　上記ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、上記ピクチャ毎に、各分割領域の視差情報を取得する
　前記（１０）または（１１）に記載の送信装置。
　（１３）立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得ステップと、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得ステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入ステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信ステップとを備え、
　上記視差情報取得ステップでは、上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の上記視差情報を取得し、
　上記視差情報挿入ステップで上記ビデオストリームに挿入されるピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなる
　送信方法。
　（１４）ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから、上記左眼画像データおよび右眼画像データを取得すると共に、該画像データの各ピクチャの分割領域毎の視差情報を取得する情報取得部と、
　画像上にグラフィクスを表示するためのグラフィクスデータを発生するグラフィクスデータ発生部と、
　上記取得された上記画像データおよび上記視差情報と、上記発生されたグラフィクスデータを用い、左眼画像および右眼画像に重畳する上記グラフィクスに、ピクチャ毎に、該グラフィクスの表示位置に対応した視差を付与し、上記グラフィクスが重畳された左眼画像のデータおよび上記グラフィクスが重畳された右眼画像のデータを得る画像データ処理部とをさらに備える
　受信装置。
　（１５）上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報が挿入されており、
　上記コンテナから上記識別情報を取得する識別情報取得部をさらに備え、
　上記情報取得部は、
　上記取得された識別情報が上記視差情報の挿入があることを示すとき、上記コンテナに含まれるビデオストリームから上記視差情報を取得する
　前記（１４）に記載の受信装置。
　（１６）上記取得された識別情報が上記視差情報の挿入がないことを示すとき、上記画像データ処理部は、装置内で算出された視差情報を用いる
　前記（１５）に記載の受信装置。
　（１７）上記画像データ処理部は、
　上記グラフィクスの表示と共に字幕の表示が行われるとき、上記グラフィクスが上記字幕よりも手前に表示されるように上記グラフィクスに視差を付与する
　前記（１４）から（１６）のいずれかに記載の受信装置。
　（１８）上記画像データ処理部は、
　上記グラフィクスの表示位置に対応した所定数の分割領域の視差情報から選択された視差情報を使用して、該グラフィクスに視差を付与する
　前記（１４）から（１７）のいずれかに記載の受信装置。
　（１９）上記情報取得部で取得された上記画像データの各ピクチャの分割領域毎の視差情報を、上記グラフィクスの画像への重畳に応じて更新する視差情報更新部と、
　上記更新された視差情報を上記画像データ処理部で得られた画像データが送信される外部機器に送信する視差情報送信部とをさらに備える
　前記（１４）から（１８）のいずれかに記載の受信装置。
　（２０）ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信ステップを備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから、上記左眼画像データおよび右眼画像データを取得すると共に、該画像データの各ピクチャの分割領域毎の視差情報を取得する情報取得ステップと、
　画像上にグラフィクスを表示するためのグラフィクスデータを発生するグラフィクスデータ発生ステップと、
　上記取得された上記画像データおよび上記視差情報と、上記発生されたグラフィクスデータを用い、左眼画像および右眼画像に重畳する上記グラフィクスに、ピクチャ毎に、該グラフィクスの表示位置に対応した視差を付与し、上記グラフィクスが重畳された左眼画像のデータおよび上記グラフィクスが重畳された右眼画像のデータを得る画像データ処理ステップとをさらに備える
　受信方法。

　本技術の主な特徴は、画像データのピクチャ毎に取得された視差情報をビデオストリームに挿入して送信するものにあって、このビデオストリームを含むトランスポートストリーム（コンテナ）のレイヤに、ビデオストリームに視差情報の挿入があるか否かを識別するための識別情報を挿入するようにしたことで、受信側においてビデオストリームに視差情報の挿入があるか否かを容易に識別でき、グラフィクスの奥行き制御を的確に行うことを可能にしたことである（図６参照）。また、ビデオストリームに挿入するピクチャ毎の視差情報をピクチャ表示画面の分割情報と、各分割領域の視差情報とからなるものとすることで、受信側における立体画像に重畳表示されるグラフィクスの奥行き制御を、グラフィクスの表示位置に応じて良好に行うことを可能にしたことである（図１５、図１８参照）。

　１０，１０Ａ・・・画像送受信システム
　１００Ａ・・・放送局
　１１１Ｌ，１１１Ｒ・・・画像データ出力部
　１１２Ｌ，１１２・・・スケーラ
　１１３・・・ビデオエンコーダ
　１１４・・・マルチプレクサ
　１１５・・・視差データ生成部
　１１６・・・サブタイトルデータ出力部
　１１７・・・サブタイトルエンコーダ
　１１８・・・音声データ出力部
　１１９・・・オーディオエンコーダ
　２００，２００Ｂ・・・テレビ受信機
　２００・・・セットトップボックス
　２１１・・・コンテナバッファ
　２１２・・・デマルチプレクサ
　２１３・・・コーデッドバッファ
　２１４・・・ビデオデコーダ
　２１５・・・デコーデッドバッファ
　２１６・・・スケーラ
　２１７・・・重畳部
　２１８・・・視差情報バッファ
　２１９・・・テレビ（ＴＶ）グラフィクス発生部
　２１９Ａ・・・セットトップボックス（ＳＴＢ）グラフィクス発生部
　２２０・・・奥行き制御部
　２２１・・・グラフィクスバッファ
　２３１・・・コーデッドバッファ
　２３２・・・サブタイトルデコーダ
　２３３・・・ピクセルバッファ
　２３４・・・サブタイトル視差情報バッファ
　２３５・・・サブタイトル表示制御部
　２４１・・・コーデッドバッファ
　２４２・・・オーディオデコーダ
　２４３・・・オーディオバッファ
　２４４・・・チャネルミキシング部
　２５１・・・スケーラ
　２５２・・・オーディオ処理部

Claims

　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部と、
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報を挿入する識別情報挿入部とを備える
　送信装置。
　上記視差情報挿入部は、
　上記視差情報を、上記ビデオストリームにピクチャ単位、あるいはＧＯＰ単位で挿入する
　請求項１に記載の送信装置。
　上記視差情報取得部は、
　上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の視差情報を取得する
　請求項１に記載の送信装置。
　上記視差情報取得部は、
　上記ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、上記ピクチャ毎に、各分割領域の視差情報を取得する
　請求項３に記載の送信装置。
　上記視差情報挿入部が上記ビデオストリームに挿入するピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する
　請求項３に記載の送信装置。
　上記画像データ送信部は、
　表示位置に対応した上記視差情報を持つ字幕データが符号化されて得られた字幕ストリームを上記コンテナに含めて送信する
　請求項１に記載の送信装置。
　上記コンテナは、トランスポートストリームであり、
　上記識別情報挿入部は、
　上記識別情報をプログラム・マップ・テーブル、あるいは、イベント・インフォメーション・テーブルの配下に挿入する
　請求項１に記載の送信装置。
　上記識別情報挿入部は、
　上記プログラム・マップ・テーブル、あるいは、イベント・インフォメーション・テーブルの配下に挿入されるデスクリプタに、上記識別情報を記述する
　請求項７に記載の送信装置。
　立体画像を構成する左眼画像データおよび右眼画像データを取得するステップと、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得するステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入するステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信するステップと、
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報を挿入するステップとを備える
　送信方法。
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得部と、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得部と、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入部と、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信部とを備え、
　上記視差情報取得部は、上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の上記視差情報を取得し、
　上記視差情報挿入部が上記ビデオストリームに挿入するピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とを有する
　送信装置。
　上記視差情報挿入部は、
　上記視差情報を、上記ビデオストリームにピクチャ単位、あるいはＧＯＰ単位で挿入する
　請求項１０に記載の送信装置。
　上記視差情報取得部は、
　上記ピクチャ表示画面の分割情報に基づいて、符号化ブロック境界を跨がないようにピクチャ表示画面を分割し、上記ピクチャ毎に、各分割領域の視差情報を取得する
　請求項１０に記載の送信装置。
　立体画像を構成する左眼画像データおよび右眼画像データを取得する画像データ取得ステップと、
　上記取得された画像データのピクチャ毎に、左眼画像および右眼画像の一方に対する他方の視差情報を取得する視差情報取得ステップと、
　上記取得された画像データが符号化されて得られたビデオストリームに、上記取得された視差情報を挿入する視差情報挿入ステップと、
　上記視差情報が挿入されたビデオストリームを含む所定フォーマットのコンテナを送信する画像データ送信ステップとを備え、
　上記視差情報取得ステップでは、上記ピクチャ毎に、ピクチャ表示画面の分割情報に基づいて、各分割領域の上記視差情報を取得し、
　上記視差情報挿入ステップで上記ビデオストリームに挿入されるピクチャ毎の視差情報は、上記ピクチャ表示画面の分割情報と、各分割領域の視差情報とからなる
　送信方法。
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信部を備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから、上記左眼画像データおよび右眼画像データを取得すると共に、該画像データの各ピクチャの分割領域毎の視差情報を取得する情報取得部と、
　画像上にグラフィクスを表示するためのグラフィクスデータを発生するグラフィクスデータ発生部と、
　上記取得された上記画像データおよび上記視差情報と、上記発生されたグラフィクスデータを用い、左眼画像および右眼画像に重畳する上記グラフィクスに、ピクチャ毎に、該グラフィクスの表示位置に対応した視差を付与し、上記グラフィクスが重畳された左眼画像のデータおよび上記グラフィクスが重畳された右眼画像のデータを得る画像データ処理部とをさらに備える
　受信装置。
　上記コンテナのレイヤに、上記ビデオストリームに上記視差情報の挿入があるか否かを識別するための識別情報が挿入されており、
　上記コンテナから上記識別情報を取得する識別情報取得部をさらに備え、
　上記情報取得部は、
　上記取得された識別情報が上記視差情報の挿入があることを示すとき、上記コンテナに含まれるビデオストリームから上記視差情報を取得する
　請求項１４に記載の受信装置。
　上記取得された識別情報が上記視差情報の挿入がないことを示すとき、上記画像データ処理部は、装置内で算出された視差情報を用いる
　請求項１５に記載の受信装置。
　上記画像データ処理部は、
　上記グラフィクスの表示と共に字幕の表示が行われるとき、上記グラフィクスが上記字幕よりも手前に表示されるように上記グラフィクスに視差を付与する
　請求項１４に記載の受信装置。
　上記画像データ処理部は、
　上記グラフィクスの表示位置に対応した所定数の分割領域の視差情報から選択された視差情報を使用して、該グラフィクスに視差を付与する
　請求項１４に記載の受信装置。
　上記情報取得部で取得された上記画像データの各ピクチャの分割領域毎の視差情報を、上記グラフィクスの画像への重畳に応じて更新する視差情報更新部と、
　上記更新された視差情報を上記画像データ処理部で得られた画像データが送信される外部機器に送信する視差情報送信部とをさらに備える
　請求項１４に記載の受信装置。
　ビデオストリームを含む所定フォーマットのコンテナを受信する画像データ受信ステップを備え、
　上記ビデオストリームは、立体画像を構成する左眼画像データおよび右眼画像データが符号化されて得られたものであり、
　上記ビデオストリームには、上記画像データのピクチャ毎に、ピクチャ表示画面の所定数の分割領域にそれぞれ対応して取得された左眼画像および右眼画像の一方に対する他方の視差情報が挿入されており、
　上記コンテナに含まれるビデオストリームから、上記左眼画像データおよび右眼画像データを取得すると共に、該画像データの各ピクチャの分割領域毎の視差情報を取得する情報取得ステップと、
　画像上にグラフィクスを表示するためのグラフィクスデータを発生するグラフィクスデータ発生ステップと、
　上記取得された上記画像データおよび上記視差情報と、上記発生されたグラフィクスデータを用い、左眼画像および右眼画像に重畳する上記グラフィクスに、ピクチャ毎に、該グラフィクスの表示位置に対応した視差を付与し、上記グラフィクスが重畳された左眼画像のデータおよび上記グラフィクスが重畳された右眼画像のデータを得る画像データ処理ステップとをさらに備える
　受信方法。