以下、図面を参照しながら本技術の実施の形態について説明する。なお、説明は以下の順序で行うものとする。
1.IP伝送方式によるデジタル放送の概要
2.コンポーネントレイヤ構造
(1)コンポーネントレイヤ構造の詳細
(2)コンポーネントレイヤ構造の具体例
3.シグナリング情報の構成
(1)シグナリング情報の詳細
(2)MPDによるコンポーネントレイヤ対応
(3)SPDとMPDの連携
(4)シンタックス
4.システム構成
5.各装置で実行される具体的な処理の流れ
6.コンピュータの構成
<1.IP伝送方式によるデジタル放送の概要>
(プロトコルスタック)
図1は、IP伝送方式のデジタル放送のプロトコルスタックを示す図である。
図1に示すように、最も下位の階層は、物理層(Physical Layer)とされ、サービス(チャンネル)のために割り当てられた放送波の周波数帯域がこれに対応する。物理層に隣接する上位の階層は、BBPストリーム(Base Band Packet Stream)を挟んでIP層とされる。BBPストリームは、IP伝送方式における各種のデータを格納したパケットを含むストリームである。
IP層は、TCP/IPのプロトコルスタックにおけるIP(Internet Protocol)に相当するものであり、IPアドレスによりIPパケットが特定される。IP層に隣接する上位階層はUDP層とされ、さらにその上位の階層は、RTP,FLUTE/ALSとされる。すなわち、IP伝送方式のデジタル放送においては、UDP(User Datagram Protocol)のポート番号が指定されたパケットが送信され、例えばRTP(Real-time Transport Protocol)セッションやFLUTE(File Delivery over Unidirectional Transport)セッションが確立されるようになされている。
FLUTE/ALSに隣接する上位階層は、fMP4(Fragmented MP4)とされ、さらに、RTP,fMP4に隣接する上位階層は、ビデオデータ(Video)、オーディオデータ(Audio)、字幕データ(Closed Caption)等とされる。すなわち、ビデオデータやオーディオデータを、ストリーム形式で伝送する場合には、RTPセッションが利用され、ビデオデータやオーディオデータを、ファイル形式で伝送する場合には、FLUTEセッションが利用される。
また、FLUTE/ALSの上位階層は、NRTコンテンツ(NRT Content),ESG,SCSとされ、NRTコンテンツ,ESG,SCSは、FLUTEセッションにより伝送される。NRTコンテンツは、NRT(Non-RealTime)放送で伝送されるコンテンツであって、受信機のストレージに一旦蓄積された後で再生が行われる。なお、NRTコンテンツは、コンテンツの一例であって、他のコンテンツのファイルがFLUTEセッションにより伝送されるようにしてもよい。ESG(Electronic Service Guide)は、電子サービスガイドである。
SCS(Service Channel Signaling)は、サービス単位のシグナリング情報であって、FLUTEセッションにより伝送される。例えば、SCSとしては、SPD(Service Parameter Description)、USD(User Service Description)、MPD(Media Presentation Description)、及び、SDP(Session Description Protocol)が伝送される。
LLS(Low Layer Signaling)は、低レイヤのシグナリング情報であって、BBPストリーム上で伝送される。例えば、LLSとしては、SCD(Service Configuration Description)、EAD(Emergency Alerting Description)、及び、RRD(Region Rating Description)などのサービス構成情報(Service Configuration Information)が伝送される。
(IP伝送方式におけるID体系)
図2は、IP伝送方式を用いたデジタル放送の放送波の信号と、IP伝送方式のID体系との関係を示す図である。
図2に示すように、所定の周波数帯域(6MHz)を有する放送波(放送ネットワーク(Network))には、ネットワークID(network_id)が割り当てられている。各放送波には、BBPストリームID(BBP_stream_id)により識別される、1又は複数のBBPストリームが含まれている。BBPストリームは、BBPヘッダとペイロードからなる複数のBBPパケットにより構成される。
各BBPストリームには、サービスID(service_id)により識別される1又は複数のサービス(Service)が含まれている。各サービスは、1又は複数のコンポーネント(Component)から構成されている。各コンポーネントは、例えば、ビデオデータやオーディオデータ、字幕データ等の番組を構成する情報である。
このように、IP伝送方式のID体系として、MPEG2-TS方式で用いられているネットワークID(network_id),トランスポートストリームID(transport_stream_id),サービスID(service_id)の組み合わせ(以下、「トリプレット(Triplet)」という。)に対応する構成を採用し、このトリプレットによって、放送ネットワーク内のBBPストリーム構成とサービス構成が示される。ただし、IP伝送方式のID体系においては、トランスポートストリームIDの代わりに、BBPストリームIDが用いられる。
このようなID体系を用いることで、現在広く普及しているMPEG2-TS方式との整合をとることができるため、例えば、MPEG2-TS方式からIP伝送方式への移行時のサイマルキャストに容易に対応することが可能となる。
(IP伝送方式の放送波の構成)
図3は、IP伝送方式のデジタル放送の放送波の構成を示す図である。
図3に示すように、所定の周波数帯域を有する放送波(図中の「Network」)には、複数のBBPストリームが伝送されている。また、各BBPストリームには、NTP(Network Time Protocol)、複数のサービスチャンネル(Service Channel)、電子サービスガイド(ESG Service)、及び、LLSが含まれる。ただし、NTP,サービスチャンネル,電子サービスガイドは、UDP/IPのプロトコルに従って伝送されるが、LLSは、BBPストリーム上で伝送される。また、NTPは、時刻情報であって、複数のサービスチャンネルで共通のものとなる。
各サービスチャンネルには、ビデオデータやオーディオデータ等のコンポーネント(Component)と、SPDやSDP等のSCSが含まれる。また、各サービスチャンネルには、共通のIPアドレスが付与されており、このIPアドレスを用いて、1又は複数のサービスチャンネルごとに、コンポーネントや制御信号(SCS)などをパッケージ化することができる。なお、図3において、ネットワーク(Network)、BBPストリーム(BBP Stream)、及び、コンポーネント(Component)は、図2に対応しているが、サービスチャンネル(Service Channel)は、図2のサービス(Service)に対応するものである。
<2.コンポーネントレイヤ構造>
(1)コンポーネントレイヤ構造の詳細
図4は、コンポーネントレイヤ構造を示す図である。
図4に示すように、ビデオ(Video)、オーディオ(Audio)、及び、字幕(Caption)の各コンポーネントは、セレクティブレイヤ(Selective Layer)、コンポジットレイヤ(Composite Layer)、及び、アダプティブレイヤ(Adaptive Layer)の3階層から構成される。この階層構造においては、アダプティブレイヤの上位階層として、コンポジットレイヤが配置され、コンポジットレイヤの上位階層として、セレクティブレイヤが配置されている。以下、各レイヤの詳細について順に説明する。
(アダプティブレイヤ)
まず、アダプティブレイヤについて説明する。図4に示すように、最も下位の階層となるアダプティブレイヤにおいて、異なる模様が付された円形の一方の記号は、放送波で送信されるコンポーネント(Broadcast Component)を表し、他方の記号は、ネットワークを介して配信されるコンポーネント(Broadband Component)を表している。これらのコンポーネントは、いわゆるアダプティブストリーミングとして配信されるものであって、ビットレートの異なるコンポーネントが複数用意されている。なお、図4の例では、放送のコンポーネントは、カテゴリごとに1つずつ用意されているが、複数用意するようにしてもよい。また、ここでは、ビデオやオーディオ、字幕などのコンポーネントの分類を、カテゴリ(Category)と称している。
アダプティブレイヤでは、図中の点線の弧上を左右に振れる直線が、スイッチとして機能することで、複数のコンポーネントの中から、1つのコンポーネントが選択される。すなわち、アダプティブレイヤは、各コンポーネントのカテゴリにおいて、受信機の適応的な判断に基づいて、複数のコンポーネントを動的に切り替えて、1つのコンポーネントとして機能させるための階層である。ただし、コンポーネントが1つのみである場合には、当該スイッチによる選択は行われずに、そのコンポーネントのみが常に選択されることになる。
また、アダプティブレイヤにおける適応選択対象の属性としては、コンポーネントの伝送経路やビットレートを指定することができる。例えば、伝送経路の属性値としては、放送又は通信が指定される。また、ビットレートとしては、例えば10Mbpsなどが指定される。さらに、例えば、画面解像度や物理層(PHY)のロバスト性に関する属性を指定するようにしてもよい。なお、上述した適応選択対象の属性は一例であって、他の属性を指定できるようにしてもよい。
このような属性を指定できることから、受信機では、一定期間(例えば10秒)ごとに、最適なコンポーネントが適応的に選択されて切り替えられ、アダプティブストリーミング配信が実現される。具体的には、コンポーネントの伝送経路が通信のみの場合には、通信経路の輻輳状況に応じて変化する受信機の受信バッファ(例えば、後述する図21の受信バッファ421)の占有状況に応じて、最適なビットレートのコンポーネントを選択することができる。
また、コンポーネントの伝送経路として通信のほかに、放送も含まれる場合には、放送のコンポーネントのビットレートに応じて、通信のコンポーネントとの選択を判断することができる。ここで、例えば、ネットワークを介して配信されるコンポーネントとして、1Mbps,2Mbps,5Mbps,10Mbps,20Mbpsのコンポーネントがそれぞれ用意され、放送波で送信されるコンポーネントとして、8Mbpsのコンポーネントのみが用意されている場合の運用を想定する。
この場合、受信機は、10Mbps又は20Mbpsの通信のコンポーネントを受信できるのであれば、放送のコンポーネントのビットレートよりも高ビットレートなるので、それらの通信のコンポーネントを優先して受信するようにする。また、輻輳によって、10Mbpsと20Mbpsの通信のコンポーネントを受信することができずに、5Mbpsの通信のコンポーネントを受信できるのであれば、通信のコンポーネントの代わりに、安定的に受信可能な8Mbpsの放送のコンポーネントを選択するようにする、といった運用が可能となる。なお、放送のコンポーネントが複数用意されている場合には、例えば、放送信号のC/N(Carrier/Noise)の変化を測定して、その測定結果に応じて、適応的に放送のコンポーネントを切り替えるようにすればよい。
(コンポジットレイヤ)
次に、コンポジットレイヤについて説明する。図4に示すように、アダプティブレイヤの上位階層となるコンポジットレイヤでは、アダプティブレイヤにより適応的に選択された複数のコンポーネントが1つのコンポーネントに合成される。すなわち、コンポジットレイヤは、各コンポーネントのカテゴリにおいて、合成対象のコンポーネントグループ(以下、「コンポジットコンポーネントグループ」という)内の複数のコンポーネントを組み合わせて1つのコンポーネント(合成コンポーネント)として機能させるための階層である。ただし、合成対象のコンポーネントグループが1つのコンポーネントのみとなる場合には、合成動作は不要となる。
また、コンポジットレイヤにおける合成対象の属性としては、スケーラブルや3D(3次元映像)、タイル、レイヤ、ミキシングなどを指定することができる。これらの属性は、組み合わせのタイプを示すものであって、それらの組み合わせにおける要素を示す属性値を指定することができる。
「スケーラブル」は、合成対象のコンポーネントが、スケーラブル符号化が施されたコンポーネントであることを示す属性である。このスケーラブル属性の属性値としては、"Base"、又は、"Extended"が指定される。
例えば、4K解像度の映像を提供する場合に、スケーラブル属性の属性値として"Base"が指定された2K解像度の映像に相当する符号化信号(ビデオコンポーネント)を放送波で送信するとともに、4K解像度と2K解像度の差分に相当する映像符号化信号(ビデオコンポーネント)に、スケーラブル属性の属性値として"Extended"を指定して、ネットワークを介して配信するようにする。これにより、4K解像度に対応した受信機は、放送で伝送される基本ストリーム(Base Stream)と、通信で伝送される拡張ストリーム(Extended Stream)を合成して、4K解像度の映像を表示させることができる。一方、4K解像度に対応していない受信機は、放送で伝送される基本ストリームのみを用い、2K解像度の映像を表示させることになる。
「3D」は、合成対象のコンポーネントが、3D用のコンポーネントであることを示す属性である。この3D属性の属性値としては、"Right"、又は、"Left"が指定される。例えば、3D属性の属性値として"Right"が指定された右目用の映像信号(ビデオコンポーネント)を放送波で送信するとともに、3D属性の属性値として"Left"が指定された左目用の映像信号(ビデオコンポーネント)を、ネットワークを介して配信するようにする。これにより、3Dに対応した受信機は、右目用の映像信号と左目用の映像信号を合成して、3Dの映像を表示させることができる。
「タイル」は、合成対象のコンポーネントが、タイリング用のコンポーネントであることを示す属性である。このタイル属性の属性値としては、例えば、"TileA1","TileA2",・・・や、"TileB1","TileB2",・・・、"TileC1","TileC2",・・・が指定される。
例えば、"TileA1","TileA2",・・・において、"TileA"は、タイリングのタイプが、タイプAであることを示す。タイプAのタイリングが2枚のタイル用の映像を、左右に並べて表示する方式である場合、タイル属性の属性値として"TileA1"が指定された左側に配置されるタイル用の映像信号(ビデオコンポーネント)を放送波で送信するとともに、タイル属性の属性値として"TileA2"が指定された右側に配置されるタイル用の映像信号(ビデオコンポーネント)を、ネットワークを介して配信するようにする。これにより、タイリング表示に対応した受信機は、左側のタイル用の映像信号と右側のタイル用の映像信号を合成して、タイプAのタイリングに対応する映像を表示させることができる。
同様に、例えば、タイプBのタイリングが、4枚のタイル用の映像を2×2に並べて配置して表示する方式である場合、それらの4枚のタイル用の映像信号(ビデオコンポーネント)が、放送又は通信により伝送されるので、受信機では、それらのタイル用の映像を合成して、タイプBのタイリングに対応する2×2の映像を表示させることができる。また、例えば、タイプCのタイリングが、複数のタイル用の映像をパノラマ映像(例えば360度)として配置して表示する方式である場合、複数のタイル用の映像信号(ビデオコンポーネント)が、放送又は通信により伝送されるので、受信機では、それらのタイル用の映像信号を合成して、タイプCのタイリングに対応するパノラマ映像を表示させることができる。なお、上述したタイプA乃至Cのタイリング方式は一例であって、他のタイリング方式を採用することができる。
「レイヤ」は、合成対象のコンポーネントが、階層状に表示されるコンポーネントのレイヤであることを示す属性である。このレイヤ属性の属性値としては、例えば重ね合わせの奥から順に、"Layer1","Layer2",・・・が指定される。例えば、レイヤ属性の属性値として"Layer1"が指定された第1層目のレイヤの映像信号(ビデオコンポーネント)を放送波で送信するとともに、レイヤ属性の属性値として"Layer2"が指定された第2層目のレイヤの映像信号(ビデオコンポーネント)を、ネットワークを介して配信するようにする。これにより、レイヤ表示に対応した受信機では、第1層目の映像信号と第2層目の映像信号を合成して、第1層目の映像に、第2層目の映像が重ね合わされた映像を表示させることができる。
「ミキシング」は、合成対象のコンポーネントが、ミキシングされるコンポーネントであることを示す属性である。例えば、このミキシング属性としては、"Track1","Track2",・・・が指定される。例えば、ミキシング属性の属性値として"Track1"が指定された音声トラック(オーディオコンポーネント)を放送波で送信するとともに、ミキシング属性の属性値として"Track2"が指定された音声トラック(オーディオコンポーネント)を、ネットワークを介して配信するようにする。これにより、ミキシングに対応した受信機では、音声トラック1と音声トラック2をミキシング(例えば、ボリューム相対位置やパン位置を調整)して、それにより得られた音声を出力することができる。
なお、上述したコンポジットレイヤにおける合成対象の属性やその属性値は一例であって、他の属性や他の属性値を指定できるようにしてもよい。
(セレクティブレイヤ)
最後に、セレクティブレイヤについて説明する。図4に示すように、コンポジットレイヤの上位階層であって、最も上位の階層となるセレクティブレイヤでは、図中の点線の弧上を左右に振れる直線が、スイッチとして機能することで、複数のコンポーネントの中から、1つのコンポーネントが選択される。すなわち、セレクティブレイヤは、各コンポーネントのカテゴリにおいて、固定選択対象のコンポーネントグループ(以下、「セレクティブコンポーネントグループ」という)の中から、所定の選択方法に応じて、1又は複数のコンポーネントを静的に選択するための階層である。この選択方法としては、ユーザによる選択のほか、例えば、受信機の性能やユーザの嗜好情報などに応じて受信機によって自動で選択されるようにすることができる。
また、セレクティブレイヤにおける固定選択対象の属性としては、ビュータグ、言語、受信機処理要求能力、ビュータイトル、目的などを指定することができる。
具体的には、「ビュータグ」は、1つのビューを構成する異なるコンポーネントのカテゴリを組み合わせるためのタグである。例えば、ビュータグとして、"1"が指定された場合には、図中の「1」であるIDが付与されたビデオ、オーディオ、及び、字幕のコンポーネントが、カテゴリを横断して選択されることになる。同様に、ビュータグとして、"2"が指定された場合、図中の「2」であるIDが付与されたコンポーネントが、カテゴリを横断して選択されることになる。なお、ビュータグが付与されていないコンポーネントは、カテゴリごとに独立していることになる。
「言語」には、例えば言語コードが指定される。例えば、言語コードに応じたGUI(Graphical User Interface)画面を提示することで、ユーザにより所望の言語が選択されることになる。「受信機処理要求能力」には、受信機で必要とされる処理要求能力が指定される。この要求能力は、レベル値などにより指定するようにしてもよいし、コーデックやレゾリューションなどを多次元で指定してもよい。例えば、処理要求能力をレベル値で指定する場合に、そのレベル値としてレベル2が指定されたときには、レベル2以上の処理能力を有する受信機のみが対応可能となる。
「ビュータイトル」には、ビュー画面選択用のタイトルが指定される。例えば、このビュータイトルをテキストで表示することで、ユーザにより所望のビュー画面が選択されることになる。「目的」には、例えば、本編用の音声に対する、ナレーション用の音声などのコンポーネントの目的に関する情報が指定される。
なお、上述したセレクティブレイヤにおける固定選択対象の属性は一例であって、他の属性を指定できるようにしてもよい。また、固定選択対象の属性は1つに限らず、複数の属性を組み合わせて利用するようにしてもよい。
このような固定選択対象の属性を指定できることから、例えば、受信機では、実行中のアプリケーションが、固定選択対象の属性に基づいて、コンポーネントを選択することができる。ただし、セレクティブコンポーネントグループが1つだけの場合には、選択する必要はなく、当該セレクティブコンポーネントグループが選択されることになる。また、ビュータグによって、ビデオ、オーディオ、字幕など、異なるカテゴリのコンポーネントの組み合わせでグルーピングされている場合には、グループ単位で、コンポーネントが選択されることになる。
また、受信機において、複数のコンポーネントが選択された場合に、その選択対象がビデオと字幕のコンポーネントであるときには、映像用と字幕用の複数の画面が表示されることになる。また、複数のコンポーネントが選択された場合に、その選択対象がオーディオコンポーネントのみであるときには、複数の音声がミキシング(Mixing)されてから、出力されることになる。
なお、図4のコンポーネントレイヤ構造の例では、各コンポーネントのカテゴリごとに、セレクティブレイヤが1つ存在する場合を示しているが、各コンポーネントのカテゴリごとに、セレクティブレイヤが複数存在するようにしてもよい。また、図4のコンポーネントレイヤ構造では、コンポーネントとして、ビデオ、オーディオ、字幕のコンポーネントについて説明したが、サービスを構成する他のコンポーネントについても同様のレイヤ構成を採用することができる。
(コンポーネントレイヤ構造のダイアグラム)
図5は、コンポーネントレイヤ構造のダイアグラムを示す図である。
図5においては、レベル3のレイヤであるピックワンコンポーネント(PickOneComponent)が、図4のアダプティブレイヤに相当するものであって、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択することになる。なお、図5のエレメンタリコンポーネント(Elementary Component)は、ビデオやオーディオ、字幕等のコンポーネントそのものを表している。
レベル2のレイヤであるコンポジットコンポーネント(Composite Component)は、図4のコンポジットレイヤに相当するものであって、レベル3のピックワンコンポーネントで選択されたn個(nは0以上の整数)のコンポーネント、及び、n個(nは0以上の整数)のエレメンタリコンポーネントを合成することになる。
レベル1のレイヤであるピックワンコンポーネント(PickOneComponent)は、図4のセレクティブレイヤに相当するものであって、レベル2のコンポジットコンポーネントで合成されたn個(nは0以上の整数)のコンポーネント、レベル3のピックワンコンポーネントで選択されたn個(nは0以上の整数)のコンポーネント、又は、n個(nは0以上の整数)のエレメンタリコンポーネントの中から1つのコンポーネントを選択することになる。
このように、図4のコンポーネントレイヤ構造は、図5に示すようなダイアグラムで表すことができる。
(シグナリング情報の構成例)
図6は、図4及び図5に示したコンポーネントレイヤ構造を実現するためのシグナリング情報(制御信号)の構成例を示す図である。なお、図6において、要素と属性のうち、属性には「@」が付されている。また、インデントされた要素と属性は、その上位の要素に対して指定されたものとなる。
図6に示すように、topAttribute属性は、最終選択のための属性であって、m0種類(m0は1以上の整数)で定義される。例えば、topAttribute属性として、選択数と選択判断を定義することができる。選択数には、全体で選択可能なコンポーネントの数が指定される。また、選択判断には、ユーザによる選択や受信機による自動選択などが指定される。
SelectiveComponentGroup要素は、固定選択対象のコンポーネントグループであるセレクティブコンポーネントグループに関する情報が指定される。SelectiveComponentGroup要素は、selectiveAttribute属性及びCompositeComponentGroup要素の上位の要素となる。ただし、SelectiveComponentGroup要素の出現数は、n1(n1は1以上の整数)となる。
selectiveAttribute属性は、SelectiveComponentGroup要素に関して規定される属性を示し、固定選択対象の属性がm1種類(m1は0以上の整数)規定される。例えば、selectiveAttribute属性には、上述したセレクティブレイヤにおける固定選択対象の属性として、ビュータグ、言語、受信機処理要求能力、ビュータイトル、目的などの個別の属性が規定される。
CompositeComponentGroup要素は、合成対象のコンポーネントグループであるコンポジットコンポーネントグループに関する情報が指定される。CompositeComponentGroup要素は、compositeAttribute属性及びAdaptiveComponent要素の上位の要素となる。ただし、CompositeComponentGroup要素の出現数は、n2(n2は1以上の整数)となる。
compositeAttribute属性は、CompositeComponentGroup要素に関して規定される属性を示し、合成対象の属性がm2種類(m2は0以上の整数)規定される。例えば、compositeAttribute属性には、上述したコンポジットレイヤにおける合成対象の属性として、スケーラブル、3D、タイル、レイヤ、ミキシングなどの個別の属性が規定される。また、これらの属性は、組み合わせのタイプを示すものであって、それらの組み合わせにおける要素を示す属性値を指定することができる。
AdaptiveComponent要素は、適応選択対象のコンポーネントに関する情報が指定される。AdaptiveComponent要素は、adaptiveAttribute属性及びcomponentId属性の上位の要素となる。ただし、AdaptiveComponent要素の出現数は、n3(n3は1以上の整数)となる。
adaptiveAttribute属性は、AdaptiveComponent要素に関して規定される属性を示し、適応選択対象の属性がm3種類(m3は0以上の整数)規定される。例えば、adaptiveAttribute属性には、上述したアダプティブレイヤにおける適応選択対象の属性として、コンポーネントの伝送経路やビットレートなどが個別に規定される。componentId属性は、コンポーネントのIDが指定される。
なお、図6を参照して説明した、図4及び図5に示したコンポーネントレイヤ構造を実現するためのシグナリング情報のデータ構成は一例であって、他のデータ構成を採用することもできる。また、このシグナリング情報は、例えば、XML(Extensible Markup Language)等のマークアップ言語により記述される。
(2)コンポーネントレイヤ構造の具体例
次に、図7乃至図9を参照して、上述したコンポーネントレイヤ構造の具体例について説明する。
図7のコンポーネントレイヤの具体例では、ビデオのコンポジットレイヤ(Composite Layer)における合成対象の属性として、スケーラブルが指定されており、その下位階層のアダプティブレイヤ(Adaptive Layer)において、基本ストリームが放送で伝送され(図中の「Scalable Base」)、拡張ストリームが通信で伝送されている(図中の「Scalable Extended」)。ここでは、基本ストリームとして、適応選択対象の放送のビデオコンポーネントが1つだけ用意されているため、その1つの放送のビデオコンポーネントが常に選択される。一方、拡張ストリームとして、適応選択対象の通信のビデオコンポーネントが複数用意されているため、それらの複数の通信のビデオコンポーネントの中から、最適なビデオコンポーネントが適応的に選択されることになる(図中の「Adaptive switching」)。
ビデオのコンポジットレイヤでは、4K解像度の映像を提供するために、放送で伝送される2K解像度の映像号化信号(ビデオコンポーネント)と、通信で伝送される4K解像度と2K解像度の差分に相当する映像号化信号(ビデオコンポーネント)が合成されることになる。そして、セレクティブレイヤ(Selective Layer)において、例えば、その固定選択対象の属性として受信機処理要求能力が指定されている場合に、受信機が4K解像度に対応している場合には、その合成された4K解像度の映像を表示させることができる(図中の「4K Capable Main View」)。一方、受信機が4K解像度に対応していない場合には、放送で伝送される基本ストリームのみを用い、2K解像度の映像を表示させることになる(図中の「4K Disable Main View」)。すなわち、この場合、通信のビデオコンポーネントは用いられないため、ビデオコンポーネントの適応的な選択は行われないことになる(図中の「Non switching」)。
ここで、図8に示すように、メインビュー(Main View)とは、ディスプレイの画面における、主の表示領域を意味する。上記の4K解像度又は2K解像度の映像は、このメインビューに表示される。また、図8の画面例には、主の表示領域に対する補助的な表示領域となるサブビュー(Sub View)を表示させることができる。図7のコンポーネントレイヤの例では、セレクティブレイヤにおいて、セレクティブコンポーネントグループとして、サブビュー1(図中の「Sub View1」)と、サブビュー2(図中の「Sub View2」)が選択可能となっている。
サブビュー1では、アダプティブレイヤにおいて、通信のビデオコンポーネントが1つだけ用意されているため、適応的な選択は行われずに、その1つの通信のビデオコンポーネントが常に選択されることになる(図中の「Non switching」)。また、サブビュー2では、アダプティブレイヤにおいて、適応選択対象の通信のビデオコンポーネントが複数用意されており、複数の通信のビデオコンポーネントから適応的に、逐次最適な通信のビデオコンポーネントが選択されることになる(図中の「Adaptive switching」)。なお、図8の画面例では、メインビューとともに、サブビュー1とサブビュー2が同時に表示されているが、図9の画面例に示すように、メインビュー、サブビュー1、及び、サブビュー2のうち、どのビューを表示させるかについては、GUI画面などにより、ユーザに選択させることができる。
オーディオのコンポジットレイヤ(Composite Layer)では、その合成対象の属性として、スケーラブルが指定されており、その下位階層のアダプティブレイヤ(Adaptive Layer)において、ステレオのストリームが放送又は通信で伝送され(図中の「Stereo」)、マルチチャンネルのストリームが通信で伝送されている(図中の「Multi-channel Dev」)。
ここでは、ステレオのストリームとして、適応選択対象のオーディオコンポーネントが複数用意されているため、それらの複数の放送又は通信のオーディオコンポーネントの中から最適なオーディオコンポーネントが適応的に選択されることになる(図中の「Adaptive switching」)。すなわち、放送のオーディオコンポーネントとして、通常のロバスト性(図中の「Normal Robustness」)と、高いロバスト性(図中の「High Robustness」)を有するオーディオコンポーネントをそれぞれ用意し、それらを適応的に選択できるようにすることで、例えば、高いロバスト性を有するオーディオコンポーネントが選択された場合に、何らかの原因で、受信機に映像を表示できないときでも、音声のみを出力する、といった運用が可能となる。また、放送のオーディオコンポーネントを受信できない場合には、通信のオーディオコンポーネントを選択するようにすればよい。
一方、マルチチャンネルのストリームとして、適応選択対象のオーディオコンポーネントが1つだけ用意されているため、その1つの通信のオーディオコンポーネントが常に選択される。
オーディオのコンポジットレイヤでは、放送で伝送されるステレオのオーディオコンポーネントと、通信で伝送されるマルチチャンネルのオーディオコンポーネントが合成され、22.2chのマルチチャンネルの合成コンポーネントが生成される。そして、セレクティブレイヤ(Selective Layer)において、例えば、その固定選択対象の属性として受信機処理要求能力が指定されている場合に、受信機が22.2chのマルチチャンネルに対応している場合には、その合成された22.2chのマルチチャンネルの音声を出力させることができる(図中の「22.2ch Capable Main View」)。一方、受信機が22.2chのマルチチャンネルに対応していない場合には、放送又は通信で伝送されるステレオのストリームのみを用い、ステレオの音声を出力させることになる(図中の「22.2ch Disable Main View」)。
ここで、これらのオーディオのセレクティブレイヤの固定選択対象の属性として、ビュータグ1が付与されているので、同様にビュータグ1が付与されているビデオのセレクティブレイヤのビデオコンポーネントに連動することになる。つまり、これらのオーディオコンポーネントに対応する音声は、図8の画面例のメインビューに表示される映像に対して出力されることになる。
また、セレクティブレイヤの固定選択対象の属性として、ビュータグ2が付与されているオーディオコンポーネントは、同様にビュータグ2が付与されているビデオのセレクティブレイヤのビデオコンポーネントに連動することになる(図中の「Sub View1」)。つまり、このオーディオコンポーネントに対応する音声は、図8の画面例のサブビュー1に表示される映像に対して出力されることになる。
さらに、ビュータグ3が付与されているオーディオコンポーネントは、同様にビュータグ3が付与されているビデオコンポーネントに連動することになる(図中の「Sub View2」)。なお、オーディオのサブビュー1とサブビュー2では、アダプティブレイヤにおいて、通信のオーディオコンポーネントが1つだけ用意されているため、適応的な選択は行われずに、その1つの通信のオーディオコンポーネントが常に選択されることになる。
また、図7に示すように、字幕のコンポジットレイヤ(Composite Layer)では、字幕コンポーネントの合成は行われず、さらに、アダプティブレイヤ(Adaptive Layer)では、字幕コンポーネントの適応的な選択が行われないため、セレクティブレイヤ(Selective Layer)における字幕コンポーネントと、アダプティブレイヤにおける字幕コンポーネントが1対1で対応している。なお、字幕コンポーネントのうち、図中の最も左側の1つの字幕コンポーネントのみが放送で伝送され、それ以外の字幕コンポーネントは、通信により伝送されている。
セレクティブレイヤの固定選択対象の属性として、ビュータグ1が付与されている字幕コンポーネントは、同様にビュータグ1が付与されているビデオとオーディオのコンポーネントに連動することになる。具体的には、この例の場合、英語とスペイン語の字幕が提供されるが、それらの字幕には、本編の字幕(図中の「Eng(Nor)」,「Spa(Nor)」)のほか、より詳細な解説的な字幕(図中の「Eng(Ex)」,「Spa(Ex)」)が用意されている。字幕のセレクティブレイヤにおいて、例えば、その固定選択対象の属性として、ユーザ選択により言語が指定されている場合、その言語コード等に応じた字幕を表示させることができる。すなわち、ユーザにより選択された英語やスペイン語などの字幕が、図8の画面例のメインビューに表示される映像に重畳して表示されることになる。
また、セレクティブレイヤの固定選択対象の属性として、ビュータグ2が付与されている字幕コンポーネントは、同様にビュータグ2が付与されているビデオとオーディオのコンポーネントに連動することになる。具体的には、英語の字幕(図中の「Eng」)と、スペイン語の字幕(図中の「Spa」)が用意されているので、図8の画面例のサブビュー1に表示される映像に、ユーザ選択に応じた字幕を重畳して表示させることができる。
さらに、セレクティブレイヤの固定選択対象の属性として、ビュータグ3が付与されている字幕コンポーネントは、同様にビュータグ3が付与されているビデオとオーディオのコンポーネントに連動することになる。具体的には、英語の字幕(図中の「Eng」)と、スペイン語の字幕(図中の「Spa」)が用意されているので、ユーザ選択に応じた字幕を映像に重畳して表示させることができる。
<3.シグナリング情報の構成>
(1)シグナリング情報の詳細
図10は、シグナリング情報の詳細を示す図である。
上述したように、LLSとしては、例えば、SCD(Service Configuration Description)、EAD(Emergency Alerting Description)、及び、RRD(Region Rating Description)が伝送される。
SCDは、MPEG2-TS方式で用いられているトリプレットに相当するID体系を採用し、このトリプレットによって、放送ネットワーク内のBBPストリーム構成とサービス構成が示される。また、SCDには、サービス単位の属性・設定情報としてのIPアドレス等の情報、ESGにアクセスするためのESG bootstrap情報、SCSにアクセスするためのSC bootstrap情報が含まれる。EADは、緊急告知に関する情報を含んでいる。RRDは、レーティング情報を含んでいる。なお、SCD、EAD、及び、RRDは、例えば、XML(Extensible Markup Language)等のマークアップ言語により記述される。
SCSとしては、例えば、SPD(Service Parameter Description)、USD(User Service Description)、MPD(Media Presentation Description)、及び、SDP(Session Description Protocol)が伝送される。
SPDは、サービスとコンポーネントのレベルで規定された各種のパラメータを含んで構成される。USDは、MPDやSDPを参照するための情報などを含んでいる。MPDは、コンポーネントのアダプティブストリーミング配信を管理するための情報であって、サービス単位で伝送されるコンポーネントごとのセグメントURL(Uniform Resource Locator)等の情報を含んでいる。
SDPは、サービス単位のサービス属性、コンポーネントの構成情報、コンポーネント属性、コンポーネントのフィルタ情報、コンポーネントのロケーション情報などを含んでいる。USD、MPD、及び、SDPを用いることで、例えば、RTPセッションやFLUTEセッションで伝送されるコンポーネントを取得することができる。なお、SPD、USD、MPD、及び、SDPは、例えば、XML等のマークアップ言語により記述される。
ESGは、例えば番組タイトルや開始時刻などの情報を含む電子サービスガイドである。ESGは、SCDのESG bootstrap情報を用い、取得することができる。アプリケーション(Application)は、HTML(Hyper Text Markup Language)形式のファイル等から構成され、例えばインターネット上のサーバから配信される。アプリケーションは、特定のサービスとして提供される、テレビ番組等の放送コンテンツに連動して実行される。ESGとアプリケーションは、USDと関連付けることができる。
(2)MPDによるコンポーネントレイヤ対応
図11は、MPDによるコンポーネントレイヤ対応を示す図である。
MPDは、Period要素、AdaptationSet要素、Representation要素、及び、SubRepresentation要素が階層構造で記述されている。Period要素は、テレビ番組等のコンテンツの構成を記述する単位となる。また、AdaptationSet要素、Representation要素、又は、SubRepresentation要素は、ビデオやオーディオ、字幕等のそれぞれのストリームごとに利用され、それぞれのストリームの属性を記述できるようになっている。
具体的には、AdaptationSet要素は、各種のソースからエンコードされたストリームを表している。そして、当該ストリームを、例えばビットレート等のパラメトリックに応じて、受信機側で選択させるために、AdaptationSet要素内に、Representation要素を配置して、例えばビットレート等のパラメータが異なる複数の選択肢となるストリームを列挙している。通常、AdaptationSet要素やRepresentation要素は、ビデオやオーディオ、字幕のストリームなど、単一のストリームに対応させている。
ここで、図11のレベル3のレイヤの機能は、ピックワンコンポーネント(PickOneComponent)を、MPDのAdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素又はSubRepresentation要素を、エレメンタリコンポーネント(Elementary Component)にマッピングすることで実現することができる。
また、図11のレベル2のレイヤの機能は、MPDのAdaptationSet要素の間の関係、Representation要素の間の関係、又は、SubRepresentation要素の間の関係を定義する依存関係記述属性にマッピングすることで実現することができる。この依存関係記述属性としては、MPDで規定されているAdaptationSet要素の下位要素となるEssentialProperty要素やSupplementalProperty要素を利用して、新たな要素を定義して、AdaptationSet属性群をグルーピングできるようにする。
さらに、図11のレベル1のレイヤの機能は、MPDのAdaptationSet要素のgroup属性にマッピングすることで実現することができる。AdaptationSet要素のgroup属性は、AdaptationSet要素をグルーピングするためのもので、同一の属性値を持つAdaptationSet要素は、同一のグループに属することになる。そして、同一のグループ内の複数のAdaptationSet要素の中から、1つのAdaptationSet要素が選択されることになる。
(具体的な運用例)
図12は、MPDによるコンポーネントレイヤ対応の具体的な運用例を示す図である。
図12においては、当該運用例を実現するためのMPDの記述内容が示されており、「AS」と「R」は、AdaptationSet要素とRepresentation要素をそれぞれ表している。また、AdaptationSet要素には、「@id」で示したid属性と、「@gid」で示したgroup属性が記述されている。さらにまた、「@schemeIdUri」は、EssentialProperty要素のschemeIdUri属性を表している。
図12のMPDにおいては、ビデオのグループ1に属する4つのAdaptationSet要素(id='11','12','13','14')と、オーディオのグループ2に属する4つのAdaptationSet要素(id='21','22','23','24')が記述され、それらのAdaptationSet要素の配下にそれぞれ、1又は複数のRepresentation要素が記述されている。
ビデオのグループ1において、各Representation要素には、ビデオコンポーネントとして、「base」、「ext」、「SV1」、及び、「SV2」が列挙されている。ここで、「base」は、単独で再生可能な基本の映像信号に相当するビデオコンポーネントを表し、「ext」は、拡張用の映像信号に相当するビデオコンポーネントを表している。また、「SV1」と「SV2」において、「SV」は、主の表示領域であるメインビューに対する補助的な領域となるサブビューを表している。
id='11'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、単独で再生可能な基本の映像信号に相当する1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該ビデオコンポーネントは、メインビュー用とされている。
id='12'のAdaptationSet要素には、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:SVC」が指定されている。ここで、図12の運用例においては、EssentialProperty要素のschemeIdUri属性の属性値として、「urn:..:SVC」が定義されており、この属性値を持っているEssentialProperty要素を有するAdaptationSet属性は、その配下のRepresentation要素群が互いに、Base-Enhance関係の依存関係を有することを意味するように定義されている。
したがって、id='12'のAdaptationSet要素の配下の4つのRepresentation要素は、Base-Enhance関係の依存関係を有していることになる。すなわち、id='12'のAdaptationSet要素の配下には、4つのRepresentation要素が記述され、基本の映像信号に相当するビデオコンポーネントが1つ列挙されているほか、拡張用の映像信号に相当するビデオコンポーネントが3つ列挙されており、Base-Enhance関係の依存関係を有している。これにより、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、基本の映像信号と拡張用の映像信号に相当するビデオコンポーネントが選択されることになる。なお、当該ビデオコンポーネントは、メインビュー用とされている。
このように、MPDにおいて、EssentialProperty要素を、AdaptationSet属性の配下のRepresentation要素に列挙されるコンポーネント群の特徴を表現するために用いている。
id='13'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのビデオコンポーネントが常に選択されることになる。このようにして選択されるビデオコンポーネントは、エレメンタリコンポーネントに相当している。
id='14'のAdaptationSet要素の配下には、3つのRepresentation要素が記述され、サブビュー2用のビデオコンポーネントが3つ列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えば、ネットワーク環境条件などに応じて、適応的に1つのビデオコンポーネントが選択されることになる。
このように、ピックワンコンポーネントを、AdaptationSet要素にマッピングし、さらに、AdaptationSet要素内に列挙されるRepresentation要素を、エレメンタリコンポーネントにマッピングすることで、図11のコンポーネントレイヤ構造におけるレベル3のレイヤの機能が実現され、ビデオコンポーネントの選択が行われる。
ここで、図12のMPDにおいては、id='11'のAdaptationSet要素、id='12'のAdaptationSet要素、id='13'のAdaptationSet要素、及び、id='14'のAdaptationSet要素には、group属性として、group='1'が指定されており、それらのAdaptationSet要素は、同一のグループ1に属していることになる。
このように、group属性によって、グルーピングを行うことで、図11のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のビデオコンポーネントの中から1つのビデオコンポーネントが選択されることになる。ここでは、グループ1に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたビデオコンポーネントとエレメンタリコンポーネントの中から、1つのビデオコンポーネントが選択される。
一方、オーディオのグループ2において、各Representation要素には、オーディオコンポーネントとして、「NrRbst」、「HiRbst」、「MCD」、「SV1」、及び、「SV2」が列挙されている。「NrRbst」は、通常のロバスト性を有するオーディオコンポーネントを意味する。また、「HiRbst」は、高いロバスト性を有するオーディオコンポーネントを意味する。「MCD」は、マルチチャンネルのオーディオコンポーネントを表している。さらに、「SV1」と「SV2」において、「SV」は、サブビュー用のオーディオコンポーネントを表している。
id='21'のAdaptationSet要素の配下には、2つのRepresentation要素が記述され、通常のロバスト性を有するオーディオコンポーネントと、高いロバスト性を有するオーディオコンポーネントが列挙されており、レベル3(ピックワンコンポーネント)のレイヤにおいて、例えばネットワーク環境条件などに応じて、適応的に一方のオーディオコンポーネントが選択されることになる。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='22'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、マルチチャンネルの1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるオーディオコンポーネントは、エレメンタリコンポーネントに相当している。なお、当該オーディオコンポーネントは、メインビュー用とされている。
id='23'のAdaptationSet要素の配下には、1つのRepresentation要素のみが記述され、サブビュー1用の1つのオーディオコンポーネントが常に選択されることになる。同様にid='24'のAdaptationSet要素の配下には、サブビュー2用の1つのオーディオコンポーネントが常に選択されることになる。このようにして選択されるサブビュー用のオーディオコンポーネントは、エレメンタリコンポーネントに相当している。
ここで、図12のMPDにおいては、id='21'のAdaptationSet要素、id='22'のAdaptationSet要素、id='23'のAdaptationSet要素、及び、id='24'のAdaptationSet要素には、group属性として、group='2'が指定されており、それらのAdaptationSet要素は、同一のグループ2に属していることになる。
このように、group属性によって、グルーピングを行うことで、図11のコンポーネントレイヤ構造におけるレベル1のレイヤの機能が実現され、当該レベル1(ピックワンコンポーネント)のレイヤにおいて、同一のグループ内のオーディオコンポーネントの中から1つのオーディオコンポーネントが選択されることになる。ここでは、グループ2に属している、レベル3(ピックワンコンポーネント)のレイヤで選択されたオーディオコンポーネントとエレメンタリコンポーネントの中から、1つのオーディオコンポーネントが選択される。
また、図12のMPDにおいては、Subset要素が、コンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いられている。
具体的には、1つ目のSubset要素のcontains属性には'11 21'が指定されており、id='11'のAdaptationSet要素と、id='21'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
2つ目のSubset要素のcontains属性には'11 22'が指定されており、id='11'のAdaptationSet要素と、id='22'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
3つ目のSubset要素のcontains属性には'11 12 21'が指定されており、id='11'のAdaptationSet要素と、id='12'のAdaptationSet要素と、id='21'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」又は「V-base」と「V-ext」)と、オーディオコンポーネント(「A-NrRbst」又は「A-HiRbst」)は、同時に再生されるメインビュー用のコンポーネントとなる。
4つ目のSubset要素のcontains属性には'11 12 22'が指定されており、id='11'のAdaptationSet要素と、id='12'のAdaptationSet要素と、id='22'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-base」又は「V-base」と「V-ext」)と、オーディオコンポーネント(「A-MCD」)は、同時に再生されるメインビュー用のコンポーネントとなる。
5つ目のSubset要素のcontains属性には'13 23'が指定されており、id='13'のAdaptationSet要素と、id='23'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV1」)と、オーディオコンポーネント(「A-SV1」)は、同時に再生されるサブビュー1用のコンポーネントとなる。
6つ目のSubset要素のcontains属性には'14 24'が指定されており、id='14'のAdaptationSet要素と、id='24'のAdaptationSet要素は、同時に提示されるAdaptationSet要素の組であることを示している。すなわち、ビデオコンポーネント(「V-SV2」)と、オーディオコンポーネント(「A-SV2」)は、同時に再生されるサブビュー2用のコンポーネントとなる。
このように、Subset要素を、図11のコンポーネントレイヤ構造に関する規定の枠外で、ビデオやオーディオなどの複数のコンポーネントの同時提示のためのグルーピングを定義するために用いることで、例えば、ビデオとオーディオの間で、メインビュー用、サブビュー1用、又は、サブビュー2用などの関連付けを行うことができる。また、例えば、ビデオとオーディオのコンポーネントのうち、一方のコンポーネントが特定されれば、他方のコンポーネントも特定されることになる。
以上、具体的な運用例について説明した。
(3)SPDとMPDの連携
図13は、SPDとMPDの連携方法を示す図である。
図13に示すように、SPDにおいては、コンポーネント(Component)、コンポーネントグループ(Component Group)、コンポーネントカテゴリ(Component Category)、及び、サービス(Service)が階層構造をなしている。また、MPDにおいては、リプレゼンテーション(Representation要素)、アダプテーションセット(AdaptationSet要素)、及び、グループ(group)が階層構造をなしている。ただし、上述したように、MPDのグループは、AdaptationSet要素のgroup属性に相当するものである。
このような階層構造において、SPDのコンポーネント(Component)と、MPDのRepresentation要素とが、リプレゼンテーションID(RepresentationId)によりマッピングされるようにする。さらに、SPDのコンポーネントグループ(Component Group)と、MPDのAdaptationSet要素とが、アダプテーションセットID(AdaptationSetId)によりマッピングされるようにする。また、SPDのコンポーネントカテゴリ(Component Category)と、MPDのAdaptationSet要素のgroup属性とが、グループID(groupId)によりマッピングされるようにする。
このように、各階層でのマッピングを行うことで、SPDとMPDが相互に連携した運用を行うことができるので、SPDとMPDの各レイヤのパラメータを共有して、各レイヤに含まれるコンポーネント(オブジェクト)を横断的に処理することができる。なお、図13の階層構造の例では、SPDのコンポーネントに対応する階層が、アダプティブレイヤとコンポジットレイヤとなり、SPDのコンポーネントグループに対応する階層が、セレクティブレイヤであるとして示しているが、これらの関係は一例であって、例えば、SPDのコンポーネントに対応する階層をアダプティブレイヤとし、SPDのコンポーネントグループに対応する階層をコンポジットレイヤとし、SPDのコンポーネントカテゴリに対応する階層をセレクティブレイヤとして捉えるようにしてもよい。
(具体的な運用例)
図14は、SPDとMPDの連携の具体的な運用例を示す図である。
図14においては、左側にSPDの記述内容が示され、右側にMPDの記述内容が示されている。また、上述した図4等と同様に、ビデオ(Video)とオーディオ(Audio)のコンポーネントが、セレクティブレイヤ、コンポジットレイヤ、及び、アダプティブレイヤの3階層から構成されている。
SPDのアダプティブレイヤにおいて、「C」はコンポーネント(Component)を意味し、「V」はビデオ、「A」はオーディオをそれぞれ意味している。また、「RTP」はコンポーネントがRTPセッションで伝送されている、すなわち、RTPストリームが放送で伝送されていることを示している。また、「DASH」は、コンポーネントが、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠してストリーミング配信されている、すなわち、DASHストリームが通信で伝送されていることを示している。
具体的には、図中の「C1」で表されるビデオコンポーネントC1は、RTPストリームとして放送で伝送されている。一方、図中の「C2」乃至「C5」で表されるビデオコンポーネントC2乃至C5は、DASHストリームとして通信で伝送されている。ここで、ビデオコンポーネントC2のビットレートは、例えば1Mbps等の低ビットレートとなる。一方、ビデオコンポーネントC3のビットレートは、例えば10Mbps等の高ビットレートとなる。
また、図中の「C6」で表されるオーディオコンポーネントC6は、RTPストリームとして放送で伝送されている。図中の「C7」と、「C8」で表されるオーディオコンポーネントC7と、オーディオコンポーネントC8は、DASHストリームとして通信で伝送されている。
一方、MPDのアダプティブレイヤにおいて、アダプティブレイヤの「R」はMPDのRepresentation要素を意味している。すなわち、図中の「R1」乃至「R4」で表されるRepresentation要素に記述されたビデオコンポーネントR1乃至R4は、DASHストリームとして通信で伝送されている。ここで、ビデオコンポーネントR1のビットレートは、例えば1Mbps等の低ビットレートとなる。一方、ビデオコンポーネントR2のビットレートは、例えば10Mbps等の高ビットレートとなる。
また、図中の「R5」と、「R6」で表されるオーディオコンポーネントR5と、オーディオコンポーネントR6は、DASHストリームとして通信で伝送されている。
以上のような構成からなるSPDとMPDのアダプティブレイヤを比較すれば、MPDはMPEG-DASHの規格に準拠したストリーミング配信を管理するために規定されているので、基本的にDASHストリームとして通信で伝送されるコンポーネントについてのみ記述される。一方、SPDでは、伝送形態に応じてコンポーネントに関する記述が制限されるということはないので、RTPストリームとして放送で伝送されるコンポーネントと、DASHストリームとして通信で伝送されるコンポーネントの両方を記述することができる。
換言すれば、図14のSPDとMPDの記述例では、SPDには、RTPストリームとして放送で伝送されるコンポーネントの他に、MPDの記述内容と同一となるDASHストリームとして通信で伝送されるコンポーネントが記述されていることになる。すなわち、SPDには、MPDに記述されたコンポーネントは、すべて記述されている。そして、SPDには、コンポーネントごとにリプレゼンテーションIDが指定されており、このリプレゼンテーションIDが、MPDのRepresentation要素のリプレゼンテーションIDと関連付けられているので、SPDとMPDに記述された通信のコンポーネントを対応付けることができる。
すなわち、図14のアダプティブレイヤにおいては、図中の矢印で示すように、SPDのビデオコンポーネントC2,C3,C4,C5と、MPDのビデオコンポーネントR1,R2,R3,R4とが、リプレゼンテーションIDによって対応付けられることになる。また、図中の矢印で示すように、SPDのオーディオコンポーネントC7,C8と、MPDのオーディオコンポーネントR5,R6とが、リプレゼンテーションIDによって対応付けられることになる。
また、SPDのコンポジットレイヤにおいて、「CG」はコンポーネントグループ(Component Group)を意味し、「V」はビデオ、「A」はオーディオをそれぞれ意味している。すなわち、図中の「CG1-V」で表されるコンポーネントグループCG1内のビデオコンポーネントC1乃至C3が合成されて、合成コンポーネントとなる。
ここで、コンポジットレイヤにおける合成対象の属性としてスケーラブル属性が指定されている。すなわち、ビデオコンポーネントC1は、スケーラブル属性の属性値として"Base"が指定され、ビデオコンポーネントC2とビデオコンポーネントC3には、スケーラブル属性の属性値として"Extended"が指定されている。また、ビデオコンポーネントC2のビットレートは、例えば1Mbps等の低ビットレートとなる。一方、ビデオコンポーネントC3のビットレートは、例えば10Mbps等の高ビットレートとなる。
これにより、基本ストリーム(Base Stream)としてのRTPストリームによって放送で伝送されるビデオコンポーネントC1と、拡張ストリーム(Extended Stream)としてのDASHストリームによって通信で伝送されるビデオコンポーネントC2又はビデオコンポーネントC3とが合成され、コンポーネントグループCG1における合成コンポーネントが得られる。なお、DASHストリームとして通信で伝送される、ビットレートの異なるビデオコンポーネントC2とビデオコンポーネントC3は、例えば通信経路の輻輳状況に応じて、いずれか一方の通信のビデオコンポーネントが選択される。
また、図中の「CG2-V」で表されるコンポーネントグループCG2内には、通信のビデオコンポーネントC4が1つだけ用意されているので、アダプティブレイヤにおいて適応的な選択は行われず、さらにコンポジットレイヤにおいて合成も行われない。さらにまた、図中の「CG3-V」で表されるコンポーネントグループCG3内には、通信のビデオコンポーネントC5が1つだけ用意されているので、アダプティブレイヤにおいて適応的な選択は行われず、さらにコンポジットレイヤにおいて合成も行われない。
さらに、図中の「CG4-A」で表されるコンポーネントグループCG4内には、放送のオーディオコンポーネントC6が1つだけ用意されているので、アダプティブレイヤにおいて適応的な選択は行われず、さらにコンポジットレイヤにおいて合成も行われない。同様にまた、図中の「CG5-A」で表されるコンポーネントグループCG5については、通信のオーディオコンポーネントC7が常に選択され、「CG6-A」で表されるコンポーネントグループCG6については、通信のオーディオコンポーネントC8が常に選択される。
一方、MPDのコンポジットレイヤにおいて、「AS」は、MPDのAdaptationSet要素を意味している。すなわち、図中の「AS1-V」で表されるアダプテーションセットAS1では、ビットレートの異なるビデオコンポーネントR1とビデオコンポーネントR2は、例えば通信経路の輻輳状態に応じて、いずれか一方の通信のビデオコンポーネントが選択される。
また、図中の「AS2-V」で表されるアダプテーションセットAS2内には、通信のビデオコンポーネントR3が1つだけ用意されているので、ビデオコンポーネントR3が常に選択される。同様にまた、図中の「AS3-V」で表されるアダプテーションセットAS3内には、通信のビデオコンポーネントR4が1つだけ用意されているので、ビデオコンポーネントR4が常に選択される。
さらにまた、図中の「AS4-A」で表されるアダプテーションセットAS4内には、通信のオーディオコンポーネントR5が1つだけ用意されているので、オーディオコンポーネントR5が常に選択される。同様にまた、図中の「AS5-A」で表されるアダプテーションセットAS5内には、通信のオーディオコンポーネントR6が1つだけ用意されているので、オーディオコンポーネントR6が常に選択される。
以上のような構成からなるSPDとMPDのコンポジットレイヤを比較すれば、MPDのAdaptationSet要素には通信のコンポーネントのみ記述される一方、SPDには、通信のコンポーネントの他に、放送のコンポーネントについてのコンポーネントグループが記述されることになる。そして、SPDには、コンポーネントグループごとに、アダプテーションセットIDが指定されており、このアダプテーションセットIDが、MPDのAdaptationSet要素のアダプテーションセットIDと関連付けられているので、SPDのコンポーネントグループと、MPDのAdaptationSet要素を関連付けることができる。
すなわち、図14のコンポジットレイヤにおいては、図中の矢印で示すように、SPDのコンポーネントグループCG1,CG2,CG3と、MPDのアダプテーションセットAS1,AS2,AS3とが、アダプテーションセットIDによって対応付けられることになる。また、図中の矢印で示すように、SPDのコンポーネントグループCG5,CG6と、MPDのアダプテーションセットAS4,AS5とが、アダプテーションセットIDによって対応付けられることになる。
また、SPDのセレクティブレイヤにおいて、「CC」はコンポーネントカテゴリ(Component Category)を意味し、「V」はビデオ、「A」はオーディオをそれぞれ意味している。すなわち、図中の「CC1-V」で表されるコンポーネントカテゴリCC1では、コンポーネントグループCG1乃至CG3のいずれか1つのビデオコンポーネントが選択されることになる。また、図中の「CC2-A」で表されるコンポーネントカテゴリCC2では、コンポーネントグループCG4乃至CG6のいずれか1つのオーディオコンポーネントが選択されることになる。
一方、MPDのセレクティブレイヤにおいて、「group」はグループを意味している。すなわち、図中の「group1-V」で表されるグループg1では、アダプテーションセットAS1乃至AS3のうちのいずれか1つの通信のビデオコンポーネントが選択されることになる。また、「group2-A」で表されるグループg2では、アダプテーションセットAS4乃至AS5のうちのいずれか1つの通信のオーディオコンポーネントが選択されることになる。
そして、SPDには、コンポーネントカテゴリごとに、グループIDが指定されており、このグループIDが、MPDのグループIDと関連付けられているので、SPDのコンポーネントカテゴリと、MPDのAdaptationSet要素のgroup属性を関連付けることができる。
すなわち、図14のセレクティブレイヤにおいては、図中の矢印で示すように、SPDのコンポーネントカテゴリCC1と、MPDのグループg1とが、グループIDによって対応付けられることになる。また、図中の矢印で示すように、SPDのコンポーネントカテゴリCC2と、MPDのグループg2とが、グループIDによって対応付けられることになる。
以上、図14の運用例で示したように、リプレゼンテーションIDによって、SPDのコンポーネント(Component)とMPDのRepresentation要素とがマッピングされ、アダプテーションセットIDによって、SPDのコンポーネントグループ(Component Group)とMPDのAdaptationSet要素とがマッピングされ、グループIDによって、SPDのコンポーネントカテゴリ(Component Category)とMPDのAdaptationSet要素のgroup属性(group)とがマッピングされる。これにより、SPDとMPDが相互に連携した運用を行うことができるので、SPDとMPDの各レイヤのパラメータを共有して、各レイヤに含まれるコンポーネント(オブジェクト)を横断的に処理することができる。
例えば、図14の運用例の場合、MPDのみだと、通信のコンポーネントしか記述できないので、アダプテーションセットAS1において、ビットレートの異なるビデオコンポーネントR1とビデオコンポーネントR2のいずれか一方が選択されるとしか表現できないが、連携されたSPDを参照することで、ビデオコンポーネントR1(C2)とビデオコンポーネントR2(C3)のいずれか一方を選択するだけでなく、選択された通信のビデオコンポーネントが、放送のビデオコンポーネントC1と合成されることを認識することができる。
また、MPDは、MPEG-DASHの規格に準拠したストリーミング配信を管理するために規定されているので、通信のコンポーネントについてのみ記述されるが、SPDを用いることで、通信のコンポーネントの他に、放送のコンポーネントについても記述することが可能となる。例えば、MPDをメインで使用している場合に、不足分の情報を補完的に、SPDを参照して取得することができる。なお、SPDには、放送のコンポーネントと通信のコンポーネントの両方を記述することができるため、SPDのみを用いるようにしてもよい。また、MPDには、通信のコンポーネントを記述することができるので、SPDに、放送のコンポーネントのみを記述するようにして、放送のコンポーネントと通信のコンポーネントが記述されるシグナリング情報を分けてもよい。
(4)シンタックス
(SPDのシンタックス)
図15は、SPDのシンタックスを示す図である。SPDは、例えば、XML等のマークアップ言語により記述される。なお、図15において、要素と属性のうち、属性には「@」が付されている。また、インデントされた要素と属性は、その上位の要素に対して指定されたものとなる。また、この要素と属性の関係は、後述する他のシンタックスにおいても同様とされる。
図15に示すように、Spd要素は、serviceId属性、spIndicator属性、ComponentLayerDescriptor要素、ProtocolVersionDescriptor要素、NRTServiceDescriptor要素、CapabilityDescriptor要素、IconDescriptor要素、ISO639LanguageDescriptor要素、ReceiverTargetingDescriptor要素、AssociatedServiceDescriptor要素、ContentAdvisoryDescriptor要素、及び、Component要素の上位要素となる。
serviceId属性には、サービスIDが指定される。spIndicator属性には、サービスIDにより識別されるサービスごとに、暗号化されているかどうかが指定される。spIndicator属性として"on"が指定された場合には、当該サービスが暗号化されていることを示し、"off"が指定された場合には、当該サービスが暗号化されていないことを示している。
ComponentLayerDescriptor要素には、コンポーネントレイヤ構造に関する情報が指定される。ProtocolVersionDescriptor要素には、データのサービスがどのようなサービスであるかを示すための情報が指定される。
NRTServiceDescriptor要素には、NRTサービスに関する情報が指定される。CapabilityDescriptor要素には、NRTサービスの提供を受ける受信機に要求される機能(キャパビリティ)に関する情報が指定される。
IconDescriptor要素には、NRTサービスで用いられるアイコンの取得先を示す情報が指定される。ISO639LanguageDescriptor要素には、NRTサービスの言語コードが指定される。ReceiverTargetingDescriptor要素には、NRTサービスのターゲット情報が指定される。
AssociatedServiceDescriptor要素には、関連従属サービスに関する情報が指定される。ContentAdvisoryDescriptor要素には、レーティングリージョンに関する情報が指定される。
SPDにおいては、上述したこれらのDescriptor要素により、サービスレベルでの各種のパラメータが規定される。また、以下のComponent要素により、コンポーネントレベルでの各種のパラメータが規定される。
Component要素は、componentId属性、representationId属性、subRepresentationLevel属性、componentCategory属性、locationType属性、componentEncryption属性、compositePosition属性、targetedScreen属性、ContentAdvisoryDescriptor要素、AVCVideoDescriptor要素、HEVCVideoDescriptor要素、MPEG4AACAudioDescriptor要素、AC3AudioDescriptor要素、及び、CaptionDescriptor要素の上位要素となる。
componentId属性には、コンポーネントIDが指定される。representationId属性には、対応するMPDのリプレゼンテーションIDが指定される。このリプレゼンテーションIDにより、SPDのコンポーネントと、MPDのRepresentation要素とが対応付けられる。
subRepresentationLevel属性には、サブリプレゼンテーションレベルが指定される。例えば、サブリプレゼンテーションレベルは、FLUTEセッションにおける各セグメントに、複数のカテゴリ(例えばビデオやオーディオ)のコンポーネントが格納される場合において、それらのコンポーネントを識別するための情報となる。
componentCategory属性には、コンポーネントのカテゴリ情報が指定される。このカテゴリ情報としては、例えば、"video","audio","caption","nrt"が指定される。"video"はビデオのコンポーネント、"audio"はオーディオのコンポーネント、"caption"は字幕のコンポーネントであることを示している。また、"nrt"は、NRTコンテンツのデータであることを示している。
locationType属性には、コンポーネントのロケーションのタイプ情報が指定される。このタイプ情報としては、例えば、"bb","bca","bco"が指定される。"bb"は、Broadbandの略であって、コンポーネントが通信を利用して配信されることを示す。"bca"は、Broadcast actualの略であって、コンポーネントが放送を利用して配信され、かつ、当該SPD(SCS)が伝送されているサービスと同一のサービス内で配信されることを示す。"bco"は、Broadcast otherの略であって、コンポーネントが放送を利用して配信され、かつ、当該SPD(SCS)が伝送されているサービスと異なる別サービス内で配信されることを示す。
componentEncryption属性には、コンポーネントIDにより識別されるコンポーネントごとに、暗号化されているかどうかが指定される。componentEncryption属性として"on"が定された場合には、当該コンポーネントが暗号化されていることを示し、"off"が指定された場合には、当該コンポーネントが暗号化されていないことを示している。
compositePosition属性には、コンポジットレイヤで行われるコンポーネントの合成に関する情報が指定される。ここには、ComponentLayerDescriptor(図16)のComponentGroup要素のcompositeType属性の属性値に対応した情報が指定される。例えば、ComponentGroup要素のcompositeType属性として、スケーラブル(scalable)属性が指定された場合に、対象のコンポーネントが、基本ストリーム(Base Stream)となるとき、compositePosition属性として"base"が指定される。また、対象のコンポーネントが、拡張ストリーム(Extended Stream)となるときには、compositePosition属性として"enhancement"が指定される。
targetedScreen属性には、コンポーネント単位での、ターゲットの機器の表示に関する情報が指定される。この表示に関する情報としては、例えば、"primary","secondary"が指定される。"primary"は、第1の表示機器として、例えばテレビジョン受像機に映像を表示する場合に指定される。"secondary"は、第2の表示機器として、例えばタブレット端末装置に映像を表示する場合に指定される。ContentAdvisoryDescriptor要素には、コンポーネント単位での、レーティング情報が指定される。
AVCVideoDescriptor要素には、ビデオデータの符号化方式として、AVC(Advanced Video Coding)が用いられている場合に、ビデオのパラメータが指定される。また、HEVCVideoDescriptor要素には、ビデオデータの符号化方式として、HEVC(High Efficiency Video Coding)が用いられている場合に、ビデオのパラメータが指定される。なお、AVCとHEVCは、ビデオデータの符号化方式の一例であって、他の符号化方式が用いられる場合には、対応するVideoDescriptor要素が指定されることになる。
MPEG4AACAudioDescriptor要素には、オーディオデータの符号化方式として、MPEG4AAC(Advanced Audio Coding)が用いられている場合に、オーディオのパラメータが指定される。また、AC3AudioDescriptor要素には、オーディオデータの符号化方式として、AC3(Audio Code number 3)が用いられる場合に、オーディオのパラメータが指定される。なお、MPEG4AACとAC3は、オーディオデータの符号化方式の一例であって、他の符号化方式が用いられる場合には、対応するAudioDescriptor要素が指定されることになる。CaptionDescriptor要素には、字幕のパラメータが指定される。
なお、図15のSPDのシンタックスにおいて、ProtocolVersionDescriptor要素、NRTServiceDescriptor要素、CapabilityDescriptor要素、IconDescriptor要素、ISO639LanguageDescriptor要素、及び、ReceiverTargetingDescriptor要素は、NRTサービス用に規定されるものである。
また、図15に示したSPDの要素と属性の出現数(Cardinality)であるが、"1"が指定された場合にはその要素又は属性は必ず1つだけ指定され、"0..1"が指定された場合には、その要素又は属性を指定するかどうかは任意である。また、"1..n"が指定された場合には、その要素又は属性は1以上指定され、"0..n"が指定された場合には、その要素又は属性を1以上指定するかどうかは任意である。これらの出現数の意味は、後述する他のシンタックスでも同様とされる。
次に、図15のSPDに記述されるDescriptor要素の詳細構成について説明する。ここでは、SPDに記述されるDescriptor要素のうち、ComponentLayerDescriptor要素を代表して説明する。
(ComponentLayerDescriptor)
図16は、ComponentLayerDescriptorのシンタックスを示す図である。ComponentLayerDescriptorは、例えば、XML等のマークアップ言語により記述される。
図16に示すように、ComponentLayerDescriptor要素には、コンポーネントレイヤ構成に関する情報が指定される。ComponentLayerDescriptor要素は、ComponentCategory要素の上位要素となる。ComponentCategory要素には、コンポーネントのカテゴリに関する情報が指定される。ComponentCategory要素は、category属性、mpdGroupId属性、及び、ComponentGroup要素の上位要素となる。
category属性には、コンポーネントのカテゴリ情報(名称)が指定される。このカテゴリ情報としては、例えば、"video","audio","caption","nrt"が指定される。"video"はビデオのコンポーネント、"audio"はオーディオのコンポーネント、"caption"は字幕のコンポーネントであることを示している。また、"nrt"は、NRTコンテンツのデータであることを示している。
mpdGroupId属性には、対応するMPDのグループIDが指定される。このグループIDによって、SPDのコンポーネントカテゴリと、MPDのAdaptationSet要素のgroup属性とが対応付けられる。ComponentGroup要素には、コンポーネントグループに関する情報が指定される。
ComponentGroup要素は、id属性、adaptationSetId属性、defaultFlag属性、muxId属性、encryption属性、language属性、compositeType属性、usage属性、stereoscope属性、audioChannelConfig属性、targetScreen属性、ViewPointDescriptor要素、ContentAdvisoryDescriptor要素、及び、componentId要素の上位要素となる。
id属性には、コンポーネントグループIDが指定される。adaptationSetId属性には、対応するMPDのアダプテーションセットIDが指定される。このアダプテーションセットIDによって、SPDのコンポーネントグループと、MPDのAdaptationSet要素とが対応付けられる。
defaultFlag属性には、選局時に、対象のコンポーネントグループが自動(デフォルト)で選択される場合には、"1"が指定される。muxId属性には、異なるコンポーネントカテゴリ間における組み合わせのIDが指定される。例えば、メインビューのビデオとオーディオのコンポーネントグループには、同一のmuxId属性が指定されることになる。なお、このIDは、MPDのSubset要素の組み合わせに対して同一のIDが指定される。encryption属性には、対象のコンポーネントグループが暗号化されている場合には、"1"が指定される。language属性には、対象のコンポーネントグループの言語が指定される。
compositeType属性には、コンポジットレイヤで行われるコンポーネントの合成のタイプ情報が指定される。このタイプ情報としては、例えば、スケーラブル(scalable)やミキシング(mix)、タイル(tile)などを指定することができる。上述したように、ここで指定されるタイプ情報に従い、SPD(図15)のComponent要素のcompositePosition属性の値が指定されることになる。
usage属性には、利用目的に関する情報が指定される。この利用目的に関する情報としては、例えば、"vi","hi","narration"が指定される。"vi"は視覚障害用、"hi"は聴覚障害用、"narration"はナレーション入りであることを示している。stereoscope属性には、3Dか2Dであるかを示す情報で、3Dの場合には、"1"が指定される。audioChannelConfig属性には、音声チャンネルの構成を示す情報が指定される。この音声チャンネルの構成を示す情報としては、"Monoral","Stereo","5.1ch","22.1ch"が指定される。
targetScreen属性には、コンポーネントグループ単位での、ターゲットの機器の表示に関する情報が指定される。この表示に関する情報としては、例えば、"primary","secondary"が指定される。"primary"は、第1の表示機器として、例えばテレビジョン受像機に映像を表示する場合に指定される。"secondary"は、第2の表示機器として、例えばタブレット端末装置に映像を表示する場合に指定される。ViewPointDescriptor要素には、ビューポイントに関する情報が指定される。このビューポイントに関する情報としては、ビューポイントごとのIDとタイトルが指定される。ContentAdvisoryDescriptor要素には、コンポーネントグループ単位での、レーティング情報が指定される。componentId要素には、対象のコンポーネントグループに含まれるコンポーネントのコンポーネントIDが指定される。
(SPDのシンタックスの他の構成)
ところで、上述した図15のSPDのシンタックスでは、サービスレベルとコンポーネントレベルの2段階で各種のパラメータが規定されるようにして、図16のComponent Layer DescriptorをサービスレベルのDescriptorとして配置したが、Component Layer Descriptorの記述内容を、SPDに直接記述するようにしてもよい。図17には、当該SPDのシンタックスを示している。なお、図17のSPDを構成する要素や属性について、図15のSPDを構成する要素や属性と同様の内容を意味する場合には、その説明は繰り返しになるので省略する。
図17に示すように、Spd要素は、serviceId属性、spIndicator属性、ProtocolVersionDescriptor要素、NRTServiceDescriptor要素、CapabilityDescriptor要素、IconDescriptor要素、ISO639LanguageDescriptor要素、ReceiverTargetingDescriptor要素、AssociatedServiceDescriptor要素、ContentAdvisoryDescriptor要素、及び、ComponentCategoryGroup要素の上位要素となる。
ComponentCategoryGroup要素には、コンポーネントカテゴリと、コンポーネントグループに関する情報が指定される。ComponentCategoryGroup要素は、componentCategory属性、mpdGroupId属性、及び、ComponentGroup要素の上位要素となる。
componentCategory属性には、コンポーネントのカテゴリ情報が指定される。このカテゴリ情報としては、例えば、"video","audio","caption","nrt"が指定される。"video"はビデオのコンポーネント、"audio"はオーディオのコンポーネント、"caption"は字幕のコンポーネントであることを示している。また、"nrt"は、NRTコンテンツのデータであることを示している。
mpdGroupId属性には、対応するMPDのグループIDが指定される。このグループIDによって、SPDのコンポーネントカテゴリと、MPDのAdaptationSet要素のgroup属性とが対応付けられる。ComponentGroup要素には、コンポーネントグループに関する情報が指定される。
ComponentGroup要素は、id属性、adaptationSetId属性、defaultFlag属性、muxId属性、encryption属性、language属性、compositeType属性、usage属性、stereoscope属性、audioChannelConfig属性、targetScreen属性、ViewPointDescriptor要素、ContentAdvisoryDescriptor要素、及び、Component要素の上位要素となる。adaptationSetId属性には、対応するMPDのアダプテーションセットIDが指定される。このアダプテーションセットIDによって、SPDのコンポーネントグループと、MPDのAdaptationSet要素とが対応付けられる。
Component要素は、componentId属性、representationId属性、subRepresentationLevel属性、componentCategory属性、locationType属性、compositePosition属性、AVCVideoDescriptor要素、HEVCVideoDescriptor要素、MPEG4AACAudioDescriptor要素、AC3AudioDescriptor要素、及び、CaptionDescriptor要素の上位要素となる。representationId属性には、対応するMPDのリプレゼンテーションIDが指定される。このリプレゼンテーションIDにより、SPDのコンポーネントと、MPDのRepresentation要素とが対応付けられる。
以上のように、図17のSPDでは、サービスレベルとコンポーネントレベルの2段階に加えて、コンポーネントカテゴリレベルと、コンポーネントグループレベルでのパラメータが規定されるようにして、グループID、アダプテーションセットID、及び、リプレゼンテーションIDによって、MPDとマッピングして、SPDとMPDが相互に連携した運用を行うことができるようにしている。なお、上述したSPDのシンタックスは一例であって、他のシンタックスを採用してもよい。
<4.システム構成>
(放送通信システムの構成)
図18は、本技術を適用した放送通信システムの一実施の形態の構成を示す図である。
図18に示すように、放送通信システム1は、データ提供サーバ10、送信装置20、配信サーバ30、及び、受信装置40から構成される。また、配信サーバ30と受信装置40は、インターネット等のネットワーク90を介して相互に接続されている。
データ提供サーバ10は、ビデオやオーディオ、字幕などの各種のコンポーネントを、送信装置20及び配信サーバ30に提供する。ここでは、例えば、テレビ番組を提供するサービスにおいて、アダプティブストリーミング配信を実現するために、当該テレビ番組を構成するコンポーネントとして、8Mbpsのビデオコンポーネントを送信装置20に、1Mbps,2Mbps,5Mbps,10Mbps,20Mbpsのビデオコンポーネントを配信サーバ30にそれぞれ提供する。
送信装置20は、データ提供サーバ10から提供される各種のコンポーネント(例えば、8Mbpsのビデオコンポーネント)を、デジタル放送の放送波によって送信する。また、送信装置20は、コンポーネントとともに、制御信号(図10のシグナリング情報)を、デジタル放送の放送波で送信する。なお、この制御信号(図10のシグナリング情報)は、ネットワーク90に接続された専用のサーバなどから配信されるようにしてもよい。
配信サーバ30は、受信装置40からの要求に応じて、データ提供サーバ10から提供される各種のコンポーネント(例えば、1Mbps,2Mbps,5Mbps,10Mbps,20Mbpsのビデオコンポーネント)を、ネットワーク90を介して、受信装置40に配信する。
受信装置40は、送信装置20から送信された放送信号を受信して、制御信号(図10のシグナリング情報)を取得する。受信装置40は、制御信号に応じて、送信装置20から送信される、ビデオやオーディオ、字幕などの各種のコンポーネント(例えば、8Mbpsのビデオコンポーネント)を取得する。また、受信装置40は、制御信号に応じて、配信サーバ30から配信される、ビデオやオーディオ、字幕などの各種のコンポーネント(例えば、1Mbps,2Mbps,5Mbps,10Mbps,20Mbpsのビデオコンポーネント)を取得する。
受信装置40は、ビデオや字幕のコンポーネントの映像をディスプレイに表示するとともに、その映像に同期したオーディオコンポーネントの音声をスピーカから出力する。ここでは、例えば、一定期間(例えば10秒)ごとに、8Mbpsの放送のビデオコンポーネントと、1Mbps,2Mbps,5Mbps,10Mbps,20Mbpsの通信のビデオコンポーネントの中から、最適なビデオコンポーネントが適応的に選択されて切り替えられ、アダプティブストリーミング配信が実現されることになる。
なお、受信装置40は、ディスプレイやスピーカを含んで単体として構成されるようにしてもよいし、テレビジョン受像機やビデオレコーダ等に内蔵されるようにしてもよい。
放送通信システム1は、以上のように構成される。次に、図18の放送通信システム1を構成する各装置の詳細な構成について説明する。
(送信装置の構成)
図19は、本技術を適用した送信装置の一実施の形態の構成を示す図である。
図19に示すように、送信装置20は、コンポーネント取得部201、制御信号取得部202、Mux203、及び、送信部204から構成される。
コンポーネント取得部201は、データ提供サーバ10から各種のコンポーネントを取得し、Mux203に供給する。制御信号取得部202は、データ提供サーバ10等の外部のサーバや、内蔵するストレージから制御信号(図10のシグナリング情報)を取得し、Mux203に供給する。
Mux203は、コンポーネント取得部201からの各種のコンポーネントと、制御信号取得部202からの制御信号を多重化して、BBPストリームを生成し、送信部204に供給する。送信部204は、Mux203から供給されるBBPストリームを放送信号として、アンテナ205を介して送信する。
(配信サーバの構成)
図20は、本技術を適用した配信サーバの一実施の形態の構成を示す図である。
図20に示すように、配信サーバ30は、制御部301、コンポーネント取得部302、蓄積部303、及び、通信部304から構成される。
制御部301は、配信サーバ30の各部の動作を制御する。
コンポーネント取得部302は、データ提供サーバ10から各種のコンポーネントを取得し、制御部301に供給する。制御部301は、コンポーネント取得部302からの各種のコンポーネントを、蓄積部303に蓄積する。これにより、蓄積部303には、データ提供サーバ10からの各種のコンポーネントが蓄積されることになる。
通信部304は、制御部301からの制御に従い、ネットワーク90を介して受信装置40と各種のデータをやりとりする。制御部301は、受信装置40からのストリーム(コンポーネント)の配信の要求を通信部304が受信した場合、当該要求に応じたコンポーネントを蓄積部303から読み出す。制御部301は、通信部304を制御して、蓄積部303から読み出したコンポーネントからなるストリームを、ネットワーク90を介して受信装置40に配信する。
(受信装置の構成)
図21は、本技術を適用した受信装置の一実施の形態の構成を示す図である。
図21に示すように、受信装置40は、チューナ402、Demux403、選択/合成部404、選択/合成部405、選択/合成部406、制御部407、NVRAM408、入力部409、通信部410、Demux411、ビデオデコーダ412、ビデオ出力部413、オーディオデコーダ414、オーディオ出力部415、及び、字幕デコーダ416から構成される。
チューナ402は、アンテナ401により受信された放送信号から、選局が指示されたサービスの放送信号を抽出して復調し、その結果得られるBBPストリームを、Demux403に供給する。
Demux403は、チューナ402から供給されるBBPストリームを、各コンポーネントと、制御信号に分離して、各コンポーネントを、選択/合成部404乃至406に供給し、制御信号を、制御部407に供給する。ここでは、コンポーネントとして、ビデオコンポーネント、オーディオコンポーネント、字幕コンポーネントが分離され、選択/合成部404、選択/合成部405、選択/合成部406にそれぞれ供給される。
制御部407は、受信装置40の各部の動作を制御する。NVRAM408は、不揮発性メモリであって、制御部407からの制御に従い、各種のデータを記録する。また、制御部407は、Demux403から供給される制御信号(図10のシグナリング情報)に基づいて、選択/合成部404乃至406により行われる選択/合成処理を制御する。
入力部409は、ユーザの操作に応じて、操作信号を制御部407に供給する。制御部407は、入力部409からの操作信号に基づいて、受信装置40の各部の動作を制御する。
通信部410は、制御部407からの制御に従い、ネットワーク90を介して配信サーバ30と各種のデータをやりとりする。通信部410は、配信サーバ30から受信したストリームを、Demux411に供給する。このとき、通信部410は、内部に設けられた受信バッファ421にストリームデータをバッファしながら、配信サーバ30から配信されるストリームを受信することになる。
Demux411は、通信部410から供給されるストリームを、各コンポーネントに分離して、選択/合成部404乃至406に供給する。ここでは、分離後のコンポーネントのうち、ビデオコンポーネントが選択/合成部404、オーディオコンポーネントが選択/合成部405、字幕コンポーネントが選択/合成部406にそれぞれ供給される。
選択/合成部404は、制御部407からの制御に従い、Demux403からのビデオコンポーネントと、Demux411からのビデオコンポーネントに対し、選択/合成処理(例えば、図4のビデオコンポーネントレイヤにおける各レイヤの処理)を行い、その処理の結果得られるビデオコンポーネントを、ビデオデコーダ412に供給する。
ビデオデコーダ412は、選択/合成部404から供給されるビデオコンポーネントを復号し、それにより得られるビデオデータを、ビデオ出力部413に供給する。ビデオ出力部413は、ビデオデコーダ412から供給されるビデオデータを、後段のディスプレイ(不図示)に出力する。これにより、ディスプレイには、例えば、テレビ番組の映像などが表示される。
選択/合成部405は、制御部407からの制御に従い、Demux403からのオーディオコンポーネントと、Demux411からのオーディオコンポーネントに対し、選択/合成処理(例えば、図4のオーディオコンポーネントレイヤにおける各レイヤの処理)を行い、その処理の結果得られるオーディオコンポーネントを、オーディオデコーダ414に供給する。
オーディオデコーダ414は、選択/合成部405から供給されるオーディオコンポーネントを復号して、それにより得られるオーディオデータを、オーディオ出力部415に供給する。オーディオ出力部415は、オーディオデコーダ414から供給されるオーディオデータを、後段のスピーカ(不図示)に供給する。これにより、スピーカからは、例えば、テレビ番組の映像に対応する音声が出力される。
選択/合成部406は、制御部407からの制御に従い、Demux403からの字幕コンポーネントと、Demux411からの字幕コンポーネントに対し、選択/合成処理(例えば、図4の字幕コンポーネントレイヤにおける各レイヤの処理)を行い、その処理の結果得られる字幕コンポーネントを、字幕デコーダ416に供給する。
字幕デコーダ416は、選択/合成部406から供給される字幕コンポーネントを復号して、それにより得られる字幕データを、ビデオ出力部413に供給する。ビデオ出力部413は、字幕デコーダ416から字幕データが供給された場合、その字幕データを、ビデオデコーダ412からのビデオデータに合成し、後段のディスプレイ(不図示)に供給する。これにより、ディスプレイには、テレビ番組の映像に重畳して字幕が表示される。
なお、図21の受信装置40においては、説明の都合上、各デコーダの前段に、選択/合成部404乃至406が設けられる構成を示したが、選択/合成処理の内容によっては、選択/合成部404乃至406が、各デコーダの後段に設けられる構成を採用するようにしてもよい。
<5.各装置で実行される処理の流れ>
次に、図18の放送通信システム1を構成する各装置で実行される処理の流れについて、図22乃至図24のフローチャートを参照して説明する。
(送信処理)
まず、図22のフローチャートを参照して、図18の送信装置20により実行される、送信処理について説明する。
ステップS201において、コンポーネント取得部201は、データ提供サーバ10から各種のコンポーネントを取得し、Mux203に供給する。ステップS202において、制御信号取得部202は、外部のサーバなどから制御信号(図10のシグナリング情報)を取得し、Mux203に供給する。
ステップS203において、Mux203は、コンポーネント取得部201からの各種のコンポーネントと、制御信号取得部202からの制御信号を多重化して、BBPストリームを生成し、送信部204に供給する。ステップS204において、送信部204は、Mux203から供給されるBBPストリームを放送信号として、アンテナ205を介して送信する。ステップS204の処理が終了すると、図22の送信処理は終了される。
以上、送信処理について説明した。この送信処理においては、データ提供サーバ10から提供される各種のコンポーネントと、制御信号が、放送波により送信されることになる。
(配信処理)
次に、図23のフローチャートを参照して、図18の配信サーバ30により実行される、配信処理について説明する。ただし、配信サーバ30において、蓄積部303には、データ提供サーバ10から取得された各種のコンポーネントが蓄積済みであるものとする。
ステップS301において、制御部301は、通信部304を常に監視して、ネットワーク90を介して受信装置40からコンポーネントが要求されたかどうかを判定する。ステップS301においては、受信装置40からのコンポーネントの要求を待って、処理は、ステップS302に進められる。
ステップS302において、制御部301は、受信装置40からの要求に応じたコンポーネントを、蓄積部303から読み出す。ステップS303において、制御部301は、通信部304を制御して、蓄積部303から読み出したコンポーネント(ストリーム)を、ネットワーク90を介して、受信装置40に配信する。ステップS303の処理が終了すると、図23の配信処理は終了する。
以上、配信処理について説明した。この配信処理においては、受信装置40からの要求に応じて、データ提供サーバ10から提供される各種のコンポーネント(ストリーム)が、ネットワーク90を介して配信されることになる。
(受信処理)
最後に、図24のフローチャートを参照して、図18の受信装置40により実行される、受信処理について説明する。この受信処理は、例えば、ユーザによるリモートコントローラの操作によって、受信装置40が起動され、選局指示がなされた場合などに実行される。
ステップS401において、チューナ402は、アンテナ401を介して放送信号を受信し、放送信号から選局が指示されたサービスの放送信号を抽出して復調する。また、Demux403は、チューナ402からのBBPストリームを、コンポーネントと制御信号に分離する。
ステップS402において、制御部407は、Demux403からの制御信号(図10のシグナリング情報)に基づいて、複数のコンポーネントの候補の中から、最適なコンポーネントを選択する。具体的には、制御部407では、制御信号として、図10のシグナリング情報が取得されるので、その選択肢の中で、まず、topAttribute属性で、選択すべきコンポーネントの数を踏まえた上で、選択判断に応じた動作を制御する。
例えば、選択判断がユーザ選択となる場合には、制御部407は、最上位の階層のセレクティブレイヤの各セレクティブコンポーネントグループに、固定選択対象の属性として指定される情報をGUI画面により表示して、ユーザがセレクティブコンポーネントグループ(コンポーネント)を選択するようにする。また、例えば、選択判断が受信機自動選択となる場合には、制御部407は、最上位の階層のセレクティブレイヤの各セレクティブコンポーネントグループに、固定選択対象の属性として指定される情報に基づいて、セレクティブコンポーネントグループ(コンポーネント)を選択する。
このコンポーネント選択処理は、基本的に、ビデオやオーディオなどのコンポーネントのカテゴリごとに実行されるが、固定選択対象の属性としてビュータグが指定されている場合には、カテゴリを横断してセレクティブコンポーネントグループ(コンポーネント)が選択されることになる。
次に、制御部407は、選択したセレクティブコンポーネントグループ(コンポーネント)に、複数のCompositeComponentGroup要素が存在する場合には、コンポジットレイヤにおいて、指定されたコンポーネント合成を行うべき複数のコンポーネントを、下位の階層のアダプティブレイヤの適応選択対象のコンポーネントから選択する。そして、制御部407は、選択/合成部404乃至406を制御して、適応的に選択された複数のコンポーネントを用い、合成処理を行う。
ここでは、例えば、コンポジットコンポーネントグループに、合成対象の属性としてスケーラブルが指定されていた場合、放送で伝送される基本ストリームと、通信で伝送される拡張ストリームとが合成されることになる。また、例えば、コンポジットコンポーネントグループに属性として3Dが指定されていた場合には、放送で伝送される右目用の映像と、通信で伝送される左目用の映像とが合成されることになる。
なお、ここでは、複数のCompositeComponentGroup要素が存在する場合について説明したが、CompositeComponentGroup要素が1つだけの場合には、コンポジットレイヤにおいて、下位の階層のアダプティブレイヤの適応選択対象のコンポーネントから適応的に、逐次最適なコンポーネントを選択するようにする。また、アダプティブレイヤにおいて、適応選択対象のコンポーネントが1つだけの場合には、そのコンポーネントが常に選択されることになる。さらにここでは、リプレゼンテーションIDによって、SPDのコンポーネントとMPDのRepresentation要素とがマッピングされ、アダプテーションセットIDによって、SPDのコンポーネントグループとMPDのAdaptationSet要素とがマッピングされ、グループIDによって、SPDのコンポーネントカテゴリとMPDのAdaptationSet要素のgroup属性とがマッピングされて、SPDとMPDが相互に連携することになる。これにより、SPDとMPDの各レイヤのパラメータを共有して、各レイヤに含まれるコンポーネント(オブジェクト)を横断的に処理することができる。
ステップS402の処理によって、最適なコンポーネントが選択されると、処理はステップS403に進められる。ステップS403において、ビデオ出力部413は、ステップS402の処理で選択されたビデオや字幕のコンポーネントに対応する映像を、ディスプレイに表示させる。また、ステップS403において、オーディオ出力部415は、ステップS402の処理で選択されたオーディオコンポーネントに対応する音声を、スピーカから出力する。ステップS403の処理が終了すると、図24の受信処理は終了する。
以上、受信処理について説明した。この受信処理においては、制御信号(図10のシグナリング情報)に基づいて、放送又は通信により受信可能な複数のコンポーネントの候補の中から、最適なコンポーネントが選択され、提示されることになる。これにより、ユーザは、例えば所望のテレビ番組を選局した場合に、受信可能な複数のコンポーネントの候補の中から選択された最適なコンポーネントに対応する映像や音声を視聴することができる。
なお、上述した説明では、シグナリングデータの名称として、Descriptionの略である「D」を用いたが、Tableの略である「T」が用いられる場合がある。例えば、SCD(Service Configuration Description)は、SCT(Service Configuration Table)と記述される場合がある。また、例えば、SPD(Service Parameter Description)は、SPT(Service Parameter Table)と記述される場合がある。ただし、これらの名称の違いは、「Description」と「Table」との形式的な違いであって、各シグナリングデータの実質的な内容が異なるものではない。
<6.コンピュータの構成>
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示す図である。
コンピュータ900において、CPU(Central Processing Unit)901,ROM(Read Only Memory)902,RAM(Random Access Memory)903は、バス904により相互に接続されている。バス904には、さらに、入出力インターフェース905が接続されている。入出力インターフェース905には、入力部906、出力部907、記録部908、通信部909、及び、ドライブ910が接続されている。
入力部906は、キーボード、マウス、マイクロフォンなどよりなる。出力部907は、ディスプレイ、スピーカなどよりなる。記録部908は、ハードディスクや不揮発性のメモリなどよりなる。通信部909は、ネットワークインターフェースなどよりなる。ドライブ910は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア911を駆動する。
以上のように構成されるコンピュータ900では、CPU901が、ROM902や記録部908に記憶されているプログラムを、入出力インターフェース905及びバス904を介して、RAM903にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ900(CPU901)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア911に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することができる。
コンピュータ900では、プログラムは、リムーバブルメディア911をドライブ910に装着することにより、入出力インターフェース905を介して、記録部908にインストールすることができる。また、プログラムは、有線又は無線の伝送媒体を介して、通信部909で受信し、記録部908にインストールすることができる。その他、プログラムは、ROM902や記録部908に、あらかじめインストールしておくことができる。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであってもよいし、複数のコンピュータによって分散処理されるものであってもよい。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
また、本技術は、以下のような構成をとることができる。
(1)
IP(Internet Protocol)伝送方式を用いたデジタル放送の放送波を受信する受信部と、
前記放送波で伝送される制御信号に含まれる、放送で伝送される放送コンポーネントを少なくとも管理するための第1の管理情報と、通信で伝送される通信コンポーネントのみを管理するための第2の管理情報に基づいて、前記放送コンポーネント及び前記通信コンポーネントの少なくとも一方のコンポーネントを取得するとともに、取得されたコンポーネントに関する所定の処理を行う各部の動作を制御する制御部と
を備える受信装置。
(2)
前記第1の管理情報は、前記放送コンポーネントとともに、前記通信コンポーネントを管理するための情報を含んでいる
(1)に記載の受信装置。
(3)
前記第2の管理情報は、MPEG-DASH(Moving Picture Expert Group - Dynamic Adaptive Streaming over HTTP)の規格に準拠したMPD(Media Presentation Description)であって、
前記第1の管理情報は、コンポーネントと前記MPDのRepresentation要素とを対応付けるための第1の識別子、コンポーネントのグループと前記MPDのAdaptationSet要素とを対応付けるための第2の識別子、及び、コンポーネントのカテゴリと前記MPDのAdaptationSet要素のgroup属性とを対応付けるための第3の識別子を含んでいる
(1)又は(2)に記載の受信装置。
(4)
前記放送コンポーネントと前記通信コンポーネントは、カテゴリごとに、第1の階層、第2の階層、及び、第3の階層からなる階層構造を有しており、
前記第3の階層は、前記放送コンポーネント又は前記通信コンポーネントを適応的に選択するための階層であり、
前記第2の階層は、前記第3の階層で適応的に選択されたコンポーネント、及び、前記第3の階層の対象となっていないコンポーネントを1つのコンポーネントに合成するための階層であり、
前記第1の階層は、前記第2の階層で合成されたコンポーネント、前記第3の階層で適応的に選択されたコンポーネント、及び、前記第2の階層と前記第3の階層の対象となっていないコンポーネントの中から、1つのコンポーネントを選択するための階層である
(1)乃至(3)のいずれか一項に記載の受信装置。
(5)
前記第1の管理情報は、特定のサービスと当該サービスを構成するコンポーネントの少なくとも一方に関するパラメータを記述可能であって、特定のサービスに関するパラメータとして、コンポーネントの階層構造を関する情報を記述した記述子を配置している
(4)に記載の受信装置。
(6)
前記第1の管理情報は、特定のサービスと、当該サービスを構成するコンポーネント、コンポーネントのグループ、及び、コンポーネントのカテゴリに関するパラメータを記述可能であって、コンポーネントの階層構造を関する情報を記述している
(4)に記載の受信装置。
(7)
前記第1の管理情報は、前記第2の階層における複数のコンポーネントの合成に関する情報を含んでいる
(4)に記載の受信装置。
(8)
前記第1の管理情報は、コンポーネントのグループに対する、異なるコンポーネントのカテゴリの間における組み合わせのための第4の識別子を含んでいる
(4)に記載の受信装置。
(9)
前記制御信号は、前記IP伝送方式におけるプロトコルの階層のうち、IP層よりも上位の階層で伝送され、
各サービスを構成する前記放送コンポーネントと、前記制御信号には、共通のIPアドレスが割り当てられる
(1)乃至(8)のいずれか一項に記載の受信装置。
(10)
受信装置の受信方法において、
前記受信装置が、
IP伝送方式を用いたデジタル放送の放送波を受信し、
前記放送波で伝送される制御信号に含まれる、放送で伝送される放送コンポーネントを少なくとも管理するための第1の管理情報と、通信で伝送される通信コンポーネントのみを管理するための第2の管理情報に基づいて、前記放送コンポーネント及び前記通信コンポーネントの少なくとも一方のコンポーネントを取得するとともに、取得されたコンポーネントに関する所定の処理を行う各部の動作を制御する
ステップを含む受信方法。
(11)
放送で伝送される放送コンポーネントを少なくとも管理するための第1の管理情報と、通信で伝送される通信コンポーネントのみを管理するための第2の管理情報を含む制御信号を取得する第1の取得部と、
サービスを構成する1又は複数の放送コンポーネントを取得する第2の取得部と、
前記放送コンポーネントとともに、前記制御信号を、IP伝送方式を用いたデジタル放送の放送波で送信する送信部と
を備える送信装置。
(12)
前記第1の管理情報は、前記放送コンポーネントとともに、前記通信コンポーネントを管理するための情報を含んでいる
(11)に記載の送信装置。
(13)
前記第2の管理情報は、MPEG-DASHの規格に準拠したMPDであって、
前記第1の管理情報は、コンポーネントと前記MPDのRepresentation要素とを対応付けるための第1の識別子、コンポーネントのグループと前記MPDのAdaptationSet要素とを対応付けるための第2の識別子、及び、コンポーネントのカテゴリと前記MPDのAdaptationSet要素のgroup属性とを対応付けるための第3の識別子を含んでいる
(11)又は(12)に記載の送信装置。
(14)
前記放送コンポーネントと前記通信コンポーネントは、カテゴリごとに、第1の階層、第2の階層、及び、第3の階層からなる階層構造を有しており、
前記第3の階層は、前記放送コンポーネント又は前記通信コンポーネントを適応的に選択するための階層であり、
前記第2の階層は、前記第3の階層で適応的に選択されたコンポーネント、及び、前記第3の階層の対象となっていないコンポーネントを1つのコンポーネントに合成するための階層であり、
前記第1の階層は、前記第2の階層で合成されたコンポーネント、前記第3の階層で適応的に選択されたコンポーネント、及び、前記第2の階層と前記第3の階層の対象となっていないコンポーネントの中から、1つのコンポーネントを選択するための階層である
(11)乃至(13)のいずれか一項に記載の送信装置。
(15)
前記第1の管理情報は、特定のサービスと当該サービスを構成するコンポーネントの少なくとも一方に関するパラメータを記述可能であって、特定のサービスに関するパラメータとして、コンポーネントの階層構造を関する情報を記述した記述子を配置している
(14)に記載の送信装置。
(16)
前記第1の管理情報は、特定のサービスと、当該サービスを構成するコンポーネント、コンポーネントのグループ、及び、コンポーネントのカテゴリに関するパラメータを記述可能であって、コンポーネントの階層構造を関する情報を記述している
(14)に記載の送信装置。
(17)
前記第1の管理情報は、前記第2の階層における複数のコンポーネントの合成に関する情報を含んでいる
(14)に記載の送信装置。
(18)
前記第1の管理情報は、コンポーネントのグループに対する、異なるコンポーネントのカテゴリの間における組み合わせのための第4の識別子を含んでいる
(14)に記載の送信装置。
(19)
前記制御信号は、前記IP伝送方式におけるプロトコルの階層のうち、IP層よりも上位の階層で伝送され、
各サービスを構成する前記放送コンポーネントと、前記制御信号には、共通のIPアドレスが割り当てられる
(11)乃至(18)のいずれか一項に記載の送信装置。
(20)
送信装置の送信方法において、
前記送信装置が、
放送で伝送される放送コンポーネントを少なくとも管理するための第1の管理情報と、通信で伝送される通信コンポーネントのみを管理するための第2の管理情報を含む制御信号を取得し、
サービスを構成する1又は複数の放送コンポーネントを取得し、
前記放送コンポーネントとともに、前記制御信号を、IP伝送方式を用いたデジタル放送の放送波で送信する
ステップを含む送信方法。