WO2016132977A1

WO2016132977A1 - 送信装置、送信方法、受信装置および受信方法

Info

Publication number: WO2016132977A1
Application number: PCT/JP2016/053869
Authority: WO
Inventors: 塚越　郁夫
Original assignee: ソニー株式会社
Priority date: 2015-02-20
Filing date: 2016-02-09
Publication date: 2016-08-25
Also published as: JP7176598B2; JP2024152974A; JP7578129B2; JP2020174367A; EP3261353A1; EP3261353A4; CN107211170B; JP2023001309A; US20180007406A1; US10225589B2; CN107211170A; JP6927374B2; JP6729547B2; JPWO2016132977A1; EP3261353B1; JP2021184626A

Abstract

　受信側における変速再生モードでのサブタイトル表示処理の簡単化を図る。【解決手段】ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成する。ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成する。ビデオストリームとサブタイトルストリームを含む多重化ストリームを生成して、送信する。多重化ストリームを生成するに当たって、サブタイトルパケットをランダムアクセス位置に配置する。

Description

送信装置、送信方法、受信装置および受信方法

　本技術は、送信装置、送信方法、受信装置および受信方法に関し、特に、画像データと共にサブタイトル情報を送信する送信装置等に関する。

　従来、例えば、ＤＶＢ（Digital Video Broadcasting）の放送などでは、サブタイトルの情報をビットマップデータで送信する運用が行われている。近時、サブタイトルの情報をテキストの文字コードで、つまりテキストベースで送信することが提案されている。この場合、受信側で解像度に応じたフォント展開がなされる。

　また、サブタイトルの情報をテキストベースで送信する場合、テキスト情報にタイミング情報を持たせることが提案されている。このテキスト情報として、例えば、Ｗ３Ｃ（(World Wide Web Consortium）でＴＴＭＬ（Timed Text Markup Language）が提唱されている（特許文献１参照）。

特開２０１２－１６９８８５号公報

　本技術の目的は、受信側における変速再生モードでのサブタイトル表示処理の簡単化を図ることにある。

　本技術の概念は、
　ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成するビデオエンコード部と、
　ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成するサブタイトルエンコード部と、
　上記ビデオストリームと上記サブタイトルストリームを含む多重化ストリームを生成する多重化ストリーム生成部と、
　上記多重化ストリームを送信する送信部を備え、
　上記多重化ストリーム生成部は、
　上記サブタイトルパケットを、ランダムアクセス位置に配置する
　送信装置にある。

　本技術において、ビデオエンコード部により、ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームが生成される。サブタイトルエンコード部により、ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームが生成される。例えば、サブタイトル情報は、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報である、ようにされてもよい。この場合、例えば、所定フォーマットのサブタイトルのテキスト情報は、ＴＴＭＬあるいはこのＴＴＭＬの派生フォーマットである、ようにされてもよい。

　多重化ストリーム生成部により、少なくともビデオストリームとサブタイトルストリームを含む多重化ストリームが生成される。この場合、サブタイトルパケットはランダムアクセス位置に配置される。例えば、ビデオパケットおよびサブタイトルパケットはＰＥＳパケットであり、多重化ストリームはＭＰＥＧ２トランスポートストリームである、ようにされてもよい。送信部により、多重化ストリームが送信される。

　このように本技術においては、ビデオストリームとサブタイトルストリームを多重化するに当たって、サブタイトルパケットをランダムアクセス位置に配置するものである。そのため、受信側では、多重化ストリームからランダムアクセス位置のビデオパケットを取り出す際にサブタイトルパケットを併せて取り出すことができ、変速再生モードでのサブタイトル表示処理の簡単化が可能となる。

　なお、本技術において、例えば、サブタイトルエンコード部は、サブタイトルパケットのヘッダのタイムスタンプ挿入位置に、ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプを挿入する、ようにされてもよい。この場合、タイムスタンプが参照されて多重化ストリームにおけるパケット多重化が行われるとき、サブタイトルパケットはランダムアクセス位置に配置されるようになる。

　また、本技術において、例えば、サブタイトルエンコード部は、サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す独自タイムスタンプを挿入する、ようにされてもよい。この場合、受信側では、この独自タイムスタンプに基づいて、サブタイトルの表示タイミングを容易に制御可能となる。

　また、本技術において、例えば、多重化ストリーム生成部は、多重化ストリームに、サブタイトルパケットに独自タイムスタンプの挿入があることを示す識別情報を挿入する、ようにされてもよい。この場合、受信側では、この識別情報に基づいて独自タイムスタンプの挿入があることを容易に認識可能となる。この場合、例えば、識別情報には挿入位置を示す情報が付加されている、ようにされてもよい。この場合、受信側では、この挿入位置を示す情報に基づいて、独自タイムスタンプを容易に取得可能となる。

　また、本技術の他の概念は、
　ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームを受信する受信部を備え、
　上記多重化ストリームにおいて、上記サブタイトルパケットは、ランダムアクセス位置に配置されており、
　上記多重化ストリームから上記サブタイトルパケットを、上記ランダムアクセス位置のビデオパケットと共に取り出してサブタイトルの表示処理を行う処理部をさらに備える
　受信装置にある。

　本技術において、受信部により、ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームが受信される。多重化ストリームにおいて、サブタイトルパケットは、ランダムアクセス位置に配置されている。処理部により、多重化ストリームからランダムアクセス位置のビデオパケットと共にサブタイトルパケットが取り出されてサブタイトルの表示処理が行われる。

　このように本技術においては、多重化ストリームにおいてサブタイトルパケットはランダムアクセス位置に配置されており、この多重化ストリームからランダムアクセス位置のビデオパケットと共にサブタイトルパケットが取り出されてサブタイトルの表示処理が行われるものである。そのため、変速再生モードでのサブタイトル表示処理の簡単化が可能となる。

　なお、本技術において、例えば、サブタイトルパケットのヘッダのタイムスタンプ挿入位置には、ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値の第１のタイムスタンプが挿入されており、サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す第２のタイムスタンプが挿入されており、処理部は、通常再生モードでは、第２のタイムスタンプを参照してサブタイトルの表示処理を行う、ようにされてもよい。この場合、サブタイトルの表示タイミングを容易に制御可能となる。

　この場合、例えば、多重化ストリームには、サブタイトルパケットに第２のタイムスタンプの挿入があることを示す識別情報が挿入されており、処理部は、この識別情報に基づいて、サブタイトルパケットから第２のタイムスタンプを抽出して用いる、ようにされてもよい。

　本技術によれば、受信側における変速再生モードでのサブタイトル表示処理の簡単化を図ることができる。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

実施の形態としての送受信システムの構成例を示すブロック図である。放送送出システムのストリーム生成部の構成例を示すブロック図である。ＴＴＭＬ構造を説明するための図である。ＴＴＭＬ構造のヘッダ（head）に存在するメタデータ（metadata）、スタイリング（styling）、レイアウト（layout）の各要素の構造例を示す図である。ＴＴＭＬ構造のボディ（body）の構造例を示す図である。制御部内のタイミング管理部の構成例を概略的に示す図である。サブタイトル表示タイミング管理部の詳細構成を説明するための図である。ＰＥＳパケットの構成例を示す図である。ＰＥＳエクステンション“PES extension”の構成例（１/２）を示す図である。ＰＥＳエクステンション“PES extension”の構成例（２/２）を示す図である。 “PES packet data bytes”の領域に配置されるＰＥＳペイロード（PES_payload）の構成例を示す図である。ＰＥＳエクステンションおよびＰＥＳペイロードの構成例における新規要素の内容を示している。サブタイトル・ラップ・デスクリプタの構造例およびその構造例における主要な情報の内容を示す図である。トランスポートストリームＴＳの構成例を示す図である。テレビ受信機の構成例を示す図である。ＲＡＰ（Random Access Point）位置で読み出されるサブタイトルＰＥＳパケットに対するデコードおよび出力の処理タイミングを概略的に示す図である。従来の多重化に関して説明するための図である。本技術の多重化に関して説明するための図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明を以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［送受信システムの構成例］
　図１は、実施の形態としての送受信システム１０の構成例を示している。この送受信システム１０は、放送送出システム１００とテレビ受信機２００により構成されている。放送送出システム１００は、多重化ストリームとしてのトランスポートストリームＴＳを、放送波に載せて送信する。トランスポートストリームＴＳは、ビデオストリームと、サブタイトルストリームとを有している。ビデオストリームは、ペイロードに画像データを持つビデオＰＥＳパケットにより構成されている。サブタイトルストリームは、ペイロードにサブタイトル（字幕）情報を持つサブタイトルＰＥＳパケットにより構成されている。

　サブタイトルＰＥＳパケットのヘッダのタイムスタンプ挿入位置に、ランダムアクセス位置のビデオＰＥＳパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプが挿入される。また、サブタイトルＰＥＳパケットのヘッダあるいはペイロードに、サブタイトルの表示時刻を示す独自タイムスタンプが挿入される。

　サブタイトルストリームが、ビデオストリームなどと多重化される際、サブタイトルＰＥＳパケットを含むＴＳパケット（以下、単にＰＥＳパケットとする）は、ランダムアクセス位置に配置される。この場合、例えば、上述したように、ヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプが参照されて、サブタイトルＰＥＳパケットは、ランダムアクセス位置、つまりランダムアクセス位置のビデオＰＥＳパケットの位置に近接した位置に配置される。

　トランスポートストリームＴＳには、サブタイトルＰＥＳパケットに独自タイムスタンプの挿入があることを示す識別情報が挿入される。この識別情報は、例えば、プログラム・マップ・テーブルの配下に挿入される。上述したように、サブタイトルＰＥＳパケットには、そのヘッダあるいはペイロードに独自タイムスタンプが挿入される。この識別情報には、挿入位置を示す情報が付加される。

　テレビ受信機２００は、放送送出システム１００から放送波で送られてくるトランスポートストリームＴＳを受信する。このトランスポートストリームＴＳは、上述したように、少なくともビデオストリームとサブタイトルストリームを有している。なお、トランスポートストリームＴＳはオーディオストリームを含む場合もある。ビデオストリームは、ペイロードに画像データを持つビデオＰＥＳパケットにより構成されている。サブタイトルストリームは、ペイロードにサブタイトル情報を持つサブタイトルＰＥＳパケットにより構成されている。そして、このトランスポートストリームＴＳの多重化において、サブタイトルＰＥＳパケットは、ランダムアクセス位置に配置されている。

　テレビ受信機２００は、トランスポートストリームＴＳからサブタイトルＰＥＳパケットを、ランダムアクセス位置のビデオＰＥＳパケットと共に取り出して、サブタイトル（字幕）の表示処理を行う。例えば、変速再生モードでは、トランスポートストリームＴＳのランダムアクセス位置から取り出されたサブタイトルＰＥＳパケットを直ちに処理してサブタイトルを表示する。

　また、例えば、通常再生モードでは、トランスポートストリームＴＳのランダムアクセス位置から取り出されたサブタイトルＰＥＳパケットを、そのヘッダまたはペイロードに挿入されているサブタイトルの表示時刻を示す独自タイムスタンプに基づいて処理し、表示時刻にサブタイトルを表示する。この場合、テレビ受信機２００は、トランスポートストリームＴＳに挿入されている識別情報に基づいてサブタイトルＰＥＳパケットから独自タイムスタンプを抽出して用いる。

　［放送送出システムのストリーム生成部の構成例］
　図２は、放送送出システム１００のストリーム生成部１１０の構成例を示している。このストリーム生成部１１０は、制御部１１１と、ビデオエンコーダ１１２と、オーディオエンコーダ１１３と、テキストフォーマット変換部１１４と、サブタイトルエンコーダ１１５と、ＴＳフォーマッタ（マルチプレクサ）１１６を有している。

　制御部１１１は、例えば、ＣＰＵ（Central Processing Unit）を備えた構成とされており、ストリーム生成部１１０の各部の動作を制御する。ビデオエンコーダ１１２は、画像データＤＶを入力し、この画像データＤＶに対して符号化を施し、ペイロードに符号化画像データを持つビデオＰＥＳパケットにより構成されるビデオストリーム（ＰＥＳストリーム）を生成する。オーディオエンコーダ１１３は、音声データＤＡを入力し、この音声データＤＡに対して符号化を施し、符号化音声データを持つオーディオＰＥＳパケットにより構成されるオーディオストリーム（ＰＥＳストリーム）を生成する。

　テキストフォーマット変換部１１４は、サブタイトル情報としてのテキストデータ（文字コード）ＤＴを入力し、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報を得る。このテキスト情報として、例えば、ＴＴＭＬあるいはＴＴＭＬの派生フォーマットが考えられるが、この実施の形態においてはＴＴＭＬであるとする。

　図３は、ＴＴＭＬ構造を示している。ＴＴＭＬは、ＸＭＬベースで記載される。ヘッダ（head）には、メタデータ（metadata）、スタイリング（styling）、レイアウト（layout）の各要素が存在する。図４（ａ）は、メタデータ（ＴＴＭ：TTML Metadata）の構造例を示している。このメタデータには、メタデータのタイトルの情報と、コピーライトの情報が含まれている。

　図４（ｂ）は、スタイリング（ＴＴＳ：TTML Styling）の構造例を示している。このスタイリングには、識別子（id）の他に、カラー（color）、フォント（fontFamily）、サイズ（fontSize）、アラインメント（textAlign）などの情報が含まれている。図４（ｃ）は、レイアウト（region：TTML layout）の構造例を示している。このレイアウトには、サブタイトルを配置するリージョンの識別子（id）の他に、範囲（extent）、オフセット（padding）、バックグラウンドカラー（backgroundColor）、アラインメント（displayAlign）などの情報が含まれている。

　図５は、ボディ（body）の構造例を示している。図示の例では、サブタイトル１（subtitle 1）、サブタイトル２（subtitle 2）、サブタイトル３（subtitle 3）の３つのサブタイトルの情報が含まれている。サブタイトル毎に、表示開始タイミングと表示終了タイミングが記載されると共に、テキストデータが記載されている。例えば、サブタイトル１（subtitle 1）に関しては、表示開始タイミングが“０．７６ｓ”で、表示終了タイミングが“３．４５ｓ”であり、テキストデータが「It seems a paradox, dose it not,」とされている。

　図２に戻って、サブタイトルエンコーダ１１５は、テキストフォーマット変換部１１４で得られるＴＴＭＬを種々のセグメントに変換し、ペイロードにそれらのセグメント（サブタイトル情報）を配置したサブタイトルＰＥＳパケットにより構成されるサブタイトルストリーム（ＰＥＳストリーム）を生成する。

　サブタイトルエンコーダ１１５は、制御部１１１の制御のもと、サブタイトルＰＥＳパケットのヘッダのタイムスタンプ挿入位置に、ランダムアクセス位置のビデオＰＥＳパケット、つまりＲＡＰ（Random Access Point）対象のビデオＰＥＳパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプ（第１のタイムスタンプ）を挿入する。

　ここで、ＲＡＰ対象のビデオＰＥＳパケットの先頭部分は、例えば、ペイロードにイントラピクチャ（Ｉピクチャ）の符号化画像データを持つビデオＰＥＳパケットの先頭部分であることを意味する。いわゆるＲＡＰ再生では、トランスポートストリームＴＳから当該ＲＡＰ対象のビデオＰＥＳパケットに含まれるイントラピクチャの符号化画像データのみがデコードされて画像表示されていく。

　また、サブタイトルエンコーダ１１５は、制御部１１１の制御のもと、サブタイトルＰＥＳパケットのヘッダあるいはペイロードに、サブタイトルの表示時刻（表示開始時刻、表示終了時刻）を示す独自タイムスタンプ（第２のタイムスタンプ）を挿入する。

　図６は、制御部１１１内のタイミング管理部１２０の構成例を概略的に示している。このタイミング管理部１２０は、ビデオタイミング管理部１２１と、オーディオタイミング管理部１２２と、ＲＡＰタイミング管理部１２３と、サブタイトル表示タイミング管理部１２４を有している。

　ビデオタイミング管理部１２１は、各ビデオＰＥＳパケットのタイムスタンプ挿入位置に挿入すべきタイムスタンプ（ビデオのアクセスユニットのタイムスタンプ）を管理する。ビデオエンコーダ１１２では、このビデオタイミング管理部１２１の管理情報に基づいて、各ビデオＰＥＳパケットのタイムスタンプ挿入位置にタイムスタンプを挿入する。

　オーディオタイミング管理部１２２は、各オーディオＰＥＳパケットのタイムスタンプ挿入位置に挿入すべきタイムスタンプ（オーディオのアクセスユニットのタイムスタンプ）を管理する。オーディオエンコーダ１１３では、このオーディオタイミング管理部１２２の管理情報に基づいて、各オーディオＰＥＳパケットのタイムスタンプ挿入位置にタイムスタンプを挿入する。

　ＲＡＰタイミング管理部１２３は、ＲＡＰ対象のビデオＰＥＳパケットのタイムスタンプを管理すると共に、オーディオＰＥＳパケットのうち、ＲＡＰ対象とするオーディオＰＥＳパケットが管理される。この場合、ＲＡＰ対象のビデオＰＥＳパケットのタイムスタンプに近いタイムスタンプを持つオーディオＰＥＳパケットがＲＡＰ時の再生対象として扱われる。

　このＲＡＰ対象とするオーディオＰＥＳパケットの管理情報に基づいて、ＴＳフォーマッタ１１６では、後述するように、当該ＲＡＰ対象とするオーディオＰＥＳパケットがランダムアクセス位置、つまりＲＡＰ対象のビデオＰＥＳパケットの位置に近接した位置に配置することが行われる。

　サブタイトル表示タイミング管理部１２４は、サブタイトルＰＥＳパケットの第１のタイムスタンプ（ヘッダのタイムスタンプ挿入領域に挿入されるタイムスタンプ）および第２のタイムスタンプ（ヘッダまたはペイロードに挿入されるサブタイトルの表示時刻を示す独自タイムスタンプ）を管理する。サブタイトルエンコーダ１１５では、このサブタイトル表示タイミング管理部１２４の管理情報に基づいて、サブタイトルＰＥＳパケットへの第１のタイムスタンプおよび第２のタイムスタンプの挿入が行われる。

　図７は、サブタイトル表示タイミング管理部１２４の詳細構成を示している。サブタイトル表示タイミング管理部１２４は、ＲＡＰタイミング管理部１２３からのＲＡＰタイミング情報に基づいて、第１のタイムスタンプ（サブタイトルストリームのタイムスタンプ）を得る。また、サブタイトル表示タイミング管理部１２４は、ＴＴＭＬボディに含まれる相対開始時刻“ｂｅｇｉｎ”および相対終了時刻“ｅｎｄ”に対してタイムスタンプ精度換算を施し、第２のタイムスタンプ（表示開始タイムスタンプ、表示終了タイムスタンプ）を得る。

　なお、図５に示すように、複数のリージョン（region）の表示タイミングが異なる場合には、最も早いタイミングのリージョンの相対開始時刻“ｂｅｇｉｎ”および相対終了時刻“ｅｎｄ” 対してタイムスタンプ精度換算を施し、第２のタイムスタンプとしての表示開始タイムスタンプおよび表示終了タイムスタンプを得る。

　この場合、受信側では、最も早いリージョンの表示制御に関しては、当該第２のタイムスタンプとしての表示開始タイムスタンプおよび表示終了タイムスタンプが用いられる。また、後続のリージョンの表示制御に関しては、ＴＴＭＬボディで供給される最も早いリージョンの相対時刻との差に基づいてタイムスタンプ精度換算された表示タイムスタンプ（表示開始タイムスタンプ、表示終了タイムスタンプ）が生成されて用いられる。

　「第２のタイムスタンプ（独自タイムスタンプ）の挿入位置」
　ここで、第２のタイムスタンプ（独自タイムスタンプ）の挿入位置の具体例について説明する。図８は、ＰＥＳパケットの構成例（Syntax）を示している。第１のタイムスタンプに関しては、矢印Ｐで示す、ヘッダのタイムスタンプ挿入領域である３３ビット領域に挿入される。このタイムスタンプ挿入領域は、ヘッダを構成する“optional PES HEADER”の下の“optional fields”内に存在する。

　第２のタイムスタンプに関しては、上述したように、ヘッダあるいはペイロードに挿入される。ヘッダに挿入する場合、例えば、矢印Ｑに示す、“PES extension fields data”の領域に挿入される。この“PES extension fields data”は、“PES extension”の下の“optional fields”内に存在する。なお、 “PES extension”は、ヘッダを構成する“optional PES HEADER”の下の“optional fields”内に存在する。一方、ペイロードに挿入する場合、矢印Ｒに示す、“PES packet data bytes”の領域に挿入される。

　図９、図１０は、ＰＥＳエクステンション“PES extension”の構成例（Syntax）を示している。図１１は、“PES packet data bytes”の領域に配置されるＰＥＳペイロード（PES_payload）の構成例（Syntax）を示している。図１２は、各構成例における新規要素の内容（Semantics）を示している。

　最初に、図９、図１０に示すＰＥＳエクステンション（PES extension）の構成例について説明する。フラグ情報として、「PES_extension_negflag_new」のフラグ情報が新たに定義される。このフラグ情報は、ＰＥＳヘッダの拡張領域（PES extension）に新定義のデータを配置することを示す。“０”は、ＰＥＳヘッダの拡張領域に新定義のデータを配置することを示す。“１”は、ＰＥＳヘッダの拡張領域に新定義のデータを配置しないことを示す。

　「PES_extension_negflag_new」が“０”であるとき、「extension_type」の８ビットフィールドが存在する。このフィールドは、新定義のデータの種類を示す。“１”は、サブタイトルの表示開始・終了を表すタイムスタンプであることを示す。「extension_type」が“１”であるとき、「subtitle_start_time」の３３ビットフィールドと、「subtitle_end_time」の３３ビットフィールドが存在する。

　「subtitle_start_time」の３３ビットフィールドは、サブタイトル表示の開始時刻をシステムのクロック精度で表す値（表示開始タイムスタンプ）を示す。「subtitle_end_time」の３３ビットフィールドは、サブタイトル表示の終了時刻をシステムのクロック精度で表す値（表示終了タイムスタンプ）を示す。

　次に、図１１に示すＰＥＳペイロード（PES_payload）の構成例について説明する。サブタイトルＰＥＳパケットは、プライベートＰＥＳパケットとして定義される。プライベートＰＥＳパケットの場合、“PES packet data bytes”を自由に定義できることから、その一部に表示開始・終了を表すタイムスタンプが挿入される。

　「private_type」の８ビットフィールドは、プライベートＰＥＳパケットの種類を示す。“ＥＣ”は、タイムスタンプ付きのサブタイトルストリームであることを示す。「timestamp_insertion_flag」のフラグ情報は、当該パケットペイロードの最初にタイムスタンプが配置されることを示す。“１”は、タイムスタンプが配置されることを示す。“０”は、タイムスタンプが配置されないことを示す。「timestamp_insertion_flag」が“１”であるとき、「subtitle_start_time」の３３ビットフィールドと、「subtitle_end_time」の３３ビットフィールドが存在する。

　図２に戻って、ＴＳフォーマッタ１１６は、ビデオエンコーダ１１２で生成されたビデオストリーム、オーディオエンコーダ１１３で生成されたオーディオストリームおよびサブタイトルエンコーダ１１５で生成されたサブタイトルストリームを、トランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームＴＳを得る。

　このように各ストリームを多重化するとき、ＴＳフォーマッタ１１６は、サブタイトルＰＥＳパケットを、第１のタイムスタンプ（ヘッダのタイムスタンプ挿入位置に挿入されているタイムスタンプ）に基づいて、ランダムアクセス位置、つまりＲＡＰ対象のビデオＰＥＳパケットの位置に近接した位置に配置する。また、このとき、ＴＳフォーマッタ１１６は、ＲＡＰ対象とするオーディオＰＥＳパケットの管理情報に基づいて、当該ＲＡＰ対象とするオーディオＰＥＳパケットをランダムアクセス位置、つまりＲＡＰ対象のビデオＰＥＳパケットの位置に近接した位置に配置する。

　また、ＴＳフォーマッタ１１６は、トランスポートストリームＴＳに、サブタイトルＰＥＳパケットに、第２のタイムスタンプ（サブタイトルの表示時刻を示す独自タイムスタンプ）が挿入されていることを示す識別情報を挿入する。この実施の形態において、ＴＳフォーマッタ１１６は、プログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下のサブタイトルストリームに対応したサブタイトル・エレメンタリストリーム・ループに、サブタイトル・ラップ・デスクリプタ（Subtitle_rap_descriptor）を挿入する。

　図１３（ａ）は、サブタイトル・ラップ・デスクリプタの構造例(Syntax)を示している。図１３（ｂ）は、その構造例における主要な情報の内容（Semantics）を示している。「descriptor_tag」の８ビットフィールドは、デスクリプタタイプを示し、ここでは、サブタイトル・ラップ・デスクリプタであることを示す。「descriptor_length」の８ビットフィールドは、デスクリプタの長さ（サイズ）を示し、デスクリプタの長さとして以降のバイト数を示す。

　「subtitle_presentation_time_flag」のフラグ情報は、従来のタイムスタンプ（第１のタイムスタンプ）とは別のタイミング、主に遅延したタイミングでサブタイトル表示を行うかどうか、つまりサブタイトル独自の表示タイムスタンプの配置があるかどうかを示す。“１”は、遅延表示（サブタイトル独自の表示タイムスタンプの配置）を行うことを示す。“０”は、遅延表示（サブタイトル独自の表示タイムスタンプの配置）を行わないことを示す。

　「subtitle_presentation_time_flag」が“１”であるとき、「time_insertion_type」の２ビットフィールドが存在する。このフィールドは、サブタイトル独自の表示タイムスタンプの挿入タイプ、つまり当該タイムスタンプがどこに挿入されているかを示す。“０１”は、ＰＥＳヘッダエクステンション（PES header extension）部に挿入することを示す。“１０”は、ＰＥＳプライベートストリームのペイロード（PES private stream payload）に挿入することを示す。

　図１４は、トランスポートストリームＴＳの構成例を示している。この構成例では、ＰＩＤ１で識別されるビデオストリームのＰＥＳパケットであるビデオＰＥＳパケット「Video PES」が存在する。また、この構成例では、ＰＩＤ２で識別されるオーディオストリームのＰＥＳパケットであるオーディオＰＥＳパケット「Audio PES」が存在する。また、この構成例では、ＰＩＤ３で識別されるサブタイトルストリームのＰＥＳパケットであるサブタイトルＰＥＳパケット「Subtitle PES」が存在する。

　ＰＥＳパケットは、ＰＥＳヘッダ（PES header）とＰＥＳペイロード（PES payload）からなっている。ビデオＰＥＳパケットにおいて、ＰＥＳヘッダにはＤＴＳ/ＰＴＳのタイムスタンプが挿入されており、ＰＥＳペイロードにはビデオ符号化ストリーム（符号化画像データ）が挿入されている。また、オーディオＰＥＳパケットにおいて、ＰＥＳヘッダにはＰＴＳのタイムスタンプが挿入されており、ＰＥＳペイロードにはオーディオ符号化ストリーム（符号化音声データ）が挿入されている。

　また、サブタイトルＰＥＳパケットにおいて、ＰＥＳヘッダにはＰＴＳのタイムスタンプ（第１のタイムスタンプ）が挿入されており、ＰＥＳペイロードにはサブタイトル符号化ストリーム（サブタイトル情報としての複数のサブタイトルセグメント）が挿入されている。また、ＰＥＳヘッダまたはＰＥＳペイロードに、第２のタイムスタンプ（独自タイムスタンプ）としての、表示開始タイムスタンプ「subtitle_start_time」および表示終了タイムスタンプ「subtitle_end_time」が存在する。

　また、トランスポートストリームＴＳには、ＰＳＩ（Program Specific Information）として、ＰＭＴ（Program Map Table）が含まれている。このＰＳＩは、トランスポートストリームＴＳに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。また、トランスポートストリームＴＳには、イベント単位の管理を行うＳＩ（Serviced Information）としてのＥＩＴ(Event Information Table)が含まれている。このＥＩＴには、番組単位のメタデータが記載される。

　ＰＭＴには、プログラム全体に関連する情報を記述するプログラム・デスクリプタ（Program Descriptor）が存在する。また、このＰＭＴには、各エレメンタリストリームに関連した情報を持つエレメンタリストリーム・ループが存在する。この構成例では、ビデオエレメンタリストリーム・ループ（Video ES loop）、オーディオエレメンタリストリーム・ループ（Audio ES loop）、サブタイトルエレメンタリストリーム・ループ（Subtitle ES loop）が存在する。

　各ループには、パケット識別子（PID）等の情報が配置されると共に、そのエレメンタリストリームに関連する情報を記述する記述子（デスクリプタ）も配置される。サブタイトルエレメンタリストリーム・ループには、デスクリプタの一つとして、上述したサブタイトル・ラップ・デスクリプタ（Subtitle_rap_descriptor）が配置される。

　図２に示すストリーム生成部１１０の動作を簡単に説明する。画像データＤＶは、ビデオエンコーダ１１２に供給される。ビデオエンコーダ１１２では、この画像データＤＶに対して符号化が施され、ペイロードに符号化画像データを持つビデオＰＥＳパケットからなるビデオストリーム（ＰＥＳストリーム）が生成される。このビデオストリームは、ＴＳフォーマッタ１１６に供給される。

　また、音声データＤＡは、オーディオエンコーダ１１３に供給される。オーディオエンコーダ１１３では、音声データＤＡに対して符号化が施され、符号化音声データを持つオーディオＰＥＳパケットからなるオーディオストリーム（ＰＥＳストリーム）が生成される。このオーディオストリームは、ＴＳフォーマッタ１１６に供給される。

　また、サブタイトル情報としてのテキストデータ（文字コード）ＤＴは、テキストフォーマット変換部１１４に供給される。このキストフォーマット変換部１１４では、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報、ここではＴＴＭＬが得られる。このＴＴＭＬは、サブタイトルエンコーダ１１５に供給される。

　サブタイトルエンコーダ１１５では、ＴＴＭＬが種々のセグメントに変換され、ペイロードにそれらのセグメントを配置したサブタイトルＰＥＳパケットからなるサブタイトルストリームが生成される。このサブタイトルストリームは、ＴＳフォーマッタ１１６に供給される。

　サブタイトルエンコーダ１１５では、サブタイトルストリームの生成時に、制御部１１１の制御のもと、サブタイトルＰＥＳパケットのヘッダのタイムスタンプ挿入位置に、ＲＡＰ対象のビデオＰＥＳパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプ（第１のタイムスタンプ）を挿入することが行われる。

　また、サブタイトルエンコーダ１１５では、サブタイトルストリームの生成時に、制御部１１１の制御のもと、サブタイトルＰＥＳパケットのヘッダあるいはペイロードに、サブタイトルの表示時刻（表示開始時刻、表示終了時刻）を示す独自タイムスタンプ（第２のタイムスタンプ）を挿入することが行われる。

　ＴＳフォーマッタ１１６では、ビデオエンコーダ１１２で生成されたビデオストリーム、オーディオエンコーダ１１３で生成されたオーディオストリームおよびサブタイトルエンコーダ１１５で生成されたサブタイトルストリームが、トランスポートパケット化されて多重化され、多重化ストリームとしてのトランスポートストリームＴＳが生成される。

　このように各ストリームを多重化されるとき、サブタイトルＰＥＳパケットは、制御部１１１の制御のもと、第１のタイムスタンプ（ヘッダのタイムスタンプ挿入位置に挿入されているタイムスタンプ）に基づいて、ランダムアクセス位置、つまりＲＡＰ対象のビデオＰＥＳパケットの位置に近接した位置に配置される。

　また、このとき、制御部１１１の制御のもと、ＲＡＰ対象とするオーディオＰＥＳパケットの管理情報に基づいて、当該ＲＡＰ対象とするオーディオＰＥＳパケットがランダムアクセス位置、つまりＲＡＰ対象のビデオＰＥＳパケットの位置に近接した位置に配置される。

　また、ＴＳフォーマッタ１１６では、トランスポートストリームＴＳに、識別情報が挿入される。この識別情報は、サブタイトルＰＥＳパケットに第２のタイムスタンプ（サブタイトルの表示時刻を示す独自タイムスタンプ）の挿入があることを示すものである。すなわち、ＴＳフォーマッタ１１６では、プログラム・マップ・テーブル（ＰＭＴ：Program Map Table）の配下のサブタイトルストリームに対応したサブタイトル・エレメンタリストリーム・ループに、サブタイトル・ラップ・デスクリプタ（Subtitle_rap_descriptor）が配置される。

　［テレビ受信機の構成例］
　図１５は、テレビ受信機２００の構成例を示している。このテレビ受信機２００は、受信部２０１と、ＴＳ解析部（デマルチプレクサ）２０２と、ビデオデコーダ２０３と、ビデオ重畳部２０４と、パネル駆動回路２０５と、表示パネル２０６を有している。また、このテレビ受信機２００は、オーディオデコーダ２０７と、音声出力回路２０８と、スピーカ２０９と、サブタイトルデコーダ２１０を有している。また、このテレビ受信機２００は、ＣＰＵ２２１と、フラッシュＲＯＭ２２２と、ＤＲＡＭ２２３と、内部バス２２４と、リモコン受信部２２５と、リモコン送信機２２６を有している。

　ＣＰＵ２２１は、テレビ受信機２００の各部の動作を制御する。フラッシュＲＯＭ２２２は、制御ソフトウェアの格納およびデータの保管を行う。ＤＲＡＭ２２３は、ＣＰＵ２２１のワークエリアを構成する。ＣＰＵ２２１は、フラッシュＲＯＭ２２２から読み出したソフトウェアやデータをＤＲＡＭ２２３上に展開してソフトウェアを起動させ、テレビ受信機２００の各部を制御する。

　リモコン受信部２２５は、リモコン送信機２２６から送信されたリモートコントロール信号（リモコンコード）を受信し、ＣＰＵ２２１に供給する。ＣＰＵ２２１は、このリモコンコードに基づいて、テレビ受信機２００の各部を制御する。ＣＰＵ２２１、フラッシュＲＯＭ２２２およびＤＲＡＭ２２３は、内部バス２２４に接続されている。

　受信部２０１は、放送送出システム１００から放送波に載せて送られてくるトランスポートストリームＴＳを受信する。このトランスポートストリームＴＳには、上述したように、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。ＴＳ解析部２０２は、トランスポートストリームＴＳからビデオ、オーディオ、サブタイトルの各ストリームのＰＥＳパケットを抽出する。

　ここで、受信部２０１で受信されたトランスポートストリームＴＳは、蓄積媒体（バッファあるいはストレージ）２０１ａに一旦蓄積され、再生モードに対応した部分が取り出されてＴＳ解析部２０２に送られる。例えば、通常再生モードにあっては、蓄積された全てがＴＳ解析部２０２に送られる。これに対して、変速再生モードにあっては、ＲＡＰ位置（ランダムアクセス位置）の部分を含む倍速スピードに応じた間欠的な一部の部分がＴＳ解析部２０２に送られる。特に、ＲＡＰ再生モードにあっては、ＲＡＰ位置（ランダムアクセス位置）の部分のみがＴＳ解析部２０２に送られる。

　また、ＴＳ解析部２０２は、トランスポートストリームＴＳに挿入されている種々の情報を抽出し、ＣＰＵ２２１に送る。この情報には、サブタイトル・ラップ・デスクリプタ（Subtitle_rap_descriptor）の情報も含まれる。ＣＰＵ２２１は、これにより、サブタイトルＰＥＳパケットに第２のタイムスタンプ（独自タイムスタンプ）の挿入があること、およびその挿入場所を容易に認識でき、サブタイトルデコーダ２１０の制御に効果的に利用できる。

　オーディオデコーダ２０７は、ＴＳ解析部２０２で抽出されるオーディオＰＥＳパケットにデコード処理を施し、音声データを得る。音声出力回路２０８は、音声データに対して、Ｄ／Ａ変換や増幅等の必要な処理を施し、スピーカ２０９に供給する。ビデオデコーダ２０３は、ＴＳ解析部２０２で抽出されるビデオＰＥＳパケットにデコード処理を施し、画像データを得る。

　オーディオデコーダ２０７およびビデオデコーダ２０３における各ＰＥＳパケットに対するデコードおよび出力の処理は、通常再生モードにおいてはヘッダに挿入されているタイムスタンプで制御されるが、変速再生モードにおいては当該タイムスタンプで制御されず、ＴＳ解析部２０２から供給された後に直ちに行われる。

　サブタイトルデコーダ２１０は、ＴＳ解析部２０２で抽出されるサブタイトルＰＥＳパケットにデコード処理を施し、画像データに重畳すべき各リージョンのビットマップデータを得る。サブタイトルデコーダ２１０におけるサブタイトルＰＥＳパケットに対するデコードおよび出力の処理は、通常再生モードにおいてはヘッダまたはペイロードに挿入されている第２のタイムスタンプ（独自タイムスタンプ）で制御されるが、変速再生モードにおいては当該第２のタイムスタンプで制御されず、ＴＳ解析部２０２から供給された後に直ちに行われる。

　図１６は、例えば、ＲＡＰ位置で読み出されるサブタイトルＰＥＳパケットに対するデコードおよび出力の処理タイミングを概略的に示している。通常再生モードの場合には、表示開始タイムスタンプで示される時刻までにデコードが完了し、当該時刻からデコード結果としてのビットマップデータの出力が開始され、表示終了タイムスタンプで示される時刻まで継続される。この場合、表示開始タイムスタンプで示される時刻から表示終了タイムスタンプで示される時刻までがサブタイトル表示期間となる。

　これに対して、変速再生モードの場合には、蓄積媒体２０１ａからの読み出し後に直ちにデコードが行われ、デコード結果としてのビットマップデータの出力が開始される。この出力継続時間が、サブタイトル表示期間となる。この出力継続時間は、変速再生の倍速スピードと、サブタイトル表示維持の機能に依存して決まる。

　図１５に戻って、ビデオ重畳部２０４は、ビデオデコーダ２０３で得られた画像データに、サブタイトルデコーダ２１０から得られる各リージョンのビットマップデータを重畳する。パネル駆動回路２０５は、ビデオ重畳部２０４で得られる表示用の画像データに基づいて、表示パネル２０６を駆動する。表示パネル２０６は、例えば、ＬＣＤ(Liquid Crystal Display)、有機ＥＬディスプレイ（organic electroluminescence display）などで構成されている。

　図１５に示すテレビ受信機２００の動作を簡単に説明する。受信部２０１では、放送送出システム１００から放送波に載せて送られてくるトランスポートストリームＴＳが受信される。このトランスポートストリームＴＳには、ビデオストリーム、オーディオストリームおよびサブタイトルストリームが含まれている。

　このトランスポートストリームＴＳは、蓄積媒体２０１ａを通じて、ＴＳ解析部２０２に供給される。この場合、再生モードに対応した部分が取り出されてＴＳ解析部２０２に送られる。例えば、通常再生モードにあっては、蓄積された全てがＴＳ解析部２０２に送られる。これに対して、変速再生モードにあっては、ＲＡＰ位置（ランダムアクセス位置）の部分を含む倍速スピードに応じた間欠的な一部の部分がＴＳ解析部２０２に送られる。特に、ＲＡＰ再生モードにあっては、ＲＡＰ位置（ランダムアクセス位置）の部分のみがＴＳ解析部２０２に送られる。

　ＴＳ解析部２０２で抽出されるビデオＰＥＳパケットは、ビデオデコーダ２０３に供給される。ビデオデコーダ２０３では、ＴＳ解析部２０２で抽出されるビデオＰＥＳパケットにデコード処理が施されて、画像データが得られる。各ビデオＰＥＳパケットに対するデコードおよび出力の処理は、通常再生モードにおいてはヘッダに挿入されているタイムスタンプで制御されるが、変速再生モードにおいては当該タイムスタンプで制御されず、ＴＳ解析部２０２から供給された後に直ちに行われる。この画像データは、ビデオ重畳部２０４に供給される。

　また、ＴＳ解析部２０２で抽出されるサブタイトルストリーム（ＰＥＳストリーム）は、サブタイトルデコーダ２１０に供給される。サブタイトルデコーダ２１０では、各リージョンのセグメントデータが処理され、画像データに重畳すべき各リージョンのビットマップデータが得られる。各サブタイトルＰＥＳパケットに対するデコードおよび出力の処理は、通常再生モードにおいてはヘッダまたはペイロードに挿入されている第２のタイムスタンプ（独自タイムスタンプ）で制御されるが、変速再生モードにおいては当該第２のタイムスタンプで制御されず、ＴＳ解析部２０２から供給された後に直ちに行われる（図１６参照）。

　サブタイトルデコーダ２１０から出力される各リージョンのビットマップデータは、ビデオ重畳部２０４に供給される。ビデオ重畳部２０４では、ビデオデコーダ２０３で得られた画像データに、サブタイトルデコーダ２１０から出力される各リージョンのビットマップデータが重畳される。

　ビデオ重畳部２０４で得られる表示用の画像データは、パネル駆動回路２０５に供給される。パネル駆動回路２０５では、表示用のビデオデータに基づいて、表示パネル２０６を駆動することが行われる。これにより、表示パネル２０６には、サブタイトルの重畳された画像が表示される。この場合、通常再生モードでは通常速度の通常再生画像となり、変速再生モードでは倍速スピードに応じた変速再生画像となる。

　また、ＴＳ解析部２０２で抽出されるオーディオＰＥＳパケットは、オーディオデコーダ２０７に供給される。オーディオデコーダ２０７では、オーディオＰＥＳパケットにデコード処理が施されて、音声データが得られる。各オーディオＰＥＳパケットに対するデコードおよび出力の処理は、通常再生モードにおいてはヘッダに挿入されているタイムスタンプで制御されるが、変速再生モードにおいては当該タイムスタンプで制御されず、ＴＳ解析部２０２から供給された後に直ちに行われる。

　この音声データは、音声出力回路２０８に供給される。音声出力回路２０８では、音声データに対して、Ｄ／Ａ変換や増幅等の必要な処理が行われる。そして、処理後の音声データはスピーカ２０９に供給される。これにより、スピーカ２０９からは表示パネル２０６の表示画像に対応した音声出力が得られる。

　以上説明したように、図１に示す送受信システム１０においては、送信側で多重化ストリームとしてのトランスポートストリームＴＳを生成するに当たって、サブタイトルＰＥＳパケットがランダムアクセス位置に配置されるものである。そのため、受信側では、多重化ストリームからランダムアクセス位置のビデオＰＥＳパケットを取り出す際にサブタイトルＰＥＳパケットを併せて取り出すことができ、変速再生モードでのサブタイトル表示処理が簡単となる。

　例えば、図１７は、従来の多重化に関して示している。図１７（ａ）は、ビデオストリームを構成するビデオＰＥＳパケット列を示している。「V_TS00」、「V_TS10」、「V_TS20」、「V_TS30」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「V0」、「V10」、「V20」、「V30」、・・・は、ペイロードに配置された符号化画像データを示している。

　図１７（ｂ）は、オーディオストリームを構成するオーディオＰＥＳパケット列を示している。「A_TS00」、「A_TS10」、「A_TS20」、「A_TS30」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「A0」、「A10」、「A20」、「A30」、・・・は、ペイロードに配置された符号化音声データを示している。

　図１７（ｃ）は、サブタイトルストリームを構成するサブタイトルＰＥＳパケット列を示している。「S_TS15」、「S_TS19」、「S_TS35」、「A_TS39」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「S15」、「S19」、「S35」、「S39」、・・・は、ペイロードに配置されたサブタイトル情報を示している。サブタイトルＰＥＳパケットのヘッダには、ビデオＰＥＳパケットやオーディオＰＥＳパケットのヘッダに挿入されるタイムスタンプとは関係なく、タイムスタンプが挿入される。

　図１７（ｄ）は、多重化ストリーム（トランスポートストリームＴＳ）における各ＰＥＳパケットの配置の一例を示している。多重化に当たっては、各ＰＥＳパケットのヘッダに挿入されているタイムスタンプが参照されて、各ＰＥＳパケットの配置が決定される。この場合、サブタイトルＰＥＳパケットは、ＲＡＰ位置（ランダムアクセス位置）とは無関係に、表示期間の少し前の位置に配置される。

　ＲＡＰ再生では、例えば、図１７（ｅ）の再生方法１に示すように、ＲＡＰ位置毎にある程度の長さでＰＥＳパケットが読み出されてデコード処理が行われて、画像表示や音声出力が行われる。この場合、ＲＡＰ位置にサブタイトルＰＥＳパケットが必ずしも配置されていないので、サブタイトル表示はされない。

　なお、このＲＡＰ再生でも、サブタイトル表示を行うためには、図１７（ｆ）の再生方法２に示すように、ＲＡＰ位置の読み出しの他に、サブタイトルＰＥＳパケットの読み出しも行っていくことが考えられる。この場合には、ＲＡＰ位置の読み出しのためのジャンプの他に、サブタイトルＰＥＳパケットを読み出すためのジャンプを繰り返す必要があり、再生処理が複雑となる。また、サブタイトルＰＥＳパケットの読み出しが行われるまで画像表示や音声出力を待つことにもなるので、画像表示や音声出力の遅延が発生する。

　図１８は、本技術の多重化に関して示している。１８（ａ）は、ビデオストリームを構成するビデオＰＥＳパケット列を示している。「V_TS00」、「V_TS10」、「V_TS20」、「V_TS30」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「V0」、「V10」、「V20」、「V30」、・・・は、ペイロードに配置された符号化画像データを示している。

　図１８（ｂ）は、オーディオストリームを構成するオーディオＰＥＳパケット列を示している。「A_TS00」、「A_TS10」、「A_TS20」、「A_TS30」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「A0」、「A10」、「A20」、「A30」、・・・は、ペイロードに配置された符号化画像データを示している。

　図１８（ｃ）は、サブタイトルストリームを構成するサブタイトルＰＥＳパケット列を示している。「S_TS10」、「S_TS30」、・・・は、ヘッダに挿入されたタイムスタンプを示し、「S10」、「S130」、・・・は、ペイロードに配置されたサブタイトル情報を示している。サブタイトルＰＥＳパケットのヘッダには、ＲＡＰ対象のビデオＰＥＳパケットのヘッダに挿入されるタイムスタンプと同じか、あるいは近傍の値のタイムスタンプ（第１のタイムスタンプ）が挿入される。

　図１８（ｄ）は、多重化ストリーム（トランスポートストリームＴＳ）における各ＰＥＳパケットの配置の一例を示している。多重化に当たっては、各ＰＥＳパケットのヘッダに挿入されているタイムスタンプが参照されて、各ＰＥＳパケットの配置が決定される。この場合、サブタイトルＰＥＳパケットは、ＲＡＰ対象のビデオＰＥＳパケットやオーディオＰＥＳパケットと同様に、ＲＡＰ位置（ランダムアクセス位置）に配置される。

　ＲＡＰ再生では、例えば、図１８（ｅ）の再生方法３に示すように、ＲＡＰ位置毎にある程度の長さでＰＥＳパケットが読み出されてデコード処理が行われる。この場合、ビデオＰＥＳパケットやオーディオＰＥＳパケットと共に、サブタイトルＰＥＳパケットも読み出されてデコード処理されることから、画像表示や音声出力と共に、サブタイトル表示も良好に行われる。

　このように本技術のように多重化が行われることで、図１７（ｆ）に示す再生方法２のような、ＲＡＰ位置の読み出しのためのジャンプの他に、サブタイトルＰＥＳパケットを読み出すためのジャンプを繰り返すということが必要なく、サブタイトル表示を可能とするための受信側における変速再生処理が簡単となる。

　また、図１に示す送受信システム１０においては、サブタイトルＰＥＳパケットのヘッダまたはペイロードにサブタイトルの表示時刻を示す第２のタイムスタンプ（独自タイムスタンプ）が挿入されるものである。そのため、受信側では、この独自タイムスタンプに基づいて、サブタイトルの表示タイミングを容易に制御可能となる。

　また、図１に示す送受信システム１０においては、トランスポートストリームＴＳに、サブタイトルＰＥＳパケットに独自タイムスタンプの挿入があることを示す識別情報が挿入されるものである。そのため、受信側では、この識別情報に基づいて独自タイムスタンプの挿入があることを容易に認識でき、独自タイムスタンプの抽出を効率よく行うことができる。

　＜２．変形例＞
　なお、上述実施の形態においては、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報としてＴＴＭＬを用いる例を示した。しかし、本技術は、これに限定されず、ＴＴＭＬと同等の情報を持つその他のタイムドテキスト情報を用いることも考えらえる。例えば、ＴＴＭＬの派生フォーマットを用いてもよい。また、本技術は、サブタイトルのフォーマットとしては従来タイプのビットマップ方式も全く同様に適用できることは当然である。

　また、上述実施の形態においては、放送送出システム１００とテレビ受信機２００とからなる送受信システム１０を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、テレビ受信機２００の部分が、ＨＤＭＩ（High-Definition Multimedia Interface）などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「ＨＤＭＩ」は登録商標である。

　また、本技術は、以下のような構成を取ることもできる。
　（１）ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成するビデオエンコード部と、
　ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成するサブタイトルエンコード部と、
　上記ビデオストリームと上記サブタイトルストリームを含む多重化ストリームを生成する多重化ストリーム生成部と、
　上記多重化ストリームを送信する送信部を備え、
　上記多重化ストリーム生成部は、
　上記サブタイトルパケットを、ランダムアクセス位置に配置する
　送信装置。
　（２）上記サブタイトルエンコード部は、
　上記サブタイトルパケットのヘッダのタイムスタンプ挿入位置に、上記ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプを挿入する
　前記（１）に記載の送信装置。
　（３）上記サブタイトルエンコード部は、
　上記サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す独自タイムスタンプを挿入する
　前記（２）に記載の送信装置。
　（４）上記多重化ストリーム生成部は、
　上記多重化ストリームに、上記サブタイトルパケットに上記独自タイムスタンプの挿入があることを示す識別情報を挿入する
　前記（３）に記載の送信装置。
　（５）上記識別情報には、挿入位置を示す情報が付加されている
　前記（４）に記載の送信装置。
　（６）上記サブタイトル情報は、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報である
　前記（１）から（５）のいずれかに記載の送信装置。
　（７）上記所定フォーマットのサブタイトルのテキスト情報は、ＴＴＭＬあるいは該ＴＴＭＬの派生フォーマットである
　前記（６）に記載の送信装置。
　（８）上記ビデオパケットおよび上記サブタイトルパケットはＰＥＳパケットであり、
　上記多重化ストリームはＭＰＥＧ２トランスポートストリームである
　前記（１）から（７）のいずれかに記載の送信装置。
　（９）ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成するビデオエンコードステップと、
　ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成するサブタイトルストリーム生成ステップと、
　上記ビデオストリームと上記サブタイトルストリームを含む多重化ストリームを生成する多重化ストリーム生成ステップと、
　送信部により、上記多重化ストリームを送信する送信ステップを有し、
　上記多重化ストリーム生成ステップでは、
　上記サブタイトルパケットを、ランダムアクセス位置に配置する
　送信方法。
　（１０）ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームを受信する受信部を備え、
　上記多重化ストリームにおいて、上記サブタイトルパケットはランダムアクセス位置に配置されており、
　上記多重化ストリームから上記サブタイトルパケットを、上記ランダムアクセス位置のビデオパケットと共に取り出してサブタイトルの表示処理を行う処理部をさらに備える
　受信装置。
　（１１）上記サブタイトルパケットのヘッダのタイムスタンプ挿入位置には、上記ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値の第１のタイムスタンプが挿入されており、
　上記サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す第２のタイムスタンプが挿入されており、
　上記処理部は、
　通常再生モードでは、上記第２のタイムスタンプを参照してサブタイトルの表示処理を行う
　前記（１０）に記載の受信装置。
　（１２）上記多重化ストリームには、上記サブタイトルパケットに上記第２のタイムスタンプの挿入があることを示す識別情報が挿入されており、
　上記処理部は、上記識別情報に基づいて、上記サブタイトルパケットから上記第２のタイムスタンプを抽出して用いる
　前記（１１）に記載の受信装置。
　（１３）受信部により、ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームを受信する受信ステップを有し、
　上記多重化ストリームにおいて、上記サブタイトルパケットはランダムアクセス位置に配置されており、
　上記多重化ストリームから上記サブタイトルパケットを、上記ランダムアクセス位置のビデオパケットと共に取り出してサブタイトルの表示処理を行う処理ステップをさらに有する
　受信方法。

　本技術の主な特徴は、多重化ストリームとしてのトランスポートストリームＴＳを生成するに当たって、サブタイトルＰＥＳパケットをランダムアクセス位置に配置することで、受信側における変速再生モードでのサブタイトル表示処理の簡単化を図るようにしたことである（図１８参照）。

　１０・・・送受信システム
　１００・・・放送送出システム
　１１０・・・ストリーム生成部
　１１１・・・制御部
　１１２・・・ビデオエンコーダ
　１１３・・・オーディオエンコーダ
　１１４・・・テキストフォーマット変換部
　１１５・・・サブタイトルエンコーダ
　１１６・・・ＴＳフォーマッタ（マルチプレクサ）
　１２０・・・タイミング管理部
　１２１・・・ビデオタイミング管理部
　１２２・・・オーディオタイミング管理部
　１２３・・・ＲＡＰタイミング管理部
　１２４・・・サブタイトル表示タイミング管理部
　２００・・・テレビ受信機
　２０１・・・受信部
　２０１ａ・・・蓄積媒体
　２０２・・・ＴＳ解析部
　２０３・・・ビデオデコーダ
　２０４・・・ビデオ重畳部
　２０５・・・パネル駆動回路
　２０６・・・表示パネル
　２０７・・・オーディオデコーダ
　２０８・・・音声出力回路
　２０９・・・スピーカ
　２１０・・・サブタイトルデコーダ
　２２１・・・ＣＰＵ

Claims

　ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成するビデオエンコード部と、
　ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成するサブタイトルエンコード部と、
　上記ビデオストリームと上記サブタイトルストリームを含む多重化ストリームを生成する多重化ストリーム生成部と、
　上記多重化ストリームを送信する送信部を備え、
　上記多重化ストリーム生成部は、
　上記サブタイトルパケットを、ランダムアクセス位置に配置する
　送信装置。
　上記サブタイトルエンコード部は、
　上記サブタイトルパケットのヘッダのタイムスタンプ挿入位置に、上記ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値のタイムスタンプを挿入する
　請求項１に記載の送信装置。
　上記サブタイトルエンコード部は、
　上記サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す独自タイムスタンプを挿入する
　請求項２に記載の送信装置。
　上記多重化ストリーム生成部は、
　上記多重化ストリームに、上記サブタイトルパケットに上記独自タイムスタンプの挿入があることを示す識別情報を挿入する
　請求項３に記載の送信装置。
　上記識別情報には、挿入位置を示す情報が付加されている
　請求項４に記載の送信装置。
　上記サブタイトル情報は、表示タイミング情報を持つ所定フォーマットのサブタイトルのテキスト情報である
　請求項１に記載の送信装置。
　上記所定フォーマットのサブタイトルのテキスト情報は、ＴＴＭＬあるいは該ＴＴＭＬの派生フォーマットである
　請求項６に記載の送信装置。
　上記ビデオパケットおよび上記サブタイトルパケットはＰＥＳパケットであり、
　上記多重化ストリームはＭＰＥＧ２トランスポートストリームである
　請求項１に記載の送信装置。
　ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームを生成するビデオエンコードステップと、
　ペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを生成するサブタイトルストリーム生成ステップと、
　上記ビデオストリームと上記サブタイトルストリームを含む多重化ストリームを生成する多重化ストリーム生成ステップと、
　送信部により、上記多重化ストリームを送信する送信ステップを有し、
　上記多重化ストリーム生成ステップでは、
　上記サブタイトルパケットを、ランダムアクセス位置に配置する
　送信方法。
　ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームを受信する受信部を備え、
　上記多重化ストリームにおいて、上記サブタイトルパケットはランダムアクセス位置に配置されており、
　上記多重化ストリームから上記サブタイトルパケットを、上記ランダムアクセス位置のビデオパケットと共に取り出してサブタイトルの表示処理を行う処理部をさらに備える
　受信装置。
　上記サブタイトルパケットのヘッダのタイムスタンプ挿入位置には、上記ランダムアクセス位置のビデオパケットのヘッダのタイムスタンプ挿入位置に挿入されるタイムスタンプの値と同じか、あるいは近傍の値の第１のタイムスタンプが挿入されており、
　上記サブタイトルパケットのヘッダまたはペイロードに、サブタイトルの表示時刻を示す第２のタイムスタンプが挿入されており、
　上記処理部は、
　通常再生モードでは、上記第２のタイムスタンプを参照してサブタイトルの表示処理を行う
　請求項１０に記載の受信装置。
　上記多重化ストリームには、上記サブタイトルパケットに上記第２のタイムスタンプの挿入があることを示す識別情報が挿入されており、
　上記処理部は、上記識別情報に基づいて、上記サブタイトルパケットから上記第２のタイムスタンプを抽出して用いる
　請求項１１に記載の受信装置。
　受信部により、ペイロードに符号化画像データを持つビデオパケットにより構成されるビデオストリームとペイロードにサブタイトル情報を持つサブタイトルパケットにより構成されるサブタイトルストリームを含む多重化ストリームを受信する受信ステップを有し、
　上記多重化ストリームにおいて、上記サブタイトルパケットはランダムアクセス位置に配置されており、
　上記多重化ストリームから上記サブタイトルパケットを、上記ランダムアクセス位置のビデオパケットと共に取り出してサブタイトルの表示処理を行う処理ステップをさらに有する
　受信方法。