[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6984586B2 - 送信装置、送信方法、受信装置および受信方法 - Google Patents

送信装置、送信方法、受信装置および受信方法 Download PDF

Info

Publication number
JP6984586B2
JP6984586B2 JP2018504385A JP2018504385A JP6984586B2 JP 6984586 B2 JP6984586 B2 JP 6984586B2 JP 2018504385 A JP2018504385 A JP 2018504385A JP 2018504385 A JP2018504385 A JP 2018504385A JP 6984586 B2 JP6984586 B2 JP 6984586B2
Authority
JP
Japan
Prior art keywords
stream
data
information
audio
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018504385A
Other languages
English (en)
Other versions
JPWO2017154646A1 (ja
Inventor
郁夫 塚越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JPWO2017154646A1 publication Critical patent/JPWO2017154646A1/ja
Application granted granted Critical
Publication of JP6984586B2 publication Critical patent/JP6984586B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23614Multiplexing of additional data and video streams
    • H04N21/23617Multiplexing of additional data and video streams by inserting additional data into a data carousel, e.g. inserting software modules into a DVB carousel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23605Creation or processing of packetized elementary streams [PES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/23805Controlling the feeding rate to the network, e.g. by controlling the video pump
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • H04N21/26233Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving content or additional data duration or size, e.g. length of a movie, size of an executable file
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4343Extraction or processing of packetized elementary streams [PES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4345Extraction or processing of SI, e.g. extracting service information from an MPEG stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

本技術は、送信装置、送信方法、受信装置および受信方法に関し、特に、ビデオ、オーディオなどのメディア符号化ストリームに所定情報を挿入して送信する送信装置等に関する。
例えば、特許文献1には、放送局、配信サーバ等から所定情報をオーディオ圧縮データストリームに挿入して送信し、受信側のセットトップボックスがこのオーディオ圧縮データストリームをそのままHDMIのデジタルインタフェースを介してテレビ受信機に送信し、テレビ受信機が当該所定情報を利用した情報処理を行うことが提案されている。
特開2012−010311号公報
本技術の目的は、メディア符号化ストリームに所定情報を挿入して送信することを良好に行い得るようにすることにある。
本技術の概念は、
メディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入部と、
上記所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
上記情報挿入部は、
上記所定情報のビットレートが所定ビットレートに収まるように、上記所定情報を分割する
送信装置にある。
本技術において、情報挿入部により、メディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が順次挿入される。各分割部分には、再構成のための順番情報が付加される。この場合、この所定情報のビットレートが所定ビットレートに収まるように分割される。そして、送信部により、所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナが送信される。
例えば、情報挿入部は、所定の情報を、各分割部分のデータサイズが固定サイズとなるように分割する、ようにされてもよい。この場合、例えば、情報挿入部は、ターゲットビットレートからメディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する単位部分の数で割ることにより固定サイズを算出する、ようにされてもよい。
また、例えば、情報挿入部は、所定情報を、分割部分が挿入された各単位部分のデータサイズが固定サイズとなるように分割する、ようにされてもよい。この場合、例えば、情報挿入部は、ターゲットビットレートからメディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する単位部分の数で割って得られた第1のサイズと、メディア符号化ストリームのビットレートを1秒間で発生する単位部分の数で割って得られた第2のサイズとを加算することで固定サイズを算出する、ようにされてもよい。また、ターゲットビットレート、そして、挿入するデータのメディア符号化に対するビットレート比を受信機側が認識できるよう、識別情報として伝送するようにしてもよい。
このように本技術においては、メディア符号化ストリームの所定数の単位部分にビットレートが所定ビットレートに収まるように所定情報を分割して得た各分割部分を挿入して送信するものである。そのため、メディア符号化ストリームを含めた全体のビットレートをターゲットビットレートに抑えることができ、メディア符号化ストリームに所定の情報を挿入して送信することを良好に行い得る。
なお、本技術において、例えば、情報挿入部は、1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入し、1つ以上のメディア符号化ストリームの所定数の単位部分に挿入される各分割部分に、他のメディア符号化ストリームへの分割部分の挿入があるか識別するための識別情報を付加する、ようにされてもよい。所定情報を分割して得た各分割部分を多くのメディア符号化ストリームを用いて送信することで、所定情報の全体の送信に必要な時間の短縮が可能となる。この場合、受信側では、各分割部分に付加されている識別情報に基づいて、他のメディア符号化ストリームへの分割部分の挿入があることを容易に認識でき、所定情報の全ての分割部分の取り出しを効率的に行い得る。
この場合、例えば、コンテナに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入があることを示す識別情報を挿入する識別情報挿入部をさらに備える、ようにされてもよい。これにより、受信側では、所定情報の分割部分の挿入があるメディア符号化ストリームを容易に識別可能となる。そして、この場合、識別情報挿入部は、コンテナに、1つ以上の上記メディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、他のメディア符号化ストリームが存在するとき、この他のメディア符号化ストリームを示す識別情報をさらに挿入する、ようにされてもよい。
また、本技術の他の概念は、
1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入部と、
上記所定情報の分割部分が挿入された上記1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信部を備える
送信装置にある。
本技術において、1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が順次挿入される。各分割部分には、再構成のための順番情報が付加される。送信部により、所定情報の分割部分が挿入された1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナが送信される。
このように本技術においては、1つ以上のメディア符号化ストリームの所定数の単位部分に所定情報を分割して得た各分割部分を挿入して送信するものである。そのため、多くのメディア符号化ストリームを用いて送信することで、所定情報の全体の送信に必要な時間の短縮が可能となる。
なお、本技術において、例えば、情報挿入部は、1つ以上のメディア符号化ストリームにそれぞれ挿入される各分割部分に、他の上記メディアストリームへの分割部分の挿入があるか識別する識別情報を付加する、ようにされてもよい。この場合、受信側では、各分割部分に付加されている識別情報に基づいて、他のメディア符号化ストリームへの分割部分の挿入があることを容易に認識でき、所定情報の全ての分割部分の取り出しを効率的に行い得る。
また、本技術において、例えば、コンテナに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入があることを示す識別情報を挿入する識別情報挿入部をさらに備える、ようにされてもよい。これにより、受信側では、所定情報の分割部分の挿入があるメディア符号化ストリームを容易に識別可能となる。そして、この場合、識別情報挿入部は、コンテナに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、他のメディア符号化ストリームが存在するとき、この他のメディア符号化ストリームを示す識別情報をさらに挿入する、ようにされてもよい。
また、本技術の他の概念は、
1つ以上のメディア符号化ストリームを受信するストリーム受信部を備え、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて順次挿入されており、
上記1つ以上のメディア符号化ストリームの上記所定数の単位部分から上記所定情報の各分割部分を取り出し、上記順番情報に基づいて上記所定情報を再構成する処理と、該再構成された所定情報を利用した情報処理を制御する制御部をさらに備える
受信装置にある。
本技術において、受信部により、1つ以上のメディア符号化ストリームが受信される。例えば、ストリーム受信部は、1つ以上のメディア符号化ストリームを、外部機器からデジタルインタフェースを介して受信する、ようにされてもよい。
1つ以上のメディア符号化ストリームの所定数の単位部分から所定情報の各分割部分が取り出され、順番情報に基づいて、所定情報が再構成される。そして、再構成された所定情報を利用した情報処理が行われる。
例えば、1つ以上のメディア符号化ストリームの所定数の単位部分に挿入されている分割部分に、他のメディア符号化ストリームへの分割部分の挿入があるか識別するための識別情報が付加されており、所定情報を再構成する処理では、識別情報に基づいて、1つ以上のメディア符号化ストリームの所定数の単位部分から所定情報の各分割部分を取り出す、ようにされてもよい。
このように本技術においては、1つ以上のメディア符号化ストリームの所定数の単位部分から所定情報の各分割部分を取り出して順番情報に基づいて再構成し、この再構成された所定情報を利用した情報処理を行うものである。そのため、所定情報の再構成を適切に行うことができ、情報処理を良好に行い得る。
また、本技術の他の概念は、
1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が再構成のための順番情報が付加されて順次挿入されており、
上記コンテナに、上記1つ以上のメディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入があることを示す識別情報が挿入されており、
上記識別情報に基づいて上記所定情報の分割部分の挿入がある上記1つ以上のメディア符号化ストリームを上記外部機器にデジタルインタフェースを介して送信する送信部をさらに備える
受信装置にある。
本技術において、受信部により、1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナが受信される。1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて順次挿入されている。また、コンテナに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入があることを示す識別情報が挿入されている。送信部により、識別情報に基づいて、所定情報の分割部分の挿入がある1つ以上のメディア符号化ストリームが、外部機器に、デジタルインタフェースを介して送信される。
このように本技術においては、コンテナに挿入されている識別情報に基づいて、所定情報の分割部分の挿入がある1つ以上のメディア符号化ストリームを外部機器にデジタルインタフェースを介して送信するものである。そのため、外部機器では、1つ以上のメディア符号化ストリームから所定情報の各分割部分の全てを取り出し、所定情報を再構成して利用することが可能となる。
本技術によれば、メディア符号化ストリームに所定情報を挿入して送信することを良好に行い得る。なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。
実施の形態としての送受信システムの構成例を示すブロック図である。 放送送出装置が備えるストリーム生成部の構成例を示すブロック図である。 所定数のオーディオフレームに挿入すべき各分割部分のサイズを決定するための処理手順の一例を示すフローチャートである。 挿入データDTの分割の一例と、各分割部分f(i)をオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示す図である。 所定数のオーディオフレームに挿入すべき各分割部分のサイズを決定するための処理手順の一例を示すフローチャートである。 挿入データDTの分割の一例と、各分割部分f(i)をオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示す図である。 MPEG−H 3D Audioの伝送データにおけるオーディオフレームの構造例を示す図である。 パケットタイプとその値の対応関係を示す図である。 ジェネリックデータ(generic_data)をMETADATAパケットに配置するために用いるエントリの構造例を示す図である。 ジェネリックデータ(generic_data)の構造例を示す図である。 ジェネリックデータ(generic_data)の構造例における主要な情報の内容を示す図である。 タイムインフォメーション(time_information)の構造例を示す図である。 タイムインフォメーション(time_information)の構造例における主要な情報の内容を示す図である。 データコンテナ・デスクリプタ(data_container descriptor)の構造例を示す図である。 データコンテナ・デスクリプタ(data_container descriptor)の構造例における主要な情報の内容を示す図である。 放送送出装置が備えるストリーム生成部の他の構成例を示すブロック図である。 挿入データDTの分割の一例と、各分割部分f(i)を2つのオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示す図である。 挿入データDTの分割の一例と、各分割部分f(i)を2つのオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示す図である。 コンテナ対象データが、複数のジェネリックデータ(generic_data)で伝送される場合の例を示す図である。 コンテナ対象データが、1つのジェネリックデータ(generic_data)で伝送される場合の例を示す図である。 複数のコンテナ対象データが、複数のジェネリックデータ(generic_data)で伝送される場合の例を示す図である。 複数のコンテナ対象データの実行が、それに付加されている時刻情報に基づいて、オーディオ PTSとは独立して、管理される例を示す図である。 受信側におけるコンテナ対象データ(所定情報)の実行が、オーディオタイムスタンプ非依存で行い得ることを示す図である。 複数のコンテナ対象データが、それに付加されている時刻情報に基づいて同期管理される具体例を示す図である。 トランスポートストリームTSの構造例を示す図である。 セットトップボックスの構成例を示すブロック図である。 テレビ受信機の構成例を示すブロック図である。 オーディオデコーダの構成例を示すブロック図である。 1つのオーディオストリームAS1に対するエクストラクタの処理例を概略的に示す図である。 2つのオーディオストリームAS1,AS2に対するエクストラクタの処理例を概略的に示す図である。 セットトップボックスのHDMI送信部とテレビ受信機のHDM受信部の構成例を示すブロック図である。 TMDSチャネルにおいて、横×縦が1920ピクセル×1080ラインの画像データが伝送される場合の、各種の伝送データの区間を示す図である。 セットトップボックスおよびテレビ受信機におけるネゴシエーションを伴った動作の一例を示す図である。 放送送出装置が備えるストリーム生成部の他の構成例を示すブロック図である。 トランスポートストリームTSの他の構造例を示す図である。 AC4のシンプルトランスポート(Simple Transport)のレイヤの構造を示す図である。 TOC(ac4_toc())およびサブストリーム(ac4_substream_data())の概略構成を示す図である。 MMTのトランスポートストリームの構造例を示す図である。 MMTのトランスポートストリームの他の構造例を示す図である。 オーディオ圧縮フォーマットがMPEG−H 3D AudioあるいはAC4である場合におけるオーディオトラック(トラックA)のデータを含むMP4ストリーム(ファイル)の構成例を示す図である。 データ挿入ストリームが2つのオーディオストリームである場合におけるMPDファイル記述例を示す図である。 データ挿入ストリームがオーディオストリームとビデオストリームである場合におけるMPDファイル記述例を示す図である。 MPDファイル記述例における主要な情報の内容を示す図である。 送受信システムの他の構成例を示すブロック図である。
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明を以下の順序で行う。
1.実施の形態
2.変形例
<1.実施の形態>
[送受信システムの構成例]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、放送送出装置100と、セットトップボックス(STB)200と、テレビ受信機(TV)300を有している。セットトップボックス200とテレビ受信機300は、HDMIケーブル400を介して接続されている。この場合、セットトップボックス200がソースで、テレビ受信機300はディスティネーションである。なお、「HDMI」は登録商標である。
放送送出装置100は、コンテナ(多重化ストリーム)としてのMPEG−2 トランスポートストリーム(以下、単に、「トランスポートストリームTS」と称する)を、放送波に載せて送信する。このトランスポートストリームTSには、メディア符号化ストリームとしてのビデオストリームおよびオーディオストリームが含まれる。
また、放送送出装置100は、1つ以上のメディア符号化ストリーム、この実施の形態においては1つ以上のオーディオストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して、順次挿入する。なお、所定数は1を含むものとする。所定数が1であるとき、所定情報は、実際には分割されず、その全体が1つの単位部分に挿入される。所定情報は、ネットワークアクセス情報、コマンド情報、メディアファイルなどである。所定情報を分割して得た各分割部分を多くのメディア符号化ストリームを用いて送信することで、所定情報の全体の送信に必要な時間の短縮が可能となる。
ここで、単位部分は、例えば、アクセスユニットである。このアクセスユニットは、メディア符号化ストリームがオーディオストリームである場合は所定数のオーディオサンプルデータを束ねたオーディオフレームを意味し、メディア符号化ストリームがビデオストリームである場合はピクチャを意味する。
また、放送送出装置100は、所定情報のビットレートが所定ビットレートに収まるように、所定情報を分割する。このように分割することで、メディア符号化ストリームを含めた全体のビットレートをターゲットビットレートに抑えることができ、メディア符号化ストリームに所定の情報を挿入して送信することを良好に行い得る。
例えば、所定情報は、各分割部分のデータサイズが固定サイズとなるように分割される。この場合、例えば、ターゲットビットレートからメディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する単位部分の数で割ることにより、固定サイズが算出される。
また、例えば、所定情報は、分割部分が挿入された各単位部分のデータサイズが固定サイズとなるように分割される。このとき、各分割部分のデータサイズは変動したものとなる。この場合、例えば、ターゲットビットレートからメディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する単位部分の数で割って得られた第1のサイズと、メディア符号化ストリームのビットレートを1秒間で発生する単位部分の数で割って得られた第2のサイズとを加算することで、固定サイズが算出される。
また、放送送出装置100は、1つ以上のメディア符号化ストリームの所定数の単位部分に挿入される各分割部分に、他のメディア符号化ストリームへの分割部分の挿入があるか識別する識別情報を付加する。この場合、受信側では、各分割部分に付加されている識別情報に基づいて、他のメディア符号化ストリームへの分割部分の挿入があることを容易に認識でき、所定情報の全ての分割部分の取り出しを効率的に行い得る。
また、放送送出装置100は、コンテナとしてのトランスポートストリームTSに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入があることを示す識別情報を挿入する。このように識別情報を挿入することで、受信側では、所定情報の分割部分の挿入があるメディア符号化ストリームを容易に識別可能となる。
また、放送送出装置100は、コンテナとしてのトランスポートストリームTSに、1つ以上のメディア符号化ストリームのそれぞれに対応して、所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、他のメディア符号化ストリームが存在するとき、この他のメディア符号化ストリームを示す識別情報を挿入する。
セットトップボックス200は、放送送出装置100から放送波に載せて送信されてくるトランスポートストリームTSを受信する。このトランスポートストリームTSには、上述したように、メディア符号化ストリーム(ビデオストリーム、オーディオストリーム)が含まれている。そして、この実施の形態においては、1つ以上のオーディオストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて、順次挿入されている。
セットトップボックス200は、受信されたビデオストリームにデコード処理を施して得られた非圧縮のビデオデータと共に、受信された1つ以上のオーディオストリームそのものを、HDMIケーブル400を介して、テレビ受信機300に送信する。上述したように、トランスポートストリームTSには、1つ以上のオーディオストリームのそれぞれに対応して、所定情報の分割部分の挿入があることを示す識別情報が挿入されている。
セットトップボックス200は、この識別情報に基づいて、所定情報の分割部分の挿入がある1つ以上のオーディオストリームの全てをテレビ受信機300に送信する。セットトップボックス200は、テレビ受信機300が1つ以上のオーディオストリームのうちの一部のデコード能力しか持たない場合であっても、その一部のオーディオストリームだけではなく所定情報の分割部分の挿入がある1つ以上のオーディオストリームの全てをテレビ受信機300に送信する。これにより、テレビ受信機300では、1つ以上のメディア符号化ストリームから所定情報の各分割部分の全てを取り出し、所定情報を再構成して利用することが可能となる。
テレビ受信機300は、セットトップボックス200から、HDMIケーブル400を介して、非圧縮のビデオデータと共に、所定情報の分割部分の挿入がある1つ以上のオーディオストリームを受信する。テレビ受信機300は、非圧縮のビデオデータによる画像を表示する。また、テレビ受信機300は、デコード能力に応じて、1つ以上のオーディオストリームの全部または一部にデコード処理を行って非圧縮のオーディオデータを得て、それによる音声を出力する。
また、テレビ受信機300は、1つ以上のオーディオストリームから所定情報の分割部分を取り出し、順番情報に基づいて所定情報を再構成する。そして、テレビ受信機300は、再構成された所定情報を利用した情報処理、例えば、メディアアクセス情報によってメディアデータを取得し、そのメディアデータによる画像表示、音声出力をする処理などを行う。
[放送送出装置のストリーム生成部]
図2は、放送送出装置100が備えるストリーム生成部110Aの構成例を示している。このストリーム生成部110Aでは、1つのオーディオストリームが生成され、その所定数のオーディオフレームに、所定情報(挿入データ)を分割して得た各分割部分が挿入される。このストリーム生成部110Aは、CPU111と、ビデオエンコーダ112と、オーディオエンコーダ113と、スプリッタ114と、インサータ115と、マルチプレクサ116を有している。なお、スプリッタ114やインサータ115は、オーディオエンコーダ113あるいはCPU111の一部として含まれる構成であってもよい。
CPU111は、ストリーム生成部110Aの各部を制御する。ビデオエンコーダ112は、ビデオデータ(画像データ)SVに対して、MPEG2、H.264/AVC、H.265/HEVCなどの符号化を施し、ビデオストリーム(ビデオエレメンタリストリーム)を生成する。ビデオデータSVは、例えば、HDD(hard disk drive)などの記録媒体から再生されたビデオデータ、あるいはビデオカメラで得られたライブビデオデータなどである。
オーディオエンコーダ113は、オーディオデータ(音声データ)SAに対して、MPEG−H 3D Audioの圧縮フォーマットによる符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。オーディオデータSAは、上述のビデオデータSVに対応しており、HDDなどの記録媒体から再生されたオーディオデータ、あるいはマイクロホンで得られたライブオーディオデータなどである。
スプリッタ114は、所定情報を構成する挿入データDTを分割して、所定数の分割部分f(i)を得る。インサータ115は、オーディオストリームの所定数のオーディオフレームに、スプリッタ114で分割されて得られた所定数の分割部分を、再構成のための順番情報を付加して、順次挿入する。この順番情報には、例えば、最初の分割部分であるか、最後の分割部分であるか、何番目の分割部分であるかなどの情報が含まれる。
スプリッタ114は、この挿入データDTのビットレートが所定ビットレート、ここでは許容ビットレートに収まるように、分割する。
この場合、スプリッタ114は、例えば、以下の(1)または(2)の方法で、挿入データDTを分割する。
(1)挿入データDTを各分割部分のデータサイズが固定サイズとなるように分割する。
(2)挿入データDTを各分割部分が挿入されたオーディオフレームのデータサイズが固定サイズとなるように分割する。
(1)の方法で分割する場合について説明する。この場合、スプリッタ114は、CPU111が指定するターゲットビットレートTRからオーディオエンコーダ113で生成されるオーディオストリームR_EM1から認識されるオーディオストリームのビットレートCRを差し引いて許容ビットレートAVR(=TR−CR)を算出する。なお、許容ビットレートAVRはオーディオ符号化ストリームのビットレートとの割合が指定されて算出されてもよいし、あるいは、許容ビットレートAVR自体が指定されてもよい。
そして、スプリッタ114は、以下の数式(1)により、許容ビットレートAVRを1秒間で発生するオーディオフレームの数AU_frecで割って、固定サイズAISを算出する。なお、数式(1)で求められる固定サイズの単位はバイトである。
AIS=AVR/8/AU_frec ・・・(1)
図3のフローチャートは、(1)の方法で分割する場合における、所定数のオーディオフレームに挿入すべき各分割部分のサイズを決定するための処理手順の一例を示している。スプリッタ114は、ステップST1において、処理を開始する。そして、スプリッタ114は、ステップST2において、i=0とし、さらに、ステップST3において、ISS(i)=AISとし、その後にステップST4の処理に移る。
このステップST4において、スプリッタ114は、挿入データDTの残りサイズNがISS(i)以下であるか否かを判断する。この残りサイズNの最初は、挿入データDTのサイズN_Originに一致する。NがISS(i)以下でないとき、スプリッタ114は、ステップST5において、i番目のオーディオフレームに挿入すべき分割部分f(i)のサイズをISS(i)とする。
次に、スプリッタ114は、ステップST6において、N=N−ISS(i)とし、さらに、ステップST7において、i=i+1として、ステップST3の処理に戻り、次のオーディオストリームに挿入すべき分割部分f(i)のサイズを決定する処理に移る。
ステップST4において、NがISS(i)以下であるとき、スプリッタ114は、ステップST8において、i番目のオーディオフレームに挿入すべき分割部分f(i)のサイズをNとする。このステップST8の処理の後、スプリッタ114は、ステップST9において、処理を終了する。
図4は、(1)の方法で分割した場合における挿入データDTの分割の一例と、各分割部分f(i)をオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示している。図示の例では、挿入データDTがf0、f1、f2、f3、f4、f5の6つの分割部分に分割され、それぞれが、オーディオストリームのA0,A1,A2,A3,A4,A5のオーディオフレームに挿入されている。
この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動がそのまま反映されたものとなる。なお、“ACS”は、後述するが、オーディオストリームのビットレートCRを1秒間で発生するオーディオフレームの数AU_frecで割って得られたデータサイズ、つまりオーディオストリームの各オーディオフレームの平均データサイズを示している。
次に、(2)の方法で分割する場合について説明する。この場合、スプリッタ114は、CPU111が指定するターゲットビットレートTRからオーディオエンコーダ113で生成されるオーディオストリームR_EM1から認識されるオーディオストリームのビットレートCRを差し引いて許容ビットレートAVR(=TR−CR)を算出する。そして、スプリッタ114は、上述の数式(1)により、許容ビットレートAVRを1秒間で発生するオーディオフレームの数AU_frecで割って、第1のサイズAISを算出する。
また、スプリッタ114は、以下の数式(2)により、オーディオストリームのビットレートCRを1秒間で発生するオーディオフレームの数AU_frecで割って、第2のサイズACSを算出する。この第2のサイズは、オーディオストリームの各オーディオフレームの平均データサイズを示す。そして、スプリッタ114は、第1のサイズAISと第2のサイズACSを加算して、固定サイズを算出する。
ACS=CR/8/AU_frec ・・・(2)
図5は、(2)の方法で分割する場合における、所定数のオーディオフレームに挿入すべき各分割部分のサイズを決定するための処理手順の一例を示している。スプリッタ114は、ステップST11において、処理を開始する。そして、スプリッタ114は、ステップST12において、i=0とし、さらに、ステップST13において、ISS(i)=(ACS+AIS)−AU(i)とし、その後にステップST14の処理に移る。ここで、AU(i)は、挿入データDTの分割部分を挿入するi番目のオーディオフレームのデータサイズである。
ステップST14において、スプリッタ114は、ISS(i)が、図10に示すsyntaxのheader に相当するバイト数(HDB)より大きいか否かを判断する。ISS(i)がHDB以下であるとき、スプリッタ114は、ステップST15において、i番目のオーディオフレームに挿入すべき分割部分f(i)のサイズを0とする。スプリッタ114は、ステップST15の処理の後、ステップST16でi=i+1として、ステップST13の処理に戻り、次のオーディオストリームに挿入すべき分割部分f(i)のサイズを決定する処理に移る。
ステップST14でISS(i)がHDBより大きいとき、スプリッタ114は、ステップST17において、挿入データDTの残りサイズNがISS(i)以下であるか否かを判断する。この残りサイズNの最初は、挿入データDTのサイズN_Originに一致する。NがISS(i)以下でないとき、スプリッタ114は、ステップST18において、i番目のオーディオフレームに挿入すべき分割部分f(i)のサイズをISS(i)とする。
次に、スプリッタ114は、ステップST19において、N=N−ISS(i)とし、さらに、ステップST16において、i=i+1として、ステップST13の処理に戻り、次のオーディオストリームに挿入すべき分割部分f(i)のサイズを決定する処理に移る。
ステップST17において、NがISS(i)以下であるとき、スプリッタ114は、ステップST20において、i番目のオーディオフレームに挿入すべき分割部分f(i)のサイズをNとする。このステップST20の処理の後、スプリッタ114は、ステップST21において、処理を終了する。
図6は、(2)の方法で分割した場合における挿入データDTの分割の一例と、各分割部分f(i)をオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示している。図示の例では、挿入データDTがf0、f1、f2、f3、f4、f5の6つの分割部分に分割され、それぞれが、オーディオストリームのA0,A1,A2,A3,A4,A5のオーディオフレームに挿入されている。
この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動によらず、挿入データDTの最後の分割部分が挿入されるオーディオフレームを除き、一定のデータサイズとなる。なお、図示の例においては、挿入データDTの最後の分割部分が挿入されるオーディオフレームについても、(ACS+AIS)の一定のデータサイズとなっている。
図7は、MPEG−H 3D Audioの伝送データにおけるオーディオフレームの構造例を示している。このオーディオフレームは、複数のMPEGオーディオストリームパケット(mpeg Audio Stream Packet)からなっている。各MPEGオーディオストリームパケットは、ヘッダ(Header)とペイロード(Payload)により構成されている。
ヘッダは、パケットタイプ(Packet Type)、パケットラベル(Packet Label)、パケットレングス(Packet Length)などの情報を持つ。ペイロードには、ヘッダのパケットタイプで定義された情報が配置される。このペイロード情報には、同期スタートコードに相当する“SYNC”と、3Dオーディオの伝送データの実際のデータである“Frame”と、この“Frame”の構成を示す“Config”が存在する。
“Frame”には、3Dオーディオの伝送データを構成するチャネル符号化データやオブジェクト符号化データが含まれる。ここで、チャネル符号化データは、SCE(Single Channel Element)、CPE(Channel Pair Element)、LFE(Low Frequency Element)などの符号化サンプルデータで構成される。また、オブジェクト符号化データは、SCE(Single Channel Element)の符号化サンプルデータと、それを任意の位置に存在するスピーカにマッピングさせてレンダリングするためのメタデータにより構成される。このメタデータは、エクステンションエレメント(Ext_element)として含まれる。
この実施の形態では、“SYNC”、“Config”、“Frame”などと同様に、パケットタイプ(Packet Type)により“Metadata”が指定されるものとし、そのパケットにおいて、所定情報の分割部分を持つジェネリックデータ(generic_data)を新たに定義する。
図8は、パケットタイプ(Packet Type)の値で識別するパケットの種別を示している。「0」として“FILLDATA”、「1」として“MPEGH3DACFG”、「2」として“MPEGH3DAFRAME”、「6」として“SYNC”などが定義されている。これに例えば「128」として“METADATA”を定義することが可能である。
メタデータのパケットのフォーマットは、例えば、図9に構造例を示すエントリを用いて配置される。具体的には、ジェネリックデータ(generic_data)は、「itu_t_t135_payload_byte」のフィールドに、配置される。
図10はジェネリックデータ(generic_data)の構造例(syntax)を示し、図11はその構造例における主要な情報の内容(semantics)を示している。「start_flag」の1ビットフィールドは、コンテナ対象データ(所定情報=挿入データDT)の開始か否か、つまり挿入分割部分にコンテナ対象データの最初のバイトを含むか否かを示す。「end_flag」の1ビットフィールドは、コンテナ対象データの終了か否か、つまり挿入分割部分にコンテナ対象データの最後のバイトを含むか否かを示す。
「joint_delivery_flag」の1ビットフィールドは、分割されたコンテナ対象データ(分割部分)が複数のメディア符号化ストリームに挿入されるか否か、つまり他のメディア符号化ストリームにも分割部分の挿入があるか否かを示す。「fcounter」の13ビットフィールドは、分割されたコンテナ対象データ(挿入分割部分)の分割位置を昇順のカウント数で示す。この「fcounter」は、上述した「start_flag」、「end_flag」と共に、分割部分の順番情報を構成している。「data_id」の8ビットフィールドは、コンテナ対象データのIDを示す。「payload_length」の8ビットフィールドは、ペイロードのサイズをバイト数で示す。
「start_flag」が“1”であって、コンテナ対象データの開始であるとき、「data_type」の8ビットフィールド、「payload_identifier」の8ビットフィールド、「target_data_size」の16ビットフィールドが存在する。「data_type」は、データの種別を示す。例えば、“0x01”はネットワークアクセスの用途向けであることを示す。「payload_identifier」は、コンテナ対象データの種類を示す。例えば、“0x01”はURLデータであることを示し、“0x02”はタイムスタンプであることを示す。「target_data_size」は、コンテナ対象データのサイズを示す。「data_payload_byte」のフィールドは、コンテナ対象データの配置領域を示す。この配置領域に、コンテナ対象データの分割部分が配置される。
図12は、「payload_identifier」が“0x02”である場合におけるコンテナ対象データである、タイムインフォメーション(time_information)の構造例(syntax)を示し、図13はその構造例における主要な情報の内容(semantics)を示している。
「absolute_time_flag」の1ビットフィールドは、実行時刻がUTC絶対時刻であるか基準時刻からの差分値であるかを示す。“1”は、UTC絶対時刻であることを示す。“0”は、基準時刻からの差分値であることを示す。
「absolute_time_flag」が“1”であるとき、「exec_time_msw」の32ビットフィールドと、「exec_time_1sw」の32ビットフィールドが存在する。「exec_time_msw」のフィールドは、データの実行時刻であるUTC絶対時刻の上位32ビットを示し、「exec_time_1sw」のフィールドは、その下位32ビットを示す。
「absolute_time_flag」が“0”であるとき、「reference_UTC_msw」の32ビットフィールドと、「reference_UTC_lsw」の32ビットフィールドと、「offset_exec_time_msw」の32ビットフィールドと、「offset_exec_time_1sw」の32ビットフィールドが存在する。「reference_UTC_msw」のフィールドは、基準時刻の上位32ビットを示し、「reference_UTC_lsw」のフィールドは、基準時刻の下位32ビットを示す。「offset_exec_time_msw」のフィールドは、データの実行時刻である基準時刻からの差分値の上位32ビットを示し、「offset_exec_time_1sw」のフィールドは、その下位32ビットを示す。
図2に戻って、マルチプレクサ116は、ビデオエンコーダ112から出力されるビデオストリームと、インサータ115から出力される、所定情報(挿入データDT)の各分割部分が挿入されたオーディオストリームとを、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。
また、マルチプレクサ114は、トランスポートストリームTSに、オーディオストリームに対応して、所定情報の挿入があることを示す識別情報などを挿入する。具体的には、プログラムマップテーブル(PMT)の配下のオーディオエレメンタリストリームループ内に、データコンテナ・デスクリプタ(data_container descriptor)を挿入する。
図14は、データコンテナ・デスクリプタの構造例(Syntax)を示している。また、図15は、その構造例における主要な情報の内容(Semantics)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示す。ここでは、データコンテナ・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして、以降のバイト数を示す。
「data_insertion_flag」の1ビットフィールドは、当該ストリーム内に所定情報の挿入があるか示す。“1”は挿入があることを示し、“0”は挿入がないことを示す。「joint_stream_delivery_flag」の1ビットフィールドは、コンテンツ対象データ(所定情報)の挿入が、当該ストリームに加え、他のストリームにもあるか示す。“1”は他のストリームにもデータ挿入があることを示し、“0”は他のストリームにはデータ挿入がないことを示す。
「media_stream_id」の6ビットフィールドは、当該ストリームの識別番号を示す。「joint_stream_delivery_flag」が“1”であるとき、「number_of_joint_streams」の8ビットフィールドが存在する。このフィールドは、コンテンツ対象データ(所定情報)が挿入されている他のストリームの数(1以上)を示す。この数だけ、「media_stream_id」の8ビットフィールド、「data_bitrate」の8ビットフィールド、「data_insertion_ratio」の8ビットフィールドが存在する。「media_stream_id」のフィールドは、ストリームの識別番号を示す。「data_bitrate」のフィールドは、データ挿入後のビットレート(ターゲットビットレート)を1000bps単位の値で示す。「data_insertion_ratio」のフィールドは、メディア符号化ストリームのビットレート(CR:compressed media_data_bitrate)を基準とした、挿入データのビットレート(AVR:inserted_data_bitrate)の割合(Ratio)を示す。その場合、割合の算出は次式のようなものになる。
Ratio = inserted_data_bitrate / compressed media_data_bitrate
図2に示すストリーム生成部110Aの動作を簡単に説明する。ビデオデータSVはビデオエンコーダ112に供給される。このビデオエンコーダ112では、ビデオデータSVに対してH.264/AVC、H.265/HEVCなどの符号化が施され、符号化ビデオデータを含むビデオストリームが生成される。
また、オーディオデータSAは、オーディオエンコーダ113に供給される。このオーディオエンコーダ113では、そのオーディオデータSAに対して、MPEG−H 3D Audioの圧縮フォーマットによる符号化が施され、オーディオストリームR_EM1が生成される。
また、所定情報としての挿入データDTは、スプリッタ114に供給される。このスプリッタ114では、挿入データDTが分割されて、所定数の分割部分f(i)が得られる。この場合、挿入データDTのビットレートが許容ビットレートAVRに収まるように分割される。この許容ビットレートAVRは、CPU111から指定されるターゲットビットレートTRからオーディオストリームR_EM1のビットレートCRを差し引くことで算出される。
オーディオエンコーダ113で得られたオーディオストリームR_EM1はインサータ115に供給され、さらにこのインサータ115にスプリッタ114で得られた挿入データDTの所定数の分割部分f(i)が供給される。このインサータ115では、オーディオストリームの所定数のオーディオフレームに、挿入データDTの所定数の分割部分f(i)が、再構成のための順番情報が付加されて、順次挿入される。
ビデオエンコーダ112で生成されたビデオストリームは、マルチプレクサ116に供給される。また、このマルチプレクサ116に、インサータ115で挿入データDTが挿入されたオーディオストリームが供給される。このマルチプレクサ116では、各ストリームがパケット化されて多重され、伝送データとしてトランスポートストリームTSが得られる。
また、デスクリプタ116では、プログラムマップテーブル(PMT)の配下のオーディオエレメンタリストリームループ内に、データコンテナ・デスクリプタ(図14参照)が挿入される。このデスクリプタには、対応するオーディオストリームに所定情報(挿入データDT)の挿入があることを示す識別情報などが含まれている。
図16は、放送送出装置100が備えるストリーム生成部110Bの構成例を示している。このストリーム生成部110Bでは、2つのオーディオストリームが生成され、その所定数のオーディオフレームに、所定情報(挿入データ)を分割して得た各分割部分が挿入される。この図16において、図2と対応する部分には、同一符号を付して示している。
このストリーム生成部110Bは、CPU111と、ビデオエンコーダ112と、オーディオエンコーダ113-1,113-2と、スプリッタ114と、インサータ115-1,115-2と、マルチプレクサ116を有している。なお、スプリッタ114やインサータ115-1,115-2は、オーディオエンコーダ113-1,113-2あるいはCPU111の一部として含まれる構成であってもよい。
CPU111は、ストリーム生成部110Bの各部を制御する。ビデオエンコーダ112は、ビデオデータSVに対して、MPEG2、H.264/AVC、H.265/HEVCなどの符号化を施し、ビデオストリーム(ビデオエレメンタリストリーム)を生成する。ビデオデータSVは、例えば、HDD(hard disk drive)などの記録媒体から再生されたビデオデータ、あるいはビデオカメラで得られたライブビデオデータなどである。
オーディオエンコーダ113-1,113-2は、それぞれ、オーディオデータSA1,SA2に対して、MPEG−H 3D Audioの圧縮フォーマットによる符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。オーディオデータSA1,SA2の組み合わせとしては種々が考えられる。
例えば、オーディオデータSA1はチャネルデータであり、オーディオデータSA2はオブジェクトデータである。また、例えば、オーディオデータSA1はステレオデータであり、オーディオデータSA2はその他のチャネルのデータである。オーディオデータSA1,SA2は、上述のビデオデータSVに対応しており、HDDなどの記録媒体から再生されたオーディオデータ、あるいはマイクロホンで得られたライブオーディオデータなどである。
スプリッタ114は、詳細説明は省略するが、図2のストリーム生成部100Aのスプリッタ114と同様にして、所定情報を構成する挿入データDTを分割して、所定数の分割部分f(i)を得る。この場合、それぞれのオーディオストリームに挿入される挿入データDTのビットレートが許容ビットレートに収まるように、上述の(1)または(2)の方法で分割される。
インサータ115-1,115-2は、それぞれ、詳細説明は省略するが、図2のストリーム生成部100Aにおけるインサータ115と同様にして、オーディオエンコーダ113-1,113-2で生成されたオーディオストリームR_EM1,R_EM2の所定数のオーディオフレームに、スプリッタ114で分割されて得られた所定数の分割部分f(i)を、再構成のための順番情報を付加して、順次挿入する。
図17は、(1)の方法で分割した場合における挿入データDTの分割の一例と、各分割部分f(i)を2つのオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示している。図示の例では、挿入データDTがf0、f1、f2、f3、f4、f5の6つの分割部分に分割されている。
そして、f0、f2、f4の3つの分割部分が、それぞれオーディオエンコーダ113-1で生成されたオーディオストリームR_EM1のA0,A1,A2のオーディオフレームに挿入されている。また、f1、f3、f5の3つの分割部分が、それぞれオーディオエンコーダ113-2で生成されたオーディオストリームR_EM2のB0,B1,B2のオーディオフレームに挿入されている。
ここで、スプリッタ114は、CPU111から指定されるターゲットビットレートTR1からオーディオストリームR_EM1のビットレートCR1を差し引いて許容ビットレートAVR1を算出する。そして、スプリッタ114は、この許容ビットレートAVR1を1秒間で発生するオーディオフレームの数AU_frecで割って、固定サイズAIS1、つまりf0、f2、f4のサイズを決定する。この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動がそのまま反映されたものとなる。
また、スプリッタ114は、CPU111から指定されるターゲットビットレートTR2からオーディオストリームR_EM2のビットレートCR2を差し引いて許容ビットレートAVR2を算出する。そして、スプリッタ114は、この許容ビットレートAVR2を1秒間で発生するオーディオフレームの数AU_frecで割って、固定サイズAIS2、つまりf0、f2、f4のサイズを決定する。この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動がそのまま反映されたものとなる。
図18は、(2)の方法で分割した場合における挿入データDTの分割の一例と、各分割部分f(i)を2つのオーディオストリームの対応するオーディオフレームに挿入した場合における各オーディオフレームのサイズの推移の一例を示している。図示の例では、挿入データDTがf0、f1、f2、f3、f4、f5の6つの分割部分に分割されている。
そして、f0、f2、f4の3つの分割部分が、それぞれオーディオエンコーダ113-1で生成されたオーディオストリームR_EM1のA0,A1,A2のオーディオフレームに挿入されている。また、f1、f3、f5の3つの分割部分が、それぞれオーディオエンコーダ113-2で生成されたオーディオストリームR_EM2のB0,B1,B2のオーディオフレームに挿入されている。
ここで、スプリッタ114は、CPU111から指定されるターゲットビットレートTR1からオーディオストリームR_EM1のビットレートCR1を差し引いて許容ビットレートAVR1を算出する。そして、スプリッタ114は、この許容ビットレートAVR1を1秒間で発生するオーディオフレームの数AU_frecで割って第1のサイズAIS1を算出する。また、スプリッタ114は、オーディオストリームR_EM1のビットレートCR1を1秒間で発生するオーディオフレームの数AU_frecで割って、第2のサイズACS1を算出する。
スプリッタ114は、第1のサイズAIS1と第2のサイズACS1を加算して固定サイズ(AIS1+ACS1)を求め、この固定サイズから挿入先のオーディオフレームのデータサイズを差し引いて、f0、f2、f4のサイズを決定する。この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動によらず、挿入データDTの最後の分割部分が挿入されるオーディオフレームを除き、一定のデータサイズとなる。
また、スプリッタ114は、CPU111から指定されるターゲットビットレートTR2からオーディオストリームR_EM2のビットレートCR2を差し引いて許容ビットレートAVR2を算出する。そして、スプリッタ114は、この許容ビットレートAVR2を1秒間で発生するオーディオフレームの数AU_frecで割って、第1のサイズAIS2を算出する。また、スプリッタ114は、オーディオストリームR_EM2のビットレートCR2を1秒間で発生するオーディオフレームの数AU_frecで割って、第2のサイズACS2を算出する。
スプリッタ114は、第1のサイズAIS2と第2のサイズACS2を加算して固定サイズ(AIS2+ACS2)を求め、この固定サイズから挿入先のオーディオフレームのデータサイズを差し引いて、f1、f3、f5のサイズを決定する。この場合、挿入後の各オーディオフレームのデータサイズは、挿入前の各オーディオフレームのデータサイズの変動によらず、挿入データDTの最後の分割部分が挿入されるオーディオフレームを除き、一定のデータサイズとなる。
なお、AIS1,ACS1,AIS2,ACS2は、それぞれ、以下の数式(4)、(5)、(6)、(7)で算出される。
AIS1=AVR1/8/AU_frec ・・・(4)
ACS1=CR1/8/AU_frec ・・・(5)
AIS2=AVR2/8/AU_frec ・・・(6)
ACS2=CR1/8/AU_frec ・・・(7)
図16に戻って、マルチプレクサ116は、ビデオエンコーダ112から出力されるビデオストリームと、インサータ115-1,115-2から出力される、所定情報(挿入データDT)の各分割部分が挿入された2つのオーディオストリームを、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。
また、マルチプレクサ116は、トランスポートストリームTSに、2つのオーディオストリームに対応して、所定情報の挿入があることを示す識別情報などを挿入する。具体的には、プログラムマップテーブル(PMT)の配下の2つのオーディオエレメンタリストリームループ内に、データコンテナ・デスクリプタ(図14参照)を挿入する。
図16に示すストリーム生成部110Bの動作を簡単に説明する。ビデオデータSVはビデオエンコーダ112に供給される。このビデオエンコーダ112では、ビデオデータSVに対してH.264/AVC、H.265/HEVCなどの符号化が施され、符号化ビデオデータを含むビデオストリームが生成される。
また、オーディオデータSA1,SA2は、それぞれ、オーディオエンコーダ113-1,113-2に供給される。このオーディオエンコーダ113-1,113-2では、それぞれ、オーディオデータSA1,SA2に対して、MPEG−H 3D Audioの圧縮フォーマットによる符号化が施され、オーディオストリームR_EM1,R_EM2が生成される。
また、所定情報としての挿入データDTは、スプリッタ114に供給される。このスプリッタ114では、挿入データDTが分割されて、所定数の分割部分f(i)が得られる。この場合、挿入データDTのビットレートが、2つのオーディオストリームR_EM1,R_EM2に関する許容ビットレートAVR1,AVR2に収まるように分割される。許容ビットレートAVR1,AVR2は、それぞれ、CPU111から指定されるターゲットビットレートTR1,TR2からオーディオストリームR_EM1,R_EM2のビットレートCR1,CR2を差し引くことで算出される。
オーディオエンコーダ113-1,113-2で得られたオーディオストリームR_EM1,R_EM2はインサータ115-1,115-2に供給され、さらにこのインサータ115-1,115-2にスプリッタ114で得られた挿入データDTの所定数の分割部分f(i)が供給される。このインサータ115-1,115-2では、オーディオストリームR_EM1,R_EM2の所定数のオーディオフレームに、挿入データDTの所定数の分割部分f(i)が、再構成のための順番情報が付加されて、順次挿入される。
ビデオエンコーダ112で生成されたビデオストリームは、マルチプレクサ116に供給される。また、このマルチプレクサ116に、インサータ115-1,115-2で挿入データDTが挿入されたオーディオストリームが供給される。このマルチプレクサ116では、各ストリームがパケット化されて多重され、伝送データとしてトランスポートストリームTSが得られる。
また、デスクリプタ116では、プログラムマップテーブル(PMT)の配下の2つのオーディオストリームにそれぞれ対応した2つのオーディオエレメンタリストリームループ内に、データコンテナ・デスクリプタ(図14参照)が挿入される。このデスクリプタには、対応するオーディオストリームに所定情報(挿入データDT)の挿入があることを示す識別情報、所定情報(挿入データDT)の挿入が当該ストリームに加えて他のストリームにもあるかを示す識別情報などが含まれている。
[コンテナ対象データ(所定の情報)の挿入]
オーディオストリームへのコンテナ対象データ(所定情報=挿入データDT)の挿入についてさらに説明する。図19は、コンテナ対象データが、複数のジェネリックデータ(generic_data)(図10参照)で伝送される場合の例を示している。
この場合、コンテナ対象データは複数に分割され、複数の分割部分のそれぞれが複数のジェネリックデータに振り分けられ、「data_payload_byte」のフィールドに挿入される。ここで、最初の分割部分に対応した「start_flag」は“1”とされ、最初の分割部分であることが示される。また、最初の分割部分に対応した「fcounter」は“0” とされる。さらに、この最初の分割部分に対応して、「target_data_size」のフィールドが存在し、コンテナ対象データの全体サイズが示される。
2番目以降の分割部分に対応した「start_flag」は“0”とされ、最初の分割部分でないことが示される。2番目以降の分割部分に対応した「fcounter」は順次インクリメントされたカウント数とされる。分割個数がnであるとき、最後の分割部分に対応した「fcounter」は“n−1”となる。最後の分割部分に対応した「end_flag」は“1”とされ、最後の分割部分であることが示される。
図20は、コンテナ対象データが、1つのジェネリックデータ(generic_data)で伝送される場合の例を示している。この場合、コンテナ対象データは分割されずに、1つのジェネリックデータの「data_payload_byte」のフィールドに挿入される。ここで、「start_flag」は“1”とされ、最初の分割部分であることが示される。また、「end_flag」は“1”とされ、最後の分割部分であることが示される。従って、これらの情報から、分割されていないことが示される。また、この分割部分に対応して、「target_data_size」のフィールドが存在し、コンテナ対象データの全体サイズが示される。
図21は、複数のコンテナ対象データが、複数のジェネリックデータ(generic_data)で伝送される場合の例を示している。図示の例は、「data_id」が“0”で示されるコンテナ対象データAと、「data_id」が“1”であるコンテナ対象データBの2つのコンテナ対象データが伝送される場合の例である。
この場合、コンテナ対象データAは3分割され、3つの分割部分のそれぞれが3つのジェネリックデータに振り分けられ、「data_payload_byte」のフィールドに挿入される。ここで、最初の分割部分に対応した「start_flag」は“1”とされ、最初の分割部分であることが示される。また、最初の分割部分に対応した「fcounter」は“0” とされる。また、この最初の分割部分に対応して、「target_data_size」のフィールドが存在し、コンテナ対象データの全体サイズが示される。
2番目の分割部分に対応した「start_flag」は“0”とされ、最初の分割部分でないことが示される。また、2番目の分割部分に対応した「end_flag」は“0”とされ、最後の分割部分でないことが示される。また、2番目の分割部分に対応した「fcounter」は“1”とされる。また、3番目の分割部分に対応した「end_flag」は“1”とされ、最後の分割部分であることが示される。そして、最後の分割部分に対応した「fcounter」は“2”とされる。
また、コンテナ対象データBは分割されずに、1つのジェネリックデータ(generic_data)の「data_payload_byte」のフィールドに挿入される。ここで、「start_flag」は“1”とされ、最初の分割部分であることが示される。また、「end_flag」は“1”とされ、最後の分割部分であることが示される。従って、これらの情報から、分割されていないことが示される。また、この分割部分に対応して、「target_data_size」のフィールドが存在し、コンテナ対象データの全体サイズが示される。
[コンテナ対象データ(所定の情報)の同期管理]
コンテナ対象データ(所定情報)の同期管理について説明する。図22は、複数のコンテナ対象データの実行が、それに付加されている時刻情報に基づいて、オーディオ PTSとは独立して、管理される例を示している。
この例では、「data_id」が“1”であるコンテナ対象データはそれに対応した実行時刻(exec_time)のタイミングで実行が開始され、「data_id」が“2”であるコンテナ対象データはそれに対応した実行時刻のタイミングで実行が開始され、さらに、「data_id」が“3”であるコンテナ対象データはそれに対応した実行時刻のタイミングで実行が開始される。
図23は、受信側におけるコンテナ対象データ(所定情報)の実行が、オーディオタイムスタンプ非依存で行い得ることを示している。この例では、コンテナ対象データが3つ(Data_0-0,Data_0-1,Data_0-2)に分割されて、3つのオーディオフレームに振り分けられて挿入されている。
また、この例では、コンテナ対象データの実行時刻が基準時刻からの差分値OFSで与えられている場合を示し、この基準時刻が“Audio timestamp(n)”に一致する場合を示している。この“Audio timestamp(n)”は、オーディオフレーム0(Frame 0)がデコードされて得られたオーディオデータ(オーディオサンプル)の出力が開始されるタイミングを示している。この“Audio timestamp(n)”は「UTC値」に対応している。
3つのオーディオフレームに分割挿入されて伝送されるコンテナ対象データは、基準時刻に差分値OFSが加算された時刻を実行時刻(exec time)として、その実行が開始される。つまり、コンテナ対象データの実行がオーディオタイムスタンプ非依存で行われる。
ここで、コンテナ対象データが、その中に相対的なタイプスタンプを持つ場合には、実行時刻を基点とした相対時刻による同期管理が行われる。例えば、コンテナ対象データが時間の概念のないMP3のようなメディアファイルである場合には、実行時刻から直ちに再生が開始される。また、例えば、コンテナ対象が相対的なタイムスタンプを持っているMP4のようなメディアファイルである場合には、実行時刻を基点とした再生同期管理が行われる。
なお、図23の例は、コンテナ対象データの実行時刻が基準時刻からの差分値OFSで与えられる場合を示したが、このコンテナ対象データの実行時刻が、実行時刻(exec time)を示すUTC絶対時刻「UTC´値」で与えられても同様である。つまり、コンテナ対象データに付加する実行時刻を示す時刻情報としては、上述したように、UTC絶対時刻あるいは基準時刻からの差分値が考えられる。
図24は、複数のコンテナ対象データが、それに付加されている時刻情報に基づいて同期管理される具体例を示している。この例では、「data_id」が“1”であるコンテナ対象データとして、リンクサーバに接続するためのURLの情報と、“Activate”または“Inactivate”などのリンクサーバに対する制御を行うコントロールコード群が伝送される。
この場合、「exec time1」の実行時刻で、URLによりリンクサーバへの接続が実行さされ、その後、「exec time3」の実行時刻からコントロールコード群により当該リンクサーバに対して“Activate”または“Inactivate”などの制御が実行され、当該リンクサーバからのメディア再生の開始、その終了など行われる。
また、この例では、「data_id」が“2”であるコンテナ対象データとして、リンクサーバに接続するためのURLの情報と、“Activate”または“Inactivate”などのリンクサーバに対する制御を行うコントロールコード群が伝送される。
この場合、「exec time2」の実行時刻で、URLによりリンクサーバへの接続が実行さされ、その後、「exec time4」の実行時刻からコントロールコード群により当該リンクサーバに対して“Activate”または“Inactivate”などの制御が実行され、当該リンクサーバからのメディア再生の開始、その終了など行われる。
また、この例では、「data_id」が“3”であるコンテナ対象データとして、メディアファイルが伝送される。「exec time5」の実行時刻から、メディアファイルの再生が開始される。
[トランスポートストリームTSの構造例]
図25は、トランスポートストリームTSの構造例を示している。この構造例は、2つのオーディオストリームが存在し、その2つのオーディオストリームで所定情報をコンテナする場合の例である(図16参照)。この構造例では、ビデオストリームに係る部分は省略されている。
この構造例では、PID1で識別されるオーディオストリームのPESパケット「Audio PES」が存在すると共に、PID2で識別されるオーディオストリームのPESパケット「Audio PES」が存在する。これらのPESパケットにはオーディオストリーム(Audio coded stream)が挿入される。このオーディオストリームの所定数(1を含む)のオーディオフレーム内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。PSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。
また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリーム・ループが存在する。この構造例では、2つのオーディオストリームにそれぞれ対応してオーディオエレメンタリストリーム・ループ(Audio ES loop)が存在する。
各オーディオエレメンタリストリーム・ループ(Audio ES loop)には、それぞれのストリームに対応して、PID(パケット識別子)等の情報が配置されると共に、そのストリームに関連する情報を記述するデスクリプタも配置される。デスクリプタの1つとして、上述したデータコンテナ・デスクリプタ(data_container descriptor)(図14参照)が配置される。
また、このオーディオエレメンタリストリーム・ループには、デスクリプタの1つとして、「Component_tag」の情報を持つストリームアイデンチファイア・デスクリプタ(Stream_identifier descriptor)が配置される。また、EIT(Event Information Table)の配下に、コンポーネント・デスクリプタ(Component_descriptor)が配置される。EITには上述したデータコンテナ・デスクリプタ(data_container descriptor)が配置されてもよい。その場合、受信機EPG表示にメタデータの挿入を記す際の識別情報の提供になる。
このコンポーネント・デスクリプタは、「Component_tag」により上述のPMT配下のオーディオエレメンタリストリーム・ループと関連付けられる。これにより、ある番組のオーディオストリームに所定情報、例えばネットアクセス情報の挿入があることがわかり、EPGなどの番組表の表示時に、当該ある番組の部分に“net link”などの表示を行って、ネットアクセス可能な配信であることをTV視聴者に知らせることが可能となる。
[セットトップボックスの構成例]
図26は、セットトップボックス200の構成例を示している。このセットトップボックス200は、CPU201と、フラッシュROM202と、DRAM203と、内部バス204と、リモコン受信部205と、リモコン送信機206を有している。また、セットトップボックス200は、アンテナ端子211と、デジタルチューナ212と、デマルチプレクサ213と、ビデオデコーダ214と、オーディオフレーミング部215と、HDMI送信部216と、HDMI端子217を有している。
CPU201は、セットトップボックス200の各部の動作を制御する。フラッシュROM202は、制御ソフトウェアの格納およびデータの保管を行う。DRAM203は、CPU201のワークエリアを構成する。CPU201は、フラッシュROM202から読み出したソフトウェアやデータをDRAM203上に展開してソフトウェアを起動させ、セットトップボックス200の各部を制御する。
リモコン受信部205は、リモコン送信機206から送信されたリモーコントロール信号(リモコンコード)を受信し、CPU201に供給する。CPU201は、このリモコンコードに基づいて、セットトップボックス200の各部を制御する。CPU201、フラッシュROM202およびDRAM203は、内部バス204に接続されている。
アンテナ端子211は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ212は、アンテナ端子211に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応したトランスポートストリームTSを出力する。
デマルチプレクサ213は、トランスポートストリームTSからビデオストリームのパケットを抽出し、ビデオデコーダ214に送る。ビデオデコーダ214は、デマルチプレクサ213で抽出されたビデオのパケットからビデオストリームを再構成し、デコード処理を行って非圧縮のビデオデータ(画像データ)を得る。
また、デマルチプレクサ213は、トランスポートストリームTSから1つまたは2つのオーディオストリームのパケットを抽出してオーディオストリームを再構成する。オーディオフレーミング部215は、再構成されたオーディオストリームに対してフレーミングを行う。このオーディオストリームには、上述のストリーム生成部110A,110B(図2、図16参照)で説明したように、所定情報(コンテナ対象データ=挿入データDT)が挿入されている。
また、デマルチプレクサ213は、トランスポートストリームTSからデスクリプタ情報などの各種情報を抽出し、CPU201に送る。この各種情報には、上述したデータコンテナ・デスクリプタ(data_cotainer descriptor)の情報も含まれる(図14参照)。
CPU201は、このデータコンテナ・デスクリプタから、対応するオーディオストリームに所定情報の挿入があることを認識する。また、このデータコンテナ・デスクリプタから、所定情報の挿入が対応するオーディオストリームに加え、他のストリームにもあるかを認識する。例えば、オーディオストリームが1つであってそれに所定情報の挿入されている場合には、データコンテナ・デスクリプタから他のストリームへは所定情報の挿入がないことを認識する。また、例えば、オーディオストリームが2つであって双方に所定情報の挿入されている場合には、データコンテナ・デスクリプタから他のストリームにも所定情報の挿入があることを認識する。
HDMI送信部216は、HDMIに準拠した通信により、ビデオデコーダ214で得られた非圧縮のビデオデータと、オーディオフレーミング部215でフレーミングされた後のオーディオストリームを、HDMI端子217から送出する。HDMI送信部216は、HDMIのTMDSチャネルで送信するため、ビデオデータおよびオーディオストリームをパッキングして、HDMI端子217に出力する。このHDMI送信部216の詳細は後述する。
セットトップボックス200の動作を簡単に説明する。アンテナ端子211に入力されたテレビ放送信号はデジタルチューナ212に供給される。このデジタルチューナ212では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応したトランスポートストリームTSが出力される。
デジタルチューナ212から出力されるトランスポートストリームTSは、デマルチプレクサ213に供給される。このデマルチプレクサ213では、トランスポートストリームTSからビデオのエレメンタリストリームのパケットが抽出され、ビデオデコーダ214に送られる。
ビデオデコーダ214では、デマルチプレクサ213で抽出されたビデオのパケットからビデオストリームが再構成された後、そのビデオストリームに対してデコード処理が行われて、非圧縮のビデオデータが得られる。この非圧縮のビデオデータは、HDMI送信部216に供給される。
また、デマルチプレクサ213では、トランスポートストリームTSから1つまたは2つのオーディオストリームのパケットが抽出され、所定情報が挿入されているオーディオストリームが再構成される。このオーディオストリームはオーディオフレーミング部215でフレーミングされた後に、HDMI送信部216に供給される。そして、HDMI送信部216では、非圧縮のビデオデータおよびオーディオストリームがパッキングされ、HDMI端子217からHDMIケーブル610を介してオーディオアンプ300に送信される。
また、デマルチプレクサ213では、トランスポートストリームTSからデスクリプタ情報などの各種情報が抽出され、CPU201に送られる。この各種情報には、上述したデータコンテナ・デスクリプタ(data_cotainer descriptor)の情報も含まれる(図14参照)。これにより、CPU201では、オーディオストリームに所定情報の挿入があることなどが認識される。
[テレビ受信機の構成例]
図27は、テレビ受信機300の構成例を示している。このテレビ受信機300は、CPU301と、フラッシュROM302と、DRAM303と、内部バス304と、リモコン受信部305と、リモコン送信機306と、通信インタフェース307を有している。
また、テレビ受信機300は、アンテナ端子311と、デジタルチューナ312と、デマルチプレクサ313と、ビデオデコーダ314と、HDMI端子315と、HDMI受信部316を有している。また、テレビ受信機300は、映像処理回路317と、パネル駆動回路318と、表示パネル319と、オーディオデコーダ320と、音声処理回路321と、音声増幅回路322と、スピーカ323を有している。
CPU301は、テレビ受信機300の各部の動作を制御する。フラッシュROM302は、制御ソフトウェアの格納およびデータの保管を行う。DRAM303は、CPU301のワークエリアを構成する。CPU301は、フラッシュROM302から読み出したソフトウェアやデータをDRAM303上に展開してソフトウェアを起動させ、テレビ受信機300の各部を制御する。
リモコン受信部305は、リモコン送信機306から送信されたリモートコントロール信号(リモコンコード)を受信し、CPU301に供給する。CPU301は、このリモコンコードに基づいて、テレビ受信機300の各部を制御する。CPU301、フラッシュROM302およびDRAM303は、内部バス304に接続されている。
通信インタフェース307は、CPU301の制御のもと、インターネット等のネットワーク上に存在するサーバとの間で通信を行う。この通信インタフェース307は、内部バス304に接続されている。
アンテナ端子311は、受信アンテナ(図示せず)で受信されたテレビ放送信号を入力する端子である。デジタルチューナ312は、アンテナ端子311に入力されたテレビ放送信号を処理して、ユーザの選択チャネルに対応したトランスポートストリームTSを出力する。
デマルチプレクサ313は、トランスポートストリームTSからビデオストリームを抽出してビデオデコーダ314に送る。ビデオデコーダ314は、ビデオストリームにデコード処理を行って非圧縮のビデオデータ(画像データ)を得る。
また、デマルチプレクサ313は、トランスポートストリームTSから1つまたは2つのオーディオストリームを抽出してオーディオデコーダ320に送る。このオーディオストリームには、上述のストリーム生成部110A,110B(図2、図16参照)で説明したように、所定情報が挿入されている。
また、デマルチプレクサ213は、トランスポートストリームTSからデスクリプタ情報などの各種情報を抽出し、CPU301に送る。この各種情報には、上述したデータコンテナ・デスクリプタ(data_cotainer descriptor)の情報も含まれる(図14参照)。CPU301は、このデータコンテナ・デスクリプタから、対応するオーディオストリームに所定情報の挿入があることを認識する。また、このデータコンテナ・デスクリプタから、所定情報の挿入が対応するオーディオストリームに加え、他のストリームにもあるかを認識する。
HDMI受信部316は、HDMIに準拠した通信により、HDMIケーブル400を介してHDMI端子315に供給される非圧縮のビデオデータとオーディオストリームを受信する。オーディオストリームには、上述のセットトップボックス200(図26参照)で説明したように、所定情報が挿入されている。このHDMI受信部316の詳細は後述する。
映像処理回路317は、ビデオデコーダ314で得られた、あるいはHDMI受信部316で得られたビデオデータ、さらには、通信インタフェース307でネット上のサーバから受信されたビデオデータなどに対してスケーリング処理、合成処理などを行って、表示用のビデオデータを得る。
パネル駆動回路318は、映像処理回路317で得られる表示用の画像データに基づいて、表示パネル319を駆動する。表示パネル319は、例えば、LCD(Liquid Crystal Display)、有機ELディスプレイ(organic electroluminescence display)などで構成されている。
オーディオデコーダ320は、デマルチプレクサ313で得られた、あるいはHDMI受信部316で得られたオーディオストリームに対してデコード処理を施して非圧縮のオーディオデータ(音声データ)を得る。また、オーディオデコーダ320は、オーディオストリームの所定数のオーディオフレームに順次挿入されている所定情報の各分割部分を取り出し、それに付加されている順番情報に基づいて所定情報を再構成し、再構成された所定情報をCPU301に送る。CPU301は、適宜、この所定情報を利用した処理が行われるように、テレビ受信機300の各部を制御する。
この場合、各オーディオストリームの所定数のオーディオフレームに挿入される各分割部分に、他のメディア符号化ストリームへの分割部分の挿入があるか識別する識別情報が付加されている。そのため、オーディオデコーダ320は、当該識別情報に基づいて、他のメディア符号化ストリームへの分割部分の挿入があるかを容易に認識でき、所定情報の分割部分が挿入されている全てのオーディオストリームから、この所定情報の全ての分割部分の取り出しを効率的かつ的確に行い得る。
図28は、オーディオデコーダ320の構成例を示している。このオーディオデコーダ320は、エクストラクタ351-1,351-2と、デコーダ352-1,352-2と、データリアセンブラ353を有している。
エクストラクタ351-1は、オーディオストリームAS1(R_EM1+IS1)の所定数のオーディオフレームから、それに挿入されている所定情報の分割部分IS1を取り出すと共に、オーディオストリームR_EM1を出力する。デコーダ352-1は、オーディオストリームR_EM1にデコード処理を施してオーディオデータSA1を出力する。
エクストラクタ351-2は、オーディオストリームAS2(R_EM2+IS2)の所定数のオーディオフレームから、それに挿入されている所定情報の分割部分IS2を取り出すと共に、オーディオストリームR_EM2を出力する。デコーダ352-2は、オーディオストリームR_EM2にデコード処理を施してオーディオデータSA2を出力する。
データリアセンブラ353は、エクストラクタ351-1,351-2で取り出された分割部分IS1,IS2から、それに付加されている順番情報に基づいて所定情報を再構成し、再構成された所定情報を出力する。
なお、図示の例は、デマルチプレクサ313から2つのオーディオストリームAS1,AS2が得られる場合に対処可能としたものである。デマルチプレクサ313から1つのオーディオストリームAS1のみが得られる場合には、エクストラクタ351-2およびデコーダ352-2の部分は用いられない。
図29は、デマルチプレクサ313から1つのオーディオストリームAS1のみが得られる場合における、エクストラクタ351-1の処理例を概略的に示している。この例は、所定情報(挿入データDT)が(2)の方法でf0、f1、f2、f3、f4、f5の6つの分割部分に分割されている場合を示している(図6参照)が、(1)の方法で分割されている場合も同様である。エクストラクタ351-1では、オーディオストリームAS1の6つのオーディオフレームに含まれているf0、f1、f2、f3、f4、f5の6つの分割部分が抽出されて、データリアセンブラ353に送られる。
図30は、デマルチプレクサ313から2つのオーディオストリームAS1,AS2が得られる場合における、エクストラクタ351-1,351-2の処理例を概略的に示している。この例も、所定情報(挿入データDT)が(2)の方法でf0、f1、f2、f3、f4、f5の6つの分割部分に分割されている場合を示している(図17参照)が、(1)の方法で分割されている場合も同様である。
エクストラクタ351-1では、オーディオストリームAS1の3つのオーディオフレームに含まれているf0、f2、f4の3つの分割部分が抽出されて、データリアセンブラ353に送られる。また、エクストラクタ351-2では、オーディオストリームAS2の3つのオーディオフレームに含まれているf1、f3、f5の3つの分割部分が抽出されて、データリアセンブラ353に送られる。
図27に戻って、音声処理回路521は、オーディオデコーダ320で得られたオーディオデータに対して、D/A変換等の処理を行う。この処理には、必要に応じて、オブジェクトデータに対するレンダリング処理、チャネルデータの合成処理、チャネル数変換処理なども含まれる。音声増幅回路322は、音声処理回路321から出力される各チャネルの音声信号を増幅してそれぞれのチャネルのスピーカ323に供給する。
図27に示すテレビ受信機300の動作を簡単に説明する。アンテナ端子311に入力されたテレビ放送信号はデジタルチューナ312に供給される。このデジタルチューナ312では、テレビ放送信号が処理されて、ユーザの選択チャネルに対応したトランスポートストリームTSが得られる。
デジタルチューナ312で得られるトランスポートストリームTSは、デマルチプレクサ313に供給される。デマルチプレクサ313では、トランスポートストリームTSからビデオストリームが抽出され、ビデオデコーダ314に供給される。ビデオデコーダ314では、ビデオストリームに対してデコード処理が施されて、非圧縮のビデオデータが得られる。この非圧縮のビデオデータは、映像処理回路317に供給される。また、デマルチプレクサ313では、トランスポートストリームTSから1つまたは2つのオーディオストリームが抽出され、オーディオデコーダ320に供給される。
また、デマルチプレクサ313では、トランスポートストリームTSからデスクリプタ情報などの各種情報が抽出され、CPU301に送られる。この各種情報には、上述したデータコンテナ・デスクリプタ(data_cotainer descriptor)の情報も含まれる(図14参照)。CPU301では、このデータコンテナ・デスクリプタから、対応するオーディオストリームに所定情報の挿入があることが認識される。また、このデータコンテナ・デスクリプタから、所定情報の挿入が対応するオーディオストリームに加え、他のストリームにもあるかが認識される。
HDMI受信部316では、HDMIに準拠した通信により、HDMIケーブル400を介してHDMI端子315に供給される非圧縮のビデオデータと、1つまたは2つのオーディオストリームが受信される。非圧縮のビデオデータは、映像処理回路317に供給される。また、オーディオストリームはオーディオデコーダ320に供給される。
映像処理回路317では、ビデオデコーダ314で得られた、あるいはHDMI受信部316で得られたビデオデータ、さらには、通信インタフェース307でネット上のサーバから受信されたビデオデータなどに対してスケーリング処理、合成処理などが施され、表示用のビデオデータが得られる。
映像処理回路317で得られた表示用のビデオデータはパネル駆動回路318に供給される。パネル駆動回路318では、表示用のビデオデータに基づいて、表示パネル319を駆動することが行われる。これにより、表示パネル319には、表示用のビデオデータに対応した画像が表示される。
オーディオデコーダ320では、デマルチプレクサ313で得られた、あるいはHDMI受信部316で得られたオーディオストリームに対してデコード処理が施されて非圧縮のオーディオデータ(音声データ)が得られる。また、オーディオデコーダ320では、オーディオストリームの所定数のオーディオフレームに順次挿入されている所定情報の各分割部分が取り出され、それに付加されている順番情報に基づいて所定情報が再構成される。このように再構成された所定情報はCPU301に送られる。CPU301では、適宜、この所定情報を利用した処理が行われるように、テレビ受信機300の各部を制することが行われる。
オーディオデコーダ320で得られたオーディオデータは、音声処理回路321に供給される。音声処理回路321では、オーディオデータに対してD/A変換等の必要な処理が施される。このオーディオデータは、音声増幅回路322で増幅された後に、スピーカ323に供給される。そのため、スピーカ323から、表示パネル319の表示画像に対応した音声が出力される。
[HDMI送信部、HDMI受信部の構成例]
図31は、セットトップボックス200のHDMI送信部216(図26参照)とテレビ受信機300のHDM受信部316(図27参照)の構成例を示している。
HDMI送信部216は、一の垂直同期信号から次の垂直同期信号までの区間から、水平帰線区間22および垂直帰線区間23を除いた区間である有効画像区間21(以下、適宜、「アクティブビデオ区間」ともいう)(図32参照)において、非圧縮の1画面分の画像の画素データに対応する差動信号を、複数のチャネルで、HDMI受信部316に一方向に送信する。また、HDMI送信部216は、水平帰線区間22または垂直帰線区間23において、少なくとも画像に付随する音声データや制御データ、その他の補助データ等に対応する差動信号を、複数のチャネルで、HDMI受信部316に一方向に送信する。
すなわち、HDMI送信部216は、HDMIトランスミッタ31を有する。トランスミッタ31は、例えば、非圧縮の画像の画素データを対応する差動信号に変換し、複数のチャネルである3つのTMDS(Transition Minimized Differential Signaling)チャネル#0,#1,#2で、HDMI受信部316に、一方向にシリアル伝送する。
また、トランスミッタ31は、非圧縮の画像に付随する音声データ、さらには、必要な制御データその他の補助データ等を、対応する差動信号に変換し、3つのTMDSチャネル#0,#1,#2で、HDMI受信部316に一方向にシリアル伝送する。
HDMI受信部316は、アクティブビデオ区間21(図32参照)において、複数のチャネルで、HDMI送信部216から一方向に送信されてくる、画素データに対応する差動信号を受信する。また、HDMI受信部316は、水平帰線区間22(図32参照)または垂直帰線区間23(図21参照)において、複数のチャネルで、HDMI送信部216から一方向に送信されてくる、音声データや制御データに対応する差動信号を受信する。
HDMI送信部216とHDMI受信部316とからなるHDMIシステムの伝送チャネルには、画素データおよび音声データを伝送するための伝送チャネルとしての3つのTMDSチャネル#0乃至#2と、ピクセルクロックを伝送する伝送チャネルとしてのTMDSクロックチャネルの他に、DDC(Display Data Channel)33やCEC(Consumer Electronics Control)ライン34と呼ばれる伝送チャネルがある。
DDC33は、HDMIケーブル400に含まれる2本の信号線からなり、HDMI送信部216が、HDMIケーブル400を介して接続されたHDMI受信部316から、EDID(Extended Display Identification Data)を読み出すために使用される。すなわち、HDMI受信部316は、HDMIレシーバ32の他に、自身の性能(Configuration・Capability)に関する性能情報であるEDIDを記憶している、EDID ROMを有している。HDMI送信部216がEDIDを読み出すことで、受信側の復号化能力情報が送信側に送られることになる。
HDMI送信部216は、HDMIケーブル400を介して接続されているHDMI受信部316から、EDIDを、DDC33を介して読み出す。そして、セットトップボックス200のCPU201は、そのEDIDに基づき、HDMI受信部316を有するテレビ受信機300の性能を認識する。
CECライン34は、HDMIケーブル400に含まれる1本の信号線からなり、HDMI送信部216とHDMI受信部316との間で、制御用のデータの双方向通信を行うために用いられる。また、HDMIケーブル400には、HPD(Hot Plug Detect)と呼ばれるピンに接続されるHPDライン35が含まれている。
ソース機器は、このHPDライン35を利用して、直流バイアス電位により、シンク機器(ディスティネーション機器)の接続を検出することができる。この場合、HPDライン35は、ソース機器側から見ると、直流バイアス電位によってシンク機器から接続状態の通知を受ける機能を有するものとなる。一方、このHPDラインは、シンク機器側から見ると、直流バイアス電位によってソース機器に接続状態を通知する機能を有するものとなる。また、HDMIケーブル400には、ソース機器からシンク機器に電源を供給するために用いられる電源ライン36が含まれている。
さらに、HDMIケーブル400には、リザーブライン37が含まれている。HPDライン35とリザーブライン37を用いた、イーサネットの信号を伝送するHDMIイーサネットチャネル(HDMI Ethernet Channel : HEC)が存在する。また、HPDライン35とリザーブライン37の双方またはHPDライン35のみを用いた、オーディオデータをディスティネーション機器(シンク機器)からソース機器に伝送するオーディオリターンチャネル(Audio Return Channel : ARC)が存在する。なお、「イーサネット」、「Ethernet」は、登録商標である。
図32は、TMDSチャネルにおいて、横×縦が1920ピクセル×1080ラインの画像データが伝送される場合の、各種の伝送データの区間を示している。HDMIの3つのTMDSチャネルで伝送データが伝送されるビデオフィールド(Video Field)には、伝送データの種類に応じて、ビデオデータ区間24(Video Data Period)、データアイランド区間25(Data Island Period)、およびコントロール区間26(Control Period)の3種類の区間が存在する。
ここで、ビデオフィールド区間は、ある垂直同期信号の立ち上がりエッジ(Active Edge)から次の垂直同期信号の立ち上がりエッジまでの区間であり、水平帰線期間22(Horizontal Blanking)、垂直帰線期間23(Vertical Blanking)、並びに、ビデオフィールド区間から、水平帰線期間および垂直帰線期間を除いた区間である有効画素区間21(Active Video)に分けられる。
ビデオデータ区間24は、有効画素区間21に割り当てられる。このビデオデータ区間24では、非圧縮の1画面分の画像データを構成する1920ピクセル(画素)×1080ライン分の有効画素(Active Pixel)のデータが伝送される。データアイランド区間25およびコントロール区間26は、水平帰線期間22および垂直帰線期間23に割り当てられる。このデータアイランド区間25およびコントロール区間26では、補助データ(Auxiliary Data)が伝送される。
すなわち、データアイランド区間25は、水平帰線期間22と垂直帰線期間23の一部分に割り当てられている。このデータアイランド区間25では、補助データのうち、制御に関係しないデータである、例えば、音声データのパケット等が伝送される。コントロール区間26は、水平帰線期間22と垂直帰線期間23の他の部分に割り当てられている。このコントロール区間26では、補助データのうちの、制御に関係するデータである、例えば、垂直同期信号および水平同期信号、制御パケット等が伝送される。
「セットトップボックスとテレビ受信機との間の通信例」
セットトップボックス200のCPU201は、例えば、テレビ受信機300のCPU301との間で例えばCECラインを用いた通信によりネゴシエーションを行って、テレビ受信機300が必要とするオーディオストリームを把握し、そのオーディオストリームのみを送信することが可能とされる。
図33は、セットトップボックス200およびテレビ受信機300におけるネゴシエーションを伴った動作の一例を示している。
(1)セットトップボックス200は、EIT配下のコンポーネント・デスクリプタ(Component_descriptor)、また、データコンテナ・デスクリプタ(data_container_descriptor)に基づいて、ネットリンク可能な番組を明示した番組表の表示信号をテレビ受信機300に送り、テレビ受信機300の表示画面に当該番組表を表示する。
(2)テレビ受信機300は、表示画面に表示された番組表を利用して、ネットリンク可能な番組を選択し、その番組選択信号をセットトップボックス200に送る。
(3)セットトップボックス200は、テレビ受信機300からの番組選択信号に基づいて、当該番組を受信する。そして、セットトップボックス200は、データコンテナ・デスクリプタ(Data_container descriptor)に基づいて、所定情報(挿入データ)が挿入されているオーディオストリームを検知する。
(4)セットトップボックス200は、テレビ受信機300のEDIDにアクセスして受信可能性をチェックする。
(5)テレビ受信機300は、EDIDにより、オーディオストリーム(圧縮ストリーム)が受信可能であることを、セットトップボックス200に通知する。(6)テレビ受信機300は、EDIDにより、オーディオ再生用デコーダは一つであることを、セットトップボックス200に通知する。
(7)セットトップボックス200は、所定情報が挿入されているオーディオストリームが2つである場合、(8)2つのオーディオストリーム(例えばメインストリームとサブストリームの2ストリーム)の受信が必要であることを、テレビ受信機300に通知する。
(9)それに対応して、テレビ受信機300は、アクノーレッジ(ACK)信号を、セットトップボックス200に送る。(10)セットトップボックス200は、テレビ受信機300のオーディオ再生用デコーダは1つであるが、2つのオーディオストリームを、送信する。
(11)テレビ受信機300は、2ストリームを受信する。そして、メインストリームに関しては、挿入されている所定情報の分割部分をエクストラクタで抽出する一方で、当該メインストリームをデコーダへ転送してデコードする。一方、サブストリームに関しては、挿入されている所定情報の分割部分をエクストラクタで抽出する。そして、テレビ受信機300は、各エクストラクタで抽出された所定情報の各分割部分から、データリアセンブラで、所定情報を再構成する。(12)テレビ受信機300は、再構成された所定情報、ここではネットアクセス情報を用いて、ネットアクセスを行って、所定の情報を取得し、表示等を行う。
上述したように、図1に示す送受信システム10において、放送送出装置100は、オーディオストリームの所定数のオーディオフレームにビットレートが所定ビットレートに収まるように所定情報を分割して得た各分割部分を挿入して送信する。そのため、オーディオストリームを含めた全体のビットレートをターゲットビットレートに抑えることができ、オーディオストリームに所定の情報を挿入して送信することを良好に行い得る。
また、図1に示す送受信システム10において、放送送出装置100は、1つ以上、例えば2つのオーディオストリームの所定数のオーディオフレームに所定情報を分割して得た各分割部分を挿入して送信する。そのため、所定情報の全体の送信に必要な時間の短縮が可能となる。
<2.変形例>
なお、上述実施の形態において、放送送出装置100は、所定情報をオーディオストリームに挿入して送信する。しかし、放送送出装置100は、所定情報をビデオストリームなどのその他のメディア符号化ストリームに挿入して送信することも考えられる。
図34は、その場合における、放送送出装置100が備えるストリーム生成部110Cの構成例を示している。この図34において、図2と対応する部分には、同一符号を付し、適宜、その詳細説明を省略する。このストリーム生成部110Cは、制御部111と、ビデオエンコーダ112と、オーディオエンコーダ113と、スプリッタ114と、インサータ115,117と、マルチプレクサ116を有している。
CPU111は、ストリーム生成部110Cの各部を制御する。ビデオエンコーダ112は、ビデオデータ(画像データ)SVに対して、MPEG2、H.264/AVC、H.265/HEVCなどの符号化を施し、ビデオストリーム(ビデオエレメンタリストリーム)を生成する。オーディオエンコーダ113は、オーディオデータ(音声データ)SAに対して、MPEG−H 3D Audioの圧縮フォーマットによる符号化を施し、オーディオストリーム(オーディオエレメンタリストリーム)を生成する。
スプリッタ114は、詳細説明は省略するが、図2のストリーム生成部110Aのスプリッタ114と同様に、所定情報を構成する挿入データDTを分割して、所定数の分割部分f(i)を得る。この場合、ビデオストリーム、オーディオストリームのそれぞれに挿入される挿入データDTのビットレートが許容ビットレートに収まるように、(1)または(2)の方法で分割される。
インサータ117は、ビデオエンコーダ112で生成されたビデオストリームR_EM3の所定数のアクセスユニット(ピクチャ)に、スプリッタ114で分割されて得られた所定数の分割部分f(i)を、再構成のための順番情報を付加して、順次挿入する。この場合、分割部分f(i)を持つジェネリックデータ(generic_data)(図10参照)が、SEI NALユニットに、例えば、図9に構造例を示すエントリを用いて配置される。
また、インサータ115は、詳細説明は省略するが、図2のストリーム生成部100Aにおけるインサータ115と同様にして、オーディオエンコーダ113で生成されたオーディオストリームR_EM1の所定数のオーディオフレームに、スプリッタ114で分割されて得られた所定数の分割部分f(i)を、再構成のための順番情報を付加して、順次挿入する。
マルチプレクサ116は、インサータ117から出力される、所定情報(挿入データDT)の各分割部分が挿入されたビデオストリームと、インサータ115から出力される、所定情報(挿入データDT)の各分割部分が挿入されたオーディオストリームを、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。
また、マルチプレクサ116は、トランスポートストリームTSに、ビデオストリーム、オーディオストリームのそれぞれに対応して、所定情報の挿入があることを示す識別情報などを挿入する。具体的には、プログラムマップテーブル(PMT)の配下のビデオエレメンタリストリームループ内、オーディオエレメンタリストリームループ内に、データコンテナ・デスクリプタ(図14参照)を挿入する。
図35は、トランスポートストリームTSの構造例を示している。この構造例は、ビデオストリームとオーディオストリームの2つのストリームで所定情報をコンテナする場合の例である(図34参照)。
この構造例では、PID1で識別されるビデオストリームのPESパケット「Video PES」が存在すると共に、PID2で識別されるオーディオストリームのPESパケット「Audio PES」が存在する。
ビデオストリームのPESパケットには、ビデオストリーム(Video coded stream)が挿入される。このビデオストリームの所定数(1を含む)のアクセスユニット(ピクチャ)内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。また、オーディオストリームのPESパケットにはオーディオストリーム(Audio coded stream)が挿入される。このオーディオストリームの所定数(1を含む)のオーディオフレーム内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。
また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。PSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。
また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリーム・ループが存在する。この構造例では、ビデオストリームに対応してビデオエレメンタリストリーム・ループ(Video ES loop)が存在すると共に、オーディオストリームに対応してオーディオエレメンタリストリーム・ループ(Audio ES loop)が存在する。
各エレメンタリストリーム・ループ(ES loop)には、それぞれのストリームに対応して、PID(パケット識別子)等の情報が配置されると共に、そのストリームに関連する情報を記述するデスクリプタも配置される。デスクリプタの1つとして、上述したデータコンテナ・デスクリプタ(data_container descriptor)(図14参照)が配置される。
また、各エレメンタリストリーム・ループには、デスクリプタの1つとして、「Component_tag」の情報を持つストリームアイデンチファイア・デスクリプタ(Stream_identifier descriptor)が配置される。また、EIT(Event Information Table)の配下に、コンポーネント・デスクリプタ(Component_descriptor)が配置される。また、EITには上述したデータコンテナ・デスクリプタ(data_container descriptor)が配置されてもよい。その場合、受信機EPG表示にメタデータの挿入を記す際の識別情報の提供になる。
このコンポーネント・デスクリプタは、「Component_tag」により上述のPMT配下の各エレメンタリストリーム・ループと関連付けられる。これにより、ある番組のビデオ、オーディオのストリームに所定情報、例えばネットアクセス情報の挿入があることがわかり、EPGなどの番組表の表示時に、当該ある番組の部分に“net link”などの表示を行って、ネットアクセス可能な配信であることをTV視聴者に知らせることが可能となる。
上述の図26に示すセットトップボックス200は、受信されたビデオストリームにデコード処理を施して得られた非圧縮のビデオデータを、HDMIケーブル400を介して、テレビ受信機300に送信する構成となっている。しかし、上述したように所定情報をビデオストリームに挿入して送信する場合にあっては、受信されたビデオストリームをデコードせずにそのまま、HDMIケーブル400を介して、テレビ受信機300に送信する構成となる。この場合、ビデオストリームのデコードはテレビ受信機300で行われることになる。
なお、図34のストリーム生成部110Cでは、所定情報をビデオストリームとオーディオストリームの双方に挿入して送信するものである。詳細説明は省略するが、所定情報をビデオストリームのみに挿入して送信する構成も考えられる。
また、上述実施の形態においては、オーディオ圧縮フォーマットがMPEG−H 3D Audioである例を示した。しかし、本技術は、オーディオ圧縮フォーマットが、AAC、AC3、AC4などのその他のオーディオ圧縮フォーマットである場合にも、同様に適用できる。
図36(a)は、AC4のシンプルトランスポート(Simple Transport)のレイヤの構造を示している。シンクワード(syncWord)のフィールドと、フレームレングス(frame Length)のフィールドと、符号化データのフィールドとしての「RawAc4Frame」のフィールドと、CRCフィールドが存在する。「RawAc4Frame」のフィールドには、図36(b)に示すように、先頭にTOC(Table Of Content)のフィールドが存在し、その後の所定数のサブストリーム(Substream)のフィールドが存在する。
図37(b)に示すように、サブストリーム(ac4_substream_data())の中には、メタデータ領域(metadata)が存在し、その中に「umd_payloads_substream()」のフィールドが設けられる。この「umd_payloads_substream()」のフィールドの中の「umd_payload_byte」のフィールドに、例えば、図9に構造例を示すエントリを用いて、所定情報の分割部分を持つジェネリックデータ(generic_data)(図10参照)が配置される。
なお、図37(a)に示すように、TOC(ac4_toc())の中には「ac4_presentation_info()」のフィールドが存在し、さらにその中に「umd_info()」のフィールドが存在し、その中に上述の「umd_payloads_substream())」のフィールドにメタデータの挿入があることが示される。
また、上述実施の形態においては、コンテナストリーム(多重化ストリーム)がMPEG−2 トランスポートストリーム(トランスポートストリームTS)である例を示した。しかし、本技術は、MP4やそれ以外のフォーマットのコンテナストリームで配信されるシステムにも同様に適用できる。例えば、MPEG−DASHベースのストリーム配信システム、あるいは、MMT(MPEG Media Transport)構造伝送ストリームを扱う送受信システムなどである。
図38は、MMTのトランスポートストリームの構造例を示している。この構造例は、2つのオーディオストリームが存在し、その2つのオーディオストリームで所定情報をコンテナする場合の例である(図16参照)。この構造例では、ビデオストリームに係る部分は省略している。
MMTのトランスポートストリームには、パケットタイプが“MPU”である場合、ID1で識別されるオーディオストリームASのMPUパケット「MPU audio」と、ID2で識別されるオーディオストリームASのMPUパケット「MPU audio」が配置される。これらのMPUパケットにはオーディオストリーム(Audio coded stream)が挿入される。このオーディオストリームの所定数(1を含む)のオーディオフレーム内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。
また、MMTのトランスポートストリームには、パケットタイプが“message”である場合、種々のメッセージパケットが配置される。このメッセージパケットの一つとしてPA(Packet Access)メッセージパケットがある。PAメッセージパケットには、MPTなどのテーブルが含まれている。
MPTには、アセットとしての各ストリームに対応して、アセットタイプ(Asset_type)、パケットID(Packet_id)等の情報が配置されると共に、そのストリームに関連する情報を記述するデスクリプタも配置される。このデスクリプタの一つとして、上述したデータコンテナ・デスクリプタ(data_container descriptor)(図14参照)が配置される。
また、デスクリプタの1つとして、「Component_tag」の情報を持つMHストリームアイデンチファイア・デスクリプタ(MH-Stream_identifier descriptor)が配置される。また、MH−EIT(MH-Event Information Table)の配下に、MH・コンポーネント・グループ・デスクリプタ(MH-Component_Group_Descriptor)が配置される。また、MH−EITには上述したデータコンテナ・デスクリプタ(data_container descriptor)が配置されてもよい。
その場合、受信機EPG表示にメタデータの挿入を記す際の識別情報の提供になる。
このMH・コンポーネント・グループ・デスクリプタは、「Component_tag」により上述のMPT配下の各アセット(オーディオストリーム)の情報と関連付けられる。これにより、ある番組のオーディオストリームに所定情報、例えばネットアクセス情報の挿入があることがわかり、EPGなどの番組表の表示時に、当該ある番組の部分に“net link”などの表示を行って、ネットアクセス可能な配信であることをTV視聴者に知らせることが可能となる。
図39は、MMTのトランスポートストリームの他の構造例を示している。この構造例は、ビデオストリームとオーディオストリームの2つのストリームで所定情報をコンテナする場合の例である(図34参照)。
MMTのトランスポートストリームには、パケットタイプが“MPU”である場合、ID1で識別されるビデオストリームVSのMPUパケット「MPU video」と、ID2で識別されるオーディオストリームASのMPUパケット「MPU audio」が配置される。
ビデオストリームのMPUパケットには、ビデオストリーム(Video coded stream)が挿入される。このビデオストリームの所定数(1を含む)のアクセスユニット(ピクチャ)内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。また、オーディオストリームのMPUパケットにはオーディオストリーム(Audio coded stream)が挿入される。このオーディオストリームの所定数(1を含む)のオーディオフレーム内に、所定情報の各分割部分を含むジェネリックデータ(generic_data)(図10参照)が挿入される。
また、MMTのトランスポートストリームには、パケットタイプが“message”である場合、種々のメッセージパケットが配置される。このメッセージパケットの一つとしてPA(Packet Access)メッセージパケットがある。PAメッセージパケットには、MPTなどのテーブルが含まれている。
MPTには、アセットとしての各ストリームに対応して、アセットタイプ(Asset_type)、パケットID(Packet_id)等の情報が配置されると共に、そのストリームに関連する情報を記述するデスクリプタも配置される。このデスクリプタの一つとして、上述したデータコンテナ・デスクリプタ(data_container descriptor)(図14参照)が配置される。
また、デスクリプタの1つとして、「Component_tag」の情報を持つMHストリームアイデンチファイア・デスクリプタ(MH-Stream_identifier descriptor)が配置される。また、MH−EIT(MH-Event Information Table)の配下に、MH・コンポーネント・グループ・デスクリプタ(MH-Component_Group_Descriptor)が配置される。MH−EITには上述したデータコンテナ・デスクリプタ(data_container descriptor)が配置されてもよい。その場合、受信機EPG表示にメタデータの挿入を記す際の識別情報の提供になる。
このMH・コンポーネント・グループ・デスクリプタは、「Component_tag」により上述のMPT配下の各アセット(ビデオストリーム、オーディオストリーム)の情報と関連付けられる。これにより、ある番組のビデオストリーム、オーディオストリームに所定情報、例えばネットアクセス情報の挿入があることがわかり、EPGなどの番組表の表示時に、当該ある番組の部分に“net link”などの表示を行って、ネットアクセス可能な配信であることをTV視聴者に知らせることが可能となる。
図40は、オーディオ圧縮フォーマットがMPEG−H 3D AudioあるいはAC4である場合におけるオーディオトラック(トラックA)のデータを含むMP4ストリーム(ファイル)の構成例を示している。図示の例は、フラグメンテッドMP4(Fragmented MP4)の場合の例である。MP4ストリームには、制御情報が入る“moof”ボックスとメディアデータ本体が入る“mdat”ボックスから構成されるムービーフラグメント(Movie Fragment)が所定個数配置される。“mdat”ボックスには、トラックデータが断片化されて得られた断片が入るので、“moof”ボックスに入る制御情報はその断片に関する制御情報となる。
オーディオトラックに対応したMP4ストリーム「audio bitstream」において、各ムービーフラグメントの“mdat”ボックスには、所定個数のオーディオフレーム(アクセスユニットフレーム)が配置される。また、このMP4ストリーム「audio bitstream」において、各ムービーフラグメントの“moof”ボックス内に“traf”ボックスが存在し、そのボックス内に“tfdt”ボックスが存在する。この“tfdt”ボックスに、“moof”ボックスの後の最初のアクセスユニットのデコードタイム“baseMediaDecodeTime”の記載がある。
また、“moof”ボックス内に“tfdt”ボックスが存在し、その内に“sgpd”ボックスが存在し、さらに、その内に“tscl”ボックスが存在する。この“tscl”ボックスに、「Audiostreamtype」、「Attribute」のパラメータの記載がある。「Audiostreamtype = AC4 or mpegh」は、オーディオ圧縮フォーマットがAC4あるいはMPEG−H 3D Audioであることを示す。「Attribute = sound genericdata」は、オーディオトラックにジェネリックデータ(generic data)の挿入あることを示す。具体的には、「sound genericdata」として、例えば、上述の図14に示すデータコンテナ・デスクリプタ(dat_cintainer descriptor)の内容が記載される。
図41は、データ挿入ストリームが2つのオーディオストリームである場合におけるMPDファイル記述例を示している。また、図42は、データ挿入ストリームがオーディオストリームとビデオストリームである場合におけるMPDファイル記述例を示している。また、図43は、それらの記述例における主要な情報の内容を示す。従来周知のように、MPEG−DASHベースのストリーム配信システムにおいては、メディアストリーム(MP4ストリーム)と、メタファイルとしてのMPDファイルが、通信ネットワーク伝送路を通じて受信側に送信される。
最初に、図41のMPDファイル記述例を説明する。ここでは、説明の簡単化のためにオーディオストリームに関する情報のみが記述されている例を示しているが、実際にはビデオストリームに関する情報も記述されている。このMPDファイルには、第1、第2のオーディオストリームにそれぞれ対応したアダプテーションセット(AdaptationSet)が存在する。
「<AdaptationSet mimeType=“audio/mp4” group=“1”>」の記述により、第1のオーディオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのオーディストリームはMP4ファイル構造で供給され、グループ1が割り当てられていることが示されている。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:codecType” value= “AC4or mpegh”/>」の記述により、オーディオストリームのコーデックがAC4あるいはMPEG−H 3D Audioであることが示されている。「schemeIdUri=“urn:brdcst:codecType”」は、コーデックの種類を示す。例えば、「value」は“mpegh”、”AAC”、”AC3”、”AC4”などとされる。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:genericdatacContained” value=“true”/>」の記述により、オーディオストリームにジェネリックデータ(generic_data)が含まれることが示されている。例えば、「value」が“true”であるときは、ジェネリックデータが含まれることを示す。「value」が“false”であるときは、ジェネリックデータが含まれないことを示す。
また、「schemeIdUri==“urn:brdcst:jointstreamdelivery”」は、ネット接続に必要な情報が複数のメディアストリーム間で協調して供給されか否かを示す。例えば、「value」が“true”であるときは、ネット接続情報が他のアダプテーションセットのストリームと協調して供給されることを示す。「value」が“false”であるときは、ネット接続情報が本アダプテーションセットのストリームのみで供給されることを示す。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:metaInsertionFrequency” value= “1”/>」の記述により、アクセスユニット単位にメタ情報が供給される頻度が“1”であることが示されている。「schemeIdUri=“urn:brdcst:metaInsertionFrequency”」は、アクセスユニット単位にメタ情報が供給される頻度を示す。例えば、“1”は、1つのユーザデータエントリが1アクセスユニットに発生することを示す。“2”は、1つ以上のユーザデータエントリが1アクセスユニットに発生することを示す。“3”は、1つ以上のユーザデータエントリが、ランダムアクセスポイントで区切られる期間中に発生することを示す。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:type”value=“netlink”/>」の記述により、メタによるサービスの種類がネット接続であることが示されている。「schemeIdUri=“urn:brdcst:type”」は、メタによるサービスの種類を示す。例えば、「value」が“netlink”であるときは、メタによるサービスの種類がネット接続であることを示す。そして、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:databitrate”value= “value”/>」の記述により、データ挿入後のbitrate(target_bitrate)を1000bps単位の値で示す。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:datainsertionratio” value= “value”/>」の記述により、メディア符号化ストリームのビットレート(CR:compressed media_data_bitrate)を基準とした、挿入データのビットレート(AVR:inserted_data_bitrate)の割合(Ratio)を示す。その場合、割合の算出は次式のようなものになる。
Ratio = inserted_data_bitrate / compressed media_data_bitrate
また、「<Representation id=“11” bandwidth=“64000”>」の記述により、グループ1のアダプテーションセットの中に、「Representation id=“11”」で識別されるリプレゼンテーションとして、グループ1“group1”の符号化データを含むビットレートが64kbpsのオーディオストリームの存在が示されている。そして、「<baseURL>audio/jp/64.mp4</BaseURL>」の記述により、そのオーディオストリームのロケーション先が、「audio/jp/64.mp4」として示されている。
また、「<AdaptationSet mimeType=“audio/mp4” group=“2”>」の記述により、第2のオーディオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのオーディストリームはMP4ファイル構造で供給され、グループ2が割り当てられていることが示されている。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:codecType” value= “AC4or mpegh”/>」の記述により、オーディオストリームのコーデックがAC4あるいはMPEG−H 3D Audioであることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:genericdatacContained” value=“true”/>」の記述により、オーディオストリームにジェネリックデータ(generic_data)が含まれることが示されている。「schemeIdUri==“urn:brdcst:jointstreamdelivery”」は、ネット接続に必要な情報が複数のメディアストリーム間で協調して供給されか否かを示す。
。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:metaInsertionFrequency” value= “1”/>」の記述により、アクセスユニット単位にメタ情報が供給される頻度が“1”であることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:type”value=“netlink”/>」の記述により、メタによるサービスの種類がネット接続であることが示されている。そして、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:databitrate”value= “value”/>」の記述により、データ挿入後のbitrate(target_bitrate)を1000bps単位の値で示す。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:datainsertionratio” value= “value”/>」の記述により、メディア符号化ストリームのビットレート(CR)を基準とした、挿入データのビットレート(AVR)の割合を示す。
また、「<Representation id=“21” bandwidth=“96000”>」の記述により、グループ2のアダプテーションセットの中に、「Representation id=“21”」で識別されるリプレゼンテーションとして、グループ2“group2”の符号化データを含むビットレートが96kbpsのオーディオストリームの存在が示されている。そして、「<baseURL>audio/jp/96.mp4</BaseURL>」の記述により、そのオーディオストリームのロケーション先が、「audio/jp/96.mp4」として示されている。
次に、図42のMPDファイル記述例を説明する。このMPDファイルには、オーディオストリーム、ビデオストリームにそれぞれ対応したアダプテーションセット(AdaptationSet)が存在する。
「<AdaptationSet mimeType=“audio/mp4” group=“1”>」の記述により、オーディオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのオーディストリームはMP4ファイル構造で供給され、グループ1が割り当てられていることが示されている。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:codecType” value= “mpegh”/>」の記述により、オーディオストリームのコーデックがMPEG−H 3D Audioであることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:genericdatacContained” value=“true”/>」の記述により、オーディオストリームにジェネリックデータ(generic_data)が含まれることが示されている。「schemeIdUri==“urn:brdcst:jointstreamdelivery”」は、ネット接続に必要な情報が複数のメディアストリーム間で協調して供給されか否かを示す。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:metaInsertionFrequency” value= “1”/>」の記述により、アクセスユニット単位にメタ情報が供給される頻度が“1”であることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:type”value=“netlink”/>」の記述により、メタによるサービスの種類がネット接続であることが示されている。そして、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:databitrate”value= “value”/>」の記述により、データ挿入後のbitrate(target_bitrate)を1000bps単位の値で示す。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:datainsertionratio” value= “value”/>」の記述により、メディア符号化ストリームのビットレート(CR)を基準とした、挿入データのビットレート(AVR)の割合を示す。
また、「<Representation id=“11” bandwidth=“128000”>」の記述により、グループ1のアダプテーションセットの中に、「Representation id=“11”」で識別されるリプレゼンテーションとして、グループ1“group1”の符号化データを含むビットレートが128kbpsのオーディオストリームの存在が示されている。そして、「<baseURL>audio/jp/128.mp4</BaseURL>」の記述により、そのオーディオストリームのロケーション先が、「audio/jp/128.mp4」として示されている。
また、「<AdaptationSet mimeType=“video/mp4” group=“2”>」の記述により、ビデオストリームに対するアダプテーションセット(AdaptationSet)が存在し、そのビデオストリームはMP4ファイル構造で供給され、グループ2が割り当てられていることが示されている。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:codecType” value= “hevc”/>」の記述により、ビデオストリームのコーデックがHEVCであることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:genericdatacContained” value=“true”/>」の記述により、オーディオストリームにジェネリックデータ(generic_data)が含まれることが示されている。「schemeIdUri==“urn:brdcst:jointstreamdelivery”」は、ネット接続に必要な情報が複数のメディアストリーム間で協調して供給されか否かを示す。
また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:genericdatacContained” value=“true”/>」の記述により、ビデオストリームにジェネリックデータ(generic_data)が含まれることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:metaInsertionFrequency” value= “1”/>」の記述により、アクセスユニット単位にメタ情報が供給される頻度が“1”であることが示されている。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:type”value=“netlink”/>」の記述により、メタによるサービスの種類がネット接続であることが示されている。そして、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:databitrate”value= “value”/>」の記述により、データ挿入後のbitrate(target_bitrate)を1000bps単位の値で示す。また、「<SupplementaryDescriptor schemeIdUri=“urn:brdcst:datainsertionratio” value= “value”/>」の記述により、メディア符号化ストリームのビットレート(CR)を基準とした、挿入データのビットレート(AVR)の割合を示す。
また、「<Representation id=“21” bandwidth=“20000000”>」の記述により、グループ2のアダプテーションセットの中に、「Representation id=“21”」で識別されるリプレゼンテーションとして、グループ2“group2”の符号化データを含むビットレートが20Mbpsのビデオストリームの存在が示されている。そして、「<baseURL>audio/jp/20000.mp4</BaseURL>」の記述により、そのオーディオストリームのロケーション先が、「video/jp/20000.mp4」として示されている。
また、上述実施の形態においては、セットトップボックス200およびテレビ受信機300を有する送受信システム10を示した。しかし、テレビ受信機300の代わりに、モニタ装置、あるいはプロジェクタ等が配置される構成も考えられる。また、セットトップボックス200の代わりに、受信機能付きのレコーダ、パーソナルコンピュータ等が配置される構成も考えられる。
また、上述実施の形態においては、セットトップボックス200およびテレビ受信機300がHDMIのデジタルインタフェースにより有線で接続されている。しかし、各機器が、HDMIと同様のデジタルインタフェースで有線接続される場合、さらには、無線によって接続される場合にも、この発明を同様に適用できることは勿論である。
また、上述実施の形態においては、放送送出装置100から放送波に載せて送信されてくるトランスポートストリームTSをセットトップボックス200で受信する送受信システム10を示した。しかし、図44に示すように、放送送出装置100から放送波に載せて送信されてくるトランスポートストリームTSをテレビ受信機300で直接受信する送受信システム10Aも考えられる。
なお、本技術は、以下のような構成もとることができる。
(1)メディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入部と、
上記所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
上記情報挿入部は、
上記所定情報のビットレートが所定ビットレートに収まるように、上記所定情報を分割する
送信装置。
(2)上記情報挿入部は、
上記所定情報を、各分割部分のデータサイズが固定サイズとなるように分割する
前記(1)に記載の送信装置。
(3)上記情報挿入部は、
ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割ることにより上記固定サイズを算出する
前記(2)に記載の送信装置。
(4)上記情報挿入部は、
上記所定情報を、上記分割部分が挿入された各単位部分のデータサイズが固定サイズとなるように分割する
前記(1)に記載の送信装置。
(5)上記情報挿入部は、
ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割って得られた第1のサイズと、上記メディア符号化ストリームのビットレートを1秒間で発生する上記単位部分の数で割って得られた第2のサイズとを加算することで上記固定サイズを算出する
前記(4)に記載の送信装置。
(6)上記情報挿入部は、
1つ以上の上記メディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入し、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入される上記各分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報を付加する
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記コンテナに、上記1つ以上の上記メディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入があることを示す識別情報を挿入する識別情報挿入部をさらに備える
前記(6)に記載の送信装置。
(8)上記識別情報挿入部は、
上記コンテナに、上記1つ以上の上記メディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、
上記他のメディア符号化ストリームが存在するとき、該他のメディア符号化ストリームを示す識別情報をさらに挿入する
前記(7)に記載の送信装置。
(9)メディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入ステップと、
送信部により、上記所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
上記情報挿入ステップでは、
上記所定情報のビットレートが所定ビットレートに収まるように、上記所定情報を分割する
送信方法。
(10)1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入部と、
上記所定情報の分割部分が挿入された上記1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信部を備える
送信装置。
(11)上記情報挿入部は、
上記1つ以上のメディア符号化ストリームにそれぞれ挿入される上記各分割部分に、他の上記メディアストリームへの上記分割部分の挿入があるか識別する識別情報を付加する
前記(10)に記載の送信装置。
(12)上記コンテナに、上記1つ以上のメディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入があることを示す識別情報を挿入する識別情報挿入部をさらに備える
前記(10)または(11)に記載の送信装置。
(13)上記識別情報挿入部は、
上記コンテナに、上記1つ以上のメディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、
上記他のメディア符号化ストリームが存在するとき、該他のメディア符号化ストリームを示す識別情報をさらに挿入する
前記(12)に記載の送信装置。
(14)1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入ステップと、
送信部により、上記所定情報の分割部分が挿入された上記1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信ステップを有する
送信方法。
(15)1つ以上のメディア符号化ストリームを受信するストリーム受信部を備え、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて順次挿入されており、
上記1つ以上のメディア符号化ストリームの上記所定数の単位部分から上記所定情報の各分割部分を取り出し、上記順番情報に基づいて上記所定情報を再構成する処理と、該再構成された所定情報を利用した情報処理を制御する制御部をさらに備える
受信装置。
(16)上記ストリーム受信部は、
上記1つ以上のメディア符号化ストリームを、外部機器からデジタルインタフェースを介して受信する
前記(15)に記載の受信装置。
(17)上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入されている上記分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報が付加されており、
上記所定情報を再構成する処理では、上記識別情報に基づいて、上記1つ以上のメディア符号化ストリームの所定数の単位部分から上記所定情報の各分割部分を取り出す
前記(15)または(16)に記載の受信装置。
(18)受信部により、1つ以上のメディア符号化ストリームを受信するストリーム受信ステップを有し、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が再構成のための順番情報が付加されて順次挿入されており、
上記1つ以上のメディア符号化ストリームの上記所定数の単位部分から上記所定情報の各分割部分を取り出し、上記順番情報に基づいて上記所定情報を再構成するデータ構成ステップと、
上記再構成された所定情報を利用した情報処理を行う情報処理ステップをさらに有する
受信方法。
(19)1つ以上のメディア符号化ストリームを含む所定フォーマットのコンテナを受信する受信部を備え、
上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて順次挿入されており、
上記コンテナに、上記1つ以上のメディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入があることを示す識別情報が挿入されており、
上記識別情報に基づいて上記所定情報の分割部分の挿入がある上記1つ以上のメディア符号化ストリームを上記外部機器にデジタルインタフェースを介して送信する送信部をさらに備える
受信装置。
本技術の主な特徴は、メディア符号化ストリームの所定数の単位部分にビットレートが所定ビットレートに収まるように所定情報を分割して得た各分割部分を挿入して送信することで、メディア符号化ストリームに所定の情報を挿入して送信することを良好に行い得るようにしたことである(図2、図4、図6参照)。
10,10A・・・送受信システム
21・・・有効画素区間
22・・・水平帰線期間
23・・・垂直帰線期間
24・・・ビデオデータ区間
25・・・データアイランド区間
26・・・コントロール区間
31・・・HDMIトランスミッタ
32・・・HDMIレシーバ
33・・・DDC
34・・・CECライン
35・・・HPDライン
36・・・電源ライン
37・・・リザーブライン
100・・・放送送出装置
110A,110B,110C・・・ストリーム生成部
111・・・CPU
112・・・ビデオエンコーダ
113,113-1,113-2・・・オーディオエンコーダ
114・・・スプリッタ
115,115-1,115-2,117・・・インサータ
116・・・マルチプレクサ
200・・・セットトップボックス(STB)
201・・・CPU
202・・・フラッシュROM
203・・・DRAM
204・・・内部バス
205・・・リモコン受信部
206・・・リモコン送信機
211・・・アンテナ端子
212・・・デジタルチューナ
213・・・デマルチプレクサ
214・・・ビデオデコーダ
215・・・オーディオフレーミング部
216・・・HDMI送信部
217・・・HDMI端子
300・・・テレビ受信機(TV)
301・・・CPU
302・・・フラッシュROM
303・・・DRAM
304・・・内部バス
305・・・リモコン受信部
306・・・リモコン送信機
307・・・通信インタフェース
311・・・アンテナ端子
312・・・デジタルチューナ
313・・・デマルチプレクサ
314・・・ビデオデコーダ
315・・・HDMI端子
316・・・HDMI受信部
317・・・映像処理回路
318・・・パネル駆動回路
319・・・表示パネル
320・・・オーディオデコーダ
321・・・音声処理回路
322・・・音声増幅回路
323・・・スピーカ
351-1,351-2・・・エクストラクタ
352-1,352-2・・・デコーダ
353・・・データリアセンブラ
400・・・HDMIケーブル

Claims (16)

  1. 1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入部と、
    上記所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
    上記情報挿入部は、
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入される上記各分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報を付加する
    送信装置。
  2. 上記情報挿入部は、
    上記所定情報を、該所定情報のビットレートが所定ビットレートに収まるように分割する
    請求項1に記載の送信装置。
  3. 上記情報挿入部は、
    上記所定情報を、各分割部分のデータサイズが固定サイズとなるように分割する
    請求項1に記載の送信装置。
  4. 上記情報挿入部は、
    ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割ることにより上記固定サイズを算出する
    請求項に記載の送信装置。
  5. 上記情報挿入部は、
    上記所定情報を、上記分割部分が挿入された各単位部分のデータサイズが固定サイズとなるように分割する
    請求項1に記載の送信装置。
  6. 上記情報挿入部は、
    ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割って得られた第1のサイズと、上記メディア符号化ストリームのビットレートを1秒間で発生する上記単位部分の数で割って得られた第2のサイズとを加算することで上記固定サイズを算出する
    請求項に記載の送信装置。
  7. 上記コンテナに、上記1つ以上の上記メディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入があることを示す識別情報を挿入する識別情報挿入部をさらに備える
    請求項に記載の送信装置。
  8. 上記識別情報挿入部は、
    上記コンテナに、上記1つ以上の上記メディア符号化ストリームのそれぞれに対応して、上記所定情報の分割部分の挿入がある他のメディア符号化ストリームが存在するかを示す識別情報と、
    上記他のメディア符号化ストリームが存在するとき、該他のメディア符号化ストリームを示す識別情報をさらに挿入する
    請求項7に記載の送信装置。
  9. 1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分を、再構成のための順番情報を付加して順次挿入する情報挿入ステップと、
    送信部により、記所定情報が挿入されたメディア符号化ストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
    上記情報挿入ステップでは、
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入される上記各分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報を付加する
    送信方法。
  10. 1つ以上のメディア符号化ストリームを受信するストリーム受信部を備え、
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が、再構成のための順番情報が付加されて順次挿入されており、
    上記1つ以上のメディア符号化ストリームの上記所定数の単位部分から上記所定情報の各分割部分を取り出し、上記順番情報に基づいて上記所定情報を再構成する処理と、該再構成された所定情報を利用した情報処理を制御する制御部をさらに備え
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入されている上記分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報が付加されており、
    上記所定情報を再構成する処理では、上記識別情報に基づいて、上記1つ以上のメディア符号化ストリームの所定数の単位部分から上記所定情報の各分割部分を取り出す
    受信装置。
  11. 上記所定情報は、該所定情報のビットレートが所定ビットレートに収まるように分割されている
    請求項10に記載の受信装置。
  12. 上記所定情報は、各分割部分のデータサイズが固定サイズとなるように分割されている
    請求項10に記載の受信装置。
  13. 上記固定サイズは、ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割ることにより算出されている
    請求項12に記載の受信装置。
  14. 上記所定情報は、上記分割部分が挿入された各単位部分のデータサイズが固定サイズとなるように分割されている
    請求項10に記載の受信装置。
  15. 上記固定サイズは、ターゲットビットレートから上記メディア符号化ストリームのビットレートを差し引いて得られた許容ビットレートを1秒間で発生する上記単位部分の数で割って得られた第1のサイズと、上記メディア符号化ストリームのビットレートを1秒間で発生する上記単位部分の数で割って得られた第2のサイズとを加算することで算出されている
    請求項14に記載の受信装置。
  16. 受信部により、1つ以上のメディア符号化ストリームを受信するストリーム受信ステップを有し、
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に、所定情報を分割して得た各分割部分が再構成のための順番情報が付加されて順次挿入されており、
    上記1つ以上のメディア符号化ストリームの上記所定数の単位部分から上記所定情報の各分割部分を取り出し、上記順番情報に基づいて上記所定情報を再構成するデータ構成ステップと、
    上記再構成された所定情報を利用した情報処理を行う情報処理ステップをさらに有し、
    上記1つ以上のメディア符号化ストリームの所定数の単位部分に挿入されている上記分割部分に、他の上記メディア符号化ストリームへの上記分割部分の挿入があるか識別するための識別情報が付加されており、
    上記データ構成ステップでは、上記識別情報に基づいて、上記1つ以上のメディア符号化ストリームの所定数の単位部分から上記所定情報の各分割部分を取り出す
    受信方法。
JP2018504385A 2016-03-09 2017-02-27 送信装置、送信方法、受信装置および受信方法 Active JP6984586B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016046002 2016-03-09
JP2016046002 2016-03-09
PCT/JP2017/007572 WO2017154646A1 (ja) 2016-03-09 2017-02-27 送信装置、送信方法、受信装置および受信方法

Publications (2)

Publication Number Publication Date
JPWO2017154646A1 JPWO2017154646A1 (ja) 2019-01-10
JP6984586B2 true JP6984586B2 (ja) 2021-12-22

Family

ID=59790476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018504385A Active JP6984586B2 (ja) 2016-03-09 2017-02-27 送信装置、送信方法、受信装置および受信方法

Country Status (7)

Country Link
US (1) US10812838B2 (ja)
JP (1) JP6984586B2 (ja)
KR (1) KR20180120169A (ja)
CN (1) CN108702533B (ja)
CA (1) CA3015063A1 (ja)
MX (1) MX2018010460A (ja)
WO (1) WO2017154646A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691519A (zh) * 2018-02-22 2023-02-03 杜比国际公司 用于处理嵌入在mpeg-h 3d音频流中的辅媒体流的方法及设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0836329A4 (en) * 1996-04-12 2002-09-04 Sony Corp IMAGE ENCODER, IMAGE ENCODING METHOD AND RECORDING MEDIUM FOR IMAGE ENCODING PROGRAM
JP4345024B2 (ja) * 1996-04-12 2009-10-14 ソニー株式会社 画像符号化装置、画像符号化方法及び画像符号化プログラムを記録した記録媒体
EP1246451A2 (en) * 1996-08-30 2002-10-02 Matsushita Electric Industrial Co., Ltd. Digital broadcasting system, digital broadcasting apparatus, and a reception apparatus for digital broadcast
JP3431470B2 (ja) * 1996-08-30 2003-07-28 松下電器産業株式会社 デジタル放送装置、受信装置、デジタル放送システム、受信装置に適用するプログラム記録媒体
JP3179060B2 (ja) * 1997-06-19 2001-06-25 株式会社東芝 情報データ多重化伝送システムとその多重化装置及び分離装置
US20030084180A1 (en) 2001-10-31 2003-05-01 Tomohiro Azami Metadata receiving apparatus, receiving method, metadata receiving program, computer-readable recording medium recording therein metadata receiving program, metadata sending apparatus, and transmitting method
JP2003204275A (ja) * 2001-10-31 2003-07-18 Victor Co Of Japan Ltd メタデータ受信方法
US8218559B2 (en) * 2007-05-15 2012-07-10 Nokia Corporation Providing best effort services via a digital broadcast network using data encapsulation
JP5274212B2 (ja) * 2008-11-13 2013-08-28 日本テレビ放送網株式会社 デジタル放送方法及びシステムと、放送局及び受信機
JP2012010311A (ja) 2010-05-26 2012-01-12 Sony Corp 送信装置、送信方法、受信装置、受信方法および送受信システム
CN104429087B (zh) 2012-07-10 2018-11-09 夏普株式会社 再现装置、再现方法、发布装置、发布方法
JP6202826B2 (ja) * 2013-01-30 2017-09-27 キヤノン株式会社 通信装置、通信装置の制御方法、および、プログラム
JP6652320B2 (ja) 2013-12-16 2020-02-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 送信方法、受信方法、送信装置及び受信装置
JP6468739B2 (ja) * 2014-06-30 2019-02-13 日本放送協会 映像音声信号送信装置及び方法

Also Published As

Publication number Publication date
US10812838B2 (en) 2020-10-20
US20190037255A1 (en) 2019-01-31
MX2018010460A (es) 2019-01-14
CN108702533A (zh) 2018-10-23
CA3015063A1 (en) 2017-09-14
CN108702533B (zh) 2021-07-09
KR20180120169A (ko) 2018-11-05
WO2017154646A1 (ja) 2017-09-14
JPWO2017154646A1 (ja) 2019-01-10

Similar Documents

Publication Publication Date Title
JP7099510B2 (ja) 受信装置および受信方法
KR102396133B1 (ko) 송신 장치, 송신 방법, 수신 장치 및 수신 방법
US20240259617A1 (en) Transmission device, transmission method, media processing device, media processing method, and reception device
JP6809450B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6984586B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP6891806B2 (ja) 送信装置、送信方法、受信装置および受信方法
JP2024161226A (ja) 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200123

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211108

R151 Written notification of patent or utility model registration

Ref document number: 6984586

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151