以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、DVDに動画の記録再生を行ためのフォーマットを利用しつつ、静止画像を連続再生するスライドショーを実現するデータを記録する情報処理装置、及びそのようなデータを再生する情報処理装置に適用したものである。
(1)第1の実施の形態
(1−1)データ構造
ここでは、先ず、本発明の第1の実施の形態における情報処理装置にて記録又は再生されるデータの構造について説明する。図1は、本発明の記録再生システムで用いる記録媒体上の静止画像アプリケーションフォーマットの構造を簡単化して示す図である。このフォーマットは、上述した特許文献2に記載のアプリケーションフォーマットと同様な構成を有し、AVストリームの管理のためにPlay ListとClipの2つのレイヤをもつ。
本第1の実施の形態においては、1枚以上の静止画像からなる静止画像群である静止画像グループ(Group of picture files)とその静止画像グループの付属情報とのペアを1つのオブジェクトと考え、このオブジェクトをClipと呼ばれる単位で管理する。この静止画像グループの付属情報(画像属性情報)をClip Informationと呼ぶ。
また、Clipの中の静止画像を使ったスライドショーの再生区間の集まりをPlay Listと呼ぶ。Play Listは、静止画像の再生順序等を指定する再生パス(再生経路)を示す再生指定情報である。1つの再生区間は、Play Itemと呼ばる。従ってPlay Listは、Play Itemの集まりにより構成される。
Play Listには、2つのタイプがある。1つは、Real Play Listであり、もう1つは、Virtual Play Listである。Real Play Listは、それが参照しているClipの静止画像グループの部分を共有しているとみなされる。すなわち、Real Play Listは、それが参照しているClipの静止画像グループの部分に相当するデータ容量をディスクの中で占める。新しい静止画像が記録される場合、それはReal Play Listに自動的に追加される。Real Play Listの再生範囲の一部分が消去された場合、それが参照しているClipの静止画像グループの部分もまたデータが消去される。一方、Virtual Play Listは、Clipのデータを共有していないとみなされる。Virtual Play Listが変更または消去されたとしても、Clipは何も変化しない。なお、以下の説明においては、Real Play ListとVirtual Play Listを総称して単に、Play Listと呼んでいる。
図2は、Group of picture filesとそのClip Informationの例を示す図である。本実施の形態においては、上述したように、1枚以上の静止画像ファイルを1つのGroup of picture filesとして管理する。そして、このGroup of picture filesに対応するClip Information fileを設ける。Clip Informationは、Group of picture filesに含まれる各静止画像ファイル毎に、静止画像ファイルを参照する時の静止画像識別情報であるID(file_id)、file_idに対応するファイル名(file_name)、そのファイルのバイトサイズ(file_size)、各静止画像の水平方向画素数(horizontal_size)及び静止画像の垂直方向画素数(vertical_size)を示す情報を有するものである。
なお、図2においては、静止画像のデータ形式は、JPEG、PNGとしているが、その他、MPEG2 I-picture、GIF、及びJPEG2000等、静止画像のデータ形式であればなんでもよいことはいうまでもない。
本実施の形態においては、2種類のスライドショーについて説明する。第1のスライドショーは、各静止画像の再生開始時刻が予め決められているスライドショー(以下、タイムベーススライドショー又はタイムベースモードともいう。)であり、第2のスライドショーは、各静止画像の再生開始時刻が決められておらず、再生順序が決められているスライドショー(以下、Browsable slide showともいう。)である。
タイムベーススライドショーは、ユーザがスライドの再生を次に進めるということを再生装置(プレーヤ)に指示しない場合、それぞれのスライドの再生は自動的に進み、時間軸上で予め決められた時刻に所定のスライドが再生される。従って、各スライドの再生時間(スライドのスチルの持続時間)が有限となっている。タイムベーススライドショーにおいては、静止画像と同時にオーディオを再生する場合、オーディオの再生を静止画像の再生に同期させることができる。
一方、ブラウザブルスライドショーは、再生順序が決められており、各スライドの再生時間が有限又は無限となっている。このように、スライド再生時間が無限であるものが含まれている場合、ユーザが再生装置に、スライドの再生を次に進めるという指示をしない限り、次のスライドの再生には進まない。従って、それぞれのスライドの再生は時間軸上で予め決められた時刻に再生されない。ブラウザブルスライドショーにおいては、静止画像と同時にオーディオを再生する場合、オーディオは静止画像の再生に同期しない。
(1−2)再生開始時刻が指定されたスライドショー
各静止画像の再生開始時刻が予め決められている第1のスライドショーについて図3乃至図5を参照して説明する。
(1−2−1)スライドショー:静止画像のみ
図3は、各静止画像の再生開始時刻が予め決められているスライドショーを説明する図であって、図3(a)は、各静止画像の再生開始時刻が予め決められているスライドショーにおけるPlay Listの一例を示す図、図3(b)は、静止画像と再生時間との関係を示す模式図である。各静止画像の再生開始時刻が予め決められているスライドショーでは、それぞれの静止画像がPlay Itemの時間軸上の所定のタイミングで再生される。
Play Listは、複数のPlay Itemから構成されてなる。図3に示すように、各Play Itemは、スライドショーの再生区間を示すIN_time及びOUT_timeのデータを有している。このIN_time及びOUT_timeにより、各スライドショーの再生開始及び終了時刻を指定する。また、各Play Itemは、スライドショーを構成する各静止画像毎のデータ(以下、Sceneともいう。)を有する。このSceneは、Clipの中のGroup of picture filesを参照するときの静止画像の識別情報であるID(file_id)を含む。また、これらのSceneは、Play Itemの中での再生開始時刻(start_time_stamp)を含む。また、これらの各Sceneの再生時間、即ち各静止画像のスチル再生時間である表示時間(duration)を有する。
ここで、各Sceneの再生時間は、Play Itemの中で重なってもよく、1つのSceneは、複数のfile_idを持つことができる。例えば、図3(b)に示す場合、Scene[2]が、Scene[1]及びScene[3]と重なっている。この場合、Scene[2]の画像がScene[1]、及びScene[3]の両方の画像上に重ねて表示される。ここで、図3(b)における画像中の数字は、file_idを示す。なお、各画像の重なり位置の情報、即ち図3(b)においては、例えばScene[2]の画像のScene[1]の画像上での表示位置の情報は、Play Listに記述することができるが、Play Listとは別のファイルに記述されていてもよいし、または、Scene[2]が参照するGroup of picture filesの中に記述されていてもよい。
図4は、図3(a)に示すPlay ListとClipとの関係を示す図である。Play Listは、Clipの中の静止画像(この例ではファイルID)を参照する。Clip Informationは、Play Listによって参照される静止画像(ファイルID)とその実態(この例ではファイル名)との関係を示す。即ち、Clip Informationを参照して、Play Listに記述された静止画像識別情報であるID(file_id)のファイル名File_nameを特定する。そして、このファイル名の静止画像ファイルを、Group of Picture filesから読み出す。
(1−2−2)スライドショー:静止画像+オーディオ
次に、このような各静止画像の再生開始時刻が予め決められているスライドショーにオーディオを同期再生する場合について説明する。図5は、静止画像のスライドショーにオーディオを同期して再生する時のPlay Listの構成例を示す図である。各静止画像の再生開始時刻が予め決められているスライドショーにオーディオを同期する場合、Play Listにおいて、静止画像の再生パスを示すPlay Item(MainPath)とは別に、オーディオの再生パスを示すオーディオ再生指定情報としてのSub Play Item(SubPath)を設ける。
このSub Play Itemは、Play Item(Play List)の時間軸上での再生開始時刻(sync_start_PTS_of_Play Item)を含む。また、このSub Play Itemは、Sub Play Itemが参照するClip上での再生開始時刻(Sub Play Item_IN_time)を含む。また、このSub Play Itemは、Sub Play Itemが参照するClip上での再生終了時刻(Sub Play Item_OUT_time)を含む。
Sub Play ItemがClipの中へのアクセスポイントをプレゼンテーションタイムスタンプ(PTS)で指し示している時、Clip Information fileは、AVストリームファイルの中でストリームのデコードを開始すべきアドレス情報を見つけるために役立つ。Sub Play Itemが参照するClipのAVストリームファイルはオーディオストリームである。
即ち、Clip Information fileは、オーディオストリームにおける開始時刻と、開始時刻及び終了時刻に対応するソースパケット(アクセス最小単位)のアドレスを示す情報とが記述されたテーブル(オーディオ用のEP_map)を有する。このテーブルを参照して、指定されたプレゼンテーションタイムPTSに対応するアドレスを取得し、このアドレスで示されるオーディオデータを読み出し再生することができる。このように、Sub Play Itemは、静止画像の再生パスを示すPlay Itemの時間軸上での再生開始時刻を有するため、静止画像のスライドショーにオーディオを同期して再生することができる。
(1−3)再生順序のみが指定されたスライドショー
次に、静止画像の再生順序のみを指定する第2のスライドショー(Browsable slide show)について、図6乃至図8を参照して説明する。
(1−3−1)スライドショー:静止画像のみ
図6(a)は、Browsable slide showを示すPlay Listの一例を示す図、図6(b)は、静止画像と再生時間との関係を示す模式図である。この場合、図6(a)に示すように、Browsable slide showのPlay ItemのSceneは、図3乃至図5の場合と異なり、静止画像の再生開始時刻を指定しない。各静止画像のPlay Itemの中での再生開始時刻(start_time_stamp)の情報の代わりに、各静止画像がPlay Item上で再生される順番のみを指定する情報を有している。更に、図3乃至図5に示す例とは異なり、Play Itemは、IN_time及びOUT_timeを持たない。また、スライドショーを構成する各静止画像の再生時間(表示時間)が決められていない。この例の場合、ユーザが各Sceneの再生時間をプレーヤへ指示することができる。
また、このPlay Listの各Sceneは、上述の図3のような予め決められた再生時間(duration)ではなく、各静止画像のPlay Item中での再生順番に対応したデフォールト再生時間を示す情報を有する。ユーザが特に何も指定しない時のみ、プレーヤはデフォールト再生時間のスチル再生を行う。このように、デフォールト再生時間を有することにより、ユーザは、リモコン等で次の静止画像への進行をプレーヤへ指示し、各静止画像のスチル再生時間を自由にコントロールすることができる。
即ち、Play Itemの各Sceneは、Play Itemの中でのSceneの再生の順序を指定する情報(playing_order)と、Clipの中のGroup of Picture filesを参照する時の静止画像の識別情報であるID(file_id)と、各Sceneのデフォールト再生時間(default_duration)とを有している。なお、このデフォールト再生時間は、各静止画像毎に異なる値としても、同じ値としてもよい。
また、Browsable slide showにおいても、上述の再生時刻を予め指定するスライドショーの場合と同じく、1つのSceneに複数の静止画像を重ねて表示することもできる。この場合は、1つのSceneに複数のfile_idが記述される。例えば図6(a)の場合、図6(b)に示すように、Scene[1]にfile_id=1とfile_id=2とが記述されている場合、file_id=2の画像がfile_id=1の画像上に表示される。ここで、図6(b)における画像中の数字は、file_idを示す。なお、file_id=2の画像のfile_id=1の画像上での表示位置の情報は、Play Listに記述することができるが、Play Listとは別のファイルに記述されていてもよいし、または、file_id=2が参照する画像ファイルの中に記述されていてもよい。
図7は、図6(a)に示すPlay Listと、Clipの関係の例を示す図である。Play Listは、Clipの中の静止画像を参照して、Clip Informationは、Play Listによって参照される静止画像とその実態の関係を示す。即ち、本実施の形態においては、Play Listが示すClipの中の静止画像を識別するためのファイルIDから、Clip Informationを参照し、このファイルIDに対応するファイル名を取得し、このファイル名の静止画像をGroup of Picture filesから読み出し再生する。
(1−3−2)スライドショー:静止画像+オーディオ
次に、このようなBrowsable slide showに対してオーディオを非同期に再生する場合について説明する。図8は、オーディオを非同期に再生するBrowsable slide showのPlay Listと、Clip Information fileと、オーディオストリームとの関係を示す図である。Play Listは、静止画像の再生パスを示すPlay Itemと、オーディオの再生パスを示すPlay Itemとからなるが、オーディオを非同期に再生する場合、図5に示す場合と異なり、Play Listは、Play Itemがオーディオの再生パスを示し、Sub Play Itemが静止画像の再生パスを示す。
このBrowsable slide showでは、ユーザが、リモコン等で次の静止画像への進行をプレーヤへ指示して、各静止画像のスチル再生時間が変化しても、オーディオ再生は、スライドショーの進行とは非同期であるため、途切れないで連続に再生される。
ここで、スライドショーの再生経路を示すSub Play Itemの構成は、上述の図6で説明したスライドショーの再生経路を示すPlay Itemと同じである。即ち、Play Itemの中でのSceneの再生順番(playing_order)と、Clipの中のGroup of Picture filesのファイルを参照する際に必要なID(file_id)と、Sceneのデフォールト再生時間(defoult_duration)とから構成されている。
また、図8に示すBrowsable slide showのオーディオの再生経路を示すPlay Itemは、Play Itemが参照するClip上での再生開始時刻(IN_time)と、Play Itemが参照するClip上での再生終了時刻(OUT_time)とが記述されている。
オーディオの再生経路を示すPlay Itemが、Clipのオーディオストリーム中へのアクセスポイントをタイムスタンプで指示している時、Clip Information fileは、ClipのAVストリームファイルの中でオーディオストリームのデコードを開始すべきアドレス情報を見つけるために役立つ。
即ち、Play Itemが参照するClip Information fileは、オーディオストリームにおいて、各再生区間の開始時刻とそのアドレスとの対応関係が記述されたテーブル(オーディオ用EP_map)を有する。これにより、再生装置は指定されたタイムスタンプをアドレスに変換して目的の再生区間のオーディオストリームを読出し再生することができる。
ここでは、オーディオの再生経路を示すPlay Itemにおいて、再生開始時刻と終了時刻とが決められているため、例えばオーディオの再生終了時刻にスライドショーが終了するようにしてもよいし、また、終了時刻まで再生されたオーディオを再び再生するようにして、オーディオを複数回繰り返して再生するようにしてもよい。
(1−4)情報処理装置(記録装置)の構成
次に、上述したように、各静止画像の再生開始時刻が予め決められているスライドショー又は静止画像の再生順序のみが予め決められているスライドショーを実現するためのデータを記録する本実施の形態における情報処理装置について説明する。
図9は、本実施の形態における情報処理装置を示すブロック図である。図9に示すように、情報処理装置1は、端子13を介して静止画像が入力され、これを符号化する静止画像エンコーダ14と、端子10を介してオーディオが入力され、これを符号化するオーディオエンコーダ11と、端子15を介してスライドショーの再生内容に関する情報が入力されると共に、静止画像エンコーダ14及びオーディオエンコーダ11から夫々画像属性情報及びオーディオ属性情報が供給され、上述したPlay List及びClip Informationを生成するコントローラ16と、コントローラ16からPlay List及びClip Informationが供給されこれを例えばDVD等の記録媒体(メディア)に記録すると共に、静止画像及びオーディオデータを所定の形式にて、記録媒体に記録する記録部17とから構成される。
コントローラ16は、スライドショーの再生内容に関する情報として、上述の図3に示したように、各静止画像の再生開始時刻が予め決められている場合、各静止画像の再生開始時刻及びその再生時間(表示時間)の情報を受取る。また、図5に示したように、そのようなスライドショーにオーディオを同期して再生する場合、各静止画像の再生開始時刻及びその再生時間に加え、オーディオの再生時間の情報として静止画像の再生パスを示すPlay Item上での再生開始時刻と、オーディオストリーム中での再生区間を示す情報とを受取る。また、上述の図6に示したように、各静止画像の再生開始時刻が決められていなく、その再生順序のみが決められているスライドショーの場合、各静止画像の再生順番及びそのデフォールト再生時間の情報を受取り、また、図8に示したように、そのようなスライドショーとは、非同期のオーディオを再生するの場合、各静止画像の再生順番及びそのデフォールト再生時間に加え、オーディオストリーム中の再生区間を示す情報を受取る。また、コントローラ16は、静止画像エンコーダ14から、画像属性情報として、各静止画像のデータサイズ、垂直及び水平画素数等のデータが供給され、Group of Picture filesに含まれる各静止画像に対応する、図2に示すClip Informatioinを作成する。
そして、コントローラ16は、供給された情報から、このClip Informatioinに記述されたID(file_id)を使用して、上述した静止画像及びオーディオの再生パスを示すPlay Listを作成する。また、オーディオデータのPlay Item上の再生時刻と、オーディオストリームのアクセス最小単位(アクセスポイント)のアドレスとの対応関係を示すテーブル(オーディオ用のEP_map)を有するオーディオデータ用のClip Information(オーディオ属性情報)を作成する。
記録部17は、これらのClip Information及びPlay Itemを記録媒体に記録すると共に、これらの情報に従ってデータを記録する。図10は、記録するデータのファイルとディレクトリの構成の例を示す図である。図10に示すように、ルート100は、BDAV110及びPICTURE120のディレクトリを有し、BDAV110は、PLAY LIST111、CLIPINF112及びSTREAM113というディレクトリを有している。PLAY LIST111は、複数のPlay Listファイル111a〜111cを有している。また、CLIPINF112は、オーディオストリームのClip Informationファイル112aと、Group of picture filesのClip Informationファイル112bとを有している。また、STREAM113は、オーディオストリーム(Auxiliary audio stream)ファイル113aを有している。更に、PICTURE120は、例えば静止画像ファイル121〜125のグループからなるGroup of picture files120aを複数有している。
図11は、Clip Informationとそれに関連する静止画像ファイルの記録媒体(ディスク)上でのデータ配置の例を示す。本実施の形態においては、図3及び図6に示すように、Clip Informationの中に出現する画像ファイル名(画像識別情報ID(file_id))の順番に、再生装置(プレーヤ)が静止画像ファイルを読み出し、再生する。よって、プレーヤが静止画像ファイルを読み出す順番に、記録媒体(ディスク)上に静止画像データを並べると、プレーヤのデータのシークにかかる時間を最小にすることができるため、読み出す静止画像ファイルの順番どおりに記録媒体上に静止画像データを書き込むようにすることができる。
次に、本実施の形態における情報処理装置の記録動作について説明する。図12は、本実施の形態における情報処理装置の記録動作のうち、Play Listの作成方法を示すフローチャートである。先ず、静止画像エンコーダ14は、端子13を介して供給される静止画像をエンコードして画像データを生成し、記録部17へ供給すると共に、その画像属性情報をコントローラ16へ供給する。また、オーディオエンコーダ11は、端子10を介して供給されるオーディオデータをエンコードしてオーディオストリームを生成し、記録部17へ供給すると共に、そのストリーム属性情報をコントローラ16へ供給する。
そして、図12に示すように、コントローラ16は、スライドショーの再生内容を取得する(ステップS1)。即ち、上述したように、スライドショーとオーディオとがAV同期する場合には、各静止画像の再生開始時刻及びその再生時間、並びに、これに同期して再生するオーディオの再生時間の情報を端子15を介して受取る。また、スライドショーとオーディオとがAV非同期の場合には、各静止画像の再生順番及びそのデフォールト再生時間、並びにオーディオの再生時間の情報を端子15を介して受取る。
次いで、コントローラ16は、静止画像エンコーダ14から画像属性情報を受取り(ステップS2)、オーディオエンコーダ11からオーディオ用のEP_map等のオーディオストリーム属性情報を受取る(ステップS3)。そして、コントローラ16は、この画像属性情報に従って、上述のGroup of picture filesに関する付属情報としてClip Informationを作成する(ステップS4)。即ち、スライドショーで再生する画像の順番に、それぞれの静止画像の属性データを登録する。更に、Clip Informationの画像ファイルのfile_idを参照して、供給された外部からの情報に基づきスライドショーの再生区間(再生パス)を示すPlay Listを作成すると共に、オーディオの再生パスを示すPlay Listを作成する(ステップS5)。更に、コントローラ16はPlay ListとClip Informationとを記録部17に記録するよう指示する。
記録部17は、コントローラ16にて作成されたPlay List及びClip Informationを記録媒体に記録すると共に、静止画像エンコーダ14及びオーディオエンコーダにて生成された夫々画像データ及びオーディオデータを記録媒体に記録する。このとき、記録部17は、Clip InformationのPlay Item中に出現する画像ファイル順に画像データが並ぶように、画像データを記録する。
このように構成された記録装置としての情報処理装置においては、1以上の静止画像ファイルをまとめて1つのファイルとしたGroup of picture filesとして管理し、このファイルに含まれる各静止画像を管理する例えば識別情報(file_id)等の情報をClip Informationとして管理し、スライドショーにおける各静止画像の再生を指定するPlay Itemを使用する。したがって、上記特許文献2等に記載されている動画用の記録装置と互換を保ちつつスライドショーを実現するデータを記録することができる。即ち、動画像におけるAVストリームファイルの代わりに、静止画像グループのファイル(Group of picture files)を用意する。このGroup of picture files内のファイルを参照するためのClip Information fileを用意し、Play Listによりその再生を指定することにより、動画像のデータのフォーマットにおけるClip(Information file)、Play List等との共通化を図ることができる。
(1−5)情報処理装置(再生装置)の構成
図13は上述の記録装置により記録されたデータを再生する情報処理装置を示すブロック図である。図13に示すように、情報処理装置20は、記録媒体からデータを読み出す読出部21と、読出部21により読み出されたPlay List及びClipInformationが供給されるコントローラ22と、読出部21により読み出された静止画像データ及びオーディオデータが供給される夫々静止画像デコーダ23及びオーディオデコーダ26と、デコードされた静止画像を一時的に保持するフレームバッファ24と、静止画像の再生を制御するプロセッサ25とから構成される。
コントローラ22は、Play Listを参照して再生する静止画像データのID(file_id)を取得し、静止画像デコーダ23に、取得した静止画像データのIDが示す静止画像素データを読み出させ、復号させる。ここで、静止画像の再生開始時刻が予め決められていないスライドショーを再生する場合は、コントローラ22には、ユーザーインターフェース27を介してユーザからの指示が供給され、このユーザからの指示のタイミングにより、静止画像データのIDを取得して読み出し動作を行わせることができる。また、ユーザからの指示がない場合は、Play Listに記述されている静止画像の再生時間(duration)又はデフォールトの再生時間(default_duration)を経過した場合に、静止画像データのIDを取得し読み出し動作を行う。
また、コントローラ22は、Play Listを参照して再生するオーディオデータの再生時間を取得し、オーディオストリームのClip Informationを参照し、当該再生時間に対応するオーディオストリームのアドレスを取得し、読出部21に対して該当するオーディオデータを読み出すよう指示する。
以下、この情報処理装置の再生動作について詳細に説明する。図14は、本実施の形態の情報処理装置における再生動作を示すフローチャートである。図14に示すように、先ず、読出部21により、Play ListとClip Informationを読み出し、コントローラ22に供給する。コントローラ22はPlay Listの静止画像の再生パスを示すPlay Itemの静止画像を識別するfile_idを取得する(ステップS11)。そして、コントローラ22は、Group of picture filesのClip Informationを参照して、上記の静止画像のfile_idが示す静止画像ファイルを特定し、その静止画像ファイルを読出部21により、Group of picture filesから読み出す(ステップS12)。
また、コントローラ22は、Play Listのオーディオの再生パスを示すPlay Itemに従って、オーディオの再生時間を取得する(ステップS13)。そして、Auxiliary audio streamのClip Informationを参照して、オーディオストリームファイルの中でストリームのデコードを開始すべきアドレス情報を取得して、その情報に基づいて読出部21により、オーディオストリームファイルからオーディオデータを読み出す(ステップS14)ように制御する。
そして、静止画像デコーダ23は、ステップS12で読み出された静止画像データをデコード(ステップS15)し、デコードした画像をフレームバッファ24へ入力する。また、オーディオデコーダ26は、ステップS14にて読み出されたオーディオデータをデコードし(ステップS16)、デコードしたオーディオを出力する。コントローラ22は、プロセッサ25に所定の指示を出し、フレームバッファ24は、その指示に従って、ストアしている画像を所定のタイミングにて再生する(ステップS17)。
ここで、ステップS11において、コントローラ22は、次のタイミングt1又はt2にて静止画像のfile_idを取得する。即ち、静止画像の再生時間が、Play Listの静止画像の再生パスを示すPlay Itemの該当するSceneに記述されている再生時間を経過したタイミングt1、又はユーザーインターフェース27から静止画像を切り替える指示を受け取ったタイミングt2である。ここで、Play Itemの最後の静止画像を再生終了したとき、コントローラ22はPlay Listの再生を終了する。
即ち、コントローラ22は、上述の図3乃至図5に示す各静止画像の再生開始時刻が予め決められている場合は、上記タイミングt1、即ちPlay ItemのSceneに記述されたduratonが経過したタイミングでfile_idを読み出し、これに対応する静止画像の読み出しを読出部21に指示することができる。また、上述の図6乃至図8に示す各静止画像の再生開始時刻をユーザ等に指示させる場合は、上記タイミングt2、即ち、ユーザから等の静止画像の切り替え指示のタイミングにて次のfile_idを読み出し、これに対応する静止画像の読み出しを指示することができる。ここで、静止画像の切り替え指示が供給されない場合は、予め決められているデフォールトの再生時間(default_dulation)を経過した時点を次のfile_idの読出しのタイミングとする。
このように構成された再生装置としての情報処理装置においては、静止画像の連続再生であるスライドショーを実現するデータのフォーマットとして、静止画像及びオーディオデータの管理のためにPlay ListとClipとからなる2つのレイヤを設け、Clipにおける静止画像群及びオーディオストリームと、これらの付属情報であるClip Information fileとが別々のファイルで管理されているため、上述の特許文献2等に記載された動画像の記録再生に適用されるデータのフォーマットと共通化を図ることができる。即ち、Clipに1以上の静止画像からなるGroup of picture filesと、これを管理するClip Information fileとを設け、Play ListのPlay Itemにてスライドショーの再生区間を指定して、静止画像の連続再生であるスライドショーを実現するようにしたので、動画像を扱う情報処理装置と互換を保ちつつ静止画像を連続再生することができる。
また、Play ListのPlay Itemに記述される再生パスの順序で静止画像を記録することにより、読出しにかかるシーク時間を短くすることができる。
(1−6)の変形例
また、上述の実施の形態においては、Group of picture filesに含まれる1以上の静止画像に別々の画像ファイル名を付し、Group of picture filesを別々の画像ファイルの集合として管理する場合について説明したが、これを1つの画像ファイルとして管理してもよい。次に、Group of picture filesに含まれる1以上の静止画像を1つの画像ファイルとして管理する第1の実施の形態における変形例について説明する。
本変形例においては、Group of picture filesにおいて、1以上の静止画像を含む画像ファイルのグループ(以下、静止画像グループファイルという。)に分け、この静止画像グループの例えば再生順序の先頭から順番にID番号を割り振り、そのID番号をClip Informationが参照するものである。
Group of picture filesに含まれる1以上の静止画像を1つの画像ファイルとして管理する本変形例においは、例えば、同時にプレゼンテーションされる静止画像をグループ化して管理することができる。具体的には上述した図7に示すスライドショーの場合、同時に再生されるfile_id=1及びfile_id=2の2つの静止画像を1つのグループとしてグループ化し、また、file_id=3の静止画像を1つのグループとし、また、同時に再生されるfile_id=4とfile_id=5の静止画像を1つのグループとしてグループ化する。
この場合、上述した図6に示すPlay Listとは異なる構造を有する。図15は、本変形例におけるPlay ListとClipとの関係の例を示す図である。図15に示すように、Play Listは、静止画像の再生パスを示すPlay Itemから構成されてなる点は図6と同様であるが、Play Itemは、図6に示すSceneの代わりに、Pageを有している。ここで、図6に示すSceneは、Play Itemの中での各Sceneの再生順序を指定する情報、Clipの中のGroup of picture filesを参照する際の静止画像の識別情報ID(file_id)、及びデフォールトの再生時間を有しているが、本変形例におけるPageは、上記Sceneの静止画像の識別情報ID(file_id)の代わりに、各静止画像グループの識別情報であるID(group_id)が記述されている点が異なる。その他の点においては、このPageはSceneと同等の機能を有する。即ち、Pageは、Play Itemの中での各Pageの再生の順序を指定する情報(playing_order)と、Clipの中のGroup of Picture filesを参照する際の静止画像グループの識別情報であるID(group_id)と、各Groupのデフォールト再生時間(default_duration)とを有している。
本変形例においても、Play Listは、Clipの中の静止画像を参照し、そして、Clip Informationは、Play Listによって参照される静止画像とその実態との関係を示す。即ち、Play Listは、Clipの中の静止画像を識別するための静止画像グループ識別情報ID(group_id)を参照する。そして、Clip Informationは、この静止画像グループ識別情報ID(group_id)に対応するグループ化された静止画像の記録媒体上でのアドレス情報を示す。再生装置は、このアドレス情報を取得し、静止画像を読み出し再生する。
図16は、図15に示す本変形例におけるClip Informationとそれに関連する静止画像ファイルの記録媒体(ディスク)上でのデータ配置の例を示す。Clip Informationは、上述したように、各々の静止画像グループ識別情報ID(group_id)に対応するグループ化された静止画像の記録媒体上でのアドレス情報(ads1、ads2、ads3)を有する。そして、記録媒体上には、Play Itemの再生順序に従って、即ちPage[1]、[2]、[3]に記述された静止画像グループ識別情報ID(group_id=1、2、3)の順番に、静止画像グループデータが記録されている。
再生装置(プレーヤ)は、Clip Informationの中に出現する静止画像グループ識別情報ID(group_id)の順番に、静止画像データを読み出して再生する。このような静止画像ファイルの構造にすることにより、Group of picture filesを別々の画像ファイルの集合とする場合に比べて、ファイルを管理するためのファイルシステムデータの量を低減することができる。
(2)第2の実施の形態
次に、本発明の第2の実施の形態について説明する。上述の第2の実施の形態においては、Group of picture filesの各静止画像、又は各々の静止画像グループの画像データがそのまま記録媒体に記録されるものとして説明したが、本実施の形態においては、この画像データがトランスポートストリーム(TS)の形式で記録されるものである。静止画像をトランスポートストリームに多重化する際は、上述の図9における記録部17にて多重化するものとする。
(2−1)スライドショー:静止画像のみ
図17は、本実施の形態におけるClip Informationとそれに関連する静止画像ファイルの記録媒体(ディスク)上でのデータ配置を示す。ここでも、同時再生される1以上の静止画像を静止画像グループとして管理する場合であって、再生順序を指定し、各静止画像の再生時間(スライドのスチルの持続時間)が有限であるデフォールトの再生時間としたスライドショーについて説明する。
本実施の形態においては、各々の静止画像グループの画像データがトランスポートストリームに多重化されているため、Clip Informationは、グループ化された静止画像の識別情報ID(group_id)と、それに対応するグループ化された静止画像が多重化されているトランスポートストリーム中における開始アドレス、即ち先頭のソースパケット番号(SPN_start)とを示すテーブルであるEP_mapを有する。なお、ソースパケット番号とは、トランスポートストリームファイルの中におけるソースパケットの順番に1ずつインクリメントされて付される番号であり、トランスポートストリームファイルの先頭のソースパケット番号がゼロとされるものである。
記録装置は、上述の第1の実施の形態と同様に、再生順序(読出し順序)に従って静止画像グループの画像データをトランスポートストリームに多重化して記録し、再生装置(プレーヤ)は、このClip Informationの中に出現する静止画像グループ識別情報ID(group_id)の順番に、静止画像データを読み出して再生する。このような静止画像ファイルの構造にすることにより、このトランスポートストリームの構造は、上記特許文献2で説明されているAVストリームファイルと同様とすることができ、同様の記録再生装置を使用すること等ができて便利である。
また、図16に示す変形例及び図17に示す本実施の形態に示すように、再生順序に従ってデータが記録されたデータ配置にすることにより、図11の場合と同様の効果を奏する。即ち、プレーヤが静止画像ファイルを読み出す順番に、記録媒体(ディスク)上に静止画像データを並べ、読み出す静止画像ファイルの順番どおりに記録媒体上に静止画像データを書き込むようにすることで、プレーヤのデータのシークにかかる時間を最小にすることができる。
(2−2)スライドショー:静止画像+オーディオ
次に、このようなスライドショーに対してオーディオを非同期に再生する場合について説明する。図18は、本実施の形態におけるオーディオを非同期に再生する場合のPlay Listを示す図である。Play Listは、静止画像の再生パスを示すPlay Itemと、オーディオの再生パスを示すPlay Itemとからなる。ここで、静止画像の再生パスをPlay Itemとし、オーディオの再生パスをSub Play Itemとしている点が図8に示す場合とは異なる。従って、本実施の形態においては、Sub Play Itemに、再生開始時刻In_timeと再生終了時刻Out_timeを持たせ、オーディオストリームの中の再生開始と再生終了のタイムスタンプを参照する。また、Play Itemは、上述したようにスライドショーを構成する各静止画像のデータであるPageを有している。
再生装置は、Clip informationを参照して、Sub Play Itemの再生開始時刻In_timeと再生終了時刻Out_timeに対応するところのオーディオストリームのデータの記録媒体上でのアドレス情報を取得する。そして、再生装置は、このアドレス情報を用いてオーディオを読み出し再生する。このようなオーディオの再生の仕組みは、図8に示す第1の実施の形態と同様である。
また、Sub Play Item及びPlay Itemには、再生パス等の情報に加えて、再生制御情報を付加することができる。ここで、本実施の形態におけるSub Play Itemは、再生制御情報として、Sub Play Itemの再生がPlay Itemの再生と非同期であることを示す第1の情報(Sub Play Item_type)が付加されている。更に、このSub Play Itemの再生制御情報として、オーディオストリームの再生開始時刻IN_timeと再生終了時刻Out_timeとで示される再生区間を繰り返し再生するか、又は1回だけ再生するかを示すフラグ(第2の情報)(is_repeat_Sub Play Itemフラグ)が付加されている。再生装置は、この第1の情報Sub Play Item_typeにより、Sub Play Itemの再生がPlay Itemの再生と非同期と判断する。また、is_repeat_Sub Play Itemフラグが例えば0のとき、1回のみの再生とし、フラグが1のとき、上記再生区間を繰り返し再生する。
なお、ここでは、この2つの再生制御情報は、静的なデータ形式でSub Play Itemに付随するデータとして説明したが、その他、プレイバックコントロール(いわゆるPBC)のコマンド形式でSub Play Itemに付随させてもよい。具体的には、例えば、is_repeat_Sub Play Itemフラグの代わりに、Repeat-Sub Play Itemというコマンドを使用してSub Play Itemに付随させてもよい。
(3)第3の実施の形態
次に、本発明の第3の実施の形態について説明する。本実施の形態は、上述の第1の実施の形態において説明した図3に示す各静止画像の再生時刻が予め決められているスライドショーや、静止画像の再生順序のみを指定する図6又は図15に示すスライドショーにおいて、Scene又はPageとして記述されている1つの再生パスを示す画像再生指定情報を、1つのPlay Itemとし、各Scene又はPageに対応する数のPlay Itemを持たせるものである。このように、各Play Itemにより再生パス(1つの再生区間)を示すことにより、AVストリームの再生区間(時間軸上のイン点(IN)とアウト点(OUT)の対で表されるPlay Item)をグループ化したものをPlay Listとして有している上記特許文献2に記載の情報処理装置におけるPlay Itemと同様の構成とすることができ、更に互換性を高めることができる。
(3−1)スライドショー:静止画像のみ
図19(a)及び(b)は、再生順序を指定し、それぞれのスライドの再生時間(スライドのスチルの持続時間)が有限であるスライドショーであって、例えば、図6に示すScene、又は図18に示すPageの代わりに、Play Itemを使用した場合の夫々Play List及び静止画像と再生時間との関係を示す図である。図19に示すように、本実施の形態においては、各Play Itemは、再生開始時刻IN_timeと再生終了時刻OUT_timeを使って、各静止画像又は同時に再生される静止画像グループの再生区間を示す。即ち、図6又は図18に示すPlay Itemにおいては、各Scene又はPageにて各Scene又はPageの長さを示すデフォールトの再生時間(表示時間)default_dulationを指定するものであるが、本実施の形態においては、図19(a)に示すように、Play Item1が、例えば図18のPage[1]に相当し、そのIN_timeとOUT_timeを夫々t1及びt2に設定する。従って、このt1からt2で示される再生区間は、デフォールト再生時間(delfault_duration)のd1に等しい。また、Play Item2のIN_time及びOUT_timeを夫々t2及びt3に設定する。このt2からt3の再生区間は、デフォールト再生時間(delfault_duration)のd2に等しい。また、Play Item3のIN_time及びOUT_timeを夫々t3及びt4に設定する。このt3からt4の再生区間は、デフォールト再生時間(delfault_duration)のd3に等しい。
各Play ItemのIN_time及びOUT_timeは、AVストリームの中の再生範囲を示しており、AVストリームの中のIN_timeのPTSからOUT_timeのPTSの値までの静止画データが再生される。図19に示すタイプのスライドショーの場合、あるPlay ItemのIN_timeのPTSからOUT_timeのPTSの値までの静止画像データが再生されると、プレーヤは、自動的に次のPlay Itemの再生に移る。
また、図19に示すPlay Itemでは、静止画像のデフォールト再生時間が有限である場合である。しかし、例えばPlay Listの作成者が、このデフォールト再生時間を無限に設定したい場合、Play Itemの情報に、再生終了時刻OUT_timeの再生画像を表示しつづけることを示す情報を追加することにより、デフォールト再生時間を無限に設定することも可能である。上述したようにPlay Itemには、上記特許文献2に記載の情報処理装置と同様、新たに情報(再生制御情報)を追加することができる。例えば、図20に示すように、Play Itemに、OUT_Timeの画像を表示し続けるか否かを示す再生制御情報としてフラグis_Play Item_Stillを付属させることができ、このフラグis_Play Item_Still=1に設定されている場合(default_durationが無限の場合)、再生装置は、Play Itemの再生終了時刻OUT_timeのPTSの画像を再生したところで、その画像を表示し続ける。この場合、ユーザがスライドの再生を次に進めるということをプレーヤへ指示しない限り、次のスライドの再生に進まない。そして、ユーザが、次の静止画像へ再生を進めることを再生装置に命令すると、再生装置は次のPlay Itemの再生を開始する。
このように、Play Itemにフラグis_Play Item_Stillを付属させれば、1つのPlay Listの中に、静止画像のデフォールト再生時間が有限のPlay Itemと無限のPlay Itemを混在させることができる。図20に示す例では、Play Item1及びPlay Item3の再生時間を無限にし、Play Item2の再生時間を有限にした場合を示す。また、全てのPlay Itemにおける再生時間を無限としてもよい。
なお、ここでは、OUT_timeの再生画像を表示し続けることを示す再生制御情報は、静的なフラグというデータ形式でPlay Itemに付随するデータとして説明したが、その他、プレイバックコントロール(いわゆるPBC)のコマンド形式でPlay Itemに付随させてもよい。具体的には、例えば、Still-Play Itemというコマンドを使用してPlay Itemに付随させることができる。
図19及び図20のPlay Itemが参照する1以上の静止画像からなる静止画像ファイルは、図17に示したようなトランスポートストリームの形式で記録媒体に記録されている。そして、Play Itemの再生開始時刻IN_timeと再生終了時刻OUT_timeが示すところのトランスポートストリームのデータアドレスは、Clip InformationのEP_mapを参照することにより得ることができる。図21及び図22は、Play Listと、そのClip Information fileと、記録媒体上に記録されるデータを模式的に示す図である。
図21は、図19に示すPlay Itemの再生時間が有限の場合を示す。図17と同様に、トランスポートストリーム形式の静止画像ファイルにおいて、ABCD0001.JPGとABCD0001.PNGとが多重化されているトランスポートストリームは、プレゼンテーションタイムスタンプPTSがt1からt2までの範囲であり、また、ABCD0002.JPGが多重化されているトランスポートストリームはPTSがt2からt3までの範囲であり、また、ABCD0003.JPGとABCD0003.PNGとが多重化されているトランスポートストリームはPTSがt3からt4までの範囲である。これら、PTSがt1〜t4の間には、静止画像とそれにオーバーレイされるグラフィックスや字幕等がトランスポートストリームに多重化されている。
この静止画像ファイルのトランスポートストリームに関連して記録媒体に記録されているClip Information fileのEP_mapは、トランスポートストリームのプレゼンテーションタイプスタンプPTSの値とそれが示すところのトランスポートストリーム中におけるソースパケット番号との対応関係を示すテーブルである。即ち、本実施の形態におけるEP_mapは、Play Item1、Play Item2及びPlay Item3のそれぞれのIN_timeであるt1、t2及びt3が示すところの各ソースパケット番号の値を有する。ここで、上述の第2の実施の形態における図17に示すEP_mapは、複数の静止画像グループ識別情報Group_idと、それが開始されるソースパケット番号SPN_startとの対応関係を示すテーブルであるのに対し、図21に示す本実施の形態におけるEP_mapは、上記特許文献2に記載のEP_mapと同様の構成、即ち、静止画像のタイムスタンプPTS_startと、それが開始される先頭のソースパケット番号SPN_startとの対応関係を示すテーブルとなっている。
再生装置(プレーヤ)は、このEP_mapを用いて、Play Itemが参照している静止画像データ、即ち、ソースパケット番号SPN_startで示されるデータを読み出し、再生する。このような静止画像ファイルの構造にすることにより、このトランスポートストリームの構造は、上記特許文献2で説明されているAVストリームファイルと同様の構造であるので、同様の記録再生装置を使用すること等ができて便利である。
この図21に示すPlay Listでは、静止画像のデフォールトの再生時間は有限に設定されており、そのデフォールトの再生時間は、Play Itemの再生開始時刻IN_timeと再生終了時刻OUT_timeとで示される時間区間である。一方、図22に示すPlay Listでは、静止画像のデフォールトの再生時間に無限が設定されているPlay Itemを含み、デフォールト再生時間が無限であることは、Play Itemに付加されたis_Play Item_Stillフラグにより示される。
ユーザは、有限に設定されたデフォールト再生時間を終わるのを待たずに、又はデフォールト再生時間が無限に設定されている場合はその途中で次の静止画像へ再生を進めることを再生装置に命令することができる。例えば、再生装置がPlay Item1を再生している途中に、ユーザが次の静止画像へ再生を進めることを再生装置に命令すると、再生装置はPlay Item2の再生を開始する。このときの再生開始時刻がIN_Time=t2となり、再生装置は、EP_mapのt2に対応するソースパケット番号spn2で示されるソースパケットから読出し再生する。
また、Play Itemの静止画像のデフォールトの再生時間を示すために、Play Itemの付属情報(再生制御情報)として、OUT_timeの画像の再生をスチルさせることを示す情報、及びスチルの持続時間を示す情報を使用することもできる。
例えば、OUT_timeの画像の再生をスチルさせることを示す情報として、上述のis_Play Item_Stillフラグを使用し、is_Play Item_Stillフラグに加えて、スチルの持続時間を示す情報Still_durationを追加する。具体的には、is_Play Item_Stillフラグが1であるとき、OUT_timeの画像の再生をスチルさせることを示し、そのスチルの持続時間をStill_durationが示すものとすることができる。また、スチルの持続時間Still_durationが所定の値に設定されている場合に、スチルの持続時間が無限であることを示すことにすればよい。例えば、スチル持続時間Still_durationを8ビットの値としたとき、0xFFの場合に、スチルの持続時間が無限であることを示し、それ以外の値であるとき、Still_durationの値は、有限のスチルの持続時間を示すものとする。このスチル持続時間Still_durationの値の単位としては例えば秒(s)を設定することができる。
また、任意のPlay Itemへのランダムアクセスを考慮するに、それぞれのPlay Itemが参照するトランスポートストリーム部分が、トランスポートストリームファイルの中でソースパケットのレベルで多重化されていないほうが便利である。なぜなら、そのPlay Itemの再生に必要なデータの読み出し量を最小にできるからである。そのためには、図23に示すように、各Play Itemが参照するトランスポートストリーム部分毎に、トランスポートストリームの基本となる同期信号(システムタイムクロック(SystemTimeClock))STCを独立させておくことが好ましい。これにより、各Play Itemが参照するトランスポートストリーム部分をトランスポートストリームファイルの中で独立させた状態で、トランスポートストリームを多重化することができる。
図23に示すClip Information fileは、上記特許文献2と同様のSequenceInfoを有する。SequenceInfoは、Clip Information fileの付属情報であり、トランスポートストリームファイルの中で連続なシステムタイムクロックSTCが開始するところのソースパケット番号(SPN_STC_start)とそのシステムタイムクロックSTCのインデックス番号(stc_id)との対応関係を示すテーブルである。1つの連続なシステムタイムクロックSTCを有するソースパケット列をSTC-sequenceと呼ぶ。
この場合は、図23に示すように、Play Itemは、再生開始時刻IN_time及び再生終了時刻OUT_timeに加えて、これらタイムスタンプが参照するところのSTCへの参照値(ref_to_stc_id)を有する。再生装置(プレーヤ)は、EP_mapとSequenceInfoとを使用して、Play Itemが参照している静止画像データを読み出し、再生する。
(3−2)スライドショー:静止画像+オーディオ
次に、このように、各再生区間がPlatListにより示されるスライドショーと共にオーディオを再生する場合について説明する。
(3−2−1)静止画像とオーディオが同期して再生する場合
先ず、図21のような静止画像のPlay Listに対してオーディオを同期させて再生する場合について説明する。上述した図5に示す第1の実施の形態においては、スライドショーにおける各静止画像の再生開始時刻及び再生時間が決められており、この静止画像の再生に同期して再生させるオーディオの再生パスを示すオーディオ再生指定情報にSub Play Itemを使用している。このように、オーディオの再生パスとしてSub Play Itemを使用することもできるが、静止画像をトランスポートストリームに多重化する場合は、静止画像に同期して再生するオーディオもまた、トランスポートストリームに多重化する方が読み出すストリームが1本になるので、再生処理が容易である。
図24は、静止画像に同期して再生するオーディオもまた、トランスポートストリームに多重化し、静止画像の再生に同期させてオーディオを再生するスライドショーのPlay Listを示す図である。図21に示す例においては、1以上の静止画像がトランスポートストリームに多重化されていたが、本実施の形態においては、スライドショーに同期して再生されるオーディオストリームが、静止画像と共にトランスポートストリームに多重化されている。再生装置(プレーヤ)は、Clip InformationのEP_mapを用いて、Play Itemが参照している静止画像データ及びオーディオを読み出し、プレゼンテーションタイムスランプPTSに基づいて、静止画像にオーディオを同期させて再生出力する。
ここで、図21、図22、図23又は図24のEP_mapが、トランスポートストリームファイル(静止画ファイル)の中で指し示すソースパケットについて、2通りの方法を説明する。
図25に示すEP_mapにおいては、静止画像の再生開始時刻のPTS(=t2)に対応する静止画像のデータを含む最初のビデオパケット(「V」)がソースパケット番号spn2により、指し示される。この場合、静止画像にオーバーレイされる(同期して再生される)グラフィクス(「G」)や字幕(「S」)等の副画像情報は、EP_mapによって指し示されるビデオパケットよりも位置的に後ろに多重化される。
また、図26に示すように、TSファイルでは、静止画像の再生開始時刻のPTS(=t2)に対応する静止画像のデータを含む最初のビデオパケット(「V」)の前に、MPEG2トランスポートストリームのシステム情報であるPAT(Program Association Table:番組表)とPMT(Program Map Table:番組対応表)とが多重化されており、例えばそのPATを含むパケットを、EP_mapのソースパケット番号spn2によって指し示してもよい。
(3−2−2)静止画像の再生がオーディオの再生と非同期である場合
次に、このような静止画像のPlay Listに対してオーディオを非同期に再生する場合について説明する。図27は、オーディオを非同期に再生するBrowsable slide showのPlay Listを示す図である。Play Listは、静止画像の再生パスを示す複数のPlay Itemと、オーディオの再生パスを示すSub Play Itemとからなる。図18に示す第2の実施の形態と同様に、Sub Play Itemの再生開始時刻IN_time及び再生終了時刻OUT_timeは、オーディオストリームの中の夫々再生開始及び終了のタイムスタンプにより示される。
再生装置は、Clip Informationを参照して、Sub Play ItemのIN_time及びOUT_timeに対応するところのオーディオストリームの記録媒体上でのデータアドレス情報を取得する。そして、再生装置は、このアドレス情報を用いてオーディオを読み出し再生する。このようなオーディオの再生の仕組みは、上述の図8に示す第1の実施の形態と同様である。Play Listの作成者は、図18に示す第2の実施の形態と同様にして、Play Itemに対して再生制御情報を付加することができる。即ち、再生制御情報として、オーディオストリームの再生開始時刻IN_timeと再生終了時刻Out_timeとで示される再生区間を繰り返し再生するか、又は1回だけ再生するかを示すフラグ(is_repeat_Sub Play Itemフラグ)とSub Play Itemの再生がPlay Itemの再生と非同期であることを示す情報(Sub Play Item_type)とを付加する。なお、上述したように、この再生制御情報をプレイバックコントロール(いわゆるPBC)のコマンド形式でSub Play Itemに付随させてもよい。
この場合、再生装置は、以下の3通りの方法でSub Play Itemの再生を行うことができる。即ち、第1の方法は、Play Itemが参照する静止画像ファイルと、Sub Play Itemが参照するオーディオストリームファイルとの2つのファイルのデータを記録媒体から読み出すときに、それぞれのファイルを時分割に交互に読み出す方法である。この場合、再生装置は、2つのファイルのデータを記録媒体から交互に読み出しながら、静止画像とオーディオとを再生する。
第2の方法は、はじめに、Sub Play Itemが参照するオーディオストリームファイルの全てのデータを読み出し、それを再生装置の中のバッファメモリーに蓄える。次に、Play Itemが参照する静止画像データを記録媒体から読み出す。再生装置は、静止画像データを記録媒体から読み出し、オーディオデータをバッファメモリーから読み出しながら、静止画像とオーディオとを再生する。
第3の方法は、はじめに、Play Itemが参照する静止画像ファイルの全てのデータを読み出し、それを再生装置の中のバッファメモリーに蓄える。次に、Sub Play Itemが参照するオーディオストリームを記録媒体から読み出す。再生装置は、オーディオストリームを記録媒体から読み出し、静止画像をバッファメモリーから読み出しながら、静止画とオーディオを再生する。
ここで、上記第2の方法は、Sub Play Itemが参照するオーディオストリームファイルのバイトサイズが小さい場合に有効であり、また、上記第3の方法は、Sub Play Itemが参照する静止画像ファイルのバイトサイズが小さい場合に有効である。
例えば、実用的な例として、数メガバイト(Mbyte)程度の大きさならば、再生に先立って、全てファイルデータをバッファメモリーに読み出すことができる。ブラウザブルスライドショーのアプリケーションとして、オーディオ再生はBGM(Back Ground Music)であり、Sub Play Itemの再生を繰り返し行う場合、例えば、ビットレート256kbpsのオーディオストリームの約65秒間のデータサイズは、約2メガバイト(Mbyte)であるため、上記第2の方法は有効である。
次に、上記の第1の方法で読み出す場合のプレーヤモデルについて説明する。図28は、上記第1の方法で読み出し再生する再生装置を示すブロック図である。この方法においては、Play Itemが参照するメイントランスポートストリーム(静止画像ファイル)(以下、メインTSという。)と、Sub Play Itemが参照するオーディオトランスポートストリーム(以下、オーディオTSという。)との2つのファイルのデータをドライブ(記録媒体)から読み出すときに、それぞれのファイルを時分割に交互に読み出す。なお、本実施の形態におけるトランスポートストリーム(DVR MPEG2-TS)の構成については後述する。
再生装置は、2つのファイル(メインTS及びオーディオTS)データを記録媒体31から交互に読み出しながら、静止画像とオーディオとを再生する。読出部31にて読み出された各ファイルデータは、復調・ECC復号部32により、復調され、復調された多重化ストリームに誤り訂正が施される。そして、メインTSファイルのソースパケットデータは、メインTSをバッファリングするメインTS用リードバッファ(Read Buffer)33にバッファリングされ、また、オーディオTSファイルのソースパケットデータは、オーディオTSをバッファリングするオーディオTS用リードバッファ34にバッファリングされる。
メインTS用リードバッファ33から読み出されたストリームデータは、後述するメイン用プレーヤ(BDAV MPEG2 TS Player Model_1)35に供給される。メイン用プレーヤ35は、メインTS用リードバッファ33から伝送レートRMAXで読み出したストリームデータを所定のタイミング(伝送レートRTS_m)で、後段のメイン用PID(パケットID)フィルタ37へ出力する。また、オーディオTS用リードバッファ34から読み出されたストリームデータは、後述するオーディオ用プレーヤ(BDAV MPEG2 TS Player Model_2)36に供給される。オーディオ用プレーヤ36は、オーディオTS用リードバッファ34から伝送レートRAで読み出したストリームデータを所定のタイミング(伝送レートRTS_a)で、後段のオーディオ用PIDフィルタ39へ出力する。
メイン用PIDフィルタ37は、入力されたメインTSをPID(パケットID)に応じて、後段の各エレメンタリーストリームのデコーダへ振り分けて出力する。即ち、静止画像(ビデオ)、副画像情報(グラフィックス及びサブタイトル(字幕)等)、並びにメインTSのPSI(Program Specific Information:プログラム仕様情報)及びSI(Service Information)等のシステム情報が、夫々トランスポートバッファTB1、TB2及びTBsys1に振り分けられる。なお、SIは、TSの付加情報を記述するテーブルであって、MPEG2規格外のものを示す。SIもまた、トランスポートパケットにパケット化さる。SIには、SIT(Selection Information Table)等がある。静止画像のトランスポートパケットは、トランスポートバッファTB1から一定レートRx1で多重バッファMBに伝送され、更に一定レートRbx1でエレメンタリーストリームEBに伝送され、デコーダD1にてデコードされ出力される。また、副画像情報のトランスポートパケットは、トランスポートストリームバッファTB2から、一定レートRx2でバッファB2に伝送され、デコーダD2にてデコードされ出力される。また、システム情報のトランスポートパケットは、トランスポートバッファTBsys1から一定レートRxsysでバッファBsys1に伝送され、デコーダDsys1にてデコードされ出力される。
同様に、オーディオ用PIDフィルタ38は、入力されたオーディオトランスポートストリームをPID(パケットID)に応じて、後段の各エレメンタリーストリームのデコーダへ振り分けて出力する。即ち、オーディオのトランスポートパケットは、トランスポートバッファTB4から一定レートRx4でメインバッファB4に伝送され、デコーダD4にてデコードされ出力される。また、オーディオTSのシステム情報のトランスポートパケットは、トランスポートバッファTBsys2から一定レートRxsysでバッファBsys2に伝送され、更に一定レートRsysでデコーダDsys2に伝送されデコードされて出力される。
また、オーディオ用PIDフィルタ38とトランスポートストリームバッファTB4、TBsysとの間には、オーディオスイッチ(Audio SW)39が設けられている。このオーディオスイッチ39は、例えば図24等に示すようなタイムベースドモード(Time Based mode)のスライドショウを再生する場合と、例えば図22又は図23等に示すブラウザブルモード(Browsable mode)のスライドショウを再生する場合とで切替え制御される。即ち、オーディオスイッチ39は、メインTS用リードバッファ33からのデータが供給されるメイン用PIDフィルタ37と接続されたタイムベースモードスイッチSWTと、オーディオ用リードバッファ34からのデータが供給されるオーディオ用PIDフィルタ38と接続されたブラウザブルモードスイッチSWBとを有し、これを切替えて、オーディオストリームをトランスポートバッファTB4に供給するようになされている。例えば、ブラウザブルスライドショーの場合、オーディオスイッチ39は、ブラウザブルモードスイッチSWBの側にあり、従って、その場合、オーディオストリームは、オーディオTS用リードバッファ34からオーディオ用PIDフィルタ38を介してオーディオデコーダD4へ供給される。また、例えば図24に示すタイムベースドスライドショーの場合であって、オーディオストリームがメインTSに多重化されている場合、オーディオスイッチ39は、タイムベースモードスイッチSWTの側にあり、メインTSに多重化されたオーディオストリームは、メインTS用リードバッファ33からメイン用PIDフィルタ37を介してトランスポートバッファTB4又はTBsys2へ供給される。
次に、エレメンタリーストリームのデコーダについて説明する。TBn、MB、EB、TBsys、Bsys、Rxn、Rbxn、Rxsys、Dn、及びDsysの表記方法は、ISO/IEC13818-1 (MPEG2 Systems規格)のT-STD(System Target Decoder)に定義されているものと同じである。即ち、次の通りである。
TBn(n=1〜5):エレメンタリーストリームnのトランスポートバッファ
MB:ビデオストリームの多重バッファ
EB:ビデオストリームのエレメンタリーストリームバッファ
TBsys:復号中のプログラムのシステム情報のための入力バッファ
Bsys:復号中のプログラムのシステム情報のためのシステムターゲットデコーダ内のメインバッファ
Rxn:データがTBnから取り除かれる伝送レート
Rbxn:PESパケットペイロードがMBnから取り除かれる伝送レート(ビデオストリームについてのみ存在)
Rxsys:データがTBsysから取り除かれる伝送レート
Dn:エレメンタリーストリームnのデコーダ
Dsys:復号中のプログラムのシステム情報に関するデコーダ
次に、図28に示したプレーヤモデルに含まれるメイン用プレーヤ(BDAV MPEG2 TS Player_1)35及びオーディオ用プレーヤ(BDAV MPEG2 TS Player_2)36について説明する。図29(a)及び(b)は、夫々メイン用プレーヤ35及びオーディオ用プレーヤ36を示すブロック図である。
図29(a)に示すように、メイン用プレーヤ35では、前段のメインTS用リードバッファ33から読み出されたソースパケットデータがソースデパッケタイザ部41へビットレートRMAXで入力される。RMAXは、メインTSファイルのソースパケットストリームのビットレートである。
アライバルタイムクロックカウンタ(Arrival time clock counter)42は、パルス発振器(27MHz X-tal)43から出力される27MHzの周波数のパルスをカウントするバイナリカウンタである。そして、アライバルタイムクロックカウンタは、時刻t(i)におけるカウント値Arrival_time_clock(i)を出力する。
メインTS及びオーディオTSは、トランスポートパケットとそのアライバルタイムスタンプとを有するソースパケットを単位とするデータ列からなり、1つのソースパケットは、1つのトランスポートパケットとそれのarrival_time_stamp(ATS)を持つ。arrival_time_stampは、メインTS又はオーディオTSの中で、対応するトランスポートパケットがデコーダに到着する時刻を示すタイムスタンプである。各ストリームを構成する各ソースパケットのarrival_time_stampに基づいて作られる時間軸をアライバルタイムベースといい、そのクロックをATC(Arrival Time Clock)と呼ぶ。
そして、このようなメインTSから読み出された現在のソースパケットのarrival_time_stampが、アライバルタイムクロックカウンタ42のカウント値arrival_time_clock(i)のLSB(least Significant Bit:最下位ビット)30ビットの値と等しい時、そのソースパケットのトランスポートパケットがソースデパッケタイザ部41から出力される。RTS_mは、メインTSのビットレートである。
また、図29(b)に示すように、オーディオ用プレーヤ36では、前段のオーディオTS用リードバッファ34から読み出されたソースパケットデータがソースデパッケタイザ44へビットレートRAで入力される。ビットレートRAは、オーディオTSファイルのソースパケットストリームのビットレートである。
アライバルタイムクロックカウンタ45及びパルス発振器46は、メイン用プレーヤ35と同様の働きをする。また、ソースデパッケタイザ部44は、メイン用プレーヤ35と同様の働きをする。即ち、現在のソースパケットのarrival_time_stampが、アライバルタイムクロックカウンタ45のカウント値arrival_time_clock(i)のLSB30ビットの値と等しい時、そのソースパケットのトランスポートパケットがソースデパッケタイザ部44から出力される。RTS_Aは、オーディオTSのビットレートである。
図30は、ブラウザブルモードのスライドショーのバッファモデルの概念を示す図である。ブラウザブルモードでは、Play Itemが参照する静止画像のファイルであるメインTSファイルと、Sub Play Itemが参照するオーディオTSファイルを時分割に交互にドライブからレートRUDで読み出す時に、メインTSのソースパケットストリームのビットレートRMAXとオーディオTSのソースパケットストリームのビットレートRAとが保障される必要がある。そのために、例えば図9に示す静止画像エンコーダ14及びオーディオエンコーダ11において、夫々メインTS及びオーディオTSをエンコードして記録するときに、それぞれのビットレートの上限値を制限しなければならない。
図31(a)及び(b)は、夫々図28に示すブラウザブルモードのスライドショー時のエレメンタリーストリームバッファEB(ビデオコードバッファ)のビット占有量及びオーディオコードバッファB4のビット占有量の例を示すグラフである。図31(a)及び(b)において、縦軸は、夫々ビデオコードバッファ及びオーディオコードバッファのバッファ占有率を示し、横軸は、夫々メインTS及びオーディオTSのシステムタイムクロックSTCを示す。
図31(a)に示すように、スタートアップディレイ(start up delay)は、最初のビデオパケットが入力される時間tVから、I−ピクチャがエレメンタリーストリームバッファEBにバッファリングされるまでの時間(DTS:Decoding Time Stamp)を示す。ブラウザブルモードにおいて、ユーザが次のスライドにスキップした際に、上記最初のビデオパケットの入力が開始される。図31(a)及び(b)において、傾きkEBは、ビデオバッファEBへの入力レートを示し、傾きkB4は、オーディオバッファB4の入力レートを示す。なお、図31(a)において、傾きkEBがゼロでビデオコード占有率が一定値となっている時間は、グラフィックス及び字幕等の副画像情報等が読出されている時間を示す。
メインTSのソースパケットストリームをビットレートRMAXで読み出すことを保障できれば、後段の図28に示すビデオデコーダD1において、静止画像を所定のデコードタイミングに間に合うようにデコードすることができる。また、オーディオTSのソースパケットストリームをビットレートRAで読み出すことを保障できれば、後段の図28に示すオーディオデコーダD4において、オーディオデータを所定のデコードタイミングに間に合うようにデコードすることができる。
図32は、ブラウザブルモードのスライドショーでのメインTSとオーディオTSの同時読み出し方法のモデルを示す模式図である。
メインTSとオーディオTSのそれぞれは、ディスク上に連続に配置されているとする。このとき、メインTSとオーディオTSとを次のようにして交互に読み出す。
(1)メインTSから所定のデータ量Xを読み出す。
(2)オーディオTSの所定のデータ位置へジャンプする。
(3)オーディオTSから所定のデータ量Yを読み出す。
(4)メインTSの所定のデータ位置へジャンプする。そして、メインTSから所定のデータ量Xを読み出す。
上述のメインTSから1回のリードアクションで読み出すデータ量Xは、メインTS用リードバッファ33の必要なサイズである。また、上述のオーディオTSから1回のリードアクションで読み出すデータ量Yは、オーディオTS用リードバッファ34の必要なサイズである。下記式(1)に、メインTS用リードバッファ33及びオーディオTS用リードバッファ34に必要なサイズを計算する式を示す。
例えば、
ドライブからの読み出しレートRUD=54Mbps
ジャンプ時間Tj=0.8秒
メインTSのソースパケットストリームのビットレートRMAX=20Mbps
オーディオTSのソースパケットストリームのビットレートRA=640kbps
とすると、
メインTS用リードバッファ33に必要なサイズx=4.06MBytes
オーディオTS用リードバッファ34に必要なサイズy=0.176MBytes
となる。
(3−3)静止画像データの他の例
また、上述の図22の説明において、静止画像のデータ形式は、JPEG、PNGとしているが、上述したように、その他、MPEG2 I-picture、GIF、及びJPEG2000等、静止画像のデータ形式であればよいことはいうまでもない。例えば、MPEG2 I-ピクチャ(フレーム内符号化画像)をトランスポートストリームに多重化する場合の例を図33に示す。図33は、静止画像データとしてIピクチャを使用する場合のPlay Listと、Clip Information fileと、記録媒体に記録されるデータ構造とを示す図である。図22に示す場合と比べて、静止画像像のデータ形式がIピクチャ(フレーム内符号化画像)であるところが異なるのみであり、Play List、EP_map、トランスポートストリームの関係は同じである。この場合においても、図27に示す場合と同様にして、静止画像の再生パスを示すPlay Listに対してオーディオの再生パスを示すSub Play Itemを付加してもよい。
また、同様にして、図21の説明において、静止画像のデータ形式は、JPEG、PNGとしているが、その他、MPEG2 I-picture、GIF、及びJPEG2000等、静止画像のデータ形式であればよい。この場合においても、図24に示す場合と同様にして、トランスポートストリームファイル(静止画像ファイル)にオーディオを多重化してもよい。
図33のEP_mapが、トランスポートストリームファイル(静止画像ファイル)の中で指し示すソースパケットについて、2通りの方法を説明する。図34に示すトランスポートストリームファイルでは、各Iピクチャがシーケンスヘッダから開始しており、上記特許文献2の説明と同様に、このシーケンスヘッダの第1バイト目を含むパケットが、EP_mapによって指し示される。この場合、静止画像にオーバーレイされる(同期して再生される)グラフィクスや字幕は、EP_mapによって指し示されるビデオパケットよりも位置的に後ろに多重化される。
また、図35に示すトランスポートストリームファイルでは、シーケンスヘッダの第1バイト目を含むパケットの前にMPEG2トランスポートストリームのシステム情報であるPAT及びとPMTが多重化されており、そのPATを含むパケットがEP_mapによって指し示される。
トランスポートストリームファイル(静止画像ファイル)において、Iピクチャと、それにオーバーレイされるグラフィックスや字幕とがトランスポートストリームに多重化される場合、Iピクチャとして示すデータの構造には、次の二つの構造が挙げられる。即ち、第1の構造としては、1枚のIピクチャの直後にシーケンスエンドコードが続く構造である。第2の構造は、静止画像をビデオシーケンスとして符号化する場合であり、Play Itemの再生時間に等しい複数枚のピクチャを符号化する。即ち、Iピクチャとそれに続く複数のPピクチャ(フレーム間順方向予測符号化画像)、Bピクチャ(双方向予測符号化画像)からなる構造である。このPピクチャやBピクチャは、Iピクチャから予測されるピクチャであるが、静止画像をビデオとして符号化するので、PピクチャやBピクチャは予測データを持たず、いわゆるMPEG2のスキップドマクロブロックを用いて符号化される。上記第1の構造及び第2の構造は、共にIピクチャの前にシーケンスヘッダが設けられている。
また、本実施の形態におけるスライドショーのためのPlay Itemと上記特許文献2に説明されている動画像再生のためのPlay Itemとを1つのPlay Listの中に混在してもよい。これにより、ユーザは1つのPlay Listの再生において、動画像の再生と静止画像の再生とをシームレスに楽しむことができる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、記録を行う装置と、再生を行う装置とは別々の装置として記録したが、記録再生を行う装置としてもよい。また、上述の実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
以上詳細に説明したように本発明に係る情報処理装置の実施の形態によれば、1以上の静止画像からなる静止画像群の各静止画像を管理する画像属性情報を作成する属性情報作成手段と、上記静止画像群の少なくとも一部の再生を指定する再生パスを示す画像再生指定情報を作成する再生情報作成手段と、上記静止画像群と、これに対応する上記画像属性情報及び画像再生指定情報とを記録媒体に記録する記録手段と、上記記録媒体から静止画像を読み出し再生する再生手段と、上記画像属性情報を参照し、上記画像再生指定情報に従って上記再生手段を制御する制御手段とを備え、上記再生情報作成手段は、上記画像属性情報を使用して上記画像再生指定情報を作成するので、静止画像群とは別に、画像属性情報及び画像再生指定情報が記録媒体に記録されるため、記録媒体から静止画像を読出し再生する際には、画像属性情報及び画像再生指定情報を先に読出し静止画像群の各静止画像を所定の順序に生成することができ、静止画像の連続再生(いわゆるスライドショー)を容易に実現することができる。
1 情報処理装置、10,13,15 端子、11 オーディオエンコーダ、14 静止画像エンコーダ、16,22 コントローラ、17 記録部、21 読出部、23 静止画像デコーダ、26 オーディオデコーダ、24 フレームバッファ、25 プロセッサ