[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4368819B2 - 要約再生装置及び要約再生装置の制御方法 - Google Patents

要約再生装置及び要約再生装置の制御方法 Download PDF

Info

Publication number
JP4368819B2
JP4368819B2 JP2005099214A JP2005099214A JP4368819B2 JP 4368819 B2 JP4368819 B2 JP 4368819B2 JP 2005099214 A JP2005099214 A JP 2005099214A JP 2005099214 A JP2005099214 A JP 2005099214A JP 4368819 B2 JP4368819 B2 JP 4368819B2
Authority
JP
Japan
Prior art keywords
image
scene
still image
importance
still
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005099214A
Other languages
English (en)
Other versions
JP2006279827A (ja
Inventor
義文 藤川
藤井  由紀夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005099214A priority Critical patent/JP4368819B2/ja
Priority to US11/368,669 priority patent/US20060222337A1/en
Publication of JP2006279827A publication Critical patent/JP2006279827A/ja
Application granted granted Critical
Publication of JP4368819B2 publication Critical patent/JP4368819B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/4147PVR [Personal Video Recorder]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computer Graphics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、動画コンテンツの要約を作成する要約再生装置及び要約再生装置の制御方法に関する。
近年、ハードディスクを内蔵した長時間録画が可能なテレビ放送受信装置や、通信ネットワークを経由して配信される動画コンテンツを閲覧可能なビデオ閲覧装置が普及し始めている。このため視聴者が扱う動画コンテンツの量は急速に増加している。
しかし、視聴者がこれら大量の動画コンテンツを視聴する時間は限られている。そのため、動画コンテンツを効率良く視聴することを可能にする技術が求められている。
このような要求に対して、各動画コンテンツの要約を再生したり、動画コンテンツ内の各シーン(場面、ショット)のサムネイル画像を並べて表示したりして、短時間に動画コンテンツの概要の把握する手助けをする技術が開発されている(例えば特許文献1、特許文献2参照)。
特許3367268号公報 特開2004−312567号公報
ところで、動画コンテンツの要約を作成する際にはその動画コンテンツの中で重要性が高いと判断される部分を選出することになるが、ある特定の部分のみが集中的に選出され、作成された要約画像を見ても動画コンテンツ全体の概要を把握することができない場合がある。
また、単に一定時間毎あるいは場面毎に要約を作成して再生するようにした場合には、重要性の低い部分が延々と再生されたり、逆に重要性の高い部分の再生が途中で終了してしまったりする場合がある。
本発明は上記課題を鑑みてなされたものであり、オリジナルの動画コンテンツ内の場面の数に依存せずに動画コンテンツ全体が見渡せる要約を作成することを可能にする要約再生装置及び要約再生装置の制御方法を提供することを主たる目的とする。
上記課題を解決するための本発明の一つは、要約再生装置であって、時系列に連続する複数の静止画像をそれぞれ符号化して得られる複数の静止画像データを動画像データとして記録するデータ記録部と、各静止画像データを時系列に再生して得られる動画像における場面の変わり目を、前記各静止画像データに基づいて検出する場面切替検出部と、前記動画像の中での各静止画像の重要度を示す指標値を、前記各静止画像データに基づいて算出する重要度算出部と、前記動画像における各場面にそれぞれ含まれる静止画像の各重要度を示す指標値に基づいて、各場面を順位付ける場面順位付け部と、前記順位付けた順に所定数だけ選出した各場面に含まれる各静止画像を時系列に要約画像として再生する要約画像再生部と、前記要約画像において再生される場面の数である前記所定数の入力をユーザインタフェースから受ける要約場面数入力部と、前記要約画像の再生時間の入力をユーザインタフェースから受ける要約再生時間入力部と、を備え、前記要約画像再生部は、前記順位付けた順に前記所定数だけ選出した各場面に含まれる各静止画像を、前記要約画像の再生時間を前記所定数で割って得られる時間ずつ、時系列に要約画像として再生する。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための最良の形態の欄、及び図面により明らかにされる。
オリジナルの動画コンテンツ内の場面の数に依存せずに動画コンテンツ全体が見渡せる要約を作成することを可能にする要約再生装置及び要約再生装置の制御方法を提供することができる。
===全体構成例===
本実施の形態に係る要約再生装置200の構成例を図1に示す。
本実施の形態に係る要約再生装置200は、チューナ204、デコーダ205、表示制御装置206、中央演算装置201、主記憶装置202、外部記憶装置203、記録媒体読取装置207、入力装置208、通信ポート209を備える。また要約再生装置200は、表示制御装置206を通じて表示装置100と接続されている。
中央演算装置201は、要約再生装置200の全体の制御を司るもので、外部記憶装置203に記憶される本実施の形態に係る各種の動作を行うためのコードから構成される要約再生装置制御プログラム900を主記憶装置202に読み出して実行することにより、要約再生装置200としての各種機能を実現する。例えば中央演算装置201により要約再生装置制御プログラム900が実行され、チューナ204、デコーダ205、表示制御装置206、主記憶装置202、外部記憶装置203、記録媒体読取装置207、入力装置208、通信ポート209等のハードウェア機器と協働することにより、データ記録部、場面切替検出部、重要度算出部、場面順位付け部、要約画像再生部、要約場面数入力部、要約再生時間入力部、放送データ受信部、通信データ受信部が実現される。
チューナ204は、放送される音声や画像のデータを動画像データとして受信する装置である。例えばデジタル衛星放送やデジタル地上波放送、デジタルCATV(Community Antenna TeleVision systemまたはCAble TeleVision)放送などの各種形式の放送を受信するための装置として構成される。もちろんアナログ放送を受信する装置とすることもできる。
動画像データは、動画像を構成する時系列に連続する複数の静止画像を、それぞれ符号化して得られる複数の静止画像データを備えてなる。また各静止画像はフレームと呼ばれることもある。本実施の形態に係る動画像データの一例を図3に示す。図3に示すように、動画像データは複数の静止画像データにより構成されている。各静止画像データには、各静止画像の時系列的な順序を表すフレーム番号が付されている。図3に示す例では1から107892までのフレーム番号が各静止画像データに付されている。各静止画像データを時系列に(つまりフレーム番号順に)再生することにより動画像を復元することができる。また通常、動画像は複数の場面(シーンあるいはショット。映画等の撮影でカメラが回り始めてから止まるまで連続撮影された一連の画像。)を含んでいる。図3に示す動画像は4つの場面を含んでいる。また詳しくは後述するが、各場面の中において最も重要度の高い静止画像をその場面の代表フレームと呼ぶ。図3に示す例では、2つめの場面及び3つ目の場面において、それぞれフレーム番号23647及び35389で示されるフレームが代表フレームであることが示されている。
一方各静止画像データには、各静止画像を構成する各画素の色を示すデータが記述されている。例えば、各画素について、RGB(Red、Green、Blue)各2ビットのデータが記述されている。この場合各画素毎に64色中の1色を表示させることが可能である。また各静止画像データの中には音声データも含まれている。
図1に戻って、デコーダ205は、動画像データを伸張(デコード)し、デコードされた動画像を表示制御装置206に送信する。
表示制御装置206はデコードされた動画像を表示装置100へ出力する。
表示装置100は動画像を表示する。表示装置100は例えばディスプレイやスピーカを備えている。
主記憶装置202は、中央演算装置201によりワークエリアとして用いられたり、要約再生装置制御プログラム900を記憶したりする。例えば、RAM(Random Access Memory)によって実現することができる。
外部記憶装置203は、例えばハードディスク装置により構成することができる。外部記憶装置203には、要約再生装置制御プログラム900やフレーム重要度管理テーブル800、定義ベクトル管理テーブル810が記憶されている。その様子を図2に示す。
要約再生装置制御プログラム900は、要約再生装置200を機能させるためのプログラムである。例えば動画像を構成する各静止画像について、後述する特徴ベクトルをそれぞれ算出したり、各静止画像に基づいて動画像に含まれる各場面の変わり目を検出したりする。詳しくは後述する。
フレーム重要度管理テーブル800は、動画像の中での各静止画像の重要度を管理するためのテーブルである。フレーム重要度管理テーブル800を図4に示す。図4に示すように、本実施の形態に係るフレーム重要度管理テーブル800は、各静止画像の重要度の高い順に各静止画像をランク付けして記憶したものである。また図4に示すフレーム重要度管理テーブル800は、全部で297場面ある動画像の各静止画像をその重要度に応じてランク付けしたものであるが、上位297にランク付けされる各静止画像は、各場面内において重要度が最大の各静止画像である。そしてそれらの各静止画像つまり各場面において最も重要度の大きな静止画像(代表フレーム)の重要度の大きい順に、1位から297位まで各静止画像がランク付けされる。これにより、1位から297位までは動画像に含まれる各場面の順位付けを表すことになる。つまり、ランキング1位の35389番のフレームを含む場面は、動画像全体の中で最も重要な場面であるということになる。また反対にランキング297位の0番のフレームを含む場面は、動画像全体の中で最も重要度の低い場面であるということになる。ランキング298位から107892位の各フレームは、場面の区別無く、単純に重要度に応じてランク付けした各フレームを表す。なおフレーム重要度管理テーブル800においては、フレーム番号の代わりにコンテンツ内の位置を示す別のものを記憶するようにしても良い。たとえば、フレームを構成するデータの場所(バイト数)や、表示時刻を示すPTS(Presentation Time Stamp)でもよい。
ここで各静止画像の重要度を表す指標値を算出するための計算式を図10に示す。図10に示すように本実施の形態においては、定数ベクトルと特徴ベクトルの内積により各静止画像の重要度を求める。定数ベクトルは、図5に示す定数ベクトル管理テーブル810に、動画像のジャンル別に記憶されている。特徴ベクトルは、直前(時間的に一つ前の静止画像)のフレームとの相違度、動きベクトルの大きさ、静止画像データを再生する際の音の大きさを表す各指標値を要素とするベクトルである。
そして、各静止画像について求めた特徴ベクトルと、図5に定義された定数ベクトルとの内積を演算することにより、各フレームの重要度を示す指標値を算出する。
なお、直前のフレームとの相違度は、そのフレームにおける色分布データと直前のフレームの色分布データとの相違度とすることができる。色分布データとは、一つのフレーム全体における同じ色を示す画素の出現頻度を求めたものである。例えばRGB各2ビット64色の色分布データを作成する場合、フレームの各画素のRGB値をそのRGB各上位2ビットのみで表現した6ビット64色に縮退し、64色のそれぞれについて縮退によってその色を示す画素の数をカウントする。この場合、色分布データは配列Hn(i)で表され、iは0から63の値をとる。例えばiが0のときの度数Hn(0)は,RGBカラー値の上位2ビットがRGB各々全て0である画素がフレーム中に幾つあるかを示している。そして、Hnと1つ前のフレームの色分布データHn−1との間の相異度は、カイ二乗検定等の計算式により求めることができる。
図1に戻って、記録媒体読取装置207は、ビデオテープやDVD(Digital Versatile Disk)などに記録された動画像データを読み取るための装置である。読み取った動画像データは、外部記憶装置203や主記憶装置202に記憶される。
入力装置208は、要約再生装置200へのデータ入力等のために用いられる装置でありユーザインタフェースとして機能する。入力装置208としては例えば操作スイッチやタッチパネル、リモートコントロール装置、あるいはキーボードやマウス等を用いることができる。
通信ポート209は、コンピュータや他の要約再生装置200等の他の情報処理装置と通信を行うための装置である。例えばインターネットを介して通信可能に接続される動画像配信サーバから送信される各種動画像データを、通信ポート209を通じて受信するようにすることもできる。この場合、受信した動画像データは、外部記憶装置203や主記憶装置202に記憶される。
===要約再生装置を用いた処理の流れ===
次に本実施の形態に係る要約再生装置200を用いて、ある動画像から、その動画像を要約した要約画像を作成し、再生する際の処理の流れについて説明する。
<フレームの重要度の算出>
まず本実施の形態に係る要約再生装置200は、動画像に含まれる各静止画像について、上述した計算式に従って重要度を算出し、図4に示したフレーム重要度管理テーブル800を作成する。その際の処理の流れを図6のフローチャートに示す。
まず、本実施の形態に係る要約再生装置200は定数ベクトルを選択する(S1000)。定数ベクトルの選択は、図5に示した定数ベクトル管理テーブル810に示す各ジャンルの中から、動画コンテンツのカテゴリ(スポーツ、ドラマ、ニュースなど)に応じて適切なものを選択することにより行うことができる。カテゴリは例えばEPG(Electronic Program Guide)情報などから取得することができる。もちろん定数データは、ユーザなどに入力装置208を通じて入力させる様にすることもできる。
次に要約再生装置200はビデオコンテンツデータ(動画像データ)を読み取る(S1010)。ビデオコンテンツデータの読み取りは、チューナ204を用いて、放送される動画像データを受信して行うようにすることもできるし、通信ポート209を介して通信可能に接続される情報処理装置から送信されてくる動画像データを受信することにより行うこともできる。あるいは、DVDやビデオテープなどの記録媒体に記録された動画像データを、記録媒体読取装置207を用いて読み取ることにより行うこともできる。
そして要約再生装置200は、S1010で読み取ったビデオコンテンツデータの各フレームに対する特徴ベクトルを計算する(S1020)。上述したように、特徴ベクトルの構成要素には、直前フレームとの相違度や動きベクトルの大きさ、音の大きさなどがある。
その後要約再生装置200はS1020で計算した直前フレームとの相違度を用いて、シーンチェンジ(場面の変わり目)を検出する(S1030)。シーンチェンジは、例えば、上述した色分布データHnと1つ前のフレームの色分布データHn−1との間の相異度と判定値とを比較し、この比較の結果に応じて検出することができる。例えば、相違度が判定値を超えている場合に、シーンチェンジであると判定するようにすることができる。そしてシーンチェンジとシーンチェンジとの間を、1つのシーンとして区別する。
次に要約再生装置200は、各フレームの重要度を計算する(S1040)。重要度は、図10に示すように、特徴ベクトルと定数ベクトルの内積を計算することにより求めることができる。ただし、特許文献2で示しているような方法を用いても良い。
続いて要約再生装置200は、S1030によって切り分けられた各シーンごとに、シーンの重要度を計算する。シーンの重要度は、シーン内のフレームの重要度の最大値を用いることができる。そして各シーンの代表フレームとして、シーン内において重要度が最大となるフレームを選択する。ただし、シーンの重要度は、シーン内の各フレームの重要度の平均値とすることもできる。また、シーンの長さ(時間)やシーン内の重要度の最大値などを組み合わせて計算してもよい。また、シーンの代表フレームとして、シーンの先頭フレームや、時間的に中央のフレームを選択しても良い。
次に要約再生装置200は、各シーンの代表フレームを、そのシーンの重要度の大きい(重要な)順にランキングし、ランキング上位とする。そしてこの結果は、図4に示すフレーム重要度管理テーブル800に格納する(S1060)。
そして要約再生装置200は、シーンの代表フレームを除いた残りのフレームを、フレームの重要度の順にランキングし、ランキング下位とする。この結果は、図4に示すフレーム重要度管理テーブル800に格納する(S1070)。
<要約の作成及び再生>
次に本実施の形態に係る要約再生装置200は、フレーム重要度管理テーブル800に基づいて、動画像を要約した要約画像を作成し、再生する。その際の処理の流れを図7のフローチャートに示す。
まず要約再生装置200は、フレーム重要度管理テーブル800から各フレームのランキング情報を読み込む(S2000)。次に要約再生装置200はランキング閾値(所定数)を初期化する(S2010)。ランキング閾値とは、要約画像において再生される場面の数を示す数値である。ランキング閾値は、例えば5を初期値として記憶しておくことができる。もちろん視聴者等により入力装置208を用いて入力させるようにすることもできる。そして次に要約再生装置200は、視聴者の要求する要約再生時間(要約画像の再生時間)の入力を受け付ける(S2020)。例えばここでは2分とする。
そうすると、要約再生装置200は、フレーム重要度管理テーブル800においてランキングされた各フレームのうち、ランキング閾値以上のフレームをまず選択する(S2030)。そして要約再生装置200は、上記選択された各フレームを基に、再生範囲を決める(S2040)。たとえば、選択されたフレームを先頭に一定の時間を再生範囲に選択する。この時間は、例えば要約画像の再生時間を上記ランキング閾値の数で割って得られる時間とすることができる。もちろんそのほかの方法によってもよい。
次に要約再生装置200は、選択された各フレームを先頭とする各再生範囲の合計時間を算出する(S2050)。そして要約再生装置200は、上記算出された合計時間と視聴者の要求する要約再生時間とを比較する(S2060)。算出された合計時間と視聴者の要求する要約再生時間との差分が所定値以下の場合には、”Yes”に進む。算出された合計時間と視聴者の要求する要約再生時間との差分が所定値以下ではない場合には、”No”に進む。ここで、例えばある一つの場面全体の再生時間が比較的短い場合には、その場面の再生時間が、要約画像の再生時間を上記ランキング閾値の数で割って得られる時間に満たない場合がある。このような場面を含んでいる場合には、算出された合計時間と視聴者の要求する要約再生時間との差分が所定値以下とはならないことがある。この場合は、S2070に進み、ランキング閾値を変更する。例えばランキング閾値をより大きな値に変更する。そして再度S2030以降の処理を繰り返す。もちろんS2070におけるランキング閾値の変更は、例えばS2070における比較の結果に応じて行うようにすることができる。例えばS2050で算出された時間の方が視聴者の要求する要約再生時間よりも大きい場合は、閾値を上げるようにすることができる。またS2050で算出された時間の方が視聴者の要求する要約再生時間よりも小さい場合は、閾値を下げるようにすることもできる。ここで変更量は、既知の2分探索法などのアルゴリズムを用いることができる。
要約再生装置200は、S2080で”Yes”に進んだら、上記選択された各フレームを先頭とする各再生範囲を、時系列に再生する(S2080)。
本実施の形態に係る要約再生装置200が以上の処理を行うことによって、視聴者は指定した時間長(ここでは2分)の要約コンテンツを閲覧することができる。また作成された要約画像には、重要度の高い場面から所定時間ずつ抽出された映像が含まれている。つまり視聴者は、オリジナルの動画像内の場面の数に依存せずに動画コンテンツ全体が見渡せる要約を閲覧することができるのである。
また以上のことから分かるように、本実施の形態に係る要約再生装置200によれば、例えば2つの場面からなる動画像について、要約画像において再生される場面の数として1が指定された場合には、2つの場面のいずれか一方の場面から所定時間分抽出された映像が要約画像として再生されることになる。
また本実施の形態に係る要約再生装置200は、図8のフローチャートに示すように、全ての場面についてそれぞれ所定時間ずつ再生するように要約画像を作成することもできる。例えば視聴者が個人的に撮影したビデオ画像を編集する場合などには、全ての場面についてどのような映像が記録されているのかを知りたいことがある。このような場合に特に有効である。
まず要約再生装置200は、フレーム重要度管理テーブル800から各フレームのランキング情報を読み込む(S3000)。そしてシーンの数だけ、フレーム重要度管理テーブル800の上位からフレームを選択する(S3010)。つまり各シーンの代表フレームを全て選択する。次に要約再生装置200は、上記選択された各フレームを基に、それぞれ一定時間を再生範囲として決める(S3020)。たとえば、選択されたフレームを先頭に2秒の範囲を再生範囲として選択する。そして要約再生装置200は、上記選択された各フレームを先頭とする各再生範囲を、時系列に再生する(S3030)。
このように、本実施の形態に係る要約再生装置200は、全ての場面についてそれぞれ所定時間ずつ再生するように要約画像を作成することもできる。
また、さらに本実施の形態に係る要約再生装置200は、全ての場面についてそれぞれサムネイルを作成し再生するようにすることもできる。この場合も、視聴者が個人的に撮影したビデオ画像を編集する場合などに、各場面にどのような画像が含まれているかを知りたいときなどに特に有効である。
まず要約再生装置200は、フレーム重要度管理テーブル800から各フレームのランキング情報を読み込む(S4000)。そしてシーンの数だけ、フレーム重要度管理テーブル800の上位からフレームを選択する(S4010)。つまり各シーンの代表フレームを全て選択する。次に要約再生装置200は、上記選択された各フレームを基に、それぞれサムネイルを作成する(S4020)。そして要約再生装置200は、上記作成した各サムネイルを、フレーム番号順位に表示する(S3030)。
このように、本実施の形態に係る要約再生装置200は、全ての場面についてそれぞれサムネイルを再生するようにすることもできる。
以上、本実施の形態に係る要約再生装置200について説明したが、本実施の形態に係る要約再生装置200によれば、視聴者の指定する時間内でコンテンツ全体を見渡すことのできる要約画像を得ることが可能となる。
また、本実施の形態に係る要約再生装置200で生成したランキング情報をネットワークや放送を介して視聴者に配信するようにすれば、動画再生装置内でランキング情報を生成せず、ネットワークや放送を用いてランキング情報を受信できる動画再生装置を所有する視聴者は、コンテンツ全体を見渡すことのできる要約画像を得ることが可能となる。
以上発明を実施するための最良の形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得ると共に、本発明にはその等価物も含まれる。例えば、本実施の形態に係る要約再生装置200は、HDDレコーダやDVDレコーダ、セットトップボックス、テレビ放送受信機、ラジオ放送受信機、携帯電話機、携帯型記憶装置、パーソナルコンピュータ等によって構成されることもできる。
本実施の形態に係る要約再生装置の全体構成を示すブロック図である。 本実施の形態に係る要約再生装置の記憶装置を示す図である。 本実施の形態に係る動画像データを示す図である。 本実施の形態に係るフレーム重要度管理テーブルを示す図である。 本実施の形態に係る定数ベクトル定義テーブルを示す図である。 本実施の形態に係るフレームの重要度の算出の処理の流れを示すフローチャートである。 本実施の形態に係る要約画像作成、再生の処理の流れを示すフローチャートである。 本実施の形態に係る要約画像作成、再生の処理の流れを示すフローチャートである。 本実施の形態に係る要約画像作成、再生の処理の流れを示すフローチャートである。 本実施の形態に係る重要度の算出式を示す図である。
符号の説明
100 表示装置
200 要約再生装置
201 中央演算装置
202 主記憶装置
203 外部記憶装置
204 チューナ
205 デコーダ
206 表示制御装置
207 記録媒体読み取り装置
208 入力装置
209 通信ポート
600 フレーム重要度管理テーブル
610 定数ベクトル管理テーブル
900 要約再生装置制御プログラム

Claims (4)

  1. 時系列に連続する複数の静止画像をそれぞれ符号化して得られる複数の静止画像データを動画像データとして記録するデータ記録部と、
    各静止画像データを時系列に再生して得られる動画像における場面の変わり目を、前記各静止画像データに基づいて検出する場面切替検出部と、
    前記動画像の中での各静止画像の重要度を示す指標値を、前記各静止画像データに基づいて算出する重要度算出部と、
    前記動画像における各場面にそれぞれ含まれる静止画像の各重要度を示す指標値に基づいて、各場面を順位付ける場面順位付け部と、
    前記順位付けた順に所定数だけ選出した各場面に含まれる各静止画像を時系列に要約画像として再生する要約画像再生部と、
    前記要約画像において再生される場面の数である前記所定数の入力をユーザインタフェースから受ける要約場面数入力部と、
    前記要約画像の再生時間の入力をユーザインタフェースから受ける要約再生時間入力部と、
    を備え、
    前記要約画像再生部は、
    前記順位付けた順に前記所定数だけ選出した各場面に含まれる各静止画像を、前記要約画像の再生時間を前記所定数で割って得られる時間ずつ、時系列に要約画像として再生する
    ことを特徴とする要約再生装置。
  2. 前記要約画像再生部は、
    前記順位付けた順に前記所定数だけ選出した各場面に含まれる各静止画像を、前記選出した各場面内において前記重要度を示す指標値が最大である静止画像から、前記要約画像の再生時間を前記所定数で割って得られる時間ずつ、時系列に要約画像として再生する
    ことを特徴とする請求項に記載の要約再生装置。
  3. 時系列に連続する複数の静止画像をそれぞれ符号化して得られる複数の静止画像データを動画像データとして記録する要約再生装置の制御方法であって、
    前記要約再生装置が、前記各静止画像データを時系列に再生して得られる動画像における場面の変わり目を、前記各静止画像データに基づいて検出し、
    前記要約再生装置が、前記動画像の中での各静止画像の重要度を示す指標値を、前記各静止画像データに基づいて算出し、
    前記要約再生装置が、前記動画像における各場面にそれぞれ含まれる静止画像の各重要度を示す指標値に基づいて、各場面を順位付け、
    前記要約再生装置が、前記順位付けた順に所定数だけ選出した各場面に含まれる各静止画像を時系列に要約画像として再生し、
    前記要約再生装置が、前記要約画像において再生される場面の数である前記所定数の入力をユーザインタフェースから受け、
    前記要約再生装置が、前記要約画像の再生時間の入力をユーザインタフェースから受け、
    前記要約再生装置が、前記順位付けた順に前記所定数だけ選出した各場面に含まれる各静止画像を、前記要約画像の再生時間を前記所定数で割って得られる時間ずつ、時系列に要約画像として再生する
    ことを特徴とする要約再生装置の制御方法。
  4. 前記要約再生装置は、
    前記順位付けた順に前記所定数だけ選出した各場面に含まれる各静止画像を、前記選出した各場面内において前記重要度を示す指標値が最大である静止画像から、前記要約画像の再生時間を前記所定数で割って得られる時間ずつ、時系列に要約画像として再生する
    ことを特徴とする請求項に記載の要約再生装置の制御方法。
JP2005099214A 2005-03-30 2005-03-30 要約再生装置及び要約再生装置の制御方法 Expired - Fee Related JP4368819B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005099214A JP4368819B2 (ja) 2005-03-30 2005-03-30 要約再生装置及び要約再生装置の制御方法
US11/368,669 US20060222337A1 (en) 2005-03-30 2006-03-07 Digest reproducing apparatus and digest reproducing apparatus control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005099214A JP4368819B2 (ja) 2005-03-30 2005-03-30 要約再生装置及び要約再生装置の制御方法

Publications (2)

Publication Number Publication Date
JP2006279827A JP2006279827A (ja) 2006-10-12
JP4368819B2 true JP4368819B2 (ja) 2009-11-18

Family

ID=37070605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005099214A Expired - Fee Related JP4368819B2 (ja) 2005-03-30 2005-03-30 要約再生装置及び要約再生装置の制御方法

Country Status (2)

Country Link
US (1) US20060222337A1 (ja)
JP (1) JP4368819B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4556752B2 (ja) * 2005-04-18 2010-10-06 株式会社日立製作所 コマーシャル視聴制御機能を有する録画再生装置
US8943410B2 (en) 2006-12-22 2015-01-27 Apple Inc. Modified media presentation during scrubbing
US8020100B2 (en) * 2006-12-22 2011-09-13 Apple Inc. Fast creation of video segments
GB2447053A (en) * 2007-02-27 2008-09-03 Sony Uk Ltd System for generating a highlight summary of a performance
US20090080852A1 (en) * 2007-09-23 2009-03-26 Peters Mark E Audiovisual Censoring
KR20100000336A (ko) * 2008-06-24 2010-01-06 삼성전자주식회사 컨텐츠 감상 경험을 기록/재생하는 멀티미디어 콘텐츠 처리방법 및 장치
JP4721079B2 (ja) * 2009-02-06 2011-07-13 ソニー株式会社 コンテンツ処理装置および方法
US8605221B2 (en) * 2010-05-25 2013-12-10 Intellectual Ventures Fund 83 Llc Determining key video snippets using selection criteria to form a video summary
US8619150B2 (en) * 2010-05-25 2013-12-31 Intellectual Ventures Fund 83 Llc Ranking key video frames using camera fixation
US8599316B2 (en) * 2010-05-25 2013-12-03 Intellectual Ventures Fund 83 Llc Method for determining key video frames
KR101804383B1 (ko) * 2014-01-14 2017-12-04 한화테크윈 주식회사 요약 영상 브라우징 시스템 및 방법
US9947294B2 (en) * 2014-03-28 2018-04-17 Lenovo (Singapore) Pte. Ltd. Power advantaged image data control
FR3030075B1 (fr) * 2014-12-16 2017-01-27 Arkamys Procede d'ordonnancement d'un traitement audio d'un vehicule automobile et systeme d'exploitation associe
US10090020B1 (en) * 2015-06-30 2018-10-02 Amazon Technologies, Inc. Content summarization
US11036435B2 (en) 2019-08-30 2021-06-15 Western Digital Technologies, Inc. Search time optimization in solid-state devices
CN114466101B (zh) * 2021-07-02 2022-11-29 荣耀终端有限公司 显示方法及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100215586B1 (ko) * 1992-11-09 1999-08-16 모리시타 요이찌 다이제스트 화상 자동생성 장치 및 다이제스트 화상 자동생성 방법
JP3472659B2 (ja) * 1995-02-20 2003-12-02 株式会社日立製作所 映像供給方法および映像供給システム

Also Published As

Publication number Publication date
JP2006279827A (ja) 2006-10-12
US20060222337A1 (en) 2006-10-05

Similar Documents

Publication Publication Date Title
US20060222337A1 (en) Digest reproducing apparatus and digest reproducing apparatus control method
JP4662779B2 (ja) 類似のビデオコンテンツへの乗り換えのための装置
US8285114B2 (en) Electronic apparatus and display method
CN101197984B (zh) 图像处理设备和图像处理方法
EP1986193B1 (en) Method of displaying moving image and image playback apparatus to display the same
US20060110128A1 (en) Image-keyed index for video program stored in personal video recorder
US8009232B2 (en) Display control device, and associated method of identifying content
KR20110070790A (ko) 콘텐츠 제공 서버, 콘텐츠 재생 장치, 콘텐츠 제공 방법, 콘텐츠 재생 방법, 프로그램 및 콘텐츠 제공 시스템
JPH0993588A (ja) 動画像処理方法
JP5079817B2 (ja) サマリ及びレポートを既に含んでいるオーディオビジュアル文書について新たなサマリを作成する方法及び該方法を使用する受信機
CN101622866A (zh) 具有搜索分屏功能的显示设备和用于控制该设备的方法
JP2007060060A (ja) 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
KR20000064909A (ko) 복수개의 키이-프레임 병렬 표시에 의한 비디오 물질을 통한 항법 및 항법 장치
JP4945497B2 (ja) コンテンツ情報表示方法
KR100370249B1 (ko) 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템
JP2005328329A (ja) 映像再生装置と映像録画再生装置と映像再生方法
JP4835439B2 (ja) 情報信号処理方法、情報信号処理装置及びコンピュータプログラム記録媒体
JP4341503B2 (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体
KR20050056556A (ko) 썸네일과 피아이피 조합 녹화 영상 검색 기능을 가지는dvd-rw장치 및 방법
CN115943625B (zh) 广播接收装置、服务器设备、信息记录播放装置及显示系统
US20220310129A1 (en) Method for indicating interest points in a media player
JP4760893B2 (ja) 動画記録再生装置
KR20070033119A (ko) Pvr 기능을 구비한 디지털 방송 수신장치 및 이를이용한 녹화 목록 검색방법
KR20110011020A (ko) 디지털 tv 및 그의 멀티미디어 파일 재생 방법
JP2006054620A (ja) 情報信号処理方法、情報信号処理装置及びプログラム記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090826

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130904

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees