JP5005154B2 - 記憶媒体上に記憶された情報信号を再生する装置 - Google Patents
記憶媒体上に記憶された情報信号を再生する装置 Download PDFInfo
- Publication number
- JP5005154B2 JP5005154B2 JP2002525659A JP2002525659A JP5005154B2 JP 5005154 B2 JP5005154 B2 JP 5005154B2 JP 2002525659 A JP2002525659 A JP 2002525659A JP 2002525659 A JP2002525659 A JP 2002525659A JP 5005154 B2 JP5005154 B2 JP 5005154B2
- Authority
- JP
- Japan
- Prior art keywords
- information signal
- color
- jump
- image
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000004044 response Effects 0.000 abstract description 7
- 230000000007 visual effect Effects 0.000 description 77
- 239000003086 colorant Substances 0.000 description 21
- 239000013598 vector Substances 0.000 description 20
- 230000006870 function Effects 0.000 description 17
- 230000001427 coherent effect Effects 0.000 description 16
- 238000000605 extraction Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000009191 jumping Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000004456 color vision Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3081—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is a video-frame or a video-field (P.I.P)
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
- G06F16/745—Browsing; Visualisation therefor the internal structure of a single video sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
- G06F16/785—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using colour or luminescence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/60—Solid state media
- G11B2220/61—Solid state media wherein solid state memory is used for storing A/V content
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
【発明の属する技術分野】
本発明は、第1記憶媒体上に記憶された情報信号を再生する装置であって、
− 上記第1記憶媒体から上記情報信号を読み取る読取手段と、
− 上記情報信号を表示ユニットに供給する出力手段と、
− コマンドを入力して、ユーザが上記情報信号にアクセスするのを可能にするユーザ制御入力手段と、
を有するような装置に関する。
【0002】
更に、本発明は記憶媒体上に記憶された情報信号を再生する方法、コンピュータプログラム、有形媒体及び上記コンピュータプログラムを伝送する信号にも関する。
【0003】
【従来の技術】
従来、ビデオは基本的なVHSテープ機能、即ち、再生、順方向早送り及び巻き戻しを用いて線形な形で視聴され、アクセスされている。
【0004】
ハードディスクに基づくビデオレコーダが市場に急速に出現しつつある。これらビデオレコーダは、記憶される情報の量を劇的に増加させ、該情報はランダムにアクセスすることができる。順方向早送り及び巻き戻しのような伝統的なVCR機能は、このような機能を利用せず、ユーザがビデオ内容(コンテンツ)を高速で閲覧する(ブラウズする)助けもしない。
【0005】
現在の傾向は、オーディオビデオ情報と一緒に、コンテンツの記述(来るべき国際規格MPEG−7は、マルチメディアコンテンツ用の規格記述子群を作成しようとしている)を設けるというものである。このような記述は、家庭のユーザが、何時間もの記録された番組内で高速で且つ効果的にサーチするのを可能にするように、利用されなければならない。重要な問題は、ユーザとシステムとの対話である。しかしながら、使い易く且つ直感的なツールは、キーワードに基づくサーチを実行することに限られる。
【0006】
現在までのところ、順方向早送り及び巻き戻しは、テープ又はディスク媒体上に記録されたビデオ題材にアクセスし及び斯かる題材をブラウズするための最も普通な使い易いツールである。しかしながら、これらは、家庭用装置に記憶することが可能なマルチメディアデータの劇的な増加により不十分となってきている。
【0007】
【発明が解決しようとする課題】
本発明の目的は、何時間もの記録された番組のようなビデオ題材又は写真若しくはスライドショーのような画像を伴うデータベース内で高速且つ効果的にサーチを行うのに適した他の使い易く且つ直感的なツールを提供することにある。
【0008】
【課題を解決するための手段】
本発明による装置は、前記ユーザ制御入力手段が或る時点において第1コマンドを入力するように構成され、該装置が前記読取手段を前記記憶媒体からの前記情報信号の読み取りを該情報信号における第2位置において開始させるように制御する制御手段を更に有し、前記第2位置における前記情報信号が、前記第1コマンドを入力する前記時点において読み取られる第1位置における前記情報信号、又は該時点よりも前に読み取られた前記情報信号の一部との類似性を示すことを特徴とする。
【0009】
本発明は下記のような認識に基づくものである。即ち、ニュース番組、トークショー及び天気予報等の多くの番組は、非常に頻繁に放送される。これらの種類の番組において、画像の背景は殆ど同一である。更に、番組においては同一の人物が行動する。ニュース番組においては、ニュース項目の変更の間に、通常、ニュースキャスタが示される。ニュースキャスタがいる画像をサーチすることにより、次のニュース項目にジャンプすることが可能となる。この機能は、ユーザがビデオストリームにおける或る画像から次の(前の)“類似の”ものへとジャンプするのを可能にする。本発明の好ましい実施例においては、類似性の規準(2つの画像の間の類似性のレベルの評価)は、当該ビデオ信号から抽出される低レベルの特徴(カラー、テクスチャ、形状及びエッジのような)、又は手動又は半自動的に発生される高レベル描写のような補助情報に基づくものとすることができる。次の(前の)類似画像へのジャンプ機能は、画像が比較される方法又は使用される類似性の概念とは独立している。内容に基づく画像検索はマルチメディア検索分野では良く知られた技術である。本発明は、その結果を使用すると共に、ユーザにビデオデータをブラウジングするための強力、直感的且つ使い易いツールを与える。本発明の目標は、ビデオ内容に基づくようなビデオデータへのアクセスポイントを可能にすることである。通常の再生の間において、又は例えばキーフレームブラウザのようなビデオ内容にアクセスする他の方法を用いることにより、ユーザは現画像を問い合わせ中の画像として暗黙的に選択し、当該システムは類似の画像を検索するのに要する処理を実行し、“次の(前の)”であるという更なる制限でもって唯一の結果を選択し、最後に当該ビデオストリーム内の対応する位置にジャンプする。この機能は、各サーチ方向につき1つずつの、2つの釦を使用して実施化することができる。このようにして、番組の興味ある部分へジャンプするためにユーザが実行しなければならない唯一の操作は、釦を押すことだけである。従って、本発明は消費者用デジタルビデオレコーダにおいてビデオ題材を介してブラウジングする場合においてエンドユーザを支援するのに特に適している。
【0010】
本発明の、これら及び他の態様は図面を参照する3つの実施例から明らかとなり、斯かる実施例により解説されるであろう。
【0011】
【発明の実施の形態】
以下、本発明の実施例を、図面を参照して詳細に説明する。
【0012】
図1は、本発明による装置の一実施例を示している。該装置は、記憶媒体4上に記憶された情報信号を読み取る読取ユニット2を有している。該装置は、記録媒体を有するビデオレコーダ又はセットトップボックスから既知であるような機能を有することができる。上記情報信号は、事前記録担体(CD若しくはテープのような)上又はハードディスク装置のような記録装置上に記憶されたTV信号とすることができる。該情報信号は、スクリーン上に表示することができる如何なる種類の情報とすることもできる。好ましい実施例においては、該情報信号は一連の画像を有するビデオ信号である。しかしながら、本発明は記録媒体上に記憶された写真又はスライドショーの収集のような何らかの種類の画像の収集を介してブラウジングを行うために使用することもできる。上記記憶媒体は、ハードディスク装置、光ディスク(DVD若しくはCDのような)等の着脱可能な記憶媒体、又は固体メモリの形態とすることができる。しかしながら、大量の情報を記憶する如何なる他の好適な記憶媒体も使用することができる。該記憶媒体から読み取られた情報信号は、当該情報を図示せぬ表示ユニットに供給するために、出力ユニット6に供給される。上記表示ユニットは当該装置に含めることもできる。
【0013】
上記装置は、更に、ユーザが記録された情報信号にアクセスし該情報信号を看取することができるようにするようなコマンドを入力するためのユーザ制御入力ユニット8を有している。このユーザ制御入力ユニットは、好ましくは、リモートコントローラの形態とする。しかしながら、音声制御の使用も同様に好適である。リモートコントローラの形態の制御入力ユニットは、好ましくは、“次の類似画像へジャンプ”なるコマンドを発生するキー及び“前の類似画像へジャンプ”なるコマンドを発生するキーを有するものとする。これらコマンドは制御ユニット10に供給される。該制御ユニットは読取ユニット2を制御するようになっている。該読取ユニットが通常の再生モードである場合、次の類似のものへのジャンプに従って、上記制御ユニットは、前記記録媒体からの情報信号の読み取りを中止すると共に、該次の類似画像へのジャンプコマンドが入力された際に読み取られた画像と同様の視的記述子を持つ次の画像へジャンプするように構成されている。何が類似画像であるか、及び何が次の又は前の類似画像であるかを決定する方法は、後に詳述する。画像の視的記述子は、画像のカラー情報により特定することができる。しかしながら、例えばMPEG−7規格に従うコンテンツの記述のような他の視的記述子も好適である。
【0014】
当該装置は、更に、次の/前の類似画像を見付けるように構成されたサーチユニット14も有している。“次/前へスキップ”コマンドの受信後、上記サーチユニットは該コマンドが付与された時点で読み取られた情報信号の視的記述子を先ず決定する。サーチユニットの第1実施例においては、該サーチユニットは、読取ユニット2により読み取られた情報信号に関する視的記述子を、該読み取られた情報信号に対応する視的記述子をデータベースから読み取ることにより決定する。該データベースは上記情報信号と一緒に記憶媒体4に記憶することができる。しかしながら、該データベースは上記サーチユニットによりアクセス可能な何れの適切な記憶媒体上に記憶することもできる。例えば、該データベースはインターネット接続を介してアクセス可能なサーバ上に記憶することもできる。該データベースは、情報信号内の同様の視的記述子を持つ画像及び該情報信号における斯かる画像の位置に関する情報を有している。例えば、当該情報信号が記録されたビデオ番組である場合、上記データベースは該ビデオ番組内の各シーンに関してレコードを持つようなテーブルを有する。更に、各レコードは当該ビデオ番組内の次の同様の視的記述子(読み取り画像)に対するポインタ、及び当該ビデオ番組内の前の同様な視的記述子に対するポインタを有している。このように、“次/前にスキップ”コマンドが入力された場合、上記サーチユニットは現在読まれているシーンに対応するレコードを読み取り、次の/前の画像の位置を読取ユニット2に供給する。該読取ユニットは、サーチユニット4により供給された位置において情報信号の読み取りを開始する。
【0015】
上記データベースは、例えば電話回線又はケーブル等の何らかの適切な接続を介して、サービス提供者から得ることができる。該データベースは、記録される番組と同時に伝送することもできる。また、該データベースは当該装置内において上記記録媒体上への情報信号の記録と同時に発生することもできる。従って、当該装置は図示せぬ抽出ユニットを有している。上記記録媒体上への情報信号の記録の間に、該情報信号は上記抽出ユニットに供給される。該抽出ユニットは当該情報信号に関する視的記述子を、例えば各シーンに関して発生する。これらの視的記述子は記録媒体上のデータベースに記憶される。この記録媒体は、当該情報信号が記憶される記録媒体と同一である必要はない。これら視的記述子を抽出する方法は後述する。更に、当該装置は、各シーンに関して、どの画像又はシーンが次の及び前の画像と見なされるべきかを決定するユニットも有している。前記画像の位置も当該データベースにおける各ロケーションに記憶される。これら画像を決定する方法も、後に詳述する。
【0016】
上記データベースは、各エントリが上記情報信号における次の及び/又は前の位置に対するポインタを有するようなリンクされたリストの形態でもよい。しかしながら、該データベースのエントリが、上記位置におけるコンテンツに関する情報を有するようにしてもよく、この場合、1つの位置が当該情報信号の一部の信号画像、例えばシーンとすることもできる。“類似のものへのジャンプ”コマンドに応答して、上記サーチユニットは該データベース内で次の位置をサーチする。内容テーブルの形態の該データベースは、幾つかの適切な態様で編成することができる。該データベースは幾つかのリストを有することができる。各リストは規定された特徴との関係を有する。当該情報信号のうちの同一の特徴を持つ部分の位置は、同一のリストに配置されると共に、好ましくは該情報信号における上記部分の位置により順番に記憶されるようにする。かくして、“次へのジャンプ”コマンドは、リストをサーチすると共に、該リストにおける上記コマンドが入力された時点の読み取り位置に対応するエントリをサーチすることにより実現することができる。該リストにおける次のエントリを取ることにより、上記読取ユニットは、上記の次のエントリに対応する位置において情報信号を読み取るように制御することができる。
【0017】
上記データベースの他の実施例においては、当該データベースにおける各エントリが当該情報信号における位置に対応する。“次へのジャンプ”コマンドが入力される毎に、内容テーブルが再び並び替えられる。エントリの順番は、コマンドが入力された時点における読み取り位置に対応するエントリの類似性の程度により決定される。この実施例は、ユーザが当該情報信号における最も類似した部分へジャンプするのを可能にする。
【0018】
図4は、ビデオ番組のような一連の画像を有する情報信号を介してスキップするのに適した、本発明の装置の一実施例を示している。好ましくは、当該情報信号はMPEGビデオ信号の形態であるとする。この実施例においては、サーチユニットは読取ユニット2から情報信号を入力する入力端子を有している。“次の/前の類似画像へスキップ”コマンドを受信後、該サーチユニットは現在読み取られている情報信号の視的記述子を先ず決定する。次いで、読取ユニット2はサーチモードにされる。このモードにおいては、情報信号の読み取りは通常のモードにおけるよりも速い。情報信号は、記録媒体から完全に読み取られるか、又は例えばMPEG信号のIフレームのように部分的にのみ読み取ることができる。該読み取られた信号はサーチユニット12に供給され、該サーチユニットは供給された信号から視的記述子を導出すると共に、該導出された視的記述子が、前記コマンドが受信された際に読み取られた情報信号の視的記述子と類似しているか否かを解析する。類似した記述子が見付かるやいなや、読取ユニット2は通常のモードに復帰する。
【0019】
上記の次の類似画像へのジャンプ機能は、幾つかの役立つ作業に使用することができる。該機能が適用される例の幾つかを以下に示す。
− 放送者が番組とコマーシャルの開始(終了)との間を区別するために静止画像(例えば、全画面のチャンネルのロゴ)を使用する場合は、コマーシャルを跳ばすために使用することができる。
− ニュース番組においてアンカーマンの画像を用いて次のニュース項目を跳ばすのに非常に有効である。通常、ニュース番組はサブタイトルを用いて放送されるので、これらニュース番組の非常に詳細且つ正確なテキスト的情報を有すると仮定することができる。この仮説を用いれば、ニュース番組に関しては、次の(前の)類似画像へのジャンプ機能の代わりにキーワードによるサーチを使用する方が良いように思われる。何れにせよ、このツールは、ユーザがテキスト情報を読む必要無しに、或るニュースから次の(前の)ニュースへ高速でジャンプすることを可能にする。
− 天気予報へ、又はスポーツニュースへ、又は番組中の固定の見出しを持つ特定の節にジャンプするのを可能にする。
− 自身の固定の提供者の若しくは終了の見出しを有する番組の開始又は終了へジャンプするのに使用することができる。
− ビデオクリップの集合である音楽番組は最近ではむしろ普通である。次の(前の)類似画像へのジャンプ機能は、或るビデオクリップから次のビデオクリップへジャンプするのに使用することができる。
− 多くのドキュメンタリは、特定のロゴで開始するような異なる話題に関する特別な節を有している。ユーザは、次の主題を示すロゴに、順方向早送りで時間を費やす必要性なしに、直接ジャンプすることができる。
【0020】
最後の2つの例におけるのと同様にして、次の/前の類似画像へのジャンプ釦は、構造(同一の文字は類似のフレームに対応する):
を有する全ての番組においてAフレーム間をジャンプするために使用することができる。ニュース番組においては、Aフレームはニュースを読むアンカーマンに相当する。ドキュメンタリにおいては、Aフレームはショーマン(又はショーガール)が主題を紹介すると共に、ドキュメンタリ項目の間に介在されるようなシーンに相当する。殆ど同じようなことが、Aフレームにおいてショーマン(又はショーガール)が行われるイベントを紹介する又は現れるゲストを紹介するようなTVショーにおいて発生する。ショーにおけるのと同様に、ショーマン(又はショーガール)は、通常、音楽ビデオクリップを紹介する。確かに、このような構造は通常の放送TV番組においては極めて普通である。
【0021】
同様の結果が、ビデオをシーンに構造化し、且つ、次のシーンへのジャンプ釦のみを使用することにより達成することができるように思われる。本発明によるブラウジング機能は、次のシーン又はキーフレームにジャンプするのみならず、次の類似のシーンへ直接ジャンプするのを可能にするので、ビデオを事前に構造化するようなもっと伝統的な階層的方法とは相違する。次の(前の)類似画像へのジャンプ機能は、ビデオの誘導(ナビゲーション)の目的のみならず、写真又はスライドショーを介するブラウジングのためにも使用することができる。
【0022】
番組の開始部にある場合又はコマーシャルの形である場合、ビデオ番組の予告編も同様に非常に有効である。前者の場合、ユーザは予告編から画像を選択し、一旦放送及び記録されたならば、該番組内の上記と同一の画像にジャンプすることが可能である。このようにして、ユーザは上記画像に対応する位置において上記ビデオ番組を視聴開始することができる。後者(即ち、ニュース番組における見出し)の場合、ユーザは予告編から選択された画像を利用して、当該番組内の興味のある部分にジャンプすることができる。この場合、上記予告編は当該番組の内容テーブルとして見ることができる。
【0023】
ユーザが幾つかの画像を好きな画像として選択するのを可能にするなら、次の/前の類似画像へのジャンプを、これら好きな画像に基づくものとすることができる。ビデオストリームの画像部分を使用する代わりに、ユーザは一群の好きな画像の間で選択することを可能にされることができる。この所謂好きな画像リストは、例えば下記の筋書きを可能にする:
− ユーザがニュース番組を視聴しており、そして該ユーザの好みのロックバンドが新たなビデオクリップを作成したことを知る。このニュース番組は該ビデオの1分予告しか含んでいない。該ユーザは該ビデオの或る重要な画像を自身の好み画像リストに保管し、この新ビデオクリップが送信されるであろうことを確信して数時間のビデオクリップを記録する。後の日に、該ユーザは以前に保管された画像を使用することにより、記録題材のなかで当該全ビデオクリップを見付けるべく試みることができる。
− ユーザがニュース番組を見ており、ハッキネンがマクラレンのF1カーで午後に最悪の事故にあったことを知る。該ユーザは全レースを記録したが、今は時間がないので見たくない。該ユーザは、自身の好み画像リスト内の上記ニュース番組からの事故の画像を用いて上記事故の一連場面にジャンプする。
【0024】
次の(前の)類似画像へのジャンプ機能は、ビデオシーケンスの各画像が次の(前の)最も類似したものに関連付けられていることを要する。通常、2つの連続するフレームは非常に類似している。次の(前の)類似画像へのジャンプにおいては、これらのフレームは破棄されるべきである。1つの解決策は、一群の連続した類似したフレーム内では1つのフレームのみを考慮することである。これは、ビデオをショットにセグメント化し、各ショットに関して代表的な静止画像(キーフレーム)を選択し、次いで、キーフレーム間のみで類似性をサーチすることと等価である。
【0025】
次の(前の)類似画像へのジャンプ機能は、記述子が得られる方法及び類似性が測定される方法とは独立していることに気付くことが重要である。
【0026】
好ましい実施化においては、各キーフレームから視的記述子が自動的に抽出される。2つのキーフレームは、これらキーフレームの視的記述子間の距離(distance)が所定の閾よりも小さい場合に類似していると仮定する。次の(前の)類似画像へのジャンプ機能は、当該フレームの類似性のみならず相対位置も考慮に入れる。何故なら、該機能は1つのみの次の(前の)類似画像を取り出さねばならないからである。図2は、当該好ましい実施化により実行されるステップを示している。
【0027】
ユーザが次の類似画像へのジャンプ釦を押下すると、当該システムは後続のショットの記述子を取り込むと共に、2つのフィルタ処理を実行する。先ず、該システムは問い合わせキーフレームの視的記述子を後続の(先行する)キーフレームの記述と比較する。該問い合わせ対象からの距離が一定の閾より大きいような記述子を持つキーフレームは破棄される。第2のフィルタ処理は、特徴空間における当該問い合わせ対象からの距離に応じて、残りのキーフレームを少なくとも2つのクラスタに分割することである。これら2つのクラスタは、画像を類似性により並び替え、これら画像の問い合わせ対象からの距離の間の順次の差を考慮することにより得られる。これらの差の1つが或る閾を超える場合は、全ての連続する画像は別のクラスタに入れられる。当該問い合わせ対象に最も近い画像のクラスタが時間順に並び替えられ、最初のフレームが上記次の類似画像に対応するものとなる。
【0028】
以下に、使用することが可能な視的記述子についての幾つかの詳細を説明する。
【0029】
現在のパターン突き合わせ及び画像理解技術は、依然として、意味的な点で視的内容を解釈するという目標からはほど遠いものである。このように、低レベルの視的特徴に依存する必要がある。カラー、テクスチャ、形状及び動きは、最も普通に使用されている知覚的な視的特徴である。カラー情報は、遮蔽(occlusion)、画像サイズ及び向きに対して、むしろ強いことが分かっている。テクスチャ記述子は一様なテクスチャパターンを分類するためには強力であるが、自然なシーンにおける不均一な領域を扱うには有効ではない。また、形状記述子も使用することができる。これらの記述子は画像のセグメント化を要し、斯かるセグメント化は大きな計算能力を必要とするので、これら記述子は現在のところ消費者用電子製品にとっては高価過ぎる。更に、現在利用可能な画像セグメント化技術は、一般的な実世界画像に対しては充分に強くはない。
【0030】
カラーに関する人の知覚は、複雑なプロセスである。ビジュアルデータ及びカラーの表現を扱う場合、幾つかの簡略化の仮定がなされる。カラーの特徴はピクセルレベルで処理され、これはカラーの知覚が周囲のカラーによっては影響されないことを意味する。更に、周囲光、視距離及び表示品質等の看取条件は考慮されない。先ず、ビジュアル事項(visual item)の定義がなされる。ビジュアル事項Iは、カラー空間CSにおけるピクセル集合として表された、全画像又は画像の任意形状領域(長方形の又は不規則な)である。
【0031】
下記の段落は、知覚的な視的特徴の量的表現を符号化する一連の記述子を提示する。抽出手順及び関連する類似性突き合わせ規準も提示される。
【0032】
カラーヒストグラムは、ビジュアル事項の低レベルカラー特性を記述する非常によく知られた方法である。斯かるヒストグラムは、3つの独立したカラー分布として又はカラーチャンネル上の1つの分布として表すことができる。カラーヒストグラムは、所与のビジュアル事項Iに関して、カラー空間CS内にn個の別個のカラーが存在するように分離されて定義される。カラーヒストグラムH(I)はベクトル<H1,H2,…,Hn>であり、ここで、各要素Hjはビジュアル事項I内のカラーCjのピクセルの割合を含む。
【0033】
カラーヒストグラムは、むしろ、カラー内容の効率の良い表現である。肯定的な面は、カラーヒストグラムの計算は効率的であるということである。更に、カラーヒストグラムは、カメラの回転、ズーミング、解像度の変更及び部分的遮蔽により発生する変動に対してかなり不感的である。しかしながら、カラーヒストグラムは光条件に対して感受的であり、カラー空間量子化によりカラー内容を表現する場合に問題を有し得る。量子化は、知覚的に区別的なカラーが同一の区分け(ビン:bin)に入らないように充分に精細でなければならない。この配慮は、下記の節で提示される全てのヒストグラム型記述子に対して適用することができる。
【0034】
カラーヒストグラム抽出は、ビジュアル事項内の各ピクセル値に対して量子化された値を計算し、当該ヒストグラムにおける対応するビンを増加させることにより実行される。この場合、ビン内のピクセルの数はビジュアル事項のサイズに従って正規化されるべきである。この最後のステップは、同一の寸法のビジュアル事項を扱う場合は避けることができる。該抽出手順は線形な時間を必要とすることに注意すべきである。
【0035】
カラーヒストグラムを用いて色的類似性を決定するために、異なる距離測定を使用することができる。これらは、実効性及び計算的複雑さの両方に関して異なる検索性能に繋がる。カラー空間の及びカラー量子化の選択と共に、類似性突き合わせ規準の選択も、視的検索技術の実施化における重大な面である。
【0036】
カラーヒストグラム用の3つの普通に使用されている類似性測定は、L1距離、ユークリッド又はL2距離、及び二次距離(quadratic distance)である。H(Iq)及びH(It)を、各々、問い合わせの及び目標のヒストグラムであるとすると、L1距離は、
【数1】
により定義される。
【0037】
ユークリッド距離、即ちL2距離は、
【数2】
により定義される。
【0038】
これらの定義において、カラーバケット間の差は一様に重み付けされる。L1距離及びL2距離は、共に、類似しているが同一ではないヒストグラム要素を比較はしない。例えば、暗い赤の画像は青の画像に対するのと同様に赤の画像に対しても等しく非類似である。距離計算内でのヒストグラム要素類似性の測定を用いることにより、ヒストグラム突き合わせを改善することが可能である。
【0039】
二次距離測定は、この問題に対処するもので、
【数3】
により定義される、ここで、W=[aij]及びaijはインデックスi及びjのカラーの知覚的類似性を示す。この計量(metric)は、全てのヒストグラム要素を比較し、対的重み係数により要素間距離に重み付けをする。相互相関aijに対する適切な値はaij=1-dijにより与えられ、ここで、dijは当該カラー空間における2つのカラー間の最大距離に対して正規化されたインデックスi及びjのカラー間の距離である。該二次距離はL1及びL2距離よりも計算的には一層高価となる。何故なら、該二次距離は全ての要素間の相互類似性を計算するからである。
【0040】
MPEG−2規格に採用された圧縮アルゴリズムが使用される場合、低コストで、当該ビデオストリームから部分的復号のみによりDC画像と呼ばれるフレームの再スケール処理されたバージョン(64倍小さい)を抽出することが可能である。これらは、完全サイズフレームの8x8ブロックの二次元離散コサイン変換の直流係数のみを考慮することにより得られる。直流画像は、フレームの一層小さな再スケール処理された、即ちブロック解像度のバージョンであるから、直流画像は同一の内容を表すと仮定することができる。類似のキーフレームを取り出す目的で、Iフレームに関しデジタルビデオストリームにおいて低コストで利用可能であるような直流画像から、視的記述子を直接抽出することが可能である。MPEGストリームにおいては、Iフレームはキーフレームと見なすことができる。これらの実施化を単純化するために、当該抽出手順は、特定されたカラー空間内のピクセル値のアレイを入力として扱うように設計された。これらを、シーン変化アルゴリズムと組み合わせて、MPEG−2復号を最小必要要件に限定するような記述子の計算を実行することが可能である。
【0041】
上記カラーヒストグラム記述子は、YCbCr及びHSVカラー空間の両方に使用することができる。YCbCrカラー空間の方が好ましい。何故なら、該カラー空間はMPEG−2規格で使用されているフォーマットであり、ビデオストリームから直接抽出されたカラー情報は更なる変換を要さないからである。更に、厳格には知覚的に一様ではないとしても、この視点からは、ユーザインターフェースにおいてキーフレームを表示するために使用されるRGBカラー空間よりは良好である。
【0042】
次に、使用することが可能なYCbCrカラー空間の3つの異なるカラー量子化を定義する。他の量子化も同様に適していることに注意すべきである。
− Y、Cb及びCrカラーチャンネルは、各々、16、4及び4のレベルに線形に量子化された。結果としての記述子は256ビンの単一変数ヒストグラムと見ることができる。
− Y、Cb及びCrカラーチャンネルは、各々、16、8及び8のレベルに線形に量子化された。結果としての記述子は1024ビンの単一変数ヒストグラムと見ることができる。
− Y、Cb及びCrカラーチャンネルは、各々、16、16及び16のレベルに線形に量子化された。結果としての記述子は4096ビンの単一変数ヒストグラムと見ることができる。
【0043】
HSVカラー空間も同様に好適である。何故なら、該空間は知覚的に略一様であり、従って適切な量子化を定義することによりカラーの小型且つ完全な集合を得ることができるからである。RGBからHSVへの変換は下記の式[36]により達成することができる:
【数4】
ここで、(r,g,b)はRGB空間内の点であり、(h,s,ν)はHSV空間における対応する点であり、(r’,g’,b’)は(r,g,b)≠min(r,g,b)の場合:
【数5】
と定義される。r,g,b∈[0…1]に関しては、該変換はh,s,ν∈[0…1]を与える。離散カラーヒストグラムを計算するのに要するカラー空間量子化は、166色の小さな集合[5,7,8,19,23]を生成するように設計される。色相(hue)が知覚的に一層重要な特徴であると信じて、最も精細な量子化が色相に対して使用された。円柱状HSVカラー空間の色相円は20度のステップに分割された。このようにして、3原色並びに黄色、マゼンタ及びシアンは、各々、3つの副分割を用いて表される。彩度(saturation)及び明度(value)は、各々、3つのレベルに量子化され、これらの次元に沿って一層大きな知覚的許容度を生じさせる。18の色相、3つの彩度、3つの明度に4つの追加のグレイを加えて、166の明確なカラーが考慮される(18x3x3+4=166)。
【0044】
3つのYCbCr量子化及びHSVのものを考慮して得られる4つのカラーヒストグラムが、完全サイズ画像及び直流画像の両方から抽出された。このように、各キーフレームは、8つの関連する異なるカラーヒストグラムを有する。
【0045】
異なる画像のカラーヒストグラムは、L1及びユークリッド距離を用いて比較することができる。YCbCrカラー空間における3つの量子化間で、最良の結果が直流画像から導出された256ビンのヒストグラムを用いて得られ、L1距離と比較された。このように、L1距離は、もっと高価なユークリッド距離よりも良好に動作することが分かった。更に、完全サイズのフレームからというよりは直流画像からヒストグラムを抽出することは、この記述子の検索性能を悪化させないことが分かった。
【0046】
直流画像から抽出されたHSVカラー空間の166ビンのヒストグラムがYCbCrのものより優れていることが分かった。斯かる結果は、HSVカラー空間が知覚的に略一様であって、166の明確なカラーへの量子化がYCbCrカラー空間の256分割よりも良好なカラー範囲を提供するという事実によるものである。
【0047】
カラーヒストグラムにより提供されるもののような包括的なカラー記述は合理的な程度に識別力のあるものであるが、空間的情報の欠如はビジュアル事項の比較において余りに多くの誤った合格(false positive)を与える可能性がある。知覚された非類似な検索ビジュアル事項が非常に類似したカラーヒストグラムを有する可能性がある。検索の実効性及び確度を改善するためには、カラーの特徴と空間関係の両方を使用することができる。カラー格子ヒストグラム及び下記のヒストグラム型記述子は、空間的情報を同様に考慮に入れることにより、包括的なカラーの特徴を局部的なものに拡張する。
【0048】
通常のカラーヒストグラムにより表される包括的なカラーの特徴を拡張するための自然な方法は、ビジュアル事項を副ブロックに分割すると共に、これら副ブロックの各々からカラー特徴を抽出することである。カラー格子ヒストグラムは、この方法に従うもので、10個のヒストグラムからなることができる。その場合、ビジュアル事項は3x3の正方形に区画された格子を用いて9個の領域に分割される。各領域から、通常のカラーヒストグラムが計算される。10番目のヒストグラムは、全体のビジュアル事項のカラーヒストグラムである。該副ブロック分割は重なり領域を考慮することにより改善することができる。この方法によれば、記述子は小さな領域変化に対しては比較的不感的とすることができる。
【0049】
該カラー格子ヒストグラム抽出手順は、本質的に、通常のカラーヒストグラム抽出手順と同一である。唯一の相違点は、増加されるべきヒストグラム要素が、当該ビジュアル事項のピクセル値の空間位置にも依存することである。
【0050】
該カラー格子ヒストグラムは通常のカラーヒストグラムからなるので、ヒストグラムを比較するのに使用するのと同一の距離計量を副ブロックヒストグラムに対しても使用することができる。2つのカラー格子ヒストグラムの間の距離は、副ブロックの距離の総和であろう。更に、副ブロックヒストグラムの間の距離に当該画像内の位置に応じて重み付けすることもできる。例えば、中央のブロックは他のものができるよりも大きく重み付けすることができる。何故なら、殆どのビジュアル事項に関しては、中央の領域が看者の注意を惹き、従って、類似性を判断する場合に人間は画像の中央に大きな重要度を与えるからである。
【0051】
上記カラー格子ヒストグラム記述子は、完全サイズのキーフレームを3x3の正方形区分格子を用いて9個の領域に分割すると共に、各副ブロックに関して64ビンのカラーヒストグラムを計算することにより実施される。更に、全体の画像に対して他の64ビンのヒストグラムが計算される。このように、該記述子は10個のヒストグラムからなる。
【0052】
各ヒストグラムはYCbCrカラー空間において計算される。Y、Cb及びCrカラーチャンネルは、各々、4つのレベルに線形に量子化されたものである。好ましくは、YCbCrカラー空間が使用される。というのは、MPEG−2ストリームではカラー情報が、このフォーマットで利用可能であるからである。
【0053】
異なる画像のカラー格子ヒストグラムを比較するために使用される距離は、対応する副領域ヒストグラムの間のL1距離、又はユークリッド距離の和とした。更に、副ブロックヒストグラム間の距離には当該画像内の位置に応じて重み付けを行った。中央のブロックの距離には他のものより2ないし10倍の重み付けをした。
【0054】
同一の画像に関して、実験的な試験は、カラー格子ヒストグラムは良好な結果を与えたが、平均では通常のものより良好には動作しないことを示している。距離の計算において異なる重みを使用しても、検索の有効性は、抽出、比較及び記憶の追加のコストを考慮すると充分には改善しなかった。
【0055】
カラー構造ヒストグラム(文献においては小滴ヒストグラム:blob histogramとも呼ばれる)は、ビジュアル事項の局部カラー構造を幾つかのピクセル値からなる構造化要素を用いて表す。通常のカラーヒストグラムは、特定のカラーを持つ単一ピクセル値の相対周波数を特徴付ける。カラー構造ヒストグラムは通常のものとは、特定のカラーを持つピクセルを含むような構造的要素(structuring element)の相対周波数を符号化する点で相違する。斯かるヒストグラムは、通常のカラーヒストグラムから不変性特性を受け継ぐと共に、空間的情報を埋め込むことにより、識別力を著しく増加させる。
【0056】
n個の明確なカラーが存在するように分割されたカラー空間CSを考える場合、ビジュアル事項Iに対するカラー構造ヒストグラムは:
定義2:カラー構造ヒストグラムH(I)は、各要素Hiが、当該ビジュアル事項IにおけるカラーCjの1以上のピクセルを含む構造的要素の数を含むようなベクトル<H1,H2,…,Hm>である。
【0057】
構造的要素の空間的広がりは、ビジュアル事項のサイズに依存するが、構造的要素内のサンプルの数は、ビジュアル事項と構造的要素とを同時にサブサンプリングすることにより一定に維持される。8x8のパターンに配列された構造的要素における64サンプルなる数を選択すると、このパターンにおける2つのサンプルの間の距離はビジュアル事項のサイズの増加と共に増加する。ビジュアル事項が固定の基本サイズに再寸法化されるなら、同一の8x8構造的要素を使用することができ、さもなければ、サブサンプリング係数並びに構造的要素の幅及び高さを次のように決定することができる。Eは元のビジュアル事項Iにおける構造的要素の空間的広がりである、即ち当該空間的広がりはExEであるとする。また、Kは適用されるサブサンプリング係数、即ちK={1,2,4,8,16,…}とし、ここでK=1はサブサンプリングなしを意味し、K=2は水平及び垂直方向に2によりサブサンプリングすることを意味し、等々である。K及びEは下記のように定義される:
p=max{0,round(0.5・log2(width・height)-8)}
K=2p
E=8K
ここで、width及びheightは長方形のビジュアル事項Iを示す。p<0の場合は、p=0を考える。
【0058】
カラー構造ヒストグラムは当該ビジュアル事項全てのロケーションを訪問し、各ロケーションに重ねられた構造要素内に含まれる全てのピクセルのカラーを取り出し、対応するビンを増加させることにより計算される。ヒストグラムのビンは、当該手順の最後において構造的要素の数により正規化することができる。図3は8つの異なるカラーのビジュアル事項での抽出手順を示している。
【0059】
構造的要素32、即ち4x4ピクセルのサイズの正方形、が当該ビジュアル事項上をスライド窓として通過される。或るロケーションにおいて(図においては当該ビジュアル事項の一部のみしか図示されていない)、当該構造的要素は、カラーC0の4つのピクセルと、カラーC1の6つのピクセルと、カラーC2の6つのピクセルとを含んでいる。次いで、行C0、C1及びC2のビンが増加される。従って、この場合、構造的要素は、該構造的要素の領域内に存在する各カラーにつき1回ずつ、3回カウントされる。
【0060】
カラー構造ヒストグラム、カラー・コレログラム、カラー・オートコレログラム、カラー・コヒーレンス・ベクトル及び連結ヒストグラム(joint histograms)は全てヒストグラム型の記述子であるので、通常のカラーヒストグラム用に提供されるのと同一の類似性突き合わせ規準を、全てのこれら他の視的記述子を比較する場合に適用することができる。異なる特徴空間における距離値は、勿論、比較することはできない。
【0061】
カラー・コレログラムはカラー対によりインデックスされるテーブルであり、ここで、<i,j>に対するk番目のエントリはカラーCiのピクセルから距離kにおいてカラーCjのピクセルを見付ける確率を特定する。カラー・コレログラムはカラーの空間的相関が距離と共にどの様に変化するかを表す。
【0062】
ビジュアル事項I、及びn個の明確なカラーが存在するように分割されたカラー空間CSが与えられたとして、I(p)がピクセル値p∈Iのカラーを示すとする。このように、p∈Icなる表記は、p∈I,I(p)=cと同義である。ピクセル値間の距離はL∞−norm、即ちピクセルp1=(x1, y1),p2=(x2, y2)に対して、
【数6】
と定義する。集合{1,2,…,n}を[n]により示す。この表記法により、カラーヒストグラムH(I)は、
【数7】
により
【数8】
と定義される。ビジュアル事項I内の如何なるピクセル値に対しても、hci(i)は当該ピクセルのカラーがciである確率を与える。距離d∈[n]が演繹的に固定であるとする。この場合、Iのカラー・コレログラムは、
【数9】
であるので、
【数10】
と定義される。当該画像内のカラーciの何れかのピクセルが与えられたとして、
【数11】
は該所与のピクセルから距離k離れたピクセルがカラーcjのものである確率を与える。
【0063】
ビジュアル事項内の異なるカラーの数が大きい場合、カラー・コレログラムの空間及び時間上の計算的複雑さは増加して、検索性能が低下する。これは、同一のカラーの間の相関のみを考慮することにより部分的に避けることができる。このカラー・コレログラムの特異化は、カラー・オートコレログラムと呼ばれる。Iのオートコレログラムは同一のカラーの空間的相関のみを捕捉し、
【数12】
により定義される。
【0064】
ビジュアル事項上のカラー分布に関する空間的情報を含めることにより、カラー・コレログラム及びオート・コレログラムは、特に類似のカラーではあるが異なるカラー配置を伴うようなビジュアル事項を扱う場合に、カラー・ヒストグラムよりも大きな識別力を提供する。
【0065】
ビジュアル事項Iのカラー・コレログラムを計算する単純なアルゴリズムは、カラーciの各p1∈Iを考慮し、各k∈[d]に関して、‖p1−p2‖=kなるカラーcjの全てのp2∈Iをカウントすることであろう。残念ながら、これはO(d2S)倍掛かり、ここでSはIのピクセル値の合計数である。この高価な計算をなくすために、1999年のインターナショナル・ジャーナル・オブ・コンピュータ・ビジョン、第35巻、第3号の第245〜268頁における記事“空間的カラーの指標付け及び用途”には、ダイナミック・プログラミングに基づく効率的なアルゴリズムが記載されている。所要の計算時間はO(dS)に減少される。
【0066】
検索有効性に関しては、L1距離でのカラー・オート・コレログラムの方が通常のヒストグラムよりも良好に動作したことが分かった。それにも拘わらず、該カラー・オート・コレログラムの計算、比較及び記憶の追加コストを考慮に入れると、最良の記述子は安価且つ有効なカラーヒストグラムのままである。
【0067】
良く知られたカラー・コヒーレンス・ベクトルは、基本的には、カラー分布に関する幾つかの空間的情報を含むように拡張されたカラーヒストグラムである。カラーのコヒーレンスとは、当該カラーのピクセルが、ビジュアル事項Iの大きな同様にカラー付けされた領域の要素(member)である程度として定義されている。ビジュアル事項Iを考えると、カラーヒストグラムH(I)の所与のカラーバケットにおける各ピクセルは、大きな同様にカラー付けされた領域の一部であるか否かに基づいてコヒーレントであるか非コヒーレントであるかの何れかとして分類される。カラー・コヒーレンス・ベクトル(CCV)は、各カラーにとってのコヒーレントピクセル対非コヒーレントピクセルの割合を記憶する。j番目の区分されたカラーのコヒーレントなピクセルの割合をαj、非コヒーレントなピクセルの割合をβjと呼ぶと、カラー・コヒーレンス・ベクトルは、各々の区分されたカラーにつき1つずつ、ベクトル対:
<(α1,β1),…,(αn,βn)>
により表すことができる。記号αj及びβjに関して同じ意味を維持することにより、通常のカラーヒストグラムは:
<α1+β1,…,αn+βn>
なるベクトルにより表すことができる。カラー・コヒーレンス・ベクトル(CCV)は、1つのビジュアル事項内のコヒーレントなピクセルが他のものにおける非コヒーレントピクセルと整合するのを防止する。コヒーレントなピクセルを非コヒーレントなピクセルから分離することにより、CCVはカラーヒストグラムよりも精細な区別を提供する。
【0068】
カラー・コヒーレンス・ベクトルを抽出する第1ステップとして、ビジュアル事項Iは、小さな局部近隣(典型的には8つの隣接するピクセル)においてピクセル値を平均値と置換することにより、僅かにぼかされる。これは、近隣のピクセル間の小さな変化を除去する。好ましくは、n個の明確なカラーの区分されたカラー空間が使用される。
【0069】
次のステップは、所与のカラーバケット内のピクセルをコヒーレントか又は非コヒーレントの何れかとして分類することである。コヒーレントなピクセルは同一のカラーの大きなピクセルの群の一部であり、一方、非コヒーレントなピクセルはそうではない。連結された成分を計算することにより、ピクセルの群を決定する。
定義3:連結成分Cは、如何なる2つのピクセルp,p’∈Cに対してもpとp’との間に経路が存在するような最大のピクセルの集合である。
定義4:C内の経路は、各ピクセルp’∈C及び如何なる2つの順番のピクセルpi,pi+1も互いに隣接するような一連のピクセルp=p1,p2、…,pn=p’である。一方のピクセルが他方の8つの最も近い近隣の間にある場合、2つのピクセルは隣接していると見なす。
所与のカラーバケット内の連結成分のみが計算されることに注意されたい。連結成分の計算が完成したら、各ピクセルは正確に1つの連結成分に属するであろう。ピクセルは、連結成分のピクセルの大きさに従ってコヒーレントであるか非コヒーレントであるかの何れかとして分類する。ピクセルは、該ピクセルの連結成分の大きさが固定の値τを超えたらコヒーレントであり、さもなければ、該ピクセルは非コヒーレントである。τは、通常、ビジュアル事項のサイズの1%に設定される。
【0070】
166カラーに量子化されたHSVカラー空間内のカラー・コヒーレンス・ベクトル(332ビンのベクトルとなる)が、L1距離と較べて、検索実効性、計算コスト及び応答時間に関してテストされた最良の視的記述子であることが分かった。
【0071】
通常のカラーヒストグラムと同様に、カラー・コヒーレンス・ベクトルは光条件の変化に対して感応的である。光に依存しないカラー特性を維持する1つの方法は、HSVカラー記述子において色相及び彩度成分のみを使用するか、又はRGBカラー空間の赤、緑及び青を、それらの和を介して正規化することである。
【0072】
当業者に良く知られた連結ヒストグラムは、カラー・コヒーレンス・ベクトル及びカラーヒストグラムの発生である。カラーコヒーレンスのみならず一連の局部的ピクセルの特徴を考慮に入れることにより、上記ヒストグラムは多次元ヒストグラムと見ることができる。連結ヒストグラムへのエントリは、特定の特徴値の組合せにより記述された当該画像内の多数のピクセルを含んでいる。もっと正確には、l番目の特徴がnlの可能性のある値を有するような、k個の特徴の集合が与えられたとして、連結ヒストグラムは、該連結ヒストグラムへの各エントリが特徴値のk組(k-tuple)により記述されるビジュアル事項内のピクセルの割合を含むようなk次元のベクトルである。従って、連結ヒストグラムのサイズは、
【数13】
、即ち各特徴の可能性のある値の組合せの数である。カラーヒストグラムがピクセルカラーの密度を符号化するように、連結ヒストグラムは幾つかのピクセルの特徴の連結密度を符号化する。カラー・コヒーレンス・ベクトルは、特徴としてカラー及びカラーコヒーレンスのみを使用する連結ヒストグラムと見ることができる。カラー格子ヒストグラムは、特徴としてカラーと特定の副領域に属することに関する位置とを使用するような連結ヒストグラムと見ることができる。エッジ密度(ピクセルのエッジ密度は、当該ピクセルを囲む小さな近隣内のピクセルに対するエッジの比である)、テクスチャードネス(ピクセルのテクスチャードネスは、輝度が固定値よりも大きく相違するような近隣のピクセルの数である)、勾配振幅(勾配振幅は、最大の変化の方向に輝度が如何に急速に変化しているかの目安である)、等級(ピクセルpの等級は、輝度がpの輝度より小さい局部的近隣におけるピクセルの数として定義される)等のような幾つかの追加の特徴を使用することにより、連結ヒストグラムはカラー・コヒーレンス・ベクトルよりも精細な区別を提供することができる。
【0073】
ビジュアル事項から連結ヒストグラムを導出する手順は、視的内容を特徴付けるように選択された特徴に依存する。通常、線形な時間で効率的に計算することが可能な特徴が選択される。
【0074】
連結ヒストグラムと見ることが可能な、カラー格子ヒストグラム及びカラー・コヒーレンス・ベクトルとは別に、特徴として、カラー、カラーコヒーレンス及び平均のテクスチャ的複雑さを使用するような連結ヒストグラムが使用される。平均のテクスチャ的複雑さは、MPEG−2ビデオストリームに組み込まれた圧縮ドメイン情報を利用して推定された。各ブロックの離散コサイン変換の64個の係数は、固定の閾より大きければ最大値に設定され、該閾より小さければ零に設定された。ブロックは、非零ピクセルの数が他の所定の閾より大きければ“複雑である”と判定された。カラー及びカラーコヒーレンスに加えて、キーフレームの各ピクセルは、当該ピクセルが属するブロックのテクスチャ的複雑さに依存して2つの等級に分類された。
【0075】
上記連結ヒストグラムの平均検索性能は、カラー・コヒーレンス・ベクトルを使用することにより得られるものと比肩し得るものである。追加のテクスチャ的特徴は識別力を改善させたが、上記特徴を実施化するためのコストは比較的高い。
【0076】
Iフレームが、キーフレームの検索実効性を改善するために使用された。特定の規準によりキーフレームが選択されない場合、近隣のIフレームの視的記述子の使用により、次の(前の)類似画像へのジャンプ機能の検索有効性が改善され得る。各キーフレームに関して1つの視的記述子を考える代わりに、当該キーフレームに近い一群のIフレームの全ての視的記述子が計算され、更に、距離が当該問い合わせ中のものに最も近いような記述子を割り当てた。
【0077】
この技術のもっと正確な説明を以下に示す。各ショットに対して、最初のIフレームがキーフレームとして選択されると仮定する。fi∈Vがi番目のIフレームであるような、ビデオシーケンスV=[f0,f1,…,fn]が与えられたとして、kq∈Vは問い合わせ中のキーフレームであり、範囲は、それ以上では2つの画像が類似しているとは見なされない最大距離であるとする。
【数14】
【0078】
最後に、キーフレームksに対して、Iフレームf’及び距離値dに関連する記述子が割り当てられる。
【0079】
好ましい実施化においては、N個の異なる一定値が選択された。更に、各ショットの全てのIフレーム(この場合、Nは当該ショットの長さに依存する)が使用された。
【0080】
単一の番組のキーフレームにわたって実行された場合、画像類似性サーチが可能であり、非常に有効であることが分かった。異なる番組内で斯かるサーチを実行することも可能であるが、多数のキーフレームが関係するので一層困難となる。数百及び数千の画像の場合、主たる問題は誤った一致と高い応答時間である。
【0081】
誤った一致は、類似した視的記述子を持つ異なる画像による。画像が多い程、非常に類似したカラーではあるが非常に異なった内容のフレームを発見する確率が高くなる。誤った一致を低減するために、即ちサーチの確度を増加させるために、非常に識別力のある視的記述子を使用することができる。
【0082】
非常に識別力のある記述子は、計算的複雑さのために応答時間を更に増加させ得る。応答時間を減少させるために、2つの戦略を一緒にしてさえ採用することができる。前置フィルタ処理として知られる第1の戦略は、可能性のある類似画像の第1集合を選択するために粗記述子を利用する。次いで、非常に識別力があり且つ計算的に高価な記述子が、該第1集合内での画像の選択のみに使用され、かくして、一層許容可能な応答時間のみが必要とされるようにする。第2の戦略は記述子を比較する場合に順次走査を避けるようにすることである。Rツリー、Sツリー又はMツリーのような良く知られたデータアクセス構造は、全体のデータベースを解析することなしで、関連のある画像のみを保持することが可能となるような方法で記述子を編成することを可能にする。これらの指標は、記述子がベクトル又は距離空間内の点としてモデル化されることを要し、データベース管理システムに対して幾らかの計算的コストを追加することになる。このように、これらは非常に大きなビデオ(画像)データベースに適している。
【0083】
以上、本発明を好ましい実施例を参照して説明したが、これらは限定することのない例であると理解すべきである。かくして、当業者にとっては、請求項に記載された本発明の範囲から逸脱することなしに、種々の変形例を着想することができる。一例として、記録された題材の特徴を含む内容テーブルは、斯かる記録題材をユーザにとり一層魅力的にするサービスとして、第3者により提供されるようにすることもできる。該内容テーブルがユーザの興味に基づくものであるなら、該ユーザの興味が当該情報信号の部分間の類似性の程度を決定する。
【0084】
“有する”なる動詞及びその活用の使用は、請求項に記載されたもの以外の構成要素及びステップの存在を排除するものではない。更に、単数表現の構成要素は複数の斯かる構成要素の存在を排除するものではない。請求項において、括弧内の符号は当該請求項の範囲を限定するものと見なすべきではない。本発明は、ハードウェアにより及びソフトウェアにより実施化することができる。幾つかの“手段”は、同一のハードウェア項目により表すことができる。更に、本発明は各及び全ての新規な特徴及び特徴の組合せに存する。
【図面の簡単な説明】
【図1】 図1は、本発明による装置の一実施例を示す。
【図2】 図2は、次の類似画像へのジャンプ機能を実行することができるようにするために取られるべきステップを示す。
【図3】 図3は、8つの異なるカラーを持つビジュアル事項での抽出手順を示す。
【図4】 図4は、本発明による装置の他の実施例を示す。
Claims (12)
- 第1記憶媒体上に記憶された画像の情報信号を再生する装置であって、該装置が、
− 前記第1記憶媒体から前記情報信号を読み取る読取手段と、
− 前記情報信号を表示ユニットに供給する出力手段と、
− “次の類似画像へジャンプする”コマンド又は“前の類似画像へジャンプする”コマンドを入力して、ユーザが前記情報信号にアクセスするのを可能にするユーザ制御入力手段と、
を有するような装置において、
前記装置は前記読取手段を前記記憶媒体からの前記情報信号の読み取りを該情報信号における第2位置において開始させるように制御する制御手段を更に有し、前記第2位置における前記情報信号は前記“次の類似画像へジャンプする”コマンド又は“前の類似画像へジャンプする”コマンドを入力する時点において読み取られる該情報信号の第1位置における特徴、又は前記時点よりも前に読み取られた情報信号の特徴との類似性を示すような特徴を有していることを特徴とする装置。 - 請求項1に記載の装置において、前記制御手段は第2記憶媒体からデータ信号を読み取るように更に構成され、該データ信号が前記情報信号における位置及び該情報信号における類似の特徴を有する他の位置に関する情報を有していることを特徴とする装置。
- 請求項2に記載の装置において、該装置が、前記情報信号から前記特徴を抽出する抽出手段と、該抽出された特徴に従い類似の特徴を持つ位置を決定して前記データ信号を得る手段と、該データ信号を前記第2記憶媒体上に書き込む書込手段とを更に有していることを特徴とする装置。
- 請求項1に記載の装置において、前記特徴が前記情報信号における位置に対応する画像のカラーヒストグラムとの関係を有していることを特徴とする装置。
- 請求項1に記載の装置において、前記特徴が前記情報信号における位置に対応する画像のカラー格子ヒストグラムとの関係を有することを特徴とする装置。
- 請求項1に記載の装置において、前記特徴が前記情報信号における位置に対応する画像のカラー構造ヒストグラムとの関係を有することを特徴とする装置。
- 請求項1に記載の装置において、前記ユーザ制御入力手段は、前記読取手段が前記情報信号の読み取りを該情報信号の前記時点における位置に後続する位置において開始するように制御する入力手段を有していることを特徴とする装置。
- 請求項1に記載の装置において、前記ユーザ制御入力手段は、前記読取手段が前記情報信号の読み取りを該情報信号の前記時点における位置よりも先行する位置において開始するように制御する入力手段を有していることを特徴とする装置。
- “次の類似画像へジャンプする”コマンド及び“前の類似画像へジャンプする”コマンドのための2つの釦を有する請求項1に記載の装置。
- 第1記憶媒体上に記憶された画像の情報信号を再生する方法であって、該方法が、
− 前記第1記憶媒体から前記情報信号を読み取るステップと、
− 前記情報信号を表示ユニットに供給するステップと、
− “次の類似画像へジャンプする”コマンド又は“前の類似画像へジャンプする”コマンドを入力して、ユーザが前記情報信号にアクセスするのを可能にするステップと、
を有するような方法において、
− 前記記憶媒体からの前記情報信号の読み取りを該情報信号における第2位置において開始するステップとを有し、前記第2位置における前記情報信号が、前記“次の類似画像へジャンプする”コマンド若しくは“前の類似画像へジャンプする”コマンドを入力する時点において読み取られる情報信号の第1位置における情報信号の特徴、又は前記時点よりも前に読み取られた前記情報信号の特徴との類似性を示す特徴を有していることを特徴とする方法。 - 請求項10に記載の方法をプロセッサに実行させるのを可能にするコンピュータプログラム。
- 請求項11に記載のコンピュータプログラムを担持する有形媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00203098 | 2000-09-08 | ||
EP00203098.9 | 2000-09-08 | ||
PCT/EP2001/010255 WO2002021529A1 (en) | 2000-09-08 | 2001-09-05 | An apparatus for reproducing an information signal stored on a storage medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004508756A JP2004508756A (ja) | 2004-03-18 |
JP2004508756A5 JP2004508756A5 (ja) | 2008-10-30 |
JP5005154B2 true JP5005154B2 (ja) | 2012-08-22 |
Family
ID=8171990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002525659A Expired - Fee Related JP5005154B2 (ja) | 2000-09-08 | 2001-09-05 | 記憶媒体上に記憶された情報信号を再生する装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6957387B2 (ja) |
EP (1) | EP1319230B1 (ja) |
JP (1) | JP5005154B2 (ja) |
KR (1) | KR20020059706A (ja) |
CN (1) | CN100392749C (ja) |
AT (1) | ATE451691T1 (ja) |
DE (1) | DE60140755D1 (ja) |
WO (1) | WO2002021529A1 (ja) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100424481B1 (ko) | 2000-06-24 | 2004-03-22 | 엘지전자 주식회사 | 디지털 방송 부가서비스 정보의 기록 재생장치 및 방법과그에 따른 기록매체 |
KR100910972B1 (ko) * | 2002-12-07 | 2009-08-05 | 엘지전자 주식회사 | 대화형 광디스크 장치에서의 재생 제어방법 |
AUPS206802A0 (en) * | 2002-05-01 | 2002-06-06 | Canon Kabushiki Kaisha | Steganographic image encoding |
JP2004015393A (ja) * | 2002-06-06 | 2004-01-15 | Matsushita Electric Ind Co Ltd | デジタル画像蓄積装置 |
KR100920654B1 (ko) * | 2002-12-09 | 2009-10-09 | 엘지전자 주식회사 | 대화형 광디스크 장치에서의 재생 제어방법 |
CN1735887B (zh) * | 2003-01-06 | 2010-04-28 | 皇家飞利浦电子股份有限公司 | 用于相似视频内容跳转的方法和设备 |
US20050177847A1 (en) * | 2003-03-07 | 2005-08-11 | Richard Konig | Determining channel associated with video stream |
US7480001B2 (en) * | 2003-07-02 | 2009-01-20 | Sony Corporation | Digital camera with a spherical display |
US20050001920A1 (en) * | 2003-07-02 | 2005-01-06 | Endler Sean Christopher | Methods and apparatuses for managing and presenting content through a spherical display device |
KR100612852B1 (ko) * | 2003-07-18 | 2006-08-14 | 삼성전자주식회사 | GoF/GoP의 질감 표현 방법과, 이를 이용한GoF/GoP 검색 방법 및 장치 |
US7379627B2 (en) * | 2003-10-20 | 2008-05-27 | Microsoft Corporation | Integrated solution to digital image similarity searching |
EP1557837A1 (en) * | 2004-01-26 | 2005-07-27 | Sony International (Europe) GmbH | Redundancy elimination in a content-adaptive video preview system |
US7299248B2 (en) * | 2004-06-29 | 2007-11-20 | International Business Machines Corporation | Method, system, program for determining frequency of updating database histograms |
US20060022995A1 (en) * | 2004-07-30 | 2006-02-02 | Yi-Pin Chang | Method for reducing noise in digital images |
GB2418556A (en) * | 2004-09-23 | 2006-03-29 | Mitsubishi Electric Inf Tech | Representing an image using descriptors based on colour information |
US7813552B2 (en) * | 2004-09-23 | 2010-10-12 | Mitsubishi Denki Kabushiki Kaisha | Methods of representing and analysing images |
US7840081B2 (en) | 2004-09-23 | 2010-11-23 | Mitsubishi Denki Kabushiki Kaisha | Methods of representing and analysing images |
US20070258009A1 (en) * | 2004-09-30 | 2007-11-08 | Pioneer Corporation | Image Processing Device, Image Processing Method, and Image Processing Program |
US7505051B2 (en) * | 2004-12-16 | 2009-03-17 | Corel Tw Corp. | Method for generating a slide show of an image |
JP2007174195A (ja) * | 2005-12-21 | 2007-07-05 | Toshiba Corp | 電子機器、自動シーンスキップ方法およびプログラム |
US7559017B2 (en) * | 2006-12-22 | 2009-07-07 | Google Inc. | Annotation framework for video |
US20100127974A1 (en) * | 2007-03-07 | 2010-05-27 | Pioneer Corporation | Data inspecting device and method |
US20090064008A1 (en) * | 2007-08-31 | 2009-03-05 | Matsushita Electric Industrial Co., Ltd. | User interaction for content based storage and retrieval |
US8111912B2 (en) * | 2008-02-15 | 2012-02-07 | Yahoo! Inc. | Cost-effective image metadata creation using near-duplicate image detection |
US8112702B2 (en) | 2008-02-19 | 2012-02-07 | Google Inc. | Annotating video intervals |
US8566353B2 (en) | 2008-06-03 | 2013-10-22 | Google Inc. | Web-based system for collaborative generation of interactive videos |
GB0901262D0 (en) * | 2009-01-26 | 2009-03-11 | Mitsubishi Elec R&D Ct Europe | Video identification |
CN102598113A (zh) * | 2009-06-30 | 2012-07-18 | 安芯美特控股有限公司 | 匹配出现在两个或多个图像内的对象或人的方法、电路和系统 |
US9036925B2 (en) * | 2011-04-14 | 2015-05-19 | Qualcomm Incorporated | Robust feature matching for visual search |
US8706711B2 (en) | 2011-06-22 | 2014-04-22 | Qualcomm Incorporated | Descriptor storage and searches of k-dimensional trees |
US8737745B2 (en) * | 2012-03-27 | 2014-05-27 | The Nielsen Company (Us), Llc | Scene-based people metering for audience measurement |
US9185456B2 (en) | 2012-03-27 | 2015-11-10 | The Nielsen Company (Us), Llc | Hybrid active and passive people metering for audience measurement |
FR2996668B1 (fr) * | 2012-10-09 | 2015-12-18 | E On Software | Procede pour accelerer des rendus monte carlo. |
US9843614B2 (en) | 2012-12-21 | 2017-12-12 | Comcast Cable Communications, Llc | Reference image based content skipping |
JP6038965B2 (ja) * | 2014-01-14 | 2016-12-07 | 有限会社パパラボ | 着色検査装置および着色検査方法 |
CN111383201B (zh) * | 2018-12-29 | 2024-03-12 | 深圳Tcl新技术有限公司 | 基于场景的图像处理方法、装置、智能终端及存储介质 |
US12094185B2 (en) * | 2021-12-20 | 2024-09-17 | Citrix Systems, Inc. | Video frame analysis for targeted video browsing |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5521841A (en) * | 1994-03-31 | 1996-05-28 | Siemens Corporate Research, Inc. | Browsing contents of a given video sequence |
JPH0993588A (ja) * | 1995-09-28 | 1997-04-04 | Toshiba Corp | 動画像処理方法 |
JP3754791B2 (ja) * | 1997-03-19 | 2006-03-15 | キヤノン株式会社 | 画像検索装置及び方法 |
US6195458B1 (en) * | 1997-07-29 | 2001-02-27 | Eastman Kodak Company | Method for content-based temporal segmentation of video |
JP2000090239A (ja) * | 1998-09-10 | 2000-03-31 | Matsushita Electric Ind Co Ltd | 画像検索装置 |
US6366296B1 (en) * | 1998-09-11 | 2002-04-02 | Xerox Corporation | Media browser using multimodal analysis |
JP2000187731A (ja) * | 1998-12-21 | 2000-07-04 | Ricoh Co Ltd | 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6819797B1 (en) * | 1999-01-29 | 2004-11-16 | International Business Machines Corporation | Method and apparatus for classifying and querying temporal and spatial information in video |
WO2000048397A1 (fr) * | 1999-02-15 | 2000-08-17 | Sony Corporation | Procede de traitement de signal et dispositif de traitement video/audio |
US6774917B1 (en) * | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
US6807306B1 (en) * | 1999-05-28 | 2004-10-19 | Xerox Corporation | Time-constrained keyframe selection method |
US6801294B2 (en) * | 1999-10-19 | 2004-10-05 | Samsung Electronics Co., Ltd. | Recording and/or reproducing apparatus and method using key frame |
JP2001177806A (ja) * | 1999-12-20 | 2001-06-29 | Sony Corp | 情報信号表示方法及び情報信号表示装置 |
JP4253972B2 (ja) * | 1999-12-20 | 2009-04-15 | ソニー株式会社 | 情報信号処理方法及び情報信号処理装置 |
JP2001177788A (ja) * | 1999-12-20 | 2001-06-29 | Sony Corp | 情報信号再生方法及び情報信号再生装置 |
US6636220B1 (en) * | 2000-01-05 | 2003-10-21 | Microsoft Corporation | Video-based rendering |
US6580437B1 (en) * | 2000-06-26 | 2003-06-17 | Siemens Corporate Research, Inc. | System for organizing videos based on closed-caption information |
-
2001
- 2001-09-05 DE DE60140755T patent/DE60140755D1/de not_active Expired - Lifetime
- 2001-09-05 US US10/129,694 patent/US6957387B2/en not_active Expired - Lifetime
- 2001-09-05 WO PCT/EP2001/010255 patent/WO2002021529A1/en active Application Filing
- 2001-09-05 CN CNB018034659A patent/CN100392749C/zh not_active Expired - Fee Related
- 2001-09-05 AT AT01976196T patent/ATE451691T1/de not_active IP Right Cessation
- 2001-09-05 EP EP01976196A patent/EP1319230B1/en not_active Expired - Lifetime
- 2001-09-05 KR KR1020027005913A patent/KR20020059706A/ko active Search and Examination
- 2001-09-05 JP JP2002525659A patent/JP5005154B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP1319230A1 (en) | 2003-06-18 |
CN100392749C (zh) | 2008-06-04 |
CN1394342A (zh) | 2003-01-29 |
US6957387B2 (en) | 2005-10-18 |
EP1319230B1 (en) | 2009-12-09 |
ATE451691T1 (de) | 2009-12-15 |
JP2004508756A (ja) | 2004-03-18 |
WO2002021529A1 (en) | 2002-03-14 |
US20030020743A1 (en) | 2003-01-30 |
KR20020059706A (ko) | 2002-07-13 |
DE60140755D1 (de) | 2010-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5005154B2 (ja) | 記憶媒体上に記憶された情報信号を再生する装置 | |
Yeung et al. | Video browsing using clustering and scene transitions on compressed sequences | |
US8316301B2 (en) | Apparatus, medium, and method segmenting video sequences based on topic | |
US7376274B2 (en) | Method and apparatus for use in video searching | |
KR100915847B1 (ko) | 스트리밍 비디오 북마크들 | |
US6675174B1 (en) | System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams | |
JP3568117B2 (ja) | ビデオ画像の分割、分類、および要約のための方法およびシステム | |
US8442384B2 (en) | Method and apparatus for video digest generation | |
Gunsel et al. | Content-based video abstraction | |
US20030061612A1 (en) | Key frame-based video summary system | |
JP2010246161A (ja) | ビデオデータストリーム内に配置されたコマーシャルを位置決めする装置及び方法 | |
CN101013446A (zh) | 表示图像组的方法和装置 | |
KR100547370B1 (ko) | 객체 형상 정보를 이용한 요약영상 추출 장치 및 그방법과 그를 이용한 동영상 요약 및 색인 시스템 | |
JP4907938B2 (ja) | 少なくとも1つの画像及び画像群を表現する方法、画像又は画像群の表現、画像及び/又は画像群を比較する方法、画像又は画像群を符号化する方法、画像又は画像シーケンスを復号する方法、符号化されたデータの使用、画像又は画像群を表現する装置、画像及び/又は画像群を比較する装置、コンピュータプログラム、システム、及びコンピュータ読み取り可能な記憶媒体 | |
Lee et al. | Automatic video summarizing tool using MPEG-7 descriptors for personal video recorder | |
US7778469B2 (en) | Methods and systems for discriminative keyframe selection | |
KR20050033075A (ko) | 비디오 이미지들의 시퀀스에서 콘텐트 속성을 검출하는 유닛 및 방법 | |
CN1692373B (zh) | 图像识别系统图像识别方法 | |
AT&T | | |
JP3334949B2 (ja) | 画像処理装置及びその方法 | |
Smoliar et al. | Video indexing and retrieval | |
KR100304370B1 (ko) | 억제 색 히스토그램을 이용한 객체의 대표색과 그의 부가정보추출, 색인화 및 검색 방법 | |
Zhang | Video content analysis and retrieval | |
Singh et al. | News Video Indexing and Retrieval System Using Feature-Based Indexing and Inserted-Caption Detection Retrieval | |
Koprinska et al. | Segmentation techniques for video sequences in the domain of MPEG-compressed data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080904 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110714 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111014 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120113 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20120113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120427 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |