JP3473864B2 - ビデオ情報検索方法 - Google Patents
ビデオ情報検索方法Info
- Publication number
- JP3473864B2 JP3473864B2 JP09744194A JP9744194A JP3473864B2 JP 3473864 B2 JP3473864 B2 JP 3473864B2 JP 09744194 A JP09744194 A JP 09744194A JP 9744194 A JP9744194 A JP 9744194A JP 3473864 B2 JP3473864 B2 JP 3473864B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- video information
- information
- image
- structured
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Description
ビデオ情報をインタラクティブに検索する場合のビデオ
情報検索方法に関する。
はネットワークを通じ、情報処理装置(コンピュータ)
を用いて情報の生成、検索、授受等を行いコミュニケー
ションをする。このようなコミュニケーション環境下に
おいて、情報の扱い易さがコミュニケーションの円滑化
に大きく寄与することとなる。特に、氾濫した情報から
利用者の所望の情報を容易に検索することの必要性が生
じる。情報の検索に関してその形態を大きく3つに分類
することができる。検索対象が明確であり、概念的に的
確なキーワード等を用いて表現できる場合のキーワード
検索をハンティングと呼ぶ。また、検索の目的意識無く
試行錯誤的に所望の情報に近づく検索方法をブラウジン
グと呼ぶ。そして、ブラウジング同様検索の目的意識は
なく、むしろあれこれ眺めながら発見的に情報を収集す
るタイプの検索をグレージングと呼ぶ。
の場合、情報は構造化することが技術的に可能であり、
キーワードによるハンティング検索方法が広く用いられ
ている。
索の研究では、情報を仮想空間に三次元的遠近法を用い
て表現し、遠く離れた所から情報を観察すると粗い大ま
かな情報が得られ、近づくにつれて細かく詳しい情報が
得られるようなシステムが報告されている(Jock D.Mac
kinlay,George G.Robertson and Stuart K.Card,ThePer
spective Wall: Detail and Context Smoothly Integra
ted,Proceedings ofCHI'91 Human Factors in Computin
g Systems,pp.173-179,1991、参照)。
は、シーンチェンジを用いブラウジングする方法(大
辻、外村、大庭:「輝度情報を使った動画ブラウジン
グ」、信学技報、IE90-103,1991、参照)やビデオを細
かくアイコンメタファーで一覧表現し検索の容易性を実
現している(外村、安部:「動画像データベースハンド
リングに関する検討」、信学技報、IE89-33,1989、参
照)。
の時間的な位置(場所)を検索者に意識させつつ、所望
のシーンを検索する方法(Magnifier Tool)も報告され
ている(Michael Mills,Jonathan Cohen and Yin Yin W
ong,A Magnifier Tool foe Video Data,Proceedings of
CHI'92 Human Factors in Computing Systems,pp.93-9
8,1992、参照)。
告されている従来の技術または実現されているビデオ情
報の検索方法(ブラウジング、グレージング)では、検
索過程や所望のビデオシーンのビデオ中の時間的な位置
(場所)及びビデオ構造上の位置(場所)を検索者に意
識させつつ、効率よく検索することは不可能である。す
なわち、仮想空間に三次元的遠近法を用い表現する報告
では、ビデオに関して検討させておらず、シーンチェン
ジを用いブラウジングの報告では、検索過程や所望のビ
デオシーンをビデオ中の時間的な位置(場所)及びビデ
オ構造上の位置(場所)を検索者に意識させることは不
可能であり、ビデオを細かくアイコンメタファーで一覧
表現し検索する方法では、同様に検索過程や位置(場
所)を検索者に意識させることは不可能であり、Magnif
ier Toolでは、ビデオの構造を積極的に用いていない。
前述したように、従来報告されている技術は種々の問題
点を抱えている。
されたものであり、本発明の目的は、検索過程を直感的
にしかも効率よく行うことが可能なビデオ情報検索方法
を提供することにある。
規な特徴は、本明細書の記述及び添付図面によって明ら
かにする。
発明のうち代表的なものの概要を簡単に説明すれば、以
下のとおりである。
ム、ショット、シーンを含む階層に構造化された構造化
ビデオ情報を構造化ビデオ情報蓄積・管理部に蓄積して
おき、情報処理装置によって、前記構造化ビデオ情報蓄
積・管理部に蓄積された構造化ビデオ情報を検索するビ
デオ情報検索方法であって、前記構造化ビデオ情報蓄積
・管理部には、前記各階層を代表する画像が蓄積されて
おり、前記情報処理装置が、前記構造化ビデオ情報のあ
る階層の画像iの下位階層の画像jを、2次元平面上で
4角形を形成するように、複数行、複数列の行列状に、
時間順に並べ、各画像jの輝度値あるいは色を変換する
ことにより、画像jを並べた2次元平面全体により前記
画像iを表現することを特徴とする。
ことにより、前記情報処理装置が、画像jの下位階層の
画像kを、2次元平面上で4角形を形成するように、複
数行、複数列の行列状に、時間順に並べ、各画像kの輝
度値あるいは色を変換することにより、画像kを並べた
2次元平面全体により前記画像jを表現することを特徴
とする。
徴を解析し、該解析結果を階層的に構造化し、該ビデオ
情報源の階層構造を可視化し、該可視化ビデオ情報へア
クセスするビデオ情報検索方法において、前記ビデオ情
報解析処理は、ビデオの画像、音声、字幕、タイムコー
ド、外部入力信号を解析し、ビデオ情報の空間的変化特
徴及び時間的変化特徴を抽出し、前記ビデオ構造化処理
は、ビデオの画像、音声、字幕、タイムコード、外部入
力信号を解析し、ビデオ情報の空間的変化特徴及び時間
的変化特徴を抽出した条件による構造条件を基に階層的
に構造化することより、ビデオ情報から所望のビデオま
たはシーンを検索する場合に、検索者と所望情報との位
置関係を検索者に意識させつつビデオ構造の積極的利用
を行うので、検索過程を直感的にしかも効率よく行うこ
とができる。
に説明する。
ピュータ)を用いてビデオ情報検索方法を行う一実施例
の機能構成及びその処理手順を示すブロック機能構成図
であり、101はビデオの特徴(インデスク)がビデオ
に付加されているかどうか判断するビデオ特徴判断部、
102は特徴(インデスク)を抽出してビデオに付加す
るビデオ情報解析処理部、103は階層的に構造化する
階層的構造化処理部、104は構造化条件情報蓄積部、
105は構造化ビデオ情報蓄積・管理部、106は構造
化ビデオ情報(階層構造)に基づいてビデオの可視化を
行う構造化情報可視化処理部、107はビデオ情報アク
セス部である。
示すように、入力されたビデオは、デオ特徴判断部10
1において、ビデオの特徴(インデスク)がビデオ情報
に付加されているかどうかを判断する。もし、付加され
ていないときは、ビデオ情報解析処理部102におい
て、前記ビデオ情報に入力ビデオの特徴(インデスク)
を抽出して付加する。
出される特徴(インデスク)とは、ビデオ情報の物理的
な特徴(輝度、色の変化、被写体の動き等)からビデオ
構造に寄与する意味のある特徴(シーンチェンジ点、カ
メラ操作、ショット、シーン、ストーリー等)が自動ま
たは半自動で抽出され、記述されて入力ビデオに付加さ
れる。例えば、シーンチェンジ検出に関する方法として
大辻他が報告している(K.Otsuji,Y.Tonomura,Projecti
on Detecting Filter for Video Cut Detection,ACM Mu
ltimedia'93 Conference Proceedings,pp.251-257,199
3、参照)。
報告している(阿久津、外村、時空間画像を用いたグロ
ーバルな動き情報の抽出、1992年電子情報通信学会
秋季大会、参照)。
グに関して上田他が報告している(上田他、動画像解析
結果に基ずく映像情報のブラウジング、1994年電子
情報通信学会春季大会、参照)。
または半自動でビデオの特徴をインデクスとしてビデオ
に記述、付加する。
加されたビデオは、階層的構造化処理部103におい
て、階層的に構造化する。ビデオ特徴(インデクス)情
報を用いない単純な階層構造の例を図2に示す。この例
は、ビデオの時間解像度を用いたものを示している。上
層に向かうほど時間解像度が粗くなり(時間サンプリン
グ間隔が大きくなる)、例えば、最上位層では、最下位
層の1000倍速に相当する。
いることにより、単純な時間サンプリングから代表画面
によるサンプリングが可能となる。上位層は下層の代表
画面で構成される。
(インデクス)の物理的な情報を用いた階層を示してい
る。輝度、色の変化、被写体の動き等の物理的な情報を
用い特徴の連続性から順次最上位層の映像を時間的に分
割した例であり、最下位層では、フレーム、画素等のレ
ベルまで分割し、階層的に構造化しているものである。
層の物理的な層から上層の意味的な層をなす階層構造が
存在すると考えられる。この構造は、各層における情報
が図に示した単位(画素、セグメント、フレーム、ショ
ット、シーン、ストーリー)で管理されていると考えら
れる。
すると、最上位層では「タイトル」が次に「代表的なシ
ーン」がそして各「ショット」という具合にビデオは意
味的に階層的に構造化する。
蓄積部104に蓄積されている構造化条件に基づいて階
層的構造化処理部103において構成される。階層的構
造化処理部103において構造化されたビデオは、構造
化ビデオ情報蓄積・管理部105に蓄積され、構造化情
報可視化処理部106の可視化のためのビデオ情報源と
なる。
化ビデオ情報(階層構造)に基づいてビデオの可視化を
行う。この可視化は可視化するための装置に依存すると
ころが大きい。
可視化についての実施例を説明する。ここで、可視化と
は、検索者の興味に応じて可視化されるビデオ情報の形
の変形を伴うものである。検索者の興味は、ビデオ情報
アクセス手順によって構造化情報可視化手順へと入力さ
れる。この入力デバイスとしてマウス、ジョイスッティ
ック、キーボードからデータグローブまで様々対象とな
る。
らの興味の意志として表現する方法には、ビデオ情報に
近づくことを表現する方法が考えられる。すなわち、ビ
デオ情報へズームする方法かまたは、ビデオ情報へ距離
的に近づく方法である。
は、「ビデオ情報へ近づくこと」が「ビデオ情報の詳細
な部分へ近づくこと」であることと同じであるが、距離
的に近づく方法は、遠近法の効果によりビデオ情報との
距離を検索者に意識させることが可能な点で異なる。
性からズームする方法がより一般的であるが、最近の計
算機能力の向上から距離的に近づく方法の実現も可能で
ある。距離的に近づく方法は、検索者とビデオ情報との
位置関係が直感的に意識できること等の有効性から、以
下この距離的に近づく方法を用いた例を示す。検索者の
興味の意識の表現として距離メタファーを用いる。距離
メタファーとは計算機上の仮想空間の距離の概念を導入
に空間内における人と情報との関係を距離で比喩的に用
いることである。
視化されたビデオ情報が存在する。可視化はビデオの構
造情報を用いて行われている。遠くからビデオ情報を検
索した場合、検索者は空間上に存在するビデオのタイト
ルを観察することとなりこの単位で検索することとな
る。興味を示したタイトルと他のタイトルとの関係(空
間的位置関係)を意識しつつ、興味を示したタイトルへ
近づくと、近づくにつれてストーリーを構成するシーン
が観察可能となる。この距離ではシーン単位での検索で
ある。
レーム、セグメント、画素等の細かさでビデオ映像が観
察でき、検索可能である。ビデオ情報として映画を例に
取り、具体的に説明する。映画は、ビデオ情報解析手順
により解析され、ビデオ構造化手順によって図4に示し
たような階層構造をもつ構造に構造化されている。
て、501は映像の一つのショットを時空間画像として
表している。一つの時空間画像501の拡大図を502
に示す。一般の映画には、千数百個のショットが存在す
る。これらのショットを時間順に並べたもの(時間順配
列ショット群)が503である。並べ方はいろいろ考え
られるが、この例の時間順配列ショット群503では向
かって左上から右下へ順次四角形を形成するように並べ
たものである。
者が仮想空間内の遠方から観察した場合、時間順配列シ
ョット群503は、観察画像506として観察できる。
すなわち、この場合、映画のタイトルを観察することに
なる。検索者は遠方より映画のタイトルを観察し、所望
(興味ある)の映画を認識し、より多くの情報を得るた
めに近づく行為を行う。観察画像506に近づくと、観
察画像506は505のように観察できる。505は映
画の代表的なシーン(504)から形成されている。こ
の段階で検索者は、所望の(興味ある)の映画のシーン
を認識することが可能である。
めに505へ近づくと、時間順配列ショット群503が
観察可能となり、ショット単位で観察または検索可能と
なる。これら行為は、映画情報までの距離による関係か
ら得られる情報を変化させているため観察または検索過
程が連続しており、観察者は、映画との距離(情報の多
さ)を意識しつつ検索可能となる。
をより自然に検索者に感じさせるために、空間の遠近法
による表現と、検索者の視覚特性(視距離に応じて空間
分解が異なる)を用いている。タイトルはシーンを用い
て表現し、シーンはショットで表現することで実現して
いる。表現は、シーン、ショットの画像の輝度値、色等
を適宜変換することによって行うことが可能である。
てきたが、音についても前記示した実施例に含まれる。
実施例での音の扱いは、遠くから映画を観察すれば、タ
イトル音(タイトル音楽)が近づくにつれてシーンを代
表する音が、ショットの音がそれぞれ距離移動に対して
連続的に聞こえる。
明したが、本発明は、前記実施例に限定されるものでは
なく、その要旨を逸脱しない範囲において種々変更可能
であることは言うまでもない。
的なものによる効果を簡単に説明すると、以下のとおり
である。
デオまたはシーンを検索する場合に、検索者と所望情報
との位置関係を検索者に意識させつつビデオ構造の積極
的利用を行うので、検索過程を直感的にしかも効率よく
行うことができる。
を用いてビデオ情報検索方法を行う一実施例の機能構成
及びその処理手順を示すブロック機能構成図である。
いない単純な階層構造の例を示す図である。
な情報を用いた階層を示す図である。
図である。
視化(映像インターフェイス)を説明すめための図であ
る。
部、103…階層的構造化処理部、104…構造化条件
情報蓄積部、105…構造化ビデオ情報蓄積・管理部、
106…構造化情報可視化処理部、107…ビデオ情報
アクセス部。
Claims (2)
- 【請求項1】 所定のビデオ情報が、フレーム、ショッ
ト、シーンを含む階層に構造化された構造化ビデオ情報
を構造化ビデオ情報蓄積・管理部に蓄積しておき、 情報処理装置によって、前記構造化ビデオ情報蓄積・管
理部に蓄積された構造化ビデオ情報を検索する ビデオ情
報検索方法であって、前記構造化ビデオ情報蓄積・管理部には、前記各階層を
代表する画像が蓄積されており、 前記情報処理装置が、前記 構造化ビデオ情報のある階層
の画像iの下位階層の画像jを、2次元平面上で4角形
を形成するように、複数行、複数列の行列状に、時間順
に並べ、 各画像jの輝度値あるいは色を変換することにより、画
像jを並べた2次元平面全体により前記画像iを表現す
る ことを特徴とするビデオ情報検索方法。 - 【請求項2】 前記画像jを拡大することにより、前記
情報処理装置が、画像jの下位階層の画像kを、2次元
平面上で4角形を形成するように、複数行、複数列の行
列状に、時間順に並べ、 各画像kの輝度値あるいは色を変換することにより、画
像kを並べた2次元平面全体により前記画像jを表現す
る ことを特徴とする請求項1に記載のビデオ情報検索方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09744194A JP3473864B2 (ja) | 1994-05-11 | 1994-05-11 | ビデオ情報検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09744194A JP3473864B2 (ja) | 1994-05-11 | 1994-05-11 | ビデオ情報検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07306866A JPH07306866A (ja) | 1995-11-21 |
JP3473864B2 true JP3473864B2 (ja) | 2003-12-08 |
Family
ID=14192436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09744194A Expired - Lifetime JP3473864B2 (ja) | 1994-05-11 | 1994-05-11 | ビデオ情報検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3473864B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3614235B2 (ja) * | 1996-03-19 | 2005-01-26 | 富士通株式会社 | 情報探索装置 |
JP3660785B2 (ja) * | 1997-07-28 | 2005-06-15 | 富士通株式会社 | 情報探索装置 |
EP0984367B1 (en) | 1998-09-03 | 2003-05-14 | Ricoh Company, Ltd. | Recording media with video, respectively audio index information, information management and retrieval methods for video, respectively audio information and a video retrieval system |
JP2001160066A (ja) | 1998-12-25 | 2001-06-12 | Matsushita Electric Ind Co Ltd | データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム |
US7134074B2 (en) | 1998-12-25 | 2006-11-07 | Matsushita Electric Industrial Co., Ltd. | Data processing method and storage medium, and program for causing computer to execute the data processing method |
US6625389B1 (en) * | 1999-09-30 | 2003-09-23 | Koninklijke Philips Electronics N.V. | Video tape hierarchical indexing system |
JP2001306579A (ja) * | 2000-04-25 | 2001-11-02 | Mitsubishi Electric Corp | 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0530464A (ja) * | 1991-07-19 | 1993-02-05 | Toshiba Corp | 動画像管理装置 |
JPH05282379A (ja) * | 1992-02-06 | 1993-10-29 | Internatl Business Mach Corp <Ibm> | 動画像の管理方法及び管理装置 |
JPH05268517A (ja) * | 1992-03-18 | 1993-10-15 | Hitachi Ltd | 動画像編集システムの表示方法 |
-
1994
- 1994-05-11 JP JP09744194A patent/JP3473864B2/ja not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
上田博唯、他3名,動画像解析に基づくビデオ構造の視覚化とその応用,電子情報通信学会論文誌J76−D−II,1993年 8月25日,第J76−D−II巻,第8号,p.1572−1580 |
月刊アスキー1991年3月号,1991年 3月 1日,第15巻,第3号,p.236−237 |
Also Published As
Publication number | Publication date |
---|---|
JPH07306866A (ja) | 1995-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Smoliar et al. | Content based video indexing and retrieval | |
Zhu et al. | InsightVideo: toward hierarchical video content organization for efficient browsing, summarization and retrieval | |
Zaiane et al. | Mining multimedia data. | |
Zhu et al. | Video data mining: Semantic indexing and event detection from the association perspective | |
US8010903B2 (en) | System and method for visualizing and navigating dynamic content in a graphical user interface | |
Zhang et al. | Developing power tools for video indexing and retrieval | |
Smith et al. | Video skimming and characterization through the combination of image and language understanding techniques | |
US7421455B2 (en) | Video search and services | |
US8027512B2 (en) | Method and software program for searching image information | |
Fan et al. | MultiView: Multilevel video content representation and retrieval a1 | |
EP3627354A1 (en) | Information processing system, method for controlling information processing system, and storage medium | |
Sabbar et al. | Video summarization using shot segmentation and local motion estimation | |
JP5768265B2 (ja) | 類似画像検索システム | |
JP3473864B2 (ja) | ビデオ情報検索方法 | |
Chiang et al. | Quick browsing and retrieval for surveillance videos | |
Höferlin et al. | Interactive schematic summaries for exploration of surveillance video | |
Rui et al. | A unified framework for video browsing and retrieval | |
Lu et al. | A novel video summarization framework for document preparation and archival applications | |
Hampapur et al. | Feature based digital video indexing | |
Rasheed et al. | Video categorization using semantics and semiotics | |
Rui et al. | Efficient access to video content in a unified framework | |
Şaykol et al. | Keyframe labeling technique for surveillance event classification | |
Zhang | Content-based video analysis, retrieval and browsing | |
Guler et al. | A video event detection and mining framework | |
Al Aghbari | cTraj: efficient indexing and searching of sequences containing multiple moving objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080919 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080919 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090919 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090919 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100919 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100919 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130919 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |