JP2004260711A - Method for creating video search database and recording medium - Google Patents
Method for creating video search database and recording medium Download PDFInfo
- Publication number
- JP2004260711A JP2004260711A JP2003051284A JP2003051284A JP2004260711A JP 2004260711 A JP2004260711 A JP 2004260711A JP 2003051284 A JP2003051284 A JP 2003051284A JP 2003051284 A JP2003051284 A JP 2003051284A JP 2004260711 A JP2004260711 A JP 2004260711A
- Authority
- JP
- Japan
- Prior art keywords
- text
- video
- search
- data
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、語学教材製作に関するもので、特に、画像ブラウザ検索及びテキスト索引表を備える語学教材のインタラクティブビデオに関するものである。
【0002】
【従来の技術】
国際化の趨勢下、様々な英語自己学習教材が発売され、中でも、インタラクティブ性が特に重視されている。しかし、語学教材は製作が難しく、かかる人力もコストも膨大で、又、消費者にとって、現在市販されているインタラクティブ式の画像語学教材は素材も限界があり、価格も高く、内容面から言っても、効果的に、しかも飽きずに学習を継続することが出来ない。
【0003】
【発明が解決しようとする課題】
本発明は外国語ビデオをインタラクティブな語学教材ビデオに転換する、ビデオ検索データベースを作成する方法を提供することを目的とする。
【0004】
【課題を解決するための手段】
上述の目的を達成するため、本発明はビデオ検索データベースを作成する方法を提供し、先ず、字幕が付いた画像データを複数のショットに分割する。複数のショット中のビデオに従って、複数のキーフレームを抽出する。複数のキーフレームにより、画像ブラウザ検索を設定する。続いて、画像データ中の画像特徴に従って、テキスト領域をとらえる。テキスト領域に対してテキストの分割を行い、複数のテキスト特徴を生成する。複数のテキスト特徴とデータベース中のテキストとを比較し、テキストデータを生成する。テキストデータにより、テキスト索引表を設定する。最後に、画像ブラウザ検索とテキスト索引表により、ビデオ検索データベースを作成する。
【0005】
【発明の実施の形態】
上述した本発明の目的、特徴、及び長所をいっそう明瞭にするため、以下に本発明の好ましい実施の形態を挙げ、図を参照にしながらさらに詳しく説明する。
【0006】
図1は、本発明の実施例による、ビデオ検索データベースを作成する方法のフローチャートであり、操作工程は以下の通りである。
【0007】
先ず、工程S10において、例えば、中国語字幕や英語字幕を含む外国語ビデオを分析し、工程S12において、コンピューターシステムにより、自動的、且つ快速にショット検出を行い、ショット切り換えタイミングに従って、ビデオファイルを複数のショットに分割する。
【0008】
工程S14において、各ショット中、フレームの画面変化に基づいて、複数のキーフレームをとらえる。キーフレームは一ショットを代表する。工程S16において、画像ブラウザ検索を設定し、一時間ちょっとのビデオは数千のショットを含み、キーフレームは一ショットを代表することにより、複数のキーフレームを用いて、速やかに画像ブラウザ検索の設定を完成することが出来、ユーザーはこのキーフレームの時間位置及び内容により、速やかに閲覧したいビデオ個所を探し出すことが出来る。
【0009】
工程S22において、画像データ中のビデオに対し強化を施し、即ち、ビデオ中のエッジを強化し、続いて、エッジ検出により、テキスト領域をとらえる。ビデオ中のイメージ部分のエッジは大きな弧度を備え、不規則で、ビデオ中の字幕部分のエッジは直線が多いため、この画像特徴に従って、画像中のテキスト領域をとらえる。
【0010】
工程S24において、テキスト領域はテキストの分割が行われ、テキスト領域を検出し、テキストの長さ、広さ、高さ、線の密度、構造に従って、テキスト領域中のテキストを複数のテキスト領域に分割し、ニ値化を用いて、それぞれのテキスト領域中の色を白黒の2色に分ける。一般のビデオ中のテキストは、大部分が複雑な画面上にあるため、複雑な背景を除去、つまりそれぞれのテキスト領域を白地に黒文字に転換して、テキストと背景を分け、テキスト特徴を生成する。
【0011】
工程S26において、それぞれのテキスト特徴とテキスト特徴データベース中のテキストを比較して、テキスト識別を実行し、類似のテキストを探し、テキストデータを作成する。
【0012】
工程S28において、テキストデータとビデオの対応関係を用いて、テキスト索引表を設定し、再生したいビデオ個所を探す。
【0013】
工程S32において、テキストデータにより、辞書データベースを作成する。
【0014】
工程S30において、画像ブラウザ検索とテキスト索引表を保存し、ビデオ検索データベースを作成する。
【0015】
図2は本発明の実施例による、ビデオ検索データベースを示す図で、検索データベース40中の画像ブラウザ検索50により、ユーザーは画像ブラウザ検索中の任意のキーフレームを選択し、このキーフレームがあるビデオ個所を再生すると同時に、検索データベース40中のテキスト索引表60を用いて、テキスト索引表60中の任意の検索フィールドを選択し、検索フィールドと対応するビデオ個所を再生することが出来る。この他、ユーザーはキーボード入力字幕個所を検索データとし、再生したいビデオを探すことが出来る。
【0016】
また、ビデオを再生する時、辞書データベース機能を実行し、スクリーン画面を2つのウィンドウに分割し、ビデオを再生するのに用いられるビデオ再生区75中のツールバー67により、ビデオの一時停止、再生、早送り、巻き戻しの機能を操作することが出来る。
【0017】
この他、字幕マスク65により、ビデオ中のテキスト領域を遮蔽、即ちビデオ中の字幕を遮蔽し、字幕マスク65を切り換え及び制御する機能により、字幕の遮蔽、或いは表示が選択できる。字幕ディスプレイ80となるもう一つのウィンドウでビデオ中の字幕を表示し、字幕ディスプレイ80中のテキストは、ビデオ中の字幕を分析して得られるテキストデータで、字幕ディスプレイ80中のテキストデータを選択し、辞書データベース70により、テキスト意義、語彙性質、熟語などを備えるテキストの注解を表示し、画像ディスプレイ85で、字幕ディスプレイ80中のテキストに対応するショットを表示する。
【0018】
本発明が提供するビデオ検索データベースを作成する方法により、ユーザーは効果的に外国語ビデオをインタラクティブな語学教材に転換することが出来、ビデオ中の字幕に基づいて、索引データを作成し、ユーザーに最良のビデオブラウザ制御方法及び便利な語学教材道具を提供する。
【0019】
本発明では好ましい実施例を前述の通り開示したが、これらは決して本発明に限定するものではなく、当該技術を熟知する者なら誰でも、本発明の精神と領域を脱しない範囲内で各種の変動や潤色を加えることができ、従って本発明の保護範囲は、特許請求の範囲で指定した内容を基準とする。
【0020】
【発明の効果】
インタラクティブな語学ビデオ教材が得られる。
【図面の簡単な説明】
【図1】本発明の実施例によるビデオ検索データベースを作成する方法を示すフローチャートである。
【図2】本発明の実施例によるビデオ検索データベースを示す図である。
【符号の説明】
40 検索データベース
50 画像ブラウザ検索
60 テキスト索引表
65 字幕マスク
67 ツールバー
70 辞書データベース
75 ビデオ再生区
80 字幕ディスプレイ
85 画像ディスプレイ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to the production of language teaching materials, and more particularly, to an interactive video of language teaching materials with an image browser search and a text index table.
[0002]
[Prior art]
Under the trend of internationalization, various self-learning materials for English have been released, and interactivity has been particularly emphasized. However, it is difficult to produce language teaching materials, the manpower and cost are huge, and for consumers, the interactive image language teaching materials currently on the market have limited materials, are expensive, and in terms of content, However, learning cannot be continued effectively and without getting tired.
[0003]
[Problems to be solved by the invention]
An object of the present invention is to provide a method for creating a video search database that converts foreign language videos into interactive language teaching videos.
[0004]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a method for creating a video search database, first dividing subtitled image data into a plurality of shots. Extract multiple keyframes according to the video in multiple shots. Set image browser search with multiple keyframes. Subsequently, a text area is captured according to the image feature in the image data. Split text into text regions to generate multiple text features. A plurality of text features are compared with text in a database to generate text data. A text index table is set according to the text data. Finally, a video search database is created using an image browser search and a text index table.
[0005]
BEST MODE FOR CARRYING OUT THE INVENTION
In order to further clarify the objects, features and advantages of the present invention described above, preferred embodiments of the present invention will be described below with reference to the accompanying drawings.
[0006]
FIG. 1 is a flowchart of a method for creating a video search database according to an embodiment of the present invention, and the operation steps are as follows.
[0007]
First, in step S10, for example, foreign language videos including Chinese subtitles and English subtitles are analyzed. In step S12, shot detection is performed automatically and quickly by a computer system, and the video file is converted according to the shot switching timing. Divide into multiple shots.
[0008]
In step S14, a plurality of key frames are captured during each shot based on a change in the screen of the frame. Keyframes represent one shot. In step S16, an image browser search is set up, and a video for one hour contains thousands of shots, and a key frame is representative of one shot. Can be completed, and the user can quickly find a video location to be viewed based on the time position and the content of the key frame.
[0009]
In step S22, the video in the image data is enhanced, that is, edges in the video are enhanced, and subsequently, a text region is captured by edge detection. The edges of the image portion in the video have a large radius and are irregular, and the edges of the subtitle portion in the video have many straight lines. Therefore, the text region in the image is captured according to this image feature.
[0010]
In step S24, the text area is subjected to text segmentation, the text area is detected, and the text in the text area is divided into a plurality of text areas according to the text length, width, height, line density, and structure. Then, the color in each text area is divided into two colors of black and white using binarization. Most of the text in general video is on a complicated screen, so remove the complex background, that is, convert each text area to black on a white background, separate the text from the background, and generate text features .
[0011]
In step S26, each text feature is compared with the text in the text feature database to perform text identification, search for similar text, and create text data.
[0012]
In step S28, a text index table is set using the correspondence between the text data and the video, and a video portion to be reproduced is searched.
[0013]
In step S32, a dictionary database is created from the text data.
[0014]
In step S30, the image browser search and the text index table are saved, and a video search database is created.
[0015]
FIG. 2 is a diagram showing a video search database according to an embodiment of the present invention. In the
[0016]
Also, when playing a video, the dictionary database function is executed, the screen screen is divided into two windows, and a video is paused, played, and played by a
[0017]
In addition, the
[0018]
The method of creating a video search database provided by the present invention allows users to effectively convert foreign language videos into interactive language teaching materials, create index data based on subtitles in the videos, and provide users with index data. Provide the best video browser control method and convenient language teaching tool.
[0019]
Although preferred embodiments of the present invention have been disclosed as described above, they are not intended to limit the present invention in any way, and any person skilled in the art may make various modifications without departing from the spirit and scope of the present invention. Variations and hydrations can be added, and the protection scope of the present invention is based on the contents specified in the claims.
[0020]
【The invention's effect】
Get interactive language video teaching materials.
[Brief description of the drawings]
FIG. 1 is a flowchart illustrating a method for creating a video search database according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a video search database according to an embodiment of the present invention.
[Explanation of symbols]
40
Claims (16)
前記複数のショット中のビデオの変化に従って、複数のキーフレームを抽出する工程と、
前記複数のキーフレームを用いて、画像ブラウザ検索を設定する工程と、
前記画像データ中の画像特徴に従って、テキスト領域をとらえる工程と、
前記テキスト領域に対し、テキスト分割を施し、複数のテキスト特徴を生成する工程と、
前記複数のテキスト特徴とデータベース中のテキストとを比較して、テキストデータを作成する工程と、
前記テキストデータを用いて、テキスト索引表を設定する工程と、
前記画像ブラウザ検索と前記テキスト索引表を用いて、ビデオ検索データベースを作成する工程と、
からなることを特徴とするビデオ検索データベース作成方法。Dividing image data with subtitles into a plurality of shots;
Extracting a plurality of keyframes according to a change in video during the plurality of shots;
Setting an image browser search using the plurality of key frames;
Capturing a text area according to the image features in the image data;
Subjecting the text region to text segmentation to generate a plurality of text features;
Comparing the plurality of text features and text in a database to create text data;
Setting a text index table using the text data;
Creating a video search database using the image browser search and the text index table;
A method for creating a video search database, comprising:
字幕を備える画像データを、複数のショットに分割する工程と、
前記複数のショット中のビデオの変化に従って、複数のキーフレームを抽出する工程と、
前記複数のキーフレームを用いて、画像ブラウザ検索を設定する工程と、
前記画像データ中の画像特徴に従って、テキスト領域をとらえる工程と、
前記テキスト領域に対し、テキスト分割を施し、複数のテキスト特徴を生成する工程と、
前記複数のテキスト特徴とデータベース中のテキストとを比較して、テキストデータを作成する工程と、
前記テキストデータを用いて、テキスト索引表を設定する工程と、
前記画像ブラウザ検索と前記テキスト索引表を用いて、ビデオ検索データベースを作成する工程と、
からなることを特徴とする記録媒体。A recording medium for recording a program that causes a computer to execute a method of creating a video search database,
Dividing image data with subtitles into a plurality of shots;
Extracting a plurality of keyframes according to a change in video during the plurality of shots;
Setting an image browser search using the plurality of key frames;
Capturing a text area according to the image features in the image data;
Subjecting the text region to text segmentation to generate a plurality of text features;
Comparing the plurality of text features and text in a database to create text data;
Setting a text index table using the text data;
Creating a video search database using the image browser search and the text index table;
A recording medium comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003051284A JP2004260711A (en) | 2003-02-27 | 2003-02-27 | Method for creating video search database and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003051284A JP2004260711A (en) | 2003-02-27 | 2003-02-27 | Method for creating video search database and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004260711A true JP2004260711A (en) | 2004-09-16 |
Family
ID=33116465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003051284A Pending JP2004260711A (en) | 2003-02-27 | 2003-02-27 | Method for creating video search database and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004260711A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2447458A (en) * | 2007-03-13 | 2008-09-17 | Green Cathedral Plc | Method of identifying, searching and displaying video assets |
JP4482051B1 (en) * | 2008-12-23 | 2010-06-16 | 株式会社東芝 | Device control system |
JP2013518292A (en) * | 2010-01-25 | 2013-05-20 | ローカス パブリッシング カンパニー | Interactive information system, interactive information method and computer-readable medium thereof |
-
2003
- 2003-02-27 JP JP2003051284A patent/JP2004260711A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2447458A (en) * | 2007-03-13 | 2008-09-17 | Green Cathedral Plc | Method of identifying, searching and displaying video assets |
JP4482051B1 (en) * | 2008-12-23 | 2010-06-16 | 株式会社東芝 | Device control system |
JP2010153940A (en) * | 2008-12-23 | 2010-07-08 | Toshiba Corp | Apparatus control system |
US7962004B2 (en) | 2008-12-23 | 2011-06-14 | Kabushiki Kaisha Toshiba | Video reproducing apparatus |
JP2013518292A (en) * | 2010-01-25 | 2013-05-20 | ローカス パブリッシング カンパニー | Interactive information system, interactive information method and computer-readable medium thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102028198B1 (en) | Device for authoring video scene and metadata | |
US8935169B2 (en) | Electronic apparatus and display process | |
US7173671B2 (en) | Selectively overlaying a user interface atop a video signal | |
CN110287949B (en) | Video clip extraction method, device, equipment and storage medium | |
US9881215B2 (en) | Apparatus and method for identifying a still image contained in moving image contents | |
US8971633B2 (en) | Content retrieval to facilitate recognizing content details of a moving image | |
CN101553814B (en) | Method and apparatus for generating a summary of a video data stream | |
CN101790049A (en) | Newscast video segmentation method and system | |
US20080095442A1 (en) | Detection and Modification of Text in a Image | |
JPH07192003A (en) | Device and method for retrieving animation picture | |
JP2008148121A (en) | Motion picture summary automatic generation apparatus and method, and computer program | |
JP2009157460A (en) | Information presentation device and method | |
CN113435438A (en) | Video screen board extraction and video segmentation method for image and subtitle fusion | |
JP5330551B2 (en) | Electronic device and display processing method | |
CN113747258B (en) | Online course video abstract generation system and method | |
JP2004260711A (en) | Method for creating video search database and recording medium | |
JP2010109852A (en) | Video indexing method, video recording and playback device, and video playback device | |
JP4625862B2 (en) | Authoring apparatus and authoring method | |
KR20080084303A (en) | Technology which is storing easily, quickly and accurately only wanted part from the movie and audio files | |
CN1430166A (en) | Method of establishig film index database and recording medium | |
JP4839076B2 (en) | Video character recognition device, video character recognition method, program, and recording medium | |
JP4456573B2 (en) | Video extraction apparatus and video extraction program | |
Denoue et al. | Video text retouch: retouching text in videos with direct manipulation | |
Breidegard | Computer-based automatic finger-and speech-tracking system | |
CN116932816A (en) | Video processing method, video processing device, computer readable medium and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050719 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20051220 |