JP2006215681A - Document detail determination support system - Google Patents
Document detail determination support system Download PDFInfo
- Publication number
- JP2006215681A JP2006215681A JP2005025911A JP2005025911A JP2006215681A JP 2006215681 A JP2006215681 A JP 2006215681A JP 2005025911 A JP2005025911 A JP 2005025911A JP 2005025911 A JP2005025911 A JP 2005025911A JP 2006215681 A JP2006215681 A JP 2006215681A
- Authority
- JP
- Japan
- Prior art keywords
- document
- data
- illustration
- computer
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Editing Of Facsimile Originals (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
本発明は、文書内容の把握を支援するための文書内容把握支援システムに関するものである。 The present invention relates to a document content grasping support system for supporting grasping of document contents.
文書内容の把握を支援する技術は、例えば特許文献1や特許文献2が開示している。特許文献1は、新聞や雑誌、論文、書籍などの文書の情報をディスプレイに表示する装置を開示する。この装置は、文書に含まれる文章や図形のデータをディスプレイの表示領域の中でレイアウトする。そのレイアウトのために、文章や図形のような文書のデータは複数のブロックに分配される。文章のデータは分割して複数のブロックに配分することができる。これらのブロックは、各ブロックに対応する情報の重要度に従って、与えられた矩形領域の列に配置される。重要度の高いブロックは優先して配置し、重要度の低いブロックであまったところを埋める。このようにして定めたレイアウトでディスプレイに文書の情報を表示することにより、この装置はユーザが文書情報を把握するのを容易にする。
For example,
特許文献2は情報検索処理方法を記載している。この方法では、公開特許公報のデータのように文字コードとイメージとを含むデータを対象として情報を検索する。検索した情報の文字コードとイメージとを同一画面上に表示し、文字コードに対応する画面上の文字をユーザが指定すると、その文字で特定されるイメージを同一画面上に切り換え表示する。これにより、検索した情報に含まれる文字と図とを対照する手間を省き、文章内容の把握を容易にしている。
このように従来の技術では、文章の重要な部分の文書全体における位置やイメージを手がかりとして、文章の内容を容易に推測することができる。しかしながら、文章の重要な部分が記述している事項や、図示されていない事項は、ユーザ自身が文章を読解して把握しなければならない。読解の難しい文章が含まれていたり、文章が長かったりすると、その読解は困難になり、文書の内容を把握するのに手間取ることになる。 As described above, according to the conventional technique, the contents of a sentence can be easily estimated based on the position and image of the important part of the sentence in the entire document. However, the user himself / herself has to understand the matter that is described in the important part of the sentence and the matter that is not illustrated by reading the sentence. If a sentence that is difficult to read is included or a sentence is long, it becomes difficult to read, and it takes time to grasp the contents of the document.
この問題は、内容を把握すべき文書の量が増えるとさらに重大になる。例えばコンピュータシステムで文書の情報を検索するときに、適当な検索条件を指定できなければ、検索結果に大量の文書が含まれてしまう。その中から必要な文書を選別するには、多数の文書の内容を把握しなければならない。一つの文書の内容を把握するのに手間取ると、選別作業を終えるのに膨大な時間が必要となる。選別作業を短時間で終えようとして文書の内容を十分に把握しなければ、重要な情報を見逃してしまう危険性が高くなる。 This problem becomes more serious as the amount of documents whose contents need to be understood increases. For example, when searching for document information in a computer system, if appropriate search conditions cannot be specified, a large amount of documents will be included in the search results. In order to select necessary documents from the list, it is necessary to grasp the contents of a large number of documents. If it takes time to grasp the contents of one document, a huge amount of time is required to finish the sorting operation. If the content of the document is not fully understood in order to finish the sorting operation in a short time, there is a high risk of missing important information.
本発明は、このような従来の技術における課題を鑑みてなされたものであり、文書の内容を簡単かつ迅速に把握することのできる文書内容把握支援システム、検索システム、ファイル管理システム、文書内容把握支援方法および文書内容把握支援プログラムを提供することを目的とするものである。 The present invention has been made in view of such problems in the conventional technology, and is a document content grasping support system, a search system, a file management system, and a document content grasping that can easily and quickly grasp the contents of a document. The object is to provide a support method and a document content grasp support program.
この目的を達成するために、本発明の文書内容把握支援システムでは、文書のデータから、その文書に含まれるワードを複数抽出する。画像データベースは、画像のデータを蓄積する。テーブルは、ワードと画像とを関連付ける。画像検索部は、抽出した複数のワードにそれぞれ対応する画像をそのテーブルから検索する。画像データ取得部は、検索した画像のデータを画像データベースから取得する。イラスト作成部は、取得した画像データを用いて、その文書のイラストを作成する。イラスト出力部は、作成したイラストを作成する。 In order to achieve this object, the document content grasping support system of the present invention extracts a plurality of words contained in the document from the document data. The image database stores image data. The table associates words with images. The image search unit searches the table for images corresponding to the extracted words. The image data acquisition unit acquires the searched image data from the image database. The illustration creation unit creates an illustration of the document using the acquired image data. The illustration output unit creates the created illustration.
この文書内容把握支援システムにおいて、文書中での出現頻度に従ってワードを抽出するようにしてもよい。 In this document content grasp support system, words may be extracted according to the appearance frequency in the document.
またこのシステムにレイアウト決定部をさらに備えるようにしてもよい。レイアウト決定部は、取得した画像データのレイアウトを決定する。イラスト作成部は、その決定に従って、取得した画像データのレイアウトをする。 The system may further include a layout determining unit. The layout determining unit determines the layout of the acquired image data. The illustration creation unit lays out the acquired image data according to the determination.
またテーブルが、ワードとそのワードの属するグループとを関連付けるようにしてもよい。イラスト作成部は、抽出したワードのグループ毎にイラストを作成する。 The table may associate a word with a group to which the word belongs. The illustration creation unit creates an illustration for each group of extracted words.
さらにイラスト作成部は、抽出したワードのグループ毎の出現頻度に従って、イラスト間のサイズの関係を決定するようにしてもよい。 Furthermore, the illustration creation unit may determine the size relationship between illustrations according to the appearance frequency of each extracted word group.
また文書内容把握支援システムにおいて、文書の一部または全部に対象部を設定するようにしてもよい。この場合、システムは、設定した対象部のデータから、その対象部に含まれるワードを複数抽出する。 In the document content grasping support system, the target part may be set for a part or all of the document. In this case, the system extracts a plurality of words included in the target part from the set data of the target part.
さらに文書の表示領域を特定し、特定した表示領域に対象部を設定するようにしてもよい。 Further, the document display area may be specified, and the target portion may be set in the specified display area.
さらに表示した文書のデータがページを示すデータを含む場合に、表示するページの変更を検出し、その結果に基づいて表示領域を特定するようにしてもよい。 Furthermore, when the data of the displayed document includes data indicating a page, a change in the page to be displayed may be detected, and the display area may be specified based on the result.
また他の観点によれば、本発明は検索システムを提供する。この検索システムにおいて、文書データベースは、文書のデータを蓄積する。文書検索部は、指定した条件に従って、蓄積された文書のデータを検索する。検索した文書のデータに基づいて、その文書に含まれるワードが複数抽出される。画像検索部は、抽出した複数のワードにそれぞれ対応する画像をテーブルから検索する。画像データ取得部は、検索した画像のデータを画像データベースから取得する。イラスト作成部は、取得した画像データを用いて、その文書のイラストを作成する。文書一覧出力部は、検索した文書毎に作成したイラストを用いて、検索した文書の一覧を出力する。 According to another aspect, the present invention provides a search system. In this search system, the document database stores document data. The document search unit searches the stored document data according to the specified conditions. A plurality of words included in the document are extracted based on the retrieved document data. The image search unit searches the table for images corresponding to the extracted words. The image data acquisition unit acquires the searched image data from the image database. The illustration creation unit creates an illustration of the document using the acquired image data. The document list output unit outputs a list of searched documents using illustrations created for each searched document.
この検索システムにおいて、文書の検索条件が文書のデータに含まれるワードを指定する場合に、その指定されたワードにも基づいて、抽出するワードを選択するようにしてもよい。 In this search system, when a search condition for a document specifies a word included in the document data, the word to be extracted may be selected based on the specified word.
さらに他の観点によれば、本発明はファイル管理システムを提供する。ファイル管理部は、ファイルの格納場所を階層的に管理する。ファイル特定部は、選択した場所に格納されたファイルから、文書のデータを含むファイルを特定する。特定したファイルの文書のデータに基づいて、その文書に含まれるワードが複数抽出される。画像検索部は、抽出した複数のワードにそれぞれ対応する画像をテーブルから検索する。画像データ取得部は、検索した画像のデータを画像データベースから取得する。イラスト作成部は、取得した画像データを用いて、文書のイラストを作成する。ファイル一覧出力部は、特定したファイル毎に作成したイラストを用いて、選択した場所に格納されたファイルの一覧を出力する。 According to yet another aspect, the present invention provides a file management system. The file management unit hierarchically manages file storage locations. The file specifying unit specifies a file including document data from the files stored in the selected location. Based on the document data of the specified file, a plurality of words included in the document are extracted. The image search unit searches the table for images corresponding to the extracted words. The image data acquisition unit acquires the searched image data from the image database. The illustration creation unit creates an illustration of the document using the acquired image data. The file list output unit outputs a list of files stored in the selected location using an illustration created for each identified file.
さらに他の観点によれば、本発明は、コンピュータを用いて、文書の内容の把握を支援する方法を提供する。この方法では、文書のデータから、その文書に含まれるワードをコンピュータが複数抽出する。コンピュータは、ワードと画像とを関連付けるテーブルから、抽出した複数のワードにそれぞれ対応する画像を検索し、画像のデータを蓄積する画像データベースから、検索した画像のデータを取得する。コンピュータは、取得した画像データを用いて、その文書のイラストを作成し、作成したイラストを出力する。 According to still another aspect, the present invention provides a method for supporting grasping of the contents of a document using a computer. In this method, the computer extracts a plurality of words included in the document from the document data. The computer retrieves images corresponding to the extracted plurality of words from a table associating words and images, and acquires retrieved image data from an image database that stores image data. The computer creates an illustration of the document using the acquired image data, and outputs the created illustration.
さらに他の観点によれば、本発明は、このような文書内容把握支援方法の手順をコンピュータに実行させるためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供する。 According to still another aspect, the present invention provides a program for causing a computer to execute the procedure of the document content grasping support method, and a computer-readable recording medium recording the program.
上述の構成を採用することにより、本発明では、文書の内容を簡単かつ迅速に把握することができる。 By adopting the above-described configuration, the present invention can easily and quickly grasp the contents of a document.
以下、添付図面を参照して本発明の実施の形態について詳細に説明する。この実施の形態では、コンピュータを用いた電子書籍の閲覧システムとして本発明を具体化している。図1はこの閲覧システムに利用するコンピュータのハードウェア構成を示す。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In this embodiment, the present invention is embodied as an electronic book browsing system using a computer. FIG. 1 shows a hardware configuration of a computer used in this browsing system.
この閲覧システムには、汎用のコンピュータを利用することができる。コンピュータ101は、CPU(Central Processing Unit)102やバス103を備えている。CPU102はバス103を通じてROM(Read Only Memory)104やRAM(Random Access Memory)105と接続される。ROM104に記憶されたプログラムの指令に従ってコンピュータ101が起動すると、CPU102はRAM105上でOS(Operating System)106の一部または全部を動作させる。
A general-purpose computer can be used for this browsing system. The
バス103にはビデオインターフェイス107やUSB(Universal Serial Bus)インターフェイス108も接続されている。ビデオインターフェイス107はCPU102の制御にしたがって、画像をディスプレイ109に表示する。ディスプレイ109としてCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)を用いることができる。USBインターフェイス108は周辺機器をコンピュータ101本体に接続するのに用いることができる。ここでは、入力装置110をコンピュータ101に接続している。入力装置110としてはキーボードに加えて、マウスやトラックボールのようなポインティングデバイスを用いることができる。
A
さらにバス103には、HDD(Hard Disk Drive)111も接続されている。このHDD111には、アプリケーションプログラム112のファイルやその他のファイルが格納される。アプリケーションプログラム112は、ここでは電子書籍の閲覧のためのプログラムである。ユーザが入力装置110でアプリケーションプログラム112の利用を指示すると、CPU102はOS106の指令に従ってHDD111からアプリケーションプログラム112のファイルを読み出し、RAM105上でそのアプリケーションプログラム112を動作させる。
Further, an HDD (Hard Disk Drive) 111 is also connected to the
アプリケーションプログラム112の指令に従ってコンピュータ101が動作することにより、コンピュータ101は図2に示すようにユーザインターフェイス部201や文書データ取得部202、データ解析部203を備える。
When the
ユーザインターフェイス部201は、ユーザが入力装置110を用いて指示を与えたりディスプレイ109で電子書籍を閲覧したりするためのGUI(Graphical User Interface)を提供する。
The
文書データ取得部202は、ユーザインターフェイス部201を通じて受けたユーザからの指示に従って、例えばHDD111に記憶された電子書籍のデータ113のファイルを取得する。ここでは、電子書籍のデータ113は書籍のページを表すデータや、ページに記述されたテキストのデータを含む。
The document
データ解析部203は、取得した電子書籍のデータ113を解析し、その結果に従って表示データを作成する。ユーザインターフェイス部201はその表示データを用いて、ユーザから指定された電子書籍の閲覧画面をディスプレイ109に表示する。図3はその閲覧画面の一例を示す。
The
閲覧画面301では、開いた書物のように、電子書籍の連続する2ページ302Lおよび302Rのデータを左右に並べて表示する。次の2ページのデータを表示するとき、ユーザはボタン303を入力装置110で操作し、前の2ページのデータを表示するときはボタン304を操作する。ユーザはその操作をすることにより、書物のページをめくるときのように、電子書籍の文章を読み進んだり読み返したりすることができる。
On the
HDD111は、このようなアプリケーションプログラム112や電子書籍のデータ113のファイルのほか、文章内容把握支援プログラム114のファイルも格納している。
In addition to the
この実施の形態において文章内容把握支援プログラム114は、アプリケーションプログラム112と連携して、電子書籍の内容をユーザが把握するのを支援する。このプログラム114の指令に従って、コンピュータ101は図4に示すような手順401乃至405を実行する。またプログラム114の指令に従って動作することでコンピュータ101は、図2に示すように、キーワード抽出部204、画像データベース205、画像管理テーブル206、画像検索部207、画像データ取得部208、イラスト作成部209、およびイラスト出力部210をさらに備える。
In this embodiment, the text content
キーワード抽出部204は、文書のデータから、その文書に含まれるワードを複数抽出する。ここでは文書のデータは、閲覧画面301で表示されている電子書籍の文章のデータ113である。プログラム114の指令に従ってCPU102は、その文書のキーワードを複数抽出する。例えば文章に含まれる名詞からキーワードを抽出する(手順401)。文章に含まれる名詞を抽出するため、既に知られた自然言語処理アルゴリズムを利用することができる。日本語の文章であれば形態素解析により文章を単語に分解し、係り受け構造などを構文解析により特定することが可能である。その結果を利用して、文章に含まれる名詞を抽出し、そのうちから、重要と推定される名詞をキーワードとして利用する。図5はキーワードを抽出する手順の一例を示す。
The
CPU102は電子書籍の文章のデータからその文章に含まれる名詞のデータを抽出すると(手順501)、抽出した全部または一部の名詞毎に、その文章におけるその名詞の出現頻度を計算する(手順502)。そしてこの出現頻度に従ってキーワードを抽出する(手順503)。例えば出現頻度の高さが最上位から10番目までの名詞をキーワードとして抽出する。抽出するキーワードの個数は一定であってもよいし、文章の長さに応じて変更するようにしてもよい。
When the
図6は文章のデータの一例を示す。この例で文章601のデータは「車にはエンジンが付いています。車はエンジンで動きます。エンジンには点火装置が付いています。エンジンは点火装置によって動きます。」といったテキストのデータを含む。この文章601であれば、「エンジン」、「車」、「点火装置」のような単語がキーワードとして抽出される。
FIG. 6 shows an example of sentence data. In this example, the data of the
画像データベース205は画像のデータを蓄積する。ここでは画像データベース205がHDD111上に構築される。画像データベース205には、車、エンジン、点火装置、地球などの物の一般名称に対応した画像のデータが蓄積される。画像のデータは図7に示すように、画像自体のデータ701乃至704とその画像を識別するためのデータとを含む。画像を識別するためのデータには画像のデータ名を用いることができる。
The
画像管理テーブル206は、画像データベース205に蓄積された画像とワードとを関連付けるテーブルであり、このテーブル206もHDD111に格納しておくことができる。テーブル206は図8に示すように、この実施の形態ではキーワードと画像のデータ名とを関連付ける。この例では、「車」というキーワードと「Car.bmp」というデータ名とを関連付け、「エンジン」というキーワードと「Engine.bmp」というデータ名とを関連付ける。「点火装置」には「Fire.bmp」を関連付け、「地球」には「Earth.bmp」を関連付けている。
The image management table 206 is a table that associates images stored in the
画像検索部207は、抽出した複数のキーワードにそれぞれ対応する画像をそのテーブル206から検索する。ここでは、CPU102が、プログラム114の指令に従ってHDD111にアクセスし、各キーワードに対応する画像データの名称をテーブル206から検索する(図4の手順402)。抽出したキーワードが「車」、「エンジン」、「点火装置」であれば、その検索で、「Car.bmp」、「Engine.bmp」、「Fire.bmp」を名称のデータとしてそれぞれ取得する。
The
画像データ取得部208は、検索した画像のデータを画像データベース205から取得する。そのためにCPU102は、バス103を通じてHDD111にアクセスし、名称のデータを用いて、画像自体のデータを画像データベース205から取得する。例えば名称のデータとして「Car.bmp」、「Engine.bmp」および「Fire.bmp」を取得していれば、図7に示した画像データ701乃至704のうち、画像データ701乃至703を取得する(図4の手順403)。
The image
イラスト作成部209は、画像データベース205から取得した画像データを用いて、電子書籍の内容を説明する画像を作成する。ここではCPU102が、画像データベース205から取得した画像データを組み合わせてイラストを作成する(図4の手順404)。例えばCPU102は画像データ701乃至703を組み合わせ、図9に示すようなイラスト901を作成する。
The
イラスト出力部210は、作成したイラスト901を出力する。プログラム114の指令に従ってCPU102は、図10に示すように、作成したイラストの出力画面1001をディスプレイ109に表示する(図4の手順405)。閲覧画面301と対応して出力画面1001を表示するため、CPU102は閲覧画面301の表示位置に基づいて出力画面1001の表示位置を計算する。図10では、閲覧画面301のページ302Rに一部重なる位置で出力画面1001が表示されている。またこの例のように、CPU102は出力画面1001の上部に、抽出したキーワードを配置するようにしてもよい。
The
このように電子書籍のイラストを出力することで、ユーザはその電子書籍の内容を簡単且つ迅速に把握することができる。また文章からイラストができるので、子供も文書を楽しみ易い。文字ばかりの文書を絵本のように楽しむことができる。 By outputting the illustration of the electronic book in this way, the user can easily and quickly grasp the contents of the electronic book. In addition, because illustrations can be made from text, it is easy for children to enjoy documents. You can enjoy text-only documents like a picture book.
上述のようなコンピュータシステムにおいて、イラストに用いる画像データを配置するため、コンピュータ101は図11に示すように、レイアウト決定部211および配置管理テーブル212をさらに備えることができる。
In the computer system as described above, in order to arrange the image data used for the illustration, the
レイアウト決定部211は、画像データ取得部208が取得した画像データのレイアウトを決定する。決定したレイアウトに従って、イラスト作成部209は、取得した画像データを組み合わせる。ここではCPU102が、配置管理テーブル212のデータを用いて、取得した画像データの配置を計算する。
The
配置管理テーブル212は、イラストにおける画像データのサイズや位置を管理するためのテーブルであり、HDD111に格納しておくことができる。図12は配置管理テーブルの構成の一例を示す。
The arrangement management table 212 is a table for managing the size and position of the image data in the illustration, and can be stored in the
この配置管理テーブル212は、イラストにおける各画像のサイズや位置のデータを配置レベル毎に与える。サイズのデータは、イラストにおける各画像のサイズを具体的に定めるのに用いられる。イラストにおける各画像のサイズは、画像データベース205に蓄積された画像データのサイズが統一されている場合、その画像のサイズとその統一されたサイズとの比率で与えることができる。例えばサイズのデータが100%の値を表していれば、画像データベース205に蓄積された画像データをそのままの大きさで用いる。サイズのデータが100%未満の値を表していれば、蓄積された画像データを縮小して用いる。サイズのデータが100%より大きな値を表してれば、蓄積された画像データを拡大して用いる。
The arrangement management table 212 gives data on the size and position of each image in the illustration for each arrangement level. The size data is used to specifically determine the size of each image in the illustration. When the size of the image data stored in the
また位置のデータは、イラストに用いる画像間の相対的な位置関係を与える。相対的な位置関係は、基準位置に対する各画像の座標で表現することができる。画像のデータが矩形の画像を表現する場合、画像の位置は、その矩形の中心や角の位置で定めることができる。例えば位置のデータが(0,0)を表していれば、その画像の位置が基準位置となる。位置のデータが(+20,+20)を表していれば、基準位置からx方向に+20だけずらしy方向に+20だけずらしてその画像を配置することを示す。 The position data gives a relative positional relationship between images used for the illustration. The relative positional relationship can be expressed by the coordinates of each image with respect to the reference position. When the image data represents a rectangular image, the position of the image can be determined by the center or corner position of the rectangle. For example, if the position data represents (0, 0), the position of the image becomes the reference position. If the position data represents (+20, +20), it indicates that the image is arranged with a shift of +20 in the x direction and a shift of +20 in the y direction from the reference position.
配置レベルは、このようなサイズおよび位置のデータを画像データに関連付けるのに用いられる。図8に示すように、画像管理テーブル206の各レコードは配置レベルのデータを含む。CPU102はキーワードを抽出すると、バス103を通じてHDD111にアクセスし、各キーワードに対応する画像データの名称および配置レベルのデータをテーブル206から取得する。各画像について配置レベルのデータを取得すると、その配置レベルに対応するサイズおよび位置のデータをHDD111上の配置管理テーブル212から取得する。そしてCPU102は、取得したサイズおよび位置のデータを用いて、イラストにおける各画像のサイズおよび位置を計算し、その結果に従ってイラストを作成する。
The placement level is used to associate such size and position data with image data. As shown in FIG. 8, each record of the image management table 206 includes arrangement level data. When the
このように画像データのレイアウトを決定することで、文書のイラストを構成する画像間の関係を適当に表すことができる。これによって、ユーザはその文章の内容をより的確に把握することが可能となる。 By determining the layout of the image data in this way, the relationship between the images constituting the document illustration can be appropriately represented. Thereby, the user can grasp the contents of the sentence more accurately.
また上述のようなコンピュータシステムにおいて、一つの文章から複数のイラストを出力するようにしてもよい。一つの文章が複数の主題を含む場合、その主題毎にイラストがあると、その文章のより詳細な内容をユーザが簡単に把握することができる。例えば図13に示すような文章1301のデータは、「車」に関するテキストデータと、「地球」に関するテキストデータとを含む。このような文章1301では、「車」に関するイラストだけでなく、「地球」に関するイラストを出力することができる。
In the computer system as described above, a plurality of illustrations may be output from one sentence. When one sentence includes a plurality of subjects, if there is an illustration for each subject, the user can easily grasp the detailed contents of the sentence. For example, the data of the
ここでは、イラスト作成部209が、抽出したキーワードのグループ毎に概説画像を作成する。そのために画像管理テーブル206に、ワードとそのワードの属するグループとを関連付けるデータを格納することができる。図8の例では、キーワード毎にそのキーワードの属するグループのデータが与えられている。「車」や「エンジン」、「点火装置」については、グループのデータとして「A」という値が与えられている。「地球」については、グループのデータとして「B」という別の値が与えられている。
Here, the
グループのデータは、画像検索部207が用いることができる。画像検索部207はグループのデータを利用して、抽出したキーワードをグループに分ける。画像検索部207は、抽出したキーワードをグループに分けると、グループ毎に画像を検索する。このような機能もCPU102が文書内容把握支援プログラム114の指令に従って実現する。そのときコンピュータ101が実行する手順の一例を図14に示す。
The
CPU102はキーワードを抽出すると(手順401)、バス103を通じてHDD111にアクセスし、各キーワードに対応するグループのデータをテーブル206から取得する(手順1401)。CPU102はプログラム114の指令に従って、データを取得したグループのうち、いずれかのグループに属するキーワードを選択する(手順1402)。キーワードを選択すると、CPU102は、選択したキーワードに対応する画像データの名称のデータをHDD111上のテーブル206から取得する(手順402)。文章1301であれば、キーワードとして「エンジン」、「車」、「点火装置」、および「地球」といった単語を抽出する。これらのキーワードが属するグループは「A」か「B」である。2つのグループのデータを取得すると、CPU102は、例えばグループ「A」に属するキーワードを選択する。これにより、抽出した4つのキーワードのうち、「車」、「エンジン」、「点火装置」が選択される。これらのキーワードを選択すると、画像データの名称のデータとして「Car.bmp」、「Engine.bmp」、「Fire.bmp」をそれぞれ取得する。
When the
抽出したキーワードをグループ分けする場合、画像データ取得部208は、選択したキーワードに対応する画像データを画像データベース205から取得し、イラスト作成部209は、選択したキーワードの属するグループに対してイラストを作成する。そのためにCPU102は、選択したキーワードの画像データの名称のデータを取得すると、HDD111にアクセスし、その名称のデータを用いて、画像自体のデータを画像データベース205から取得する(手順403)。取得した画像データを組合せ、選択したキーワードの属するグループに対してイラストを作成する(手順404)。例えば名称のデータとして「Car.bmp」、「Engine.bmp」、「Fire.bmp」を取得していれば、CPU102は画像データ701乃至703をHDD111上の画像データベース205から取得する。そして画像データ701乃至703を組合せ、イラスト901を作成する。
When grouping the extracted keywords, the image
このようにしていずれかのグループに対してイラストを作成すると、残りのグループについても同様にイラストを作成する(手順1403)。グループ「A」および「B」のうち、グループ「A」に対してイラストを作成していれば、CPU102はプログラム114の指令に従い、グループ「B」に対してもイラストを作成する。この例では、グループ「B」に属するキーワードとして、「地球」を選択する。そのキーワードを選択すると、画像データの名称のデータとして「Earth.bmp」を取得する。CPU102はHDD111にアクセスし、その名称のデータを用いて、画像データベース205から画像データ704を取得する。そしてその画像データ704を用いて、グループ「B」に対するイラストを作成する。
When illustrations are created for any of the groups in this way, illustrations are created for the remaining groups in the same manner (step 1403). If an illustration is created for the group “A” in the groups “A” and “B”, the
全てのグループに対しそれぞれイラストを作成すると、イラスト出力部210は、グループ毎に作成したイラストを出力する。例えばCPU102が、図15に示すように、グループ「A」に対するイラスト901の出力画面1501とグループ「B」に対するイラストの出力画面1502とをそれぞれディスプレイ109に表示する(手順405)。この例では、グループ「B」に対するイラストとして画像データ704をそのまま用いている。
When illustrations are created for all groups, the
またこの例では、出力画面1501よりも下側に出力画面1502を配置している。この配置は、文章中でキーワードが出現する順序に従って、イラスト出力部210が定めることができる。そのためにキーワード抽出部204が、文書の先頭から末尾に向かってワードを抽出するとともに、その抽出の順序をワード毎に記録するようにしてもよい。イラスト出力部210は、その記録に基づいてキーワードの出現順序を定め、その出願順序に従って複数の出力画面の表示位置を定める。
In this example, the
また上述の例のように各グループに対するイラストを別個の出力画面で表示する代わりに、それらのイラストを一つの出力画面で表示するようにしてもよい。この場合には、各グループのイラストを作成したときに、イラスト作成部209がそれらのイラストを連結して一つのイラストを作成することができる。イラスト出力部210は、そのイラストを一つの出力画面に表示する。
Further, instead of displaying the illustrations for each group on separate output screens as in the above example, those illustrations may be displayed on one output screen. In this case, when creating illustrations for each group, the
このように各グループに対するイラストを作成することで、ユーザがイラストから得られる情報が増え、文章の内容をより詳細に把握することが可能となる。 Thus, by creating an illustration for each group, the user can obtain more information from the illustration, and the contents of the sentence can be grasped in more detail.
各グループに対するイラストを作成する例においても、各イラストを構成する画像データのレイアウトをレイアウト決定部211が決定するようにしてもよい。
Also in the example of creating an illustration for each group, the
またイラスト作成部209が、抽出したワードの属するグループ毎の出現頻度に従って、イラスト間のサイズの関係を決定することができる。例えばグループ毎の出現頻度は、そのグループに属するキーワードそれぞれの出現頻度の総計として求める。イラスト作成部209は、グループ毎の総計を比較し、その比較結果に基づいて各グループに対するイラストのサイズを決定する。この機能を実現するためにCPU102が、プログラム114の指令に従ってグループ毎に総計を計算する。グループ毎に総計を計算すると、CPU102は、最大の総計で各グループの総計の値を正規化する演算を行う。そして正規化した値で各グループのイラストのサイズを調整する。全てのイラストを矩形の画像で表現し、その矩形のサイズを揃えていれば、例えばその矩形の一辺の長さに、正規化した値を乗算して、各イラストのサイズを調整する。
The
このようにしてイラスト間のサイズの関係を決定することで、ユーザは、その関係から各イラストから得られる情報の重要度を推測することができ、必要な情報を簡単に選別できる。特に、文章が様々な情報や文脈を含んでいるときに有用である。 By determining the size relationship between illustrations in this way, the user can estimate the importance of information obtained from each illustration from the relationship, and can easily select necessary information. This is particularly useful when the text contains various information and contexts.
キーワードを抽出する範囲は、文書の全体でも文書の一部でもよい。上述のようなコンピュータシステムにおいて、キーワードを抽出する対象部を設定するため、コンピュータ101は図16に示すように、対象設定部213をさらに備えることができる。
The range for extracting keywords may be the whole document or a part of the document. In the computer system as described above, the
対象設定部213は、文書の一部または全部に、ワードを抽出する対象部を設定する。この実施の形態におけるコンピュータシステムがユーザインターフェイス部201を備えているように、文書を表示する表示部をシステムが備えている場合には、対象設定部213は、表示領域特定部214を備えるようにしてもよい。
The
表示領域特定部214は文書の表示領域を特定する。対象設定部213は、特定した表示領域に対象部を設定する。表示領域の特定は、ユーザから指示を受けたときにすることができる。ここでは、表示領域を特定する指示をユーザから受けるため、図3に示すように、「イラスト」ボタン305を閲覧画面301上に配置している。
The display
このような機能を実現するためCPU102はプログラム114の指令に従って、入力装置110を用いたアプリケーションプログラム112に対するユーザの操作を監視する。ボタン305を押す操作を検出すると、CPU102はそのときに表示されている文書の領域を特定する。電子書籍のデータ113のように、表示する文書のデータがページを示すデータを含む場合には、文書の表示領域の特定にそのページを示すデータを利用することができる。表示中のページを示すデータをRAM105に一時的に記録していれば、CPU102は、そのデータをRAM105から取得する。そしてそのデータを用いて表示しているページを特定する。図3の例ではページ番号表示部306および307に示すように、6ページ中の3ページ目と4ページ目とを表示している。この状態でボタン305を押す操作をユーザがすると、CPU102は3ページ目と4ページ目を表示領域として特定し、ワードを抽出する対象部としてその表示領域を設定する。この場合、CPU102は文書全体ではなく3ページ目および4ページ目のデータからキーワードを抽出する。そしてそのキーワードを使って、3ページ目および4ページ目に対するイラストを作成し、そのイラストをディスプレイ109に表示する。別のページについてイラストを既に表示している場合には、そのイラストの出力画面の表示を更新して、新たに作成したイラストを表示してもよいし、新たに作成したイラストを別の出力画面で表示するようにしてもよい。
In order to realize such a function, the
また表示領域の特定は、ユーザから明示的に指示を受けたときだけでなく、システムが定めたときにもすることができる。ここでは、表示領域特定部214が、表示した文書のデータがページを示すデータを含む場合に、表示するページの変更を検出し、その検出結果に基づいて自動的に表示領域を特定する。このような機能を実現するためにCPU102は文書内容把握支援プログラム114の指令に従って、入力装置110を用いたアプリケーションプログラム112に対するユーザの操作を監視する。例えばボタン303や304を押す操作のように、表示ページを変更する操作をユーザが行うと、CPU102はその操作を検出する。表示中のページを表すデータをRAM105に一時的に記録している場合、その操作が行われると、CPU102はバス103を通じてRAM105にアクセスし、そのデータをRAM105から取得する。それまで表示していたページを表すデータをRAM105から取得すると、CPU102はそのデータに基づいて、次に表示するページを表す数値を計算する。ボタン303を押す操作をユーザがすると、CPU102は表示ページを示す値から、一度に表示するページ数、ここでは「2」を加算することで、次に表示するページを表す数値を計算する。ボタン304を押す操作がされていれば、CPU102は表示ページを示す値に「2」を引くことで、次に表示するページを表す数値を計算する。図3の例のように3ページ目と4ページ目とを表示した状態でボタン303を押す操作がされていれば、次に表示するページを表す数値は、5および6である。またボタン304を押す操作がされていれば、その数値は1および2である。このようにして表示するページを特定することで、CPU102は表示領域を特定することができる。CPU102は、ワードを抽出する対象部としてその表示領域を設定する。この場合、CPU102は文書全体ではなく、1ページ目および2ページのデータからキーワードを抽出するか、5ページ目および6ページ目のデータからキーワードを抽出する。そしてそのキーワードを使って、1ページ目および2ページ目に対するイラストか、5ページ目および6ページ目に対するイラストを作成し、そのイラストをディスプレイ109に表示する。このため、表示するページに変更があれば、自動的にイラストが更新されるか、変更後のページに対するイラストが追加される。
The display area can be specified not only when an instruction is explicitly received from the user, but also when the system determines it. Here, when the displayed document data includes data indicating a page, the display
上述の対象部は、文書のデータがページを示すデータを含まない場合でも設定することができる。例えばHTML(HyperText Markup Language)やXML(eXtensible Markup Language)で記述したデータは、ページの区切りを示すデータを含まない。図17はHTMLで記述したウェブページの閲覧システムの概略構成を示す図である。 The target portion described above can be set even when the document data does not include data indicating a page. For example, data described in HTML (HyperText Markup Language) or XML (extensible Markup Language) does not include data indicating page breaks. FIG. 17 is a diagram showing a schematic configuration of a web page browsing system described in HTML.
図17に示す例では、コンピュータ101が通信インターフェイス115をさらに備えている。通信インターフェイス115はネットワーク116を通じて、別のコンピュータ117に接続されている。コンピュータ117は、ウェブページを公開するウェブサーバコンピュータである。またコンピュータ101において、通信インターフェイス115はバス103に接続されている。コンピュータ101はこの通信インターフェイス115を用いることでコンピュータ117と通信することができる。コンピュータ117が公開するウェブページを閲覧する場合には、ウェブブラウザのようなウェブクライアントプログラムをアプリケーションプログラム112として利用する。その場合、CPU102はアプリケーションプログラム112の指令に従ってコンピュータ117と通信し、コンピュータ117からウェブページのデータをダウンロードする。通信インターフェイス115がウェブページのデータを受信すると、CPU102はバス103を通じてHDD111にアクセスし、ダウンロードしたウェブページのデータ118をHDD111に一時的に記憶する。CPU102はアプリケーションプログラム112の指令に従ってデータ118を解釈し、そのウェブページをディスプレイ109に表示する。図18はウェブブラウザの画面の一例を示す。
In the example illustrated in FIG. 17, the
図18に示すように、ウェブブラウザの画面1801には、URL(Uniform Resource Locator)を指定するための欄1802が配置されている。この例では、「http:www.hhh.com/aaa.html」というURLを指定することで、上述した文章601を含むウェブページが画面1801のエリア1803に表示されている。このウェブページは、自動車や自動二輪車などの仕組みを説明するページである。そのウェブページでは、説明のありかを示す画像1804や1805が文章601やその他の文章に対応するテキストの間に配置されている。
As shown in FIG. 18, a
また画面1801には、スクロールバー1806が用意されている。このスクロールバー1806は、ウェブページの表示サイズがエリア1803のサイズよりも大きいときに、そのエリア1803に表示する部分をユーザが指定するのに用いることができる。ユーザが入力装置110を用いてこのスクロールバー1806を移動する操作をすると、CPU102は移動後のスクロールバー1806の位置に基づいて計算を行う。その計算結果に従って、ウェブページのユーザが表示した部分をエリア1803に表示する。
A
CPU102は文章内容把握支援プログラム114の指令に従って、このような計算結果を利用して、ウェブページのデータのように文書のデータがページを示すデータを含まない場合でも、文書の表示領域を特定する。図18に示す状態では、エリア1803に表示されているテキストは文章601のテキストのみである。この場合、CPU102は文書内容把握支援プログラム114の指令に従って、文章601に対するイラストを作成する。ここでは、上述した手順に従い、文章601に対するイラストとしてイラスト901を作成し、そのイラスト901を出力画面1001で表示する。
The
イラストの作成と文書の表示は別々のコンピュータで行うことができる。図18の例であれば、イラストの作成はサーバ側のコンピュータ117が行い、文書およびその文書に対するイラストの表示はクライアント側のコンピュータ101が行うことができる。この場合には、コンピュータ101からウェブページの転送要求があると、例えばコンピュータ117が、転送するウェブページのデータにスクリプトを書き込む。このスクリプトを含むウェブページをコンピュータ101上のウェブブラウザが解釈すると、そのウェブブラウザの指令に従ってコンピュータ101は、そのウェブページに対するイラストのデータの転送要求をコンピュータ117に送信する。この要求を受信すると、コンピュータ117は、上述したような手順に従ってそのイラストのデータを作成し、作成したデータをコンピュータ101へ出力する。イラストのデータを受信すると、コンピュータ101は、ポップアップ画面やその他の出力画面でそのイラストを表示する。
Illustration creation and document display can be done on separate computers. In the example of FIG. 18, illustration creation can be performed by the
表示するイラストは、表示するデータがページを示すデータを含む場合と同様、文書の表示領域に変更があったときに自動的に変更するようにしてもよい。表示するデータがページを示すデータを含まない場合、文書の表示領域の変更は、スクロールバー1806の位置の変動に基づいて検出することができる。例えばスクロールバー1806が移動する方向のエリア1803の長さとスクロールバー1806の位置の変動量とをCPU102が比較する。その変動量がその長さを上回ったことをCPU102が検出すると、そのときのスクロールバー1806の位置に基づいて文書の表示領域を特定し直す。文書の表示領域を特定し直すと、CPU102はその表示領域に対してイラストを新たに作成し、新たに作成したイラストを使って出力画面の表示を自動的に更新する。
The illustration to be displayed may be automatically changed when the display area of the document is changed, as in the case where the data to be displayed includes data indicating a page. When the data to be displayed does not include data indicating a page, a change in the display area of the document can be detected based on a change in the position of the
またこのようなシステムにおいて、ワードを抽出する対象部は、表示領域を特定しなくても設定することができる。例えば入力装置110を使ってユーザが選択した部分を対象部に設定することができる。
In such a system, the target part from which the word is extracted can be set without specifying the display area. For example, a portion selected by the user using the
本発明は、上述したシステムだけでなく、検索システムにも応用することができる。図19は検索システムのハードウェア構成を説明する図である。 The present invention can be applied not only to the system described above but also to a search system. FIG. 19 is a diagram illustrating the hardware configuration of the search system.
この検索システムでは、コンピュータ1901および1902がネットワーク1903を通じて接続している。ここでは、コンピュータ1901は文書の検索サービスを提供するのに用いるコンピュータで、コンピュータ1902はそのサービスをユーザが受けるのに利用するコンピュータである。コンピュータ1901および1902には、汎用のコンピュータを利用することができる。
In this search system,
図19に示すように、コンピュータ1901は、CPU1904やバス1905を備えている。CPU1904はバス1905を通じてROM1906やRAM1907と接続される。ROM1906に記憶されたプログラムの指令に従ってコンピュータ1901が起動すると、CPU1904はRAM1907上でOS1908の一部または全部を動作させる。
As illustrated in FIG. 19, the
バス1905には通信インターフェイス1909も接続されている。通信インターフェイス1909はコンピュータ1901をネットワーク1903に接続する。
A
さらにバス1905には、HDD1910も接続されている。このHDD1910には、文書検索プログラム1911のファイルやその他のファイルが格納される。文書検索プログラム1911は、文書を管理したり文書を検索したりするのに用いるプログラムである。また文書検索プログラム1911は、上述の文書内容把握支援プログラム114と同様に、文書内容の把握を支援するのに用いることができる。ここではさらに、ウェブサーバのように他のコンピュータと通信するのにも用いる。コンピュータ1901の起動時などサービスを開始するとき、CPU1904はOS1908の指令に従ってHDD1910からその文書検索プログラム1911のファイルを読み出し、RAM1907上で文書検索プログラム1911を動作させる。
Further, an
この文書検索プログラム1911の指令に従ってコンピュータ1901が動作することにより、コンピュータ1901は図20に示すように、通信処理部2001、文書管理部2002、インデックステーブル2003、文書データベース2004、キーワード抽出部2005、画像データベース2006、画像管理テーブル2007、画像検索部2008、画像データ取得部2009、イラスト作成部2010、および文書一覧出力部2011を備える。
As the
通信処理部2001は、文書の検索サービスを提供するために、他のコンピュータとの通信に関する処理をする。ここでは、コンピュータ1902からの検索要求を受け付けたり、その要求に対する応答をコンピュータ1902に送信したりする。このような機能を実現するため、文書検索プログラム1911の指令に従ってCPU1904は処理を実行し、通信インターフェイス1909を用いてコンピュータ1902と通信する。
A
文書管理部2002は、文書の管理や検索をする。文書の検索は、書誌事項のような属性データについて行ってもよいし、文書の本文データについて行ってもよい。文書データは、テキスト形式かバイナリ形式の文字データを含む。新聞や雑誌、論文、書籍、法令集、業務書類の電子データやウェブページのデータのように文字データを含んでいれば、図形データやその他のデータを含んでいてもよい。バイナリ形式のデータの場合、テキスト形式の文字データを抽出する必要がある。本文データについて全文検索をするのであれば、N文字インデックス方式のような既に知られた検索方式を用いることができる。そのために、文書管理部2002がインデックステーブル2003を作成するようにしてもよい。
A
インデックステーブル2003は、索引キーとその索引キーを付与した文書のファイルを特定するIDデータとを含むインデックスを記憶している。また文書データベース2004は、索引キーを付与した文書データのファイルを蓄積する。ここでは、インデックステーブル2003や文書データベース2004をHDD1910上に構築している。
The index table 2003 stores an index including an index key and ID data that identifies a file of a document to which the index key is assigned. The
文書管理部2002は、指定された条件に従って、文書データベース2004に蓄積された文書のデータを検索する。ここでは、コンピュータ1902から通信インターフェイス1909が検索要求を受信すると、プログラム1911の指令に従ってCPU1904がその検索要求から、コンピュータ1902のユーザが指定した条件を抽出する。文書の本文データについて検索条件がその本文データに含まれるワードを指定する場合、CPU1904はバス1905を通じてHDD1910にアクセスし、その検索ワードに対応するIDデータをインデックステーブル2003から取得する。取得したIDデータからリストを作成し、そのリストをHDD1910に一時的に記憶する。
The
キーワード抽出部2005は、検索した文書のデータから、その文書に含まれるワードを複数抽出する。ここでは、検索ワードに対応するIDデータを取得すると、CPU1904がHDD1910にアクセスし、取得したIDデータによって特定される文書データのファイルから文字データを取得する。CPU1904は、文書データに含まれる文字データから、複数のキーワードを抽出する。文書の検索条件が文書のデータに含まれるワードを指定する場合、その指定されたワードも、キーワードの抽出に用いることができる。その場合、CPU1904は、文書データに含まれる文字データから複数のワードを選択し、選択したワードのうち、指定されたワードに対応するワードをキーワードとして抽出する。
The
画像データベース2006、画像管理テーブル2007、画像検索部2008、画像データ取得部2009、およびイラスト作成部2010は、図2で示した画像データベース205、画像管理テーブル206、画像検索部207、画像データ取得部208、およびイラスト作成部209と基本的に同様である。CPU1904はプログラム1911の指令に従い、上述の手順で、抽出したキーワードから文書のイラストを作成する。検索した文書が複数ある場合には、それぞれの文書に対しイラストを作成する。文書毎に作成したイラストは、HDD1910に一時的に記憶する。また作成したイラストのファイルにもそのファイルを特定するIDデータを与え、HDD1910に記憶したリストのIDデータに対応付ける。
The
文書一覧出力部2011は、検索した文書毎に作成したイラストを用いて、検索した文書の一覧のデータを通信処理部2001に出力する。通信処理部2001は、そのデータを検索要求元のコンピュータ1902に送信する。この機能を実現するため、ここではCPU1904がプログラム1911の指令に従って、HDD1910からリストを取得する。CPU1904は、取得したリストとそのリストに含まれるIDデータから、検索した文書の一覧を表示するデータを作成する。このデータは、イラストのデータの他、文書の題名や種類、作者、発行・発表日、ファイルの所在のような文書の属性データを含む。CPU1904は、このデータから、コンピュータ1902への通信データを作成し、通信インターフェイス1909を用いてコンピュータ1902に送信する。ネットワーク1903を介して通信データを受信すると、コンピュータ1902はその受信データに基づいて、文書の一覧を表示する。図21は文書一覧の表示画面の一例を示す。
The document
文書一覧の表示画面2101は、検索条件の入力欄2102や検索実行ボタン2103、一覧表示部2104を有する。この例における検索条件の入力欄2102は、コンピュータ1902でユーザが検索キーワードを入力したり変更したりするのに用いられる。検索実行ボタン2103はユーザが検索実行をコンピュータ1901に指示するのに用いることができる。一覧表示部2104は、検索した文書の一覧を表示する。
The document
その一覧は、検索した文書のそれぞれについて、属性データ2105と、対応するイラスト2106とを含む。この例では、属性データのうち、文書の題名と作者を表示している。文書の題名には、本文データへのリンク2107が付されている。ユーザがコンピュータ1902でこのリンク2107に対し操作すると、コンピュータ1902はその本文データをコンピュータ1901に要求する。コンピュータ1901からその本文データを受信すると、コンピュータ1902はそのデータを表示する。図21の例のように文書の一覧にイラストを含めず、本文データを表示したときにその本文データとともに、対応するイラストを表示するようにしてもよい。
The list includes
このように文書にイラストを対応付けて表示することで、ユーザは検索された文書の内容を簡単且つ迅速に把握することができる。このため、多数の文書が検索された場合でも、必要な文書を効率良く選別することができる。 By displaying the illustration in association with the document in this way, the user can easily and quickly grasp the contents of the retrieved document. Therefore, even when a large number of documents are searched, necessary documents can be efficiently selected.
またこのような検索システムは、論文や雑誌、インターネットの情報だけでなく、特許や実用新案、意匠、その他の知的財産に関する公報を検索するシステムにも利用することができる。特許公開公報であれば、その公報の属性データは出願人やIPC、出願番号、出願日、公開番号、公開日、発明者、発明の名称のような項目のデータを含む。コンピュータ1902のユーザはこのような項目の一つまたは複数について検索条件を指定することができる。属性データに対するこのような項目データを検索条件としてユーザが指定すると、コンピュータ1901は、指定された項目について公報の属性データを検索する。
Such a search system can be used not only for information on papers, magazines, and the Internet, but also for systems that search for patents, utility models, designs, and other gazettes related to intellectual property. If it is a patent publication gazette, the attribute data of the gazette includes data of items such as the applicant, IPC, application number, application date, publication number, publication date, inventor, name of the invention. A user of the
また本文データは、願書に添付された明細書や特許請求の範囲、要約書それぞれの書類について別個に用意するようにしてもよい。一部の書類のみを指定するため、これらの書類の書類名を検索条件の項目に含めるようにしてもよい。さらに特許請求の範囲の一部を指定するため、請求項番号のようなデータを検索条件の項目に含めるようにしてもよい。また明細書の一部の記載事項を指定するため、「背景技術」や「発明が解決しようとする課題」、「課題を解決するための手段」のような明細書中の見出しを検索条件の項目に含めるようにしてもよい。本文データに対するこのような項目を検索条件としてユーザが指定すると、コンピュータ1901は、指定された項目について公報の本文データを検索する。
Further, the text data may be prepared separately for each of the specification, claims, and abstract documents attached to the application. Since only some documents are designated, the document names of these documents may be included in the search condition item. Furthermore, in order to designate a part of the claims, data such as claim numbers may be included in the items of the search conditions. In addition, in order to specify a part of the description, a headline in the specification such as “background art”, “problem to be solved by the invention”, “means for solving the problem” is used as a search condition. You may make it include in an item. When the user specifies such an item for the text data as a search condition, the
属性データや本文データについて公報を検索すると、上述の通り、コンピュータ1901は、検索した公報毎にイラストを作成する。コンピュータ1901は、検索した公報毎に作成したイラストを用いて、検索した公報の一覧を表示するデータを作成し、そのデータを検索要求元のコンピュータ1902に送信する。コンピュータ1902は、ネットワーク1903を介してデータを受信すると、そのデータに基づいて、検索した公報の一覧を表示する。図22は公報一覧の表示画面の一例を示す。
When a gazette is searched for attribute data and text data, as described above, the
この公報一覧の表示画面2201は、検索条件表示部2202や一覧表示部2203を有する。検索条件表示部2202は、ユーザが指定した検索条件を表示するのに用いられる。一覧表示部2203は、検索した公報の一覧を表示する。
The publication
一覧は、検索した公報のそれぞれについて、例えば公報番号2204と、その公報の代表図面2205と、対応するイラスト2206とを含む。公報番号2204には、本文データへのリンク2207が付されている。ユーザがコンピュータ1902でこのリンク2207に対し操作すると、コンピュータ1902はその公報の本文データをコンピュータ1901に要求する。コンピュータ1901からその公報の本文データを受信すると、コンピュータ1902はそのデータを表示する。図22の例のように公報の一覧に、代表図面2205やイラスト2206を含めず、本文データを表示したときにその本文データとともに、代表図面およびイラストを表示するようにしてもよい。
The list includes, for example, a
ユーザは、代表図面2205およびイラスト2206から、公報の内容を容易に把握することができる。イラスト2206は、本文データから作成するので、代表図面と類似することもあれば、大きく相違することもある。いずれにしても、代表図面だけでは得られない情報をユーザはイラストを一見して得ることができる。このため、公報が多数検索された場合でも、必要な公報を効率良く選別することが可能となる。
The user can easily grasp the contents of the publication from the
本発明は、コンピュータを用いたファイル管理システムにも応用することができる。このコンピュータには、他のシステムと同様、汎用のコンピュータを利用することができる。ここでは、そのコンピュータとして、図1で示したコンピュータ101を用いる。
The present invention can also be applied to a file management system using a computer. As this computer, a general-purpose computer can be used like other systems. Here, the
図23に示すように、この例では、コンピュータ101のHDD111に、ファイル管理モジュール2301のファイルやその他のファイルが格納される。ファイル管理モジュール2301は、ファイルの格納場所を階層的に管理する機能をOS106に提供するために用いる。このファイル管理モジュール2301を利用することで、OS106は、文書のデータを含むファイルについてその文書内容をユーザが把握するのを支援する機能も得ることができる。コンピュータ101が起動するとき、CPU102はOS106の指令に従ってHDD111からファイル管理モジュール2301のファイルをRAM105に読み出し、そのファイル管理モジュール2301の提供する機能を実現する。
As shown in FIG. 23, in this example, the file of the
ファイル管理モジュール2301を用いたOS106の指令に従ってコンピュータ101が動作することにより、コンピュータ101は図24に示すように、ユーザインターフェイス部2401、ファイル管理部2402、ファイル格納部2403、ファイル特定部2404、キーワード抽出部2405、画像データベース2406、画像管理テーブル2407、画像検索部2408、画像データ取得部2409、イラスト作成部2410、およびファイル一覧出力部2411を備える。
When the
ユーザインターフェイス部2401は、GUIを提供する点で図2で示したユーザインターフェイス部201と基本的に同様である。ユーザインターフェイス部2401は、ユーザが入力装置101を用いてファイルの格納場所を指定したりファイルを選択したり、ディスプレイ109でファイルの一覧を表示するためのGUIを提供する。
The
ファイル管理部2402は、ファイルの格納場所を階層的に管理する。ここでは、ファイル管理部2402は、ファイル格納部2403に格納したファイルを管理する。ファイル格納部2403としてHDD111の記憶領域を利用することができる。ファイル格納部2403には、OS106やドライバ、アプリケーションに必要なファイルや、ユーザが作成したりネットワークを通じて他のコンピュータから取得したりしたファイルなど、多数のファイルが通常格納される。それらのファイルは、テキスト形式やバイナリ形式のデータを含む。このようなファイルを管理するため、HDD111の記憶領域にはファイル格納部2403に加えて管理領域が設けられる。この管理領域は、階層的なディレクトリを表すデータを格納する。OS106の指令に従ってCPU102は、その管理領域のデータを用いてファイルの格納場所を階層的に管理する。
The
ファイル特定部2404は、選択した場所に格納されたファイルから、文書のデータを含むファイルを特定する。ファイルの格納場所の選択は、ユーザインターフェイス部2401の提供するファイル操作画面を使ってユーザがすることができる。図25はファイル操作画面の一例を示す。ファイル操作画面2501は、ディレクトリ領域2502とファイル領域2503とを有する。ディレクトリ領域2502は、ここでは、ルートディレクトリおよびそれより下位の階層にあるフォルダを表示する。この例では、ルートディレクトリ2504、および「Documents」という名称のフォルダ2505を図示している。ユーザは、入力装置110を用いてポインタ2506を操作することで、ディレクトリ領域2502に表示されたフォルダを選択する指示をコンピュータ101に与えることができる。ファイル領域2503は、ここでは、選択されたフォルダにあるファイルのアイコンおよび名称を表示する。この例では、フォルダ2505にあるファイル2507乃至2509を図示している。ユーザは、入力装置110を用いてポインタ2506を操作することで、ファイル領域2503に表示されたファイルを選択する指示をコンピュータ101に与えることができる。選択されたファイルに対し実行や削除、名称変更などの指示をユーザがすると、CPU102は、OS106の指令に従ってユーザの指示に対応する処理を実行する。またファイル操作画面2501は、イラストボタン2510も有している。このボタン2510を押す操作をユーザがすると、CPU102は、ファイル領域2503の表示形式を変更する。例えばその変更のとき、CPU102は、選択されているフォルダを特定する。選択されているフォルダを特定すると、そのフォルダに格納されているファイルから、文書のデータを含むファイルを特定する。この特定は、ファイルの種類に従ってすることができる。文書のデータを含むファイルがそのフォルダに格納されていないときは、CPU102は処理を中止してもよい。図25の例では、ファイル2507および2508が文書のデータを含み、ファイル2509が文書のデータを含まない。この場合、CPU102は、文書のデータを含むファイルとしてファイル2507および2508を特定する。
The
キーワード抽出部2405は、特定したファイルの文書のデータに基づいて、その文書に含まれるワードを複数抽出する。ここでは、特定したファイルのデータをファイル格納部2403から取得し、そのファイルの文書のデータに基づいて、その文書に含まれるワードを複数抽出する。この機能を実現するため、OS106の指令に従ってCPU102は、特定したファイルのデータをHDD111から読み出す。
The
画像データベース2406、画像管理テーブル2407、画像検索部2408、画像データ取得部2409、およびイラスト作成部2410は、図2で示した画像データベース205、画像管理テーブル206、画像検索部207、画像データ取得部208、およびイラスト作成部209と基本的に同様である。CPU102はOS106の指令に従い、上述の手順で、抽出したキーワードから文書のイラストを作成する。特定したファイルが複数ある場合には、それぞれのファイルに対しイラストを作成する。
The
ファイル一覧出力部2411は、特定したファイル毎に作成したイラストを用いて、選択したファイルの一覧を出力する。ここでは、ユーザインターフェイス部2401の提供するファイル操作画面2501を通じてそのファイルの一覧を出力する。ファイルの一覧を出力するため、CPU102は、特定したファイル毎にイラストを作成すると、そのイラストから、対応するファイルのアイコン画像を作成する。アイコン画像を作成すると、そのアイコン画像を用いて、ファイル操作画面2501のファイル領域2503に表示しているファイルのアイコンを更新する。このようにアイコンの表示を更新することで、ファイル一覧の表示形式の変更が完了する。図26は表示形式が変更されたファイル操作画面の一例を示す。
The file
表示形式の変更後には、図26に示すように、ファイル領域2503に表示されたファイルの一部のアイコンが更新される。この例では、文書のデータを含まないファイル2509のファイルのアイコンは変更されていない。文書のデータを含むファイル2507および2508のファイルのアイコンが、対応するイラストの画像を用いて更新されている。
After the change of the display format, as shown in FIG. 26, some icons of the files displayed in the
このようにファイル一覧の表示形式を変更することで、ユーザは文書データを含むファイルを容易に見分けることができ、またその文書の内容を簡単且つ迅速に把握することが可能となる。 By changing the display format of the file list in this way, the user can easily identify the file containing the document data, and can easily and quickly grasp the contents of the document.
上述のようなファイル管理システムにおいて、例えば作成日時や、選択した格納場所に対し属性データが与えられているときには、キーワードの抽出にその属性データを利用することができる。 In the file management system as described above, for example, when attribute data is given to a creation date and time or a selected storage location, the attribute data can be used for keyword extraction.
このようなコンピュータシステムにおける文書内容把握支援プログラム114や文書検索プログラム1911、ファイル管理モジュール2301は、コンピュータ101や1901に限らず、他のコンピュータや、携帯端末や携帯電話のような機器で動作させることも可能である。イラストのデータ形式にSVG(Scale Vector Graphics)のようなベクター形式を用いれば、機器の表示領域に応じてイラストの表示サイズを円滑に変更することができる。また携帯端末や携帯電話のように、長い文章を表示するには表示領域が狭い機器でも、イラストを使うことで、文章全体の内容を簡単且つ迅速に把握することが可能となる。図27は携帯電話でイラストを表示した一例を示す。
The document content grasping
携帯電話2701は、液晶ディスプレイ2702や、操作ボタン2703および2704を有している。携帯電話2701は、上述のプログラムやモジュールに相当するプログラムの指令に従って動作することにより、そのディスプレイ2702にイラストを表示する。この例では、ディスプレイ2702にイラスト901を表示している。例えばユーザがボタン2703を用いてページを変更する指示を携帯電話2701に与えると、携帯電話2701はそのプログラムの指令に従って、変更先のページに対応するイラストを作成し、新たに作成したイラストをディスプレイ2702に表示する。限られた領域で識別可能に文章を表示するよりも、認識可能にイラストを表示する方が容易である。ユーザは、比較的狭い表示領域でも、文章の内容を簡単且つ迅速に把握することができる。さらにイラストを用いれば、テキスト全体をスクロールして表示するよりも簡単にページを進めることができる。例えばボタン2704を押す操作をユーザがすることで、ページのテキストを表示するか、イラストを表示するかを切り換える。イラストを順次更新することでページを進め、テキストが読みたくなれば、ユーザは表示を切り換える。これによって、ユーザは、必要なテキストのみを読むことができる。
A
文書内容把握支援プログラム114や文書検索プログラム1911、ファイル管理モジュール2301は、インターネットなどの電気通信回線を用いたり、コンピュータ読み取り可能な記録媒体に格納したりすることで、関係者や第三者に提供することができる。例えばプログラムの指令を電気信号や光信号、磁気信号などで表現し、その信号を搬送波に載せて送信することで、同軸ケーブルや銅線、光ファイバのような伝送媒体でそのプログラムを提供することができる。またコンピュータ読取可能な記録媒体としては、CD−ROMやDVD−ROMなどの光学メディアや、フレキシブルディスクのような磁気メディア、フラッシュメモリやRAMのような半導体メモリを利用することができる。
The document content
また文書内容把握支援プログラム114や文書検索プログラム1911、ファイル管理モジュール2301の指令を複数のコンピュータで分散して処理するようにしてもよい。
Further, the commands of the document content
上述した実施の形態は本発明の技術的範囲を制限するものではなく、既に記載したもの以外でも、本発明の範囲内で種々の変形や応用が可能である。例えば静止画のイラストを用いる代わりに、イラストとしてアニメーション画像や動画を用いることができる。 The embodiments described above do not limit the technical scope of the present invention, and various modifications and applications other than those already described are possible within the scope of the present invention. For example, instead of using a still image illustration, an animation image or a moving image can be used as an illustration.
また上述の説明では、出現頻度の高いワードを優先的にキーワードとして抽出したが、これに限られるものではない。見出しに含まれているワードや強調表示されるワードを優先的にキーワードとして抽出するようにしてもよい。また出現頻度の低いワードを優先的にキーワードとして抽出するようにしてもよい。例えば図を含むような文書で、重要な事項がその図に記述されていれば、出現頻度の低いワードをキーワードとして抽出することで、その図を補完するイラストを作成することができる。また名詞だけでなく、形容詞のような別の品詞のワードも抽出するようにしてもよい。 In the above description, words having a high appearance frequency are preferentially extracted as keywords. However, the present invention is not limited to this. You may make it extract the word contained in the headline, and the word highlighted as a keyword preferentially. Moreover, you may make it extract a word with low appearance frequency preferentially as a keyword. For example, in a document including a figure, if an important matter is described in the figure, an illustration that complements the figure can be created by extracting a word with a low appearance frequency as a keyword. Further, not only nouns but also words of other parts of speech such as adjectives may be extracted.
また文章から抽出したワードに加えてその文章に含まれていないワードに基づいて、イラストに用いる画像を検索するようにしてもよい。例えばワード間の関係を表すデータベースを用意する。そして、文章から抽出したワードに関連するワードをそのデータベースから検索する。その関連するワードも画像を検索するのに用いる。これによってイラストの完成度を高めたり、多様性を増大させたりすることができる。 In addition to the word extracted from the sentence, an image used for the illustration may be searched based on a word not included in the sentence. For example, a database representing the relationship between words is prepared. Then, a word related to the word extracted from the sentence is searched from the database. The associated word is also used to retrieve the image. This can increase the completeness of illustrations and increase diversity.
本発明にかかる文書内容把握支援システム、文書内容把握支援方法および文書内容把握支援プログラムは、文章の内容も含めて文書の内容を簡単かつ迅速に把握することができるという効果を有し、文章閲覧システムのほか検索システムや、ファイル管理システムなどで有用である。 The document content grasping support system, the document content grasping support method, and the document content grasping support program according to the present invention have the effect that the contents of the document including the contents of the sentences can be grasped easily and quickly. It is useful for search systems and file management systems in addition to systems.
114 文書内容把握支援プログラム
201、2401 ユーザインターフェイス部
202 文書データ取得部
203 データ解析部
204、2005、2405 キーワード抽出部
205、2006、2406 画像データベース
206、2007、2407 画像管理テーブル
207、2008、2408 画像検索部
208、2009、2409 画像データ取得部
209、2010、2410 イラスト作成部
210 イラスト出力部
211 レイアウト決定部
212 配置管理テーブル
213 対象設定部
214 表示領域特定部
1911 文書検索プログラム
2001 通信処理部
2002 文書管理部
2003 インデックステーブル
2004 文書データベース
2011 文書一覧出力部
2402 ファイル管理部
2403 ファイル格納部
2404 ファイル特定部
24111 ファイル一覧出力部
114 Document content
Claims (14)
画像のデータを蓄積する画像データベース、
ワードと画像とを関連付けるテーブル、
抽出した複数のワードにそれぞれ対応する画像をそのテーブルから検索する手段、
検索した画像のデータを画像データベースから取得する手段、
取得した画像データを用いて、その文書のイラストを作成する手段、そして
作成したイラストを出力する手段
を備えた文書内容把握支援システム。 Means for extracting a plurality of words contained in the document from the document data;
An image database that stores image data,
A table that associates words with images,
Means for retrieving an image corresponding to each of the extracted words from the table;
Means for obtaining retrieved image data from an image database;
A document content understanding support system comprising means for creating an illustration of the document using the acquired image data, and means for outputting the created illustration.
前記イラストを作成する手段が、その決定に従って、取得した画像データのレイアウトをする請求項1記載の文書内容把握支援システム。 Means for determining the layout of the acquired image data;
2. The document content grasping support system according to claim 1, wherein the means for creating the illustration lays out the acquired image data according to the determination.
前記イラストを作成する手段が、抽出したワードのグループ毎にイラストを作成する請求項1記載の文書内容把握支援システム。 The table associates a word with a group to which the word belongs,
2. The document content grasping support system according to claim 1, wherein the means for creating the illustration creates an illustration for each group of extracted words.
前記ワードを抽出する手段が、設定した対象部のデータから、その対象部に含まれるワードを複数抽出する請求項1記載の文書内容把握支援システム。 Means for setting a target part in a part or all of a document;
2. The document content grasping support system according to claim 1, wherein the word extracting means extracts a plurality of words included in the target part from the set data of the target part.
前記対象部を設定する手段が、文書の表示領域を特定する手段を有し、特定した表示領域に対象部を設定する請求項6記載の文書内容把握支援システム。 Further comprising means for displaying the document;
7. The document content grasping support system according to claim 6, wherein the means for setting the target part has means for specifying a display area of the document, and sets the target part in the specified display area.
指定した条件に従って、蓄積された文書のデータを検索する文書検索手段、
検索した文書のデータに基づいて、その文書に含まれるワードを複数抽出する手段、
画像のデータを蓄積する画像データベース、
ワードと画像とを関連付けるテーブル、
抽出した複数のワードにそれぞれ対応する画像をそのテーブルから検索する画像検索手段、
検索した画像のデータを画像データベースから取得する手段、
取得した画像データを用いて、その文書のイラストを作成する手段、そして
検索した文書毎に作成したイラストを用いて、検索した文書の一覧を出力する手段
を備えた検索システム。 Document database that stores document data,
Document search means for searching stored document data according to specified conditions,
Means for extracting a plurality of words contained in the document based on the retrieved document data;
An image database that stores image data,
A table that associates words with images,
Image search means for searching the image corresponding to each of the plurality of extracted words from the table;
Means for obtaining retrieved image data from an image database;
A retrieval system comprising means for creating an illustration of the document using the acquired image data, and means for outputting a list of retrieved documents using the illustration created for each retrieved document.
選択した場所に格納されたファイルから、文書のデータを含むファイルを特定する手段、
特定したファイルの文書のデータに基づいて、その文書に含まれるワードを複数抽出する手段、
画像のデータを蓄積する画像データベース、
ワードと画像とを関連付けるテーブル、
抽出した複数のワードにそれぞれ対応する画像をそのテーブルから検索する手段、
検索した画像のデータを画像データベースから取得する手段、
取得した画像データを用いて、その文書のイラストを作成する手段、そして
特定したファイル毎に作成したイラストを用いて、選択した場所に格納されたファイルの一覧を出力する手段
を備えたファイル管理システム。 Means for hierarchically managing file storage locations,
A means for identifying a file containing document data from files stored in a selected location;
Means for extracting a plurality of words contained in the document based on the document data of the identified file;
An image database that stores image data,
A table that associates words with images,
Means for retrieving an image corresponding to each of the extracted words from the table;
Means for obtaining retrieved image data from an image database;
A file management system comprising means for creating an illustration of the document using the acquired image data, and means for outputting a list of files stored in the selected location using the illustration created for each identified file .
文書のデータから、その文書に含まれるワードをコンピュータが複数抽出する手順、
ワードと画像とを関連付けるテーブルから、抽出した複数のワードにそれぞれ対応する画像をコンピュータが検索する手順、
画像のデータを蓄積する画像データベースから、検索した画像のデータをコンピュータが取得する手順、
取得した画像データを用いて、その文書のイラストをコンピュータが作成する手順、そして
作成したイラストをコンピュータが出力する手順
を備えた文書内容把握支援方法。 A method for supporting the grasp of the contents of a document using a computer,
A procedure for the computer to extract multiple words contained in the document from the document data,
A procedure for a computer to search for images corresponding to a plurality of extracted words from a table associating words with images,
Procedure for the computer to retrieve the retrieved image data from the image database that stores the image data,
A document content comprehension support method that includes a procedure for a computer to create an illustration of the document using the acquired image data, and a procedure for the computer to output the created illustration.
A computer-readable recording medium on which the program according to claim 13 is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025911A JP2006215681A (en) | 2005-02-02 | 2005-02-02 | Document detail determination support system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005025911A JP2006215681A (en) | 2005-02-02 | 2005-02-02 | Document detail determination support system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006215681A true JP2006215681A (en) | 2006-08-17 |
Family
ID=36978888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005025911A Pending JP2006215681A (en) | 2005-02-02 | 2005-02-02 | Document detail determination support system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006215681A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009164854A (en) * | 2007-12-29 | 2009-07-23 | Canon Software Inc | Information processing apparatus and method of controlling the same, program, and computer readable recording medium |
WO2011036755A1 (en) * | 2009-09-24 | 2011-03-31 | 株式会社 東芝 | Keyword extraction apparatus and program |
WO2011039848A1 (en) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | Region-of-interest extracting device and program |
US8654359B2 (en) | 2008-06-11 | 2014-02-18 | Konica Minolta Business Technologies, Inc. | Apparatus, method and recording medium for determining document preview modes |
CN104484438A (en) * | 2014-12-23 | 2015-04-01 | 小米科技有限责任公司 | Image processing method and device |
JP2015135668A (en) * | 2014-01-17 | 2015-07-27 | インテル コーポレイション | Computing devices and methods of connecting people based on content and relational distance |
-
2005
- 2005-02-02 JP JP2005025911A patent/JP2006215681A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009164854A (en) * | 2007-12-29 | 2009-07-23 | Canon Software Inc | Information processing apparatus and method of controlling the same, program, and computer readable recording medium |
US8654359B2 (en) | 2008-06-11 | 2014-02-18 | Konica Minolta Business Technologies, Inc. | Apparatus, method and recording medium for determining document preview modes |
WO2011036755A1 (en) * | 2009-09-24 | 2011-03-31 | 株式会社 東芝 | Keyword extraction apparatus and program |
JPWO2011036755A1 (en) * | 2009-09-24 | 2013-02-14 | 株式会社東芝 | Keyword extraction device and program |
JP5238886B2 (en) * | 2009-09-24 | 2013-07-17 | 株式会社東芝 | Keyword extraction device and program |
US8904285B2 (en) | 2009-09-24 | 2014-12-02 | Kabushiki Kaisha Toshiba | Keyword extraction apparatus and program |
WO2011039848A1 (en) * | 2009-09-29 | 2011-04-07 | 株式会社 東芝 | Region-of-interest extracting device and program |
JP5367833B2 (en) * | 2009-09-29 | 2013-12-11 | 株式会社東芝 | Region of interest extraction apparatus and program |
US9141706B2 (en) | 2009-09-29 | 2015-09-22 | Kabushiki Kaisha Toshiba | Region-of-interest extraction apparatus and method |
JP2015135668A (en) * | 2014-01-17 | 2015-07-27 | インテル コーポレイション | Computing devices and methods of connecting people based on content and relational distance |
US10002127B2 (en) | 2014-01-17 | 2018-06-19 | Intel Corporation | Connecting people based on content and relational distance |
CN104484438A (en) * | 2014-12-23 | 2015-04-01 | 小米科技有限责任公司 | Image processing method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9135341B2 (en) | Method and arrangement for paginating and previewing XHTML/HTML formatted information content | |
US10796076B2 (en) | Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine | |
US7908284B1 (en) | Content reference page | |
US7793209B2 (en) | Electronic apparatus with a web page browsing function | |
JP4814575B2 (en) | System and method for displaying content on a small screen computing device | |
US6859909B1 (en) | System and method for annotating web-based documents | |
JP5383234B2 (en) | Information processing apparatus and print control method | |
US8584009B2 (en) | Automatically propagating changes in document access rights for subordinate document components to superordinate document components | |
US20080092051A1 (en) | Method of dynamically creating real time presentations responsive to search expression | |
US10650186B2 (en) | Device, system and method for displaying sectioned documents | |
US9965495B2 (en) | Method and apparatus for saving search query as metadata with an image | |
US7715625B2 (en) | Image processing device, image processing method, and storage medium storing program therefor | |
JP5516918B2 (en) | Image element search | |
US9607105B1 (en) | Content searching techniques | |
EP0384986A2 (en) | Method for displaying online information | |
KR101401250B1 (en) | Method of providing keyword-map for electronic documents, and computer-readable recording medium with keyword-map program for the same | |
JP2012212191A (en) | Information processor and information processing method | |
US8874529B2 (en) | User-determinable method and system for manipulating and displaying textual and graphical information | |
JP2006215681A (en) | Document detail determination support system | |
JP2013012242A (en) | Information processing apparatus, information processing method and program | |
JP2009053928A (en) | Image data processor, image data processing method, and image data display system | |
JP2008046879A (en) | Page display device, page display method, and computer program | |
JP2008117375A (en) | Apparatus and method for editing and displaying web document | |
JP2002049644A (en) | Information processing device, storage medium, and computer program | |
JP5707937B2 (en) | Electronic document conversion apparatus and electronic document conversion method |