[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2005346454A - Method and program for archiving electronic document - Google Patents

Method and program for archiving electronic document Download PDF

Info

Publication number
JP2005346454A
JP2005346454A JP2004165964A JP2004165964A JP2005346454A JP 2005346454 A JP2005346454 A JP 2005346454A JP 2004165964 A JP2004165964 A JP 2004165964A JP 2004165964 A JP2004165964 A JP 2004165964A JP 2005346454 A JP2005346454 A JP 2005346454A
Authority
JP
Japan
Prior art keywords
electronic document
document
search text
file
external medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004165964A
Other languages
Japanese (ja)
Inventor
Takashi Saito
隆 斉藤
Jugo Noda
十悟 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004165964A priority Critical patent/JP2005346454A/en
Publication of JP2005346454A publication Critical patent/JP2005346454A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an archiving method for storing an electronic document in external media so that the electronic document stored in the external media can be easily retrieved and referred to even if a storage period becomes long. <P>SOLUTION: When archiving the electronic document in the external media, such as a DVD, a retrieval text is created from the electronic document, control information for relating the electronic document to the retrieval text is created, and three files of original electronic documents 121-1 to 121-3, retrieval texts 131-1 to 131-3, and control information 111 are stored in the external media. The retrieval text and the control information 111 do not depend on an application that has created the electronic document. Therefore, even if a long period passes after storing the electronic document in the external media and an application that has created the electronic document is replaced, the electronic document stored in the external media is retrieved and referred to easily. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は電子文書のアーカイブ方法及びプログラムに係り、特に、DVDのような外部メディアに電子文書を検索、参照可能にアーカイブする電子文書のアーカイブ方法及びアーカイブのために使用するプログラムに関する。   The present invention relates to an electronic document archiving method and program, and more particularly, to an electronic document archiving method for archiving an electronic document in an external medium such as a DVD so that it can be referred to, and a program used for archiving.

電子文書をDVD等の外部メディアにアーカイブする方法として、OSのファイルシステムを用い、外部メディアに自由にフォルダ階層を作って、そこにファイルを格納するという方法がある。また、他の方法として、文書管理システムが知られている。文書管理システムは、蓄積されている電子文書やその属性情報を外部メディアに出力するためのエクスポート機能やバックアップ機能を備えている。エクスポート機能は、蓄積された文書をファイル出力し、その属性を文書管理システムが決めたCSVやXMLのフォーマットで出力するものである。そして、文書ファイルと属性とを関連付けるために、属性の1つとして文書ファイル名やパス名を含めるのが一般的である。バックアップ機能は、システム障害時用のバックアップが目的であるので、システムのディスク格納イメージを外部メディアにバックアップするか、あるいは、システム独自の形式で文書やその属性を外部メディアに出力するものである。   As a method for archiving an electronic document to an external medium such as a DVD, there is a method in which an OS file system is used, a folder hierarchy is freely created on the external medium, and a file is stored therein. As another method, a document management system is known. The document management system has an export function and a backup function for outputting stored electronic documents and their attribute information to an external medium. The export function outputs a stored document as a file and outputs its attributes in a CSV or XML format determined by the document management system. In order to associate the document file with the attribute, the document file name and the path name are generally included as one of the attributes. Since the backup function is intended for backup in the event of a system failure, the disk storage image of the system is backed up to an external medium, or the document and its attributes are output to the external medium in a system-specific format.

一方、原本性保証のために電子文書を外部メディアにアーカイブする技術が知られている。すなわち、この技術は、Write at Once の外部メディアに電子文書を書き込み、その外部メディア単位に日付と氏名とを自筆記入し、そこに格納されている電子文書の原本性を保証するようにしたものである。この方法は、電子署名を文書につける方法や原本性保証が可能な文書データベースに文書を保存する方法と比べると安価に原本保証を行うことができるというメリットがある。   On the other hand, a technique for archiving an electronic document to an external medium for guaranteeing the originality is known. In other words, this technology writes the electronic document to the Write at Once external media, writes the date and name in the external media unit, and guarantees the originality of the electronic document stored there. It is. This method has the advantage that the original guarantee can be performed at a lower cost than the method of attaching the electronic signature to the document and the method of saving the document in a document database capable of guaranteeing the originality.

なお、DVD等の外部メディアに電子文書をアーカイブする方法に関する従来技術として、例えば、特許文献1等に記載された技術が知られている。
特開平10−74210号公報
As a conventional technique related to a method of archiving an electronic document on an external medium such as a DVD, for example, a technique described in Patent Document 1 is known.
JP-A-10-74210

前述した従来技術による電子文書のアーカイブ方法を使用して外部メディアに格納された電子文書は、長い年月を経るうちにその電子文書をすばやく参照したり検索することが困難になる可能性がある。なぜなら、その長い年月を経るうちにその文書を作成したアプリケーションやそれを格納していた文書管理システムがリプレースされていることが多く、外部メディアに格納した文書やその属性を参照するには、その電子文書を外部メディアに格納するときに使用したアプリケーションやそれを格納していた文書管理システムを用意しなければならないためである。   An electronic document stored on an external medium using the above-described conventional electronic document archiving method may be difficult to quickly browse and search the electronic document over a long period of time. . This is because the application that created the document and the document management system that stored it have been replaced over time, so to refer to the document stored on external media and its attributes, This is because it is necessary to prepare an application used when storing the electronic document in an external medium and a document management system storing the application.

すなわち、アプリケーションがリプレースされていた場合、外部メディアに格納された電子文書が目的とするものであるかどうかを調べるためだけに、電子文書を外部メディアに格納した時点で使用したであろうアプリケーションと、そのアプリケーションが動作するPCとを見つけて、アプリケーションをPCに再インストールすることが必要となる場合が生じる。このため、もし複数種類のアプリケーションを用いて作成された文書が外部メディアに格納されている場合には、それらのアプリケーションを最悪すべて見つけ出してPCにインストールする必要がでてくることになる。   In other words, if the application has been replaced, the application that would have been used when the electronic document was stored on the external medium only to check whether the electronic document stored on the external medium was the target. , It may be necessary to find the PC on which the application runs and reinstall the application on the PC. For this reason, if documents created using a plurality of types of applications are stored in an external medium, it will be necessary to find all those applications and install them on the PC.

また、文書管理システムがリプレースされていた場合、電子文書を外部メディアに格納した時点で使用したであろう文書管理システムのマニュアルを見つけ出して、属性のエクスポート形式を調べて外部メディアに格納された属性値の意味を判断し、目的とする文書であるかどうかを調べることが必要となる場合が生じたり、あるいは、バックアップデータをリカバリできるようにその文書管理システムそのものを再セットアップしなければならない場合が生じる。   Also, if the document management system has been replaced, find the manual of the document management system that would have been used when the electronic document was stored on the external media, check the attribute export format, and store the attributes stored on the external media. It may be necessary to determine the meaning of the value and check whether it is the target document, or the document management system itself may need to be re-setup so that the backup data can be recovered. Arise.

本発明の目的は、前述に鑑みて、外部メディアにアーカイブされた電子文書が長い年月が経った後でも、その外部メディアに格納した電子文書を容易に検索、参照することができるように電子文書を外部メディアに格納する電子文書のアーカイブ方法及びプログラムを提供することにある。   In view of the foregoing, the object of the present invention is to make it possible to easily search and refer to an electronic document stored in an external medium even after a long time has passed. An object of the present invention is to provide an electronic document archiving method and program for storing a document in an external medium.

本発明によれば前記目的は、情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする電子文書のアーカイブ方法において、電子文書から検索テキストを作成し、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける制御情報を作成し、電子文書と検索テキストと制御情報とのファイルを外部メディアに格納することにより達成される。   According to the present invention, an object of the present invention is to provide an electronic document archiving method for searching an electronic document on an external medium using an information processing apparatus and archiving the electronic document so that the electronic document can be referred to. This is achieved by creating control information that associates the file position of the document with the file position of the search text, and storing the file of the electronic document, the search text, and the control information in an external medium.

また、前記目的は、情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする電子文書のアーカイブ方法において、電子文書から検索テキストを作成し、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける情報を作成すると共に、この情報と前記検索テキストとを含む制御情報を作成し、電子文書と制御情報とのファイルを外部メディアに格納することにより達成される。   Another object of the present invention is to provide an electronic document archiving method in which an electronic document is retrieved to an external medium using an information processing apparatus and archived so that the electronic document can be referred to, and a search text is created from the electronic document and stored in the external medium Achieved by creating information associating the position with the file position of the search text, creating control information including this information and the search text, and storing the file of the electronic document and the control information in an external medium Is done.

本発明によれば、電子文書を格納した外部メディアを長期間に渡って保管した場合にも、必要なときにその電子文書をすばやく検索して参照することができる。   According to the present invention, even when an external medium storing an electronic document is stored for a long period of time, the electronic document can be quickly searched and referenced when necessary.

以下、本発明による電子文書のアーカイブ方法の実施形態を図面により詳細に説明する。なお、以下に説明する本発明の実施形態は、外部メディアの一例としてDVDを用いるものとしているが、外部メディアとしては、DVDでなくてもよく、例えば、CD、MO等どのようなメディアであってもよい。   Hereinafter, an embodiment of an electronic document archiving method according to the present invention will be described in detail with reference to the drawings. In the embodiment of the present invention described below, a DVD is used as an example of an external medium. However, the external medium may not be a DVD, for example, any medium such as a CD or an MO. May be.

図1は電子文書をDVDにアーカイブしたときのDVDのフォルダ構造及びファイル配置の例について説明する図である。図1において、100はDVDアーカイバ、110はルートフォルダ、111は制御ファイル、120は「ORIGINAL」フォルダ、121(121−1〜121−3)はオリジナル文書、130は「RETRIEVAL」フォルダ、130(130−1〜130−3)は検索テキストファイルである。   FIG. 1 is a diagram for explaining an example of the folder structure and file arrangement of a DVD when an electronic document is archived on a DVD. In FIG. 1, 100 is a DVD archiver, 110 is a root folder, 111 is a control file, 120 is an “ORIGINAL” folder, 121 (121-1 to 121-3) is an original document, 130 is a “RETRIEVAL” folder, and 130 (130 -1 to 130-3) are search text files.

DVDアーカイバ100は、ルートフォルダ110が設けられ、このルートフォルダの下位に、図1に示すように、複数のフォルダ、ファイルが階層状に設けられて構成される。ルートフォルダ110には、電子文書をアーカイブするときにユーザが設定した名前が表示されている。図1に示す例では、「発注契約」という文字列と契約を識別するための番号とが表示されている。ルートフォルダ110の直下には、以下に説明する1つのファイルと2つのフォルダとがある。   The DVD archiver 100 is provided with a root folder 110, and a plurality of folders and files are provided in a hierarchical structure below the root folder as shown in FIG. In the root folder 110, a name set by the user when the electronic document is archived is displayed. In the example shown in FIG. 1, a character string “ordering contract” and a number for identifying the contract are displayed. Immediately below the root folder 110 are one file and two folders described below.

ルートフォルダ110の直下にある1つのファイルは、制御ファイル111であり、この制御ファイル111は、DVDアーカイバ100に電子文書を格納する形式に関する情報をもち、図1に示す例では、XML形式で記述されている。   One file directly under the root folder 110 is a control file 111. This control file 111 has information on a format for storing an electronic document in the DVD archiver 100, and is described in the XML format in the example shown in FIG. Has been.

制御ファイル111の下位にある2つのフォルダは、「ORIGINAL」フォルダ120と「RETRIEVAL」フォルダ130とである。「ORIGINAL」フォルダ120は、電子文書をまとめて格納するフォルダであり、その直下にユニークなファイル名を持った1または複数のオリジナル文書121が置かれる。図1に示す例では、3つのオリジナル文書121−1〜121−3が置かれている。「RETRIEVAL」フォルダ130は、オリジナル文書121を検索するときに用いるテキストファイルを格納するフォルダであり、その直下にユニークなファイル名を持った検索テキストファイル131が置かれる。図1に示す例では、3つの検索テキストファイル131−1〜131−3が置かれている。   Two folders below the control file 111 are an “ORIGINAL” folder 120 and a “RETRIEVAL” folder 130. The “ORIGINAL” folder 120 is a folder in which electronic documents are stored together, and one or a plurality of original documents 121 having unique file names are placed immediately below the folder. In the example shown in FIG. 1, three original documents 121-1 to 121-3 are placed. The “RETRIEVAL” folder 130 stores a text file used when searching for the original document 121, and a search text file 131 having a unique file name is placed immediately below the folder. In the example shown in FIG. 1, three search text files 131-1 to 131-3 are placed.

図2は制御ファイル111の構成例について説明する図である。図2において、210はアーカイブ情報、220(220−1〜220−3)はオリジナル文書情報である。   FIG. 2 is a diagram for explaining a configuration example of the control file 111. In FIG. 2, 210 is archive information, and 220 (220-1 to 220-3) is original document information.

制御ファイル111には、アーカイブ情報210とオリジナル文書情報220−1〜220−3との2種類の情報が格納される。アーカイブ情報210は、DVDアーカイバ100に格納されるオリジナル文書121からなるアーカイブに関する情報であり、図2に示す例では、アーカイブ名211、アーカイブの作成者212、アーカイブの作成日213を保持する。オリジナル文書情報220は、DVDアーカイバ100に格納されるオリジナル文書121−1〜121−3に関する情報である。ここで説明している例では、複数のオリジナル文書121−1〜121−3を格納しているとしているので、このオリジナル文書情報220も、オリジナル文書情報220−1〜220−3として示すように、その数だけ存在する。そして、このオリジナル文書情報220−1〜220−3には、オリジナル文書121−1〜121−3のそれぞれに対して、オリジナル文書のタイトル221−1〜221−3、それぞれのオリジナル文書に対する検索テキストファイル131−1〜131−3の格納パス222−1〜222−3、それぞれのオリジナル文書の格納パス223−1〜223−3の3つが保持される。   The control file 111 stores two types of information: archive information 210 and original document information 220-1 to 220-3. The archive information 210 is information relating to an archive made up of the original document 121 stored in the DVD archiver 100. In the example shown in FIG. 2, the archive name 211, the archive creator 212, and the archive creation date 213 are retained. The original document information 220 is information related to the original documents 121-1 to 121-3 stored in the DVD archiver 100. In the example described here, since a plurality of original documents 121-1 to 121-3 are stored, the original document information 220 is also represented as original document information 220-1 to 220-3. There are as many as that. In the original document information 220-1 to 220-3, the original document titles 221-1 to 221-3 and the search text for each original document are stored for each of the original documents 121-1 to 121-3. Three storage paths 222-1 to 222-3 of the files 131-1 to 131-3 and storage paths 223-1 to 223-3 of the original documents are held.

前述したように構成されるDVDアーカイバにおいて、制御ファイル111及び「RETRIEVAL」フォルダ130は、アプリケーションには依存しないものであり、このDVDアーカイブを作成したアプリケーションでなくても読み取ることができる。このため、このDVDアーカイブを長期に渡って保存した後に読み出そうとしたときに、アプリケーションがリプレースされていた場合にも読み出すことができる。そして、後述するように、このDVDアーカイブを検索した結果により、必要なオリジナル文書を読み出そうとして読み込めない場合にも、そのアーカイブされたオリジナル文書に付与されている属性情報、例えば、拡張子等により、そのDVDアーカイブを作成したアプリケーションを知ることができ、そのアプリケーションを探して情報処理装置にインストールすることにより、オリジナル文書を読み出すことが可能となる。   In the DVD archiver configured as described above, the control file 111 and the “RETRIEVAL” folder 130 do not depend on the application, and can be read even if it is not the application that created this DVD archive. For this reason, when this DVD archive is stored for a long period of time and then an attempt is made to read it, it can be read even if the application has been replaced. As will be described later, the attribute information given to the archived original document, for example, the extension, etc., even when the necessary original document cannot be read as a result of searching the DVD archive, as will be described later Thus, the application that created the DVD archive can be known, and the original document can be read by searching for the application and installing it in the information processing apparatus.

図3はDVDアーカイブを作成する処理動作を説明するフローチャートであり、次に、これについて説明する。なお、ここでの処理及び以後に説明する本発明の実施形態での処理は、DVDドライバを有するPC等を用いて、PCを構成するCPUがプログラムを実行することにより行うものであり、その構成例については後述する。   FIG. 3 is a flowchart for explaining a processing operation for creating a DVD archive, which will be described next. Note that the processing here and the processing in the embodiment of the present invention to be described later are performed by executing a program by a CPU that constitutes the PC using a PC having a DVD driver. Examples will be described later.

(1)まず、ハードディスク上にDVDに焼き付けるイメージを作成する。そのイメージ上に文書格納用の「ORIGINAL」フォルダ120と検索テキスト用の「RETRIEVAL」フォルダ130との2つを作成する(ステップ301)。 (1) First, an image to be burned on a DVD is created on a hard disk. Two "ORIGINAL" folders 120 for storing documents and "RETRIEVAL" folders 130 for search text are created on the image (step 301).

(2)ユーザが指定したオリジナル文書121の1つを取り出す。もし、この機能が文書管理システムに属するものであれば、ユーザが指定した文書管理システムの中の文書をそのデータベースから取り出す処理を行う(ステップ302)。 (2) Take out one of the original documents 121 designated by the user. If this function belongs to the document management system, a process for retrieving a document in the document management system designated by the user from the database is performed (step 302).

(3)オリジナル文書121のファイル名をDVDに格納する単位でユニークとなるように付け替えて、ハードディスク上のDVDイメージにある「ORIGINAL」フォルダ120に格納する(ステップ303)。 (3) The file name of the original document 121 is changed so as to be unique for each unit stored in the DVD, and is stored in the “ORIGINAL” folder 120 in the DVD image on the hard disk (step 303).

(4)オリジナル文書121から検索テキストを抽出する。検索テキストの抽出方法としては種々のものがあり、例えば、オリジナル文書121がTIFFであればOCRにより検索テキストを抽出することができる。また、オリジナル文書121がワープロ文書であればその制御コードを取り除くことにより検索テキストを抽出することができる。また、オリジナル文書121がPDFのようにオリジナル文書中にテキストを持つアプリケーション文書であれば、オリジナル文書に含まれるテキストをそのまま抽出すればよい。さらに、オリジナル文書121がXML文書であれば、それをそのまま検索テキストとして用いてもよいし、そこから一部を抜き出して検索テキストとして使用してもよい(ステップ304)。 (4) Extract the search text from the original document 121. There are various search text extraction methods. For example, if the original document 121 is TIFF, the search text can be extracted by OCR. If the original document 121 is a word processor document, the search text can be extracted by removing the control code. Further, if the original document 121 is an application document having text in the original document such as PDF, the text included in the original document may be extracted as it is. Furthermore, if the original document 121 is an XML document, it may be used as a search text as it is, or a part may be extracted from it and used as a search text (step 304).

(5)ステップ304の処理で抽出された検索テキストをDVDに格納する単位でユニークとなるような名前の検索テキストファイル131に出力し、ハードディスク上のDVDイメージにある「RETRIEVAL」フォルダ130に格納する(ステップ305)。 (5) The search text extracted in the process of step 304 is output to a search text file 131 having a unique name for each unit stored in the DVD and stored in the “RETRIEVAL” folder 130 in the DVD image on the hard disk. (Step 305).

(6)DVDイメージとして格納したオリジナル文書ファイル121と検索テキストファイル131とを関連づける制御データを作成し、制御ファイル111に格納する(ステップ306)。 (6) Control data for associating the original document file 121 stored as a DVD image with the search text file 131 is created and stored in the control file 111 (step 306).

(7)DVDに格納すべきオリジナル文書121が他にあるか否かを調べ、他に格納すべきオリジナル文書121があれば、ステップ302からの処理に戻って処理を繰り返し、そのオリジナル文書121に対する処理を行う(ステップ307)。 (7) It is checked whether or not there is another original document 121 to be stored on the DVD. If there is another original document 121 to be stored, the process returns to step 302 and the process is repeated. Processing is performed (step 307).

(8)ステップ307の調べで、他に格納すべき文書がなくなった場合、制御ファイル111をハードディスク上のDVDイメージにあるルートフォルダ110に格納する(ステップ308)。 (8) If there are no more documents to be stored in step 307, the control file 111 is stored in the root folder 110 in the DVD image on the hard disk (step 308).

(9)最後に、ハードディスク上のDVDイメージをDVDに焼き付ける(ステップ309)。 (9) Finally, the DVD image on the hard disk is burned onto the DVD (step 309).

前述した処理により電子文書が外部メディアであるDVDにアーカイブされたことになり、作成されたDVDアーカイバ100を長期に渡って保存することが可能となる。   Through the above-described processing, the electronic document is archived on a DVD as an external medium, and the created DVD archiver 100 can be stored for a long period of time.

図4はWebツールを用いてDVDアーカイバ100にあるオリジナル文書を検索、参照する場合のWebツールの検索画面例を示す図である。   FIG. 4 is a view showing an example of a search screen of the Web tool when searching and referring to the original document in the DVD archiver 100 using the Web tool.

検索画面は、図4に示すように、以下に説明する3つの表示領域400、410、420により構成される。表示領域400は、DVDに格納されているアーカイブに関する情報であるアーカイブ名401、アーカイブ作成者402、アーカイブ作成日403を表示する領域であり、表示領域410は、DVDアーカイバ100の検索用領域であり、ユーザが検索キーを入力する領域411とユーザが検索実行時にクリックする「検索実行」ボタン412を表示する領域である。また、表示領域420は、「検索実行」ボタン412をクリックしてDVDアーカイバ100を検索した結果一覧を表示する領域である。表示された検索結果421−1、421−2は、表示名としてオリジナル文書121のタイトル221を表示すると共に、DVDアーカイバ100中のオリジナル文書121−1〜121−3を参照するためのアンカーとなっている。そのため、ユーザが検索結果421に表示されたタイトル221を見て目的とするオリジナル文書121に当りをつけると、そのアンカーをクリックすることによりそのオリジナル文書121を表示することができる。   As shown in FIG. 4, the search screen includes three display areas 400, 410, and 420 described below. The display area 400 is an area for displaying the archive name 401, the archive creator 402, and the archive creation date 403, which are information related to the archive stored on the DVD, and the display area 410 is a search area of the DVD archiver 100. In this area, an area 411 in which the user inputs a search key and an “execute search” button 412 that the user clicks when executing the search are displayed. The display area 420 is an area for displaying a list of results obtained by searching the DVD archiver 100 by clicking the “Search” button 412. The displayed search results 421-1 and 421-2 display the title 221 of the original document 121 as a display name, and serve as anchors for referring to the original documents 121-1 to 121-3 in the DVD archiver 100. ing. Therefore, when the user hits the target original document 121 by looking at the title 221 displayed in the search result 421, the original document 121 can be displayed by clicking the anchor.

図5はWebツールを用いてDVDアーカイバ100を検索する処理動作を説明するフローチャートであり、次に、これについて説明する。   FIG. 5 is a flowchart for explaining the processing operation for searching the DVD archiver 100 using the Web tool. Next, this will be explained.

(1)まず、DVDアーカイバ100の検索画面400をWebブラウザ上に表示し、この画面を用いて、ユーザが検索キーの入力領域411に入力した文字列を検索キーとして読み込む(ステップ501、502)。 (1) First, the search screen 400 of the DVD archiver 100 is displayed on the Web browser, and using this screen, the character string input by the user in the search key input area 411 is read as a search key (steps 501 and 502). .

(2)次に、DVDアーカイバ100から制御ファイル111を読み込んで、制御ファイル111の中の検索テキストファイルパス222から検索テキストファイル131のパスを取り出す(ステップ503、504)。 (2) Next, the control file 111 is read from the DVD archiver 100, and the path of the search text file 131 is extracted from the search text file path 222 in the control file 111 (steps 503 and 504).

(3)ステップ504の処理で取り出したパスを元に、DVDアーカイバ100より検索テキストファイル131を取り出し、取り出した検索テキストファイル131を対象として、ステップ502の処理で読み込んだ検索キーが含まれるか否かを調べる(ステップ505、506)。 (3) Based on the path extracted in the process of step 504, the search text file 131 is extracted from the DVD archiver 100. Whether the search key read in the process of step 502 is included for the extracted search text file 131 is included. (Steps 505 and 506).

(4)ステップ506の調べで、検索キーが検索テキストファイル131に含まれていた場合、その検索テキストファイルパス222に対応するタイトル221とオリジナル文書ファイルパス223とをヒット文書リストとしてメモリに記憶する(ステップ507)。 (4) If the search key is included in the search text file 131 in step 506, the title 221 and the original document file path 223 corresponding to the search text file path 222 are stored in the memory as a hit document list. (Step 507).

(5)次に、制御ファイル111の中に他の検索テキストファイルパス222があるか否かを調べ、他に検索テキストファイルパス222があれば、ステップ504からの処理に戻って処理を繰り返し、その検索テキストファイルパス222を対象にステップ504以降の処理を行う(ステップ508)。 (5) Next, it is checked whether or not there is another search text file path 222 in the control file 111. If there is another search text file path 222, the process returns to step 504 and the process is repeated. The processing after step 504 is performed for the search text file path 222 (step 508).

(6)ステップ508の調べで、他に検索テキストファイルパス222がなかった場合、メモリに記憶されたヒット文書リストからタイトル221とオリジナル文書ファイルの格納パス223とを取り出し、検索結果一覧を表示する表示領域420の画面(HTML)を作成し、その画面を、Webブラウザ上の表示領域420に表示する(ステップ509、510)。 (6) If no other search text file path 222 is found in step 508, the title 221 and the original document file storage path 223 are extracted from the hit document list stored in the memory, and the search result list is displayed. A screen (HTML) of the display area 420 is created, and the screen is displayed on the display area 420 on the Web browser (steps 509 and 510).

図6は電子文書をDVDにアーカイブしたときの図1により説明したものとは異なるDVDのフォルダ構造及びファイル配置の例について説明する図である。図6において、600はDVDアーカイバ、610はルートフォルダ、611は制御ファイル、620は「ORIGINAL」フォルダ、621(621−1〜621−3)はオリジナル文書である。   FIG. 6 is a diagram for explaining an example of the folder structure and file arrangement of a DVD different from that explained with reference to FIG. 1 when an electronic document is archived on a DVD. In FIG. 6, 600 is a DVD archiver, 610 is a root folder, 611 is a control file, 620 is an "ORIGINAL" folder, and 621 (6211-1 to 621-3) is an original document.

図6に示す例は、図1における検索テキストファイル131−1〜131−3及びこれらの検索テキストを格納する「RETRIEVAL」フォルダ130をなくし、検索テキストを制御ファイル611に格納するようにしたものである。但し、オリジナル文書621自体は図1の場合と同様に「ORIGINAL」フォルダ620に格納される。   In the example shown in FIG. 6, the search text files 131-1 to 131-3 and the “RETRIEVAL” folder 130 for storing these search texts are deleted and the search text is stored in the control file 611. is there. However, the original document 621 itself is stored in the “ORIGINAL” folder 620 as in the case of FIG.

図7は制御ファイル611の構成例について説明する図である。図7において、710はアーカイブ情報、720(720−1〜720−3)はオリジナル文書情報である。   FIG. 7 is a diagram for explaining a configuration example of the control file 611. In FIG. 7, 710 is archive information, and 720 (720-1 to 720-3) is original document information.

制御ファイル611には、アーカイブ情報710とオリジナル文書情報720−1〜720−3との2種類の情報が格納される。アーカイブ情報710は、DVDアーカイバ600に格納されるオリジナル文書621からなるアーカイブに関する情報であり、図7に示す例では、アーカイブ名711、アーカイブの作成者712、アーカイブの作成日713を保持する。オリジナル文書情報720は、DVDアーカイバ600に格納されるオリジナル文書621−1〜621−3に関する情報である。ここで説明している例では、複数のオリジナル文書621−1〜621−3を格納しているとしているので、この情報も720−1〜720−3としてその数だけ繰り返されることになる。すなわち、オリジナル文書情報720−1〜720−3のそれぞれには、図7に示すように、オリジナル文書621−1〜621−3のそれぞれに対して、オリジナル文書のタイトル721−1〜721−3、それぞれのオリジナル文書から作成された検索テキスト722−1〜722−3、オリジナル文書の621−1〜621−3の格納パス723−1〜723−3の3つが保持される。   The control file 611 stores two types of information: archive information 710 and original document information 720-1 to 720-3. The archive information 710 is information relating to an archive composed of the original document 621 stored in the DVD archiver 600. In the example shown in FIG. The original document information 720 is information related to the original documents 621-1 to 621-3 stored in the DVD archiver 600. In the example described here, since a plurality of original documents 621-1 to 621-3 are stored, this information is also repeated as many as 720-1 to 720-3. That is, in each of the original document information 720-1 to 720-3, as shown in FIG. 7, the titles 721-1 to 721-3 of the original document with respect to the original documents 621-1 to 621-3, respectively. The search text 722-1 to 722-3 created from each original document and the storage paths 723-1 to 723-3 of the original documents 621-1 to 621-3 are held.

図8は図4の場合と同様なWebツールを用いてDVDアーカイバ600にあるオリジナル文書を検索、参照する場合のWebツールの検索画面例を示す図である。   FIG. 8 is a diagram showing an example of a Web tool search screen when searching and referring to an original document in the DVD archiver 600 using the same Web tool as in FIG.

検索画面は、図8に示すように、以下に説明する3つの表示領域800、810、820により、図4の場合と同様に構成されるが、表示領域800に表示される項目が図4における表示領域400と異なる。   As shown in FIG. 8, the search screen is configured by three display areas 800, 810, and 820 described below in the same manner as in FIG. 4, but items displayed in the display area 800 are the same as those in FIG. Different from the display area 400.

表示領域800は、DVDアーカイバ600に格納するアーカイブ情報であるアーカイブ名801、アーカイブ作成者802、アーカイブ作成日803、特徴語804を表示する。すなわち、表示領域800には、オリジナル文書621群が格納されたDVDアーカイバ600を特徴づける単語を検索テキストから抽出し、それを表示項目として特徴語804が表示されることが図4の場合と異なる。このような表示の機能により、ユーザは、DVDアーカイバ600を指定するだけでそこに含まれるオリジナル文書621の概要を知ることができ、目的とするオリジナル文書621が格納されているDVDアーカイバ0600を探し出すことが容易になる。そして、表示領域820には、図4の場合と同様に検索結果の一覧が表示される。   The display area 800 displays an archive name 801, archive creator 802, archive creation date 803, and feature word 804 that are archive information stored in the DVD archiver 600. That is, the display area 800 is different from the case of FIG. 4 in that a word characterizing the DVD archiver 600 storing the original document 621 group is extracted from the search text and the feature word 804 is displayed as a display item. . With such a display function, the user can know the outline of the original document 621 included in the DVD archiver 600 simply by specifying the DVD archiver 600, and find the DVD archiver 0600 in which the original document 621 is stored. It becomes easy. In the display area 820, a list of search results is displayed as in the case of FIG.

図9は特徴語804として表示する単語を抽出する処理動作を説明するフローチャートであり、次に、これについて説明する。   FIG. 9 is a flowchart for explaining a processing operation for extracting a word to be displayed as the feature word 804. Next, this will be described.

(1)まず、ユーザが指定したDVDアーカイバ600の中の制御ファイル611を読み込み、関連のある電子文書621一式が複数のDVDアーカイバ600に分けて保管されていることがあるので、読み込むべきDVDアーカイバ600が他にあるか否かを判定しする(ステップ901、902)。 (1) First, the control file 611 in the DVD archiver 600 designated by the user is read, and a set of related electronic documents 621 may be divided and stored in a plurality of DVD archivers 600. It is determined whether there is another 600 (steps 901 and 902).

(2)ステップ902の判定で、他に読み込むべきDVDアーカイバ600があった場合、ステップ901の処理に戻って、ユーザが指定したDVDアーカイバ600の中の制御ファイル611を読み込む処理を続ける。 (2) If it is determined in step 902 that there is another DVD archiver 600 to be read, the process returns to step 901 to continue the process of reading the control file 611 in the DVD archiver 600 designated by the user.

(3)ステップ902の判定で、他に読み込むべきDVDアーカイバ600がなかった場合、ステップ901の処理で読み込んだ全ての制御ファイル611の中の検索テキスト722の部分を抜き出す(ステップ903)。 (3) If it is determined in step 902 that there is no other DVD archiver 600 to be read, the search text 722 portion in all the control files 611 read in the process in step 901 is extracted (step 903).

(4)抜き出した検索テキスト722に含まれる単語から特徴語を抽出する。特徴語の抽出に関する技術としては、例えば、前述で示した特許文献1等に記載されてよく知られている技術等を使用すればよく、ここでの説明は省略する(ステップ904)。 (4) A feature word is extracted from words included in the extracted search text 722. As a technique relating to feature word extraction, for example, a technique well-known in Patent Document 1 described above may be used, and the description thereof is omitted (step 904).

(5)ステップ904の処理で、ユーザが指定したDVDアーカイバ600を特徴づける単語として抽出したた特徴語を表示領域800の特徴語804の表示領域に表示する(ステップ905)。 (5) The feature word extracted as a word characterizing the DVD archiver 600 specified by the user in the process of step 904 is displayed in the display area of the feature word 804 in the display area 800 (step 905).

前述した本発明の実施形態における各処理は、処理プログラムとして構成することができ、この処理プログラムは、HD、DAT、FD、MO、DVD−ROM、CD−ROM等の記録媒体に格納して提供することができる。   Each processing in the above-described embodiment of the present invention can be configured as a processing program, and this processing program is stored in a recording medium such as HD, DAT, FD, MO, DVD-ROM, and CD-ROM and provided. can do.

図10は本発明の実施形態での各処理を実行する情報処理装置の構成例を示すブロック図である。図10において、10はCPU、11はDVDドライブ、12はHDドライブ、13はキーボード、14は表示装置、15は主メモリ(MM)、16はOS、17、18はアプリケーションシステム(AP)、19はデータ領域である。   FIG. 10 is a block diagram illustrating a configuration example of an information processing apparatus that executes each process according to the embodiment of the present invention. In FIG. 10, 10 is a CPU, 11 is a DVD drive, 12 is an HD drive, 13 is a keyboard, 14 is a display device, 15 is a main memory (MM), 16 is an OS, 17 and 18 are application systems (AP), 19 Is a data area.

本発明の実施形態での処理を実行する情報処理装置は、PC、WS等であってよく、図10に示すように、CPU10、DVDドライブ11、HDドライブ12、キーボード13、表示装置14、主メモリ15を備えて構成され、主メモリ15には、OS16、複数のアプリケーションシステム17、18が格納され、さらに、データ領域19が備えられている。OS16、複数のアプリケーションシステム17、18は、通常、ハードディスクに格納されており、情報処理装置が立ち上げられたとき、OS15が主メモリ15内にダウンロードされ、また、必要なアプリケーションシステムが主メモリ15内にダウンロードされる。アプリケーションシステムの1つは、本発明の実施形態での処理のためのプログラムであり、OS16の制御の下にCPU10により実行される。   The information processing apparatus that executes the processing in the embodiment of the present invention may be a PC, WS, or the like. As shown in FIG. 10, the CPU 10, the DVD drive 11, the HD drive 12, the keyboard 13, the display device 14, the main device, and the like. The main memory 15 includes an OS 16, a plurality of application systems 17 and 18, and a data area 19. The OS 16 and the plurality of application systems 17 and 18 are normally stored in the hard disk. When the information processing apparatus is started up, the OS 15 is downloaded into the main memory 15, and the necessary application system is the main memory 15. Downloaded in. One of the application systems is a program for processing in the embodiment of the present invention, and is executed by the CPU 10 under the control of the OS 16.

電子文書をDVDにアーカイブしたときのDVDのフォルダ構造及びファイル配置の例について説明する図である。It is a figure explaining the example of the folder structure and file arrangement | positioning of DVD when an electronic document is archived on DVD. 制御ファイルの構成例について説明する図である。It is a figure explaining the structural example of a control file. DVDアーカイブを作成する処理動作を説明するフローチャートである。It is a flowchart explaining the processing operation | movement which produces a DVD archive. Webツールを用いてDVDアーカイバにあるオリジナル文書を検索、参照する場合のWebツールの検索画面例を示す図である。It is a figure which shows the example of a search screen of a Web tool when searching and referring to the original document in a DVD archiver using a Web tool. Webツールを用いてDVDアーカイバを検索する処理動作を説明するフローチャートである。It is a flowchart explaining the processing operation | movement which searches a DVD archiver using a web tool. 電子文書をDVDにアーカイブしたときの図1により説明したものとは異なるDVDのフォルダ構造及びファイル配置の例について説明する図である。It is a figure explaining the example of the folder structure and file arrangement | positioning of DVD different from what was demonstrated by FIG. 1 when an electronic document is archived on DVD. 図6における制御ファイルの構成例について説明する図である。It is a figure explaining the structural example of the control file in FIG. 図4の場合と同様なWebツールを用いて図6に示すDVDアーカイバにあるオリジナル文書を検索、参照する場合のWebツールの検索画面例を示す図である。FIG. 7 is a diagram showing an example of a Web tool search screen when searching and referring to the original document in the DVD archiver shown in FIG. 6 using the same Web tool as in FIG. 4. 特徴語として表示する単語を抽出する処理動作を説明するフローチャートである。It is a flowchart explaining the processing operation which extracts the word displayed as a feature word. 本発明の実施形態での各処理を実行する情報処理装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the information processing apparatus which performs each process in embodiment of this invention.

符号の説明Explanation of symbols

10 CPU
11 DVDドライブ
12 HDドライブ
13 キーボード
14 表示装置
15 主メモリ(MM)
16 OS
17、18 アプリケーションシステム(AP)
19 データ領域
100、600 DVDアーカイバ
110、610 ルートフォルダ
111、611 制御ファイル
120、620 「ORIGINAL」フォルダ
121(121-1〜121-3)、621(621-1〜621-3) オリジナル文書
130 「RETRIEVAL」フォルダ
130(130−1〜130−3) 検索テキストファイル
210、710 アーカイブ情報
220(220-1〜220-3)、720(720-1〜720-3) オリジナル文書情報
10 CPU
11 DVD drive 12 HD drive 13 Keyboard 14 Display device 15 Main memory (MM)
16 OS
17, 18 Application system (AP)
19 Data area 100, 600 DVD archiver 110, 610 Root folder 111, 611 Control file 120, 620 “ORIGINAL” folder 121 (121-1 to 121-3), 621 (621-1 to 621-3) Original document 130 “ "RETRIEVAL" folder 130 (130-1 to 130-3) Search text file 210, 710 Archive information 220 (220-1 to 220-3), 720 (720-1 to 720-3) Original document information

Claims (7)

情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする電子文書のアーカイブ方法において、電子文書から検索テキストを作成し、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける制御情報を作成し、電子文書と検索テキストと制御情報とのファイルを外部メディアに格納することを特徴とする電子文書のアーカイブ方法。 In an electronic document archiving method in which an electronic document is searched and archived so as to be referable on an external medium using an information processing apparatus, a search text is created from the electronic document and the file position of the electronic document stored in the external medium and the search text A method of archiving an electronic document, comprising: creating control information that associates a file position with each other; and storing a file of the electronic document, search text, and control information in an external medium. 情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする電子文書のアーカイブ方法において、電子文書から検索テキストを作成し、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける情報を作成すると共に、この情報と前記検索テキストとを含む制御情報を作成し、電子文書と制御情報とのファイルを外部メディアに格納することを特徴とする電子文書のアーカイブ方法。 In an electronic document archiving method in which an electronic document is searched and archived so as to be referable on an external medium using an information processing apparatus, a search text is created from the electronic document and the file position of the electronic document stored in the external medium and the search text An electronic document archive characterized by creating information associating a file position, creating control information including this information and the search text, and storing the electronic document and control information file in an external medium Method. 前記電子文書からの検索テキストの作成は、電子文書がイメージ文書である場合、そのイメージ文書をOCRして検索テキストを作成することにより、また、電子文書がテキストを含むアプリケーション文書である場合、その電子文書からテキストを抽出して検索テキストを作成することにより行われることを特徴とする請求項1または2記載の電子文書のアーカイブ方法。 When the electronic document is an image document, the search text is created by OCRing the image document to create the search text, and when the electronic document is an application document including the text, 3. The electronic document archiving method according to claim 1, wherein the method is performed by extracting text from the electronic document and creating a search text. 前記電子文書をアーカイブした外部メディアの検索テキストを対象に全文検索を行い、検索結果からヒットした検索テキストと対応付けられた電子文書のファイル位置を取り出すことを特徴とする請求項1記載の電子文書のアーカイブ方法。 2. The electronic document according to claim 1, wherein a full-text search is performed on a search text of an external medium in which the electronic document is archived, and a file position of the electronic document associated with the searched search text is extracted from the search result. Archiving method. 前記検索テキストから特徴語を抽出して、表示することを特徴とする請求項4記載の電子文書のアーカイブ方法。 5. The electronic document archiving method according to claim 4, wherein feature words are extracted from the search text and displayed. 情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする処理プログラムであって、電子文書から検索テキストを作成する処理と、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける制御情報を作成する処理と、電子文書と検索テキストと制御情報とのファイルを外部メディアに格納する処理とを実行させることを特徴とする処理プログラム。 A processing program for searching and archiving an electronic document on an external medium using an information processing apparatus, the processing program creating search text from the electronic document, the file position of the electronic document stored on the external medium, and the search text A processing program for executing a process for creating control information for associating a file position of a file and a process for storing a file of an electronic document, a search text, and control information in an external medium. 情報処理装置を用いて外部メディアに電子文書を検索、参照可能にアーカイブする処理プログラムであって、電子文書から検索テキストを作成する処理と、外部メディアに格納する電子文書のファイル位置と前記検索テキストのファイル位置とを対応づける情報を作成すると共に、この情報と前記検索テキストとを含む制御情報を作成する処理と、電子文書と制御情報とのファイルを外部メディアに格納する処理とを実行させることを特徴とする処理プログラム。
A processing program for searching and archiving an electronic document on an external medium using an information processing apparatus, the processing program creating search text from the electronic document, the file position of the electronic document stored on the external medium, and the search text Creating information for associating the file position of the document, creating control information including the information and the search text, and storing the file of the electronic document and the control information in an external medium. A processing program characterized by
JP2004165964A 2004-06-03 2004-06-03 Method and program for archiving electronic document Pending JP2005346454A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004165964A JP2005346454A (en) 2004-06-03 2004-06-03 Method and program for archiving electronic document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004165964A JP2005346454A (en) 2004-06-03 2004-06-03 Method and program for archiving electronic document

Publications (1)

Publication Number Publication Date
JP2005346454A true JP2005346454A (en) 2005-12-15

Family

ID=35498765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004165964A Pending JP2005346454A (en) 2004-06-03 2004-06-03 Method and program for archiving electronic document

Country Status (1)

Country Link
JP (1) JP2005346454A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008186053A (en) * 2007-01-26 2008-08-14 Nec Corp File management device, file management method and file management program
JP2010039966A (en) * 2008-08-08 2010-02-18 Hitachi Ltd Data management method
JP6940111B1 (en) * 2021-03-18 2021-09-22 システム・プランニング 株式会社 Data archiving system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008186053A (en) * 2007-01-26 2008-08-14 Nec Corp File management device, file management method and file management program
JP2010039966A (en) * 2008-08-08 2010-02-18 Hitachi Ltd Data management method
JP6940111B1 (en) * 2021-03-18 2021-09-22 システム・プランニング 株式会社 Data archiving system
JP2022143712A (en) * 2021-03-18 2022-10-03 システム・プランニング 株式会社 Data archive system

Similar Documents

Publication Publication Date Title
KR101130366B1 (en) Method, medium, and system for recovering data using a timeline-based computing environment
US7590939B2 (en) Storage and utilization of slide presentation slides
JP4477689B2 (en) Annotating documents in collaborative applications with data from different information systems
US8312388B2 (en) Information processing apparatus, information processing method and computer readable medium
TWI393051B (en) Management and use of data in a computer-generated document
US20100306171A1 (en) Timeline Experience for Restore User Interface
US7546533B2 (en) Storage and utilization of slide presentation slides
US20140007014A1 (en) Method For Graphical Representation Of A Content Collection
US20060294468A1 (en) Storage and utilization of slide presentation slides
US8204916B2 (en) Hierarchical presentation of search results
US20120210298A1 (en) Locating changes in source code
US7305629B2 (en) Consolidation of computer documentation
JP2011065546A (en) File search system and program
JP2009187136A (en) Electronic file management apparatus and electronic file management method
US20130124955A1 (en) Representation of last viewed or last modified portion of a document
JP2010165030A (en) Document management system, and method and program of the same
US9613089B2 (en) Form template refactoring
US20070185832A1 (en) Managing tasks for multiple file types
JP2005346454A (en) Method and program for archiving electronic document
US9305018B2 (en) Contextual and semantic differential backup
JP2005275979A (en) Image retrieving program
JP2003223345A (en) File display device
US8166389B2 (en) Methods and apparatus for including customized CDA attributes for searching and retrieval
JP4212539B2 (en) File storage location information management system and method and program thereof
JP2007156863A (en) Information processing method, system, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091110