JP2008191813A - File importance determination device, file importance determination method and file importance determination program - Google Patents
File importance determination device, file importance determination method and file importance determination program Download PDFInfo
- Publication number
- JP2008191813A JP2008191813A JP2007023916A JP2007023916A JP2008191813A JP 2008191813 A JP2008191813 A JP 2008191813A JP 2007023916 A JP2007023916 A JP 2007023916A JP 2007023916 A JP2007023916 A JP 2007023916A JP 2008191813 A JP2008191813 A JP 2008191813A
- Authority
- JP
- Japan
- Prior art keywords
- file
- importance
- program
- statistical processing
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明はファイル重要度判定装置、ファイル重要度判定方法およびファイル重要度判定プログラムに関し、特にファイルに関する特別な知識を有していなくても、ファイルの重要さを表す度合いである、ファイル重要度を判定することを可能にしたファイル重要度判定装置、ファイル重要度判定方法およびファイル重要度判定プログラムに関する。 The present invention relates to a file importance determination device, a file importance determination method, and a file importance determination program, and more particularly to a file importance, which is a degree representing the importance of a file without having special knowledge about the file. The present invention relates to a file importance determination device, a file importance determination method, and a file importance determination program that can be determined.
従来、バックアップ装置などでファイルに応じてバックアップの頻度を変更することにより、バックアップによるコンピュータに対する負荷を軽減し、バックアップによるユーザの待ち時間を軽減させる方法がある。つまり、重要度の高いファイルはバックアップの頻度を高くし、そうでないファイルは、その逆を行う。従来の重要度判定装置は、こうしたバックアップ頻度の決定などに用いられるファイルの重要度を人手によらず自動的に判定するために用いられている。 2. Description of the Related Art Conventionally, there is a method of reducing the load on a computer due to backup and reducing the waiting time of a user due to backup by changing the backup frequency according to a file using a backup device or the like. In other words, files with high importance are more frequently backed up, and files that are not so are reversed. Conventional importance determination devices are used to automatically determine the importance of a file used for determining such a backup frequency without relying on humans.
従来の重要度判定装置の一例が、特許文献1や特許文献2、および特許文献3に記載されている。 An example of a conventional importance level determination device is described in Patent Literature 1, Patent Literature 2, and Patent Literature 3.
特許文献1によれば、従来の重要度判定装置は、ファイルの単位時間当りの更新回数やファイル全体のうち更新された割合(更新ブロック率)を測定することにより、ファイルの重要度を判定している。この技術により、頻繁に更新され、更新ブロック率も大きいファイルは重要度が高いと判定し、逆に更新回数や更新ブロック率の低いファイルは重要度が低いと判定することができる。 According to Patent Document 1, a conventional importance determination device determines the importance of a file by measuring the number of updates per unit time of the file and the updated ratio (update block ratio) of the entire file. ing. With this technique, it is possible to determine that a file that is frequently updated and has a large update block rate is high in importance, and conversely, a file that has a low update count and low update block rate can be determined to have low importance.
特許文献2の実施の形態の構成を図11に示す。特許文献2によれば、この重要度判定装置1050では、ファイルシステム1020によって自動的に作成され、ファイルの実データ1040aに関連付けられるファイルの管理情報1040bのうち、ファイルの作成日時および更新日時を用いてファイルの作成時間(ファイルの編集を行った時間の累計)を推定し、作成時間の大小によって重要度を判定する。これによって、上記特許文献1と同様にファイルの重要度を判定することができる。特許文献2における実際のファイル作成時間の推定と重要度判定の動作の流れを、図12のフローチャートを用いて説明する。ステップS1020にて管理情報取り出し部1050aが、ファイルの管理情報1040bから、作成日時および更新日時を取り出す。ステップS1030にて作成時間算出部1050bが、上記の取り出された更新日時と作成日時の差として作成時間を算出する。ステップS1050にて重要度判定部1050cが、作成時間算出部1050bにより算出された作成時間をもとにして重要度を判定する。この技術により、作成時間が長いファイルは重要度が高いと判定し、逆に作成時間が短いファイルは重要度が低いと判定する。
The configuration of the embodiment of Patent Document 2 is shown in FIG. According to Patent Document 2, the
特許文献3によれば、さらに別の重要度判定装置では、重要度判定の対象となるファイルが提供されるソフトウェアパッケージについて、他のソフトウェアパッケージからの依存関係の数を静的に解析し、重要度を判定している。この技術により、システムライブラリのように多数のソフトウェアパッケージが依存しているコンピュータの動作にとって重要なファイルと、ドキュメント類のようにコンピュータの動作にとって重要でないファイルとを判別することができる。 According to Patent Document 3, in another importance level determination device, the number of dependencies from other software packages is statically analyzed for a software package provided with a file to be subjected to importance level determination. Judging the degree. With this technology, a file that is important for the operation of a computer such as a system library on which a large number of software packages depend can be discriminated from a file that is not important for the operation of a computer such as documents.
上述のように従来の重要度判定装置では、ファイルの重要度の判定のために、特許文献1に見られるように単位時間あたりの更新回数および更新ブロック率を測定する方法や、特許文献2に見られるようにファイルの作成時間を推定する方法、また特許文献3に見られるようにファイルを提供するソフトウェアパッケージの被依存数を解析する方法を用いていた。しかし、特許文献1および2の判定方法によれば、重要度判定の対象となるファイルが更新可能なファイルに限定されるため、更新が許されていないデータファイルやほとんど更新されないデータファイルの重要度の判定には適さない。他方、特許文献3の判定方法によれば、重要度判定の対象となるファイルがソフトウェアパッケージに含まれるものであれば、ファイルの種類を問わず重要度を判定できる。しかし、ファイルの重要度が他プログラムからの依存数によって画一的に決定されるため、インストールされたものの全く利用されていないデータファイルが、一日に何度も利用されるデータファイルよりも重要度の高いファイルとして判定される可能性がある。このため、利用頻度の高いデータファイルほどバックアップ頻度やウィルスチェック頻度を高くする等を目的とした重要度判定には向いていない。 As described above, in the conventional importance level determination device, a method for measuring the number of updates per unit time and the update block rate as disclosed in Patent Document 1 or Patent Document 2 for determining the importance level of a file is disclosed. As can be seen, a method for estimating the creation time of a file and a method for analyzing the number of dependencies of a software package that provides a file have been used, as can be seen in Patent Document 3. However, according to the determination methods of Patent Documents 1 and 2, since the files whose importance is determined are limited to files that can be updated, the importance of data files that are not allowed to be updated or data files that are hardly updated are determined. It is not suitable for judgment. On the other hand, according to the determination method of Patent Document 3, if the file whose importance is to be determined is included in the software package, the importance can be determined regardless of the type of the file. However, since the importance of a file is uniformly determined by the number of dependencies from other programs, a data file that is installed but not used at all is more important than a data file that is used many times a day. There is a possibility that it is determined as a high-degree file. For this reason, data files that are used more frequently are not suitable for determining the importance for the purpose of increasing the backup frequency or the virus check frequency.
『発明の目的』
本発明の目的は、ファイルの種類によらずデータファイルの実際の利用状況に基づいてその重要度を判定することのできるファイル重要度判定装置を提供することにある。
“Purpose of invention”
An object of the present invention is to provide a file importance determination device that can determine the importance based on the actual usage status of a data file regardless of the type of the file.
本発明の第1のファイル重要度判定装置は、起動されたプログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログを複数記憶するコンソール出力ログ保存手段から読み出したコンソール出力ログを解析して、プログラムによってオープンされたファイルの識別子を取り出すファイルオープン情報取り出し手段と、前記ファイルオープン情報取り出し手段で取り出されたファイルの識別子に基づいて統計処理を施し、ファイルの利用に関する統計値を出力する統計処理部と、該統計処理部から出力されたファイルの利用に関する統計値をファイルの重要度の値に変換する重要度判定部と、該重要度判定部で得られたファイルの重要度の値を記憶する重要度判定データ保存部とを備えることを特徴とする。 The first file importance determination device of the present invention analyzes a console output log read from a console output log storage unit that stores a plurality of console output logs including an identifier of a started program and an argument passed to the program. A file open information extracting means for extracting an identifier of the file opened by the program, and a statistic for performing statistical processing based on the identifier of the file extracted by the file open information extracting means and outputting a statistical value relating to the use of the file A processing unit, an importance determination unit that converts a statistical value regarding the use of the file output from the statistical processing unit into a file importance value, and a file importance value obtained by the importance determination unit. And a degree-of-importance determination data storage unit to be stored.
本発明の第2のファイル重要度判定装置は、第1のファイル重要度判定装置において、前記統計値が、ファイル毎の総オープン回数であることを特徴とする。 The second file importance determining apparatus according to the present invention is characterized in that, in the first file importance determining apparatus, the statistical value is a total number of open times for each file.
本発明の第3のファイル重要度判定装置は、第1のファイル重要度判定装置において、前記統計値が、ファイル毎の当該ファイルをオープンしたプログラムの識別子のユニーク数であることを特徴とする。 The third file importance determination device of the present invention is characterized in that, in the first file importance determination device, the statistical value is a unique number of identifiers of a program that has opened the file for each file.
本発明の第4のファイル重要度判定装置は、第1乃至第3の何れかのファイル重要度判定装置において、ファイルの統計値とファイルの重要度の値との対応を示す重要度変換ルールを保持する重要度変換ルール保存手段を備え、前記重要度判定部は、前記重要度変換ルールを参照して重要度の値を決定することを特徴とする。 According to a fourth file importance determination device of the present invention, in any of the first to third file importance determination devices, an importance conversion rule indicating a correspondence between a file statistical value and a file importance value is provided. An importance level conversion rule storing unit is provided, and the importance level determination unit refers to the importance level conversion rule to determine an importance value.
本発明の第5のファイル重要度判定装置は、第1乃至第3のファイル重要度判定装置において、前記所定の統計処理を規定する統計処理ルールを保持する統計処理ルール保存手段を備え、前記統計処理部は、前記統計処理ルールにより規定された統計処理を実行することを特徴とする。 According to a fifth file importance determination device of the present invention, in the first to third file importance determination devices, a statistical processing rule storage unit that holds a statistical processing rule that defines the predetermined statistical processing is provided. The processing unit executes statistical processing defined by the statistical processing rule.
本発明の第6のファイル重要度判定装置は、第1乃至第3のファイル重要度判定装置において、前記重要度判定データ保存部に保存されたファイルの重要度の値を重要度利用プログラムから取り出すための重要度取り出し手段を備えることを特徴とする。 According to a sixth file importance determination device of the present invention, in the first to third file importance determination devices, the importance value of the file stored in the importance determination data storage unit is extracted from the importance use program. It is characterized by comprising an importance level taking-out means.
本発明の第7のファイル重要度判定装置は、第6のファイル重要度判定装置において、前記重要度利用プログラムは、ファイルの重要度に応じてバックアップをとる頻度を調整するバックアッププログラムであることを特徴とする。 According to a seventh file importance determination device of the present invention, in the sixth file importance determination device, the importance use program is a backup program that adjusts the frequency of backup according to the importance of the file. Features.
本発明の第8のファイル重要度判定装置は、第6のファイル重要度判定装置において、前記重要度利用プログラムは、ファイルの重要度に応じてウィルス検査を行う頻度を調整するウィルススキャンプログラムであることを特徴とする。 An eighth file importance determination apparatus according to the present invention is the sixth file importance determination apparatus, wherein the importance utilization program is a virus scan program that adjusts a frequency of performing a virus check according to the importance of the file. It is characterized by that.
本発明のファイル重要度判定方法は、コンピュータを用いてファイルの重要度を判定する方法であって、前記コンピュータが、プログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログを複数記憶するコンソール出力ログ保存手段から読み出したコンソール出力ログを解析して、プログラムによってオープンされたファイルの識別子を取り出す第1のステップと、前記コンピュータが、前記オープンされたファイルの識別子に基づいて統計処理を施し、ファイル毎の統計値を出力する第2のステップと、前記コンピュータが、前記出力されるファイル毎の統計値をファイルの重要度の値に変換する第3のステップと、前記コンピュータが、前記得られたファイルの重要度の値を重要度判定データ保存部に記憶する第4のステップとを含むことを特徴とする。 The file importance determination method of the present invention is a method for determining the importance of a file using a computer, and the computer stores a plurality of console output logs including an identifier of a program and an argument passed to the program. A first step of analyzing a console output log read from the console output log storage means and extracting an identifier of a file opened by a program; and the computer performs statistical processing based on the identifier of the opened file. A second step of outputting a statistical value for each file; a third step in which the computer converts the statistical value for each output file into a value of importance of the file; and A fourth value that stores the importance value of the selected file in the importance determination data storage unit Characterized in that it comprises a step.
本発明のファイル重要度判定プログラムは、起動されたプログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログを複数記憶するコンソール出力ログ保存手段を有するコンピュータに、前記コンソール出力ログ保存手段から読み出したコンソール出力ログを解析して、プログラムによってオープンされたファイルの識別子を取り出す第1の処理と、前記オープンされたファイルの識別子に基づいて統計処理を施し、ファイル毎の統計値を出力する第2の処理と、前記出力されるファイル毎の統計値をファイルの重要度の値に変換する第3の処理と、前記得られたファイルの重要度の値を重要度判定データ保存部に記憶する第4の処理とを行わせることを特徴とする。 The file importance determination program of the present invention includes a console output log storage unit that stores a plurality of console output logs including an identifier of a started program and an argument passed to the program. Analyzing the read console output log to extract the identifier of the file opened by the program, performing statistical processing based on the identifier of the opened file, and outputting a statistical value for each file 2, a third process for converting the statistical value of each output file into a file importance value, and storing the obtained file importance value in the importance determination data storage unit The fourth process is performed.
『作用』
本発明にあっては、従来の重要度判定方法では重要度判定のための要素として用いることができなかったファイルの利用に関する情報のうち、プログラムがオープンしたファイルの識別子やオープン回数などといったファイルに関する統計値を、コンソール出力ロギング部によって計測される、プログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログを利用して算出する。従って、ファイルオープン情報に含まれるファイルの参照情報を反映した重要度を判定することが可能である。例えば、頻繁にプログラムからオープンされるファイルを重要度大と判定し、逆に、ほとんどプログラムからオープンされないファイルを重要度小と判定することができる。
"Action"
In the present invention, among the information on the use of a file that could not be used as an element for determining the importance in the conventional importance determination method, the file related to the file identifier such as the identifier of the file opened and the number of times of opening. The statistical value is calculated by using a console output log including a program identifier and an argument passed to the program, which is measured by the console output logging unit. Therefore, it is possible to determine the importance reflecting the file reference information included in the file open information. For example, a file that is frequently opened from a program can be determined to have a high importance level, and conversely, a file that is hardly opened from a program can be determined to have a low importance level.
本発明によれば、ファイルの種類によらずデータファイルの実際の利用状況に基づいてその重要度を判定することができる。その理由は、プログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログから統計処理により求められるデータファイルの利用に関する統計値は、参照や更新される各データファイルの実際の利用状況を示しているため、その統計値から変換される重要度はデータファイルの実際の利用状況に基づく重要度になるためである。従って、利用頻度の高いデータファイルほどバックアップ頻度を高くしたり、ウィルスチェック頻度を高くすることを目的とした重要度の判定に本発明を適用すれば、非常に有効である。 According to the present invention, the degree of importance can be determined based on the actual usage status of a data file regardless of the type of file. The reason is that the statistical value regarding the use of the data file obtained by the statistical processing from the console output log including the program identifier and the argument passed to the program indicates the actual usage status of each data file to be referenced or updated. This is because the importance converted from the statistical value is based on the actual usage status of the data file. Therefore, it is very effective if the present invention is applied to the determination of the importance for the purpose of increasing the backup frequency or the virus check frequency for a data file having a high usage frequency.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
図1を参照すると、本発明の第1の実施の形態は、本発明によって判定される重要度を入力として動作する重要度利用プログラム10と、プログラムを実行した際のコンソールへの画面出力を保存するコンソール出力ロギング部20と、プログラムの重要度を判定するファイル重要度判定装置50とを含む。
Referring to FIG. 1, the first embodiment of the present invention stores an importance use
重要度利用プログラム10は、ファイル重要度判定装置50によって判定されたファイルの重要度を用いて動作するプログラムである。この重要度利用プログラム10は、ファイル重要度判定装置50によって判定されたファイルの重要度を用いることで、実行効率や実行性能を改善できる種類のプログラムを想定している。具体的には、コンピュータのバックアッププログラムやウィルス検知プログラムなどが想定される。例えば、バックアッププログラムでは、プログラムの重要度に応じてバックアップの頻度を変化させ、重要度の高いプログラムのみを高い頻度でバックアップすることによって、高効率かつ効果的なバックアップが期待できる。同様に、ウィルス検知プログラムでは、重要度に応じてウィルスチェックの頻度を変化させ、重要度の高いプログラムのみを高い頻度でウィルスチェックすることによって、高効率かつ効果的なウィルススキャンが期待できる。
The
コンソール出力ロギング部20は、コンソール上でプログラムを実行した際のユーザ入力およびプログラム出力をすべてログとして保存する。図2にコンソール出力ロギング部20によって保存されるコンソール出力ログの構成を示す。このログにはユーザからのキーボード入力とプログラム実行結果の出力とが、プログラムを実行した順にすべて保存される。ユーザからのキーボード入力内容は、実行するプログラムのコマンド名とプログラムへ渡す引数とから構成される。
The console
ファイル重要度判定装置50は、重要度判定データ保存部60と、重要度判定部90と、統計処理部120と、ファイルオープン情報取り出し手段150とを備える。
The file
ファイル重要度判定装置50は、バッチジョブとして一定の周期で、またはコンピュータ中のファイルが更新された場合などに、ファイルの重要度を判定する。
The file
ファイルオープン情報取り出し手段150は、統計処理部120からの要求に応じて、コンソール出力ログ保存手段30に保存されたコンソール出力ログを解析し、プログラムが実行時にオープンしたファイルを推定する。具体的には、コンソール出力ログ内のユーザ入力行に注目し、プログラムへ渡された引数がファイル名であった場合には、このファイル名で表されるファイルがプログラムによって実行時にオープンされたものと推定する。
The file open
統計処理部120は、ファイルオープン情報取り出し手段150で取り出されたファイルの識別子に基づいて統計処理を施し、重要度の判定に必要な情報である、ファイルの利用に関する統計値を出力する。この統計処理部120は、本実施の形態の場合、統計処理を規定する統計処理ルールを保持する統計処理ルール保存手段130と、統計処理ルールにより規定された統計処理を実行する統計処理手段140とで構成される。
The
統計処理ルール保存手段130に記憶される統計処理ルールは、図3に示すようにファイルの利用に関する統計値と、これを集計するための具体的な手順である統計処理手順との組から構成される。具体的には例えば、ファイルの利用に関する統計値としてファイルがオープンされた回数である"ファイルのオープン回数"というファイルの利用に関する統計値を考えた場合、これを得るための統計処理ルールは図4のようになる。図4によると、"ファイルのオープン回数"を得るための統計処理手順は、"重要度判定対象ファイルがオープンされた回数を集計"となる。つまり、上記ファイルオープン情報取り出し手段150にて取り出したファイルオープン情報から、オープンされたファイルそれぞれについてオープンされた回数を集計することとなる。同様に、ファイルの利用に関する統計値の一つである"ユニークプログラム数"を得るための統計処理手順は、"重要度判定対象ファイルをオープンしたプログラム識別子のユニーク数を集計"となる。以上のように、コンソール出力ログから得られる情報を用いてファイルの利用に関する統計値を算出する一連の手順を、統計処理ルールとして定義できる。
The statistical processing rule stored in the statistical processing rule storage means 130 is composed of a set of statistical values relating to the use of files and a statistical processing procedure which is a specific procedure for aggregating the statistical values as shown in FIG. The Specifically, for example, when considering a statistical value related to file usage, which is the number of times a file has been opened as a statistical value related to file usage, the statistical processing rule for obtaining this is shown in FIG. become that way. According to FIG. 4, the statistical processing procedure for obtaining the “file open count” is “total number of times the importance determination target file is opened”. That is, the number of times each file is opened is counted from the file open information extracted by the file open
重要度判定部90は、統計処理部120から出力されるファイルの利用に関する統計値をファイルの重要度の値に変換する。この重要度判定部90は、本実施の形態の場合、ファイルの利用に関する統計値とファイルの重要度の値との対応を示す重要度変換ルールを保持する重要度変換ルール保存手段100と、重要度変換ルールを参照して重要度の値を決定する重要度判定手段110とで構成される。
The
重要度変換ルール保存手段100に記憶される重要度変換ルールは、図5に示すようにファイルの利用に関する統計値の1つである"オープン回数"と重要度との対応表を定義している。ここで、"オープン回数"は重要度判定対象ファイルがオープンされた回数を表しており、これは上記統計処理部120にて算出されるファイルの利用に関する統計値である。この対応表は、図5に示すように1つのファイルの利用に関する統計値と重要度とを対応付ける以外にも、例えば図6に示すように、2つのファイルの利用に関する統計値(ここでは、"オープン回数"および"ユニークプログラム数")と重要度とを対応付けるなど、任意の個数のファイルの利用に関する統計値と重要度とを対応付けることによって、より多くのファイルの利用に関する統計値を重要度へ反映させても良い。重要度変換ルールは、第1の実施の形態のコンピュータの運用者(例えば企業など)のポリシーなどに基づいて予め作成される。
As shown in FIG. 5, the importance conversion rule stored in the importance conversion
重要度判定データ保存部60は、重要度判定データ保存手段70と重要度取り出し手段80とで構成される。重要度判定データ保存手段70は、例えば図7に示すような構成の重要度判定データを保存する。図7に示すように重要度判定データは、判定の対象となるファイル名および重要度の各項目を含む。重要度判定の対象となるファイルは、例えば重要度利用プログラム10に含まれるウィルススキャンソフトウェアで設定されている監視対象ファイルなどである。重要度の項目には、上記重要度判定部90により判定された重要度を表わす値が記述される。
The importance determination data storage unit 60 includes importance determination data storage means 70 and importance extraction means 80. The importance determination
重要度判定データ保存部60の重要度取り出し手段80は、重要度利用プログラム10からの要求に応じて重要度を取り出し、この重要度を重要度利用プログラム10へ渡す。
The importance extraction means 80 of the importance determination data storage unit 60 extracts the importance in response to a request from the
なお、このファイル重要度判定装置50は、重要度利用プログラム10またはコンソール出力ロギング部20を実現するのと同一または別のコンピュータを基本ハードウェアとして用いることができる。そして、重要度判定データ保存部60、重要度判定部90、統計処理部120、およびファイルオープン情報取り出し手段150は、上記のコンピュータに搭載されたプロセッサにプログラムを実行させることにより実現することができる。
The file
ファイル重要度判定装置50は、上記のプログラムをコンピュータに予めインストールすることで実現されても良いし、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、光磁気ディスク(MOなど)、半導体メモリなどのリムーバブルな記憶媒体に記録して、あるいはLANやインターネット等のネットワークを介して上記のプログラムを配布し、このプログラムをコンピュータに適宜インストールすることで実現されても良い。
The file
コンソール出力ログ保存手段30、重要度判定データ保存部60、重要度判定部90、および統計処理部120は、上記のコンピュータに内蔵されたメモリやハードディスク装置などの記憶デバイス、上記のコンピュータに外付けされたメモリやハードディスク装置などの記憶デバイス、さらにはフレキシブルディスクなどのようなリムーバブルな記憶媒体などを適宜利用して実現することができる。
The console output
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼動しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が本実施の形態を実現するための各処理の一部を実行しても良い。記憶媒体は1つに限らず、複数の媒体から本実施の形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であっても良い。 Further, an OS (operating system) running on the computer based on an instruction of a program installed in the computer from the storage medium, MW (middleware) such as database management software, network software, or the like implements the present embodiment. A part of each process may be executed. The number of storage media is not limited to one, and the case where the processing according to the present embodiment is executed from a plurality of media is also included in the storage medium of the present invention, and the media configuration may be any configuration.
上記のコンピュータは、記憶媒体に記憶されたプログラムに基づき、第1の実施の形態における各処理を実行するものであって、パーソナルコンピュータ等の1つからなる装置、複数の装置がネットワーク接続されたコンピュータ等の何れの構成であっても良い。上記のコンピュータは、パーソナルコンピュータに限らず、情報処理機器に含まれる演算処理装置、マイクロコンピュータ等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。 The above computer executes each process in the first embodiment based on a program stored in a storage medium, and a single device such as a personal computer or a plurality of devices are connected to a network. Any configuration such as a computer may be used. The above computer is not limited to a personal computer, but includes an arithmetic processing device, a microcomputer, and the like included in an information processing device, and collectively refers to devices and devices that can realize the functions of the present invention by a program.
次に、図8のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。 Next, the overall operation of the present embodiment will be described in detail with reference to the flowchart of FIG.
図8はファイル重要度判定装置50の処理手順を示すフローチャートである。ファイル重要度判定装置50は、バッチジョブとして一定の周期で、またはファイルが更新されたことに応じて図8に示す処理を起動する。
FIG. 8 is a flowchart showing a processing procedure of the file
ステップS110にてファイル重要度判定装置50は、重要度判定の対象であるファイルのうち、未選択である1つを判定対象ファイルとして選択する。なお、重要度判定の対象となるファイルは、重要度を用いる重要度利用プログラムやコンピュータ管理者等によってあらかじめファイル名で指定されたものである。
In step S110, the file
ステップS120にてファイル重要度判定装置50では、ファイルオープン情報取り出し手段150が、コンソール出力ログ保存手段30より、実行されたプログラムとプログラムが開いたと推定されるファイルリストを取り出す。
In step S <b> 120, in the file
ステップS130にてファイル重要度判定装置50では、統計処理部120が、上記ステップS120にて取り出したファイルオープン情報を統計処理ルールに適用することにより、ファイルの利用に関する統計値を算出する。
In step S130, in the file
ステップS140にてファイル重要度判定装置50では、重要度判定部90が重要度変換ルールを参照し、上記ステップS130にて統計処理部120により算出されたファイルの利用に関する統計値を利用することにより重要度を判定する。具体的には、図5に示すように重要度判定部90に重要度変換ルールが定義されていて、かつ統計処理部120により判定対象のファイルがオープンされた回数が110回と算出されているのであれば、重要度判定部90は重要度を50と判定する。
In the file
ステップS150にてファイル重要度判定装置50では、重要度判定部90が、上記の判定した重要度を重要度判定データ保存部60へ保存する。
In step S150, in the file
ステップS160にてファイル重要度判定装置50は、重要度判定の対象となっている全ての判定対象ファイルを選択し終えているか否かを確認する。ここで「YES」と判断できるまで、ファイル重要度判定装置50はステップS110乃至ステップS160の処理を繰り返す。これにより全ての判定対象ファイルに関して重要度を判定する。そしてステップS160にて「YES」と判断できたならば、ファイル重要度判定装置50は図8に示す処理を終了する。
In step S160, the file
次に、本実施の形態の効果について説明する。 Next, the effect of this embodiment will be described.
第1の実施の形態によれば、ファイルの重要度はコンソール出力ロギング部20によって計測し保存されたコンソール出力ログを元に判定される。すなわち、コンソール出力監視手段40によって計測され、コンソール出力ログ保存手段30に保存されたファイルオープン情報を、統計処理部120に定義された統計処理ルールに基づいて、統計処理部120がファイルの利用に関する統計値に変換する。そして、得られたファイルの利用に関する統計値と重要度判定部90に定義された重要度変換ルールをもとにして、重要度判定部90がプログラムファイルの重要度を判定する。こうして得られた重要度には、ファイルのオープン回数などといったファイルの実際の利用情報を反映することができる。
According to the first embodiment, the importance level of the file is determined based on the console output log measured and stored by the console
たとえば、頻繁にオープンされるファイルのような、万一改ざんされた場合にコンピュータへの影響が大きいと考えられるファイルの重要度を判定したい場合には、"オープン回数"というファイルの利用に関する統計値を求めるとともに、これを重要度に変換する重要度変換ルールを適切に設定することで、ファイルの実際の利用情報を反映した重要度を自動的に判定することができる。また図6に見られるように、目的に応じて重要度変換ルールへの入力とするファイルの利用に関する統計値の数を2つ以上に増やすことで、より多くのファイルの利用に関する統計値を重要度へ反映することができ、結果として重要度の精度の向上が期待できる。 For example, if you want to determine the importance of a file that is considered to have a large impact on your computer if it is tampered with, such as a file that is frequently opened, the statistical value related to the use of the file is called "number of times to open" And by appropriately setting importance conversion rules for converting this into importance, the importance reflecting the actual usage information of the file can be automatically determined. In addition, as shown in FIG. 6, by increasing the number of file usage statistics to be input to the importance conversion rule to 2 or more according to the purpose, the statistics on the usage of more files are important. As a result, improvement in the accuracy of importance can be expected.
次に、本発明の第1の実施例を、図面を参照して説明する。かかる実施例は本発明の第1の実施の形態に対応するものである。 Next, a first embodiment of the present invention will be described with reference to the drawings. This example corresponds to the first embodiment of the present invention.
本実施例は、入力装置としてキーボードを、データ処理装置としてパーソナル・コンピュータを、データ記憶装置として磁気ディスク装置を、出力装置としてディスプレイを備えている。 This embodiment includes a keyboard as an input device, a personal computer as a data processing device, a magnetic disk device as a data storage device, and a display as an output device.
パーソナル・コンピュータは、コンソール出力監視手段40、重要度取り出し手段80、重要度判定手段110、統計処理手段140、およびファイルオープン情報取り出し手段150として機能する中央演算処理装置を有している。またコンソール出力ログ保存手段30、重要度判定データ保存手段70、重要度変換ルール保存手段100、および統計処理ルール保存手段130として機能する磁気ディスク装置を有している。 The personal computer has a central processing unit that functions as console output monitoring means 40, importance level extraction means 80, importance level determination means 110, statistical processing means 140, and file open information extraction means 150. In addition, it has a magnetic disk device that functions as console output log storage means 30, importance level determination data storage means 70, importance level conversion rule storage means 100, and statistical processing rule storage means 130.
今、重要度利用プログラム10に含まれるプログラムの1つから、ファイル"memo.txt"の重要度を求める要求が出されたとする。また、統計処理ルールには図4に示されるルールが定義されていたとする。ファイル"memo.txt"の重要度を求めるためには、統計処理部120はコンソール出力ログ保存手段30からファイルオープン情報150を通じてファイルオープン情報を取得し、これに上記統計処理ルールを適用することで、ファイルの利用に関する統計値を求める必要がある。
It is assumed that a request for calculating the importance of the file “memo.txt” is issued from one of the programs included in the
ここで、コンソール出力ログはコンソール出力ログ保存手段30に保存されており、具体的にはたとえば図9に示される内容になっている。図9は一般的なUNIX(登録商標)システムでのコンソール出力ログの例である。記号"$"で始まる行はコンソールへのユーザ入力を示し、プログラムのコマンド名とプログラムへ渡された引数を示している。また、ユーザ入力行に続く"$"で始まらない行は、プログラムからの出力(プログラムの実行結果)である。よって、ファイルオープン情報取り出し手段150がプログラム"vi"が実行時に開いたファイルを推定するためには、まずコンソール出力ログのうちユーザ入力を示す行(記号"$"で始まる行)を抽出し、このうちプログラムのコマンド名が"vi"に一致するものを抽出し、引数で渡されている値が、前記指定されたファイル名であるかどうかをチェックすればよい。
Here, the console output log is stored in the console output log storage means 30, and specifically has the contents shown in FIG. 9, for example. FIG. 9 is an example of a console output log in a general UNIX (registered trademark) system. Lines beginning with the symbol "$" indicate user input to the console, indicating the command name of the program and the arguments passed to the program. The line that does not start with "$" following the user input line is the output from the program (program execution result). Therefore, in order for the file open
上記統計処理ルールを用いてファイルの利用に関する統計値である"ファイルのオープン回数"を算出するためには、統計処理部120は、統計値"ファイルのオープン回数"に対応する統計処理手順である"重要度判定対象ファイルがオープンされた回数を集計"をファイルオープン情報へ適用する。つまり、ファイルオープン情報取り出し手段150を通じて取り出したファイルオープン情報の内容のうち、ファイル名の部分が"memo.txt"であるエントリの出現回数を合計する。この出現回数が、ファイル"memo.txt"がオープンされた回数を表す。ここでは、ファイル"memo.txt"のオープン回数は31回だったとする。
In order to calculate “file open count”, which is a statistical value related to file usage, using the statistical processing rule, the
次に、重要度判定部90は図5に示される重要度変換ルールを参照したとする。この重要度変換ルールでは、"ファイルのオープン回数"に対応する重要度が定義されている。たとえば、100回以上500回未満オープンされたファイルの重要度は50と定義されている。重要度判定部90は統計処理部120によって算出された"memo.txt"のオープン回数31回と、この重要度変換ルールを参照し、"memo.txt"に対応する重要度を5と判定する。重要度を判定した後、重要度判定部90は、ファイル名"memo.txt"とこれに対応する重要度の値"5"を図7に示されるフォーマットで重要度判定データ保存部60へ保存する。
Next, it is assumed that the importance
重要度判定データ保存部60に保存された重要度は、重要度利用プログラム10によって取得され、重要度利用プログラム10の動作に使用される。
The importance stored in the importance determination data storage unit 60 is acquired by the
以上、第1の実施例では、重要度変換ルールを1個または2個のファイルの利用に関する統計値から重要度への変換表として説明したが、この他にも任意の個数のファイルの利用に関する統計値から重要度への変換表や、任意の個数のファイルの利用に関する統計値から重要度を算出する数式やプログラムなど、他の形式によっても重要度変換ルールを定義し重要度を判定することができる。 As described above, in the first embodiment, the importance level conversion rule has been described as a conversion table from the statistical value to the importance level regarding the use of one or two files, but in addition to this, the use of an arbitrary number of files is also related. Define the importance conversion rules and determine the importance in other formats, such as conversion tables from statistical values to importance, and mathematical formulas and programs that calculate importance from statistics on the usage of any number of files Can do.
また、重要度判定データ保存部60は、判定された重要度を保存するための手段である重要度判定データ保存手段70と重要度利用プログラム10が重要度を取り出すための手段である重要度取り出し手段80という2つの要素から構成されていたが、重要度取り出し手段80は重要度判定データ保存部60の外にあっても良い。
In addition, the importance determination data storage unit 60 extracts importance, which is means for the importance determination data storage means 70 and means for using the
また、重要度判定部90は、重要度変換ルールを保存するための手段である重要度変換ルール保存手段100と重要度を判定するための手段である重要度判定手段110という2つの要素から構成されていたが、重要度変換ルール保存手段100は重要度判定部90の外にあっても良い。また、重要度判定手段110を実現するプログラム中に重要度変換ルールを組み入れることで、重要度変換ルール保存手段100を省略しても良い。
The importance
また、統計処理部120は、統計処理ルールを保存するための手段である統計処理ルール保存手段130と統計処理を行うための手段である統計処理手段140という2つの要素から構成されていたが、統計処理ルール保存手段130は統計処理部120の外にあっても良い。また、統計処理手段140を実現するプログラム中に統計処理ルールを組み入れることで、統計処理ルール保存手段130を省略しても良い。
The
また、コンソール出力監視手段40が生成するコンソール出力ログがすでに統計処理を施されており、重要度判定部90にて直接重要度へ変換可能な場合には、統計処理部120は統計処理を行わず、無加工のコンソール出力ログを重要度判定手段110への入力として渡しても良い。
If the console output log generated by the console
次に、本発明をウィルススキャンプログラムへ適用した場合の実施例を図10に示し、通常のウィルススキャンプログラムの運用例との違いを示す。通常のウィルススキャンプログラムでは、コンピュータ中にインストールされたファイルすべてについて、定期的にスキャン処理を行い、改ざんやその他悪意のある変更が行われていないかどうかを確認することで、コンピュータの安全性を保証する。この方式では、一回のスキャンですべてのファイルをスキャンするため、コンピュータ中にインストールされたファイルの数が増えるにつれ、一回のスキャン時間が増加するという問題がある。この場合、たとえば一回のスキャンに30分を要する場合、改ざんが行われてから改ざんを検出するまでの最低時間が最悪で30分となってしまう。 Next, FIG. 10 shows an embodiment in which the present invention is applied to a virus scan program, and shows a difference from an operation example of a normal virus scan program. Regular virus scanning programs regularly scan all files installed on your computer to make sure that it has not been tampered with or otherwise maliciously modified. Guarantee. In this method, since all files are scanned in one scan, there is a problem that the scan time for one scan increases as the number of files installed in the computer increases. In this case, for example, when 30 minutes is required for one scan, the minimum time from tampering to detection of tampering is 30 minutes at worst.
そこで、本発明を用いてスキャン対象のファイルを重要度に応じてグループ分けし、グループごとにスキャンの頻度を変化させることで、一度のスキャン時間を短くし、かつ重要度の高いグループに含まれたファイルのみを重点的にスキャンすることでコンピュータの安全性を高めることが期待できる。 Therefore, by using the present invention, the files to be scanned are grouped according to the importance, and the scan frequency is changed for each group, so that the scan time for one time is shortened and included in the high importance group. You can expect to increase the security of your computer by focusing on scanning only the files.
具体的には、図10に示されるようにウィルススキャンプログラム10がスキャンしようとしているファイルすべてについて、あらかじめファイル重要度判定装置50によって重要度を判定する。次に、判定された重要度に応じてファイルをグループ分けし、スキャン間隔を適切に設定する。具体的には例えば、重要度が100未満の比較的重要度の低いファイルは、スキャン間隔を60分に設定し、スキャンを長い間隔で行う。また、重要度が100以上の比較的重要度の高いファイルは、スキャン間隔を5分に設定し、スキャンを短い間隔で行う。このようにすることで、重要なファイルのみを短い間隔で重点的にスキャンでき、よって改ざんが行われてから改ざんを検出するまでの時間を短縮することが期待できる。
Specifically, as shown in FIG. 10, the importance level is determined in advance by the file importance
本発明によれば、コンピュータ全体からウィルスを検索するウィルススキャンプログラムや、改ざんや侵入を検知する侵入検知装置といった用途に適用できる。また、パーソナルコンピュータなどに搭載されている、コンピュータ全体から特定のキーワードを含むファイルを検索する検索システムでの検索結果の重要度による重み付けや、バックアップシステムでの重要度によるバックアップ優先度の重み付けといった用途にも適用できる。 The present invention can be applied to uses such as a virus scanning program that searches for viruses from the entire computer, and an intrusion detection device that detects tampering and intrusion. In addition, weighting by importance of search results in search systems that search for files containing specific keywords from the entire computer installed in personal computers, etc., and weighting of backup priority by importance in backup systems It can also be applied to.
10…重要度利用プログラム
20…コンソール出力ロギング部
30…コンソール出力ログ保存手段
40…コンソール出力監視手段
50…ファイル重要度判定装置
60…重要度判定データ保存部
70…重要度判定データ保存手段
80…重要度取り出し手段
90…重要度判定部
100…重要度変換ルール保存手段
110…重要度判定手段
120…統計処理部
130…統計処理ルール保存手段
140…統計処理手段
150…ファイルオープン情報取り出し手段
DESCRIPTION OF
Claims (10)
前記コンピュータが、プログラムの識別子と該プログラムへ渡される引数とを含むコンソール出力ログを複数記憶するコンソール出力ログ保存手段から読み出したコンソール出力ログを解析して、プログラムによってオープンされたファイルの識別子を取り出す第1のステップと、
前記コンピュータが、前記オープンされたファイルの識別子に基づいて統計処理を施し、ファイル毎の統計値を出力する第2のステップと、
前記コンピュータが、前記出力されたファイル毎の統計値をファイルの重要度の値に変換する第3のステップと、
前記コンピュータが、前記得られたファイルの重要度の値を重要度判定データ保存部に記憶する第4のステップとを含むことを特徴とするファイル重要度判定方法。 A method for determining the importance of a file using a computer,
The computer analyzes a console output log read from a console output log storage unit that stores a plurality of console output logs including a program identifier and an argument passed to the program, and extracts an identifier of a file opened by the program The first step;
A second step in which the computer performs statistical processing based on the identifier of the opened file and outputs a statistical value for each file;
A third step in which the computer converts the output statistical value for each file into a file importance value;
And a fourth step in which the computer stores a value of importance of the obtained file in an importance determination data storage unit.
前記コンソール出力ログ保存手段から読み出したコンソール出力ログを解析して、プログラムによってオープンされたファイルの識別子を取り出す第1の処理と、
前記オープンされたファイルの識別子に基づいて統計処理を施し、ファイル毎の統計値を出力する第2の処理と、
前記出力されたファイル毎の統計値をファイルの重要度の値に変換する第3の処理と、
前記得られたファイルの重要度の値を重要度判定データ保存部に記憶する第4の処理とを行わせるためのファイル重要度判定プログラム。 In a computer having console output log storage means for storing a plurality of console output logs including an identifier of a started program and an argument passed to the program,
A first process of analyzing a console output log read from the console output log storage means and extracting an identifier of a file opened by a program;
A second process of performing statistical processing based on the identifier of the opened file and outputting a statistical value for each file;
A third process for converting the output statistical value for each file into a file importance value;
A file importance determination program for performing a fourth process of storing the obtained importance value of a file in an importance determination data storage unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007023916A JP2008191813A (en) | 2007-02-02 | 2007-02-02 | File importance determination device, file importance determination method and file importance determination program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007023916A JP2008191813A (en) | 2007-02-02 | 2007-02-02 | File importance determination device, file importance determination method and file importance determination program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008191813A true JP2008191813A (en) | 2008-08-21 |
Family
ID=39751876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007023916A Withdrawn JP2008191813A (en) | 2007-02-02 | 2007-02-02 | File importance determination device, file importance determination method and file importance determination program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008191813A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013025700A (en) * | 2011-07-25 | 2013-02-04 | Nec Corp | File storage destination candidate determination device, file storage destination candidate determination method, file storage destination determination supporting system, and computer program |
US8922828B2 (en) | 2010-09-22 | 2014-12-30 | International Business Machines Corporation | Determining scan priority of documents |
US8930368B2 (en) | 2010-12-27 | 2015-01-06 | International Business Machines Corporation | Categorizing data to perform access control |
JP2017211945A (en) * | 2016-05-27 | 2017-11-30 | 富士通株式会社 | File determination program, file determination device and file determination method |
-
2007
- 2007-02-02 JP JP2007023916A patent/JP2008191813A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8922828B2 (en) | 2010-09-22 | 2014-12-30 | International Business Machines Corporation | Determining scan priority of documents |
US8930368B2 (en) | 2010-12-27 | 2015-01-06 | International Business Machines Corporation | Categorizing data to perform access control |
JP2013025700A (en) * | 2011-07-25 | 2013-02-04 | Nec Corp | File storage destination candidate determination device, file storage destination candidate determination method, file storage destination determination supporting system, and computer program |
JP2017211945A (en) * | 2016-05-27 | 2017-11-30 | 富士通株式会社 | File determination program, file determination device and file determination method |
US10691641B2 (en) | 2016-05-27 | 2020-06-23 | Fujitsu Limited | File determination device and file determination method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230409713A1 (en) | Ransomware infection detection in filesystems | |
US9032254B2 (en) | Real time monitoring of computer for determining speed and energy consumption of various processes | |
US11263071B2 (en) | Enabling symptom verification | |
US8776027B2 (en) | Extracting and collecting platform use data | |
US8220054B1 (en) | Process exception list updating in a malware behavior monitoring program | |
US9736173B2 (en) | Differential dependency tracking for attack forensics | |
US8225291B2 (en) | Automated detection of application performance bottlenecks | |
US8516499B2 (en) | Assistance in performing action responsive to detected event | |
JP6387777B2 (en) | Evaluation program, evaluation method, and evaluation apparatus | |
US20110258610A1 (en) | Optimizing performance of integrity monitoring | |
JP6260130B2 (en) | Job delay detection method, information processing apparatus, and program | |
US11966778B2 (en) | Cloud application scaler | |
JPWO2011071010A1 (en) | Load characteristic estimation system, load characteristic estimation method and program | |
US8307246B2 (en) | Real time monitoring of computer for determining speed of various processes | |
JP6282217B2 (en) | Anti-malware system and anti-malware method | |
US20140130065A1 (en) | Method and Device for Obtaining Using-Frequency of Application Program | |
JP2008191813A (en) | File importance determination device, file importance determination method and file importance determination program | |
US7496795B2 (en) | Method, system, and computer program product for light weight memory leak detection | |
JP2008191812A (en) | Program file importance determination device and program file importance determination method | |
US11361077B2 (en) | Kernel-based proactive engine for malware detection | |
JP2002351852A (en) | System operation management method | |
JP2009181494A (en) | Job processing system and job information acquisition method | |
JP2009163305A (en) | Log output device, log output method and log output program | |
WO2021124528A1 (en) | Incident response assistant system, incident response assistant method, and incident response assistant program | |
JP2002163130A (en) | Computer system, diagnostic device for computer system, and computer-readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090909 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090909 |
|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20100406 |