JP2004348640A - Method and system for managing network - Google Patents
Method and system for managing network Download PDFInfo
- Publication number
- JP2004348640A JP2004348640A JP2003147663A JP2003147663A JP2004348640A JP 2004348640 A JP2004348640 A JP 2004348640A JP 2003147663 A JP2003147663 A JP 2003147663A JP 2003147663 A JP2003147663 A JP 2003147663A JP 2004348640 A JP2004348640 A JP 2004348640A
- Authority
- JP
- Japan
- Prior art keywords
- operation information
- monitored
- status
- monitored machine
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明はネットワーク管理システム及びネットワーク管理方法にかかり、特にコンピュータネットワークに発生したトラブルの原因を特定することのできるネットワーク管理システム及びネットワーク管理方法に関する。
【0002】
【従来の技術】
近年、インターネット上で構築されているWebシステム等の安定運用が切望されている。Webシステム等を構成するコンピュータネットワークシステムは、通常複数のネットワーク機器で構成されており、例えば特許文献1に示されるように、種々の専用ソフトウェアを用いて稼動情報等を取得することによりその状態を監視している。例えば、Webページのレスポンスが低下した場合においては、管理者は、その原因を前記稼働情報をもとに手作業で調べている。
【0003】
また、特許文献2には、マルチメディアネットワークにおいて、標準的に取得可能なトラヒック情報を用い、運用サーバへの負荷等の影響を最小限に抑えて、特定サーバが提示する特定アプリケーションの性能劣化要因を分析可能にすることが示されている。
【0004】
また、特許文献3には、管理対象となるシステムの構成要素間の関係について、稼働情報をもとに定量化することにより、性能のボトルネックや障害の原因となる構成要素を絞り込み、原因の特定を早期に実現できるようにしたものが示されている。
【0005】
【特許文献1】
特開2001−144761号公報
【0006】
【特許文献2】
特開2001−195285号公報
【0007】
【特許文献3】
特開2002−342182号公報
【0008】
【発明が解決しようとする課題】
前記特許文献1の方法によれば、Webページのレスポンスが低下するというようなトラブルが発生した場合には、あらかじめ蓄積していた多数のネットワーク機器の稼動情報から、問題の根本原因となっている可能性のあるものを、手作業で調査しなければならない。このような作業は熟練したネットワーク管理者でないと困難な作業である。
【0009】
また、特許文献2,3に示す方法では、取得する稼働情報等の情報に欠損が存在する場合前記トラブルの原因を正確に特定することは困難である。
【0010】
本発明はこれらの問題点に鑑みてなされたもので、稼働情報に欠損がある場合においてもトラブルの原因を正確に特定することのできるネットワーク管理システム及びネットワーク管理方法を提供する。
【0011】
【課題を解決するための手段】
本発明は、上記の課題を解決するために次のような手段を採用した。
【0012】
各被監視マシンの稼働情報を取得する稼働情報取得部と、前記可動情報取得部が取得した被監視マシンの稼働情報を各被監視マシン毎に格納する稼働情報データベースと、各被監視マシン毎の稼働情報の欠損の有無を表すステータス情報を各監視対象計算機毎に格納するステータスデータベースと、前記稼働情報データベースに格納した被監視マシンの稼働情報及びステータスデータベースに格納したステータス情報をもとに特定の被監視マシンの稼働率変化の原因となる被監視マシンの候補を相関分析により特定して表示する稼働情報分析部を備えた。
【0013】
【発明の実施の形態】
以下、本発明の実施形態を添付図面を参照しながら説明する。図1は、本発明の実施形態にかかるネットワーク管理システムを説明する図である。稼動情報分析計算機100は稼動情報採取計算機120が取得した稼動情報(CPU利用率、メモリ利用率、Webページ応答時間等)を取得し、取得した稼動情報をもとに相関分析等を実施し、コンピュータシステムのトラブル(問題)の原因を探索する。
【0014】
稼動情報分析計算機100は、分析部101、稼動情報収集部105、画面表示部107、稼動情報データベース108、ステータスデータベース109を備える。分析部101は、実際に分析を実施する部署であり、相関分析部102、危険度計算部103、原因度計算部104を備える。稼動情報収集部105は、稼動情報採取計算機120から定期的に稼動情報を取得する。また、前記稼動情報が取得できない場合には、その旨を表すステータスを生成するステータス生成部106を備える。
【0015】
画面表示部107は、分析対象の選択、分析結果の表示及び分析範囲の絞込み等の各種処理に対応した表示を行う。稼動情報データベース108は、稼動情報採取計算機120から定期的に取得した稼動情報を記憶しておく記憶手段である。ステータスデータベース109は、稼動情報採取計算機120から抽出した稼動情報に一部欠損があった場合に生成するステータス情報を記憶しておく記憶手段である。なお、稼動情報分析計算機100は任意の数の稼動情報採取計算機120から稼動情報を取得することが可能である。
【0016】
また、稼動情報採取計算機120は、コンピュータネットワーク上で実際に監視対象となる被監視マシン150の稼動情報を採取し、採取した稼動情報分析計算機100からの稼動情報取得要求に答えて、稼動情報を送信する機能を持つ。また、稼動情報採取計算機120は、稼動情報取得部121、稼動情報採取ツール122を備える。稼動情報取得部121は、稼動情報採取ツール122が採取した稼動情報を取得し、稼動情報分析計算機に送信する。稼動情報採取ツール122は一般的な市販のネットワーク管理ツールであり、複数の被監視マシン150から稼動情報を採取する。
【0017】
被監視マシン150はコンピュータネットワークを構成するネットワーク機器であり、一般的にはルータ、ハブ、スイッチ、ワークステーション、PC等が該当する。
【0018】
図2は、本発明のネットワーク管理システムを適用するコンピュータネットワークの例を示す図である。この例では、Webショッピングモール等を実施する場合に構築される典型的なWebシステムの例である。
【0019】
図に示すように、ネットワーク(WAN)210を挟んで、クライアントPC220とWebシステム220を構成する。Webシステム200は、ファイヤウオール201、ルータ202、Webサーバ203、AP(アプリケーション)サーバ204、205、及びDB(データベース)サーバ206、207、208等のネットワーク機器で構成する。
【0020】
各ネットワーク機器の稼動情報は一般的には複数のネットワーク管理アプリケーションによって採取する。図の例の場合では、ネットワーク管理アプリケーションが設置されているマシン(ルータ202,サーバ204等)が稼動情報採取計算機120となる。
【0021】
図3は、ステータス生成処理を説明する図である。ステータスは相関分析の欠点を補うために導入した手段であり、相関分析は、二つの異なる稼動情報を比較しその時系列データに相関性があるか(因果関係があるか)を調べる統計学的手法である。
【0022】
相関分析は、その対象とするデータの一部に欠損がある場合には正確な相関分析を行うことができない。ネットワークを構成するネットワーク機器が、トラブルの発生により一時的に停止した場合、停止期間中には稼動情報が採取されなくなる。この場合、一時停止した前記ネットワーク機器あるいはサーバはネットワークのトラブルの原因である可能性が高いにもかかわらず相関分析の対象とすることができない。
【0023】
本発明ではこの問題を解決するためにステータスという概念を導入している。ステータスは、稼動情報が採取できている期間には例えば「1」、稼動情報が採取できていない期間には例えば「0」を割り当て、全てのネットワーク機器に対してステータスを稼動情報とは別個に割り当てて蓄積しておく。そして、相関分析を行う際には、前記稼働情報の外にステータスを参照して行う。これにより、稼動情報が採取できなかったネットワーク機器(トラブルにより停止したネットワーク機器)に対しては、稼働情報に代えてステータスを参照することにより相関分析を実施することが可能となる。
【0024】
ステータス生成処理は、稼動情報分析計算機100の稼動情報収集部105のステータス生成部106で行われる。まず、ステップ300において、稼動情報収集部105は稼動情報採取計算機120の稼動情報取得部121から稼動情報を取得する。ステップ301において、採取した稼動情報を時系列に調査し、その時間帯で稼動情報が取得できているかどうかを判定する。稼動情報が取得できていれば、ステップ302においてステータスを1としてステータスデータベース109に格納する。同時にステップ304において稼動情報自体を稼動情報データベース108に格納する。稼動情報が取得できていなければ、ステップ303においてステータスを0としてステータスデータベース109に格納する。この処理を収集した稼動情報がなくなるまで実施する。
【0025】
図4は、ステータス情報のイメージを説明する図である。ネットワーク機器あるいはサーバの停止などにより、情報に欠損がある稼働情報400を取得した場合、図3に示すステータス生成処理によりステータスを生成すると、ステータスデータ401が得られる。
【0026】
ステータスは、前述のように監視対象期間のうち、稼動情報が採取できている期間には「1」、稼動情報が採取できていない期間には「0」を割り当てる。
【0027】
図に示すように、分析対象とするネットワーク機器等の稼動情報402の変化が、ネットワーク機器等の停止に影響されている場合、ステータスデータ401を用いて、ステータスデータ401と稼動情報402との相関等を分析することにより、稼動情報402の変化の原因を特定することができる。
【0028】
図5は、稼働率変化の原因となる被監視マシンの候補(原因候補)を相関分析により特定する処理を説明する図である。
【0029】
まず、ステップ500において、分析対象とする被監視マシンの稼動情報を選択し、分析の期間(時刻範囲)を決定する。この作業はネットワーク管理者が行う。前述したように、Webシステムの場合、一般的にはWebページのレスポンス時間等が分析対象となる。次に、ステップ501において、原因候補として調査するネットワーク機器の範囲を決定する。この作業もネットワーク管理者が行う。なお、確実に原因候補とならない要素はここで調査範囲から外しておく。
【0030】
ステップ502以降は稼動情報分析計算機100により自動的に行う。まず、ステップ502において原因候補として調査するネットワーク機器の稼動情報に対して、分析対象との相関分析を実施し、0から1の範囲の相関係数を計算する。この相関係数は大きいほど、分析対象との相関が高いことを表す。 稼動情報に欠損がある場合には、ステップ503において、ステータスデータベースからステータス情報を取得し、分析対象の稼働率及びステータス情報をもとに相関分析を実施し、相関係数を計算する。ステップ504において、相関係数の上位幾つか(あらかじめ指定した値で、例えば10個)の稼動情報を、分析対象とした稼動情報に影響を与えた原因候補と決定する。
【0031】
図6は、原因候補の原因度の計算処理を説明する図である。まず、ステップ600において、図4で示す処理により原因候補となったネットワーク機器の稼動情報のしきい値を読み込む。なお、しきい値はあらかじめネットワーク管理者が適切に設定しておく。ステップ601で原因候補となったネットワーク機器の稼動情報が、分析対象となった期間でどれくらいの期間しきい値を超えていたかを計算し、0〜1の範囲の危険割合を算出する。例えば、1時間中の15分間、稼動情報がしきい値を超えていた場合、その稼動情報の危険割合は0.25とする。ステップ602において、相関係数と危険割合から原因度を計算する。原因度は、((相関係数×α)+(危険割合×(100−α)))/ 100で計算し、0〜1の範囲とする。なお、αは重み付けの為の係数で0〜100の任意の値を指定可能である。αを大きくすると、相関の高さを重要視し、αを小さくすると危険割合を重要視していることになる。
【0032】
図7は、稼動情報データベース108の構成を説明する図である。稼動情報データベースは、各ネットワーク機器の稼動情報を所定時間毎に格納する。図に示すように、稼動情報として、Webページ応答時間、回線利用率、CPU利用率、キャッシュヒット率等を格納する。なお、稼動情報が取得できていない場合は、値が無い状態となっている。
【0033】
図8は、ステータスデータベース109の構成を説明する図である。ステータスデータベースは、各ネットワーク機器のステータスを格納する。ステータスは各ネットワーク機器毎に1つだけ存在し、一定の時間おきに0か1の値を格納する。
【0034】
図9は、分析結果一覧画面900のイメージ例を説明する図である。分析結果一覧画面900は、稼動情報分析計算機100の画面表示部107に表示する。分析結果一覧画面900は、分析時刻ビュー901、分析対象ビュー902、分析結果ビュー903、グラフ表示ボタン904を備える。分析時刻ビュー901には、分析の対象範囲(期間)を時刻で表示する。分析対象ビュー903には分析対象として指定した稼動情報とその稼動情報を取得したネットワーク機器を表すマシン名を表示する。分析結果ビュー903には、最終的な分析結果が表示されるが、原因候補として可能性が高いもの(原因度が大きいもの)から順にリスト表示される。このリストの上位にある稼動情報が、分析対象としたWebページの応答時間が劣化したことの原因となるマシンの稼働情報である可能性が高いと考えらられる。分析結果ビュー903には順位、原因候補名、原因度、相関係数、危険割合が表示される。グラフ表示ボタン904を押すと、分析結果グラフ画面が表示される。
【0035】
図10は、分析結果グラフ画面1000のイメージ例を説明する図である。分析結果グラフ画面1000は、分析結果一覧画面900のグラフ表示ボタン904を押すと、稼動情報分析計算機100の画面表示部107に表示される。分析結果グラフ画面1000は、グラフビュー1001、グラフ要素ビュー1002、分析時刻ビュー1003を備える。グラフビュー1001は、分析対象および原因候補となった稼動情報のグラフを同時に表示する。グラフ要素ビュー1002は表示しているグラフのそれぞれがどの稼動情報のものであるかを表示する。分析時刻ビュー1003には、分析の対象範囲を時刻で表示する。
【0036】
以上説明したように、本実施形態によれば、コンピュータシステムにトラブルが発生した場合に、稼働情報に欠損がある場合においてもトラブルの原因を正確に特定し、その原因となっている可能性のあるネットワーク機器をネットワーク管理者に示すことができる。これにより、ネットワーク管理者は問題点の一次切り分け、及び復旧処理を速やかに行うことができる。なお、稼動情報分析計算機100及び稼動情報採取計算機120が備える明細書記載の各機能はソフトウエアにより実現することができる。
【0037】
また、前述のように監視対象期間を所定時間毎に分割し、各分割期間のうち、稼動情報が採取できている期間には「1」、稼動情報が採取できていない期間には「0」のステータスデータを割り当てたステータスデータを用いて相関分析を行う。このため、トラブルの発生により一時的に停止したネットワーク機器等(稼働率低下の原因である可能性が高い)を相関分析の対象とすることができる。
【0038】
【発明の効果】
以上説明したように本発明によれば、稼働情報に欠損がある場合においてもトラブルの原因を正確に特定することのできるネットワーク管理システムを提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態にかかるネットワーク管理システムを説明する図である。
【図2】本発明のネットワーク管理システムを適用するコンピュータネットワークの例を示す図である。
【図3】ステータス生成処理を説明する図である。
【図4】ステータス情報のイメージを説明する図である。
【図5】稼働率変化の原因となる被監視マシンの候補を相関分析により特定する処理を説明する図である。
【図6】原因候補の原因度の計算処理を説明する図である。
【図7】稼動情報データベース108の構成を説明する図である。
【図8】ステータスデータベース109の構成を説明する図である。
【図9】分析結果一覧画面900のイメージ例を説明する図である。
【図10】分析結果グラフ画面1000のイメージ例を説明する図である。
【符号の説明】
101 稼働情報分析計算機
102 相関分析部
103 危険度計算部
104 原因度計算部
105 稼働情報収集部
106 ステータス生成部
107 画面表示部
108 稼働情報データベース
109 ステータスデータベース
110 ネットワーク
120,130,140 稼働情報採取計算機
121,131,141 稼働情報取得部
122,132,142 稼働情報採取ツール
150,160,170,180 被監視マシン
200 Webシステム
201 ファイヤウォール
202 ルーター
203 Webサーバ
204,205 APサーバ
206,207,208 DBサーバ
210 ネットワーク
220 クライアントPC[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a network management system and a network management method, and more particularly to a network management system and a network management method capable of specifying a cause of a trouble that has occurred in a computer network.
[0002]
[Prior art]
2. Description of the Related Art In recent years, stable operation of a Web system or the like built on the Internet has been desired. A computer network system that constitutes a Web system or the like generally includes a plurality of network devices. For example, as shown in
[0003]
Japanese Patent Application Laid-Open No. H11-163873 discloses a method for deteriorating the performance of a specific application presented by a specific server by using traffic information that can be acquired as standard in a multimedia network, minimizing the influence of a load on an operation server, and the like. To be able to be analyzed.
[0004]
Patent Document 3 discloses that the relationship between the components of the system to be managed is quantified based on the operation information, thereby narrowing down the components causing a performance bottleneck or a failure. It is shown that the identification can be realized early.
[0005]
[Patent Document 1]
JP 2001-144761 A [0006]
[Patent Document 2]
JP 2001-195285 A
[Patent Document 3]
JP-A-2002-342182
[Problems to be solved by the invention]
According to the method of
[0009]
Further, according to the methods described in Patent Documents 2 and 3, it is difficult to accurately identify the cause of the trouble when information such as operation information to be acquired has a defect.
[0010]
The present invention has been made in view of these problems, and provides a network management system and a network management method capable of accurately specifying the cause of a trouble even when operation information has a defect.
[0011]
[Means for Solving the Problems]
The present invention employs the following means in order to solve the above problems.
[0012]
An operation information acquisition unit that acquires operation information of each monitored machine; an operation information database that stores operation information of the monitored machines acquired by the movable information acquisition unit for each monitored machine; A status database that stores status information indicating the presence or absence of lack of operation information for each computer to be monitored, and a specific database based on the operation information of the monitored machine stored in the operation information database and the status information stored in the status database. An operation information analysis unit is provided for identifying and displaying a candidate of the monitored machine that causes a change in the operation rate of the monitored machine by correlation analysis.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a diagram illustrating a network management system according to an embodiment of the present invention. The operation information analysis computer 100 acquires the operation information (CPU utilization, memory utilization, Web page response time, etc.) acquired by the operation
[0014]
The operation information analysis computer 100 includes an
[0015]
The
[0016]
The operation
[0017]
The monitored
[0018]
FIG. 2 is a diagram illustrating an example of a computer network to which the network management system of the present invention is applied. This example is an example of a typical Web system constructed when implementing a Web shopping mall or the like.
[0019]
As shown in the figure, a
[0020]
The operation information of each network device is generally collected by a plurality of network management applications. In the case of the example shown in the figure, the machine (
[0021]
FIG. 3 is a diagram illustrating the status generation processing. Status is a method introduced to make up for the shortcomings of correlation analysis. Correlation analysis is a statistical method that compares two different pieces of operation information and checks whether the time-series data is correlated (causal relationship). It is.
[0022]
Correlation analysis cannot perform accurate correlation analysis if part of the target data has a defect. If a network device constituting the network is temporarily stopped due to the occurrence of a trouble, the operation information is not collected during the stop period. In this case, the suspended network device or server cannot be a target of the correlation analysis even though there is a high possibility of causing a network trouble.
[0023]
The present invention introduces the concept of status in order to solve this problem. The status is assigned, for example, “1” during a period in which the operation information is collected, and “0”, for example, in a period during which the operation information is not collected. The status is assigned to all network devices separately from the operation information. Assign and accumulate. When performing a correlation analysis, the correlation analysis is performed by referring to a status in addition to the operation information. This makes it possible to perform correlation analysis on network devices for which operation information could not be collected (network devices stopped due to a trouble) by referring to the status instead of the operation information.
[0024]
The status generation processing is performed by the
[0025]
FIG. 4 is a diagram illustrating an image of the status information. When the
[0026]
As described above, among the monitoring target periods, “1” is assigned to a period during which operation information can be collected, and “0” is assigned to a period during which operation information cannot be collected.
[0027]
As shown in the figure, when the change of the
[0028]
FIG. 5 is a diagram illustrating a process of identifying a monitored machine candidate (cause candidate) that causes a change in the operation rate by correlation analysis.
[0029]
First, in
[0030]
Step 502 and subsequent steps are automatically performed by the operation information analysis computer 100. First, in
[0031]
FIG. 6 is a diagram illustrating a process of calculating the degree of cause of a cause candidate. First, in
[0032]
FIG. 7 is a diagram illustrating the configuration of the
[0033]
FIG. 8 is a diagram illustrating the configuration of the
[0034]
FIG. 9 is a diagram illustrating an example of an image of the analysis
[0035]
FIG. 10 is a diagram illustrating an example of an image of the analysis
[0036]
As described above, according to the present embodiment, when a trouble occurs in a computer system, the cause of the trouble can be accurately specified even if there is a defect in the operation information, and the possibility of the cause may be determined. A network device can be shown to a network administrator. As a result, the network administrator can quickly perform the primary isolation of the problem and the recovery processing. The functions described in the specification of the operation information analysis computer 100 and the operation
[0037]
Further, as described above, the monitoring target period is divided into predetermined periods, and among the divided periods, “1” is set during a period in which operation information is collected, and “0” is set during a period in which operation information is not collected. The correlation analysis is performed by using the status data to which the status data is assigned. For this reason, a network device or the like that has been temporarily stopped due to the occurrence of a trouble (it is highly likely to be a cause of a decrease in the operation rate) can be subjected to the correlation analysis.
[0038]
【The invention's effect】
As described above, according to the present invention, it is possible to provide a network management system capable of accurately specifying the cause of a trouble even when operation information has a defect.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a network management system according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating an example of a computer network to which the network management system of the present invention is applied.
FIG. 3 is a diagram illustrating a status generation process.
FIG. 4 is a diagram illustrating an image of status information.
FIG. 5 is a diagram illustrating a process of identifying a monitored machine candidate that causes a change in the operation rate by correlation analysis;
FIG. 6 is a diagram illustrating a process of calculating the degree of cause of a cause candidate.
FIG. 7 is a diagram illustrating a configuration of an operation information database.
FIG. 8 is a diagram illustrating a configuration of a
FIG. 9 is a diagram illustrating an example of an image of an analysis
FIG. 10 is a diagram illustrating an example of an image of an analysis
[Explanation of symbols]
101 operation information analysis computer 102
Claims (5)
前記可動情報取得部が取得した被監視マシンの稼働情報を各被監視マシン毎に格納する稼働情報データベースと、
各被監視マシン毎の稼働情報の欠損の有無を表すステータス情報を各監視対象計算機毎に格納するステータスデータベースと、
前記稼働情報データベースに格納した被監視マシンの稼働情報及びステータスデータベースに格納したステータス情報をもとに特定の被監視マシンの稼働率変化の原因となる被監視マシンの候補を相関分析により特定して表示する稼働情報分析部を備えたことを特徴とするネットワーク管理システム。An operation information acquisition unit that acquires operation information of each monitored machine;
An operation information database that stores operation information of the monitored machines acquired by the movable information acquisition unit for each monitored machine,
A status database that stores status information indicating whether or not the operation information is missing for each monitored machine for each monitored computer;
Based on the operation information of the monitored machine stored in the operation information database and the status information stored in the status database, the candidate of the monitored machine causing the change in the operation rate of the specific monitored machine is identified by correlation analysis. A network management system comprising an operation information analysis unit for displaying.
前記分析部は、前記特定の被監視マシンの稼働率変化の原因となる被監視マシンの候補となった計算機の稼働情報を取得し、該稼働情報が示す稼働率が所定の閾値を超えている期間をもとに危険度を計算することを特徴とするネットワーク管理システム。The network management system according to claim 1,
The analysis unit acquires operation information of a computer that is a candidate of the monitored machine that causes a change in the operation rate of the specific monitored machine, and the operation rate indicated by the operation information exceeds a predetermined threshold. A network management system for calculating a risk based on a period.
前記分析部は、前記相関分析による相関係数及び前記危険度をもとに原因度を計算することを特徴とするネットワーク管理システム。The network management system according to claim 2,
The network management system, wherein the analysis unit calculates a cause based on the correlation coefficient obtained by the correlation analysis and the risk.
前記可動情報取得部が取得した被監視マシンの稼働情報を各被監視マシン毎に稼働情報データベースに格納する工程と、
各被監視マシン毎の稼働情報の欠損の有無を表すステータス情報を各監視対象計算機毎にステータスデータベースに格納する工程と、
前記稼働情報データベースに格納した被監視マシンの稼働情報及びステータスデータベースに格納したステータス情報をもとに特定の被監視マシンの稼働率変化の原因となる被監視マシンの候補を相関分析により特定して表示する工程を備えたことを特徴とするネットワーク管理方法。A step of acquiring operation information of each monitored machine;
Storing the operation information of the monitored machine acquired by the movable information acquisition unit in an operation information database for each monitored machine;
A step of storing status information indicating presence or absence of loss of operation information of each monitored machine in a status database for each monitored computer;
Based on the operation information of the monitored machine stored in the operation information database and the status information stored in the status database, the candidate of the monitored machine causing the change in the operation rate of the specific monitored machine is identified by correlation analysis. A network management method comprising a step of displaying.
前記分析部は、前記特定の被監視マシンの稼働率変化の原因となる被監視マシンの候補となった計算機の稼働情報を取得し、該稼働情報が示す稼働率が所定の閾値を超えている期間をもとに危険度を計算することを特徴とするネットワーク管理方法。The network management method according to claim 4,
The analysis unit acquires operation information of a computer that is a candidate of the monitored machine that causes a change in the operation rate of the specific monitored machine, and the operation rate indicated by the operation information exceeds a predetermined threshold. A network management method comprising calculating a risk level based on a period.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003147663A JP2004348640A (en) | 2003-05-26 | 2003-05-26 | Method and system for managing network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003147663A JP2004348640A (en) | 2003-05-26 | 2003-05-26 | Method and system for managing network |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004348640A true JP2004348640A (en) | 2004-12-09 |
Family
ID=33534134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003147663A Pending JP2004348640A (en) | 2003-05-26 | 2003-05-26 | Method and system for managing network |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004348640A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007060721A1 (en) * | 2005-11-24 | 2007-05-31 | Hewlett-Packard Development Company, L.P. | Network administrating device and method of administrating network |
CN100435151C (en) * | 2005-09-30 | 2008-11-19 | 兄弟工业株式会社 | Information management device, information management system, and computer usable medium |
CN100447790C (en) * | 2005-07-26 | 2008-12-31 | 兄弟工业株式会社 | Information management system, information processing device, and program |
WO2010038327A1 (en) * | 2008-09-30 | 2010-04-08 | 株式会社 日立製作所 | Root cause analysis method targeting information technology (it) device not to acquire event information, device and program |
JP2010191738A (en) * | 2009-02-19 | 2010-09-02 | Hitachi Ltd | Failure analysis support system |
JP2011258057A (en) * | 2010-06-10 | 2011-12-22 | Fujitsu Ltd | Analysis program, analysis method, and analyzer |
WO2012046293A1 (en) * | 2010-10-04 | 2012-04-12 | 富士通株式会社 | Fault monitoring device, fault monitoring method and program |
JP2016006567A (en) * | 2014-06-20 | 2016-01-14 | 富士通株式会社 | Output program, output device and output method |
JP2016197450A (en) * | 2016-07-25 | 2016-11-24 | 日本電気株式会社 | Operation management device, operation management system, information processing method, and operation management program |
JP2018530803A (en) * | 2015-07-14 | 2018-10-18 | サイオス テクノロジー コーポレーションSios Technology Corporation | Apparatus and method for utilizing machine learning principles for root cause analysis and repair in a computer environment |
JPWO2019176062A1 (en) * | 2018-03-15 | 2020-12-17 | 日本電気株式会社 | Analyzer, analysis method, and program |
-
2003
- 2003-05-26 JP JP2003147663A patent/JP2004348640A/en active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100447790C (en) * | 2005-07-26 | 2008-12-31 | 兄弟工业株式会社 | Information management system, information processing device, and program |
CN100435151C (en) * | 2005-09-30 | 2008-11-19 | 兄弟工业株式会社 | Information management device, information management system, and computer usable medium |
WO2007060721A1 (en) * | 2005-11-24 | 2007-05-31 | Hewlett-Packard Development Company, L.P. | Network administrating device and method of administrating network |
US8359378B2 (en) | 2005-11-24 | 2013-01-22 | Hewlett-Packard Development Company, L.P. | Network system and method of administrating networks |
US8479048B2 (en) | 2008-09-30 | 2013-07-02 | Hitachi, Ltd. | Root cause analysis method, apparatus, and program for IT apparatuses from which event information is not obtained |
WO2010038327A1 (en) * | 2008-09-30 | 2010-04-08 | 株式会社 日立製作所 | Root cause analysis method targeting information technology (it) device not to acquire event information, device and program |
JP2010086115A (en) * | 2008-09-30 | 2010-04-15 | Hitachi Ltd | Root cause analysis method targeting information technology (it) device not to acquire event information, device and program |
CN101981546A (en) * | 2008-09-30 | 2011-02-23 | 株式会社日立制作所 | Root cause analysis method targeting information technology (IT) device not to acquire event information, device and program |
US8020045B2 (en) | 2008-09-30 | 2011-09-13 | Hitachi, Ltd. | Root cause analysis method, apparatus, and program for IT apparatuses from which event information is not obtained |
CN101981546B (en) * | 2008-09-30 | 2015-04-01 | 株式会社日立制作所 | Root cause analysis method targeting information technology (IT) device not to acquire event information, device and program |
JP2010191738A (en) * | 2009-02-19 | 2010-09-02 | Hitachi Ltd | Failure analysis support system |
JP2011258057A (en) * | 2010-06-10 | 2011-12-22 | Fujitsu Ltd | Analysis program, analysis method, and analyzer |
JPWO2012046293A1 (en) * | 2010-10-04 | 2014-02-24 | 富士通株式会社 | Fault monitoring apparatus, fault monitoring method and program |
WO2012046293A1 (en) * | 2010-10-04 | 2012-04-12 | 富士通株式会社 | Fault monitoring device, fault monitoring method and program |
JP2016006567A (en) * | 2014-06-20 | 2016-01-14 | 富士通株式会社 | Output program, output device and output method |
JP2018530803A (en) * | 2015-07-14 | 2018-10-18 | サイオス テクノロジー コーポレーションSios Technology Corporation | Apparatus and method for utilizing machine learning principles for root cause analysis and repair in a computer environment |
JP2016197450A (en) * | 2016-07-25 | 2016-11-24 | 日本電気株式会社 | Operation management device, operation management system, information processing method, and operation management program |
JPWO2019176062A1 (en) * | 2018-03-15 | 2020-12-17 | 日本電気株式会社 | Analyzer, analysis method, and program |
JP7067612B2 (en) | 2018-03-15 | 2022-05-16 | 日本電気株式会社 | Analytical equipment, analytical methods, and programs |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4872944B2 (en) | Operation management apparatus, operation management system, information processing method, and operation management program | |
US10904112B2 (en) | Automatic capture of detailed analysis information based on remote server analysis | |
US20140189431A1 (en) | Method and system for monitoring transaction execution on a computer network and computer storage medium | |
CN111026621B (en) | Monitoring alarm method, device, equipment and medium for Elasticissearch cluster | |
JP6823265B2 (en) | Analytical instruments, analytical systems, analytical methods and analytical programs | |
US9692654B2 (en) | Systems and methods for correlating derived metrics for system activity | |
JP2004348640A (en) | Method and system for managing network | |
JP4504346B2 (en) | Trouble factor detection program, trouble factor detection method, and trouble factor detection device | |
CN113835918A (en) | Server fault analysis method and device | |
US7184935B1 (en) | Determining and annotating a signature of a computer resource | |
US20110179313A1 (en) | System and Method for Correlating Empirical Data with User Experience | |
JP2008108154A (en) | Management system for operation performance information | |
CN110011845B (en) | Log collection method and system | |
CN113342608A (en) | Method and device for monitoring streaming computing engine task | |
JP5974905B2 (en) | Response time monitoring program, method, and response time monitoring apparatus | |
JP5979185B2 (en) | Operation management apparatus, operation management system, information processing method, and operation management program | |
JP6168209B2 (en) | Operation management apparatus, operation management system, information processing method, and operation management program | |
CN115525392A (en) | Container monitoring method and device, electronic equipment and storage medium | |
JP5590196B2 (en) | Operation management apparatus, operation management system, information processing method, and operation management program | |
CN113407412A (en) | Micro-service monitoring method and system | |
JP5686001B2 (en) | Information processing apparatus, message isolation method, and message isolation program | |
JP5516494B2 (en) | Operation management apparatus, operation management system, information processing method, and operation management program | |
JP5380386B2 (en) | Device information management system and method | |
JP2009134535A (en) | Device for supporting software development, method of supporting software development, and program for supporting software development | |
JP2004164552A (en) | System and method for data display and program |