JP5258040B2 - Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program - Google Patents
Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program Download PDFInfo
- Publication number
- JP5258040B2 JP5258040B2 JP2008279292A JP2008279292A JP5258040B2 JP 5258040 B2 JP5258040 B2 JP 5258040B2 JP 2008279292 A JP2008279292 A JP 2008279292A JP 2008279292 A JP2008279292 A JP 2008279292A JP 5258040 B2 JP5258040 B2 JP 5258040B2
- Authority
- JP
- Japan
- Prior art keywords
- configuration information
- information
- symptom
- event
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Description
本発明は、シンプトンの記憶量を過度に増大させることなく、障害検出精度を高く維持することができる障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラムに関する。 The present invention relates to an apparatus that supports detection of a fault event that can maintain high fault detection accuracy without excessively increasing the storage amount of symptom, a method that supports detection of a fault event, and a computer program.
昨今のコンピュータ技術の急速な発展により、コンピュータシステムは社会インフラを構築する基幹システムに当然のように組み込まれている。社会インフラを定常的に正常に運用するためには、相当の運用コストが発生する。斯かる運用コストを少しでも削減し、しかもシステムの安定度を高める技術としてオートノミック・コンピューティング・システムが注目されている。 Due to the rapid development of computer technology in recent years, computer systems are naturally incorporated in core systems that build social infrastructure. In order to operate social infrastructure regularly and properly, considerable operational costs are incurred. An autonomic computing system has attracted attention as a technique for reducing such operation costs as much as possible and increasing the stability of the system.
オートノミック・コンピューティング・システムは、システム規模の自己管理型環境を構築する技術全体の総称であり、システムに生じた問題、障害等を検出して自律的に解消するシステム全般を意味している。システムに生じた問題、障害等を検出する方法は、多様な方法が開示されている。 The autonomic computing system is a general term for all technologies for constructing a system-wide self-managed environment, and means an entire system that autonomously resolves problems and failures that occur in the system. Various methods have been disclosed for detecting problems, faults, etc. occurring in the system.
例えば特許文献1では、障害を含むサブジェクト構成要素の状態に至った根本原因を、サブジェクト構成要素が依存する他の構成要素及び該構成要素に関連する関係モデルの一部を走査することにより特定し、構成要素それぞれに関連する状態を判定する根本原因識別方法が開示されている。また、特許文献2では、コンピューティング環境下の様々なコンポーネント間の依存関係情報、特に実行時の依存関係を管理する依存性管理方法が開示されている。
しかし、特許文献1に開示されている根本原因識別方法では、依存関係モデルを上流から下流までくまなく走査することにより精度良く根本原因を検出することができるが、依存関係モデルが複雑である場合には、走査自体に相当の時間を要し、依存関係モデルの走査順序も特定されていないことからパフォーマンス、ユーザビリティの低下を引き起こすおそれがあるという問題点があった。
However, in the root cause identification method disclosed in
斯かる問題を解決するためには、特許文献2に開示されている依存関係モデルにシステムの構成情報を付与することが考えられるが、モデル生成時に必ずしもシステムの構成情報を付与することができるとは限らない。したがって、システムの構成情報を有していない依存関係モデルが存在する場合であってもパフォーマンス、ユーザビリティの低下を防止することが望まれる。
In order to solve such a problem, it is conceivable to add system configuration information to the dependency relationship model disclosed in
本発明は斯かる事情に鑑みてなされたものであり、依存関係モデルを構成するために必要となる論理式等の知識(以下、シンプトン)にシステム構成情報が付与されていない場合であっても、シンプトンの適用効率を向上させ、障害が発生したイベントの検出精度を高く維持することができる障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and even when system configuration information is not given to knowledge (hereinafter referred to as symptoms) such as logical expressions necessary for constructing a dependency model. An object of the present invention is to provide an apparatus for supporting the detection of a fault event that can improve the efficiency of applying symptom and maintain high detection accuracy of the event in which the fault has occurred, a method for supporting the detection of a fault event, and a computer program And
上記目的を達成するために第1発明に係る障害イベントの検出を支援する装置は、少なくとも複数のコンポーネントを含むシステムのログ情報又は該システムでの障害発生時に各コンポーネントから出力される障害情報のいずれかを含む前記システムの履歴情報を収集する履歴情報収集手段と、発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段と、収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段と、特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段と、特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得する正誤情報取得手段と、取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新する更新手段とを備える。 Device, the log information Homata of a system including at least a plurality of components failure information output from each component upon occurrence failure in the system to support the detection of a failure event according to the first invention to achieve the above object History information collecting means for collecting history information of the system including any of the above, and a symptom storage for storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the fault that has occurred Means, an event group specifying means for specifying an event group that matches the symptom based on the collected history information and the stored symptom, and each event group is transmitted based on the specified event group System configuration information, including related information between the component and other components Extraction means for extracting partial configuration information, and correct / incorrect information acquisition means for acquiring whether or not an event in which a failure has occurred has been normally detected based on the identified event group and the extracted partial configuration information And updating means for updating the symptom that is the basis for specifying the event group based on the acquired correct / incorrect information and the extracted partial configuration information.
また、第2発明に係る障害イベントの検出を支援する装置は、第1発明において、前記システムの構成情報であるシステム構成情報を取得するシステム構成情報取得手段を備え、前記シンプトン記憶手段は、取得したシステム構成情報のうち、記憶されているシンプトンの基礎となったイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を前記シンプトンに付加情報として付加するようにしてある。 According to a second aspect of the present invention, there is provided an apparatus for supporting the detection of a failure event according to the first aspect, further comprising system configuration information acquisition means for acquiring system configuration information that is configuration information of the system, wherein the symptom storage means is acquired. Among the system configuration information, the partial configuration information, which is the system configuration information related to the component that sent the event that is the basis of the stored symptom, is added to the symptom as additional information.
次に、上記目的を達成するために第3発明に係る障害イベントの検出を支援する方法は、少なくとも複数のコンポーネントを含むシステムのログ情報又は該システムでの障害発生時に各コンポーネントから出力される障害情報のいずれかを含む前記システムの履歴情報を収集するステップと、発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するステップと、収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するステップと、特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出するステップと、特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得するステップと、取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新するステップとを含む。 Next, a method for supporting the detection of the failure event according to a third invention for achieving the above object, the log information Homata of a system including at least a plurality of components is output from each component upon occurrence failure in the system Collecting history information of the system including any failure information , storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred, and A step of identifying an event group that matches the symptom based on the collected history information and the stored symptom, and a component that sent each of the event group based on the identified event group and other components Partial configuration information, which is system configuration information including information related to A step of acquiring, a step of acquiring correct / incorrect information on whether or not an event in which a failure has occurred has been normally detected based on the identified event group and the extracted partial configuration information, and the acquired correct / incorrect information and the extracted Updating the symptom that is the basis for identifying the event group based on partial configuration information.
次に、上記目的を達成するために第4発明に係るコンピュータプログラムは、複数のコンポーネントを含むシステムで障害が発生したイベントの検出を支援するコンピュータで実行することが可能であり、前記コンピュータを、少なくとも前記システムのログ情報又は該システムでの障害発生時に各コンポーネントから出力される障害情報のいずれかを含む前記システムの履歴情報を収集する履歴情報収集手段、発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段、収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段、特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段、特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得する正誤情報取得手段、及び取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新する更新手段として機能させる。 Next, in order to achieve the above object, a computer program according to the fourth invention can be executed by a computer that supports detection of an event in which a failure has occurred in a system including a plurality of components. said component at least log information Homata of the system associated with the history information collecting means for collecting history information of the system, the failure that has occurred, including any of the failure information output from each component upon occurrence failure in the system Based on the symptom storage means for storing the symptom obtained by adding predetermined additional information to the detection rule for detecting the event included in the event, the collected history information, and the stored symptom, the event group that matches the symptom is specified. Event group identification means, based on the identified event group Extraction means for extracting partial configuration information, which is system configuration information including related information between the component that sent each event group and other components, a failure based on the identified event group and the extracted partial configuration information The correct / incorrect information acquisition means for acquiring correct / incorrect information regarding whether or not the event in which the event occurred has been normally detected, and the symptom that is the basis for specifying the event group based on the acquired correct / incorrect information and the extracted partial configuration information It functions as an updating means for updating.
また、第5発明に係るコンピュータプログラムは、第4発明において、前記コンピュータを、前記システムの構成情報であるシステム構成情報を取得するシステム構成情報取得手段として機能させ、前記シンプトン記憶手段を、取得したシステム構成情報のうち、記憶されているシンプトンの基礎となったイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を前記シンプトンに付加情報として付加する手段として機能させる。 The computer program according to a fifth aspect of the present invention is the computer program according to the fourth aspect , wherein the computer functions as system configuration information acquisition means for acquiring system configuration information that is configuration information of the system, and the symptom storage means is acquired. Of the system configuration information, the partial configuration information that is the system configuration information related to the component that has transmitted the event that is the basis of the stored symptom is caused to function as means for adding to the symptom as additional information.
次に、上記目的を達成するために第6発明に係る障害イベントの検出を支援する装置は、少なくとも複数のコンポーネントを含むシステムのログ情報又は該システムでの障害発生時に各コンポーネントから出力される障害情報のいずれかを含む前記システムの履歴情報を収集する履歴情報収集手段と、発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段と、収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段と、特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段と、該抽出手段で抽出された部分構成情報と、前記イベント群特定手段で前記イベント群を特定するのに適用した前記シンプトンに含まれている部分構成情報との適合度を算出する適合度算出手段と、算出された適合度が所定値より大きいか否かを判断する判断手段と、該判断手段で所定値より大きいと判断された場合、前記抽出手段で抽出された部分構成情報に正常に検出された旨を示す情報を付加した正常検出構成情報を、所定値以下であると判断された場合、前記抽出手段で抽出された部分構成情報に誤検出された旨を示す情報を付加した誤検出構成情報を、それぞれ前記シンプトンに付加して前記シンプトンを更新する更新手段とを備える。 Next, apparatus for supporting detection of a failure event according to the sixth invention to achieve the above object, the log information Homata of a system including at least a plurality of components is output from each component upon occurrence failure in the system History information collecting means for collecting history information of the system including any of the failure information , and a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred Symptom storage means, event group specifying means for specifying an event group matching the symptom based on collected history information and stored symptom, and each event group based on the specified event group System that contains relevant information between the component that sent the message and other components Extraction means for extracting partial configuration information as composition information, partial configuration information extracted by the extraction means, and a portion included in the symptom applied to specify the event group by the event group specification means The degree-of-fit calculation means for calculating the degree of fit with the configuration information, the judgment means for judging whether or not the calculated degree of fit is larger than a predetermined value, When it is determined that the normal detection configuration information obtained by adding information indicating normal detection to the partial configuration information extracted by the extraction unit is equal to or less than a predetermined value, the partial configuration information extracted by the extraction unit is And updating means for updating the symptom by adding erroneously detected configuration information to which information indicating that the error has been detected is added to the symptom.
本発明によれば、部分構成情報をシンプトンが保有していない場合であっても、障害が発生したイベントの検出結果に応じて部分構成情報をシンプトンに付加することができる。したがって、付加された部分構成情報により、どのシンプトンを優先して適用するべきか容易に判断することができ障害が発生したイベントの検出精度の向上を図ることができる。また、誤って障害が発生したイベントを検出した場合の部分構成情報も記憶しておくことにより、誤検出時に用いられた部分構成情報との適合度も提示することができ、適合度に基づくシンプトン適用の順位付けをより精度良く行うことが可能となる。 According to the present invention, even if the symptom does not hold the partial configuration information, the partial configuration information can be added to the symptom according to the detection result of the event in which the failure has occurred. Therefore, it is possible to easily determine which symptom should be preferentially applied based on the added partial configuration information, and it is possible to improve the detection accuracy of an event in which a failure has occurred. Also, by storing the partial configuration information when an event in which a fault has occurred in error is stored, the degree of conformity with the partial configuration information used at the time of erroneous detection can also be presented. Application ranking can be performed with higher accuracy.
以下、本発明の実施の形態に係る障害イベントの検出を支援する装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。 Hereinafter, an apparatus for supporting detection of a failure event according to an embodiment of the present invention will be specifically described with reference to the drawings. The following embodiments do not limit the invention described in the claims, and all combinations of characteristic items described in the embodiments are essential to the solution. It goes without saying that it is not limited.
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。 The present invention can be implemented in many different modes and should not be construed as being limited to the description of the embodiment. The same symbols are attached to the same elements throughout the embodiments.
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した障害イベントの検出を支援する装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、障害イベントの検出を支援する装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソフトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。 In the following embodiments, an apparatus for supporting the detection of a failure event in which a computer program is introduced into a computer system will be described. However, as will be apparent to those skilled in the art, the present invention can be partially executed by a computer. It can be implemented as a possible computer program. Therefore, the present invention can take a hardware embodiment of a device that supports detection of a failure event, a software embodiment, or a combination of software and hardware. The computer program can be recorded on any computer-readable recording medium such as a hard disk, DVD, CD, optical storage device, magnetic storage device or the like.
本発明の実施の形態では、部分構成情報をシンプトンが保有していない場合であっても、障害が発生したイベントの検出結果に応じて部分構成情報をシンプトンに付加することができる。したがって、付加された部分構成情報により、どのシンプトンを優先して適用するべきか容易に判断することができ、障害が発生したイベントの検出精度の向上を図ることができる。また、誤って障害が発生したイベントを検出した場合の部分構成情報も付加して記憶しておくことにより、誤検出時に用いられた部分構成情報との適合度も提示することができ、適合度に基づくシンプトン適用の順位付けをより精度良く行うことが可能となる。ここで、「部分構成情報」とは、システムを構成しているコンポーネントのうち障害が発生したイベントである障害発生イベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報を意味する。例えばコンポーネントであるアプリケーションサーバとデータベースとの関連情報、リンク情報等が含まれる。したがって、対象となるコンポーネント間のトポロジー図を正確に作成することができる。 In the embodiment of the present invention, even if the symptom does not hold the partial configuration information, the partial configuration information can be added to the symptom according to the detection result of the event in which the failure has occurred. Therefore, it is possible to easily determine which symptom should be preferentially applied based on the added partial configuration information, and it is possible to improve the detection accuracy of an event in which a failure has occurred. In addition, by adding and storing partial configuration information when an event in which a fault has occurred accidentally is detected, the degree of conformity with the partial configuration information used at the time of erroneous detection can be presented. It becomes possible to perform the ranking of the symptom application based on the above with higher accuracy. Here, “partial configuration information” means related information including dependency relationships between the component that sent the fault occurrence event that is the event in which the fault has occurred and the other components that constitute the system. To do. For example, information related to the application server as a component and a database, link information, and the like are included. Therefore, it is possible to accurately create a topology diagram between target components.
また、コンポーネント間の依存関係に関する情報だけではなく、障害解析に有用な関連を導出することが可能な情報、例えば通信における接続関係、命令、指示等による操作主体、客体の関係等の情報も含めてシンプトンに付加することができ、障害が発生している根本原因をより精度良く特定することができ、どのような条件下で障害が発生したイベントが検出されたのか条件をより容易に絞り込むことが可能となる。 Also includes not only information about dependency relationships between components, but also information that can be used to derive useful relationships for failure analysis, such as connection relationships in communications, information on operating subjects based on commands, instructions, etc., object relationships, etc. Can be added to the symptom, the root cause of the failure can be identified more accurately, and the conditions under which the failure event is detected can be more easily narrowed down. Is possible.
(実施の形態1)
図1は、本発明の実施の形態1に係る障害イベントの検出を支援する装置を含む障害イベント検出装置の構成例を示すブロック図である。本発明の実施の形態1に係る障害イベント検出装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、通信インタフェース15、ビデオインタフェース16、可搬型ディスクドライブ17及び上述したハードウェアを接続する内部バス18で構成されている。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration example of a failure event detection apparatus including an apparatus that supports detection of a failure event according to
CPU11は、内部バス18を介して障害イベント検出装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されているコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
The
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置13に記憶されているコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ17によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース15を介してネットワーク2に接続されている外部のコンピュータからダウンロードされたコンピュータプログラムであっても良い。
The
また記憶装置13は、シンプトンデータベース131を備えている。シンプトンデータベース131には、障害が発生したイベントを検出するための検出ルールに加えて、検出ルールごとに障害検出時の推奨アクション、コメント等を付加してある。ユーザが、障害が発生したイベントを選択し、ルールパターン等の検出ルールの生成に必要な情報を入力した場合、選択されたイベントに応じて検出ルールが抽出され、コンポーネントのトポロジー図とともに表示装置23に表示される。
The
また記憶装置13は、障害が発生したか否かの監視対象となるシステムのシステム構成情報を記憶する構成情報記憶部132と、監視対象となるシステムのログ情報、該システムで障害が発生した場合に出力されるイベント情報等の履歴情報を記憶する履歴情報記憶部133とを備えている。構成情報記憶部132は、監視対象となる監視対象システム200のコンポーネント間の依存関係情報、各コンポーネントの関連情報等を含むCCMDB(Change and Configuration Management DB)で構成されている。構成情報記憶部132に記憶されているシステム構成情報に基づいてコンポーネントのトポロジー図を表示することができる。なお、構成情報記憶部132は、記憶装置13内に備わっていても良いが、通常は本実施の形態1に係る障害イベント検出装置1とは別個に設けてあり、例えばネットワーク2を介して接続されている外部コンピュータ等に備わっている。
In addition, the
通信インタフェース15は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワーク2に接続されることにより、外部のコンピュータ等とデータ送受信を行うことが可能となっている。また、監視対象システム200ともネットワーク2を介して接続されており、システム構成情報、障害発生時の履歴情報等を取得することが可能となっている。
The
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース16は、CRTモニタ、LCD等の表示装置23と接続され、所定の画像を表示する。
The I /
図2は、本発明の実施の形態1に係る障害イベント検出装置1の機能ブロック図である。構成情報抽出部201は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を抽出して、構成情報記憶部132に記憶する。コンポーネント間の関連情報を含むシステム構成情報とは、例えばコンポーネント間の通信における接続関係情報、操作・非操作の関係に関するリンク関係情報等である。なお、構成情報抽出部201は本発明に必須の構成要件ではなく、事前に構成情報記憶部132にシステム構成情報を生成しておいても良く、障害イベント検出装置1内に内蔵していてもいなくても良い。すなわち、構成情報抽出部201及び構成情報記憶部132は、本発明の実施の形態1に係る障害イベント検出装置1の必須の構成要件ではない。
FIG. 2 is a functional block diagram of the failure
構成情報取得部202は、構成情報記憶部132に記憶されているシステム構成情報を取得する。システム構成情報は監視対象システム200ごとに対応付けて構成情報記憶部132に記憶してあり、監視対象システム200に応じて対応するシステム構成情報を取得する。
The configuration
履歴情報収集部203は、監視対象システム200を常時監視し、監視対象システム200に含まれる各コンポーネントから出力されたログ情報及び/又は障害発生時に出力されるイベント情報等の障害情報を含む履歴情報を収集して、履歴情報記憶部133に記憶する。ログ情報は、常時出力されるシステムログ等に限定されるものではなく、障害発生時に割り込み処理等により出力されるメッセージ情報等を含んでも良い。
The history
なお、履歴情報収集部203で収集した履歴情報は、それぞれデータ形式が相違することが多く、そのままでは障害が発生したイベントの候補となるイベントを特定するための基本情報として用いることができない場合も生じうる。そこで、データ形式変換部212を備え、標準的な統一データ形式に変換して履歴情報記憶部133へ記憶しておくことが望ましい。
Note that the history information collected by the history
検出ルール生成部204は、発生した障害に関連するコンポーネントに含まれるイベントを検出するための検出ルールを生成する。シンプトン記憶部205は、生成された検出ルールに所定の付加情報を付加したシンプトンを記憶する。付加情報としては、障害検出時の推奨アクション等に関する情報、各種コメントを含むメッセージ情報等を付加してある。
The detection
イベント検出部206は、記憶されているシンプトンに基づいて障害が発生したイベントを検出する。例えば、監視対象システム200のシステム構成情報が付加情報として付加されているシンプトンを適用する場合には、システム構成情報を考慮したイベント検出処理を実行することができる。
The
イベント選択受付部207は、発生した障害に関連するコンポーネントに含まれるイベントの選択を、例えばイベントリスト等からの選択として受け付ける。部分構成情報抽出部208は、構成情報取得部202で取得されたシステム構成情報から、イベント選択受付部207で選択を受け付けたイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を抽出する。抽出される部分構成情報とは、システムを構成しているコンポーネントのうち障害発生イベントとして選択を受け付けたイベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報も含んでいる。例えばコンポーネントであるアプリケーションサーバとデータベースとの関連情報、リンク情報等も含まれる。
The event
図3は、本発明の実施の形態1に係る障害イベント検出装置1における部分構成情報を含むシンプトンの構成の例示図である。図3(a)は従来のシンプトンの構成の例示図であり、シンプトンは、論理情報としてエラーAに起因してエラーBが誘導される旨を示す因果関係情報を有している。
FIG. 3 is an exemplary diagram of a symptom configuration including partial configuration information in the failure
一方、図3(b)は部分構成情報を付加したシンプトンの構成の例示図である。シンプトンは論理情報としての因果関係情報に、具体的なコンポーネントであるアプリケーションサーバAにてエラーAが生じることに起因して、具体的なコンポーネントであるデータベースBにてエラーBが生じる旨が付加されている。すなわち、コンポーネントであるアプリケーションサーバAとデータベースBとの依存関係に関する情報を付加することにより、障害発生イベントの検出のためのシンプトンとしてコンポーネント間の依存関係をも考慮に入れることができ、より障害発生イベントの検出精度を高めることができる。 On the other hand, FIG. 3B is an exemplary diagram of a symptom configuration to which partial configuration information is added. The symptom adds to the causal relationship information as logical information that error B occurs in database B, which is a specific component, due to occurrence of error A in application server A, which is a specific component. ing. In other words, by adding information about the dependency relationship between the application server A and the database B, which are components, the dependency relationship between components can be taken into account as a symptom for detecting a failure occurrence event. Event detection accuracy can be increased.
シンプトン更新部209は、部分構成情報抽出部208で抽出された部分構成情報を、対応するシンプトンに付加して記憶する。すなわち、部分構成情報が付加情報となる。部分構成情報提示部210は、部分構成情報抽出部208で抽出された部分構成情報を表示装置23に提示する。更新受付部211は、提示されている部分構成情報の更新を受け付ける。これにより、ユーザは提示された部分構成情報を所望の構成に変更することにより、適合した部分構成情報を確実に生成することができる。
The
図4は、部分構成情報提示部210により表示装置23に提示される画面40の例示図である。トポロジー図表示領域41には、監視対象システム200に含まれるコンポーネントの依存関係を示すトポロジー図を表示する。イベントリスト表示領域42には、監視対象システム200に含まれるイベントが一覧表示される。イベント選択受付部207により、イベントリスト表示領域42に表示されているイベント群の中から、発生した障害に関連するコンポーネントに含まれるイベントの選択を受け付けた場合、選択を受け付けたイベント及び依存関係を有するイベントが強調表示される。図4では、選択を受け付けたイベント及び依存関係を有するイベントの表示色を変更して表示している。強調表示の方法は特に限定されるものではなく、輝度を変更しても良い。
FIG. 4 is an exemplary view of a
部分構成情報表示領域43は、部分構成情報提示部210により、選択を受け付けたイベントに依存するコンポーネントのトポロジー図を部分的に表示する。コンポーネント表示領域44は、部分構成情報表示領域43に表示されているコンポーネントの内容を詳細に表示する。部分構成情報表示領域43に表示されているコンポーネントに対する更新情報を更新受付部211により受け付けることにより、部分構成情報を更新することもできる。具体的にはマウス等の操作によりイベントリスト表示領域42に一覧表示されているイベントから改めてイベントを選択することにより更新する。
In the partial configuration
部分構成情報は、コンポーネントごとの依存関係を含む情報としてシンプトンデータベース131に記憶される。図5は、記憶される部分構成情報の例示図である。図5(a)は、部分構成情報表示領域43及びコンポーネント表示領域44の例示図であり、図5(b)は、記憶される部分構成情報のデータ例である。図5(b)に示すように、部分構成情報表示領域43に抽出されているコンポーネントごとに、コンポーネントの種類、依存関係、及び各コンポーネント間のリンク情報がコード情報として記憶される。もちろん、記憶されるデータ形式は図5に示すデータ形式に限定されるものではない。
The partial configuration information is stored in the
図6は、本発明の実施の形態1に係る障害イベント検出装置1のCPU11の部分構成情報の付加処理の手順を示すフローチャートである。まず障害イベント検出装置1のCPU11は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を取得する(ステップS601)。もちろん、事前にシステム構成情報を取得して、構成情報記憶部132に記憶しておいても良い。
FIG. 6 is a flowchart showing a procedure of the partial configuration information addition processing of the
CPU11は、監視対象システム200に含まれる各コンポーネントから出力されたログ情報及び/又は障害発生時に出力されるイベント情報等の障害情報を含む履歴情報を収集して、履歴情報記憶部133に記憶する(ステップS602)。ログ情報は、常時出力されるシステムログ等に限定されるものではなく、障害発生時に割り込み処理等により出力されるメッセージ情報等を含んでも良い。
The
なお、履歴情報収集部203で収集した履歴情報は、それぞれデータ形式が相違することが多く、そのままでは障害が発生したイベントの候補となるイベントを特定するための基本情報として用いることができない場合も生じうる。そこで、ステップS602にて履歴情報記憶部133に記憶する前に、収集した履歴情報を統一された標準のデータ形式に変換しておくことが望ましい。これにより、コンポーネントごとに異なる履歴情報であっても、統一された標準のデータ形式にて収集することができ、検出ルール生成時に全ての履歴情報を活用することができる。
Note that the history information collected by the history
CPU11は、障害発生イベントの候補となる全てのイベントを表示装置23へ提示して(ステップS603)、ユーザによるイベントの選択を受け付ける(ステップS604)。具体的にはマウス等の操作により、例えばイベントリスト等からの選択として受け付ける。
The
CPU11は、選択を受け付けたイベント及び取得したシステム構成情報に基づいて、選択を受け付けたイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を抽出する(ステップS605)。抽出される部分構成情報とは、システムを構成しているコンポーネントのうち障害発生イベントとして選択を受け付けたイベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報も含んでいる。図3に示すようなアプリケーションサーバとデータベースとの関連情報も含まれる。
The
CPU11は、抽出された部分構成情報を、対応するシンプトンに付加情報として付加して記憶する(ステップS606)。このように部分構成情報をシンプトンに付加することにより、従来のように論理式だけでなく、監視対象システム200のシステム構成情報を反映させたシンプトンを検出ルールとして生成することができる。したがって、誤検出の可能性を著しく減少させることができ、既知の障害であるか否かを正確に判別することが可能となる。
The
以上のように本実施の形態1によれば、部分構成情報をシンプトンに付加することにより、記憶されているシンプトンの内容を確認することで障害が発生している根本原因をより精度良く特定することができ、どのような条件下で該障害が発生したイベントが検出されたのか容易に絞り込むことが可能となる。 As described above, according to the first embodiment, by adding the partial configuration information to the symptom, it is possible to more accurately identify the root cause of the failure by confirming the contents of the stored symptom. It is possible to easily narrow down under what conditions the event in which the failure has occurred is detected.
(実施の形態2)
本発明の実施の形態2に係る障害イベントの検出を支援する装置を含む障害イベント検出装置1の構成は、実施の形態1と同様であることから、同一の符号を付することにより詳細な説明は省略する。本実施の形態2は、シンプトンに部分構成情報が付加されている場合に、障害検出処理に適用するシンプトンに優先順位を付する点で実施の形態1と相違する。
(Embodiment 2)
Since the configuration of the fault
図7は、本発明の実施の形態2に係る障害イベント検出装置1の機能ブロック図である。構成情報抽出部201は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を抽出して、構成情報記憶部132に記憶する。コンポーネント間の関連情報を含むシステム構成情報とは、例えばコンポーネント間の通信における接続関係情報、操作・非操作の関係に関するリンク関係情報等である。なお、構成情報抽出部201は本発明に必須の構成要件ではなく、事前に構成情報記憶部132にシステム構成情報を生成しておいても良く、障害イベント検出装置1内に内蔵していてもいなくても良い。すなわち、構成情報抽出部201及び構成情報記憶部132は、本発明の実施の形態2に係る障害イベント検出装置1の必須の構成要件ではない。
FIG. 7 is a functional block diagram of the failure
構成情報取得部202は、構成情報記憶部132に記憶されているシステム構成情報を取得する。システム構成情報は監視対象システム200ごとに対応付けて構成情報記憶部132に記憶してあり、監視対象システム200に応じて対応するシステム構成情報を取得する。
The configuration
履歴情報収集部203は、監視対象システム200を常時監視し、監視対象システム200に含まれる各コンポーネントから出力されたログ情報及び/又は障害発生時に出力されるイベント情報等の障害情報を含む履歴情報を収集して、履歴情報記憶部133に記憶する。ログ情報は、常時出力されるシステムログ等に限定されるものではなく、障害発生時に割り込み処理等により出力されるメッセージ情報等を含んでも良い。
The history
なお、履歴情報収集部203で収集した履歴情報は、それぞれデータ形式が相違することが多く、そのままでは障害が発生したイベントの候補となるイベントを特定するための基本情報として用いることができない場合も生じうる。そこで、データ形式変換部212を備え、標準的な統一データ形式に変換して履歴情報記憶部133へ記憶しておくことが望ましい。
Note that the history information collected by the history
検出ルール生成部204は、発生した障害に関連するコンポーネントに含まれるイベントを検出するための検出ルールを生成する。シンプトン記憶部205は、生成された検出ルールに所定の付加情報を付加したシンプトンを記憶する。付加情報としては、障害検出時の推奨アクション等に関する情報、各種コメントを含むメッセージ情報等を付加してある。
The detection
イベント選択受付部207は、発生した障害に関連するコンポーネントに含まれるイベントの選択を、例えばイベントリスト等からの選択として受け付ける。部分構成情報抽出部208は、構成情報取得部202で取得されたシステム構成情報から、イベント選択受付部207で選択を受け付けたイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を抽出する。抽出される部分構成情報とは、システムを構成しているコンポーネントのうち障害発生イベントとして選択を受け付けたイベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報も含んでいる。例えばコンポーネントであるアプリケーションサーバとデータベースとの関連情報、リンク情報等も含まれる。
The event
本発明の実施の形態2に係る障害イベント検出装置1における部分構成情報を含むシンプトンの構成は実施の形態1と同様であり、上述した図3(b)に示す構成と同じである。すなわち、従来のシンプトンにコンポーネントであるアプリケーションサーバAとデータベースBとの依存関係に関する情報を追加することにより、障害発生イベントの検出のためのシンプトンとしてコンポーネント間の依存関係をも考慮に入れることができ、より障害が発生したイベントの検出精度を高めることができる。
The configuration of the symptom including the partial configuration information in the failure
シンプトン更新部209は、部分構成情報抽出部208で抽出された部分構成情報を、対応するシンプトンに付加して記憶する。すなわち、部分構成情報が付加情報となる。部分構成情報提示部210は、部分構成情報抽出部208で抽出された部分構成情報を表示装置23に提示する。更新受付部211は、提示されている部分構成情報の更新を受け付ける。これにより、ユーザは提示された部分構成情報を所望の構成に変更することにより、適合した部分構成情報を確実に生成することができる。
The
図8は、部分構成情報提示部210により表示装置23に提示される画面80の例示図である。トポロジー図表示領域81には、監視対象システム200に含まれるコンポーネントの依存関係を示すトポロジー図を表示する。シンプトンリスト表示領域82には、シンプトンデータベース131に記憶されているシンプトンが一覧表示される。例えばシンプトンリスト表示領域82に表示されているシンプトン群の中から、障害発生イベントの検出に適用するべきシンプトンの選択を受け付けた場合、選択を受け付けたシンプトンに付加されている部分構成情報が部分構成情報表示領域83に表示される。
FIG. 8 is an exemplary diagram of a
トポロジー図表示領域81に表示されているコンポーネントのうち、部分構成情報表示領域83に表示されている部分構成情報と一致しているコンポーネントは、シンプトンの選択を受け付けた時点で強調表示される。図8では、選択を受け付けたシンプトン及び該シンプトンに付加されている部分構成情報に対応する部分の表示色を変更して表示している。強調表示の方法は特に限定されるものではなく、輝度を変更しても良い。
Among the components displayed in the topology
一致度算出部701は、構成情報取得部202で取得したシステム構成情報と、シンプトン更新部209でシンプトンに付加して記憶されている部分構成情報とを比較して、シンプトンデータベース131に記憶されている部分構成情報ごとに両者の一致度を算出する。
The degree-of-
シンプトン抽出部702は、一致度算出部701で算出された一致度に基づいて、イベント検出部206で適用するシンプトンを抽出する。すなわち、一致度が高いシンプトンの適用優先順位を高くすることにより、障害が発生したイベントの検出精度を高める。
The
イベント検出部206は、一致度が高いシンプトンから順次適用して、障害が発生したイベントを検出する、一致度が高いシンプトンの適用優先順位を高めることにより、誤検出の可能性を低減し、障害が発生したイベントの検出精度を高めることができる。
The
図9は、本発明の実施の形態2に係る障害イベント検出装置1のCPU11のシンプトン抽出処理の手順を示すフローチャートである。障害イベント検出装置1のCPU11は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を取得する(ステップS901)。もちろん、事前にシステム構成情報を取得して、構成情報記憶部132に記憶しておいても良い。
FIG. 9 is a flowchart showing a procedure of symptom extraction processing of the
CPU11は、シンプトンデータベース131に記憶されているシンプトンから一のシンプトンを読み出し(ステップS902)、読み出したシンプトンに付加されている部分構成情報の、システム構成情報との一致度を算出する(ステップS903)。一致度の算出方法は特に限定されるものではなく、一実施例については後述する。
The
CPU11は、算出した一致度の昇順にシンプトンをソートし(ステップS904)、記憶されている全てのシンプトンを読み出したか否かを判断する(ステップS905)。CPU11が、まだ読み出していないシンプトンが存在すると判断した場合(ステップS905:NO)、CPU11は、次のシンプトンを読み出し(ステップS906)、処理をステップS903へ戻して上述した処理を繰り返す。CPU11が、全てのシンプトンを読み出したと判断した場合(ステップS905:YES)、CPU11は、一致度の高い順にシンプトンを抽出して(ステップS907)、障害発生イベントの検出に適用する。
The
図10及び図11は、本発明の実施の形態2に係る障害イベント検出装置1のCPU11の一致度の算出処理の手順を示すフローチャートである。図10において、障害イベント検出装置1のCPU11は、一致度の最大値Nmax 、最小値Nmin を初期化する(ステップS1001)。本実施の形態2では、最大値Nmax を100に、最小値Nmin を0に設定する。CPU11は、最大値Nmax を部分構成情報に含まれるコンポーネント及びリンクに割り当てる(ステップS1002)。割り当て方法によって、コンポーネント及びリンクの重要度の重み付けをすることができる。
10 and 11 are flowcharts showing the procedure of the degree of coincidence calculation processing of the
CPU11は、読み出したシンプトンに付加されている部分構成情報に含まれるコンポーネントと一致するコンポーネントが有るか否かを判断する(ステップS1003)。一致するコンポーネントが無いと判断した場合(ステップS1003:NO)、CPU11は、最小値Nmin を一致度とする(ステップS1004)。すなわち、一致度Nは0(ゼロ)となる。
The
CPU11が、一致するコンポーネントが有ると判断した場合(ステップS1003:YES)、CPU11は、一のコンポーネントを選択する(ステップS1005)。CPU11は、選択したコンポーネントの属性に応じてコンポーネントの割当値に乗ずる係数αを特定する(ステップS1006)。例えば、コンポーネントのタイプが一致している場合はα=0.1、コンポーネントの製品名が一致している場合はα=0.6、コンポーネントのバージョンが上位互換で該当している場合はα=0.8、バージョンが一致している場合はα=1.0等のように特定すれば良い。
When the
CPU11は、コンポーネントの割当値に係数αを乗算してコンポーネントの一致度N1を算出し(ステップS1007)、一致するすべてのコンポーネントを選択したか否かを判断する(ステップS1008)。CPU11が、まだ選択されていないコンポーネントが有ると判断した場合(ステップS1008:NO)、CPU11は、次のコンポーネントを選択し(ステップS1009)、処理をステップS1006へ戻して上述した処理を繰り返す。
The
CPU11が、すべてのコンポーネントを選択したと判断した場合(ステップS1008:YES)、図11に示すようにCPU11は、関連するリンクが有るか否かを判断する(ステップS1101)。CPU11が、関連するリンクが有ると判断した場合(ステップS1101:YES)、CPU11は、一のリンクを選択し(ステップS1102)、選択したリンクの属性に応じてリンクの割当値に乗ずる係数βを特定する(ステップS1103)。
If the
例えばコンポーネント間のリンクが、該当ルールを検出するために存在が必須である必須リンクと一致している場合にはβ=1.0、必須リンクが間接的に存在している場合にはβ=0.6、存在してもしなくても良い任意リンクである場合にはβ=1.0、任意リンクが間接的に存在している場合にはβ=0.8、存在してはならない禁止リンクが存在しない場合にはβ=1.0、禁止リンクが間接的に存在している場合にはβ=0.1、リンクの種類が一致している場合にはβ=1.0、互換性がある場合にはβ=0.8等のように特定すれば良い。 For example, β = 1.0 when a link between components matches a mandatory link that must be present in order to detect the corresponding rule, and β = when a mandatory link exists indirectly. 0.6, β = 1.0 if an arbitrary link may or may not exist, β = 0.8 if an arbitrary link exists indirectly, prohibited that must not exist Β = 1.0 if no link exists, β = 0.1 if a forbidden link exists indirectly, β = 1.0 if the link types match, compatible If there is a property, it may be specified such as β = 0.8.
CPU11は、リンクの割当値に係数βを乗算してリンクの一致度N2を算出し(ステップS1104)、関連するすべてのリンクを選択したか否かを判断する(ステップS1105)。CPU11が、選択されていないリンクが存在すると判断した場合(ステップS1105:NO)、CPU11は、次のリンクを選択し(ステップS1106)、処理をステップS1103へ戻して上述した処理を繰り返す。
The
CPU11が、関連するリンクが無いと判断した場合(ステップS1101:NO)、CPU11は、リンクの一致度N2を0(ゼロ)とし(ステップS1107)、処理をステップS1108へ進める。CPU11が、すべてのリンクを選択したと判断した場合(ステップS1105:YES)、CPU11は、部分構成情報全体の一致度Nを、コンポーネントの一致度N1とリンクの一致度N2との和として算出し(ステップS1108)、連続リンクが有るか否かを判断する(ステップS1109)。
When the
CPU11が、連続リンクが有ると判断した場合(ステップS1109:YES)、CPU11は、所定の評価値N3を部分構成情報全体の一致度Nに加算する(ステップS1110)。CPU11が、連続リンクが無いと判断した場合(ステップS1109:NO)、CPU11は、ステップS1110をスキップして処理を終了する。
When the
上述した一致度の算出方法を、具体例に基づいて説明する。一致度を算出する基礎となる部分構成情報は、アプリケーションサーバAとデータベースBとの2つのコンポーネントと、アプリケーションサーバAとデータベースBとの間のリンクとを有している。図10及び図11と同様、Nmax =100、Nmin =0とし、重要度をアプリケーションサーバA:データベースB:リンク=1:1:3とする。したがって、アプリケーションサーバAの割当値は20、データベースBの割当値は20、リンクの割当値は60とNmax が割り当てられる。 The above-described method for calculating the degree of coincidence will be described based on a specific example. The partial configuration information that is the basis for calculating the degree of coincidence includes two components, the application server A and the database B, and a link between the application server A and the database B. Similar to FIGS. 10 and 11, Nmax = 100 and Nmin = 0, and the importance is assumed to be application server A: database B: link = 1: 1: 3. Therefore, 20 is assigned to the application server A, 20 is assigned to the database B, and 60 is assigned to the link.
図12は、部分構成情報と同一の構成がシステム構成情報に存在する場合の一致度算出例を示す模式図である。図12の例では、同一のコンポーネントであるアプリケーションサーバAとデータベースB2とが存在することから、コンポーネントの一致度はそれぞれ‘20’であり、アプリケーションサーバAとデータベースBとの間のリンクも存在することから、リンクの一致度も‘60’となる。したがって、図12に示す部分構成情報の一致度Nは20+20+60=100となる。 FIG. 12 is a schematic diagram illustrating an example of calculating the degree of coincidence when the same configuration as the partial configuration information exists in the system configuration information. In the example of FIG. 12, since the application server A and the database B2 which are the same components exist, the degree of coincidence between the components is “20”, and there is also a link between the application server A and the database B. For this reason, the matching degree of the link is also “60”. Accordingly, the degree of coincidence N of the partial configuration information shown in FIG. 12 is 20 + 20 + 60 = 100.
図13は、部分構成情報のリンクがシステム構成情報に間接的に存在する場合の一致度算出例を示す模式図である。図13の例では、同一のコンポーネントであるアプリケーションサーバAとデータベースB1とが存在することから、コンポーネントの一致度はそれぞれ‘20’であるが、アプリケーションサーバAとデータベースBとの間のリンクがコンポーネントKを介する間接的なリンクであることから、リンクの一致度N2=0.6×60=36となる。したがって、図13に示す部分構成情報の一致度Nは20+20+36=76となる。 FIG. 13 is a schematic diagram illustrating an example of calculating the degree of coincidence when the link of the partial configuration information exists indirectly in the system configuration information. In the example of FIG. 13, since the application server A and the database B1 which are the same components exist, the degree of coincidence between the components is “20”, but the link between the application server A and the database B is the component. Since the link is an indirect link via K, the degree of matching N2 = 0.6 × 60 = 36. Accordingly, the coincidence degree N of the partial configuration information shown in FIG. 13 is 20 + 20 + 36 = 76.
図14は、部分構成情報と同一のコンポーネントは存在するが、リンクが存在しない場合の一致度算出例を示す模式図である。図14の例では、同一のコンポーネントであるアプリケーションサーバAとデータベースB1とが存在することから、コンポーネントの一致度はそれぞれ‘20’であるが、アプリケーションサーバAとデータベースB1との間にリンクが存在しないことから、リンクの一致度は‘0’となる。したがって、図14に示す部分構成情報の一致度Nは20+20+0=40となる。 FIG. 14 is a schematic diagram illustrating an example of calculating the degree of coincidence when the same component as the partial configuration information exists but no link exists. In the example of FIG. 14, since the application server A and the database B1 which are the same components exist, the degree of coincidence of the components is “20”, but there is a link between the application server A and the database B1. As a result, the matching degree of the link is “0”. Accordingly, the degree of coincidence N of the partial configuration information shown in FIG. 14 is 20 + 20 + 0 = 40.
図15は、部分構成情報と同一のコンポーネントが存在しない場合の一致度算出例を示す模式図である。図15の例では、同一のコンポーネントが存在しないことから、コンポーネントの一致度はそれぞれ‘0’であり、当然のことながらアプリケーションサーバAとデータベースBとの間のリンクも存在しないことから、リンクの一致度も‘0’となる。したがって、図15に示す部分構成情報の一致度Nは0となる。 FIG. 15 is a schematic diagram illustrating an example of calculating the coincidence when the same component as the partial configuration information does not exist. In the example of FIG. 15, since the same component does not exist, the degree of coincidence between the components is “0”. Naturally, there is no link between the application server A and the database B. The degree of coincidence is also “0”. Accordingly, the degree of coincidence N of the partial configuration information shown in FIG.
以上のように本実施の形態2によれば、取得したシステム構成情報と、シンプトンに付加して記憶されている部分構成情報とを比較して算出した一致度が大きい部分構成情報に対応するシンプトンを適用して障害が発生したイベントを検出することができ、不要なシンプトンを適用することなく、効率的に障害が発生している根本原因を特定することができる。 As described above, according to the second embodiment, the symptom corresponding to the partial configuration information having a high degree of coincidence calculated by comparing the acquired system configuration information with the partial configuration information stored in addition to the symptom. Can be used to detect the event in which the failure has occurred, and the root cause of the failure can be identified efficiently without applying unnecessary symptoms.
(実施の形態3)
本発明の実施の形態3に係る障害イベントの検出を支援する装置を含む障害イベント検出装置1の構成は、実施の形態1及び2と同様であることから、同一の符号を付することにより詳細な説明は省略する。本実施の形態3は、抽出された部分構成情報と、イベント群を特定するのに用いたシンプトンに含まれている部分構成情報との適合度を算出してシンプトンの検出結果を評価する点で実施の形態1及び2と相違する。
(Embodiment 3)
Since the configuration of the fault
図16は、本発明の実施の形態3に係る障害イベント検出装置1の機能ブロック図である。構成情報抽出部201は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を抽出して、構成情報記憶部132に記憶する。コンポーネント間の関連情報を含むシステム構成情報とは、例えばコンポーネント間の通信における接続関係情報、操作・非操作の関係に関するリンク関係情報等である。なお、構成情報抽出部201は本発明に必須の構成要件ではなく、事前に構成情報記憶部132にシステム構成情報を生成しておいても良く、障害イベント検出装置1内に内蔵していてもいなくても良い。すなわち、構成情報抽出部201及び構成情報記憶部132は、本発明の実施の形態3に係る障害イベント検出装置1の必須の構成要件ではない。
FIG. 16 is a functional block diagram of the failure
構成情報取得部202は、構成情報記憶部132に記憶されているシステム構成情報を取得する。システム構成情報は監視対象システム200ごとに対応付けて構成情報記憶部132に記憶してあり、監視対象システム200に応じて対応するシステム構成情報を取得する。
The configuration
履歴情報収集部203は、監視対象システム200を常時監視し、監視対象システム200に含まれる各コンポーネントから出力されたログ情報及び/又は障害発生時に出力されるイベント情報等の障害情報を含む履歴情報を収集して、履歴情報記憶部133に記憶する。ログ情報は、常時出力されるシステムログ等に限定されるものではなく、障害発生時に割り込み処理等により出力されるメッセージ情報等を含んでも良い。
The history
なお、履歴情報収集部203で収集した履歴情報は、それぞれデータ形式が相違することが多く、そのままでは障害が発生したイベントの候補となるイベントを特定するための基本情報として用いることができない場合も生じうる。そこで、データ形式変換部212を備え、標準的な統一データ形式に変換して履歴情報記憶部133へ記憶しておくことが望ましい。
Note that the history information collected by the history
検出ルール生成部204は、発生した障害に関連するコンポーネントに含まれるイベントを検出するための検出ルールを生成する。シンプトン記憶部205は、生成された検出ルールに所定の付加情報を付加したシンプトンを記憶する。付加情報としては、障害検出時の推奨アクション等に関する情報、各種コメントを含むメッセージ情報等を付加してある。
The detection
イベント選択受付部207は、発生した障害に関連するコンポーネントに含まれるイベントの選択を、例えばイベントリスト等からの選択として受け付ける。部分構成情報抽出部208は、構成情報取得部202で取得されたシステム構成情報から、イベント選択受付部207で選択を受け付けたイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を抽出する。抽出される部分構成情報とは、システムを構成しているコンポーネントのうち障害発生イベントとして選択を受け付けたイベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報も含んでいる。例えばコンポーネントであるアプリケーションサーバとデータベースとの関連情報、リンク情報等も含まれる。
The event
本発明の実施の形態3に係る障害イベント検出装置1における部分構成情報を含むシンプトンの構成は実施の形態1と同様であり、上述した図3(b)に示す構成と同じである。すなわち、従来のシンプトンにコンポーネントであるアプリケーションサーバAとデータベースBとの依存関係に関する情報を追加することにより、障害発生イベントの検出のためのシンプトンとしてコンポーネント間の依存関係をも考慮に入れることができ、より障害が発生したイベントの検出精度を高めることができる。
The configuration of the symptom including the partial configuration information in the failure
シンプトン更新部209は、部分構成情報抽出部208で抽出された部分構成情報を、対応するシンプトンに付加して記憶する。すなわち、部分構成情報が付加情報となる。部分構成情報提示部210は、部分構成情報抽出部208で抽出された部分構成情報を表示装置23に提示する。更新受付部211は、提示されている部分構成情報の更新を受け付ける。これにより、ユーザは提示された部分構成情報を所望の構成に変更することにより、適合した部分構成情報を確実に生成することができる。
The
部分構成情報提示部210により表示装置23に提示される画面80は、実施の形態2と同様であることから、詳細な説明は省略する。
Since the
イベント群特定部1601は、履歴情報収集部203で収集された履歴情報及びシンプトンデータベース131に記憶されているシンプトンに基づいて、記憶されているシンプトンに適合するイベント群を特定する。抽出部1602は、イベント群特定部1601で特定されたイベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含む部分構成情報を抽出する。
The event
適合度算出部1603は、抽出部1602で抽出された部分構成情報と、イベント群特定部1601でイベント群を特定するのに用いたシンプトンデータベース131に記憶されているシンプトンに含まれている部分構成情報との適合度を算出する。適合度が高いシンプトンが検出されている場合には、障害が発生したイベントの誤検出の可能性が低いものと判断することができる。また、ユーザによるシンプトン適用の熟練度合に左右されること無く、一定の精度で障害が発生したイベントを検出することができる。すなわち、イベント検出部206は、適合度が高いシンプトンを適用して、障害が発生したイベントを検出することにより、障害が発生したイベントの誤検出の可能性を低減し、障害発生イベントの検出精度を高めることができる。
The
提示部1604は、適用したシンプトン、該シンプトンに付加されている部分構成情報、及び算出された該シンプトンの適合度を表示装置23へ提示する。これにより、単にシンプトンの適用結果を適用順に提示するだけでなく適合度の高い順に提示することにより、障害発生イベントの誤検出結果が表示装置23に表示される可能性を低減することができ、イベント検出精度の高いシンプトンから順に表示することが可能となる。
The presenting
図17は、提示部1604により表示装置23に提示される画面160の例示図である。トポロジー図表示領域161には、監視対象システム200に含まれるコンポーネントの依存関係を示すトポロジー図を表示する。イベントリスト表示領域162には、監視対象システム200に含まれるイベントが一覧表示される。イベント選択受付部207により、イベントリスト表示領域162に表示されているイベント群の中から、発生した障害に関連するコンポーネントに含まれるイベントの選択を受け付けた場合、選択を受け付けたイベント及び依存関係を有するイベントが強調表示される。図17では、選択を受け付けたイベント及び依存関係を有するイベントの表示色を変更して表示している。強調表示の方法は特に限定されるものではなく、輝度を変更しても良い。
FIG. 17 is an exemplary diagram of a
シンプトンリスト表示領域163には、検出ルールに基づいて検出されたシンプトンが一覧表示され、部分構成情報表示領域164は、適用されたシンプトンに付加されている部分構成情報が表示される。部分構成情報表示領域164に表示されている部分構成情報と、イベント群の選択の受付によりトポロジー図表示領域161に表示されている部分構成情報とを照合して、適合度を算出する。算出された適合度は、シンプトンリスト表示領域163の対応するシンプトンの欄に提示される。
The symptom
図18は、本発明の実施の形態3に係る障害イベント検出装置1のCPU11の障害検出処理の手順を示すフローチャートである。障害イベント検出装置1のCPU11は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を取得する(ステップS1801)。もちろん、事前にシステム構成情報を取得して、構成情報記憶部132に記憶しておいても良い。
FIG. 18 is a flowchart showing the procedure of the failure detection process of the
CPU11は、監視対象システム200のログ情報及び/又は障害発生時に各コンポーネントから出力される障害情報を含む履歴情報を収集し(ステップS1802)、履歴情報記憶部133に記憶する(ステップS1803)。CPU11は、収集された履歴情報及びシンプトンデータベース131に記憶されているシンプトンに基づいて、記憶されているシンプトンに適合するイベント群を特定する(ステップS1804)。
The
CPU11は、特定されたイベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含む部分構成情報を抽出し(ステップS1805)、抽出された部分構成情報と、イベント群を特定するのに適用したシンプトンデータベース131に記憶されているシンプトンに付加されている部分構成情報との適合度を算出する(ステップS1806)。適合度の算出方法は特に限定されるものではなく、一実施例については後述する。
The
CPU11は、適用したシンプトン、該シンプトンに付加されている部分構成情報、及び算出された該シンプトンの適合度を表示装置23へ提示する(ステップS1807)。これにより、ユーザは、シンプトンの適合度の高い順に提示された結果を目視で確認することができる。
The
図19及び図20は、本発明の実施の形態3に係る障害イベント検出装置1のCPU11の適合度の算出処理の手順を示すフローチャートである。図19において、障害イベント検出装置1のCPU11は、適合度の最大値Pmax 、最小値Pmin を初期化する(ステップS1901)。本実施の形態3では、最大値Pmax を100に、最小値Pmin を0に設定する。CPU11は、最大値Pmax を部分構成情報に含まれるコンポーネント及びリンクに割り当てる(ステップS1902)。割り当て方法によって、コンポーネント及びリンクの重要度の重み付けをすることができる。
19 and 20 are flowcharts showing the procedure of the fitness level calculation processing of the
CPU11は、読み出したシンプトンに付加されている部分構成情報に含まれるコンポーネントと一致するコンポーネントが有るか否かを判断する(ステップS1903)。一致するコンポーネントが無いと判断した場合(ステップS1903:NO)、CPU11は、最小値Pmin を適合度とする(ステップS1904)。すなわち、適合度Pは0(ゼロ)となる。
The
CPU11が、一致するコンポーネントが有ると判断した場合(ステップS1903:YES)、CPU11は、一のコンポーネントを選択する(ステップS1905)。CPU11は、選択したコンポーネントの属性に応じてコンポーネントの割当値に乗ずる係数αを特定する(ステップS1906)。例えば、コンポーネントのタイプが一致している場合はα=0.1、コンポーネントの製品名が一致している場合はα=0.6、コンポーネントのバージョンが上位互換で該当している場合はα=0.8、バージョンが一致している場合はα=1.0等のように特定すれば良い。
If the
CPU11は、コンポーネントの割当値に係数αを乗算してコンポーネントの適合度P1を算出し(ステップS1907)、一致するすべてのコンポーネントを選択したか否かを判断する(ステップS1908)。CPU11が、まだ選択されていないコンポーネントが有ると判断した場合(ステップS1908:NO)、CPU11は、次のコンポーネントを選択し(ステップS1909)、処理をステップS1906へ戻して上述した処理を繰り返す。
The
CPU11が、すべてのコンポーネントを選択したと判断した場合(ステップS1908:YES)、図20に示すようにCPU11は、関連するリンクが有るか否かを判断する(ステップS2001)。CPU11が、関連するリンクが有ると判断した場合(ステップS2001:YES)、CPU11は、一のリンクを選択し(ステップS2002)、選択したリンクの属性に応じてリンクの割当値に乗ずる係数βを特定する(ステップS2003)。
If the
例えばコンポーネント間のリンクが、該当ルールを検出するために存在が必須である必須リンクと一致している場合にはβ=1.0、必須リンクが間接的に存在している場合にはβ=0.6、存在してもしなくても良い任意リンクである場合にはβ=1.0、任意リンクが間接的に存在している場合にはβ=0.8、存在してはならない禁止リンクが存在しない場合にはβ=1.0、禁止リンクが間接的に存在している場合にはβ=0.1、リンクの種類が一致している場合にはβ=1.0、互換性がある場合にはβ=0.8等のように特定すれば良い。 For example, β = 1.0 when a link between components matches a mandatory link that must be present in order to detect the corresponding rule, and β = when a mandatory link exists indirectly. 0.6, β = 1.0 if an arbitrary link may or may not exist, β = 0.8 if an arbitrary link exists indirectly, prohibited that must not exist Β = 1.0 if no link exists, β = 0.1 if a forbidden link exists indirectly, β = 1.0 if the link types match, compatible If there is a property, it may be specified such as β = 0.8.
CPU11は、リンクの割当値に係数βを乗算してリンクの適合度P2を算出し(ステップS2004)、関連するすべてのリンクを選択したか否かを判断する(ステップS2005)。CPU11が、選択されていないリンクが存在すると判断した場合(ステップS2005:NO)、CPU11は、次のリンクを選択し(ステップS2006)、処理をステップS2003へ戻して上述した処理を繰り返す。
The
CPU11が、関連するリンクが無いと判断した場合(ステップS2001:NO)、CPU11は、リンクの適合度P2を0(ゼロ)とし(ステップS2007)、処理をステップS2008へ進める。CPU11が、すべてのリンクを選択したと判断した場合(ステップS2005:YES)、CPU11は、部分構成情報全体の適合度Pを、コンポーネントの適合度P1とリンクの適合度P2との和として算出し(ステップS2008)、連続リンクが有るか否かを判断する(ステップS2009)。
When the
CPU11が、連続リンクが有ると判断した場合(ステップS2009:YES)、CPU11は、所定の評価値P3を部分構成情報全体の適合度Pに加算する(ステップS2010)。CPU11が、連続リンクが無いと判断した場合(ステップS2009:NO)、CPU11は、ステップS2010をスキップして処理を終了する。
When the
上述した適合度の算出方法を、具体例に基づいて説明する。適合度を算出する基礎となるシンプトンに付加されている部分構成情報は、アプリケーションサーバAとデータベースBとの2つのコンポーネントと、アプリケーションサーバAとデータベースBとの間のリンクとを有している。図19及び図20と同様、Pmax =100、Pmin =0とし、重要度をアプリケーションサーバA:データベースB:リンク=1:1:3とする。したがって、アプリケーションサーバAの割当値は20、データベースBの割当値は20、リンクの割当値は60とPmax が割り当てられる。 The above-described method for calculating the fitness will be described based on a specific example. The partial configuration information added to the symptom that is the basis for calculating the fitness has two components, the application server A and the database B, and a link between the application server A and the database B. Similarly to FIGS. 19 and 20, Pmax = 100 and Pmin = 0, and the importance is set to application server A: database B: link = 1: 1: 3. Therefore, 20 is assigned to the application server A, 20 is assigned to the database B, 60 is assigned to the link, and Pmax is assigned.
図21は、シンプトンに付加されている部分構成情報と、システム構成情報との適合度の概念を説明する模式図である。システム構成情報には、アプリケーションサーバA1とデータベースB1、アプリケーションサーバA2とデータベースB2という2つのリンクが存在しており、アプリケーションサーバAとデータベースBとのリンク属性と属性がそれぞれ同一であるとする。 FIG. 21 is a schematic diagram for explaining the concept of the degree of matching between the partial configuration information added to the symptom and the system configuration information. In the system configuration information, there are two links, application server A1 and database B1, application server A2 and database B2, and it is assumed that the link attributes and attributes of application server A and database B are the same.
この場合、アプリケーションサーバA1とデータベースB1とのリンク2101、アプリケーションサーバA2とデータベースB2とのリンク2102は、シンプトン生成時に付加されている部分構成情報と属性が同一であることから類似していると判断される。したがって、この場合には適合度Pは大きな値として算出される。
In this case, it is determined that the
一方、アプリケーションサーバA1とデータベースB2とのリンク2103、アプリケーションサーバA2とデータベースB1とのリンク2104は、コンポーネントの属性は一致するものの、シンプトン生成時に付加されている部分構成情報とは属性が相違する。したがって、この場合には適合度Pは小さな値として算出される。
On the other hand, the
図22は、シンプトン生成時に付加されている部分構成情報と同一の構成がシステム構成情報に存在する場合の適合度算出例を示す模式図である。図22の例では、同一のコンポーネントであるアプリケーションサーバA1とデータベースB1、アプリケーションサーバA2とデータベースB2が存在することから、コンポーネントの適合度はそれぞれ‘20’であり、アプリケーションサーバAとデータベースBとの間のリンクと同一属性であるアプリケーションサーバA1とデータベースB1との間のリンク2101が存在する。したがって、リンクの適合度が‘60’となるので、図22に示す部分構成情報の適合度Pは20+20+60=100となる。
FIG. 22 is a schematic diagram illustrating a fitness calculation example in the case where the same configuration as the partial configuration information added at the time of symptom generation exists in the system configuration information. In the example of FIG. 22, since the application server A1 and the database B1 and the application server A2 and the database B2 which are the same components exist, the compatibility of the components is “20”, and the application server A and the database B There is a
図23は、シンプトン生成時に付加されている部分構成情報のリンクがシステム構成情報に間接的に存在する場合の適合度算出例を示す模式図である。図23の例では、同一のコンポーネントであるアプリケーションサーバA1とデータベースB1、アプリケーションサーバA2とデータベースB2が存在することから、コンポーネントの適合度はそれぞれ‘20’である。一方、アプリケーションサーバAとデータベースBとの間のリンクと同一属性であるリンクは存在しないものの、アプリケーションサーバA1とデータベースB1とが、その他のコンポーネントC1を介するリンク2301が存在する。したがって、これらのリンクの適合度P2は0.6×60=36となる。したがって、図23に示す部分構成情報の適合度Pは20+20+36=76となる。
FIG. 23 is a schematic diagram illustrating a fitness calculation example in a case where a link of partial configuration information added at the time of symptom generation indirectly exists in the system configuration information. In the example of FIG. 23, since the application server A1 and the database B1 and the application server A2 and the database B2 that are the same components exist, the fitness of the components is “20”. On the other hand, although there is no link having the same attribute as the link between the application server A and the database B, the application server A1 and the database B1 have a
図24は、シンプトン生成時に付加されている部分構成情報と同一のコンポーネントは存在するが、リンクが存在しない場合の適合度算出例を示す模式図である。図24の例では、同一のコンポーネントであるアプリケーションサーバA1とデータベースB1、アプリケーションサーバA2とデータベースB2が存在することから、コンポーネントの適合度はそれぞれ‘20’である。一方、アプリケーションサーバAとデータベースBとの間のリンクと同一属性であるリンクは存在せず、アプリケーションサーバA1とデータベースB2との間のリンク2103が存在する。したがって、これらのリンクの適合度P2は0となるので、図24に示す部分構成情報の適合度Pは20+20+0=40となる。
FIG. 24 is a schematic diagram illustrating a fitness calculation example in the case where the same component as the partial configuration information added at the time of symptom generation exists but no link exists. In the example of FIG. 24, since the application server A1 and the database B1 and the application server A2 and the database B2 which are the same components exist, the compatibility of the components is “20”. On the other hand, there is no link having the same attribute as the link between the application server A and the database B, and there is a
以上のように本実施の形態3によれば、部分構成情報をシンプトンに付加することにより障害が発生したイベントの検出精度を高く維持しつつ、抽出された部分構成情報と、イベント群を特定するのに適用したシンプトンに含まれている部分構成情報との適合度を算出することができるので、ユーザの熟練度合に左右されることなく客観的に検出された結果を評価することができる。また、部分構成情報とともに、算出された適合度も提示することができるので、ユーザの熟練度合に左右されることなく、検出された結果を客観的に評価することができる。 As described above, according to the third embodiment, by adding the partial configuration information to the symptom, the extracted partial configuration information and the event group are specified while maintaining high detection accuracy of the event in which the failure has occurred. Since the degree of matching with the partial configuration information included in the symptom applied to the above can be calculated, the objectively detected result can be evaluated without being influenced by the degree of skill of the user. Further, since the calculated fitness can be presented together with the partial configuration information, the detected result can be objectively evaluated without being influenced by the skill level of the user.
(実施の形態4)
本発明の実施の形態4に係る障害イベントの検出を支援する装置を含む障害イベント検出装置1の構成は、実施の形態1乃至3と同様であることから、同一の符号を付することにより詳細な説明は省略する。本実施の形態4は、検出結果の正誤に関する情報とともに部分構成情報をシンプトンに付加する点で実施の形態1乃至3と相違する。
(Embodiment 4)
The configuration of the failure
図25は、本発明の実施の形態4に係る障害イベント検出装置1の機能ブロック図である。構成情報抽出部201は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を抽出して、構成情報記憶部132に記憶する。コンポーネント間の関連情報を含むシステム構成情報とは、例えばコンポーネント間の通信における接続関係情報、操作・非操作の関係に関するリンク関係情報等である。なお、構成情報抽出部201は本発明に必須の構成要件ではなく、事前に構成情報記憶部132にシステム構成情報を生成しておいても良く、障害イベント検出装置1内に内蔵していてもいなくても良い。すなわち、構成情報抽出部201及び構成情報記憶部132は、本発明の実施の形態4に係る障害イベント検出装置1の必須の構成要件ではない。
FIG. 25 is a functional block diagram of the failure
構成情報取得部202は、構成情報記憶部132に記憶されているシステム構成情報を取得する。システム構成情報は監視対象システム200ごとに対応付けて構成情報記憶部132に記憶してあり、監視対象システム200に応じて対応するシステム構成情報を取得する。
The configuration
履歴情報収集部203は、監視対象システム200を常時監視し、監視対象システム200に含まれる各コンポーネントから出力されたログ情報及び/又は障害発生時に出力されるイベント情報等の障害情報を含む履歴情報を収集して、履歴情報記憶部133に記憶する。ログ情報は、常時出力されるシステムログ等に限定されるものではなく、障害発生時に割り込み処理等により出力されるメッセージ情報等を含んでも良い。
The history
なお、履歴情報収集部203で収集した履歴情報は、それぞれデータ形式が相違することが多く、そのままでは障害が発生したイベントの候補となるイベントを特定するための基本情報として用いることができない場合も生じうる。そこで、データ形式変換部212を備え、標準的な統一データ形式に変換して履歴情報記憶部133へ記憶しておくことが望ましい。
Note that the history information collected by the history
検出ルール生成部204は、発生した障害に関連するコンポーネントに含まれるイベントを検出するための検出ルールを生成する。シンプトン記憶部205は、生成された検出ルールに所定の付加情報を付加したシンプトンを記憶する。付加情報としては、障害検出時の推奨アクション等に関する情報、各種コメントを含むメッセージ情報等を付加してある。
The detection
イベント選択受付部207は、発生した障害に関連するコンポーネントに含まれるイベントの選択を、例えばイベントリスト等からの選択として受け付ける。部分構成情報抽出部208は、構成情報取得部202で取得されたシステム構成情報から、イベント選択受付部207で選択を受け付けたイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を抽出する。抽出される部分構成情報とは、システムを構成しているコンポーネントのうち障害発生イベントとして選択を受け付けたイベントを送出したコンポーネントと他のコンポーネントとの間の依存関係を含む関連情報も含んでいる。例えばコンポーネントであるアプリケーションサーバとデータベースとの関連情報、リンク情報等も含まれる。
The event
本発明の実施の形態4に係る障害イベント検出装置1における部分構成情報を含むシンプトンの構成は実施の形態1と同様であり、上述した図3(b)に示す構成と同じである。すなわち、従来のシンプトンにコンポーネントであるアプリケーションサーバAとデータベースBとの依存関係に関する情報を追加することにより、障害発生イベントの検出のためのシンプトンとしてコンポーネント間の依存関係をも考慮に入れることができ、より障害が発生したイベントの検出精度を高めることができる。
The configuration of the symptom including the partial configuration information in the failure
シンプトン更新部209は、部分構成情報抽出部208で抽出された部分構成情報を、対応するシンプトンに付加して記憶する。すなわち、部分構成情報が付加情報となる。部分構成情報提示部210は、部分構成情報抽出部208で抽出された部分構成情報を表示装置23に提示する。更新受付部211は、提示されている部分構成情報の更新を受け付ける。これにより、ユーザは提示された部分構成情報を所望の構成に変更することにより、適合した部分構成情報を確実に生成することができる。
The
部分構成情報提示部210により表示装置23に提示される画面80は、実施の形態2と同様であることから、詳細な説明は省略する。
Since the
本発明の実施の形態4では、上述した部分構成情報が付加されたシンプトンと、従来のように部分構成情報が付加されていないシンプトンとがシンプトンデータベース131に混在して記憶されていることを前提とする。したがって、部分構成情報が付加されているシンプトンを適用する場合には、上述した実施の形態1乃至3と同様の構成とすることにより、同等の効果を奏することは言うまでもない。
In the fourth embodiment of the present invention, it is assumed that the symptom to which the partial configuration information is added and the symptom to which the partial configuration information is not added as in the past are stored in the
そこで本実施の形態4では、実施の形態3と同様、イベント群特定部1601が、履歴情報収集部203で収集された履歴情報及びシンプトンデータベース131に記憶されているシンプトンに基づいて、記憶されているシンプトンに適合するイベント群を特定し、抽出部1602が、イベント群特定部1601で特定されたイベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含む部分構成情報を抽出する。
Therefore, in the fourth embodiment, as in the third embodiment, the event
そして、イベント検出部206は、抽出部1602で抽出された部分構成情報とイベント群特定の基礎となったシンプトンを適用して、障害が発生したイベントを検出する。正誤情報取得部2501は、イベント検出部206における検出結果が正しいか否か、すなわち障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得する。
Then, the
更新部2502は、取得した正誤情報及び抽出された部分構成情報を、イベント群特定の基礎となったシンプトンの付加情報として該シンプトンを更新する。これにより、部分構成情報を有していないシンプトンに対して、正誤情報とともに部分構成情報を付加することができる。
The
正誤情報取得部2501は、ユーザによる正誤判断結果の入力を受け付ける正誤情報受付部2503であっても良い。この場合、画面上に表示された障害発生イベントが正しいか否かを判断した結果を、例えば「確認」ボタン又は「修正」ボタン等のマウス等によるクリック操作により受け付ける。
The correct / incorrect
あるいは、実施の形態3と同様、適合度を算出して、所定値より大きいか否かに応じて正誤判断をしても良い。この場合、適合度算出部2504は、抽出部1602で抽出された部分構成情報と、イベント群特定部1601でイベント群を特定するのに用いたシンプトンデータベース131に記憶されているシンプトンに含まれている部分構成情報との適合度を算出する。適合度が高いシンプトンが検出されている場合には、障害判別における誤検出の可能性が低いものと判断することができる。また、ユーザによるシンプトン適用の熟練度合に左右されること無く、一定の精度で障害判別を行うことができる。すなわち、イベント検出部206は、適合度が高いシンプトンを適用して、障害が発生したイベントを検出することにより、誤検出の可能性を低減し、障害発生イベントの検出精度を高めることができる。
Alternatively, as in the third embodiment, the degree of conformity may be calculated and a correct / incorrect determination may be made according to whether the value is greater than a predetermined value. In this case, the
適合度判断部2505は、算出した適合度が所定値より大きいか否かを判断し、所定値より大きいと判断した場合、更新部2502は、抽出部1602で抽出された部分構成情報に正常に検出された旨を示す情報を付加した正常検出構成情報を、所定値以下であると判断した場合、更新部2502は、抽出部1602で抽出された部分構成情報に誤検出された旨を示す情報を付加した誤検出構成情報を、それぞれシンプトンに付加してシンプトンデータベース131を更新する。これにより、正常に検出された旨を示す情報を付加されている部分構成情報を有するシンプトンを優先して適用することで、障害発生イベントをより精度良く検出することができる。
The fitness
図26は、本発明の実施の形態4に係る障害イベント検出装置1のCPU11の障害検出処理の手順を示すフローチャートである。障害イベント検出装置1のCPU11は、監視対象システム200に含まれるコンポーネント間の関連情報を含むシステム構成情報を取得する(ステップS2601)。もちろん、事前にシステム構成情報を取得して、構成情報記憶部132に記憶しておいても良い。
FIG. 26 is a flowchart showing a procedure of failure detection processing of the
CPU11は、監視対象システム200のログ情報及び/又は障害発生時に各コンポーネントから出力される障害情報を含む履歴情報を収集し(ステップS2602)、履歴情報記憶部133に記憶する(ステップS2603)。CPU11は、収集された履歴情報及びシンプトンデータベース131に記憶されているシンプトンに基づいて、記憶されているシンプトンに適合するイベント群を特定する(ステップS2604)。
The
CPU11は、特定されたイベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含む部分構成情報を抽出し(ステップS2605)、監視対象システムに発生した障害に適合したシンプトンが正常に検出されているか否かの判断結果の入力を受け付ける(ステップS2606)。CPU11は、受け付けた判断結果が正常に検出された旨を示す判断結果であるか否かを判断する(ステップS2607)。
The
CPU11が、受け付けた判断結果が正常に検出された旨を示すと判断した場合(ステップS2607:YES)、CPU11は、正常に検出された旨を示す情報を該部分構成情報に付加した正常検出構成情報を、適用したシンプトンに付加することでシンプトンデータベース131を更新する(ステップS2608)。CPU11が、受け付けた判断結果が正常に検出されていない旨を示すと判断した場合(ステップS2607:NO)、CPU11は、誤検出である旨を示す情報を該部分構成情報に付加した誤検出構成情報を、適用したシンプトンに付加することでシンプトンデータベース131を更新する(ステップS2609)。これにより、検出結果が正常に検出されたか否かを示す情報とともに部分構成情報を付加したシンプトンを生成することができる。
When the
このように、シンプトンの生成時には部分構成情報が付加されていないシンプトンであっても、正常検出構成情報が新たに付加された場合には、該シンプトンを適用することにより障害発生イベントを正しく検出できることが保証される。また、誤検出構成情報が新たに付加された場合には、該シンプトンの適用の可能性を減じることにより、障害発生イベントを正しく検出する可能性を高めることができる。 Thus, even if a symptom is not added with partial configuration information at the time of symptom generation, when a normal detection configuration information is newly added, a fault occurrence event can be detected correctly by applying the symptom. Is guaranteed. In addition, when erroneous detection configuration information is newly added, the possibility of correctly detecting a failure event can be increased by reducing the possibility of applying the symptom.
また、実施の形態2と同様に、取得したシステム構成情報と、シンプトンに付加された正常検出構成情報又は誤検出構成情報とを比較して、記憶されている部分構成情報ごとに両者の一致度を算出することにより、適用するシンプトンの優先順位をつけることができる。この場合、実施の形態2と同様、一致度算出部701及びシンプトン抽出部702を設け、CPU11は、構成情報取得部202で取得したシステム構成情報と、更新部2502でシンプトンに付加して記憶されている正常検出構成情報又は誤検出構成情報とを比較して、正常検出構成情報又は誤検出構成情報ごとに両者の一致度を算出する。
Similarly to the second embodiment, the acquired system configuration information is compared with normal detection configuration information or false detection configuration information added to the symptom, and the degree of coincidence between the two is stored for each stored partial configuration information. , It is possible to prioritize the symptom to be applied. In this case, as in the second embodiment, a coincidence
正常検出構成情報については、算出された一致度が高いシンプトンの適用優先順位を高くしてシンプトンを適用することにより、障害が発生したイベントの検出精度を高めることができる。誤検出構成情報については、算出された一致度が高いシンプトンの適用優先順位を下げることにより、障害が発生したイベントの検出精度を高めることができる。また、誤検出構成情報であって、一致度が高いシンプトンについては、あえてシンプトンとして適用した場合の検出結果を誤検出用の検出結果として活用することもできる。 With respect to the normal detection configuration information, by applying the symptom by increasing the application priority of the symptom having a high degree of coincidence, the detection accuracy of the event in which the failure has occurred can be improved. For erroneous detection configuration information, the detection accuracy of an event in which a failure has occurred can be increased by lowering the application priority of a symptom having a high degree of coincidence. Further, for a symptom that is erroneous detection configuration information and has a high degree of coincidence, the detection result when applied as a symptom can be used as a detection result for erroneous detection.
また、誤検出構成情報が付加されている場合には、実施の形態3と同様に検出結果の適合度を算出してシンプトン適用可能性を減じることもできる。例えばCPU11は、抽出部1602にて抽出された部分構成情報と、イベント群特定部1601でイベント群を特定するのに適用されたシンプトンに含まれている部分構成情報との適合度を適合度算出部2504で算出し、適合度判断部2505にて算出された適合度が所定値より大きいと判断した場合には誤検出構成情報と判断して、例えば評価値を減算する、優先順位を下げる等の処理を行うことにより、適合度が高いシンプトンを障害発生イベント検出のために適用するシンプトンの候補から確実に外すことができる。結果として障害発生イベントの検出精度を高めることができる。
Further, when false detection configuration information is added, the suitability of the detection result can be reduced by calculating the fitness of the detection result as in the third embodiment. For example, the
一のシンプトンに対して、正常検出構成情報及び誤検出構成情報は複数付加されても良い。図27は、正常検出構成情報及び誤検出構成情報が付加されたシンプトンデータベース131のデータ構成の例示図である。図27に示すように、正常検出構成情報271が複数個、誤検出構成情報272が複数個、それぞれ一のシンプトン273に対応付けて付加されている。
A plurality of normal detection configuration information and erroneous detection configuration information may be added to one symptom. FIG. 27 is a view showing an example of the data configuration of the
例えば複数の正常検出構成情報271、271、・・・が一のシンプトンに対応付けられている場合、正常検出構成情報271、271、・・・の各々に対して付加された回数を計数する計数部(図示せず)を備え、付加された回数が多い部分構成情報を優先的に適用する。このようにすることで、正常に検出したと判断された回数の多い部分構成情報を優先的に適用することができ、障害が発生したイベントの検出精度を高めることができる。
For example, when a plurality of normal
一方、複数の誤検出構成情報272、272、・・・が一のシンプトンに対応付けられている場合、誤検出構成情報272、272、・・・の各々に対して付加された回数を計数する計数部(図示せず)を備え、付加された回数が多い部分構成情報については適用優先順位を下げる等の処理を行うことにより、誤検出であると判断された回数の多い部分構成情報を適用する可能性を減じることができ、障害が発生したイベントの検出精度を高めることができる。
On the other hand, when a plurality of erroneous
以上のように本実施の形態4によれば、部分構成情報をシンプトンが保有していない場合であっても、障害発生イベントの検出結果に応じて部分構成情報をシンプトンに付加することができる。したがって、付加された部分構成情報により、どのシンプトンを優先して用いるべきか容易に判断することができ、障害発生イベントの検出精度の向上を図ることができる。また、誤って障害発生イベントを検出した場合の部分構成情報も記憶しておくことにより、誤検出時に用いられた部分構成情報との適合度も提示することができ、適合度に基づくシンプトン適用の順位付けをより精度良く行うことが可能となる。 As described above, according to the fourth embodiment, even when the symptom does not hold the partial configuration information, the partial configuration information can be added to the symptom according to the detection result of the failure occurrence event. Therefore, it is possible to easily determine which symptom should be preferentially used based on the added partial configuration information, and it is possible to improve the detection accuracy of the failure event. Also, by storing the partial configuration information when a fault occurrence event is detected by mistake, it is possible to present the degree of conformity with the partial configuration information used at the time of erroneous detection. Ranking can be performed with higher accuracy.
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。例えばネットワークを介して本実施の形態に係る障害イベント検出装置に接続されている外部のコンピュータの記憶装置に、シンプトンデータベース、構成情報記憶部、履歴情報記憶部を備え、必要に応じて各種情報を読み書きするようにしても良い。 The present invention is not limited to the above-described embodiments, and various changes and improvements can be made within the scope of the present invention. For example, a storage device of an external computer connected to the failure event detection device according to the present embodiment via a network includes a symptom database, a configuration information storage unit, and a history information storage unit, and various types of information are stored as necessary. You may make it read and write.
1 障害イベント検出装置
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 通信インタフェース
16 ビデオインタフェース
17 可搬型ディスクドライブ
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 シンプトンデータベース
132 構成情報記憶部
133 履歴情報記憶部
1 Failure
12
Claims (6)
発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段と、
収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段と、
特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段と、
特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得する正誤情報取得手段と、
取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新する更新手段と
を備える装置。 A history information collection unit system log information Homata that collects historical information of the system including any of the failure information output from each component upon occurrence of a failure in the system that includes at least a plurality of components,
Symptom storage means for storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred,
An event group specifying means for specifying an event group that matches the symptom based on the collected history information and the stored symptom;
Extraction means for extracting partial configuration information, which is system configuration information including related information between the component that sent each of the event groups and other components, based on the identified event groups;
Correct / incorrect information acquisition means for acquiring correct / incorrect information regarding whether or not an event in which a failure has occurred has been normally detected based on the identified event group and the extracted partial configuration information;
An update unit that updates the symptom that is the basis for specifying the event group based on the acquired correct / incorrect information and the extracted partial configuration information.
前記シンプトン記憶手段は、取得したシステム構成情報のうち、記憶されているシンプトンの基礎となったイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を前記シンプトンに付加情報として付加するようにしてある請求項1記載の装置。 Comprising system configuration information acquisition means for acquiring system configuration information which is configuration information of the system;
The symptom storage means adds partial configuration information as additional information to the symptom, which is system configuration information related to a component that has transmitted the event that is the basis of the stored symptom among the acquired system configuration information. The apparatus of claim 1.
発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するステップと、 Storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred;
収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するステップと、 Identifying a group of events that match the symptom based on collected history information and stored symptoms;
特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出するステップと、 Extracting partial configuration information, which is system configuration information including related information between the component that sent each of the event groups and other components, based on the identified event groups;
特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得するステップと、 Acquiring correct / incorrect information regarding whether or not an event in which a failure has occurred has been normally detected based on the identified event group and the extracted partial configuration information;
取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新するステップと Updating the symptom that is the basis for the event group identification based on the acquired correct / incorrect information and the extracted partial configuration information;
を含む方法。 Including methods.
前記コンピュータを、 The computer,
少なくとも前記システムのログ情報又は該システムでの障害発生時に各コンポーネントから出力される障害情報のいずれかを含む前記システムの履歴情報を収集する履歴情報収集手段、 History information collection means for collecting history information of the system including at least either log information of the system or failure information output from each component when a failure occurs in the system;
発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段、 Symptom storage means for storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred,
収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段、 An event group specifying means for specifying an event group matching the symptom based on the collected history information and the stored symptom;
特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段、 Extraction means for extracting partial configuration information, which is system configuration information including related information between a component that has transmitted each event group and another component, based on the identified event group;
特定されたイベント群及び抽出された部分構成情報に基づいて障害が発生したイベントが正常に検出されたか否かに関する正誤情報を取得する正誤情報取得手段、及び Correct / incorrect information acquisition means for acquiring correct / incorrect information regarding whether or not an event in which a failure has occurred is normally detected based on the identified event group and the extracted partial configuration information, and
取得した正誤情報及び抽出された部分構成情報に基づいて、前記イベント群特定の基礎となった前記シンプトンを更新する更新手段 Updating means for updating the symptom that is the basis for the event group identification based on the acquired correct / incorrect information and the extracted partial configuration information
として機能させるコンピュータプログラム。 A computer program that functions as a computer program.
前記システムの構成情報であるシステム構成情報を取得するシステム構成情報取得手段として機能させ、 Function as system configuration information acquisition means for acquiring system configuration information which is configuration information of the system,
前記シンプトン記憶手段を、取得したシステム構成情報のうち、記憶されているシンプトンの基礎となったイベントを送出したコンポーネントに関するシステム構成情報である部分構成情報を前記シンプトンに付加情報として付加する手段として機能させる請求項4記載のコンピュータプログラム。 The symptom storage means functions as means for adding, as additional information, partial configuration information, which is system configuration information related to a component that has transmitted a stored symptom-based event, among the acquired system configuration information. The computer program according to claim 4 to be caused.
発生した障害に関連する前記コンポーネントに含まれるイベントを検出する検出ルールに所定の付加情報を付加したシンプトンを記憶するシンプトン記憶手段と、 Symptom storage means for storing a symptom in which predetermined additional information is added to a detection rule for detecting an event included in the component related to the failure that has occurred,
収集された履歴情報及び記憶されているシンプトンに基づいて、前記シンプトンに適合するイベント群を特定するイベント群特定手段と、 An event group specifying means for specifying an event group that matches the symptom based on the collected history information and the stored symptom;
特定されたイベント群に基づいて、該イベント群それぞれを送出したコンポーネントと他のコンポーネントとの間の関連情報を含むシステム構成情報である部分構成情報を抽出する抽出手段と、 Extraction means for extracting partial configuration information, which is system configuration information including related information between the component that sent each of the event groups and other components, based on the identified event groups;
該抽出手段で抽出された部分構成情報と、前記イベント群特定手段で前記イベント群を特定するのに適用した前記シンプトンに含まれている部分構成情報との適合度を算出する適合度算出手段と、 A fitness calculation means for calculating a fitness between the partial configuration information extracted by the extraction means and the partial configuration information included in the symptom applied to specify the event group by the event group specification means; ,
算出された適合度が所定値より大きいか否かを判断する判断手段と、 Determining means for determining whether the calculated fitness is greater than a predetermined value;
該判断手段で所定値より大きいと判断された場合、前記抽出手段で抽出された部分構成情報に正常に検出された旨を示す情報を付加した正常検出構成情報を、所定値以下であると判断された場合、前記抽出手段で抽出された部分構成情報に誤検出された旨を示す情報を付加した誤検出構成情報を、それぞれ前記シンプトンに付加して前記シンプトンを更新する更新手段と When the determination means determines that the detected value is larger than the predetermined value, the normal detection configuration information obtained by adding information indicating that the partial detection information is normally detected to the partial configuration information extracted by the extraction means is determined to be equal to or less than the predetermined value. Update means for updating the symptom by adding, to the sympton, erroneous detection configuration information to which information indicating that the partial detection information is erroneously detected is added to the partial configuration information extracted by the extraction unit.
を備える装置。 A device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008279292A JP5258040B2 (en) | 2008-10-30 | 2008-10-30 | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008279292A JP5258040B2 (en) | 2008-10-30 | 2008-10-30 | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010108225A JP2010108225A (en) | 2010-05-13 |
JP5258040B2 true JP5258040B2 (en) | 2013-08-07 |
Family
ID=42297622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008279292A Expired - Fee Related JP5258040B2 (en) | 2008-10-30 | 2008-10-30 | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5258040B2 (en) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11243390A (en) * | 1998-02-26 | 1999-09-07 | Sumitomo Electric Ind Ltd | Preparation of event correlation table for network |
JPH11308222A (en) * | 1998-04-22 | 1999-11-05 | Sumitomo Electric Ind Ltd | Network management system |
JP3875436B2 (en) * | 1999-10-28 | 2007-01-31 | 富士通株式会社 | Network management apparatus and recording medium |
AU2002359925B2 (en) * | 2002-12-26 | 2008-10-23 | Fujitsu Limited | Operation managing method and operation managing server |
JP2006099249A (en) * | 2004-09-28 | 2006-04-13 | Fujitsu Ltd | Fault management device and fault management method |
JP4458493B2 (en) * | 2006-08-10 | 2010-04-28 | 株式会社日立情報システムズ | Log notification condition definition support apparatus, log monitoring system, program, and log notification condition definition support method |
JP4172807B2 (en) * | 2006-09-08 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Technology that supports the discovery of the cause of failure |
JP2008090504A (en) * | 2006-09-29 | 2008-04-17 | Oki Electric Ind Co Ltd | Computer maintenance support system and analysis server |
US8612372B2 (en) * | 2008-08-29 | 2013-12-17 | International Business Machines Corporation | Detection rule-generating facility |
JP5220555B2 (en) * | 2008-10-30 | 2013-06-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program |
JP5220556B2 (en) * | 2008-10-30 | 2013-06-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program |
WO2010050381A1 (en) * | 2008-10-30 | 2010-05-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Device for supporting detection of failure event, method for supporting detection of failure event, and computer program |
-
2008
- 2008-10-30 JP JP2008279292A patent/JP5258040B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010108225A (en) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5132779B2 (en) | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program | |
JP5274565B2 (en) | Detection rule generation device, detection rule generation method, and computer program | |
CN110928772B (en) | Test method and device | |
JP5285084B2 (en) | System for supporting action execution according to detection event, method for supporting action execution according to detection event, support apparatus, and computer program | |
US7251584B1 (en) | Incremental detection and visualization of problem patterns and symptoms based monitored events | |
JP6233411B2 (en) | Fault analysis apparatus, fault analysis method, and computer program | |
JP4282717B2 (en) | Periodic inspection data analysis apparatus and method | |
US20090113248A1 (en) | Collaborative troubleshooting computer systems using fault tree analysis | |
JP2011034208A (en) | Failure detection method, device and program | |
JP5220555B2 (en) | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program | |
JP7262506B2 (en) | A system and method for visualizing the results of causal diagnosis of events that have occurred or may occur in equipment | |
JP5514643B2 (en) | Failure cause determination rule change detection device and program | |
JP2016192034A (en) | Statistical model creation device, statistical model creation method, and statistical model creation program | |
JP5220556B2 (en) | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program | |
JP5258040B2 (en) | Apparatus for supporting detection of failure event, method for supporting detection of failure event, and computer program | |
US12052134B2 (en) | Identification of clusters of elements causing network performance degradation or outage | |
CN101556168B (en) | Equipment operating data monitoring device | |
US20220129906A1 (en) | Intelligent self-serve diagnostics | |
JP5197128B2 (en) | Dependency Estimation Device, Dependency Estimation Program, and Recording Medium | |
JP5569438B2 (en) | Fuzzy description automatic detection apparatus and method | |
US20110138228A1 (en) | Verification computer product and apparatus | |
JP4667954B2 (en) | Analysis support device | |
JP7073766B2 (en) | Information processing program, information processing method and information processing equipment | |
KR20170135387A (en) | Apparatus and method for analyzing usability hampering elements of mobile application | |
US8332691B2 (en) | Verification apparatus, verification method, and computer product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20130404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130419 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |