JP2004320267A - Fault notice apparatus and fault notice method - Google Patents
Fault notice apparatus and fault notice method Download PDFInfo
- Publication number
- JP2004320267A JP2004320267A JP2003109679A JP2003109679A JP2004320267A JP 2004320267 A JP2004320267 A JP 2004320267A JP 2003109679 A JP2003109679 A JP 2003109679A JP 2003109679 A JP2003109679 A JP 2003109679A JP 2004320267 A JP2004320267 A JP 2004320267A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- fault
- type
- report
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、被監視装置と被監視装置を監視する保守センタとの間に設置され、被監視装置から保守センタに通報される障害情報を選別する障害通報装置に関し、障害情報を選別する障害通報方法に関する。
【0002】
【従来の技術】
被監視装置から保守センタに障害を通報するシステムにおいて、保守センタの負担を軽減する技術として、被監視装置と保守センタの間にマネージャ(装置)を設置する技術は、従来から知られている。
【0003】
特開平07−183932号公報によれば、階層型ネットワーク管理システムにおいて、エージェントが発行するトラップ情報のうち、統合マネージャには、通信ネットワーク管理に必要なトラップ情報だけが通知されるようにした管理情報の通信方式が知られていた。この通信方式は、エージェントと統合マネージャとの間に設置した各サブマネージャが、フィルタリングするための条件を格納したフィルタMIBと、トラップ情報受信時にフィルタMIB中のフィルタ条件を参照してトラップ情報のフィルタリングするフィルタ機能を有し、統合マネージャからの要求によりフィルタ条件を変更および追加を行う。よって、統合マネージャが受信するトラップ情報の数を削減することができ、統合マネージャの負担を軽減することができる。
【0004】
特開2001−331350号公報によれば、計算機システム内で発生する複数の軽微な事象の相互関係により引き起こされる重大な障害を予報出力できる保守管理装置に関する技術が知られていた。この技術は、所定の時間差内で発生する複数の動作状況の組み合わせと起こり得る障害結果との関連を予め関連データベースに格納し、計算機システム内に発生した動作状況をその発生時刻情報とともに動作状況記録ファイルに記録する動作記録装置、動作状況記録ファイルを監視して、複数の動作状況の組み合わせが上記関連データベースに存在し、それらの発生時刻情報の差が上記所定の時間差内であれば、上記関連データベースに格納された今後起こり得る障害結果を表示装置に予報出力する記録監視装置を備えている。
【0005】
また、特開2000−242625号公報によれば、特徴の抽出に関して、文字数値属性が混在する分析対象の元データに対して目的属性がないような場合でもデータの特徴を抽出して視覚化対象属性を適確に選択し得る相関ルールを利用した属性選択する技術が知られている。この技術は、トランザクション形式のデータが入力されると、相関ルールが抽出され、この抽出されたすべての相関ルールに対して確信度Ciと支持度Siを乗じた値Miを計算し、この値Miが大きい相関ルールから順に選択し、この選択した相関ルールから本体、頭部の順でアイテムを選択し、本体または頭部に複数のアイテムがある場合には、出現数の一番多いアイテムから順に選択し、この選択したアイテムが属する属性を順に選択する。
【0006】
発生した障害の原因診断に関する技術について、特開平06−149577号公報によれば、機器および通信路の物理的故障、誤操作、プログラムの不具合、パラメータ値の設定不備による誤動作などによる障害の診断を効率よく行えるようにする技術が知られていた。この技術は、機器および通信路に生じる障害の診断を行う障害診断方法および装置において、障害状態に対応させて記述した診断データを複数個のノードとして階層的に配列する診断木により構成された診断知識ベースを設け、対処すべき障害に最も関連がある診断知識ベース中のノードを指定する診断ノード指定部と、指定されたノードに対応する内容を検査する検査部と、障害状態を示すノードの候補の中で最も確かな障害状態を示すノードを選択する検査結果判定部とを備えるものである。
【0007】
また、特開平07−200499号公報によれば、主記憶装置のサイズを軽減し、かつ診断プログラムの実行時間を効率化し、迅速かつ正確な障害診断を遂行する障害診断装置に関する技術が知られていた。中央処理装置に、入力装置、表示装置、記憶装置が接続され、中央処理装置に、障害を診断する診断装置を備える。記憶装置には、障害状態に対応させて記述した診断データを複数個設ける。診断装置には、知識ベースの障害状態を示すノードの中で対処すべき障害で関連ある診断木とノードを選択する診断木選択部と、指定されたノードに記述されている内容に従って検査を行う検査部と、障害状態を示すノードの中で最も確からしい障害状態を示すノードを検査結果に基づいて選択し、その結果を診断木指示部、あるいは表示装置に表示する検査結果判定部とを有するものである。
【0008】
さらに、特開平08−077260号公報によれば、通報された障害情報に対応する障害対策支援システムに関する技術が知られていた。この技術は、顧客先機器で発生した障害の対策に要する一連の作業手順を的確に誘導し、支援し得る構成の障害対策支援システムを提供するものである。顧客先機器から障害対策支援システムに通知された障害申告情報に基づいて障害対策受付処理部が各情報ファイルを検索し、検索結果に基づいて障害機器の正式機器型名を特定するとともに、障害原因、例えば不良部品の推定、部品の手配処理を行い、更に、関連部署端末制御部を通じて関連部署への連絡等を行う。その際、当該障害対策の処理者のための誘導情報、例えば次に行うべき作業、入力すべきデータの紹介等を端末表示誘導処理部で端末画面等へ表示し、必要なデータなどの入力を促すものである。
【0009】
【特許文献1】
特開平07−183932号公報
特開2001−331350号公報
特開2000−242625号公報
特開平06−149577号公報
特開平07−200499号公報
特開平08−077260号公報
【0010】
【発明が解決しようとする課題】
本発明の目的は、被監視装置の障害を通報される保守センタの負担を軽減する障害通報装置および障害通報方法を提供することにある。
【0011】
本発明の他の目的は、被監視装置の障害を選択通報する条件を人手ではなく自動的に設定する障害通報装置および障害通報方法を提供することにある。
【0012】
また、本発明の他の目的は、被監視装置の障害を選択通報する条件をミスなく設定する障害通報装置および障害通報方法を提供することにある。
【0013】
さらに、本発明の他の目的は、保守対応の時間を短縮する障害通報装置および障害通報方法を提供することにある。
【0014】
【課題を解決するための手段】
以下に、[発明の実施の形態]で使用される番号・符号を用いて、課題を解決するための手段を説明する。これらの番号・符号は、[特許請求の範囲]の記載と[発明の実施の形態]との対応関係を明らかにするために付加されたものである。ただし、それらの番号・符号を、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
【0015】
本発明の観点によれば、障害通報装置(11)は、入力部(21)と、定義テーブル(34、35)、とフィルタ部(22、23)と、通報部(24)と、登録部(27、28、29、31、32)とを具備し、当該障害通報装置(11)の稼働に伴って、保守センタ(14)に通報すべき障害種別を自動的に更新する。被監視装置(12)から保守センタ(14)に通報される障害情報は、発生した障害の種類を示す障害種別と障害の発生した時刻を示す発生時刻とを含んでいる。入力部(21)は、保守センタ(14)によって監視される被監視装置(12)から障害情報を収集する。定義テーブル(34、35)は、保守センタ(14)に通報すべき障害種別を定義する。フィルタ部(22、23)は、定義テーブル(34、35)に基づいて入力部(21)に入力した障害情報のうち、保守センタ(14)に通報すべき障害情報を決定する。通報部(24)は、フィルタ部(22、23)で決定した結果に応答して、被監視装置(12)を監視する保守センタ(14)に障害情報を通報する。登録部(27、28、29、31、32)は、入力部(21)で収集される障害情報に基づいて保守センタ(14)に通報すべき障害情報の障害種別を抽出し、抽出した障害種別で定義テーブル(35)を更新する。
【0016】
本発明の障害通報装置(11)において、登録部(27、28、29、31、32)は、データ整形部(27)と、相関ルール分析部(28)と、通報定義登録部(29)とを備えている。データ整形部(27)は、障害情報が入力されるごとに関連通報ログ(31)に障害情報を格納する。相関ルール分析部(28)は、関連通報ログ(31)から、障害の前後に発生する関連障害の関連障害種別を障害の障害種別に対応付けた相関ルールを抽出し、抽出した結果を相関ルールテーブル(32)に格納する。通報定義登録部(29)は、定義テーブル(34、35)と相関ルールテーブル(32)とを参照して、保守センタ(14)に通報すべき障害情報の障害種別を定義テーブル(35)に登録する。
【0017】
本発明の障害通報装置(11)において、被監視装置(12)に発生した第1障害の第1障害情報は、第1発生時刻と第1障害種別を含んでいる。第1発生時刻の前後の予め定められた時間T以内に発生した被監視装置(12)の第2障害の第2障害情報は、第2障害種別を含んでいる。データ整形部(27)は、第1障害種別と第1発生時刻と第2障害種別を対応付けて関連通報ログ(31)に格納する。
【0018】
本発明の障害通報装置(11)において、相関ルール分析部(28)は、関連通報ログ(31)に格納される予め定められた数の障害情報から相関ルールを抽出する。相関ルールを抽出する障害情報の数を限定することによって、運用状態の変化などによる障害発生の変化に対応することができ、分析する標本数も確保できるので確度の向上も見込めるようになる。
【0019】
本発明の障害通報装置(11)において、相関ルール分析部(28)は、関連通報ログ(31)に格納される障害情報のうち、相関ルールを抽出する時刻から予め定められた時間以内に発生した障害の障害情報から相関ルールを抽出する。相関ルールを抽出する障害情報の時間を限定することによって、最近の運用状態における障害発生状況に合致した相関ルールを抽出できるようになる。
【0020】
本発明の障害通報装置(11)において、定義テーブル(34、35)は、通報定義テーブル(34)と、相関通報定義テーブル(35)とを含んでいる。通報定義テーブル(34)は、保守センタ(14)に通報すべき障害種別が予め登録されている。相関通報定義テーブル(35)は、通報定義登録部(29)によって保守センタ(14)に通報すべき障害種別が登録される。フィルタ部(22、23)は、通報フィルタ部(22)と、相関通報フィルタ部(23)とを含んでいる。通報フィルタ部(22)は、通報定義テーブル(34)に登録されている障害種別の障害情報を通報部(24)から保守センタ(14)に通報させる。相関通報フィルタ部(23)は、相関通報定義テーブル(35)に登録されている障害種別の障害情報を通報部(24)から保守センタ(14)に通報させる。
【0021】
本発明の障害通報装置(11)において、相関通報定義テーブル(35)に登録された障害種別の障害情報は、相関通報定義テーブル(35)を参照して通報されたことを示すフラグが付加される。通報部(24)は、フラグを付加された障害情報を保守センタ(14)に通報する。
【0022】
本発明の観点によれば、障害通報方法は、入力ステップと、フィルタステップと、通報ステップと、登録ステップとを具備し、当該方法を用いる障害通知装置(11)の稼働に伴って、保守センタ(14)に通報すべき障害種別を自動的に更新する。被監視装置(12)から保守センタ(14)に通報される障害情報は、発生した障害の種類を示す障害種別と障害の発生した時刻を示す発生時刻とを含んでいる。入力ステップは、保守センタ(14)によって監視される被監視装置(12)から障害情報を収集する。定義テーブル(34、35)は、保守センタ(14)に通報すべき障害種別を定義する。フィルタステップは、定義テーブル(34、35)に基づいて入力ステップで入力した障害情報のうち、保守センタ(14)に通報すべき障害情報を決定する。通報ステップは、フィルタステップで決定した結果に応答して、被監視装置(12)を監視する保守センタ(14)に障害情報を通報する。登録ステップは、入力ステップで収集される障害情報に基づいて保守センタ(14)に通報すべき障害情報の障害種別を抽出し、抽出した障害種別で定義テーブル(35)を更新する。
【0023】
本発明の障害通報方法において、登録ステップは、データ整形ステップと、相関ルール分析ステップと、通報定義登録ステップとを備えている。データ整形ステップは、障害情報を入力されるごとに関連通報ログ(31)に格納する。相関ルール分析ステップは、障害の前後に発生する関連障害の関連障害種別を障害の障害種別に対応付けた相関ルールを関連通報ログ(31)から抽出し、抽出した結果を相関ルールテーブル(32)に格納する。通報定義登録ステップは、定義テーブル(34、35)と相関ルールテーブル(32)とを参照して、保守センタ(14)に通報すべき障害情報の障害種別を定義テーブル(35)に追加する。
【0024】
本発明の障害通報方法において、被監視装置(12)に発生した第1障害の第1障害情報は、第1発生時刻と第1障害種別を含んでいる。第1発生時刻の前後の予め定められた時間T以内に発生した被監視装置(12)の第2障害の第2障害情報は、第2障害種別を含んでいる。データ整形ステップは、第1障害種別と第1発生時刻と第2障害種別を対応付けて関連通報ログ(31)に格納する。
【0025】
本発明の障害通報方法において、相関ルール分析ステップは、関連通報ログ(31)に格納される予め定められた数の障害情報から相関ルールを抽出する。
【0026】
本発明の障害通報方法において、相関ルール分析ステップは、関連通報ログ(31)に格納される障害情報のうち、相関ルールを抽出する時刻から予め定められた時間以内に発生した障害の障害情報から相関ルールを抽出する。
【0027】
本発明の障害通報方法において、定義テーブル(34、35)は、保守センタ(14)に通報すべき障害種別が予め登録されている通報定義テーブル(34)と、登録ステップによって保守センタ(14)に通報すべき障害種別が登録される相関通報定義テーブル(35)とを含んでいる。フィルタステップは、通報定義テーブル(34)に登録されている障害種別の障害情報を通報ステップにより保守センタ(14)に通報させる通報フィルタステップと、相関通報定義テーブル(35)に登録されている障害種別の障害情報を通報ステップにより保守センタ(14)に通報させる相関通報フィルタステップとを含んでいる。
【0028】
本発明の障害通報方法において、相関通報定義テーブル(35)に登録された障害種別の障害情報は、相関通報定義テーブル(35)を参照して通報されたことを示すフラグが付加される。通報ステップは、フラグを付加された障害情報を保守センタ(14)に通報する。フラグ付加により、通報された障害は、予め通報が定められている障害情報か、関連する障害として追加登録された障害情報であるかを区別することができ、障害分析等の保守対応の時間短縮が可能となる。
【0029】
【発明の実施の形態】
本発明の障害通報装置を監視マネージャと称して本発明の実施の形態を説明する。図1は、本発明の監視マネージャを使用した障害監視システムの構成を示すブロック図である。障害監視システムは、被監視装置12と監視マネージャ11と保守センタ14とを含んでいる。被監視装置12は、障害が発生したことをその障害の程度によらず全て保守センタ14に通報しようとする。通報する障害情報は、発生した障害の種類(例えば、「ディスク障害」、「データベースアクセス不能」など)を示す障害種別と、発生時刻とを含み、監視マネージャ11に通報される。監視マネージャ11は、通報された障害情報を選別し、保守センタ14に通報して有効な障害情報のみ保守センタ14に通報する。保守センタ14は、通報された障害情報に基づいて、保守作業を行う。
【0030】
図1では被監視装置12は、1台しか図示していないが、複数台あってもよく、複数台の被監視装置12から通報される障害情報を処理することによって以下に示す障害情報の選択条件を推定するサンプル数が増えるため確度の向上が期待できる。被監視装置12ごとに障害情報を処理する形態にすると被監視装置12ごとの個別状況に応じた対応が可能となる。
【0031】
また、被監視装置12の近傍と、遠隔地に保守センタ14や保守端末などがある場合もあり、保守センタ14も複数あってもよい。さらに、被監視装置12と監視マネージャ11、監視マネージャ11と保守センタ14の接続は、通信ネットワークによってもよい。
【0032】
障害情報を選別して保守センタ14に通報することによって、保守センタ14では、被監視装置12を保守する上で重要ではない障害情報が除去されているため、障害情報の解析などの負担が削減でき、保守時間の短縮が可能となる。
【0033】
監視マネージャ11は、ワークステーションなどに例示される情報処理装置であり、障害情報入力部21、通報フィルタ部22、相関通報フィルタ部23、障害情報通報部24、データ整形部27、相関ルール分析部28、通報定義登録部29、関連通報ログ31、相関ルールテーブル32、通報定義テーブル34、相関通報定義テーブル35を具備している。
【0034】
通報定義テーブル34と相関通報定義テーブル35は、障害情報を選択する条件を格納する定義テーブルである。これらの定義テーブルは、障害の種類を示す障害種別を一覧表形式で格納してある。定義テーブルに登録されている障害種別の障害情報は、保守センタ14に通報される。定義テーブルに登録されていない障害種別の障害情報は、保守センタ14に通報されずに破棄される。
【0035】
通報定義テーブル34は、被監視装置12の保守に直接的に関係する障害の障害種別が予め登録されているテーブルである。登録されている障害種別は、固定されていて自動的に更新されることはない。保守運用上で必要となった障害種別の登録や不要となった障害種別の削除などのメンテナンスを保守者が行うことができることはいうまでもないが、登録や削除に誤設定が無いように十分注意して行うことが必要である。
【0036】
相関通報定義テーブル35は、被監視装置12の保守に間接的に関係する障害の障害種別が登録されるテーブルである。被監視装置12の保守に間接的に関係する障害とは、その障害自体は、軽微であって保守運用上で無視できるもので保守センタ14に通報する必要はないが、通報定義テーブル34に登録されている障害種別の障害の発生に関連すると推測される障害である。相関通報定義テーブル35は、相関ルール分析部28により分析された結果に基づいて通報定義登録部29により自動的に更新される。
【0037】
定義テーブルをこのように固定部分と可変部分に分離することにより、重要な固定部分が自動更新機能により誤設定されることを防止することができる。また、固定部分が明確になることによりメンテナンスにおける人為的ミスも防止する効果が期待できる。
【0038】
障害情報入力部21は、被監視装置12とのインタフェースを備え、被監視装置12から障害情報を収集する。収集した障害情報は、通報フィルタ部22とデータ整形部27に送られる。
【0039】
通報フィルタ部22と相関通報フィルタ部23は、障害情報を選択するフィルタである。通報フィルタ22は、障害情報入力部21から障害情報を受け取り、通報定義テーブル34に登録されている障害種別の障害情報を選択して障害情報通報部24から保守センタ14に通報させる。通報定義テーブル34に登録されていない障害種別の障害情報は、相関通報フィルタ部23に送られる。
【0040】
相関通報フィルタ部23は、通報フィルタ部22から送られた障害情報から相関通報定義テーブル35に登録されている障害種別の障害情報を選択して障害情報通報部24から保守センタ14に通報させる。相関通報定義テーブル35に登録されていない障害種別の障害情報は、通報されないためここで破棄されることになる。通報される障害情報は、相関通報定義テーブル35を参照して保守センタ14に通報することを示すフラグが添付される。このフラグによって、保守センタ14は、相関通報定義テーブル35に登録された障害であることを識別して、被監視装置12の予防保守などに役立てる。
【0041】
これら障害情報のフィルタによって、軽微な障害などの被監視装置12の保守に有効ではない障害は、保守センタ14に通報されなくなり、保守センタ14の負荷の軽減になる。
【0042】
障害情報通報部24は、保守センタ14とのインタフェースを備え、通報フィルタ部22と相関通報フィルタ部23から送られる障害情報を保守センタ14に送る。
【0043】
データ整形部27と相関ルール分析部28と通報定義登録部29と関連通報ログ31と相関ルールテーブル32は、障害情報を選択する条件を生成する登録部である。
【0044】
データ整形部27は、障害情報入力部21から送られる障害情報を関連通報ログ31に保存する。また、発生時刻から予め定められた時間Tの間に発生した過去の障害を関連通報ログ31から抽出し、抽出した障害の関連する障害として障害情報入力部21から受け取った障害情報の障害種別を関連通報ログ31に登録する。その逆に、抽出した障害の障害種別を受け取った障害の関連障害として関連通報ログ31に登録する。予め定められた時間Tは、全ての障害に対して一定の時間として以下の説明を行うが、障害の種類(障害種別)によって異なっていてもよい。障害種別nに対する異なる時間Tnを閾値とした場合、それぞれの障害種別nにおいて関連する障害の発生する時間を調節できるため、相関ルール分析部28で行われる分析の時間を短縮したり、相関のある障害の発生をより詳細に推定をすることができる。
【0045】
関連通報ログ31は、図2に示すように、障害情報入力部21から送られる障害情報の障害種別と発生時刻に、関連する障害の障害種別をn個まで対応付けて格納されている。ここでは説明のため、関連障害の数を固定する表形式としたが、可変長のリスト形式で格納することもできる。可変長にすると各障害に対する関連障害の数が大幅に異なる場合には使用するメモリ領域などを節約できる。
【0046】
相関ルール分析部28は、定期的に関連通報ログ31を分析して障害間の関連性のルールを抽出する。関連性のルールの分析方法は、相関ルール(association rule)を用いるものとする。相関ルールとは、ある事象Aが発生した場合に事象Bも発生するという事実を示すもので、一般的に次の式で記述される。
A⇒B
ここでは、ある定められた時間Tを与え障害Aと障害Bの相関をA⇒Bとして記述した場合、障害Aが時刻taに発生して、その前後の間隔Tの間に障害Bが発生したとき、つまり、
ta−T<tb<ta+T
を満たす時刻tbに障害Bが発生したとき、相関A⇒Bを満たすとする。また、相関ルールA⇒B、B⇒Aを満たす障害A、Bを「障害A、B間に関連がある」と定義する。
【0047】
ルールの価値を表すものとして、確信度(confidence)とサポート(support)がある。確信度は、事象Aが発生した数aのうち、事象Bが発生した数bの割合であり、b/aで求められる。サポートは、A⇒Bを満たすデータ数bの全データNに対する割合でb/Nで求められる。例えば、図2のように障害が発生した場合、障害C⇒障害Aの相関ルールを評価すると、確信度=1/2=50%、サポート=1/4=25%、となる。相関ルール分析部28は、確信度とサポートの閾値を持ち、閾値以上である確信度とサポートの相関ルールを通報定義登録部29に通知する。このように確信度とサポートを与えてそれ以上の確信度とサポートを持つ相関ルールを発見する手法は公知のものであり、アプリオリアルゴリズム等が知られている。
【0048】
関連通報ログ31に格納してある各障害間の確信度とサポートを計算した結果は、図3に示すような相関ルールテーブル32に格納され、通報定義登録部29に渡される。相関ルールテーブル32は、障害種別Aと、障害種別Aに関連のある障害種別Bと、その確信度と、サポートとをまとめたものである。
【0049】
通報定義登録部29は、相関ルールテーブル32に格納されている相関ルールに従い、通報定義テーブル34を参照して通報すべき障害の障害種別を相関通報定義テーブル35に登録する。この通報すべき障害は、通報定義テーブル34に登録されている障害種別の障害に相関関係がある障害で、かつ通報定義テーブル34に登録されていない障害である。つまり、相関通報定義テーブル35に登録されていなければ保守センタ14に通報されない障害であり、直接的に保守運用上で通報が必要となる障害ではなく、重要な障害の前兆を示すと予測される障害である。
【0050】
本発明の監視マネージャ11は、被監視装置12から入力した障害情報を関連通報ログ31に保存し、保存された障害情報から相関のある障害のルールを分析し、分析した相関ルールに基づいて定義テーブルを更新し、稼働にともなって更新されていく定義テーブルを参照して被監視装置12から入力した障害情報を選別(フィルタリング)して保守センタ14に通報する。その動作を以下に説明する。
【0051】
被監視装置12から入力した障害情報を関連通報ログ31に保存する動作は、障害情報が入力されるごとに、図5のフローチャートに示されるような動作を繰り返す。図2に示す関連通報ログ31に障害情報が蓄積される状態を、図4に示すように障害が発生したと想定して説明する。障害種別Cである障害1は、時刻t1に発生し、その後時間T以内に障害種別Aである障害2が時刻t2に発生し、その後時間T以内に障害種別Bである障害3が時刻t3に発生し、その後時間T以上経てから障害種別Cである障害4が時刻t4に発生したものとする。
【0052】
障害1が時刻t1に発生し、被監視装置12から障害情報が障害情報入力部21に入力すると、データ整形部27は、その障害情報から障害種別Cと発生時刻t1を取り出し、関連通報ログ31に登録する。障害1の発生時は、他に障害がないので登録するのみである。次に障害2が時刻t2に発生し、被監視装置12から障害情報が障害情報入力部21に入力すると、データ整形部27は、その障害情報から障害種別Aと発生時刻t2を取り出し、関連通報ログ31に登録する。(ステップS11)
【0053】
関連障害を調べるため、関連通報ログ31にある過去の障害情報を取り出す。障害2を登録するときは、関連通報ログ31には障害1が登録されているので、障害1のデータを取り出す。(ステップS13)
【0054】
取り出したデータの発生時刻が、関連する障害とする時間T以内であるか比較する(ステップS16)。障害1の発生時刻はt1であるから、障害2との時間差はT以内であり(ステップS16−YES)、障害1と障害2は、関連する障害として登録する。障害2の障害種別Aを障害1の関連障害種別1に、障害1の障害種別Cを障害2の関連障害種別1に、それぞれ関連通報ログ31へ登録する。それ以上のデータは関連通報ログ31に無いので障害2に対する処理は終わる。(ステップS18)
【0055】
次に障害3が時刻t3に発生すると、まず、障害1、2と同様に関連通報ログ31に障害3の障害種別Bと発生時刻t3が登録される(ステップS11)。関連通報ログ31の過去の障害を検索し、時刻t2に発生した障害種別Aの障害2を抽出する(ステップS13)。時刻t2は時刻t3から時間T以内であるので(ステップS16−YES)、関連障害種別を関連通報ログ31に登録する。障害3の障害種別Bを障害2の関連障害種別2に、障害2の障害種別Aを障害3の関連障害種別1にそれぞれ登録する(ステップS18)。
【0056】
さらに過去の障害を検索すると、時刻t1に発生した障害種別Cの障害1が抽出される(ステップS13)。時刻t1は、時刻t3から時間T以上経過しているので障害3に対する処理は終了する(ステップS16−NO)。
【0057】
次に障害4が時刻t4に発生すると、同様に関連通報ログ31に障害4の障害種別Cと発生時刻t4が登録される(ステップS11)。関連通報ログ31の過去の障害を検索し、時刻t3に発生した障害種別Bの障害3を抽出する(ステップS13)。時刻t3は時刻t4から時間T以上経過しているので障害4に対する処理は終了する(ステップS16−NO)。このようにして、図2に示すような関連障害種別が登録されることになる。
【0058】
図6を参照して関連通報ログ31に保存されている障害情報から相関のある障害のルールを分析し、相関ルールテーブル32に格納する動作を説明する。分析は、相関ルール分析部28が定期的に行うが、障害情報が入力されて、関連通報ログ31に保存されると並行して行ってもよい。
【0059】
ルールを分析する範囲、つまり、関連通報ログ31のデータの範囲は、保存されている件数とする。以下では予め決めてある障害の発生件数まで分析を行うことにして説明するが、分析する時点から一定の時間だけ過去に遡ったところまでの障害を対象にしてもよい。
【0060】
相関ルール分析部28は、関連通報ログ31に保存されている障害のうち分析する範囲のはじめの障害にポインタを設定し、分析する障害の総数N、障害種別の数を計数するカウンタをクリアしておく。ここでは、分析範囲の最も過去の障害から分析するものとする(ステップS21)。
【0061】
関連通報ログ31からポインタに指示された障害情報を取り出し、分析の総数を+1する。例えば、図2の障害2を指示しているものとする(ステップS22)。
【0062】
障害Ai(図2においては障害2)のデータを取り出し、障害種別の数aiを+1する。図2の障害2では、障害種別Aであるから、障害種別Aの数を計数するカウンタを+1することになる(ステップS23)。
【0063】
関連障害Bijのデータを取り出し、関連する障害種別の数bijを+1する。図2の障害2では、関連障害種別1は、障害種別Cであるから、発生障害種別Aに対する関連障害種別Cのカウンタを+1する(ステップS25)。
【0064】
図2の障害2では、関連障害は2まであるので(ステップS27−NO)、関連障害種別2についても計数する。関連障害種別2は、障害種別Bであるから、発生障害種別Aに対する関連障害種別Bのカウンタを+1する(ステップS25)。
【0065】
図2の障害2では、関連障害種別2までしか登録されていないので、障害2に対する処理は終わり、ポインタを次の障害(図2の障害3)に移す(ステップS27−YES)。
【0066】
次の障害(図2の障害3)は登録されているので(ステップS28−NO)、ステップS22から次の障害(図2の障害3)についても同様にカウントする。
【0067】
分析範囲の最後の障害(図2の障害4)まで処理を進めると(ステップS28−YES)、分析した障害の総数Nと障害Aiの発生数と障害Aiに対する関連障害Bijの発生数が計数されているので、それぞれの確信度とサポートを計算する。確信度は、障害Aiが発生した数aiのうち、障害Bijが発生した数bijの割合であり、bij/aiで求められる。サポートは、Ai⇒Bijを満たすデータ数bijの分析した障害の総数Nに対する割合であり、bij/Nで求められる。例えば、図2のように障害が発生した場合、障害C⇒障害Aの相関ルールを評価すると、確信度=1/2=50%、サポート=1/4=25%、となる。(ステップS29)
【0068】
相関ルール分析部28で計算した相関ルールは、図3に示されるような相関ルールテーブル32に格納される。格納された相関ルールは、時間Tによって関連があるとした障害を全て列挙しているため、偶発的な障害間を関連あるとしたものも含まれているため、相関ルールテーブル32内の確信度、サポートを参照して相関関係のあるものを選択し、相関ルールとする。相関ルールテーブル32内の確信度、サポートは相関ルールとして有効とするか否かを判定するときに使用されるため、以上のような手順以外で相関ルールを抽出する場合は、必要がないこともある。以上によって相関ルールが相関ルールテーブル32に登録されたことになる。
【0069】
分析した相関ルールに基づいて、定義テーブルを更新する動作について図7を参照して説明する。相関ルールテーブル32に登録されている相関ルールと通報定義テーブル34に基づいて、通報定義登録部29は、相関通報定義テーブル35を更新する。相関ルールテーブル32には、障害種別Aの障害の発生に前後して障害種別Bの障害が発生すると推測できるという形式でルールが登録されている。関連通報ログ31の保存方法と相関ルールの生成方法から、障害種別Bの障害の発生に前後して障害種別Aの障害が発生すると推測できるというルールも登録されている。よって、通報定義登録部29は、相関ルールに登録されているどちらかの障害について登録すればよいことになる。通報定義登録部29が相関ルールを登録する際に、相関通報定義テーブル35を予めクリアしておくと、相関ルールを抽出した期間の相関ルールに基づいて相関通報定義テーブル35ができる。クリアせずに登録すると、過去の相関ルールに新しい期間の相関ルールが追加されることになる。適用するシステムの運用状態に応じて選択するとよい。
【0070】
相関ルールを相関ルールテーブル32から取り出す。取り出した相関ルールは、障害種別A⇒障害種別Bであったとする。通報定義登録部29は、障害種別Aの登録状態によって障害種別Bを相関通報定義テーブル35に登録するか否かを判断することになる(ステップS31)。
【0071】
障害種別Aが、通報することになっている障害の障害種別を登録してある通報定義テーブル34に登録されているか判定する(ステップS32)。障害種別Aが通報定義テーブル34に登録されていなければ、障害種別Aの障害は、保守センタ14に通報しなくてもよい障害であり、その相関のある障害種別Bの障害も通報しなくてもよく、次の相関ルールの判定に進む(ステップS32−NO)。
【0072】
障害種別Aが通報定義テーブル34に登録されていると、障害種別Aの障害は、保守センタ14に通報すべき障害であり、その相関のある障害種別Bの障害も通報すべき障害と判断する(ステップS35−YES)。
【0073】
障害種別Aに相関のある障害種別Bを取り出す。障害種別Bの障害は、通報すべき障害であっても既に通報する障害として登録されていると登録する必要がないため、未登録であることを確認する(ステップS34)。
【0074】
まず、通報定義テーブル34に未登録であることを確認する。障害種別Bが通報定義テーブル34に登録されている場合、登録する必要がないので次の相関ルールの判定に進む(ステップS35−YES)。障害種別Bが通報定義テーブル34に登録されていない場合は、相関通報定義テーブル35の登録状態を確認する(ステップS35−NO)。
【0075】
障害種別Bが相関通報定義テーブル35に既に登録されていれば、登録する必要がないので次の相関ルールの判定に進む(ステップS36−YES)。障害種別Bが相関通報定義テーブル35に登録されていなければ(ステップS36−NO)、障害種別Bを相関通報定義テーブル35に登録する(ステップS38)。相関通報定義テーブル35に登録することで、障害種別Bの障害は、保守センタ14に通報されることになる。
【0076】
相関のある障害種別Aと障害種別Bはともに定義テーブルに登録されていないとならないが、本発明の方法では、障害種別A⇒障害種別Bのとき、障害種別B⇒障害種別Aとなるように構成されているので、障害種別Aと障害種別Bはともに定義テーブルに登録される(通報定義テーブル34、相関通報定義テーブル35のいずれかに登録される)。
【0077】
以上を相関ルールの終わりまで繰り返し(ステップS39−NO)、全ての相関ルールを判定し終われば相関ルールをすべて相関通報定義テーブル35に反映したことになる(ステップS39−YES)。このようにして相関通報定義テーブル35を更新する。
【0078】
このように監視マネージャ11の稼働にともなって更新されていく相関通報定義テーブル35と、固定的に規定されている通報定義テーブル34を参照して被監視装置12から入力する障害情報を選別(フィルタリング)して保守センタ14に通報する動作を、図8を参照して説明する。
【0079】
障害情報入力部21は、被監視装置12から障害情報を入力し、通報フィルタ部22に送る(ステップS41)。
【0080】
通報フィルタ部22は、入力した障害情報の障害種別が通報定義テーブル34に登録されているか判定する。通報定義テーブル34に登録されていれば、入力した障害情報を保守センタ14に通報するため、障害情報通報部24に送る(ステップS43−YES)。
【0081】
通報定義テーブル34に登録されていない障害は、相関通報フィルタ部23に送られる。相関通報フィルタ部23では、入力した障害情報の障害種別が相関通報定義テーブル35に登録されているか判定する。相関通報定義テーブル35に登録されていれば(ステップS43−YES)、相関通報定義テーブル35に登録されている障害種別の障害であることを示すフラグを付加する。フラグを付加された障害情報は、保守センタ14に通報するため、障害情報通報部24に送られる(ステップS48)。障害情報通報部24は、障害情報を保守センタ14に通報する(ステップS49)。
【0082】
相関通報定義テーブル35にも登録されていない障害種別の障害は、保守センタ14に通報する必要がないので破棄される(ステップS46−NO)。
【0083】
このようにして、通報すべき障害は、保守センタ14に通報され、通報する必要のない障害情報は、破棄されることになる。
【0084】
以上のように、本発明の監視マネージャによると自動的に障害の通報条件を設定し、かつ、その稼働とともに最適な通報条件に転化するフィルタ条件を設定できるため、適切な障害通報が保守センタに通報されるようになる。よって、保守センタの負荷を削減することができ、保守時間の短縮が可能となる。
【0085】
【発明の効果】
本発明によれば、被監視装置から収集される障害通報をフィルタ機能により保守センタに通報しなくてもよい軽微な障害通報を削除することができ、保守センタの負担を軽減する障害通報装置および障害通報方法を提供することができる。
【0086】
また、本発明によれば、システムごとに異なる被監視装置の障害を選択通報する条件を人手ではなく自動的に設定する障害通報装置および障害通報方法を提供することができる。
【0087】
さらに、本発明によれば、ミスしやすい人手による条件設定を排除することで被監視装置の障害を選択通報する条件をミスなく設定する障害通報装置および障害通報方法を提供することができる。
【0088】
また、本発明によれば、関連のある障害を通報することにより障害発生を予測したり、原因究明を行うことができ、保守対応の時間を短縮する障害通報装置および障害通報方法を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る障害監視システムの構成、及び監視マネージャの構成を示すブロック図である。
【図2】同関連通報ログの構成を示す図である。
【図3】同相関ルールテーブルの構成を示す図である。
【図4】同関連通報ログに障害情報が蓄積される状態を説明するための障害発生の時間関係などを示した図である。
【図5】同関連通報ログに障害情報を蓄積する動作を示すフローチャートである。
【図6】同相関ルール分析する動作を示すフローチャートである。
【図7】同相関通報定義テーブルに登録する動作を示すフローチャートである。
【図8】同通報動作を示すフローチャートである。
【符号の説明】
11 監視マネージャ
12 被監視装置
14 保守センタ
21 障害情報入力部
22 通報フィルタ部
23 相関通報フィルタ部
24 障害情報通報部
27 データ整形部
28 相関ルール分析部
29 通報定義登録部
31 関連通報ログ
32 相関ルールテーブル
34 通報定義テーブル
35 相関通報定義テーブル[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a fault reporting device that is installed between a monitored device and a maintenance center that monitors the monitored device, and that selects fault information reported from the monitored device to the maintenance center. About the method.
[0002]
[Prior art]
2. Description of the Related Art In a system in which a failure is reported from a monitored device to a maintenance center, a technology of installing a manager (device) between the monitored device and the maintenance center has been conventionally known as a technology for reducing the burden on the maintenance center.
[0003]
According to Japanese Patent Application Laid-Open No. 07-183932, in a hierarchical network management system, of trap information issued by an agent, management information in which an integrated manager is notified of only trap information necessary for communication network management. Communication method was known. In this communication method, each sub-manager installed between the agent and the integration manager refers to a filter MIB storing a condition for filtering and a filter condition in the filter MIB when the trap information is received. Filter function to change and add filter conditions according to a request from the integration manager. Therefore, the number of trap information received by the integrated manager can be reduced, and the burden on the integrated manager can be reduced.
[0004]
According to Japanese Patent Application Laid-Open No. 2001-331350, there has been known a technology related to a maintenance management device capable of predicting and outputting a serious failure caused by a correlation between a plurality of minor events occurring in a computer system. This technology stores in advance a relation between a combination of a plurality of operating situations occurring within a predetermined time difference and a possible failure result in an association database, and records the operating situation occurring in the computer system together with its occurrence time information in an operating situation record. The operation recording device that records the file, the operation status recording file is monitored, and if a combination of a plurality of operation statuses exists in the related database and the difference between the occurrence time information is within the predetermined time difference, A recording monitoring device is provided that outputs a possible failure result stored in the database in a forecast on a display device.
[0005]
According to Japanese Patent Application Laid-Open No. 2000-242625, a feature of data is extracted and a visualization target is extracted even when there is no target attribute with respect to original data to be analyzed in which character and numeric attributes are mixed. 2. Description of the Related Art A technique for selecting an attribute using an association rule capable of selecting an attribute properly is known. According to this technique, when data in a transaction format is input, an association rule is extracted, and a value Mi obtained by multiplying the confidence Ci and the support Si for all the extracted association rules is calculated. Are selected in order from the correlation rule with the largest is, and the items are selected in order of the body and the head from the selected association rule. Select and sequentially select the attributes to which the selected item belongs.
[0006]
According to Japanese Patent Application Laid-Open No. 06-149577, regarding a technique for diagnosing the cause of a fault that has occurred, it is possible to efficiently diagnose faults caused by physical faults of devices and communication paths, erroneous operations, program faults, malfunctions due to improper parameter value settings, and the like. Techniques that make it possible to do well were known. This technique is a diagnostic method and apparatus for diagnosing a fault occurring in a device and a communication path, wherein a diagnostic tree configured by a diagnostic tree in which diagnostic data described corresponding to a fault state is hierarchically arranged as a plurality of nodes. A diagnostic node specifying unit that specifies a node in a diagnostic knowledge base most relevant to a fault to be dealt with, a checking unit that checks the content corresponding to the specified node, and a node that indicates a fault state. A test result determination unit that selects a node that shows the most certain failure state among the candidates.
[0007]
Further, according to Japanese Patent Application Laid-Open No. 07-200499, there is known a technique related to a fault diagnosis apparatus that reduces the size of a main storage device, increases the efficiency of execution time of a diagnosis program, and performs a quick and accurate fault diagnosis. Was. An input device, a display device, and a storage device are connected to the central processing unit, and the central processing unit includes a diagnostic device that diagnoses a failure. The storage device is provided with a plurality of diagnostic data described in correspondence with the failure state. The diagnostic apparatus includes a diagnostic tree selecting unit that selects a diagnostic tree and a node related to a fault to be dealt with among nodes indicating a fault state in the knowledge base, and performs a test according to the content described in the specified node. An inspection unit, and a test result determination unit that selects a node that indicates the most probable failure state among the nodes that indicate the failure state based on the inspection result, and displays the result on a diagnostic tree instruction unit or a display device. Things.
[0008]
Further, according to Japanese Patent Application Laid-Open No. 08-077260, a technique related to a failure countermeasure support system corresponding to the reported failure information has been known. This technique provides a failure countermeasure support system having a configuration capable of properly guiding a series of work procedures required for countermeasures for a failure occurring in a customer device and supporting the failure. The failure countermeasure reception processing unit searches each information file based on the failure report information notified from the customer's equipment to the failure countermeasure support system, identifies the formal device model name of the failed device based on the search result, and For example, estimation of a defective part, processing for arranging a part, and communication with the related department through the related department terminal control unit are performed. At that time, guidance information for the processor of the trouble countermeasure, for example, work to be performed next, introduction of data to be input, and the like are displayed on a terminal screen or the like by the terminal display guidance processing unit, and input of necessary data and the like is performed. To encourage.
[0009]
[Patent Document 1]
JP-A-07-183932
JP 2001-331350 A
JP 2000-242625 A
JP 06-149577 A
JP 07-200499 A
JP 08-077260 A
[0010]
[Problems to be solved by the invention]
An object of the present invention is to provide a failure reporting device and a failure reporting method that reduce the burden on a maintenance center to be notified of a failure of a monitored device.
[0011]
Another object of the present invention is to provide a failure reporting device and a failure reporting method for automatically setting conditions for selectively reporting a failure of a monitored device, not manually.
[0012]
It is another object of the present invention to provide a failure reporting device and a failure reporting method for setting conditions for selectively reporting a failure of a monitored device without error.
[0013]
Still another object of the present invention is to provide a failure reporting device and a failure reporting method that reduce the time for maintenance.
[0014]
[Means for Solving the Problems]
The means for solving the problem will be described below using the numbers and symbols used in [Embodiments of the Invention]. These numbers and symbols have been added in order to clarify the correspondence between the description of [Claims] and [Embodiments of the Invention]. However, those numbers and symbols must not be used for interpreting the technical scope of the invention described in [Claims].
[0015]
According to an aspect of the present invention, a failure notification device (11) includes an input unit (21), a definition table (34, 35), a filter unit (22, 23), a notification unit (24), and a registration unit. (27, 28, 29, 31, 32), and automatically updates the fault type to be reported to the maintenance center (14) with the operation of the fault notification device (11). The fault information reported from the monitored device (12) to the maintenance center (14) includes a fault type indicating the type of fault that has occurred and an occurrence time indicating the time when the fault occurred. The input unit (21) collects failure information from the monitored device (12) monitored by the maintenance center (14). The definition tables (34, 35) define the types of faults to be reported to the maintenance center (14). The filter units (22, 23) determine the failure information to be reported to the maintenance center (14) from the failure information input to the input unit (21) based on the definition tables (34, 35). The reporting unit (24) reports failure information to a maintenance center (14) that monitors the monitored device (12) in response to the result determined by the filter units (22, 23). The registration unit (27, 28, 29, 31, 32) extracts a failure type of failure information to be reported to the maintenance center (14) based on the failure information collected by the input unit (21), and extracts the extracted failure. The definition table (35) is updated with the type.
[0016]
In the fault notification device (11) of the present invention, the registration unit (27, 28, 29, 31, 32) includes a data shaping unit (27), an association rule analysis unit (28), and a notification definition registration unit (29). And The data shaping section (27) stores the failure information in the related report log (31) every time the failure information is input. The correlation rule analysis unit (28) extracts, from the related report log (31), a correlation rule in which a related failure type of a related failure occurring before and after the failure is associated with the failure type of the failure, and extracts the extracted result as a correlation rule. It is stored in the table (32). The report definition registration unit (29) refers to the definition tables (34, 35) and the correlation rule table (32) to store the failure type of the failure information to be reported to the maintenance center (14) in the definition table (35). register.
[0017]
In the failure notification device (11) of the present invention, the first failure information of the first failure that has occurred in the monitored device (12) includes a first occurrence time and a first failure type. The second fault information of the second fault of the monitored device (12) that has occurred within the predetermined time T before and after the first occurrence time includes the second fault type. The data shaping unit (27) stores the first failure type, the first occurrence time, and the second failure type in the associated report log (31) in association with each other.
[0018]
In the trouble report device (11) of the present invention, the correlation rule analysis unit (28) extracts a correlation rule from a predetermined number of trouble information stored in the related report log (31). By limiting the number of pieces of fault information for extracting correlation rules, it is possible to cope with a change in fault occurrence due to a change in operation state and the like, and the number of samples to be analyzed can be secured, so that an improvement in accuracy can be expected.
[0019]
In the failure notification device (11) of the present invention, the correlation rule analysis unit (28) generates the failure information within a predetermined time from the time when the correlation rule is extracted from the failure information stored in the related notification log (31). The correlation rule is extracted from the failure information of the failed failure. By limiting the time of the failure information for extracting the correlation rule, it becomes possible to extract a correlation rule that matches the failure occurrence situation in the latest operation state.
[0020]
In the fault notification device (11) of the present invention, the definition tables (34, 35) include a notification definition table (34) and a correlation notification definition table (35). In the report definition table (34), a fault type to be reported to the maintenance center (14) is registered in advance. In the correlation report definition table (35), a failure type to be reported to the maintenance center (14) is registered by the report definition registration unit (29). The filter units (22, 23) include a report filter unit (22) and a correlation report filter unit (23). The report filter unit (22) causes the report unit (24) to report the failure information of the failure type registered in the report definition table (34) to the maintenance center (14). The correlation report filter section (23) causes the report section (24) to report the failure information of the failure type registered in the correlation report definition table (35) to the maintenance center (14).
[0021]
In the failure notification device (11) of the present invention, the failure information of the failure type registered in the correlation report definition table (35) is added with a flag indicating that the failure has been reported with reference to the correlation report definition table (35). You. The reporting unit (24) reports the flagged failure information to the maintenance center (14).
[0022]
According to an aspect of the present invention, a failure notification method includes an input step, a filter step, a notification step, and a registration step, and is performed by a maintenance center when a failure notification device (11) using the method operates. The fault type to be reported to (14) is automatically updated. The fault information reported from the monitored device (12) to the maintenance center (14) includes a fault type indicating the type of fault that has occurred and an occurrence time indicating the time when the fault occurred. The input step collects fault information from the monitored device (12) monitored by the maintenance center (14). The definition tables (34, 35) define the types of faults to be reported to the maintenance center (14). The filter step determines failure information to be reported to the maintenance center (14) from the failure information input in the input step based on the definition tables (34, 35). The reporting step reports failure information to a maintenance center (14) that monitors the monitored device (12) in response to a result determined in the filtering step. The registration step extracts a failure type of the failure information to be reported to the maintenance center (14) based on the failure information collected in the input step, and updates the definition table (35) with the extracted failure type.
[0023]
In the failure notification method according to the present invention, the registration step includes a data shaping step, an association rule analysis step, and a notification definition registration step. The data shaping step stores the failure information in the relevant report log (31) each time it is input. The association rule analysis step extracts, from the association report log (31), an association rule that associates the associated failure type of the associated failure occurring before and after the failure with the failure type of the failure, and extracts the extracted result from the association rule table (32). To be stored. The report definition registration step adds a failure type of failure information to be reported to the maintenance center (14) to the definition table (35) with reference to the definition tables (34, 35) and the correlation rule table (32).
[0024]
In the failure notification method of the present invention, the first failure information of the first failure that has occurred in the monitored device (12) includes a first occurrence time and a first failure type. The second fault information of the second fault of the monitored device (12) that has occurred within the predetermined time T before and after the first occurrence time includes the second fault type. In the data shaping step, the first failure type, the first occurrence time, and the second failure type are stored in the associated report log (31) in association with each other.
[0025]
In the failure notification method of the present invention, the correlation rule analysis step extracts a correlation rule from a predetermined number of pieces of failure information stored in the related notification log (31).
[0026]
In the failure notification method according to the present invention, the correlation rule analysis step includes, among failure information stored in the related notification log (31), failure information of a failure that has occurred within a predetermined time from the time when the correlation rule is extracted. Extract association rules.
[0027]
In the failure notification method according to the present invention, the definition tables (34, 35) include a notification definition table (34) in which a failure type to be reported to the maintenance center (14) is registered in advance, and the maintenance center (14) by a registration step. And a correlation report definition table (35) in which a fault type to be reported is registered. The filtering step includes a reporting filter step for causing the maintenance center (14) to report the failure information of the failure type registered in the reporting definition table (34) by the reporting step, and a failure registered in the correlation reporting definition table (35). A correlation report filter step for reporting the type of fault information to the maintenance center (14) by a report step.
[0028]
In the failure notification method according to the present invention, the failure information of the failure type registered in the correlation report definition table (35) is added with a flag indicating that the failure has been reported with reference to the correlation report definition table (35). The reporting step reports the flagged fault information to the maintenance center (14). By adding a flag, it is possible to distinguish whether the reported fault is fault information for which a report has been set in advance or fault information that has been additionally registered as a related fault, thereby reducing the time required for maintenance such as fault analysis. Becomes possible.
[0029]
BEST MODE FOR CARRYING OUT THE INVENTION
An embodiment of the present invention will be described with the fault notification device of the present invention referred to as a monitoring manager. FIG. 1 is a block diagram showing the configuration of a fault monitoring system using the monitoring manager of the present invention. The fault monitoring system includes a monitored
[0030]
Although only one monitored
[0031]
Further, there may be a case where the
[0032]
By sorting the fault information and reporting it to the
[0033]
The
[0034]
The report definition table 34 and the correlation report definition table 35 are definition tables that store conditions for selecting fault information. In these definition tables, fault types indicating the types of faults are stored in a list format. Fault information of the fault type registered in the definition table is reported to the
[0035]
The report definition table 34 is a table in which fault types of faults directly related to maintenance of the monitored
[0036]
The correlation report definition table 35 is a table in which fault types of faults indirectly related to the maintenance of the monitored
[0037]
By separating the definition table into a fixed part and a variable part, it is possible to prevent an important fixed part from being erroneously set by the automatic update function. Moreover, the effect of preventing human error in maintenance can be expected by clarifying the fixed portion.
[0038]
The failure
[0039]
The
[0040]
The correlation
[0041]
Due to the filtering of the failure information, a failure that is not effective for maintenance of the monitored
[0042]
The failure
[0043]
The
[0044]
The
[0045]
As shown in FIG. 2, the related
[0046]
The correlation
A⇒B
Here, if a predetermined time T is given and the correlation between the fault A and the fault B is described as A⇒B, the fault A occurs at the time ta, and the fault B occurs during the interval T before and after the time ta. When, that is,
ta-T <tb <ta + T
It is assumed that when a failure B occurs at time tb that satisfies the condition, the correlation A → B is satisfied. Further, faults A and B satisfying the association rules A → B and B⇒A are defined as “there is a relationship between faults A and B”.
[0047]
The value of the rule is represented by confidence and support. The certainty factor is the ratio of the number b in which the event B has occurred to the number a in which the event A has occurred, and is calculated as b / a. The support is determined by b / N, which is the ratio of the number of data b satisfying A to B to all data N. For example, when a failure occurs as shown in FIG. 2, when the correlation rule of the failure C → the failure A is evaluated, the confidence = 1/2 = 50% and the support = 1 / = 25%. The correlation
[0048]
The result of calculating the certainty factor and the support between the faults stored in the related
[0049]
The report
[0050]
The
[0051]
The operation of storing the failure information input from the monitored
[0052]
When the failure 1 occurs at time t1 and the failure information is input from the monitored
[0053]
In order to investigate the related trouble, the past trouble information in the related
[0054]
It is compared whether or not the occurrence time of the extracted data is within the time T as the related failure (step S16). Since the occurrence time of the fault 1 is t1, the time difference from the fault 2 is within T (step S16-YES), and the fault 1 and the fault 2 are registered as related faults. The failure type A of the failure 2 is registered in the related failure type 1 of the failure 1 and the failure type C of the failure 1 is registered in the related failure log 1 of the failure 2. Since there is no more data in the related
[0055]
Next, when the failure 3 occurs at the time t3, first, similarly to the failures 1 and 2, the failure type B of the failure 3 and the occurrence time t3 are registered in the related notification log 31 (step S11). The related
[0056]
When a past failure is searched, a failure 1 of the failure type C that occurred at the time t1 is extracted (step S13). At time t1, since the time T has elapsed since time t3, the process for the failure 3 ends (step S16-NO).
[0057]
Next, when the
[0058]
With reference to FIG. 6, an operation of analyzing a rule of a correlated fault from the fault information stored in the related
[0059]
The range for analyzing the rule, that is, the range of the data of the related
[0060]
The correlation
[0061]
The failure information pointed to by the pointer is extracted from the related
[0062]
The data of the fault Ai (failure 2 in FIG. 2) is extracted, and the number ai of the fault types is incremented by one. In the fault 2 of FIG. 2, since the fault type is A, the counter for counting the number of fault types A is incremented by 1 (step S23).
[0063]
The data of the related fault Bij is extracted, and the number bij of the related fault types is incremented by one. In the fault 2 of FIG. 2, since the related fault type 1 is the fault type C, the counter of the related fault type C for the generated fault type A is incremented by 1 (step S25).
[0064]
In the fault 2 of FIG. 2, since there are up to two related faults (step S27-NO), the related fault type 2 is also counted. Since the related fault type 2 is the fault type B, the counter of the related fault type B for the generated fault type A is incremented by 1 (step S25).
[0065]
In the fault 2 of FIG. 2, since only the related fault type 2 has been registered, the processing for the fault 2 ends, and the pointer is moved to the next fault (the fault 3 in FIG. 2) (step S27-YES).
[0066]
Since the next fault (fault 3 in FIG. 2) has been registered (step S28-NO), the next fault (fault 3 in FIG. 2) is similarly counted from step S22.
[0067]
When the process proceeds to the last failure in the analysis range (
[0068]
The association rules calculated by the association
[0069]
The operation of updating the definition table based on the analyzed association rule will be described with reference to FIG. The report
[0070]
The association rule is extracted from the association rule table 32. It is assumed that the retrieved association rule is fault type A → failure type B. The notification
[0071]
It is determined whether the failure type A is registered in the notification definition table 34 in which the failure type of the failure to be reported is registered (step S32). If the failure type A is not registered in the report definition table 34, the failure of the failure type A is a failure that does not need to be reported to the
[0072]
If the fault type A is registered in the report definition table 34, the fault of the fault type A is a fault to be reported to the
[0073]
The fault type B having a correlation with the fault type A is extracted. Since it is not necessary to register the fault of the fault type B as a fault to be reported as already registered as a fault to be reported, it is confirmed that the fault has not been registered (step S34).
[0074]
First, it is confirmed that the information has not been registered in the report definition table 34. If the fault type B is registered in the report definition table 34, it is not necessary to register the fault type B, and the process proceeds to the next correlation rule determination (step S35-YES). If the failure type B is not registered in the report definition table 34, the registration status of the correlation report definition table 35 is confirmed (step S35-NO).
[0075]
If the fault type B has already been registered in the correlation report definition table 35, there is no need to register it, and the process proceeds to the next correlation rule determination (step S36-YES). If the failure type B is not registered in the correlation report definition table 35 (step S36-NO), the failure type B is registered in the correlation report definition table 35 (step S38). By registering in the correlation report definition table 35, a failure of the failure type B is reported to the
[0076]
It is necessary that both the fault type A and the fault type B having a correlation are not registered in the definition table. However, according to the method of the present invention, when the fault type A is the fault type B, the fault type B is the fault type A. Because of this configuration, both the fault type A and the fault type B are registered in the definition table (registered in either the report definition table 34 or the correlation report definition table 35).
[0077]
The above is repeated until the end of the correlation rule (step S39-NO), and when all the correlation rules are determined and completed, all the correlation rules are reflected in the correlation report definition table 35 (step S39-YES). Thus, the correlation report definition table 35 is updated.
[0078]
By referring to the correlation report definition table 35 updated with the operation of the
[0079]
The failure
[0080]
The
[0081]
Failures not registered in the report definition table 34 are sent to the correlation
[0082]
Faults of the fault type not registered in the correlation report definition table 35 are discarded because there is no need to notify the maintenance center 14 (step S46-NO).
[0083]
In this way, a failure to be reported is reported to the
[0084]
As described above, according to the monitoring manager of the present invention, a fault report condition can be automatically set, and a filter condition that can be converted to an optimum report condition along with its operation can be set. Be notified. Therefore, the load on the maintenance center can be reduced, and the maintenance time can be reduced.
[0085]
【The invention's effect】
ADVANTAGE OF THE INVENTION According to this invention, the trouble report which does not need to report the trouble report collected from a monitored apparatus to a maintenance center by a filter function can be deleted, and the trouble report apparatus which reduces the burden of a maintenance center, and A fault reporting method can be provided.
[0086]
Further, according to the present invention, it is possible to provide a failure reporting device and a failure reporting method that automatically set, instead of manually, conditions for selectively reporting a failure of a monitored device that differs for each system.
[0087]
Further, according to the present invention, it is possible to provide a failure reporting device and a failure reporting method for setting a condition for selectively reporting a failure of a monitored device without making a mistake by eliminating a condition setting by a human who tends to make a mistake.
[0088]
Further, according to the present invention, it is possible to provide a failure notification device and a failure notification method that can predict occurrence of a failure by investigating a related failure and investigate the cause, thereby shortening maintenance response time. Can be.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a fault monitoring system and a configuration of a monitoring manager according to an embodiment of the present invention.
FIG. 2 is a diagram showing a configuration of the related report log.
FIG. 3 is a diagram showing a configuration of the correlation rule table.
FIG. 4 is a diagram illustrating a time relationship of a failure occurrence for explaining a state in which failure information is accumulated in the related notification log.
FIG. 5 is a flowchart showing an operation of accumulating failure information in the related notification log.
FIG. 6 is a flowchart showing an operation of analyzing the association rule.
FIG. 7 is a flowchart showing an operation of registering in the correlation report definition table.
FIG. 8 is a flowchart showing the notification operation.
[Explanation of symbols]
11 Monitoring Manager
12 Monitored device
14 Maintenance Center
21 Failure information input section
22 Report Filter Section
23 Correlation Report Filter
24 Failure information reporting section
27 Data Formatter
28 Association Rule Analysis Unit
29 Report definition registration section
31 Related Report Log
32 Association rule table
34 Report definition table
35 Correlation Report Definition Table
Claims (14)
通報すべき前記障害情報の前記障害種別を定義する定義テーブルと、
前記定義テーブルに基づいて通報すべき前記障害情報を決定するフィルタ部と、
前記フィルタ部で決定した結果に応答して前記被監視装置を監視する保守センタに前記障害情報を通報する通報部と、
前記入力部で収集される前記障害情報に基づいて前記保守センタに通報すべき前記障害種別を抽出し、抽出した前記障害種別により前記定義テーブルを更新する登録部と
を具備し、
当該障害通報装置の稼働に伴って、前記保守センタに通報すべき前記障害情報の前記障害種別を自動的に更新する障害通報装置。An input unit configured to collect, from the monitored device, fault information including a fault type indicating a type of the fault that has occurred and an occurrence time indicating the time when the fault has occurred;
A definition table defining the fault type of the fault information to be reported;
A filter unit that determines the fault information to be reported based on the definition table,
A reporting unit that reports the failure information to a maintenance center that monitors the monitored device in response to a result determined by the filter unit;
A registration unit that extracts the failure type to be notified to the maintenance center based on the failure information collected by the input unit, and updates the definition table with the extracted failure type,
A failure reporting device that automatically updates the failure type of the failure information to be reported to the maintenance center with the operation of the failure reporting device.
前記障害情報を入力されるごとに関連通報ログに格納するデータ整形部と、
前記障害の前後に発生する関連障害の関連障害種別を前記障害の前記障害種別に対応付けた相関ルールを前記関連通報ログから抽出し、抽出した結果を相関ルールテーブルに格納する相関ルール分析部と、
前記定義テーブルと前記相関ルールテーブルとを参照して、前記保守センタに通報すべき前記障害情報の前記障害種別を前記定義テーブルに登録する通報定義登録部と
を備える
請求項1に記載の障害通報装置。The registration unit,
A data shaping unit that stores the failure information in a related report log every time the failure information is input;
A correlation rule analysis unit that extracts a correlation rule that associates a related failure type of a related failure occurring before and after the failure with the failure type of the failure from the related notification log, and stores the extracted result in a correlation rule table. ,
The failure report according to claim 1, further comprising: a report definition registration unit that registers the failure type of the failure information to be reported to the maintenance center in the definition table with reference to the definition table and the correlation rule table. apparatus.
前記第1発生時刻の前後の予め定められた時間T以内に発生した前記被監視装置の第2障害の第2障害情報は、第2障害種別を含み、
前記データ整形部は、第1障害種別と第1発生時刻と第2障害種別を対応付けて前記関連通報ログに格納する
請求項2に記載の障害通報装置。The first fault information of the first fault that has occurred in the monitored device includes a first occurrence time and a first fault type,
The second failure information of the second failure of the monitored device that has occurred within a predetermined time T before and after the first occurrence time includes a second failure type,
The failure notification device according to claim 2, wherein the data shaping unit stores the first failure type, the first occurrence time, and the second failure type in the related report log in association with each other.
請求項2または請求項3に記載の障害通報装置。4. The failure notification device according to claim 2, wherein the correlation rule analysis unit extracts the correlation rule from a predetermined number of pieces of the failure information stored in the related notification log. 5.
請求項2または請求項3に記載の障害通報装置。The correlation rule analysis unit extracts the correlation rule from the failure information of the failure that occurred within a predetermined time from the time at which the correlation rule was extracted, among the failure information stored in the related notification log. The fault notification device according to claim 2 or 3, which performs the fault notification.
前記保守センタに通報すべき前記障害種別が予め登録されている通報定義テーブルと、
前記通報定義登録部によって前記保守センタに通報すべき前記障害種別が登録される相関通報定義テーブルと
を含み、
前記フィルタ部は、
前記通報定義テーブルに登録されている前記障害種別の前記障害情報を前記通報部から前記保守センタに通報させる通報フィルタ部と、
前記相関通報定義テーブルに登録されている前記障害種別の前記障害情報を前記通報部から前記保守センタに通報させる相関通報フィルタ部と
を含む、
請求項2から請求項5のいずれかに記載の障害通報装置。The definition table is
A report definition table in which the fault types to be reported to the maintenance center are registered in advance;
A correlation report definition table in which the fault type to be reported to the maintenance center is registered by the report definition registration unit.
The filter unit includes:
A report filter unit for reporting the failure information of the failure type registered in the report definition table from the report unit to the maintenance center,
A correlation report filter unit that reports the failure information of the failure type registered in the correlation report definition table from the report unit to the maintenance center.
The fault notification device according to claim 2.
請求項6に記載の障害通報装置。The fault notification device according to claim 6, wherein the notification unit notifies the maintenance center of the fault information added with a flag indicating that the notification has been made with reference to the correlation report definition table.
通報すべき前記障害情報の前記障害種別を定義する定義テーブルに基づいて、通報すべき前記障害情報を決定するフィルタステップと、
前記フィルタステップで決定した結果に応答して前記被監視装置を監視する保守センタに前記障害情報を通報する通報ステップと、
前記入力ステップで収集される前記障害情報に基づいて前記保守センタに通報すべき前記障害情報の前記障害種別を抽出し、抽出した前記障害種別により前記定義テーブルを更新する登録ステップと
を具備し、
当該方法を用いる障害通知装置の稼働に伴って、前記保守センタに通報すべき前記障害情報の前記障害種別を自動的に更新する障害通報方法。An input step of collecting fault information including a fault type indicating the type of the fault that has occurred and an occurrence time indicating the time at which the fault has occurred from the monitored device;
Based on a definition table that defines the fault type of the fault information to be reported, a filter step of determining the fault information to be reported,
A reporting step of reporting the failure information to a maintenance center that monitors the monitored device in response to a result determined in the filtering step;
A registration step of extracting the fault type of the fault information to be notified to the maintenance center based on the fault information collected in the input step, and updating the definition table with the extracted fault type,
A failure notification method for automatically updating the failure type of the failure information to be reported to the maintenance center with the operation of the failure notification device using the method.
前記障害情報を入力されるごとに関連通報ログに格納するデータ整形ステップと、
前記障害の前後に発生する関連障害の関連障害種別を前記障害の前記障害種別に対応付けた相関ルールを前記関連通報ログから抽出し、抽出した結果を相関ルールテーブルに格納する相関ルール分析ステップと
前記定義テーブルと前記相関ルールテーブルとを参照して、前記保守センタに通報すべき前記障害情報の前記障害種別を前記定義テーブルに登録する通報定義登録ステップと
を備える
請求項8に記載の障害通報方法。The registration step includes:
A data shaping step of storing in the relevant report log each time the failure information is input;
A correlation rule analysis step of extracting, from the related notification log, a correlation rule in which a related failure type of the related failure occurring before and after the failure is associated with the failure type of the failure, and storing the extracted result in a correlation rule table; 9. The failure report according to claim 8, further comprising: a report definition registration step of referring to the definition table and the correlation rule table and registering the failure type of the failure information to be reported to the maintenance center in the definition table. Method.
前記第1発生時刻の前後の予め定められた時間T以内に発生した前記被監視装置の第2障害の第2障害情報は、第2障害種別を含み、
前記データ整形ステップは、第1障害種別と第1発生時刻と第2障害種別を対応付けて前記関連通報ログに格納する
請求項9に記載の障害通報方法。The first fault information of the first fault that has occurred in the monitored device includes a first occurrence time and a first fault type,
The second failure information of the second failure of the monitored device that has occurred within a predetermined time T before and after the first occurrence time includes a second failure type,
The failure notification method according to claim 9, wherein the data shaping step stores the first failure type, the first occurrence time, and the second failure type in the related report log in association with each other.
請求項9または請求項10に記載の障害通報方法。The failure notification method according to claim 9, wherein the correlation rule analysis step extracts the correlation rule from a predetermined number of pieces of the failure information stored in the related notification log.
請求項9または請求項10に記載の障害通報方法。The correlation rule analysis step extracts the correlation rule from the failure information of the failure that has occurred within a predetermined time from the time at which the correlation rule is extracted, among the failure information stored in the related notification log. The failure notification method according to claim 9 or 10, wherein
前記保守センタに通報すべき前記障害種別が予め登録されている通報定義テーブルと、
前記通報定義登録ステップによって前記保守センタに通報すべき前記障害種別が登録される相関通報定義テーブルと
を含み、
前記フィルタステップは、
前記通報定義テーブルに登録されている前記障害種別の前記障害情報を前記通報ステップにより前記保守センタに通報させる通報フィルタステップと、
前記相関通報定義テーブルに登録されている前記障害種別の前記障害情報を前記通報ステップにより前記保守センタに通報させる相関通報フィルタステップと
を含む、
請求項9から請求項12のいずれかに記載の障害通報方法。The definition table is
A report definition table in which the fault types to be reported to the maintenance center are registered in advance;
A correlation report definition table in which the fault types to be reported to the maintenance center are registered by the report definition registration step.
The filtering step includes:
A report filtering step of causing the maintenance center to report the failure information of the failure type registered in the report definition table by the reporting step;
A correlation report filter step of causing the maintenance center to report the failure information of the failure type registered in the correlation report definition table by the reporting step.
The failure notification method according to any one of claims 9 to 12.
請求項13に記載の障害通報方法。14. The failure reporting method according to claim 13, wherein the reporting step reports the failure information to which the flag indicating that the report was made with reference to the correlation report definition table is added to the maintenance center.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003109679A JP3902564B2 (en) | 2003-04-15 | 2003-04-15 | Fault reporting device and fault reporting method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003109679A JP3902564B2 (en) | 2003-04-15 | 2003-04-15 | Fault reporting device and fault reporting method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004320267A true JP2004320267A (en) | 2004-11-11 |
JP3902564B2 JP3902564B2 (en) | 2007-04-11 |
Family
ID=33470737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003109679A Expired - Fee Related JP3902564B2 (en) | 2003-04-15 | 2003-04-15 | Fault reporting device and fault reporting method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3902564B2 (en) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006090781A1 (en) * | 2005-02-24 | 2006-08-31 | Nec Corporation | Filtering rule analysis method and system |
JP2007080035A (en) * | 2005-09-15 | 2007-03-29 | Fujitsu Support & Service Kk | Notification method and system for fault notification |
JP2007096610A (en) * | 2005-09-28 | 2007-04-12 | Fujitsu Ltd | Monitor information acquisition device |
JP2011154491A (en) * | 2010-01-26 | 2011-08-11 | Fujitsu Ltd | Program, device, and method for managing information |
JP2011239381A (en) * | 2010-05-07 | 2011-11-24 | Lsis Co Ltd | Remote communication system and method |
JP2012089080A (en) * | 2010-10-22 | 2012-05-10 | Nec Corp | Fault analysis apparatus, fault analysis method and program |
JP2013034243A (en) * | 2012-10-26 | 2013-02-14 | Oki Electric Ind Co Ltd | Fault analysis system and fault analysis method |
JP2013201695A (en) * | 2012-03-26 | 2013-10-03 | Nec Corp | Fault severity level processing device, network management system, fault severity level estimation method, and program |
WO2015008412A1 (en) * | 2013-07-17 | 2015-01-22 | 株式会社 東芝 | Protection control system and interface device |
WO2017081985A1 (en) * | 2015-11-11 | 2017-05-18 | 日立オートモティブシステムズ株式会社 | Vehicle control device |
JP2017517060A (en) * | 2014-06-24 | 2017-06-22 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Fault processing method, related apparatus, and computer |
JP2017175423A (en) * | 2016-03-24 | 2017-09-28 | 日本電信電話株式会社 | Network monitoring device and network monitoring method |
CN113963456A (en) * | 2020-07-20 | 2022-01-21 | 核工业理化工程研究院 | Method and system for analyzing operation data of multiple high-speed rotating devices |
JP2022551007A (en) * | 2019-11-14 | 2022-12-06 | エンヴィジョン デジタル インターナショナル ピーティーイー.エルティーディー. | Method and apparatus for setting alarm rules for IoT devices, devices and storage media |
-
2003
- 2003-04-15 JP JP2003109679A patent/JP3902564B2/en not_active Expired - Fee Related
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006090781A1 (en) * | 2005-02-24 | 2006-08-31 | Nec Corporation | Filtering rule analysis method and system |
US7792775B2 (en) | 2005-02-24 | 2010-09-07 | Nec Corporation | Filtering rule analysis method and system |
JP2007080035A (en) * | 2005-09-15 | 2007-03-29 | Fujitsu Support & Service Kk | Notification method and system for fault notification |
JP4679314B2 (en) * | 2005-09-15 | 2011-04-27 | 株式会社富士通エフサス | Notification method and system for failure notification |
JP2007096610A (en) * | 2005-09-28 | 2007-04-12 | Fujitsu Ltd | Monitor information acquisition device |
JP4578371B2 (en) * | 2005-09-28 | 2010-11-10 | 富士通株式会社 | Monitoring information acquisition device |
JP2011154491A (en) * | 2010-01-26 | 2011-08-11 | Fujitsu Ltd | Program, device, and method for managing information |
JP2011239381A (en) * | 2010-05-07 | 2011-11-24 | Lsis Co Ltd | Remote communication system and method |
US8578212B2 (en) | 2010-05-07 | 2013-11-05 | Lsis Co., Ltd. | Remote communication system and method |
JP2012089080A (en) * | 2010-10-22 | 2012-05-10 | Nec Corp | Fault analysis apparatus, fault analysis method and program |
JP2013201695A (en) * | 2012-03-26 | 2013-10-03 | Nec Corp | Fault severity level processing device, network management system, fault severity level estimation method, and program |
JP2013034243A (en) * | 2012-10-26 | 2013-02-14 | Oki Electric Ind Co Ltd | Fault analysis system and fault analysis method |
WO2015008412A1 (en) * | 2013-07-17 | 2015-01-22 | 株式会社 東芝 | Protection control system and interface device |
JP2015023633A (en) * | 2013-07-17 | 2015-02-02 | 株式会社東芝 | Protection control system and interface device |
JP2017517060A (en) * | 2014-06-24 | 2017-06-22 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Fault processing method, related apparatus, and computer |
US10353763B2 (en) | 2014-06-24 | 2019-07-16 | Huawei Technologies Co., Ltd. | Fault processing method, related apparatus, and computer |
US11360842B2 (en) | 2014-06-24 | 2022-06-14 | Huawei Technologies Co., Ltd. | Fault processing method, related apparatus, and computer |
WO2017081985A1 (en) * | 2015-11-11 | 2017-05-18 | 日立オートモティブシステムズ株式会社 | Vehicle control device |
JP2017175423A (en) * | 2016-03-24 | 2017-09-28 | 日本電信電話株式会社 | Network monitoring device and network monitoring method |
JP2022551007A (en) * | 2019-11-14 | 2022-12-06 | エンヴィジョン デジタル インターナショナル ピーティーイー.エルティーディー. | Method and apparatus for setting alarm rules for IoT devices, devices and storage media |
JP7284349B2 (en) | 2019-11-14 | 2023-05-30 | エンヴィジョン デジタル インターナショナル ピーティーイー.エルティーディー. | Method and apparatus for setting alarm rules for IoT devices, devices and storage media |
US11811586B2 (en) | 2019-11-14 | 2023-11-07 | Envision Digital International Pte. Ltd. | Method and apparatus for configuring alarm rule of IoT device, device, and storage |
CN113963456A (en) * | 2020-07-20 | 2022-01-21 | 核工业理化工程研究院 | Method and system for analyzing operation data of multiple high-speed rotating devices |
Also Published As
Publication number | Publication date |
---|---|
JP3902564B2 (en) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3902564B2 (en) | Fault reporting device and fault reporting method | |
US7516368B2 (en) | Apparatus, method, and computer product for pattern detection | |
US6182022B1 (en) | Automated adaptive baselining and thresholding method and system | |
KR102141391B1 (en) | Failure data management method based on cluster estimation | |
JP4859558B2 (en) | Computer system control method and computer system | |
US20170097863A1 (en) | Detection method and information processing device | |
US20100205483A1 (en) | Operation management apparatus and method thereof | |
EP2759938A1 (en) | Operations management device, operations management method, and program | |
JP2019502191A (en) | Service call information processing method and device | |
JP4445300B2 (en) | Network failure estimation method and network failure estimation device | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
WO2007143943A1 (en) | Method, system and network device of centralized maintenance of multiple devices | |
JP7293260B2 (en) | How to analyze log patterns | |
JP7147361B2 (en) | Abnormality diagnosis program and abnormality diagnosis method | |
JPWO2011155621A1 (en) | Fault detection apparatus, fault detection method, and program recording medium | |
CN111611146B (en) | Micro-service fault prediction method and device | |
US20040205397A1 (en) | Complex system diagnostic analysis model correction method and apparatus | |
CN101989931A (en) | Operation alarm processing method and device | |
JP4585534B2 (en) | System monitoring program, system monitoring method, and system monitoring apparatus | |
CN117194142A (en) | Integrated application performance diagnosis system and method based on link tracking | |
CN101345656B (en) | global fault rate measuring method | |
JP2001331350A (en) | Maintenance management device | |
JP5746565B2 (en) | Maintenance management system, work priority calculation method and program | |
CN114328107A (en) | Monitoring method and system for optomagnetic fusion storage server cluster and electronic equipment | |
JP4575020B2 (en) | Failure analysis device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061228 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |