JP2003345628A - Method for collecting fault research material, and implementation system therefor and processing program therefor - Google Patents
Method for collecting fault research material, and implementation system therefor and processing program thereforInfo
- Publication number
- JP2003345628A JP2003345628A JP2002155899A JP2002155899A JP2003345628A JP 2003345628 A JP2003345628 A JP 2003345628A JP 2002155899 A JP2002155899 A JP 2002155899A JP 2002155899 A JP2002155899 A JP 2002155899A JP 2003345628 A JP2003345628 A JP 2003345628A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- fault
- data
- occurred
- monitored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は顧客のシステムで発
生した障害を解析する為の資料を採取する障害調査資料
採取システムに関し、特に過去に採取した資料の情報を
基に採取対象の資料を判定してその採取を行う障害調査
資料採取システムに適用して有効な技術に関するもので
ある。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a fault investigation data collection system for collecting data for analyzing a failure that has occurred in a customer's system, and in particular, to determine a data to be collected based on information of data collected in the past. The present invention relates to a technology that is effective when applied to a failure investigation data collection system that performs the collection.
【0002】[0002]
【従来の技術】従来、ハードウェアまたはソフトウェア
の不良や設定ミスによる障害解析において、マニュアル
等で対処できない場合には、カスタマサポートセンタへ
問い合わせていた。複数の計算機から出力されたログに
基づき、更に詳細な情報を得るという作業は、人手を介
して障害発生側管理者とサポートセンタ側担当者との間
で何度かやり取りする場合があり、人手と時間を要して
いた。また、詳細な情報を得る為の作業には、作業指示
書等に基づいて、保守員が作業する場合もあった。2. Description of the Related Art Conventionally, in the case of failure analysis due to a failure of hardware or software or a setting error, if it is not possible to deal with the failure manually, an inquiry is made to a customer support center. In order to obtain more detailed information based on logs output from multiple computers, there is a case where the administrator on the failure side and the person in charge of the support center exchange data manually several times. And took time. In addition, in order to obtain detailed information, a maintenance worker sometimes performs an operation based on a work instruction sheet or the like.
【0003】インターネットの普及により障害情報の入
手は容易になったものの、これらの情報は、管理者やベ
ンダのサービス担当者により時間をかけて、その適用可
否の判断を行わなければならなかった。[0003] Although the spread of the Internet has made it easier to obtain fault information, it has been necessary for managers and vendor service personnel to take time to determine the applicability of such information.
【0004】障害監視の観点では、ソフトウェア障害に
ついて、既存の障害及び対策方法を直接的、自動的に障
害と対応付けして修正版適用の迅速化や予防的な監視に
用いたり、また、インターネットの普及によるネットワ
ーク経由での障害情報や修正版の入手を容易にし、これ
らの情報を診断システムの一要素として取り入れる障害
診断システムについては特開2001-14187号公
報に記載されている。その概要は、障害監視部と障害診
断部とで構成された計算機システムにおいて、障害監視
部はハードウェア及びソフトウェアの構成情報の変更情
報と障害発生時の障害情報を障害診断部に通知する障害
通知手段を有し、障害診断部は通知された構成及び障害
情報に該当する既報告障害をデータベースから検索する
障害診断手段を有し、特定の構成変更や障害発生時に、
起こりうる可能性のある報告済障害情報の一覧を提示す
るものである。[0004] From the viewpoint of fault monitoring, for software faults, existing faults and countermeasures are directly and automatically associated with faults to be used for speeding up the application of modified versions and for proactive monitoring, and for the Internet. JP-A-2001-14187 discloses a failure diagnosis system that facilitates the acquisition of failure information and a corrected version via a network due to the spread of information and incorporates such information as an element of the diagnosis system. The outline of this is that in a computer system composed of a fault monitoring unit and a fault diagnosis unit, the fault monitoring unit notifies the fault diagnosis unit of change information of hardware and software configuration information and fault information when a fault occurs. Means, the failure diagnosis unit has a failure diagnosis means for searching a database for a reported failure corresponding to the notified configuration and failure information, and when a specific configuration change or failure occurs,
It presents a list of possible reported failure information.
【0005】[0005]
【発明が解決しようとする課題】前記従来技術では、障
害発生時に通知された構成及び障害情報に該当する既報
告障害をデータベースから検索し、特定の構成変更や障
害発生時に起こりうる可能性のある報告済障害情報の一
覧を提示することにより、障害発生時の問題分析効率を
向上させ、既存の問題である場合の修正版適用までの時
間を短縮させているが、障害発生時に通知する障害情報
としてどの様な資料を採取すべきかが明らかでない場合
には、障害発生側管理者とサポートセンタ側担当者とで
何度かやり取りして採取する資料を決定する必要があ
り、障害の原因を究明するまでに人手と時間を要してい
た。In the above-mentioned prior art, a reported failure corresponding to the configuration and failure information notified at the time of failure occurrence is searched from a database, and there is a possibility that a specific configuration change or failure may occur at the time of failure occurrence. By presenting a list of reported failure information, the efficiency of problem analysis in the event of a failure has been improved, and the time required to apply a modified version of an existing problem has been reduced. If it is not clear what kind of data should be collected, the administrator on the failure side and the person in charge of the support center need to communicate several times to determine the data to be collected, and investigate the cause of the failure. It took manpower and time to do it.
【0006】また、一箇所の不具合により多様な障害現
象が発生する場合には、観測している障害現象によって
は異なる障害に見える為、障害発生側管理者とサポート
センタ側担当者との間でやり取りを行って採取する資料
を決定する際に更に時間を要する場合がある。更に、障
害現象が同じでも不具合個所が複数推定される場合には
複数の資料を採取する必要があるが、個々の不具合箇所
に応じて一箇所づつ資料採取を行った場合には資料採取
に時間を要するという問題がある。[0006] Further, when various failure phenomena occur due to a single failure, the failures appear different depending on the failure phenomenon being observed. It may take more time to determine the data to be collected by performing the exchange. Furthermore, even if the failure phenomenon is the same, if it is estimated that there are multiple defective points, it is necessary to collect multiple data.However, if data is collected one by one according to each defective point, it takes time to collect data. There is a problem that requires.
【0007】また、顧客システム対応のサービスエンジ
ニア(SE)がハードウェア、オペレーティングシステ
ム(OS)、各種ミドルウェア全てに精通した知識を持
っていることは稀であり、それらの知識を持った他の担
当者と連絡を取り合う必要があるが、その際に発生する
連絡ミスや対応者の技術レベルの相違による人為的ミス
も作業遅延の要因であった。実際、障害発生時にマニュ
アルを見て、必要な資料を採取してから復旧作業を確
実、冷静に実施することは、経験豊富なSEでもなかな
か難しい。その為、障害発生時のエラー番号を調べ、特
定のログやダンプ等の資料を採取するまでに時間が長く
かかる場合があった。Further, it is rare that a service engineer (SE) corresponding to a customer system has knowledge of hardware, an operating system (OS), and all kinds of middleware. It is necessary to keep in touch with the workers, but mistakes in the communication that occur at that time and human errors due to differences in the technical level of the responders also caused the work delay. In fact, it is difficult even for experienced SEs to look at the manual at the time of the failure, collect necessary materials, and then perform the recovery work reliably and calmly. For this reason, it sometimes takes a long time to check the error number at the time of occurrence of a failure and to collect data such as a specific log or dump.
【0008】本発明の目的は上記問題を解決し、監視対
象の情報処理装置で発生した障害を解析する為の資料の
採取を効率的に行うことが可能な技術を提供することに
ある。It is an object of the present invention to solve the above-mentioned problem and to provide a technique capable of efficiently collecting data for analyzing a failure that has occurred in an information processing apparatus to be monitored.
【0009】[0009]
【課題を解決するための手段】本発明は、顧客のシステ
ムで発生した障害を解析する為の資料を採取する障害調
査資料採取システムにおいて、過去に発生した障害の事
例を基に採取対象の資料を判定して資料採取を行うもの
である。According to the present invention, there is provided a fault investigation data collection system for collecting data for analyzing a failure that has occurred in a customer system. Is determined and data is collected.
【0010】本発明の障害調査資料採取システムでは、
監視対象の情報処理装置である監視対象システムで障害
の発生が検知されると、その発生した障害を識別する為
の識別情報であるエラー番号を含む障害情報を、障害管
理を行う情報処理装置である障害管理システムへネット
ワーク経由で送信し、障害管理システムでは前記送信さ
れた障害情報を受信する。[0010] In the trouble investigation data collection system of the present invention,
When the occurrence of a failure is detected in the monitored system, which is the information processing device to be monitored, failure information including an error number, which is identification information for identifying the occurred failure, is transmitted to the information processing device that performs failure management. The information is transmitted to a certain fault management system via a network, and the fault management system receives the transmitted fault information.
【0011】次に障害管理システムでは、管理対象の複
数の監視対象システムで過去に発生した障害とその際に
採取した資料を示す事例データベースを参照し、前記受
信した障害情報中のエラー番号と一致するレコード中の
資料番号を読み出して、その障害を解析する為に必要な
資料を前記事例データベース中から選択する。そして前
記選択された資料の資料番号を監視対象システムへ送信
し、その資料の採取を監視対象システムに要求する。Next, the fault management system refers to a case database showing faults that have occurred in the past in a plurality of managed systems to be managed and data collected at that time, and matches with the error number in the received fault information. The material number in the record to be read is read out, and the material necessary for analyzing the failure is selected from the case database. Then, it transmits the material number of the selected material to the monitored system, and requests the monitored system to collect the material.
【0012】監視対象システムでは、各資料を採取する
為のコマンドを示す資料採取コマンドテーブルを参照
し、前記送信された資料番号に対応するコマンドを前記
資料採取コマンドテーブルから読み出して実行した後、
そのコマンドにより採取された資料を障害管理システム
へ送信する。In the monitored system, a command corresponding to the transmitted material number is read from the material collection command table and executed by referring to a material collection command table indicating a command for collecting each material.
The data collected by the command is transmitted to the fault management system.
【0013】前記の様に本発明では、ある監視対象シス
テムで障害が発生した場合に、他の監視対象システムで
過去に発生した障害とその際に採取した資料を示す事例
データベースを用いて、新たに発生した障害を解析する
為の資料を決定して資料採取を行うので、従来の原因究
明の際に資料採取までに要していた時間を短縮すること
ができる。As described above, according to the present invention, when a failure occurs in a certain monitored system, a new database is created by using a case database showing the failures that have occurred in the past in another monitored system and the data collected at that time. Since the data for analyzing the failure that has occurred is determined and the data is collected, it is possible to shorten the time required for collecting the data in the conventional investigation of the cause.
【0014】以上の様に本発明の障害調査資料採取シス
テムによれば、過去に発生した障害の事例を基に採取対
象の資料を判定して資料採取を行うので、監視対象の情
報処理装置で発生した障害を解析する為の資料の採取を
効率的に行うことが可能である。As described above, according to the fault investigation data collection system of the present invention, the data to be collected is determined based on the case of the fault that occurred in the past, and the data is collected. It is possible to efficiently collect data for analyzing the failure that has occurred.
【0015】[0015]
【発明の実施の形態】以下に監視対象システムで発生し
た障害を解析する為の資料を採取する一実施形態の障害
調査資料採取システムについて説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A failure investigation data collection system according to an embodiment for collecting data for analyzing a failure that has occurred in a monitored system will be described below.
【0016】図1は本実施形態の障害調査資料採取シス
テムの概略構成を示す図である。図1に示す様に本実施
形態の監視対象システム100は、障害履歴102と、
契約情報103と、資料採取コマンドテーブル106と
を有している。FIG. 1 is a diagram showing a schematic configuration of a fault investigation data collection system according to this embodiment. As shown in FIG. 1, the monitoring target system 100 of the present embodiment includes a failure history 102,
It has contract information 103 and a data collection command table 106.
【0017】障害履歴102は、監視対象システム10
0で発生した障害の履歴を示す情報である。契約情報1
03は、監視対象システム100と障害管理システム1
10との間で結ばれている障害管理契約の内容を識別す
る為の契約番号を示す情報である。資料採取コマンドテ
ーブル106は、障害の原因追求に必要な資料を採取す
る資料採取コマンドを選択する為の情報を格納したテー
ブルである。また監視対象システム100は、障害検知
部101と、障害通知部104と、資料採取部105と
を有している。The failure history 102 is stored in the monitored system 10
This is information indicating the history of failures that have occurred at 0. Contract information 1
03 is the monitoring target system 100 and the fault management system 1
This is information indicating a contract number for identifying the content of the fault management contract concluded with the ten. The data collection command table 106 is a table in which information for selecting a data collection command for collecting data required for pursuing the cause of the failure is stored. Further, the monitoring target system 100 includes a failure detection unit 101, a failure notification unit 104, and a data collection unit 105.
【0018】障害検知部101は、監視対象システム1
00で発生した障害を検知する処理部である。障害通知
部104は、障害検知部101で障害が検知された場合
にその障害を識別する為の識別情報であるエラー番号を
障害管理システム110へ通知する処理部である。資料
採取部105は、前記検知された障害の原因追求に必要
な資料を採取する処理部である。The failure detection unit 101 is a monitoring target system 1
This is a processing unit that detects a failure that has occurred in 00. The failure notification unit 104 is a processing unit that, when a failure is detected by the failure detection unit 101, notifies the failure management system 110 of an error number that is identification information for identifying the failure. The data collection unit 105 is a processing unit that collects data necessary for pursuing the cause of the detected failure.
【0019】監視対象システム100を障害検知部10
1、障害通知部104及び資料採取部105として機能
させる為のプログラムは、CD−ROM等の記録媒体に
記録され磁気ディスク等に格納された後、メモリにロー
ドされて実行されるものとする。なお前記プログラムを
記録する記録媒体はCD−ROM以外の他の記録媒体で
も良い。また前記プログラムを当該記録媒体から情報処
理装置にインストールして使用しても良いし、ネットワ
ークを通じて当該記録媒体にアクセスして前記プログラ
ムを使用するものとしても良い。The monitoring target system 100 is connected to the fault detecting unit 10.
1. A program for functioning as the failure notification unit 104 and the data collection unit 105 is recorded on a recording medium such as a CD-ROM, stored on a magnetic disk or the like, and then loaded into a memory and executed. The recording medium for recording the program may be a recording medium other than the CD-ROM. Further, the program may be installed from the recording medium to the information processing apparatus and used, or the recording medium may be accessed through a network to use the program.
【0020】障害管理システム110は、契約データベ
ース113と、事例データベース114とを有してい
る。The fault management system 110 has a contract database 113 and a case database 114.
【0021】契約データベース113は、各監視対象シ
ステムと障害管理システム110との間で結ばれている
障害管理契約の内容を表す情報を保持するデータベース
である。事例データベース114は、各監視対象システ
ムでこれまでに発生した障害の事例を示す情報を保持す
るデータベースである。また障害管理システム110
は、障害受信部111と、障害診断部112と、資料要
求部115とを有している。The contract database 113 is a database that holds information indicating the contents of a fault management contract between each monitored system and the fault management system 110. The case database 114 is a database that holds information indicating a case of a failure that has occurred in each monitored system so far. Also, the fault management system 110
Has a fault receiving unit 111, a fault diagnosing unit 112, and a material requesting unit 115.
【0022】障害受信部111は、発生した障害を識別
する為のエラー番号を含む障害情報を監視対象システム
100から受信する処理部である。障害診断部112
は、障害受信部111から障害情報を受け取り、事例デ
ータベース114及び契約データベース113にアクセ
スして必要な資料を選択する処理部である。資料要求部
115は、障害診断部112で選択された資料の送信を
監視対象システム100に要求する処理部である。The fault receiving unit 111 is a processing unit that receives fault information including an error number for identifying a fault that has occurred from the monitored system 100. Fault diagnosis unit 112
Is a processing unit that receives failure information from the failure receiving unit 111, accesses the case database 114 and the contract database 113, and selects necessary materials. The data requesting unit 115 is a processing unit that requests the monitored system 100 to transmit the data selected by the failure diagnosis unit 112.
【0023】障害管理システム110を障害受信部11
1、障害診断部112及び資料要求部115として機能
させる為のプログラムは、CD−ROM等の記録媒体に
記録され磁気ディスク等に格納された後、メモリにロー
ドされて実行されるものとする。なお前記プログラムを
記録する記録媒体はCD−ROM以外の他の記録媒体で
も良い。また前記プログラムを当該記録媒体から情報処
理装置にインストールして使用しても良いし、ネットワ
ークを通じて当該記録媒体にアクセスして前記プログラ
ムを使用するものとしても良い。The fault management system 110 is connected to the fault receiving unit 11
1. A program for functioning as the failure diagnosis unit 112 and the data requesting unit 115 is recorded on a recording medium such as a CD-ROM, stored on a magnetic disk or the like, and then loaded into a memory and executed. The recording medium for recording the program may be a recording medium other than the CD-ROM. Further, the program may be installed from the recording medium to the information processing apparatus and used, or the recording medium may be accessed through a network to use the program.
【0024】本実施形態の障害調査資料採取システム
は、監視対象システム100とそれをネットワーク10
7で結ぶ障害管理システム110で実現されており、障
害管理システム110はネットワーク107経由で複数
の監視対象システムの障害監視を行うものとする。また
本実施形態では、障害検知部101を監視対象システム
100に置いているが、障害管理システム110に設置
しても良い。The fault investigation data collection system according to the present embodiment includes a monitoring target system 100 and a network 10
7 is realized by the fault management system 110. The fault management system 110 monitors faults of a plurality of monitored systems via the network 107. In this embodiment, the failure detection unit 101 is provided in the monitoring target system 100, but may be provided in the failure management system 110.
【0025】図2は本実施形態の障害調査資料採取シス
テムの全体の処理手順を示すフローチャートである。図
2に示す様に本実施形態の障害調査資料採取システムで
は、監視対象システム100で障害が検知された場合
に、過去に発生した障害の事例を示す事例データベース
114を障害管理システム110で参照し、検索された
資料番号を監視対象システム100に通知して資料採取
を行う。FIG. 2 is a flowchart showing the overall processing procedure of the fault investigation data collection system of the present embodiment. As shown in FIG. 2, in the fault investigation data collection system according to the present embodiment, when a fault is detected in the monitored system 100, the fault management system 110 refers to a case database 114 indicating a case of a fault that has occurred in the past. Then, the retrieved material number is notified to the monitored system 100 to collect the material.
【0026】図3は本実施形態の監視対象システム10
0側での障害履歴検索処理の処理手順を示すフローチャ
ートである。図3に示す様に本実施形態の障害調査資料
採取システムでは、監視対象システム100で発生した
障害が障害履歴102中に保持されている障害と一致し
ているかどうを検索し、一致している場合には、その障
害の際に採取した資料と同じ資料を再発時の資料として
採取する処理を行う。FIG. 3 shows a monitoring target system 10 according to this embodiment.
11 is a flowchart illustrating a procedure of a failure history search process on the 0 side. As shown in FIG. 3, in the fault investigation data collection system of the present embodiment, it is searched whether or not a fault that has occurred in the monitoring target system 100 matches the fault held in the fault history 102, and matches. In this case, the same data as the data collected at the time of the failure is collected as the data at the time of recurrence.
【0027】図4は本実施形態の図2のステップ203
の契約チェック処理の処理手順を示すフローチャートで
ある。図4に示す様に本実施形態の障害調査資料採取シ
ステムでは、監視対象システム100から障害情報を受
け付けた際に、その監視対象システム100との間のサ
ポート契約が有効であるかをチェックする処理を行う。FIG. 4 shows step 203 of FIG. 2 of the present embodiment.
It is a flowchart which shows the processing procedure of the contract check processing of FIG. As shown in FIG. 4, in the failure investigation data collection system according to the present embodiment, when failure information is received from the monitored system 100, a process for checking whether a support contract with the monitored system 100 is valid. I do.
【0028】図5は本実施形態の図3のステップ306
の再発時資料採取処理の処理手順を示すフローチャート
である。図5に示す様に本実施形態の障害調査資料採取
システムでは、資料採取コマンドテーブル106から該
当する資料採取コマンドを取得して実行し、障害再発時
の資料採取を行う。FIG. 5 shows step 306 in FIG. 3 of this embodiment.
It is a flowchart which shows the processing procedure of the material collection process at the time of recurrence. As shown in FIG. 5, in the failure investigation data collection system of the present embodiment, a corresponding data collection command is acquired from the data collection command table 106 and executed, and data is collected when a failure occurs again.
【0029】図6は本実施形態の図2のステップ212
のサポート担当者への割当て処理の処理手順を示すフロ
ーチャートである。図6に示す様に本実施形態の障害調
査資料採取システムでは、監視対象システム100で発
生する各障害の担当者への連絡先を示す担当者テーブル
を参照し、監視対象システム100から受信した障害情
報中のエラー番号で識別される障害の発生要因に応じ
て、異なるサポート担当者へ障害が発生したことを連絡
する。FIG. 6 shows step 212 of FIG. 2 of this embodiment.
It is a flowchart which shows the processing procedure of the assignment process to a support person. As shown in FIG. 6, in the failure investigation data collection system of the present embodiment, the failure table received from the monitored According to the cause of the failure identified by the error number in the information, notify the different support personnel that the failure has occurred.
【0030】図7は本実施形態の監視対象システム10
0の障害履歴102のデータ構造例を示す図である。図
7の様にエラー番号701には監視対象システム100
で発生した障害を識別する為の番号が登録され、発生日
702にはその障害が発生した最近の日付が登録され、
発生回数累計値703にはその障害が発生した回数がカ
ウントされる。また資料番号704は、その障害の原因
調査に必要な資料を表わすユニークな番号である。FIG. 7 shows a monitoring target system 10 according to this embodiment.
FIG. 3 is a diagram illustrating an example of a data structure of a failure history of 0. As shown in FIG. 7, the error number 701 includes the monitored system 100
A number for identifying the failure that has occurred in is registered, and the latest date when the failure occurred is registered in the occurrence date 702.
The cumulative number of occurrences 703 counts the number of times the failure has occurred. The material number 704 is a unique number representing a material necessary for investigating the cause of the failure.
【0031】図8は本実施形態の監視対象システム10
0の契約情報103のデータ構造例を示す図である。図
8の様に契約番号801は、サポート契約を行った場合
に発行されるユニークな番号であり、契約時にサポート
担当者によって登録される。本実施形態のサポート契約
では、ハードウェア、OS、ミドルウェア等を含めて1
つの契約番号で管理されるものとする。FIG. 8 shows a monitoring target system 10 according to this embodiment.
It is a figure showing the example of data structure of contract information 103 of 0. As shown in FIG. 8, a contract number 801 is a unique number issued when a support contract is made, and is registered by a support person at the time of contract. In the support contract of the present embodiment, one contract includes hardware, OS, middleware, and the like.
It shall be managed by one contract number.
【0032】図9は本実施形態の資料採取コマンドテー
ブルの一例を示す図である。図9の様に資料番号901
は、資料毎に採番されるユニークな番号である。資料名
902に示される資料は、対応する資料採取コマンド9
03の実行により採取される。FIG. 9 is a diagram showing an example of a data collection command table according to this embodiment. Document number 901 as shown in FIG.
Is a unique number assigned to each material. The material indicated by the material name 902 is the corresponding material collection command 9
03 is collected.
【0033】図10は本実施形態の契約データベース1
13の一例を示す図である。図10の様に契約番号10
01は、システム毎に発行されるユニークな番号であ
り、契約終了日1002は契約の有効期限を示してい
る。また製品名1003、ソフトウェアのバージョン1
004及びハードウェア情報1007は、契約されてい
る製品を示しており、顧客名1005及び顧客連絡先1
006の顧客情報は、全て契約時にサポート担当者によ
って登録される。FIG. 10 shows the contract database 1 of the present embodiment.
FIG. 13 is a diagram illustrating an example of a thirteenth embodiment. Contract number 10 as shown in FIG.
01 is a unique number issued for each system, and the contract end date 1002 indicates the expiration date of the contract. Product name 1003, software version 1
004 and hardware information 1007 indicate a contracted product, and include a customer name 1005 and customer contact information 1
All customer information 006 is registered by a support person at the time of contract.
【0034】図11は本実施形態の事例データベース1
14の受付テーブルの一例を示す図である。図11の受
付番号1101は、障害案件の受付け時に発行されるユ
ニークな番号であり、エラー番号1102は発生した障
害を識別する為の識別情報である。FIG. 11 shows a case database 1 of this embodiment.
It is a figure showing an example of 14 reception tables. The reception number 1101 in FIG. 11 is a unique number issued when a failure case is received, and the error number 1102 is identification information for identifying a failure that has occurred.
【0035】ステータス1103は、受付けた案件の状
態を示し、サポート担当者によって入力される。その
為、サポート担当者によって入力されるまで空欄であ
る。受付日1104は、その障害案件を受付けた年月日
を示す。The status 1103 indicates the status of the received case, and is input by a support person. Therefore, it is blank until input by the support person. The reception date 1104 indicates the date when the failure case was received.
【0036】サポート担当者1105は、その障害案件
を担当するサポート担当者名または担当者を識別する為
の番号を示しており、契約番号1106には、障害の発
生した監視対象システム100の契約番号1001が格
納される。The support person 1105 indicates the name of the support person in charge of the trouble case or the number for identifying the person in charge. The contract number 1106 is the contract number of the monitored system 100 in which the trouble has occurred. 1001 is stored.
【0037】図12は本実施形態の事例データベース1
14の資料テーブルの一例を示す図である。図12に示
す様にエラー番号1201は、障害を識別する為の識別
情報であり、図11のエラー番号1102に格納されて
いる番号が設定される。発生要因1202は、エラー番
号1201で識別される障害が発生する要因を示してお
り、資料番号1203は、エラー番号1201の障害が
発生した場合にその障害を解析する為に必要な資料の識
別番号を示している。FIG. 12 shows a case database 1 of this embodiment.
It is a figure showing an example of 14 material tables. As shown in FIG. 12, the error number 1201 is identification information for identifying a failure, and the number stored in the error number 1102 in FIG. 11 is set. The occurrence factor 1202 indicates the cause of the failure identified by the error number 1201, and the material number 1203 indicates the identification number of the material required to analyze the failure when the failure of the error number 1201 occurs Is shown.
【0038】この事例データベース114の資料テーブ
ルに格納される発生要因1202や資料番号1203
は、本実施形態の障害調査資料採取システムにおける複
数の監視対象システム100で、エラー番号1201で
識別される障害が初めて発生した際にサポート担当者に
よって設定されるものとし、以後、エラー番号1201
が同一である障害が発生した場合には、この資料テーブ
ルを参照することにより、資料番号1203で識別され
る資料の採取を直ちに行うことができる。The occurrence factors 1202 and material numbers 1203 stored in the material table of the case database 114
Is set by a support person when a failure identified by the error number 1201 occurs for the first time in a plurality of monitored systems 100 in the failure investigation data collection system of the present embodiment.
In the case where a failure occurs, the data identified by the data number 1203 can be immediately collected by referring to the data table.
【0039】また、一箇所の不具合により多様な障害現
象が発生する場合には、それぞれの障害現象に対応する
複数のエラー番号1201に対して同一の資料番号12
03を設定しておくことにより、多様な障害現象に惑わ
されること無く適切な資料採取を行うことができる。更
に、障害現象が同じでも不具合個所が複数推定される場
合には同一のエラー番号1201に対して複数の資料番
号1203を設定しておくことにより、複数の不具合箇
所に対応した資料をまとめて採取することが可能であ
る。When a variety of failure phenomena occur due to a single failure, the same reference number 12 is used for a plurality of error numbers 1201 corresponding to the respective failure phenomena.
By setting 03, appropriate data collection can be performed without being misled by various failure phenomena. Further, when a plurality of trouble locations are estimated even if the failure phenomenon is the same, a plurality of data numbers 1203 are set for the same error number 1201 to collect materials corresponding to the plurality of trouble locations at once. It is possible to
【0040】図13は本実施形態の担当者テーブルの一
例を示す図である。図13の様にエラー番号1301
は、発生した障害を識別する為の識別情報であり、図1
1のエラー番号1102や図12のエラー番号1201
と対応するものである。担当部署1302は、障害の発
生した製品毎や機能毎に分けられた担当の部署名を示し
ており、代表連絡先1303は、担当部署1302に属
する代表担当者への連絡先として、その電子メールアド
レス等を示している。FIG. 13 is a diagram showing an example of the person in charge table according to the present embodiment. Error number 1301 as shown in FIG.
Is identification information for identifying a fault that has occurred.
1 and error number 1201 in FIG.
It corresponds to The department in charge 1302 indicates the department name of the department in charge for each product or function in which a failure has occurred, and the representative contact 1303 is an e-mail as a contact to the representative person in charge belonging to the department in charge 1302. An address or the like is shown.
【0041】図14は本実施形態の事例データベース1
14の受付資料テーブルの一例を示す図である。図14
の様に受付番号1401は、障害案件の受付け時に発行
されるユニークな番号であり、対応する図11の受付番
号1101の値が格納される。資料番号1402は、発
生した障害を解析する為に必要な資料の識別番号を示し
ており、対応する図12の資料番号1203の値が格納
される。資料ファイル1403は、実際に採取された資
料を示すファイル名であり、採取日1404はその資料
が採取された日を示す。FIG. 14 shows a case database 1 according to this embodiment.
It is a figure showing an example of 14 reception materials tables. FIG.
As described above, the reception number 1401 is a unique number issued when a failure case is received, and stores the corresponding value of the reception number 1101 in FIG. The material number 1402 indicates the identification number of the material necessary for analyzing the failure that has occurred, and the corresponding value of the material number 1203 in FIG. 12 is stored. The material file 1403 is a file name indicating the material actually collected, and the collection date 1404 indicates the date when the material was collected.
【0042】図15は本実施形態の図2のステップ21
1の新規資料採取処理の処理手順を示すフローチャート
である。図15に示す様に本実施形態の障害調査資料採
取システムでは、資料採取コマンドテーブル106から
該当する資料採取コマンドを取得して実行し、その監視
対象システム100で初めて発生した障害の資料採取を
行う。FIG. 15 is a flowchart showing the operation of step 21 in FIG.
9 is a flowchart illustrating a processing procedure of a first new material collection process. As shown in FIG. 15, in the failure investigation data collection system of the present embodiment, a relevant data collection command is obtained from the data collection command table 106 and executed, and data of a failure that has occurred for the first time in the monitored system 100 is collected. .
【0043】次に、本実施形態の障害調査資料採取シス
テムにおいて、監視対象システム100での障害検知か
らその障害の資料採取までの全体の処理について図2を
参照して説明する。ステップ200で監視対象システム
100の障害検知部101は、監視対象システム100
で障害の発生状況を監視し、障害の発生を検知するとそ
の障害を識別する為のエラー番号を障害情報として出力
する。Next, the entire process from the detection of a fault in the monitored system 100 to the collection of the fault data in the fault investigation data collection system of the present embodiment will be described with reference to FIG. In step 200, the failure detection unit 101 of the monitored system 100
Monitor the failure occurrence status, and when the failure is detected, output an error number for identifying the failure as failure information.
【0044】ステップ201では、監視対象システム1
00で過去に発生した障害の履歴を示す障害履歴102
を参照して前記エラー番号に該当するレコードを検索
し、前記発生した障害が障害履歴102中に保持されて
いる障害と一致している場合には、その障害発生時に採
取した資料を採取して前記障害情報に付加し、資料採取
済フラグをONに設定する。In step 201, the monitoring target system 1
A failure history 102 indicating the history of failures that occurred in the past at 00
And retrieves the record corresponding to the error number. If the error that has occurred matches the error held in the error history 102, collect the data collected when the error occurred. The data collection completion flag is set to ON in addition to the failure information.
【0045】本実施形態において、障害情報とは、ステ
ップ200で検知したエラー番号と、ステップ201の
処理、すなわち後述する図3のステップ306の再発時
資料採取処理、若しくはステップ211で説明する新規
資料採取処理にて得られる資料を含む情報であるものと
する。また本実施形態では、前記障害履歴検索処理を監
視対象システム100側の障害履歴102により行って
いるが、障害管理システム110側の事例データベース
114を利用して行っても良い。In the present embodiment, the failure information includes the error number detected in step 200 and the processing in step 201, ie, the recollection data collection processing in step 306 in FIG. It is assumed that the information includes information obtained in the collection process. Further, in the present embodiment, the failure history search processing is performed using the failure history 102 on the monitoring target system 100 side, but may be performed using the case database 114 on the failure management system 110 side.
【0046】ステップ202では、図8の契約情報10
3から契約番号801を読み出して前記障害情報に付加
し、その障害情報を障害管理システム110の障害受信
部111へ通知する。In step 202, the contract information 10 shown in FIG.
3 and adds the contract number 801 to the failure information, and notifies the failure information to the failure receiving unit 111 of the failure management system 110.
【0047】ステップ203で障害管理システム110
の障害診断部112は、障害受信部111から情報を受
け取り、契約データベース113にアクセスして契約確
認を行う。In step 203, the fault management system 110
The failure diagnosis unit 112 receives the information from the failure reception unit 111, accesses the contract database 113, and confirms the contract.
【0048】ステップ204では、資料採取済フラグが
ONであるかどうかを調べ、ONである場合には、必要
な資料が全て採取されているものとしてステップ213
へ進み、事例更新処理を行う。この事例更新処理では、
エラー番号と契約番号を基に図11の事例データベース
114の受付けテーブルの受付日1104の更新及び図
14の事例データベース114の受付け資料テーブルの
登録を行う。In step 204, it is checked whether or not the data collection completed flag is ON. If it is ON, it is determined that all necessary data has been collected in step 213.
Then, the case update process is performed. In this case update process,
Based on the error number and the contract number, the receiving date 1104 of the receiving table of the case database 114 of FIG. 11 is updated and the receiving material table of the case database 114 of FIG. 14 is registered.
【0049】一方、ステップ204で資料採取済フラグ
がONでなければステップ205へ進み、障害診断部1
12は、エラー番号を基に事例データベース114の受
付けテーブルを検索する。On the other hand, if the data collection completion flag is not ON in step 204, the process proceeds to step 205, where the failure diagnosis unit 1
12 searches the reception table of the case database 114 based on the error number.
【0050】ステップ206では、事例データベース1
14中に前記エラー番号に合致するものがあるかどうか
を調べ、合致例が無ければ、合致例無しとしてステップ
212へ進み、図11の事例データベース114の受付
けテーブルの新規登録処理を行った後、ステップ214
では、サポート担当者への割当て処理を行う。ここで受
付けテーブルの初期ステータスとサポート担当者の欄へ
はサポート担当者から入力された情報を格納する。In step 206, the case database 1
It is checked whether or not any of the error numbers 14 matches the error number. If there is no matching example, the process proceeds to step 212 as there is no matching example, and a new registration process of the receiving table of the case database 114 in FIG. 11 is performed. Step 214
Then, the assignment process to the support staff is performed. Here, information input from the support staff is stored in the columns of the initial status and the support staff in the reception table.
【0051】一方、ステップ206で合致例がある場合
にはステップ207へ進み、契約番号とエラー番号を検
索キーとして図11の事例データベース114の受付け
テーブルを検索することで、同一システムでの事例であ
るかどうかを判定する。On the other hand, if there is a matching example in step 206, the process proceeds to step 207, where the receiving table of the case database 114 in FIG. Determine if there is.
【0052】ステップ207で判定した結果、同一シス
テムでの同一事例であれば現象再発としてステップ21
3へ進み、図11の事例データベース114の受付けテ
ーブルの受付日1104の更新を行う。一方、ステップ
207で本事例が当該システムでの新規の事例であると
判定された場合にはステップ208へ進み、図11の事
例データベース114の受付けテーブルへの新規登録を
行う。As a result of the judgment in step 207, if the same case occurs in the same system, it is determined that the phenomenon has occurred again in step 21.
Then, the process proceeds to step 3 to update the reception date 1104 in the reception table of the case database 114 in FIG. On the other hand, if it is determined in step 207 that this case is a new case in the system, the process proceeds to step 208, and new registration is performed in the reception table of the case database 114 in FIG.
【0053】次にステップ209では、図12の事例デ
ータベース114の資料テーブルを検索することによ
り、エラー番号1201に対応する資料番号1203の
資料が採取できているかを判定し、その資料が採取され
ている場合には追加資料は必要ないものとしてステップ
213で事例更新処理を行う。Next, in step 209, it is determined whether or not the material of the material number 1203 corresponding to the error number 1201 has been collected by searching the material table of the case database 114 of FIG. 12, and the material is collected. If so, the case update processing is performed in step 213 assuming that no additional material is necessary.
【0054】一方ステップ209の処理で、エラー番号
1201に対応する資料番号1203の資料が採取され
ていない場合には追加資料が必要であるものとして判定
してステップ210へ進み、資料要求部115から監視
対象システム100の資料採取部105へエラー番号1
201と資料番号1203を通知する。On the other hand, if it is determined in step 209 that the material with the material number 1203 corresponding to the error number 1201 has not been collected, it is determined that additional material is necessary, and the process proceeds to step 210. Error number 1 to the data collection unit 105 of the monitored system 100
201 and the document number 1203 are notified.
【0055】次にステップ211で監視対象システム1
00は、図15に後述する新規資料採取手順を実行し、
資料採取後、ステップ202の処理以降を行う。そし
て、採取資料の調査をサポート担当者により行う。Next, at step 211, the monitored system 1
00 executes a new data collection procedure described later with reference to FIG.
After collecting the data, the processing after step 202 is performed. Then, the support person investigates the collected data.
【0056】次に、本実施形態の障害調査資料採取シス
テムにおける監視対象システム100側での障害履歴検
索処理について図3を参照して説明する。ステップ30
1では、ステップ200で検知したエラー番号を基に監
視対象システム100の障害履歴102を検索し、ステ
ップ302では、当該システムの障害履歴102での合
致例の有無を判別する。Next, a failure history search process on the monitoring target system 100 side in the failure investigation material collection system of the present embodiment will be described with reference to FIG. Step 30
In step 1, the failure history 102 of the monitoring target system 100 is searched based on the error number detected in step 200, and in step 302, the presence or absence of a matching example in the failure history 102 of the system is determined.
【0057】ステップ302での判別の結果、当該シス
テムの障害履歴102に合致例が有る場合にはステップ
303へ進み、現象の再発として、その合致例のエラー
番号701に該当する発生日702を更新する。そして
ステップ304では、発生回数累計値703に「1」を
足した後、ステップ305では、そのエラー番号701
に対応する資料番号704を取得し、ステップ306で
は、再発時資料採取手順を実行する。一方、ステップ3
02での判別の結果、合致例が無ければステップ307
へ進み、図7の障害履歴102へ、エラー番号701、
発生日702、発生回数累計値703の新規登録を行
う。As a result of the determination in step 302, if there is a matching example in the failure history 102 of the system, the process proceeds to step 303, and as a recurrence of the phenomenon, the occurrence date 702 corresponding to the error number 701 of the matching example is updated. I do. Then, in step 304, “1” is added to the total number of occurrences 703, and then in step 305, the error number 701 is added.
In step 306, a recurring data collection procedure is executed. Step 3
If the result of determination in step 02 is that there is no matching example, step 307
Then, the error number 701,
A new registration of the occurrence date 702 and the total number of occurrences 703 is performed.
【0058】次に、本実施形態の障害調査資料採取シス
テムにおけるステップ203の契約チェック処理につい
て図4を参照して説明する。ステップ401では、契約
番号を基に契約データベース113を検索し、ステップ
402では、契約が有効であるかどうかを判別する。契
約が有効か判別する際には、図10に示す契約番号10
01に対応する契約終了日1002を用いて判別を行
う。ステップ402で判別した結果、契約が無効である
場合にはステップ403へ進み、図10の顧客連絡先1
006の顧客へ、契約切れ、契約外である旨を通知す
る。また、契約が有効である場合には、契約判定処理を
終了する。Next, the contract check processing of step 203 in the failure investigation data collection system of the present embodiment will be described with reference to FIG. In step 401, the contract database 113 is searched based on the contract number, and in step 402, it is determined whether the contract is valid. When determining whether the contract is valid, the contract number 10 shown in FIG.
The determination is made using the contract end date 1002 corresponding to 01. If the result of the determination in step 402 is that the contract is invalid, the process proceeds to step 403, where the customer contact 1 in FIG.
The customer 006 is notified that the contract has expired or is out of contract. If the contract is valid, the contract determination processing ends.
【0059】次に、本実施形態の障害調査資料採取シス
テムにおけるステップ211の新規資料採取処理につい
て図15を参照して説明する。ステップ211の新規資
料採取処理の場合にはステップ1501に進み、通知さ
れた資料番号1203を基に、図9に示す資料採取コマ
ンドテーブル106から該当する資料採取コマンド90
3を選択し、ステップ1502では、前記選択されたコ
マンドを実行した後、ステップ1503では、前記コマ
ンドの実行により出力されたデータを採取/格納し、ス
テップ1504では、その採取日時を記録する。そして
ステップ1505では、エラー番号を基に、図7の監視
対象システム100側の障害履歴102に資料番号70
4を追加し、ステップ1506では、資料採取済フラグ
をONにして新規資料採取処理を終了する。Next, a description will be given, with reference to FIG. 15, of a new data collection process in step 211 in the fault investigation data collection system of the present embodiment. In the case of the new material collection process of step 211, the process proceeds to step 1501, and based on the notified material number 1203, the corresponding material collection command 90 from the material collection command table 106 shown in FIG.
3 is selected, and in step 1502, the selected command is executed. In step 1503, data output by executing the command is collected / stored. In step 1504, the date and time of the collection are recorded. In step 1505, based on the error number, the material number 70 is stored in the failure history 102 of the monitored system 100 shown in FIG.
In step 1506, the data collection completed flag is turned ON, and the new data collection process is terminated.
【0060】次に、本実施形態の障害調査資料採取シス
テムにおけるステップ306の再発時資料採取処理につ
いて図5を参照して説明する。ステップ306の再発時
資料採取処理の場合にはステップ501へ進み、図7の
監視対象システム100側の障害履歴102の資料番号
704を基に、図9に示す資料採取コマンドテーブル1
06から該当する資料採取コマンド903を選択し、ス
テップ502では、前記選択されたコマンドを実行した
後、ステップ503では、前記コマンドの実行により出
力されたデータを採取/格納し、ステップ504では、
その採取日時を記録する。またステップ505では、資
料採取済フラグをONにして再発時資料採取処理を終了
する。Next, a description will be given, with reference to FIG. 5, of the data collection processing at the time of recurrence in step 306 in the failure investigation data collection system of the present embodiment. In the case of the data collection process at the time of recurrence in step 306, the process proceeds to step 501, and based on the material number 704 of the failure history 102 on the monitored system 100 side in FIG. 7, the data collection command table 1 shown in FIG.
06, the corresponding material collection command 903 is selected, and in step 502, the selected command is executed. In step 503, data output by execution of the command is collected / stored. In step 504,
Record the date and time of collection. In step 505, the data collection completion flag is turned ON, and the data collection process at the time of recurrence is terminated.
【0061】図5及び図15の各処理において、資料採
取部105及び資料要求部115ではネットワーク負荷
を下げる為、図9の資料採取コマンドテーブル106の
複製(レプリケーション等を用いる)を保持しているも
のとする。In each of the processes shown in FIGS. 5 and 15, the data collection unit 105 and the data request unit 115 hold a copy (using replication or the like) of the data collection command table 106 in FIG. 9 in order to reduce the network load. Shall be.
【0062】次に、本実施形態の障害調査資料採取シス
テムにおけるステップ212のサポート担当者への割当
て処理について図6を参照して説明する。ステップ60
1では、図13の担当者テーブルを参照して監視対象シ
ステム100から送信されたエラー番号と一致するエラ
ー番号1301を検索する。Next, the assignment processing to the support staff in step 212 in the failure investigation data collection system of the present embodiment will be described with reference to FIG. Step 60
In step 1, an error number 1301 that matches the error number transmitted from the monitored system 100 is searched for with reference to the person in charge table in FIG.
【0063】ステップ602では、検索されたレコード
の担当部署1302の内容を調べ、担当部署1302が
ハードウェアの担当部署である場合、すなわち、発生し
た障害がハードウェア障害である場合にはステップ60
5へ進み、代表連絡先1303に示されたハードウェア
担当代表連絡先へ通知する。In step 602, the contents of the department in charge 1302 of the searched record are examined. If the department in charge 1302 is the department in charge of hardware, that is, if the fault that occurred is a hardware fault, step 602 is executed.
Then, the process proceeds to step S5, and the hardware representative representative contact indicated in the representative contact 1303 is notified.
【0064】同様にステップ603でOS障害と判定さ
れた場合にはステップ606でOS担当の代表連絡先1
303へ通知し、ステップ604でミドルウェア障害と
判定された場合には、ステップ607でミドルウェア担
当の代表連絡先1303へ通知する。代表連絡先130
3への通知は、電子メール等を利用する。本実施形態で
は、ハードウェア、OS、ミドルウェアの3つに大別し
ているが、各種ミドルウェアを製品名毎に別けても良
い。Similarly, if it is determined in step 603 that an OS failure has occurred, then in step 606 the representative contact 1 for the OS
In step 604, a notification is made to the representative contact 1303 in charge of the middleware. Representative contact 130
Notification to 3 uses an e-mail or the like. In the present embodiment, hardware, OS, and middleware are roughly classified, but various middleware may be classified for each product name.
【0065】前記の様に本実施形態では、ある監視対象
システムで障害が発生した場合に、他の監視対象システ
ムで過去に発生した障害とその際に採取した資料を示す
事例データベース114を用いて、新たに発生した障害
を解析する為の資料を決定して資料採取を行うので、従
来の原因究明の際に資料採取までに要していた時間を短
縮することができる。As described above, in the present embodiment, when a failure occurs in a certain monitored system, a case database 114 indicating failures that occurred in the past in another monitored system and data collected at that time is used. In addition, since data to be collected for analyzing a newly generated failure is determined, it is possible to reduce the time required for collecting the data when investigating the cause in the related art.
【0066】また、一箇所の不具合により多様な障害現
象が発生する場合や、障害現象が同じでも不具合個所が
複数推定される場合にも、事例データベース114の資
料テーブルの複数のエラー番号1201に同一の資料番
号1203を設定したり、単一のエラー番号1201に
複数の資料番号1203を設定することにより対応が可
能となった。更に障害通知の受付の際、サポート契約を
自動的にチェックすることで素早い対応が可能であり、
資料採取が素早く確実に行われることにより、より早く
障害回復作業に取り掛かることができる。In addition, when a variety of failure phenomena occur due to one failure, or when a plurality of failure locations are estimated even if the failure phenomena are the same, a plurality of error numbers 1201 in the material table of the case database 114 are the same. By setting the material number 1203 of the document or by setting a plurality of material numbers 1203 to the single error number 1201, it is possible to cope with the problem. In addition, when receiving a failure notification, it is possible to respond quickly by automatically checking the support contract,
Since the data collection is performed quickly and reliably, the failure recovery work can be started more quickly.
【0067】以上説明した様に本実施形態の障害調査資
料採取システムによれば、過去に発生した障害の事例を
基に採取対象の資料を判定して資料採取を行うので、監
視対象の情報処理装置で発生した障害を解析する為の資
料の採取を効率的に行うことが可能である。As described above, according to the fault investigation data collection system of the present embodiment, the data to be collected is determined based on the case of the fault that occurred in the past, and the data is collected. It is possible to efficiently collect data for analyzing a failure that has occurred in the device.
【0068】[0068]
【発明の効果】本発明によれば過去に発生した障害の事
例を基に採取対象の資料を判定して資料採取を行うの
で、監視対象の情報処理装置で発生した障害を解析する
為の資料の採取を効率的に行うことが可能である。According to the present invention, since the data to be collected is determined based on the case of the fault that occurred in the past and the data is collected, the data for analyzing the fault occurring in the information processing apparatus to be monitored is provided. Can be efficiently collected.
【図1】本実施形態の障害調査資料採取システムの概略
構成を示す図である。FIG. 1 is a diagram illustrating a schematic configuration of a failure investigation material collection system according to an embodiment;
【図2】本実施形態の障害調査資料採取システムの全体
の処理手順を示すフローチャートである。FIG. 2 is a flowchart illustrating an overall processing procedure of the fault investigation material collection system according to the embodiment;
【図3】本実施形態の監視対象システム100側での障
害履歴検索処理の処理手順を示すフローチャートであ
る。FIG. 3 is a flowchart illustrating a processing procedure of a failure history search process on the monitoring target system 100 according to the embodiment.
【図4】本実施形態の図2のステップ203の契約チェ
ック処理の処理手順を示すフローチャートである。FIG. 4 is a flowchart illustrating a procedure of a contract check process in step 203 of FIG. 2 of the embodiment.
【図5】本実施形態の図3のステップ306の再発時資
料採取処理の処理手順を示すフローチャートである。FIG. 5 is a flowchart showing a processing procedure of a data collection process at the time of recurrence in step 306 of FIG. 3 of the embodiment;
【図6】本実施形態の図2のステップ212のサポート
担当者への割当て処理の処理手順を示すフローチャート
である。6 is a flowchart showing a processing procedure of a process of assigning to a support person in step 212 in FIG. 2 of the embodiment.
【図7】本実施形態の監視対象システム100の障害履
歴102のデータ構造例を示す図である。FIG. 7 is a diagram illustrating an example of a data structure of a failure history 102 of the monitoring target system 100 according to the present embodiment.
【図8】本実施形態の監視対象システム100の契約情
報103のデータ構造例を示す図である。FIG. 8 is a diagram illustrating an example of a data structure of contract information 103 of the monitored system 100 according to the present embodiment.
【図9】本実施形態の資料採取コマンドテーブルの一例
を示す図である。FIG. 9 is a diagram illustrating an example of a data collection command table according to the embodiment;
【図10】本実施形態の契約データベース113の一例
を示す図である。FIG. 10 is a diagram illustrating an example of a contract database 113 according to the present embodiment.
【図11】本実施形態の事例データベース114の受付
テーブルの一例を示す図である。FIG. 11 is a diagram illustrating an example of a reception table of the case database 114 according to the embodiment.
【図12】本実施形態の事例データベース114の資料
テーブルの一例を示す図である。FIG. 12 is a diagram illustrating an example of a material table of a case database 114 according to the present embodiment.
【図13】本実施形態の担当者テーブルの一例を示す図
である。FIG. 13 is a diagram illustrating an example of a person in charge table according to the embodiment;
【図14】本実施形態の事例データベース114の受付
資料テーブルの一例を示す図である。FIG. 14 is a diagram illustrating an example of a reception material table of a case database 114 according to the present embodiment.
【図15】本実施形態の図2のステップ211の新規資
料採取処理の処理手順を示すフローチャートである。FIG. 15 is a flowchart showing a processing procedure of a new material collecting process in step 211 of FIG. 2 of the embodiment.
100…監視対象システム、107…ネットワーク、1
10…障害管理システム、102…障害履歴、103…
契約情報、106…資料採取コマンドテーブル、101
…障害検知部、104…障害通知部、105…資料採取
部、113…契約データベース、114…事例データベ
ース、111…障害受信部、112…障害診断部、11
5…資料要求部、701…エラー番号、702…発生
日、703…発生回数累計値、704…資料番号、80
1…契約番号、901…資料番号、902…資料名、9
03…資料採取コマンド、1001…契約番号、100
2…契約終了日、1003…製品名、1004…ソフト
ウェアのバージョン、1005…顧客名、1006…顧
客連絡先、1007…ハードウェア情報、1101…受
付番号、1102…エラー番号、1103…ステータ
ス、1104…受付日、1105…サポート担当者、1
106…契約番号、1201…エラー番号、1202…
発生要因、1203…資料番号、1301…エラー番
号、1302…担当部署、1303…代表連絡先、14
01…受付番号、1402…資料番号、1403…資料
ファイル、1404…採取日。100: monitored system, 107: network, 1
10: failure management system, 102: failure history, 103:
Contract information, 106 ... data collection command table, 101
... Fault detection unit, 104 ... Fault notification unit, 105 ... Data collection unit, 113 ... Contract database, 114 ... Case database, 111 ... Fault reception unit, 112 ... Fault diagnosis unit, 11
5: Material request section, 701: Error number, 702: Date of occurrence, 703: Cumulative number of occurrences, 704: Material number, 80
1: Contract number, 901: Material number, 902: Material name, 9
03: Data collection command, 1001: Contract number, 100
2 ... contract end date, 1003 ... product name, 1004 ... software version, 1005 ... customer name, 1006 ... customer contact information, 1007 ... hardware information, 1101 ... reception number, 1102 ... error number, 1103 ... status, 1104 ... Reception day, 1105 ... Support person, 1
106: contract number, 1201: error number, 1202 ...
Cause of occurrence, 1203: Material number, 1301, Error number, 1302 ... Department in charge, 1303 ... Representative contact, 14
01 ... reception number, 1402 ... material number, 1403 ... material file, 1404 ... collection date.
Claims (6)
を解析する為の資料を採取する障害調査資料採取方法に
おいて、 監視対象の情報処理装置で発生した障害を識別する為の
識別情報を受信するステップと、過去に発生した障害と
その際に採取した資料を示す事例データベースを参照
し、前記受信した識別情報で識別される障害を解析する
為に必要な資料を前記事例データベース中から選択する
ステップと、前記選択された資料の採取を監視対象の情
報処理装置に要求するステップとを有することを特徴と
する障害調査資料採取方法。In a failure investigation data collection method for collecting data for analyzing a failure that has occurred in a monitored information processing apparatus, identification information for identifying a failure that has occurred in a monitored information processing apparatus is received. And referring to a case database showing the troubles that occurred in the past and the materials collected at that time, and selecting materials necessary for analyzing the trouble identified by the received identification information from the case database. And a step of requesting the information processing apparatus to be monitored to collect the selected material.
料採取コマンドテーブルを参照し、前記選択された資料
を採取する為のコマンドを前記資料採取コマンドテーブ
ルから読み出して実行することにより当該資料の採取を
行うことを特徴とする請求項1に記載された障害調査資
料採取方法。2. A data collection command table indicating a command for collecting each material is referred to, and a command for collecting the selected material is read out from the material collection command table and executed to execute the command. The method for collecting fault investigation data according to claim 1, wherein collection is performed.
害の担当者への連絡先を示す担当者テーブルを参照し、
前記受信した識別情報で識別される障害のサポート担当
者へ障害が発生したことを連絡することを特徴とする請
求項1または請求項2のいずれかに記載された障害調査
資料採取方法。3. A person in charge table showing contact information for persons in charge of each failure occurring in the information processing device to be monitored,
3. The method according to claim 1, further comprising: notifying a support person in charge of the failure identified by the received identification information that the failure has occurred.
た障害を示す障害履歴を当該情報処理装置中に保持し、
監視対象の情報処理装置で新たに発生した障害が前記障
害履歴中に保持されている障害と一致している場合に、
その障害発生時に採取した資料を採取して送信すること
を特徴とする請求項1乃至請求項3のいずれか1項に記
載された障害調査資料採取方法。4. A failure history indicating a failure that has occurred in the past in the information processing device to be monitored is stored in the information processing device,
When a failure newly occurred in the information processing device to be monitored matches a failure held in the failure history,
4. The method according to claim 1, wherein the data collected at the time of occurrence of the failure is collected and transmitted.
を解析する為の資料を採取する障害調査資料採取システ
ムにおいて、 監視対象の情報処理装置で発生した障害を識別する為の
識別情報を受信する障害受信部と、過去に発生した障害
とその際に採取した資料を示す事例データベースを参照
し、前記受信した識別情報で識別される障害を解析する
為に必要な資料を前記事例データベース中から選択する
障害診断部と、前記選択された資料の採取を監視対象の
情報処理装置に要求する資料要求部とを備えることを特
徴とする障害調査資料採取システム。5. A fault investigation data collection system for collecting data for analyzing a failure that has occurred in a monitored information processing apparatus, receiving identification information for identifying a failure that has occurred in the monitored information processing apparatus. Fault receiving unit, referring to the case database showing the faults that occurred in the past and the materials collected at that time, from the case database the necessary materials to analyze the fault identified by the received identification information A fault investigation data collection system, comprising: a failure diagnosis unit to be selected; and a data request unit that requests the information processing apparatus to be monitored to collect the selected data.
を解析する為の資料を採取する障害調査資料採取システ
ムとしてコンピュータを機能させる為のプログラムにお
いて、 監視対象の情報処理装置で発生した障害を識別する為の
識別情報を受信する障害受信部と、過去に発生した障害
とその際に採取した資料を示す事例データベースを参照
し、前記受信した識別情報で識別される障害を解析する
為に必要な資料を前記事例データベース中から選択する
障害診断部と、前記選択された資料の採取を監視対象の
情報処理装置に要求する資料要求部としてコンピュータ
を機能させることを特徴とするプログラム。6. A program for causing a computer to function as a fault investigation data collection system for collecting data for analyzing a fault that has occurred in a monitored information processing apparatus, the program comprising: It is necessary to analyze the fault identified by the received identification information by referring to the fault receiving unit that receives the identification information for identification and the case database that shows the faults that occurred in the past and the materials collected at that time. A program for causing a computer to function as a failure diagnosis unit that selects appropriate data from the case database and a data request unit that requests the information processing apparatus to be monitored to collect the selected data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002155899A JP2003345628A (en) | 2002-05-29 | 2002-05-29 | Method for collecting fault research material, and implementation system therefor and processing program therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002155899A JP2003345628A (en) | 2002-05-29 | 2002-05-29 | Method for collecting fault research material, and implementation system therefor and processing program therefor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003345628A true JP2003345628A (en) | 2003-12-05 |
Family
ID=29772307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002155899A Pending JP2003345628A (en) | 2002-05-29 | 2002-05-29 | Method for collecting fault research material, and implementation system therefor and processing program therefor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003345628A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005251191A (en) * | 2004-02-19 | 2005-09-15 | Microsoft Corp | Method and system for troubleshooting misconfiguration of computer system based on configuration of other computer system |
JP2007249467A (en) * | 2006-03-15 | 2007-09-27 | Fujitsu Ltd | Data collection program |
JP2008077384A (en) * | 2006-09-21 | 2008-04-03 | Hitachi Building Systems Co Ltd | Work report preparation device and work report preparation system |
JP2008217735A (en) * | 2007-03-08 | 2008-09-18 | Nec Corp | Fault analysis system, method and program |
WO2009011028A1 (en) * | 2007-07-17 | 2009-01-22 | Advantest Corporation | Electronic device, host device, communication system, and program |
JP2009059204A (en) * | 2007-08-31 | 2009-03-19 | Toshiba It Service Kk | Computer remote control system |
JP2009193153A (en) * | 2008-02-12 | 2009-08-27 | Nec Corp | Management system, method for storing history information, and data structure of history information database |
JP2016218844A (en) * | 2015-05-22 | 2016-12-22 | 日本電気株式会社 | Monitoring device |
US10664340B2 (en) | 2017-02-16 | 2020-05-26 | Fujitsu Limited | Failure analysis program, failure analysis device, and failure analysis method |
-
2002
- 2002-05-29 JP JP2002155899A patent/JP2003345628A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005251191A (en) * | 2004-02-19 | 2005-09-15 | Microsoft Corp | Method and system for troubleshooting misconfiguration of computer system based on configuration of other computer system |
JP2011258230A (en) * | 2004-02-19 | 2011-12-22 | Microsoft Corp | Method for storing configuration parameter of multiple sample computer systems |
JP2007249467A (en) * | 2006-03-15 | 2007-09-27 | Fujitsu Ltd | Data collection program |
JP2008077384A (en) * | 2006-09-21 | 2008-04-03 | Hitachi Building Systems Co Ltd | Work report preparation device and work report preparation system |
JP4703527B2 (en) * | 2006-09-21 | 2011-06-15 | 株式会社日立ビルシステム | Work report creation device |
JP2008217735A (en) * | 2007-03-08 | 2008-09-18 | Nec Corp | Fault analysis system, method and program |
WO2009011028A1 (en) * | 2007-07-17 | 2009-01-22 | Advantest Corporation | Electronic device, host device, communication system, and program |
US8301411B2 (en) | 2007-07-17 | 2012-10-30 | Advantest Corporation | Electronic device, host apparatus, communication system, and recording medium |
JP2009059204A (en) * | 2007-08-31 | 2009-03-19 | Toshiba It Service Kk | Computer remote control system |
JP2009193153A (en) * | 2008-02-12 | 2009-08-27 | Nec Corp | Management system, method for storing history information, and data structure of history information database |
JP2016218844A (en) * | 2015-05-22 | 2016-12-22 | 日本電気株式会社 | Monitoring device |
US10664340B2 (en) | 2017-02-16 | 2020-05-26 | Fujitsu Limited | Failure analysis program, failure analysis device, and failure analysis method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5287505A (en) | On-line problem management of remote data processing systems, using local problem determination procedures and a centralized database | |
US8140565B2 (en) | Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction | |
JP4318643B2 (en) | Operation management method, operation management apparatus, and operation management program | |
JP6048038B2 (en) | Information processing apparatus, program, and information processing method | |
US8756385B2 (en) | Software configuration item back-up facility | |
JPH0432417B2 (en) | ||
US20090132858A1 (en) | Analyzer, analyzing system, and computer program product | |
US8438422B2 (en) | Failure response support apparatus and failure response support method | |
US20060085404A1 (en) | Method, apparatus, and computer program product updating software in an information processing apparatus | |
JP2011197785A (en) | System and program for collecting log | |
JP2003345628A (en) | Method for collecting fault research material, and implementation system therefor and processing program therefor | |
US20100251029A1 (en) | Implementing self-optimizing ipl diagnostic mode | |
JP2008027022A (en) | Fault data collection system | |
JP4928480B2 (en) | Job processing system and job management method | |
JP2002366388A (en) | Method, system, and program for supporting customer support | |
WO2011051999A1 (en) | Information processing device and method for controlling information processing device | |
CN116560893B (en) | Computer application program operation data fault processing system | |
JP2009193207A (en) | Information collection procedure management system | |
JP3867868B2 (en) | Fault integrated management device | |
JP2009181494A (en) | Job processing system and job information acquisition method | |
EP1381952A2 (en) | Panic message analyzer | |
JP2004192293A (en) | Software verification support tool | |
JP3992029B2 (en) | Object management method | |
JP4286594B2 (en) | Fault analysis data collection device and method | |
JP4271612B2 (en) | Fault detection system and method |