JP2004086278A - 装置障害監視方法および装置障害監視システム - Google Patents
装置障害監視方法および装置障害監視システム Download PDFInfo
- Publication number
- JP2004086278A JP2004086278A JP2002243009A JP2002243009A JP2004086278A JP 2004086278 A JP2004086278 A JP 2004086278A JP 2002243009 A JP2002243009 A JP 2002243009A JP 2002243009 A JP2002243009 A JP 2002243009A JP 2004086278 A JP2004086278 A JP 2004086278A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- fault
- time
- direct
- log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】装置の各部位に連鎖的に障害が発生したとき、少ないログ容量によって直接障害が発生した部位を簡単に特定して見つけ出すことができるようにする。
【解決手段】障害状況監視手段2がポーリング方式などにより装置の各部位の障害状況を監視している。障害発生判定手段4が障害状況に基づいて障害の発生を確認すると、タイマセット判定手段3がタイマカウントを開始する。障害発生判定手段4はタイマカウントが終了するまで直接障害と連鎖障害を含めた障害状況を判定する。タイマカウントが終了すると、タイムアップフラグセット手段5がタイムアップフラグをセットし、タイムアップフラグ判定手段6がタイムアップフラグが立っていることを確認する。直接障害発生部位特定手段7が障害部位探求マップと実際の障害状況とを照合して直接障害の発生部位を特定し、障害情報記録手段8が特定された直接障害の発生部位を障害情報のログとして記録する。
【選択図】 図1
【解決手段】障害状況監視手段2がポーリング方式などにより装置の各部位の障害状況を監視している。障害発生判定手段4が障害状況に基づいて障害の発生を確認すると、タイマセット判定手段3がタイマカウントを開始する。障害発生判定手段4はタイマカウントが終了するまで直接障害と連鎖障害を含めた障害状況を判定する。タイマカウントが終了すると、タイムアップフラグセット手段5がタイムアップフラグをセットし、タイムアップフラグ判定手段6がタイムアップフラグが立っていることを確認する。直接障害発生部位特定手段7が障害部位探求マップと実際の障害状況とを照合して直接障害の発生部位を特定し、障害情報記録手段8が特定された直接障害の発生部位を障害情報のログとして記録する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、機器や装置(以下、両者を含めて単に装置という)の障害を監視する装置障害監視方法および装置障害監視システムに関し、より詳しくは、装置を監視する装置監視局との間に通信手段のない遠隔地などに設置された装置の障害情報をログとして蓄積しながら監視する装置障害監視方法および装置障害監視システムに関するものである。
【0002】
【従来の技術】
従来、離れた場所に設置された装置の障害情報を監視するための装置障害監視システムに関する技術が種々報告されている。例えば、特開2001−309454号公報には、複写機、ファクシミリ装置、プリンタ、および画像記憶装置などのビジネスオフィス機器の障害を遠隔で監視するための遠隔監視システムが報告されている。この技術によれば、各種ビジネスオフィス機器から上位装置であるサービスセンタへ定期的にログファイルを転送(ポーリング)することによって、サービスセンタは、各種ビジネスオフィス機器のログファイルを解析し、障害情報を遠隔より効率的に監視・診断することができる。また、特開平11−110248号公報には、LANシステム内の各種機器の障害情報をログファイルに記録しておき、上位装置である保守端末がログファイルの内容をチェックすることにより、LANシステムの挙動を収集して故障解析を行う技術が開示されている。この技術によれば、LANシステム内の各種機器に障害が発生した際に、LANシステムの運転に影響を与えることなく障害に至るシステム全体の挙動を詳細に把握することが可能となり、障害の解析を容易に行うことができる。
【0003】
さらに、特開平11−234273号公報には、ネットワークの障害検出から保守者へ障害対策を通知するまでの時間を短縮する障害通知方法が開示されている。この技術によれば、過去に発生した障害内容をログとして障害情報番号ごとに区分し、それぞれのログの障害情報番号に対応した障害復旧手順が障害情報テーブルとしてデータベースに登録されている。したがって、ネットワークの障害が発生した時には、その障害内容から障害情報番号を特定し、データベースの障害情報テーブルより障害情報番号に該当する障害復旧手順を直ちに取得することができる。また、特開2000−267726号公報には、遠隔地にある機械設備の故障復旧を迅速に行うことのできる遠隔故障診断システムが開示されている。この技術によれば、上位装置である保守センタが遠隔地の機械設備から故障情報を受信すると、保守センタは、受信した故障情報と自己が予め用意している故障発生条件データベース内のログ情報とに基づいて故障原因を推定し、故障原因と対応した復旧指示データを保守担当部門へ通知する。これによって、迅速に機械設備の故障復旧を行うことができる。
【0004】
【発明が解決しようとする課題】
上記従来の装置障害監視システムは、装置のある部位に障害が発生し、それに起因して一つないしは複数の部位に障害が波及した場合は、その装置について全ての障害情報をログ(履歴情報)として記録している。このため、障害発生の時刻を示すタイムスタンプが付いてない場合は、記録されている障害情報の中から直接障害を発生させた部位を見つけ出すにはかなりの時間がかかる。また、タイムスタンプが付いている場合でも、直接障害の部位と波及障害の部位についての障害に関する因果関係の知識がないと、直接障害を起こした部位を見つけ出すことは困難である。さらに、装置障害監視システムとの間に通信手段を持たない遠隔地などに設置された装置などにおいては、障害情報のログを蓄積して定期的なメンテナンスの際にそのログを出力して障害の解析を行っている。しかし、ログには直接障害の部位についての原因を究明するのに不必要な障害情報も記憶されるため、前述と同様に、直接障害を発生させた部位を見つけるにはかなりの時間がかかる。また、ログには直接障害の部位以外の障害情報も記録されるために記憶媒体の限られた容量をより制限する要因ともなる。
【0005】
本発明は、上述の課題に鑑みてなされたもので、その目的とするところは、装置の各部位にほぼ同時に連鎖的に障害が発生した場合、直接障害が発生した部位を簡単に特定して見つけ出すことができ、かつ、装置障害の履歴情報を記録するログの蓄積容量を最小限にすることができるログ蓄積手段を備えた装置障害監視システムを提供することにある。
【0006】
【課題を解決するための手段】
上記の目的を達成するため、本発明の装置障害監視方法は、機器または装置の障害状況を監視する装置障害監視方法において、機器または装置の各部位に障害が発生した時に連鎖的に他の部位へ障害が波及することを想定して作成された障害部位探求マップと現実に発生した障害の部位とを照合する第1のステップと、第1のステップによる照合結果に基づいて直接障害の発生した部位を特定する第2のステップと、第2のステップで特定された部位を機器または装置の障害情報のログとして記録する第3のステップとを備えることを特徴とする。
【0007】
本発明の装置障害監視方法によれば、任意の装置にほぼ同時かつ連鎖的に障害が発生した場合、予め用意されている障害部位探求マップと現実に発生した障害状況とを照合することによって直接障害を発生させた部位を特定し、これを障害情報のログとして蓄積しておく。これによって、ログに記録された障害情報から直接障害を発生させた部位を容易に発見することができ、且つ短時間で障害の直接原因を解析することができる。
【0008】
また、本発明の装置障害監視システムは、機器または装置の障害状況を監視する装置障害監視システムにおいて、機器または装置の各部位に障害が発生した時に連鎖的に他の部位に障害が波及することを想定して作成された障害部位探求マップ(例えば、図3のような障害部位探求マップ)と、現実に発生した障害の部位と障害部位探求マップとを照合して直接障害の発生した部位を特定する特定手段(例えば、図1の直接障害発生部位特定手段7)と、特定された部位を機器または装置の障害情報のログとして記録する記録手段(例えば、図1の障害情報ログ記録手段8)とを備えることを特徴とする。
【0009】
本発明の装置障害監視システムによれば、予め想定した直接障害の部位と連鎖障害の部位とがテーブルとして関連付けられ、図3に示すような障害部位探求マップとして用意されている。したがって、現実に障害が発生したときは、図1に示す直接障害発生部位特定手段7が障害部位探求マップと障害の発生した部位とを照合することによって直接障害の発生した部位を特定し、障害情報ログ記録手段8が特定された部位を機器または装置の障害情報のログとして記録しておく。これによって、任意の装置において直接障害を発生させた部位を容易に発見することができ、且つ短時間で障害の直接原因を解析することができる。また、ログには直接障害を発生させた部位の障害情報だけを記憶させておくので、障害情報を蓄積するログの容量を小さくすることができる。
【0010】
また、本発明の装置障害監視システムは、機器または装置の障害状況を監視する装置障害監視システムにおいて、ポーリング方式によって障害状況を監視する障害状況監視手段と、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定するタイマセット判定手段と、障害状況監視手段が監視している障害状況に基づいて実際に障害が発生したか否かを判定する障害発生判定手段と、直接障害が発生してから一定の時間が経過するとタイムアップフラグをセットするタイムアップフラグセット手段と、タイムアップフラグがセットされて立っているか否かを判定するタイムアップフラグ判定手段と、各部位の障害発生時に連鎖的に他の部位に波及する障害状況を想定して作成した障害部位探求マップと障害判定手段によって判定された実際の障害状況とを照合し、直接障害の発生部位を特定する直接障害発生部位特定手段と、直接障害発生部位特定手段によって特定された直接障害の発生部位を、機器または装置の障害情報のログとして記録する障害情報ログ記録手段とを備えることを特徴とする。
【0011】
本発明の装置障害監視システムによれば、ポーリング方式によって障害情報を常時監視しながら、現実に障害が発生したときには、所定の時間をタイムカウントして直接障害と連鎖障害とを現実の障害状況として把握する。そして、予め用意されている障害部位探求マップと現実の障害状況とを照合し、直接障害の発生部位を特定する。さらに、特定された直接障害の発生部位を障害情報のログとして記録しておく。装置障害監視システムに対してこのような装置障害情報ログ蓄積手段を備えることによって、装置の幾つかの部位でほぼ同時に障害が発生した場合でも、直接障害を発生した部位を容易に見つけ出すことができる。また、不要な障害情報のログを記録しないため、障害情報を記録するログの容量を最小限にすることができる。
【0012】
【発明の実施の形態】
以下、図面を用いて、本発明における装置障害監視システムの実施の形態を詳細に説明する。本発明の装置障害監視システムは、予め、装置の各部位に障害が発生した時に連鎖的に他の部位に障害が波及することを想定して障害部位探求マップを作成する。そして、現実に障害が発生した場合には、障害が発生した部位と障害部位探求マップとを照合することによって直接障害の発生した部位を特定し、特定された部位を装置の障害情報のログとして記録する。これによって、ある装置にほぼ同時かつ連鎖的に障害が発生した場合、直接障害を発生させた部位を容易に発見することができ、短時間において障害の直接原因を解析することができる。また、特定された部位の障害情報のみをログに記録するため、障害情報を蓄積するログの記憶容量を小さくすることができる。
【0013】
なお、装置に障害が発生したとき、障害が連鎖的に波及する各部位の障害判定の速度が装置を制御するCPUの処理速度と比べて遅い場合は、障害が連鎖的に波及する各部位の障害であっても、CPUの処理においては同時に障害を検出することができない。このため、タイマを設けて、最初に発生した障害(つまり、直接障害)から一定の時間内に発生した障害を連鎖障害として検出することが必要である。
【0014】
図3は、ある装置における障害部位探求マップのテーブルの一例である。図3に示す障害部位探求マップでは、ある装置にはA,B,Cの各部位があり、部位Aが直接障害の発生部位のとき、それに起因して部位B及び部位Cがほぼ同時に連鎖障害を起こしたり、部位Bのみがほぼ同時に連鎖障害を起こすことを想定して障害モデルのマップを作成している。また、部位Bが直接障害のときは、それに起因して部位Cもほぼ同時に連鎖障害となるような障害モデルの障害部位探求マップとなっている。なお、部位A,Cや部位Bや部位Cが直接障害のときに他の部位には障害が波及しない場合も想定して障害モデルのマップを作成している。
【0015】
図1は、本発明における装置障害監視システムの構成図である。図1において、装置障害監視システム1は、各装置から定期的にデータを取得するポーリング方式などによって障害状況を監視する障害状況監視手段2と、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定するタイマセット判定手段3と、障害状況監視手段2が監視している障害状況に基づいて実際に障害が発生したか否かを判定する障害発生判定手段4と、直接障害が発生してから一定の時間が経過するとタイムアップフラグをセットする(立てる)タイムアップフラグセット手段5と、タイムアップフラグが立っているか否かを判定するタイムアップフラグ判定手段6と、各部位の障害発生時に連鎖的に他の部位に波及する障害状況を想定して作成した障害部位探求マップと障害判定手段4によって判定された実際の障害とを照合し、直接障害の発生部位を特定する直接障害発生部位特定手段7と、特定された直接障害の発生部位を装置における障害情報のログとして記録する障害情報ログ記録手段8とによって構成されている。
【0016】
図2は、図1に示す装置障害監視システムが行う障害部位探求の処理の流れを示すフローチャートである。したがって、図1と図2を用いて本発明の装置障害監視システムが行う障害部位探求の処理の流れを説明する。先ず、障害状況監視手段2がポーリング方式などによって所定の装置における各部位の障害状況を常時監視する(ステップS1)。続いて、タイマセット判定手段3が、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定する(ステップS2)。ここで、タイマがセットされていない場合は(ステップS2でNoの場合)、障害発生判定手段4が障害状況監視手段2の監視による障害状況に基づいて実際に障害が発生したか否かを判定する(ステップS3)。ここで、実際に障害が発生していない場合は(ステップS3でNoの場合)、再びステップS1に戻って、障害状況監視手段1による障害状況の監視を継続する。
【0017】
一方、ステップS3において実際に障害が発生した場合は(ステップS3でYesの場合)、タイマセット判定手段3が再び、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定する(ステップS4)。ここで、タイマがセットされている場合は(ステップS4でYesの場合)、ステップS1に戻って、連鎖障害があるか否かを監視するために障害状況監視手段2による障害状況の監視をさらに継続する。一方、ステップS4でタイマがセットされていない場合は(ステップS4でNoの場合)、タイマをセットしてから(ステップS5)、ステップS1に戻って、連鎖障害があるか否かを監視するために障害状況監視手段2による障害状況の監視を継続する。
【0018】
このようにして障害状況監視手段2による障害状況の監視を継続しながら(ステップS1)、タイマがセットされている間中はタイムカウントを継続し(ステップS2でYesの場合)、タイマにセットされた所定の時間が経過した後にタイムアップフラグセット手段5がタイムアップフラグを立てたか否かを、タイムアップフラグ判定手段6が判定する(ステップS6)。ここで、タイムアップフラグが立っていない場合は(ステップS6でNoの場合)、そのまま障害状況の監視を継続するために、ステップS3,S4,S5を経て前述と同様にステップS1〜S6の処理を繰り返す。
【0019】
一方、タイマにセットされた所定の時間が経過してタイムアップフラグが立った場合は(ステップS6でYesの場合)、直接障害発生部位特定手段7が予め用意されている図3に示すような障害部位探求マップと障害発生判定手段4によって判定された実際の障害状況とを照合し、障害部位探求処理を行って直接障害の発生部位を特定する(ステップS7)。さらに、障害情報記録手段8が特定された直接障害の発生部位を装置における障害情報のログとして記録する(ステップS8)。これによって、ログに記録されている障害情報から、容易に、直接障害の発生部位を見つけ出すことができる。
【0020】
以上述べた実施の形態は本発明を説明するための一例であり、本発明は、上記の実施の形態に限定されるものではなく、発明の要旨の範囲で種々の変形が可能である。上記の実施の形態では、装置障害監視システムが障害状況を監視する装置台数については特に述べなかったが、1台の装置でもn台の装置でも同じ装置障害監視システムおよび同じ装置障害監視方法によって障害状況を監視できることは云うまでもない。また、上記の実施の形態では、装置障害監視システムと監視される装置との位置関係については特に述べなかったが、両者は遠隔、近接何れの場所にあっても構わない。ただし、本発明の装置障害監視システムを有効に利用するためには、装置監視システムとの間に通信手段のない遠隔地などに設置された装置の障害情報をログとして蓄積しながら障害状況を監視するための装置障害監視システムとして用いることが望ましい。
【0021】
【発明の効果】
以上説明したように、本発明の装置障害監視システムによれば、ポーリング方式によって障害情報を常時監視しながら、現実に障害が発生したときには、所定の時間をタイムカウントして直接障害と連鎖障害とを現実の障害状況として把握する。そして、予め用意されている障害部位探求マップと現実の障害状況とを照合し、直接障害の発生部位を特定する。さらに、特定された直接障害の発生部位を障害情報のログとして記録しておく。装置障害監視システムに対してこのような装置障害情報ログ蓄積手段を備えることによって、幾つかの部位でほぼ同時に障害が発生した場合でも、直接障害が発生した部位を容易に見つけ出すことができる。また、不要な障害情報をログに記録しないためログの容量を最小限にすることができる。
【図面の簡単な説明】
【図1】本発明における装置障害監視システムの構成図である。
【図2】図1に示す装置障害監視システムが行う障害部位探求の処理の流れを示すフローチャートである。
【図3】ある装置における障害部位探求マップのテーブルの一例である。
【符号の説明】
1 装置障害監視システム、2 障害状況監視手段、3 タイマセット判定手段、4 障害発生判定手段、5 タイムアップフラグセット手段、6 タイムアップフラグ判定手段、7 直接障害発生部位特定手段、8 障害情報ログ記録手段。
【発明の属する技術分野】
本発明は、機器や装置(以下、両者を含めて単に装置という)の障害を監視する装置障害監視方法および装置障害監視システムに関し、より詳しくは、装置を監視する装置監視局との間に通信手段のない遠隔地などに設置された装置の障害情報をログとして蓄積しながら監視する装置障害監視方法および装置障害監視システムに関するものである。
【0002】
【従来の技術】
従来、離れた場所に設置された装置の障害情報を監視するための装置障害監視システムに関する技術が種々報告されている。例えば、特開2001−309454号公報には、複写機、ファクシミリ装置、プリンタ、および画像記憶装置などのビジネスオフィス機器の障害を遠隔で監視するための遠隔監視システムが報告されている。この技術によれば、各種ビジネスオフィス機器から上位装置であるサービスセンタへ定期的にログファイルを転送(ポーリング)することによって、サービスセンタは、各種ビジネスオフィス機器のログファイルを解析し、障害情報を遠隔より効率的に監視・診断することができる。また、特開平11−110248号公報には、LANシステム内の各種機器の障害情報をログファイルに記録しておき、上位装置である保守端末がログファイルの内容をチェックすることにより、LANシステムの挙動を収集して故障解析を行う技術が開示されている。この技術によれば、LANシステム内の各種機器に障害が発生した際に、LANシステムの運転に影響を与えることなく障害に至るシステム全体の挙動を詳細に把握することが可能となり、障害の解析を容易に行うことができる。
【0003】
さらに、特開平11−234273号公報には、ネットワークの障害検出から保守者へ障害対策を通知するまでの時間を短縮する障害通知方法が開示されている。この技術によれば、過去に発生した障害内容をログとして障害情報番号ごとに区分し、それぞれのログの障害情報番号に対応した障害復旧手順が障害情報テーブルとしてデータベースに登録されている。したがって、ネットワークの障害が発生した時には、その障害内容から障害情報番号を特定し、データベースの障害情報テーブルより障害情報番号に該当する障害復旧手順を直ちに取得することができる。また、特開2000−267726号公報には、遠隔地にある機械設備の故障復旧を迅速に行うことのできる遠隔故障診断システムが開示されている。この技術によれば、上位装置である保守センタが遠隔地の機械設備から故障情報を受信すると、保守センタは、受信した故障情報と自己が予め用意している故障発生条件データベース内のログ情報とに基づいて故障原因を推定し、故障原因と対応した復旧指示データを保守担当部門へ通知する。これによって、迅速に機械設備の故障復旧を行うことができる。
【0004】
【発明が解決しようとする課題】
上記従来の装置障害監視システムは、装置のある部位に障害が発生し、それに起因して一つないしは複数の部位に障害が波及した場合は、その装置について全ての障害情報をログ(履歴情報)として記録している。このため、障害発生の時刻を示すタイムスタンプが付いてない場合は、記録されている障害情報の中から直接障害を発生させた部位を見つけ出すにはかなりの時間がかかる。また、タイムスタンプが付いている場合でも、直接障害の部位と波及障害の部位についての障害に関する因果関係の知識がないと、直接障害を起こした部位を見つけ出すことは困難である。さらに、装置障害監視システムとの間に通信手段を持たない遠隔地などに設置された装置などにおいては、障害情報のログを蓄積して定期的なメンテナンスの際にそのログを出力して障害の解析を行っている。しかし、ログには直接障害の部位についての原因を究明するのに不必要な障害情報も記憶されるため、前述と同様に、直接障害を発生させた部位を見つけるにはかなりの時間がかかる。また、ログには直接障害の部位以外の障害情報も記録されるために記憶媒体の限られた容量をより制限する要因ともなる。
【0005】
本発明は、上述の課題に鑑みてなされたもので、その目的とするところは、装置の各部位にほぼ同時に連鎖的に障害が発生した場合、直接障害が発生した部位を簡単に特定して見つけ出すことができ、かつ、装置障害の履歴情報を記録するログの蓄積容量を最小限にすることができるログ蓄積手段を備えた装置障害監視システムを提供することにある。
【0006】
【課題を解決するための手段】
上記の目的を達成するため、本発明の装置障害監視方法は、機器または装置の障害状況を監視する装置障害監視方法において、機器または装置の各部位に障害が発生した時に連鎖的に他の部位へ障害が波及することを想定して作成された障害部位探求マップと現実に発生した障害の部位とを照合する第1のステップと、第1のステップによる照合結果に基づいて直接障害の発生した部位を特定する第2のステップと、第2のステップで特定された部位を機器または装置の障害情報のログとして記録する第3のステップとを備えることを特徴とする。
【0007】
本発明の装置障害監視方法によれば、任意の装置にほぼ同時かつ連鎖的に障害が発生した場合、予め用意されている障害部位探求マップと現実に発生した障害状況とを照合することによって直接障害を発生させた部位を特定し、これを障害情報のログとして蓄積しておく。これによって、ログに記録された障害情報から直接障害を発生させた部位を容易に発見することができ、且つ短時間で障害の直接原因を解析することができる。
【0008】
また、本発明の装置障害監視システムは、機器または装置の障害状況を監視する装置障害監視システムにおいて、機器または装置の各部位に障害が発生した時に連鎖的に他の部位に障害が波及することを想定して作成された障害部位探求マップ(例えば、図3のような障害部位探求マップ)と、現実に発生した障害の部位と障害部位探求マップとを照合して直接障害の発生した部位を特定する特定手段(例えば、図1の直接障害発生部位特定手段7)と、特定された部位を機器または装置の障害情報のログとして記録する記録手段(例えば、図1の障害情報ログ記録手段8)とを備えることを特徴とする。
【0009】
本発明の装置障害監視システムによれば、予め想定した直接障害の部位と連鎖障害の部位とがテーブルとして関連付けられ、図3に示すような障害部位探求マップとして用意されている。したがって、現実に障害が発生したときは、図1に示す直接障害発生部位特定手段7が障害部位探求マップと障害の発生した部位とを照合することによって直接障害の発生した部位を特定し、障害情報ログ記録手段8が特定された部位を機器または装置の障害情報のログとして記録しておく。これによって、任意の装置において直接障害を発生させた部位を容易に発見することができ、且つ短時間で障害の直接原因を解析することができる。また、ログには直接障害を発生させた部位の障害情報だけを記憶させておくので、障害情報を蓄積するログの容量を小さくすることができる。
【0010】
また、本発明の装置障害監視システムは、機器または装置の障害状況を監視する装置障害監視システムにおいて、ポーリング方式によって障害状況を監視する障害状況監視手段と、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定するタイマセット判定手段と、障害状況監視手段が監視している障害状況に基づいて実際に障害が発生したか否かを判定する障害発生判定手段と、直接障害が発生してから一定の時間が経過するとタイムアップフラグをセットするタイムアップフラグセット手段と、タイムアップフラグがセットされて立っているか否かを判定するタイムアップフラグ判定手段と、各部位の障害発生時に連鎖的に他の部位に波及する障害状況を想定して作成した障害部位探求マップと障害判定手段によって判定された実際の障害状況とを照合し、直接障害の発生部位を特定する直接障害発生部位特定手段と、直接障害発生部位特定手段によって特定された直接障害の発生部位を、機器または装置の障害情報のログとして記録する障害情報ログ記録手段とを備えることを特徴とする。
【0011】
本発明の装置障害監視システムによれば、ポーリング方式によって障害情報を常時監視しながら、現実に障害が発生したときには、所定の時間をタイムカウントして直接障害と連鎖障害とを現実の障害状況として把握する。そして、予め用意されている障害部位探求マップと現実の障害状況とを照合し、直接障害の発生部位を特定する。さらに、特定された直接障害の発生部位を障害情報のログとして記録しておく。装置障害監視システムに対してこのような装置障害情報ログ蓄積手段を備えることによって、装置の幾つかの部位でほぼ同時に障害が発生した場合でも、直接障害を発生した部位を容易に見つけ出すことができる。また、不要な障害情報のログを記録しないため、障害情報を記録するログの容量を最小限にすることができる。
【0012】
【発明の実施の形態】
以下、図面を用いて、本発明における装置障害監視システムの実施の形態を詳細に説明する。本発明の装置障害監視システムは、予め、装置の各部位に障害が発生した時に連鎖的に他の部位に障害が波及することを想定して障害部位探求マップを作成する。そして、現実に障害が発生した場合には、障害が発生した部位と障害部位探求マップとを照合することによって直接障害の発生した部位を特定し、特定された部位を装置の障害情報のログとして記録する。これによって、ある装置にほぼ同時かつ連鎖的に障害が発生した場合、直接障害を発生させた部位を容易に発見することができ、短時間において障害の直接原因を解析することができる。また、特定された部位の障害情報のみをログに記録するため、障害情報を蓄積するログの記憶容量を小さくすることができる。
【0013】
なお、装置に障害が発生したとき、障害が連鎖的に波及する各部位の障害判定の速度が装置を制御するCPUの処理速度と比べて遅い場合は、障害が連鎖的に波及する各部位の障害であっても、CPUの処理においては同時に障害を検出することができない。このため、タイマを設けて、最初に発生した障害(つまり、直接障害)から一定の時間内に発生した障害を連鎖障害として検出することが必要である。
【0014】
図3は、ある装置における障害部位探求マップのテーブルの一例である。図3に示す障害部位探求マップでは、ある装置にはA,B,Cの各部位があり、部位Aが直接障害の発生部位のとき、それに起因して部位B及び部位Cがほぼ同時に連鎖障害を起こしたり、部位Bのみがほぼ同時に連鎖障害を起こすことを想定して障害モデルのマップを作成している。また、部位Bが直接障害のときは、それに起因して部位Cもほぼ同時に連鎖障害となるような障害モデルの障害部位探求マップとなっている。なお、部位A,Cや部位Bや部位Cが直接障害のときに他の部位には障害が波及しない場合も想定して障害モデルのマップを作成している。
【0015】
図1は、本発明における装置障害監視システムの構成図である。図1において、装置障害監視システム1は、各装置から定期的にデータを取得するポーリング方式などによって障害状況を監視する障害状況監視手段2と、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定するタイマセット判定手段3と、障害状況監視手段2が監視している障害状況に基づいて実際に障害が発生したか否かを判定する障害発生判定手段4と、直接障害が発生してから一定の時間が経過するとタイムアップフラグをセットする(立てる)タイムアップフラグセット手段5と、タイムアップフラグが立っているか否かを判定するタイムアップフラグ判定手段6と、各部位の障害発生時に連鎖的に他の部位に波及する障害状況を想定して作成した障害部位探求マップと障害判定手段4によって判定された実際の障害とを照合し、直接障害の発生部位を特定する直接障害発生部位特定手段7と、特定された直接障害の発生部位を装置における障害情報のログとして記録する障害情報ログ記録手段8とによって構成されている。
【0016】
図2は、図1に示す装置障害監視システムが行う障害部位探求の処理の流れを示すフローチャートである。したがって、図1と図2を用いて本発明の装置障害監視システムが行う障害部位探求の処理の流れを説明する。先ず、障害状況監視手段2がポーリング方式などによって所定の装置における各部位の障害状況を常時監視する(ステップS1)。続いて、タイマセット判定手段3が、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定する(ステップS2)。ここで、タイマがセットされていない場合は(ステップS2でNoの場合)、障害発生判定手段4が障害状況監視手段2の監視による障害状況に基づいて実際に障害が発生したか否かを判定する(ステップS3)。ここで、実際に障害が発生していない場合は(ステップS3でNoの場合)、再びステップS1に戻って、障害状況監視手段1による障害状況の監視を継続する。
【0017】
一方、ステップS3において実際に障害が発生した場合は(ステップS3でYesの場合)、タイマセット判定手段3が再び、直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定する(ステップS4)。ここで、タイマがセットされている場合は(ステップS4でYesの場合)、ステップS1に戻って、連鎖障害があるか否かを監視するために障害状況監視手段2による障害状況の監視をさらに継続する。一方、ステップS4でタイマがセットされていない場合は(ステップS4でNoの場合)、タイマをセットしてから(ステップS5)、ステップS1に戻って、連鎖障害があるか否かを監視するために障害状況監視手段2による障害状況の監視を継続する。
【0018】
このようにして障害状況監視手段2による障害状況の監視を継続しながら(ステップS1)、タイマがセットされている間中はタイムカウントを継続し(ステップS2でYesの場合)、タイマにセットされた所定の時間が経過した後にタイムアップフラグセット手段5がタイムアップフラグを立てたか否かを、タイムアップフラグ判定手段6が判定する(ステップS6)。ここで、タイムアップフラグが立っていない場合は(ステップS6でNoの場合)、そのまま障害状況の監視を継続するために、ステップS3,S4,S5を経て前述と同様にステップS1〜S6の処理を繰り返す。
【0019】
一方、タイマにセットされた所定の時間が経過してタイムアップフラグが立った場合は(ステップS6でYesの場合)、直接障害発生部位特定手段7が予め用意されている図3に示すような障害部位探求マップと障害発生判定手段4によって判定された実際の障害状況とを照合し、障害部位探求処理を行って直接障害の発生部位を特定する(ステップS7)。さらに、障害情報記録手段8が特定された直接障害の発生部位を装置における障害情報のログとして記録する(ステップS8)。これによって、ログに記録されている障害情報から、容易に、直接障害の発生部位を見つけ出すことができる。
【0020】
以上述べた実施の形態は本発明を説明するための一例であり、本発明は、上記の実施の形態に限定されるものではなく、発明の要旨の範囲で種々の変形が可能である。上記の実施の形態では、装置障害監視システムが障害状況を監視する装置台数については特に述べなかったが、1台の装置でもn台の装置でも同じ装置障害監視システムおよび同じ装置障害監視方法によって障害状況を監視できることは云うまでもない。また、上記の実施の形態では、装置障害監視システムと監視される装置との位置関係については特に述べなかったが、両者は遠隔、近接何れの場所にあっても構わない。ただし、本発明の装置障害監視システムを有効に利用するためには、装置監視システムとの間に通信手段のない遠隔地などに設置された装置の障害情報をログとして蓄積しながら障害状況を監視するための装置障害監視システムとして用いることが望ましい。
【0021】
【発明の効果】
以上説明したように、本発明の装置障害監視システムによれば、ポーリング方式によって障害情報を常時監視しながら、現実に障害が発生したときには、所定の時間をタイムカウントして直接障害と連鎖障害とを現実の障害状況として把握する。そして、予め用意されている障害部位探求マップと現実の障害状況とを照合し、直接障害の発生部位を特定する。さらに、特定された直接障害の発生部位を障害情報のログとして記録しておく。装置障害監視システムに対してこのような装置障害情報ログ蓄積手段を備えることによって、幾つかの部位でほぼ同時に障害が発生した場合でも、直接障害が発生した部位を容易に見つけ出すことができる。また、不要な障害情報をログに記録しないためログの容量を最小限にすることができる。
【図面の簡単な説明】
【図1】本発明における装置障害監視システムの構成図である。
【図2】図1に示す装置障害監視システムが行う障害部位探求の処理の流れを示すフローチャートである。
【図3】ある装置における障害部位探求マップのテーブルの一例である。
【符号の説明】
1 装置障害監視システム、2 障害状況監視手段、3 タイマセット判定手段、4 障害発生判定手段、5 タイムアップフラグセット手段、6 タイムアップフラグ判定手段、7 直接障害発生部位特定手段、8 障害情報ログ記録手段。
Claims (3)
- 機器または装置の障害状況を監視する装置障害監視方法において、
前記機器または前記装置に障害が発生した時に連鎖的に他の部位へ障害が波及することを想定して作成された障害部位探求マップと現実に発生した障害の部位とを照合する第1のステップと、
前記第1のステップによる照合結果に基づいて直接障害の発生した部位を特定する第2のステップと、
前記第2のステップで特定された部位を、前記機器または前記装置の障害情報のログとして記録する第3のステップと
を備えることを特徴とする装置障害監視方法。 - 機器または装置の障害状況を監視する装置障害監視システムにおいて、
前記機器または前記装置の各部位に障害が発生した時に連鎖的に他の部位に障害が波及することを想定して作成された障害部位探求マップと、
現実に発生した障害の部位と前記障害部位探求マップとを照合して直接障害の発生した部位を特定する特定手段と、
特定された部位を前記機器または前記装置の障害情報のログとして記録する記録手段と
を備えることを特徴とする装置障害監視システム。 - 機器または装置の障害状況を監視する装置障害監視システムにおいて、
ポーリング方式によって障害状況を監視する障害状況監視手段と、
直接障害が発生してから一定の時間をカウントするタイマがセットされているか否かを判定するタイマセット判定手段と、
前記障害状況監視手段が監視している障害状況に基づいて実際に障害が発生したか否かを判定する障害発生判定手段と、
直接障害が発生してから一定の時間が経過するとタイムアップフラグをセットするタイムアップフラグセット手段と、
タイムアップフラグがセットされて立っているか否かを判定するタイムアップフラグ判定手段と、
各部位の障害発生時に連鎖的に他の部位に波及する障害状況を想定して作成した障害部位探求マップと前記障害判定手段によって判定された実際の障害とを照合し、直接障害の発生部位を特定する直接障害発生部位特定手段と、
前記直接障害発生部位特定手段によって特定された直接障害の発生部位を、前記機器または前記装置の障害情報のログとして記録する障害情報ログ記録手段とを備えることを特徴とする装置障害監視システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243009A JP2004086278A (ja) | 2002-08-23 | 2002-08-23 | 装置障害監視方法および装置障害監視システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243009A JP2004086278A (ja) | 2002-08-23 | 2002-08-23 | 装置障害監視方法および装置障害監視システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004086278A true JP2004086278A (ja) | 2004-03-18 |
Family
ID=32051884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002243009A Withdrawn JP2004086278A (ja) | 2002-08-23 | 2002-08-23 | 装置障害監視方法および装置障害監視システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004086278A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007007410A1 (ja) * | 2005-07-14 | 2007-01-18 | Fujitsu Limited | メッセージ解析装置、メッセージ解析方法およびメッセージ解析プログラム |
JP2008171057A (ja) * | 2007-01-09 | 2008-07-24 | Mitsubishi Electric Corp | システム総合管理システム |
JP2009252006A (ja) * | 2008-04-08 | 2009-10-29 | Nec Computertechno Ltd | コンピュータシステムにおけるログ管理システム、ログ管理方法 |
WO2012063358A1 (ja) * | 2010-11-12 | 2012-05-18 | 富士通株式会社 | エラー箇所特定方法、エラー箇所特定装置およびエラー箇所特定プログラム |
CN103189848A (zh) * | 2010-11-29 | 2013-07-03 | 日本电气株式会社 | 显示处理系统、显示处理方法和程序 |
JP2013250650A (ja) * | 2012-05-30 | 2013-12-12 | Fujitsu Ltd | 監視装置、情報処理装置、監視プログラム、及び監視方法 |
JP2014222794A (ja) * | 2013-05-13 | 2014-11-27 | 三菱電機株式会社 | 状態監視装置 |
CN108717438A (zh) * | 2018-05-16 | 2018-10-30 | 北京奇艺世纪科技有限公司 | 一种链式数据状态采集系统及方法 |
-
2002
- 2002-08-23 JP JP2002243009A patent/JP2004086278A/ja not_active Withdrawn
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2007007410A1 (ja) * | 2005-07-14 | 2009-01-29 | 富士通株式会社 | メッセージ解析装置、制御方法および制御プログラム |
US7823016B2 (en) | 2005-07-14 | 2010-10-26 | Fujitsu Limited | Message analyzing apparatus, message analyzing method, and computer product |
WO2007007410A1 (ja) * | 2005-07-14 | 2007-01-18 | Fujitsu Limited | メッセージ解析装置、メッセージ解析方法およびメッセージ解析プログラム |
JP2008171057A (ja) * | 2007-01-09 | 2008-07-24 | Mitsubishi Electric Corp | システム総合管理システム |
JP2009252006A (ja) * | 2008-04-08 | 2009-10-29 | Nec Computertechno Ltd | コンピュータシステムにおけるログ管理システム、ログ管理方法 |
JP5532143B2 (ja) * | 2010-11-12 | 2014-06-25 | 富士通株式会社 | エラー箇所特定方法、エラー箇所特定装置およびエラー箇所特定プログラム |
WO2012063358A1 (ja) * | 2010-11-12 | 2012-05-18 | 富士通株式会社 | エラー箇所特定方法、エラー箇所特定装置およびエラー箇所特定プログラム |
US9141463B2 (en) | 2010-11-12 | 2015-09-22 | Fujitsu Limited | Error location specification method, error location specification apparatus and computer-readable recording medium in which error location specification program is recorded |
CN103189848A (zh) * | 2010-11-29 | 2013-07-03 | 日本电气株式会社 | 显示处理系统、显示处理方法和程序 |
US9195532B2 (en) | 2010-11-29 | 2015-11-24 | Nec Corporation | Display processing system, display processing method, and program |
JP2013250650A (ja) * | 2012-05-30 | 2013-12-12 | Fujitsu Ltd | 監視装置、情報処理装置、監視プログラム、及び監視方法 |
JP2014222794A (ja) * | 2013-05-13 | 2014-11-27 | 三菱電機株式会社 | 状態監視装置 |
CN108717438A (zh) * | 2018-05-16 | 2018-10-30 | 北京奇艺世纪科技有限公司 | 一种链式数据状态采集系统及方法 |
CN108717438B (zh) * | 2018-05-16 | 2020-10-23 | 北京奇艺世纪科技有限公司 | 一种链式数据状态采集系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113836044B (zh) | 一种软件故障采集和分析的方法及系统 | |
US7051244B2 (en) | Method and apparatus for managing incident reports | |
CN105488610B (zh) | 一种电力应用系统故障实时分析诊断方法 | |
US7266758B2 (en) | Network monitoring program, network monitoring method, and network monitoring apparatus | |
JP4892367B2 (ja) | 異常兆候検出システム | |
US20140172371A1 (en) | Adaptive fault diagnosis | |
CN106789306B (zh) | 通信设备软件故障检测收集恢复方法和系统 | |
JP2004086792A (ja) | 障害情報収集プログラムおよび障害情報収集装置 | |
US20060031906A1 (en) | Information processing apparatus and notification method therefor, program for implementing the method, and storage medium storing the program | |
JP4842738B2 (ja) | 障害管理支援システム及びその情報管理方法 | |
JP2004086278A (ja) | 装置障害監視方法および装置障害監視システム | |
JP6317074B2 (ja) | 障害通知装置、障害通知プログラムならびに障害通知方法 | |
CN105589800A (zh) | 预测复杂系统故障的应用系统 | |
JP5503177B2 (ja) | 障害情報収集装置 | |
CN118606005A (zh) | 一种基于容器的算法训练平台故障自动处理方法及系统 | |
JP4575020B2 (ja) | 障害解析装置 | |
JP4081258B2 (ja) | 管理サーバシステム | |
CN116028251A (zh) | 一种错误日志的上报方法、装置、设备及可读存储介质 | |
CN115686890A (zh) | 一种处理器故障提前预警方法、系统、电子设备及介质 | |
JP2001331330A (ja) | プロセス異常検知及び復旧システム | |
JP4437416B2 (ja) | ネットワーク保守システム | |
JPH04257035A (ja) | 仮想計算機システム配下における障害情報処理方式 | |
JP2006094155A (ja) | ネットワーク障害監視システムおよびそのためのプログラム | |
JP5380386B2 (ja) | 機器情報管理システム及び方法 | |
JP3889177B2 (ja) | 画像形成装置サービスシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20051101 |