JP6291326B2 - Redundant system and alarm management method - Google Patents
Redundant system and alarm management method Download PDFInfo
- Publication number
- JP6291326B2 JP6291326B2 JP2014079339A JP2014079339A JP6291326B2 JP 6291326 B2 JP6291326 B2 JP 6291326B2 JP 2014079339 A JP2014079339 A JP 2014079339A JP 2014079339 A JP2014079339 A JP 2014079339A JP 6291326 B2 JP6291326 B2 JP 6291326B2
- Authority
- JP
- Japan
- Prior art keywords
- alarm
- failure
- information
- standby
- recovery
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、障害アラーム等のアラーム管理を対象とし、冗長システムとアラーム管理方法に適用し得るものである。 The present invention is intended for alarm management such as failure alarms, and can be applied to a redundant system and an alarm management method.
一般に、通信設備に重大な故障が発生しても、システムが提供するサービスの継続が求められる場合には、運用系と待機系とからなる冗長システムを採用することが知られている。通常時は運用系装置が動作し、待機系装置は待機しており、運用系装置の工事や故障時には待機系装置が運用系装置に切り替わって動作する。 In general, it is known to adopt a redundant system composed of an active system and a standby system when continuation of services provided by the system is required even if a serious failure occurs in communication equipment. During normal operation, the active system device operates and the standby system device is in standby mode. When the active system device is under construction or failure, the standby system device switches to the active system device and operates.
例えば、特許文献1には、システム規模及びシステムコストを増大させることなく、運用システムから待機システムへ切り替えることで、無停止メンテナンスを容易かつ確実に行う技術が開示されている。また、特許文献2には短時間で運用系サーバから待機系サーバへと切り替える技術、特許文献3には待機系システムへの切り替え時に、外部装置が、回線切断と誤判断することを防止する技術が開示されている。
For example,
また、特許文献4には運用系がダウンするなどの致命的障害を発生する前に、待機系へ切り替えを行う技術、特許文献5,6,7には、リアルタイム性が要求されるサービスの継続に必要なデータを運用系サーバから待機系サーバに転送してデータ同期させる技術が開示されている。また、共有メモリ上のデータを同期させることで運用系サーバから待機系サーバへとアプリケーションプロセスを停止させることなく切り替える技術等も提案されている。
Patent Document 4 discloses a technique for switching to a standby system before a fatal failure such as an operation system going down.
このように、冗長システムに関する各種の技術が提案されているが、障害アラーム等のアラーム情報を対象としたものではない。冗長システムにおけるアラーム管理に関する技術は、未だ開示されていない。 As described above, various techniques related to the redundant system have been proposed, but are not intended for alarm information such as a failure alarm. A technique related to alarm management in a redundant system has not yet been disclosed.
図16(a)と(b)を参照して冗長システムではないシステム構成におけるアラーム管理手順を簡単に説明する。そのシステムは、ユーザ端末900と、通信設備910と、監視サーバ920と、で構成される。ユーザ端末900と通信設備910とは、図示しないネットワークを介して接続される。同様に通信設備910と監視サーバ920もネットワークを介して接続される。通信設備910は、例えば加入者制御を行うサーバである。ここでは、通信設備910を装置Aと称する。監視サーバ920は、アラーム対応テーブル9201と、アラーム管理テーブル9200と、を備える。
An alarm management procedure in a system configuration that is not a redundant system will be briefly described with reference to FIGS. The system includes a
アラーム対応テーブル9201は、障害のアラーム番号と復旧のアラーム番号を対応付けるもので、復旧アラームを受信した際、どの障害アラームに対する復旧アラームであるかを判断するために用いる。つまり、復旧アラームに記載されている復旧アラーム番号をキーとしてアラーム対応テーブル9201を参照し、解除すべき障害アラームを抽出して障害アラームの解除を行う。例えば、アラーム対応テーブル9201に、障害アラーム番号001と復旧アラーム番号002が対応付けられていれば、復旧アラーム番号002を受信するとアラーム対応テーブル9201を参照することで障害アラーム001が復旧したと判断できる。
The alarm correspondence table 9201 associates a failure alarm number with a recovery alarm number, and is used to determine which failure alarm is a recovery alarm when a recovery alarm is received. That is, referring to the alarm correspondence table 9201 using the recovery alarm number described in the recovery alarm as a key, the failure alarm to be canceled is extracted and the failure alarm is canceled. For example, if a
アラーム管理テーブル9200は、受信した障害アラームと装置名を対応付けるテーブ
ルである。装置Aから障害アラーム001を受信すると、装置Aと障害アラーム001とを対応付けて管理する。アラーム管理手順を順に説明する。先ず障害発生時を、図16(a)を参照して説明する。
The alarm management table 9200 is a table that associates a received failure alarm with a device name. When the
(1)例えばユーザ端末900からのユーザ11のユーザ情報の登録失敗の障害が発生したと仮定する。(数)の表記は図16,17の表記と対応している。(2)装置Aは、障害アラームを監視サーバ920に対して発行する。障害アラームには、障害を特定する障害アラーム番号(例えば001)と、障害アラームを発行した装置名(例えば装置A)が記載されている。そして、装置Aは、(3)障害アラーム番号を保持する。(4)障害アラームを受信した監視サーバ920は、障害アラーム番号とアラームを発行した装置名をアラーム管理テーブル9200に登録する。
(1) For example, it is assumed that a failure of registration failure of user information of the user 11 from the
復旧時を図16(b)を参照して説明する。(5)例えば、ユーザの再試行によってユーザ登録が成功する。すると、(6)装置Aは、復旧アラームを監視サーバ920へ送信する。復旧アラームには、復旧した障害を特定する復旧アラーム番号(例えば002)と復旧アラームを発行した装置名が記載されている。
The time of recovery will be described with reference to FIG. (5) For example, the user registration is successful by the user's retry. Then, (6) Device A transmits a recovery alarm to the
(7)復旧アラームを受信した監視サーバ920は、復旧アラームのアラーム番号をキーとして、アラーム対応テーブル9201より障害アラーム番号(001)に対応する復旧であると判断し、更に、アラーム管理テーブル9200から装置Aの障害アラームに対する復旧であると判断し、アラーム管理テーブル9200から装置Aの障害アラーム(001)を削除することでアラームを解除する。
(7) The
図16に示したアラーム管理方法を、冗長構成をとっているシステムに、そのまま適用することはできない。図17を参照して図16に示したアラーム管理方法を、冗長構成をとるシステムにそのまま適用した場合の課題について説明する。 The alarm management method shown in FIG. 16 cannot be directly applied to a system having a redundant configuration. A problem when the alarm management method shown in FIG. 16 is directly applied to a system having a redundant configuration will be described with reference to FIG.
装置A(910、以降参照符号省略)と装置B(910′、以降参照符号省略)が冗長構成をとり、装置Aが運用系、装置Bが待機系であるとする。監視サーバ920とユーザ端末900とは、上記した実システムと同じものである。また、上記した手順の(1)〜(4)までも同じである。ここでは、装置Aにおいて故障が発生し、待機系の装置Bに運用が切り替わった場合を想定する。
Assume that the device A (910, reference numeral omitted hereinafter) and the device B (910 ', reference symbol omitted) have a redundant configuration, the device A is an active system and the device B is a standby system. The
(5)故障が発生すると、(6)装置Aは、運用を装置Bに切り替える。運用切り替えの後、ユーザ端末900は装置Bに接続される。
(5) When a failure occurs, (6) Device A switches operation to Device B. After the operation switching, the
(7)装置Bに運用を切り替えた後に、例えばユーザの再試行によりユーザ登録が成功すると、装置Bは「装置Aにおいてユーザ登録を失敗」した障害情報を持たないので、装置Bはその障害が復旧したことを判断できない。したがって、復旧アラームは監視サーバ920に送信されない。よって、復旧しているにも関わらず監視サーバ920では障害が継続しているものと判断してしまう。
(7) After the operation is switched to the device B, for example, when the user registration is successful due to the user's retry, the device B does not have the failure information indicating that “user registration failed in the device A”. It cannot be determined that it has recovered. Therefore, the recovery alarm is not transmitted to the
このように、監視サーバ920の保持するアラーム管理テーブル9200と運用系装置の保持する障害情報との間で不一致が生じる課題がある。この課題は、冗長システムを仮想化システムで構成した場合でも同様に発生する。
As described above, there is a problem that a mismatch occurs between the alarm management table 9200 held by the
この発明は、このような課題に鑑みてなされたものであり、監視サーバと運用系装置との間で障害情報の不一致が生じないようにした冗長システムとアラーム管理方法を提供することを目的とする。 The present invention has been made in view of such problems, and an object thereof is to provide a redundant system and an alarm management method in which a mismatch of failure information does not occur between a monitoring server and an operation system device. To do.
本発明の冗長システムは、ネットワークを介して通信する運用系装置と待機系装置と監視サーバと、を備える。運用系装置は、障害アラーム発行部と、障害イベント通知部と、装置アラーム発行部とを具備する。障害アラーム発行部は、障害発生時の障害アラーム情報を監視サーバに通知する。障害イベント通知部は、運用系装置を待機系に切り替える際に、保持している障害イベント情報を上記待機系装置に通知する。装置アラーム発行部は、運用系に系を切り替えた待機系装置の装置名を含む装置アラーム情報を監視サーバに通知する。待機系装置は復旧アラーム発行部を具備する。復旧アラーム発行部は、障害アラーム情報に含まれる識別子と当該待機系装置の装置名の情報を、復旧アラーム情報として監視サーバに通知する。監視サーバは、再登録部と障害アラーム解除部とを具備する。再登録部は、装置アラーム情報を受信した際に、障害アラーム情報に対応させて登録している装置名を、当該装置アラーム情報に含まれる待機系装置の装置名に書き換えて再登録する。障害アラーム解除部は、復旧アラーム情報に含まれる識別子と装置名とで対応する障害アラーム情報を削除することで解除する。 The redundant system of the present invention includes an active device, a standby device, and a monitoring server that communicate via a network. The operational system includes a failure alarm issuing unit, a failure event notification unit, and a device alarm issuing unit. The failure alarm issuing unit notifies the monitoring server of failure alarm information when a failure occurs. The failure event notification unit notifies the standby device of the stored failure event information when switching the active device to the standby system. The device alarm issuing unit notifies the monitoring server of device alarm information including the device name of the standby device that has switched the system to the active system. The standby system device includes a recovery alarm issuing unit. The recovery alarm issuing unit notifies the monitoring server of the identifier included in the failure alarm information and the information on the device name of the standby system device as recovery alarm information. The monitoring server includes a re-registration unit and a failure alarm cancellation unit. When receiving the device alarm information, the re-registration unit re-registers the device name registered corresponding to the failure alarm information with the device name of the standby device included in the device alarm information. The failure alarm cancellation unit is canceled by deleting the failure alarm information corresponding to the identifier and device name included in the recovery alarm information.
また、本発明の冗長システムのアラーム管理方法は、運用系装置が、障害アラーム発行過程と障害イベント通知過程と装置アラーム発行過程とを備える。また、待機系装置は、復旧アラーム発行過程を備える。また、監視サーバは、再登録過程と障害アラーム解除過程とを備える。障害アラーム発行過程は、障害発生時の障害アラーム情報を監視サーバに通知する。障害イベント通知過程は、当該運用系装置を待機系に替える際に、保持している障害イベント情報を待機系装置に通知する。装置アラーム発行過程は、運用系に系を切り替えた待機系装置の装置名を含む装置アラーム情報を監視サーバに通知する。復旧アラーム発行過程は、障害復旧時に、障害イベント情報に含まれる識別子と当該待機系の装置名を、復旧アラーム情報として監視サーバに通知する。再登録過程は、装置アラーム情報を受信した際に、障害アラーム情報に対応させて登録している装置名を、当該装置アラーム情報に含まれる待機系装置の装置名に書き換えて再登録する。障害アラーム解除過程は、復旧アラーム情報に含まれる識別子と装置名とで対応する障害アラーム情報を削除する。 Also, in the redundant system alarm management method according to the present invention, the operating system device includes a failure alarm issuing process, a failure event notifying process, and a device alarm issuing process. The standby system device includes a recovery alarm issuing process. The monitoring server also includes a re-registration process and a failure alarm cancellation process. The failure alarm issuing process notifies the monitoring server of failure alarm information when a failure occurs. The failure event notification process notifies the standby device of the stored failure event information when the active device is switched to the standby system. In the device alarm issuing process, device alarm information including the device name of the standby device that has switched the system to the active system is notified to the monitoring server. In the recovery alarm issuing process, at the time of failure recovery, the identifier included in the failure event information and the standby device name are notified to the monitoring server as recovery alarm information. In the re-registration process, when device alarm information is received, the device name registered corresponding to the failure alarm information is rewritten and re-registered with the device name of the standby device included in the device alarm information. In the failure alarm release process, the failure alarm information corresponding to the identifier and the device name included in the recovery alarm information is deleted.
この発明の冗長システムとアラーム管理方法は、故障や保守等の理由で運用系を切り替える時に、旧運用系装置が保持する障害イベント情報を、新運用系装置(旧待機系装置)に通知するので、新運用系装置において旧運用系装置で生じた障害の復旧を検出することが可能になる。また、運用系を切り替える際に、新運用系装置の装置名が装置アラーム情報として監視サーバに通知されているので、監視サーバは新運用系装置で旧運用系装置で生じた障害が復旧したことを判断でき、監視サーバと運用系装置との間で障害情報の不一致が生じさせない。つまり、監視サーバと運用系装置とが保持する障害情報に乖離を生じさせない効果を奏する。 In the redundant system and alarm management method of the present invention, when the operating system is switched due to a failure or maintenance, the fault event information held by the old operating system is notified to the new operating system (old standby system). Thus, it becomes possible to detect the recovery of a failure that has occurred in the old operation system device in the new operation system device. Also, when the active system is switched, the device name of the new active device is reported to the monitoring server as device alarm information, so that the monitoring server has recovered from the failure that occurred in the old active device on the new active device Therefore, the failure information does not become inconsistent between the monitoring server and the active device. In other words, there is an effect of not causing a difference in the failure information held by the monitoring server and the active device.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
〔実施形態1〕
図1に、実施形態1の冗長システム100の構成例を示す。冗長システム100は、ネットワーク930を介して通信する運用系装置20と待機系装置30と監視サーバ40と、を備える。
FIG. 1 shows a configuration example of the
運用系装置20は、障害アラーム発行部223と、障害イベント通知部224と、装置アラーム発行部226と、を具備する。障害アラーム発行部223は、障害発生時の障害イベント情報を障害アラーム情報として監視サーバ40に通知する。障害イベント通知部224は、当該運用系装置を待機系に切り替える際に、保持している障害イベント情報を
待機系装置30に通知する。障害アラーム情報と障害イベント情報とは、例えば、ユーザ情報登録失敗等の論理的なエラー情報のことである。
The
装置アラーム発行部226は、運用系に系を切り替えた待機系装置30の装置名を含む装置アラーム情報を監視サーバ40に通知する。装置アラーム情報とは、例えば、装置のハードウェアの故障等の物理的なエラー情報のことである。
The device
待機系装置30は、復旧アラーム発行部321を具備する。復旧アラーム発行部321は、障害復旧時に、障害イベント情報に含まれる識別子と当該待機系装置の装置名を、復旧アラーム情報として監視サーバに通知する。
The
監視サーバ40は、再登録部424と、障害アラーム解除部425と、を具備する。再登録部424は、装置アラームを受信した際に、障害イベント情報に対応させて記憶している装置名を、当該装置アラーム情報に含まれる待機系装置の装置名に書き換えて再登録する。障害アラーム解除部425は、復旧アラーム情報に含まれる識別子と装置名とで対応する障害アラーム情報を削除することで解除する。
The monitoring
以上説明した実施形態1の冗長システム100は、運用系装置20を、故障又は保守等の必要性から待機系装置に切り替える場合に、運用系装置20が保持している障害イベント情報を新運用系装置(待機系装置)30に通知するので、新運用系装置30において旧運用系装置20で生じた障害情報を得ることができる。また、新運用系装置30の装置名も監視サーバ40に通知されるので、過去の障害と新運用系装置30とを対応付けることができる。
In the
その結果、新運用系装置30において旧運用系装置20で生じた障害が復旧された場合、その復旧を監視サーバ40に通知することができ、監視サーバ40は、復旧アラーム情報に含まれる識別子と新運用系装置30の装置名とで、障害アラーム情報を削除して解除することができる。このように、冗長システム100では、監視サーバ40で保持する障害情報と運用系装置30の保持する障害情報との間に乖離を生じさせない効果を奏する。また、以上説明したアラーム管理方法によれば、監視サーバはどの装置が運用系/待機系として運用されているかを管理する必要がない。
As a result, when the failure that occurred in the old
次に、図2〜図4を参照して冗長システム100の時系列的動作を説明する。図2は、障害発生時の冗長システム100を示す。運用系装置20と待機系装置30とが冗長構成をとり、監視サーバ40はアラーム管理テーブル420とアラーム対応テーブル422を持つ。アラーム管理テーブル420は障害アラーム情報に含まれる障害を特定するアラーム番号と装置名を対応付けるテーブルである。アラーム対応テーブル422は、アラーム番号と当該アラーム番号に対応する復旧アラーム番号とを対応付けるテーブルである。アラーム対応テーブル422のアラーム番号と障害/復旧とペア情報は、予め監視サーバ40が持っている情報である。
Next, a time-series operation of the
運用系装置40は、例えば加入者制御を行うサーバであり、ユーザ情報を登録するものである。ここでは、ユーザ端末900から入力されるユーザ11のユーザ情報の登録に障害が発生した状況を想定している。図5に示す動作シーケンス図も参照してその動作を説明する。
The
運用系装置20は、運用系装置として動作している(ステップS0)。その状態で、例えばユーザ情報のフォーマット違い等が原因で正常にユーザ11のユーザ情報の登録が出来ない障害が発生したと仮定する(ステップS1)。運用系装置20は、障害発生時の障害アラーム情報を、監視サーバ40に通知する(ステップS2)。障害アラーム情報には、障害を特定するアラーム番号(例えば001)と障害アラーム情報を発行した装置名(20)とが、含まれている。
The
障害アラーム情報を受信した監視サーバ40は、障害アラーム情報に含まれるアラーム番号(001)をアラーム対応テーブル422に照会することで、運用系装置20に障害が発生したことを検知する(ステップS4)。そしてアラーム管理テーブル420に、アラーム番号(001)とアラームを発行した装置名(20)を登録する(ステップS5)。
The monitoring
図3に、故障発生時の冗長システム100を示す。運用系装置20において例えば故障が発生(ステップS6)し、待機系装置30に運用を切り替える事態が発生したとする(ステップS7)。あるいは、運用系装置20を保守する必要から運用系装置20を停止し待機系装置30に切り替えたとする(ステップS7)。切り替えない場合、運用系装置20は運用を継続する(ステップS6のなし)。
FIG. 3 shows the
待機系装置30に運用を切り替える場合、運用系装置20は、保持している障害イベント情報を、待機系装置30に通知する(ステップS8)。待機系装置30は、受信した障害イベント情報を保持する(ステップS9)。障害イベント情報は、上記した障害アラーム情報と基本的に同じものである。 また、運用系装置20は、新たに運用系装置に切り替えた新運用系装置30の装置名と当該切り替え処理を特定するアラーム番号(003)とを含む装置アラーム情報を、監視サーバ40に通知する(ステップS10)。装置アラーム情報を発行した後の運用系装置20は待機系装置として動作する。装置アラーム情報は、監視サーバ40のみに通知される。
When switching the operation to the
装置アラーム情報を受信した監視サーバ40は、装置アラーム情報に含まれるアラーム番号(003)をアラーム対応テーブル422に照会することで、運用系装置20に故障が発生したことを検知する(ステップS11)。そして、運用系装置が装置30に切り替わったことを受信した監視サーバ40は、ステップS4で登録したアラーム番号(001)とアラームを発行した装置名(20)を、アラーム番号(001)と装置名(30)とで再登録する(ステップS12)。この再登録の処理は、運用系装置20で発生した障害アラーム情報を待機系装置30に引き継いだことを意味する。
The monitoring
図4に、障害復旧時の冗長システム100を示す。図4は、新運用系装置30(旧待機系装置)において、旧運用系装置20で生じた障害が復旧した場合を示している。例えばユーザ11の再試行によってユーザ11のユーザ情報の登録が成功した場合を想定する。
FIG. 4 shows the
待機系装置30は、ユーザ11のユーザ登録が成功すると、保持している障害イベント情報から、アラーム番号(001)に対応する復旧であると判断して障害の復旧を検出する(ステップS13)。そして、障害の復旧を検出した新運用系装置30は、障害イベント情報に含まれるアラーム番号(001)に対応する復旧アラーム番号(002)と新運用系装置の装置名30を、復旧アラーム情報として監視サーバ40に通知する(ステップS14)。
When the user registration of the user 11 is successful, the
復旧アラーム情報を受信した監視サーバ40は、復旧アラーム番号(002)からアラーム番号(001)の障害が、装置名30において復旧したと判断する(ステップS15)。そして、監視サーバ40は、アラーム管理テーブル420から、アラーム番号(001)と装置名30とで登録されている障害アラーム情報を削除することで障害アラームの解除を行う(ステップS16)。
The monitoring
このように、故障や保守等の理由で運用系装置20が待機系装置20に運用が切り替わった時、運用系装置20から待機系装置に通知される障害イベント情報によって、障害の情報を待機系装置30へ引き継ぐことで、運用系装置20で発生した障害の復旧を待機系装置(新運用系装置)で検出することができる。また、装置アラーム情報によって、運用系装置20が切り替わったことを、監視サーバ40に通知するので、監視サーバ40は復旧アラーム番号と装置名の両方で、障害の復旧を検出することが可能である。
As described above, when the
以上説明したように、冗長システム100によれば、監視サーバと運用系装置との間で障害情報の不一致を生じさせない。つまり、監視サーバと運用系装置とが保持する障害情報に乖離を生じさせない効果を奏する。また、監視サーバ40は、どの装置が運用系/待機系で運転されているかを管理する必要がない。
As described above, according to the
次に、冗長システム100を構成する各装置のより具体的な機能構成例を示して更に詳しく実施形態1を説明する。
Next, the first embodiment will be described in more detail by showing a more specific functional configuration example of each device constituting the
〔運用系装置〕
図6に、運用系装置20のより具体的な機能構成例を示す。運用系装置20は、通信インターフェース21と、制御部22と、を備える。制御部22は、ユーザ情報登録部220、ユーザ情報記録部221、障害検出保持部222、障害アラーム発行部223、障害イベント通知部224、系切替え信号生成部225、装置アラーム発行部226、障害復旧検出部227、復旧アラーム発行部321、の機能構成部を具備する。各機能構成部は、通信インターフェース21とネットワーク930を介して接続される。運用系装置20は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
[Operational equipment]
FIG. 6 shows a more specific functional configuration example of the
ユーザ情報登録部220は、運用系装置20を、例えば加入者制御を行うサーバ(装置)とした場合に必要になる機能構成部であり、ユーザ端末900から入力されるユーザ情報をユーザ情報記録部221に登録するものである。運用系装置20を、他の用途で用いる装置とした場合、ユーザ情報登録部220とユーザ情報記録部221は、無くても良い機能構成部である。つまり、ユーザ情報登録部220とユーザ情報記録部221は、実施形態1に必須な機能構成部ではない。
The user
障害検出保持部222は、図5に示したステップS1の障害を検出する機能構成部である。障害検出保持部222は、例えばユーザ11のユーザ情報が入力ミスによってフォーマット違いであるような場合を検出する。障害アラーム発行部223は、障害発生時の障害アラーム情報を監視サーバ40に通知する(ステップS2)。
The failure
障害イベント通知部224は、運用系装置20を待機系に切り替える際に、障害検出保持部222が保持している障害イベント情報を待機系装置30に通知する(ステップS8)。待機系の切り替えは、例えば運用系装置20を保守するために停止させる場合に、外部から入力される信号に基づいて行われる。又は、運用系装置20の内部の故障を検出する系切替え信号生成部225を具備し、その出力信号に基づいて待機系に切り替えても良い。
The failure
装置アラーム発行部226は、運用系に切り替えた待機系装置30の装置名を含む装置アラーム情報を監視サーバ40に通知する(ステップS10)。
The device
障害復旧検出部227は、運用系装置20が運転中に、障害検出保持部222に保持されている障害アラーム情報に対応する復旧が検出された場合の障害復旧を検出する。また、復旧アラーム発行部321は、障害復旧検出部227が検出した障害復旧を、復旧アラームとして監視サーバ40に通知する。障害復旧検出部227と復旧アラーム発行部321の機能構成部の処理は、上記した図5においては省略している。これらの処理ステップは、運用系装置20が、故障/保守等を理由とする系の切り替えが不要の場合(ステップS6のなしのループ)に、図5のステップS3とステップS6との間に挿入される。
The failure
〔待機系装置〕
図7に、待機系装置30のより具体的な機能構成例を示す。図6に示した運用系装置20の機能構成部と同じ参照符号が付けられた機能部は、同じものである。運用系装置20の、障害イベント通知部224と系切替え信号生成部225と装置アラーム発行部226と、は具備しない。これらを具備する構成は実施形態2で説明する。
[Standby system]
FIG. 7 shows a more specific functional configuration example of the
逆に、運用系装置20が具備しない障害イベント情報記憶部320を、待機系装置30は具備する。障害イベント情報記憶部320は、運用系装置20から通知される障害イベント情報を記憶する(ステップS9)。上記したように障害イベント情報は、障害アラーム情報と同じものであるため、障害イベント情報記憶部320に運用系装置20で生じた障害の情報が保持される。
Conversely, the
待機系装置30の障害復旧検出部227′は、待機系装置30が運用系装置として運用されている時に生じた障害検出保持部222に保持されている障害と、障害イベント情報記憶部320に保持されている障害イベント情報の両者の復旧を検出する点で異なる。よって、待機系装置30の復旧アラーム発行部321は、旧運用系装置20で発生した障害が、待機系装置30において復旧したことを、監視サーバ40に通知することができる。
The failure
〔監視サーバ〕
図8に、監視サーバ40のより具体的な機能構成例を示す。監視サーバ40は、通信インターフェース41と、制御部42と、を備える。制御部42は、アラーム管理テーブル420、アラーム管理テーブル登録部421、アラーム対応テーブル422、アラーム番号照会部423、再登録部424、障害アラーム解除部425、の機能構成部を具備する。各機能構成部は、通信インターフェース41とネットワーク930を介して接続される。監視サーバ40は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
[Monitoring server]
FIG. 8 shows a more specific functional configuration example of the
アラーム対応テーブル422は、障害アラーム情報に含まれる障害アラーム番号(例えば001)と、装置アラーム情報に含まれるアラーム番号(例えば003)との対応と、を記録する。アラーム対応テーブル422は、障害アラーム情報と装置アラーム情報を、区別して管理する。 The alarm correspondence table 422 records the correspondence between the failure alarm number (for example, 001) included in the failure alarm information and the alarm number (for example, 003) included in the device alarm information. The alarm correspondence table 422 separately manages failure alarm information and device alarm information.
アラーム管理テーブル420は、障害アラーム情報に含まれるアラーム番号(例えば001)と、運用系装置20の装置名(20)又は装置アラーム情報に含まれる待機系装置30の装置名(30)とを対応付けて記録する。
The alarm management table 420 associates the alarm number (for example, 001) included in the failure alarm information with the device name (20) of the
アラーム番号照会部423は、アラーム情報に含まれるアラーム番号(例えば001〜004)をアラーム対応テーブル422に照会することで、その意味を確定させる(ステップS4,S11)。
The alarm
アラーム管理テーブル登録部421は、障害アラーム情報に含まれる障害を特定する識別子と装置名の組を上記アラーム管理テーブルに登録する(ステップS5,S12)。障害を特定する識別子とは、アラーム番号(例えば001)のことである。
The alarm management
再登録部424は、装置アラーム情報を受信した際に、障害アラーム情報に対応させて登録されている装置名を、当該装置アラーム情報に含まれる待機系装置の装置名に書き換えて再登録する(ステップS12)。この例では、「001:装置名20」の登録情報を、「001:装置名30」に再登録する。
When the
障害アラーム解除部425は、復旧アラーム情報に含まれる復旧アラーム番号と装置名とで対応するアラーム管理テーブル420の登録情報を削除することで障害アラームの解除を行う(ステップS16)。この例では、「001:装置名30」で登録されている登録情報を削除することで障害アラームを解除する。
The failure
〔実施形態2〕
以上説明した実施形態1の冗長システム100は、運用系装置と待機系装置とが1台ずつの2重構成の例で説明を行ったが、冗長システム100に示した考えは、3重構成、4重構成といったn重構成(n≧2)の冗長システムに適用することも可能である。図9〜図12を参照してn=3の場合について説明する。
[Embodiment 2]
The
図9に、実施形態2の冗長システム200の障害発生時を示す。冗長システム200は、冗長システム100の構成に、待機系装置31を1台追加して3重構成にしたものである。図9は、図2に示した実施形態1の冗長システム100に対応するものであり、障害アラーム情報に含まれるアラーム番号(001)をアラーム対応テーブル422に照会することで、運用系装置20に障害が発生したことを検知して(ステップS4)、アラーム管理テーブル420に、アラーム番号(001)とアラームを発行した装置名(20)を登録する(ステップS5)。このステップS5の処理まで、図2と同じである。よって、同じステップ番号を図9に示すことで、その説明を省略する。
FIG. 9 illustrates a failure occurrence time of the redundant system 200 according to the second embodiment. The redundant system 200 is configured by adding one
図10に、運用系装置20で故障が発生した時の冗長システム200を示す。図3と同様に、運用系装置が装置30に切り替わったことを受信した監視サーバ40が、ステップS4で登録したアラーム番号(001)とアラームを発行した装置名(20)を、アラーム番号(001)と装置名(30)とで再登録(ステップS12)する処理まで、図3と同じである。よって、同じステップ番号を図10に示すことで、その説明を省略する。
FIG. 10 shows the redundant system 200 when a failure occurs in the
図11に、新運用系装置30(旧待機系装置)で故障が発生した時の冗長システム200を示す。ここでは、旧運用系装置20で生じた障害が復旧しない状態で、新運用系装置30が故障した場合を想定する。以降の動作は、ステップ番号を新たにS26から付して説明する。
FIG. 11 shows the redundant system 200 when a failure occurs in the new active system device 30 (old standby system device). Here, it is assumed that the new
運用系装置30において例えば故障が発生(ステップS26)し、待機系装置31に運用を切り替える事態が発生したとする。あるいは、運用系装置30を保守する必要から運用系装置30を停止し待機系装置31に切り替えたとする(ステップS27)。
For example, it is assumed that a failure has occurred in the active system device 30 (step S26), and a situation has occurred in which the operation is switched to the
運用系装置30は、保持している障害イベント情報を、待機系装置31に通知する(ステップS28)。待機系装置31は、受信した障害イベント情報を保持する(ステップS29)。また、運用系装置30は、新たに運用系装置に切り替えた新運用系装置31の装置名と当該切り替え処理を特定するアラーム番号(003)と当該故障アラーム番号に対応する装置復旧アラーム番号(004)とを含む装置アラーム情報を、監視サーバ40に通知する(ステップS30)。装置アラーム情報を発行した後の運用系装置30は待機系装置として動作する。
The
装置アラーム情報を受信した監視サーバ40は、装置アラーム情報に含まれるアラーム番号(003)をアラーム対応テーブル422に照会することで、運用系装置31に故障が発生したことを検知する((ステップS31)。そして、運用系装置が装置31に切り替わったことを受信した監視サーバ40は、ステップS12で再登録したアラーム番号(001)とアラームを発行した装置名(30)を、アラーム番号(001)と装置名(31)とで再登録する(ステップS32)。この再登録の処理は、運用系装置30で発生した障害アラーム情報を待機系装置31に引き継いだことを意味する。
The monitoring
図12に、待機系装置31において障害が復旧した時の冗長システム200を示す。図12は、新運用系装置31(旧待機系装置)において、旧運用系装置20で生じた障害が復旧した場合を示している。例えばユーザ11の再試行によってユーザ11のユーザ情報の登録が成功した場合を想定する。待機系装置31は、ユーザ11のユーザ登録が成功すると、保持している障害イベント情報から、障害アラーム番号(001)に対応する復旧であると判断して障害の復旧を検出する(ステップS33)。そして、障害の復旧を検出した新運用系装置31は、障害アラーム情報に含まれるアラーム番号(001)に対応する復旧アラーム番号(002)と新運用系装置の装置名31を、復旧アラーム情報として監視サーバ40に通知する(ステップS34)。
FIG. 12 shows the redundant system 200 when the failure is recovered in the
復旧アラーム情報を受信した監視サーバ40は、復旧アラーム番号(002)からアラーム番号(001)の障害が、装置名31において復旧したと判断する(ステップS35)。そして、監視サーバ40は、アラーム管理テーブル420から、アラーム番号(001)と装置名31とで登録されている障害アラーム情報を削除することで障害アラームの解除を行う(ステップS36)。
The monitoring
以上説明したように冗長システム100に示した考えは、n重構成(n≧2)の冗長システム200に適用することが可能である。
As described above, the idea shown in the
冗長システム200における待機系装置30,31は、上記した運用系装置20(図6)と待機系装置30(図7)とがそれぞれ具備する機能構成部を、全て具備する装置であって、当該装置をn個具備することで冗長システム200が構成される。
The
つまり当該装置は、ユーザ情報登録部220、ユーザ情報記録部221、障害検出保持部222、障害アラーム発行部223、障害イベント通知部224、系切替え信号生成部225、装置アラーム発行部226、障害復旧検出部227、復旧アラーム発行部321、障害イベント情報記憶部320、を具備する。
That is, the apparatus includes a user
〔実施形態3〕
実施形態1と2の冗長システム100,200は、仮想化システムで構成することもできる。仮想化システムで構成した実施形態3の冗長システム300は、運用系仮想化装置320と待機系仮想化装置330,331と、監視サーバ40とで構成される。冗長システム300の運用系装置と待機系装置は、仮想装置として仮想化システムで構成される。仮想化システム及び仮想化装置は、周知の技術である。
[Embodiment 3]
The
実施形態3の運用系仮想化装置320と実施形態1又は2の運用系装置20、実施形態3の待機系仮想化装置330,331と実施形態1又は2の待機系装置30,31とは、仮想化装置が仮想化システムで構成されている点のみが異なるだけで、各装置(実施形態3)が行う処理は、実施形態1,2で説明したものと同じである。図13に、実施形態3の冗長システム300の障害発生時を示す。図14に故障発生時の冗長システム300を示す。図15に障害復旧時の冗長システム300を示す。
The active
図13は図2、図14は図3、図15は図4に、それぞれ対応するものである。図13〜図15のそれぞれに、上記したのと同じステップ番号を表記することで、その説明を省略する。 13 corresponds to FIG. 2, FIG. 14 corresponds to FIG. 3, and FIG. 15 corresponds to FIG. The same step numbers as described above are shown in FIGS. 13 to 15, and the description thereof is omitted.
以上説明したように本実施形態の冗長システム100,200,300は、運用系装置を待機系装置に切り替える際に運用系装置が保持している障害イベント情報を障害イベント通知として待機系装置に通知する点、及び、その際に新たに運用系装置となる待機系装置の装置名を、監視サーバに装置アラーム情報として通知する点、及び、監視サーバが障害アラーム情報に対応させて登録している装置名を、装置アラーム情報に含まれる装置名に書き換えて再登録する点、に特徴がある。これらの構成によって、本実施形態の冗長システムは、監視サーバと運用系装置とが保持する障害情報に乖離を生じさせない効果を奏する。
As described above, the
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。 When the processing means in the above apparatus is realized by a computer, the processing contents of the functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of a server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
このように本願発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。 As described above, the present invention is not limited to the above-described embodiment, and various modifications can be made within the scope of the gist thereof.
100:冗長システム
930:ネットワーク
900:ユーザ端末
20:運用系装置
223:障害アラーム発行部
224:障害イベント通知部
226:装置アラーム発行部
30:待機系装置
321:復旧アラーム発行部
40:監視サーバ
424:再登録部
425:障害アラーム解除部
100: Redundant system 930: Network 900: User terminal 20: Active device 223: Failure alarm issuing unit 224: Failure event notifying unit 226: Device alarm issuing unit 30: Standby device 321: Recovery alarm issuing unit 40: Monitoring server 424 : Re-registration unit 425: Fault alarm cancellation unit
Claims (8)
上記運用系装置は、
障害発生時の障害アラーム情報を上記監視サーバに通知する障害アラーム発行部と、
当該運用系装置を待機系に切り替える際に、保持している障害イベント情報を上記待機系装置に通知する障害イベント通知部と、
運用系に系を切り替えた上記待機系装置の装置名を含む装置アラーム情報を上記監視サーバに通知する装置アラーム発行部と、を具備し、
上記待機系装置は、
障害復旧時に、上記障害イベント情報に含まれる識別子と当該待機系装置の装置名とを、復旧アラーム情報として監視サーバに通知する復旧アラーム発行部を具備し、
上記監視サーバは、
上記装置アラーム情報を受信した際に、上記障害アラーム情報に対応させて登録している装置名を、当該装置アラーム情報に含まれる上記待機系装置の装置名に書き換えて再登録する再登録部と、
上記復旧アラーム情報に含まれる識別子と装置名とで対応する障害アラーム情報を削除することで解除する障害アラーム解除部と、を具備する、
ことを特徴とする冗長システム。 A redundant system comprising an active device, a standby device, and a monitoring server that communicate via a network,
The above operational system
A failure alarm issuing unit for notifying the monitoring server of failure alarm information when a failure occurs;
A fault event notification unit for notifying the standby system of the fault event information held when switching the active system to the standby system;
A device alarm issuing unit for notifying the monitoring server of device alarm information including the device name of the standby device that has switched the system to the active system,
The standby system device
At the time of failure recovery, comprising a recovery alarm issuing unit for notifying the monitoring server as the recovery alarm information of the identifier included in the failure event information and the device name of the standby system device,
The monitoring server
A re-registration unit that, when receiving the device alarm information, rewrites and re-registers the device name registered corresponding to the failure alarm information with the device name of the standby device included in the device alarm information; ,
A failure alarm canceling unit that cancels the failure alarm information corresponding to the identifier and device name included in the recovery alarm information,
A redundant system characterized by that.
上記運用系装置は、
更に、
障害発生時の障害イベント情報を検出して保持する障害検出保持部を具備し、
上記待機系装置は、
更に、
運用系装置から通知された障害イベント情報を記憶する障害イベント情報記憶部と、
上記障害イベント情報記憶部に記憶されている障害イベント情報と、新たに生じた障害の復旧を検出する障害復旧検出部とを具備し、
上記監視サーバは、
更に、
上記障害アラーム情報に含まれるアラーム番号と復旧アラーム番号との対応と、上記装置アラーム情報に含まれるアラーム番号と装置復旧アラーム番号との対応と、を記録するアラーム対応テーブルと、
上記障害アラーム情報に含まれるアラーム番号と、上記運用系装置の装置名又は装置アラーム情報に含まれる上記待機系装置の装置名とを対応付けて記録するアラーム管理テーブルと、
上記障害アラーム情報に含まれるアラーム番号と上記装置アラーム情報に含まれるアラーム番号とを、照会することで当該アラーム番号の意味を確定させるアラーム番号照会部と、
上記障害アラーム情報に含まれる障害を特定する識別子と装置名の組を上記アラーム管理テーブルに登録するアラーム管理テーブル登録部とを具備する、
ことを特徴とする冗長システム。 The redundant system according to claim 1,
The above operational system
Furthermore,
A failure detection holding unit that detects and holds failure event information when a failure occurs,
The standby system device
Furthermore,
A failure event information storage unit for storing failure event information notified from the active device;
The failure event information stored in the failure event information storage unit, and a failure recovery detection unit that detects recovery of a newly generated failure,
The monitoring server
Furthermore,
An alarm correspondence table for recording the correspondence between the alarm number and the recovery alarm number included in the failure alarm information, and the correspondence between the alarm number and the device recovery alarm number included in the device alarm information;
An alarm management table for recording the alarm number included in the failure alarm information and the device name of the active device or the device name of the standby device included in the device alarm information in association with each other;
An alarm number inquiry unit for confirming the meaning of the alarm number by referring to the alarm number included in the failure alarm information and the alarm number included in the device alarm information;
An alarm management table registration unit for registering a pair of an identifier and a device name for identifying a failure included in the failure alarm information in the alarm management table;
A redundant system characterized by that.
上記待機系装置を複数備え、
各々の上記待機系装置は、上記障害アラーム発行部、上記障害イベント通知部、上記装置アラーム発行部、上記復旧アラーム発行部、上記障害検出保持部、上記障害イベント情報記憶部、及び上記障害復旧検出部を
具備することを特徴とする冗長システム。 In the redundant system according to claim 1 or 2,
A plurality of the standby system devices are provided ,
Each of the standby devices includes the failure alarm issuing unit, the failure event notifying unit, the device alarm issuing unit, the recovery alarm issuing unit, the failure detection holding unit, the failure event information storage unit, and the failure recovery detection. Part
A redundant system comprising:
上記運用系装置と上記待機系装置とは、仮想装置として仮想化システムで構成されることを特徴とする冗長システム。 In the redundant system according to claim 1 or 2,
The redundant system characterized in that the operational system device and the standby system device are configured as virtual devices in a virtualized system.
上記運用系装置は、
障害発生時の障害アラーム情報を上記監視サーバに通知する障害アラーム発行過程と、
当該運用系装置を待機系に切り替える際に、保持している障害イベント情報を上記待機系装置に通知する障害イベント通知過程と、
運用系に系を切り替えた上記待機系装置の装置名を含む装置アラーム情報を上記監視サーバに通知する装置アラーム発行過程と、を行い、
上記待機系装置は、
障害復旧時に、上記障害イベント情報に含まれる識別子と当該待機系装置の装置名を、復旧アラーム情報として監視サーバに通知する復旧アラーム発行過程を行い、
上記監視サーバは、
上記装置アラーム情報を受信した際に、上記障害アラーム情報に対応させて登録している装置名を、当該装置アラーム情報に含まれる上記待機系装置の装置名に書き換えて再登録する再登録過程と、
上記復旧アラーム情報に含まれる識別子と装置名とで対応する障害アラーム情報を削除することで解除する障害アラーム解除過程と、を行う、
ことを特徴とするアラーム管理方法。 An alarm management method executed by a redundant system comprising an active device, a standby device, and a monitoring server that communicate via a network,
The above operational system
A failure alarm issuing process for notifying the monitoring server of failure alarm information when a failure occurs;
A failure event notification process for notifying the standby device of the failure event information held when the active device is switched to the standby system;
Carried out, and the device alarm issue process of notification to the monitoring server the device alarm information, including the device name of the standby system device switching the system to the operation system,
The standby system device
At the time of failure recovery, perform the recovery alarm issuing process of notifying the monitoring server as the recovery alarm information of the identifier included in the failure event information and the device name of the standby system device,
The monitoring server
A re-registration process in which when the device alarm information is received, the device name registered in correspondence with the failure alarm information is rewritten and re-registered with the device name of the standby device included in the device alarm information; ,
Performing a failure alarm cancellation process that is canceled by deleting the failure alarm information corresponding to the identifier and device name included in the recovery alarm information,
Features and be a luer alarm management method that.
上記運用系装置は、
更に、
障害発生時の障害イベント情報を検出して保持する障害検出保持過程を行い、
上記待機系装置は、
更に、
運用系装置から通知された障害イベント情報を障害イベント情報記憶部に記憶する障害イベント情報記憶過程と、
上記障害イベント情報記憶部に記憶されている障害イベント情報と、新たに生じた障害の復旧を検出する障害復旧検出過程とを行い、
上記監視サーバは、
更に、
上記障害アラーム情報に含まれるアラーム番号と上記装置アラーム情報に含まれるアラーム番号とを、アラーム番号と装置名を対応付けたテーブルであるアラーム管理テーブルに照会することで当該アラーム番号の意味を確定させるアラーム番号照会過程と、
上記障害アラーム情報に含まれる障害を特定する識別子と装置名の組を上記アラーム管理テーブルに登録するアラーム管理テーブル登録過程とを行う、
ことを特徴とするアラーム管理方法。 In the alarm management method executed by the redundant system according to claim 5,
The above operational system
Furthermore,
Perform failure detection holding process to detect and hold failure event information at the time of failure occurrence,
The standby system device
Furthermore,
A failure event information storage process for storing the failure event information notified from the active device in the failure event information storage unit ;
Performing the failure event information stored in the failure event information storage unit and the failure recovery detection process for detecting the recovery of a newly generated failure,
The monitoring server
Furthermore,
The meaning of the alarm number is determined by referring to the alarm management table, which is a table in which the alarm number and the device name are associated with each other, with the alarm number included in the failure alarm information and the alarm number included in the device alarm information. Alarm number inquiry process,
Performing an alarm management table registration process for registering a pair of an identifier and a device name for identifying a fault included in the fault alarm information in the alarm management table;
Features and be a luer alarm management method that.
上記待機系装置を複数備え、
各々の上記待機系装置は、上記障害アラーム発行過程、上記障害イベント通知過程、上記装置アラーム発行過程、上記復旧アラーム発行過程、上記障害検出保持過程、上記障害イベント情報記憶過程、及び上記障害復旧検出過程を行う
ことを特徴とするアラーム管理方法。 In the alarm management method executed by the redundant system according to claim 5 or 6,
A plurality of the standby system devices are provided ,
Each of the standby devices includes the failure alarm issuing process, the failure event notification process, the device alarm issuing process, the recovery alarm issuing process, the failure detection holding process, the failure event information storing process, and the failure recovery detection. Do the process
Features and be a luer alarm management method that.
上記運用系装置と上記待機系装置とは、仮想装置として仮想化システムで構成され、上記運用系装置と上記待機系装置が行う各過程は、上記仮想化システムが行う
ことを特徴とする冗長システムのアラーム管理方法。 In the alarm management method executed by the redundant system according to claim 5 or 6,
The active device and the standby device are configured as a virtual device in a virtualization system, and each process performed by the active device and the standby device is performed by the virtualization system.
An alarm management method for a redundant system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014079339A JP6291326B2 (en) | 2014-04-08 | 2014-04-08 | Redundant system and alarm management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014079339A JP6291326B2 (en) | 2014-04-08 | 2014-04-08 | Redundant system and alarm management method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015201031A JP2015201031A (en) | 2015-11-12 |
JP6291326B2 true JP6291326B2 (en) | 2018-03-14 |
Family
ID=54552241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014079339A Active JP6291326B2 (en) | 2014-04-08 | 2014-04-08 | Redundant system and alarm management method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6291326B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7340573B2 (en) * | 2021-08-27 | 2023-09-07 | エヌ・ティ・ティ・アドバンステクノロジ株式会社 | Information processing method, information processing system |
CN115499295A (en) * | 2022-07-29 | 2022-12-20 | 浪潮通信技术有限公司 | Server failure reporting method, device, electronic equipment and storage medium |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3291328B2 (en) * | 1992-11-04 | 2002-06-10 | 富士通株式会社 | Monitoring device |
JP3428260B2 (en) * | 1995-11-30 | 2003-07-22 | 富士通株式会社 | Line switching control device |
JP2003022259A (en) * | 2001-07-06 | 2003-01-24 | Mitsubishi Electric Corp | Client server control system |
JP2006039662A (en) * | 2004-07-22 | 2006-02-09 | Hitachi Ltd | Proxy response device when failure occurs to www server and www server device equipped with the proxy response device |
JP5948933B2 (en) * | 2012-02-17 | 2016-07-06 | 日本電気株式会社 | Job continuation management apparatus, job continuation management method, and job continuation management program |
-
2014
- 2014-04-08 JP JP2014079339A patent/JP6291326B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015201031A (en) | 2015-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6333410B2 (en) | Fault processing method, related apparatus, and computer | |
CN108900353B (en) | Fault warning method and terminal equipment | |
CN110807064B (en) | Data recovery device in RAC distributed database cluster system | |
KR101558047B1 (en) | Cluster system and method for providing service availbility in cluster system | |
EP3210367B1 (en) | System and method for disaster recovery of cloud applications | |
JP2010128644A (en) | Failure restoration method, program and management server | |
US10353786B2 (en) | Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program | |
WO2014076838A1 (en) | Virtual machine synchronization system | |
CN103493021A (en) | Virtual machine high availability | |
JP6447258B2 (en) | Management program, management method, and management apparatus | |
CN113360579A (en) | Database high-availability processing method and device, electronic equipment and storage medium | |
KR100922584B1 (en) | Distributed object-sharing system and method thereof | |
JP2006012004A (en) | Hot standby system | |
JP6291326B2 (en) | Redundant system and alarm management method | |
CN105740049B (en) | A kind of control method and device | |
CN110968456B (en) | Method and device for processing fault disk in distributed storage system | |
US7865766B2 (en) | Providing increased availability of I/O drawers during concurrent I/O hub repair | |
CN109189854A (en) | The method and node device of sustained traffic are provided | |
JP5537599B2 (en) | Version upgrade management method in business system | |
US7343534B2 (en) | Method for deferred data collection in a clock running system | |
CN116149749A (en) | Retry method, device, equipment and storage medium for business operation | |
CN109634252B (en) | Root cause diagnosis method and device | |
JP5670935B2 (en) | Distributed data management system and operation method thereof | |
Lennert et al. | The automated backup solution—safeguarding the communications network infrastructure | |
JP2011081830A (en) | Server switching method, program and management server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160715 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6291326 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |