JP2007026038A - Path monitoring system, path monitoring method and path monitoring program - Google Patents
Path monitoring system, path monitoring method and path monitoring program Download PDFInfo
- Publication number
- JP2007026038A JP2007026038A JP2005206568A JP2005206568A JP2007026038A JP 2007026038 A JP2007026038 A JP 2007026038A JP 2005206568 A JP2005206568 A JP 2005206568A JP 2005206568 A JP2005206568 A JP 2005206568A JP 2007026038 A JP2007026038 A JP 2007026038A
- Authority
- JP
- Japan
- Prior art keywords
- server
- path
- paths
- failure
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、障害が発生した場合に現有系サーバを待機系サーバに切り替えるために、ストレージと現用系サーバとを接続する複数のパス中から障害が発生したパスを監視するパス監視システム,パス監視方法,およびパス監視プログラムに関する。 The present invention relates to a path monitoring system for monitoring a path in which a failure has occurred from a plurality of paths connecting a storage and an active server in order to switch a current server to a standby server when a failure occurs. The present invention relates to a method and a path monitoring program.
従来より、ストレージデバイスに対するアクセスを複数のアクセスパスに分散するストレージデバイスのマルチバスシステムの技術が知られている(例えば、特許文献1参照)。このマルチバスシステムは、プログラム制御により動作するホストコンピュータと、ホストコンピュータに接続されたバス制御アダプタ,制御バス,ストレージデバイスを含んで構成されている。そして、ホストコンピュータは、複数のパスを検出する複数パス検出手段が備えられ、ストレージデバイスは、ホストコンピュータによってストレージデバイスに与えられるユニークIDを格納するユニーク格納領域を有している。 2. Description of the Related Art Conventionally, a storage device multi-bus system technology that distributes access to a storage device to a plurality of access paths is known (see, for example, Patent Document 1). This multi-bus system includes a host computer that operates under program control, a bus control adapter connected to the host computer, a control bus, and a storage device. The host computer is provided with a plurality of path detecting means for detecting a plurality of paths, and the storage device has a unique storage area for storing a unique ID given to the storage device by the host computer.
このシステムは、複数パス検出手段がホストコンピュータとストレージデバイスとの間の複数のアクセスパスのうち任意の1つのアクセスパスを使用してストレージデバイス内のユニークID格納領域に、該当するストレージデバイスに対するユニークIDを書き込むことにより、当該ストレージデバイスと複数のアクセスパスとを関連づけている。 In this system, the multi-path detection means uses a single access path among a plurality of access paths between the host computer and the storage device to store the unique ID for the corresponding storage device in the unique ID storage area in the storage device. The storage device is associated with a plurality of access paths by writing the ID.
又、ホットスタンバイシステムでの回線系障害処理方式の技術が、従来より知られている(例えば特許文献2参照)。この回線系障害処理方式は、主記憶装置及び中央処理装置からなる第1の処理系と、この第1の処理系と同様、主記憶装置及び中央処理装置からなる第2の処理系と、第1の処理系の中央処理装置および第2の処理系の中央処理装置のいずれかに回線接続可能な第1の通信制御装置と第2の通信制御装置と、前述した第1の通信制御装置と第2の通信制御装置を、前述した第1の処理系の中央処理装置及び第2の処理系の中央処理装置のいずれかに回線を切り替えるための回線切換え装置とから構成されている。 In addition, a technique of a line system failure processing method in a hot standby system has been known (see, for example, Patent Document 2). This line fault processing method includes a first processing system comprising a main storage device and a central processing unit, a second processing system comprising a main storage device and a central processing unit, as well as the first processing system, A first communication control device and a second communication control device connectable to any one of the central processing unit of the first processing system and the central processing unit of the second processing system, and the first communication control device described above, The second communication control device is composed of a line switching device for switching the line to either the first processing system central processing device or the second processing system central processing device described above.
この回線系障害処理方式では、処理系の性能低下とならない通信制御装置の障害が発生した場合でも、ある一定以上の回線数が縮退したならば、処理系を切換え、通信制御装置を初期化、及び外部端末との再接続を行うことにより、システムの停止を救済するようにしている。 In this line system fault processing method, even if a communication control device failure that does not degrade the processing system performance occurs, if the number of lines more than a certain level degenerates, the processing system is switched and the communication control device is initialized. In addition, the system is relieved from being stopped by reconnection with an external terminal.
しかしながら、上述したストレージデバイスのマルチバスシステムでは、各ストレージデバイスへの複数のアクセスパスを自動的に検出し、ストレージデバイスに対するアクセスの負荷を複数のアクセスパスに適切に分散するようにしたものであり、現在処理中の現用系サーバとストレージと間に接続するパス障害によって、自動的に待機系サーバに処理を切り換えるものではない。従って、アクセスパスに障害が発生した場合には、システムのパフォーマンスが低下するという問題点があった。 However, in the above-described multi-bus system of storage devices, a plurality of access paths to each storage device are automatically detected, and the load of access to the storage device is appropriately distributed to the plurality of access paths. However, the processing is not automatically switched to the standby server due to a path failure connecting between the active server being processed and the storage. Therefore, when a failure occurs in the access path, there is a problem that the system performance is degraded.
また、ホットスタンバイシステムでの回線系障害処理方式では、通信ネットワーク回線の切り換え処理を行うものであり、基本的に回線が二系統のものであり、パスを複数(例えば10数本以上)有するもののストレージのパフォーマンスを維持するような内容のものではない。 Also, in the line fault processing method in the hot standby system, communication network line switching processing is performed, basically two lines are used, and there are a plurality of paths (for example, more than ten). It is not intended to maintain storage performance.
本発明は、上述した問題点に鑑みてなされたものであって、現用系サーバとストレージとの間にバランス良く接続された複数のパスにつき、その障害によるパフォーマンスの低下を事前に回避することが可能なパス監視システム,パス監視方法,およびパス監視プログラムを提供することを、その目的とする。 The present invention has been made in view of the above-described problems, and it is possible to avoid in advance deterioration in performance due to a failure of a plurality of paths connected in good balance between the active server and the storage. An object of the present invention is to provide a path monitoring system, a path monitoring method, and a path monitoring program that can be used.
上記目的達成するために、本発明では、稼働中の現有系サーバとストレージとを接続する複数本のパスを対象としてその障害発生を監視すると共に、障害発生時には当該現有系サーバを同等に機能する待機系サーバに切り替える機能を備えている。前述した現有系サーバに、当該現有系サーバとストレージとを接続する複数本のパスの障害発生を監視する現有系バス監視機構が併設されている。この現有系バス監視機構は、前述した待機系サーバに処理を移す基準である障害発生パスの本数を示す限界パス本数を予め記憶する設定情報記憶手段と、現有系サーバとストレージとをつなぐ複数のパスの中から障害が発生したパスの本数を検出する障害パス検出手段と、この障害パス検出手段により検出された障害発生パスの本数が、前述した設定情報記憶手段に予め記憶された限界パス本数以上であるか否かを判定するパス本数判定手段とを備えている。更に、この現有系バス監視機構は、前述したパス本数判定手段によって障害発生パス本数が限界パス本数以上であると判定した場合に作動し前記現有系サーバから前記待機系サーバに切り替える要求を出力する切替え要求出力手段とを備えた構成とした(請求項1乃至4)。 To achieve the above object, according to the present invention, the occurrence of a failure is monitored for a plurality of paths connecting an active current server and a storage, and the current server functions equally when a failure occurs. A function for switching to a standby server is provided. The above-described current server is provided with a current bus monitoring mechanism that monitors the occurrence of a failure in a plurality of paths connecting the current server and the storage. This current bus monitoring mechanism includes a plurality of setting information storage means for preliminarily storing a limit path number indicating the number of faulty paths that is a reference for transferring processing to the standby server, and a plurality of connections between the current server and the storage. Failure path detection means for detecting the number of paths in which a failure has occurred from among the paths, and the limit number of paths in which the number of failure paths detected by the failure path detection means is stored in advance in the setting information storage means described above Path number determining means for determining whether or not the above is true. Furthermore, this current system bus monitoring mechanism operates when the path number determination means described above determines that the number of failed paths is greater than or equal to the limit number of paths, and outputs a request to switch from the current server to the standby server. The switching request output means is provided (claims 1 to 4).
このため、現用系サーバとストレージとの間に接続する複数のパスの障害を有効に検出し得ると共に障害発生パス数が所定本数を越えた場合に直ちに待機系サーバに切り替え得るようにしたので、複数パスを備えたシステムのパフォーマンスの低下を事前に有効に回避することができる。 For this reason, it is possible to effectively detect the failure of a plurality of paths connected between the active server and the storage and to switch to the standby server immediately when the number of failed paths exceeds a predetermined number. It is possible to effectively avoid beforehand a decrease in performance of a system having multiple paths.
ここで、前述した待機系サーバに、前述した現有系サーバに装備された現有系バス監視機構と同等の構成を有し且つ同等に機能する待機系バス監視機構を併設してもよい(請求項2)。また、前述した現有系サーバに、前記ストレージとの間で成される処理動作を当該現有系サーバから前述した待機系サーバに切替え制御するサーバ切替え制御機構を併設してもよい(請求項3)。このようにすると、サーバ切替えを瞬時に成し得ることから、障害パスの発生に対しても信頼性あるシステムを構築することができる。 Here, the standby server described above may be provided with a standby bus monitoring mechanism having the same configuration and functioning as the existing bus monitoring mechanism installed in the existing server. 2). In addition, a server switching control mechanism that controls the processing operation performed between the current server and the storage from the current server to the standby server may be provided in the above-described current server. . In this way, since server switching can be performed instantaneously, it is possible to construct a system that is reliable even when a failure path occurs.
更に、前述したサーバ切替え制御機構が、前記現有系バス監視機構の切替え要求手段から出力される切替え要求に基づいて作動し前記現有サーバから待機系サーバへ切り替えるサーバ切替え制御機能と、このサーバの切替えと同時に作動し前記現有系バスの監視を停止する監視動作停止機能と、サーバの切替えが成された後に作動し当該新たな現有サーバと成った側のパスの監視を開始する監視動作開始機能とを備えた構成としてもよい。このようにすると、サーバの切替えがあっても前述した接続パスに対する監視を中断することがなくなり、かかる点においても信頼性あるシステムを構築することができる。 Further, the server switching control mechanism described above operates based on the switching request output from the switching request means of the existing bus monitoring mechanism and switches from the current server to the standby server, and switching of this server. A monitoring operation stop function that operates simultaneously and stops monitoring of the existing bus, and a monitoring operation start function that starts after the server is switched and starts monitoring the path on the side of the new current server; It is good also as a structure provided with. In this way, even if the server is switched, the monitoring of the connection path described above is not interrupted, and a reliable system can be constructed in this respect as well.
又、本発明にかかるパス監視方法は、稼働中の現有系サーバとストレージとを接続する複数本のパスを対象としてその障害発生を監視すると共に、障害発生時には当該現有系サーバを同等に機能する待機系サーバに切り替えるように機能するパス監視方法であって、前述した現有系サーバと前記ストレージとをつなぐ前記複数のパスの中から障害が発生したパスの本数を検出する障害パス検出工程と、検出した障害発生パスの本数が、予め記憶した切替え基準値である障害発生パスの本数を示す限界パス本数以上であるか否かを判定するパス本数判定工程と、前記障害が発生したパス本数が前記限界パス本数以上であると判定した場合に作動しサーバの切替え要求を出力する切替え要求出力工程とを備えた構成とした(請求項5)。 In addition, the path monitoring method according to the present invention monitors the occurrence of a failure for a plurality of paths connecting an active current server and a storage, and functions the existing server equally when a failure occurs. A path monitoring method that functions to switch to a standby server, the fault path detecting step of detecting the number of paths in which a fault has occurred among the plurality of paths connecting the existing server and the storage, A path number determining step for determining whether or not the number of detected faulty paths is equal to or greater than a limit path number indicating the number of faulty paths that is a switching reference value stored in advance, and the number of paths in which the fault has occurred And a switching request output step that operates when it is determined that the number of paths is equal to or more than the limit path and outputs a server switching request.
このため、現用系サーバとストレージとの間に接続する複数のパスの障害を確実に検出し得ると共に障害発生パス数が所定本数を越えた場合に直ちに待機系サーバに切り替えるることができる。 For this reason, it is possible to reliably detect the failure of a plurality of paths connected between the active server and the storage, and to immediately switch to the standby server when the number of failed paths exceeds a predetermined number.
ここで、前述した切替え要求出力工程によって出力されるサーバ切替え要求に基づいてサーバを現有系サーバから待機系サーバへ切り替えるサーバ切替え制御工程と、このサーバの切替え動作と同時に作動し前記現有系バスの監視を停止する監視動作停止工程と、サーバの切替えが成された後に作動し当該新たな現有サーバと成った側のパスの監視を開始する監視動作開始工程とを備えた構成としてもよい(請求項6)。 Here, a server switching control process for switching a server from a current server to a standby server based on the server switching request output by the switching request output process described above, and the current bus A monitoring operation stop step for stopping monitoring and a monitoring operation start step that starts after the server is switched and starts monitoring the path on the side that has become the new existing server may be provided. Item 6).
現有系サーバとストレージとを接続する複数のパスの障害発生状況を定期的に監視するパス監視プログラムであって、現有系サーバとストレージとをつなぐ複数のパスの中から障害が発生したパスの本数を検出する障害パス検出機能、検出した前記障害が発生したパスの本数が予め記憶されたサーバ切替え基準をなす障害発生パスの本数を示す限界パス本数以上であるか否かを判定する障害パス数判定機能、前記障害が発生したパスの本数が前記限界パス本数以上であると判定した場合に作動し前記現有系サーバから前記待機系サーバに切り換え要求を出力する切替え要求出力機能、をコンピュータに実行させることを特徴とした(請求項7)。 A path monitoring program that periodically monitors the failure occurrence status of multiple paths connecting the current server and storage, and the number of paths that have failed from the multiple paths connecting the current server and storage Failure path detection function that detects the number of failed paths that determine whether or not the number of detected faulted paths is greater than or equal to a limit path number indicating the number of failed paths that constitute a server switching criterion stored in advance A determination function, a switching request output function that operates when it is determined that the number of failed paths is greater than or equal to the limit number of paths and outputs a switching request from the current server to the standby server is executed on the computer (Claim 7).
これにより、現用系サーバとストレージとの間に接続する複数のパスの障害によるパフォーマンスの低下を事前に且つ迅速に回避することができる。 As a result, it is possible to avoid in advance and quickly a decrease in performance due to a failure of a plurality of paths connected between the active server and the storage.
本発明によると、現用系サーバとストレージとの間に接続する複数のパスの障害を有効に検出し得ると共に障害発生パス数が所定本数を越えた場合に直ちに待機系サーバに切り替えるようにしたので、複数パスを備えたシステムのパフォーマンスの低下を事前に有効に回避することができる。 According to the present invention, the failure of a plurality of paths connected between the active server and the storage can be detected effectively, and when the number of failed paths exceeds the predetermined number, the server is immediately switched to the standby server. Therefore, it is possible to effectively avoid a decrease in performance of a system having a plurality of paths in advance.
以下、発明を実施するための最良の形態を図面に基づき説明する。 The best mode for carrying out the invention will be described below with reference to the drawings.
図1は、本発明の実施形態に係るパス監視システムの構成を示すブロック図である。この実施形態のパス監視システムは、例えばDB(データベース)サーバ等の現用系サーバに障害に発生したとき、待機系サーバに処理を引き継ぐ(接続を切り替える)システムである。図1に、現用系サーバとしてのアクティブサーバ1と、待機系としてのスタンバイサーバ2と、サーバ切替制御機構3と、ストレージ4との接続関係を示す。ここで、ストレージ4は複数のパスを介して現用系サーバと接続されている。 FIG. 1 is a block diagram showing a configuration of a path monitoring system according to an embodiment of the present invention. The path monitoring system of this embodiment is a system that takes over processing (switches connection) to a standby server when a failure occurs in an active server such as a DB (database) server. FIG. 1 shows a connection relationship among an active server 1 as an active server, a standby server 2 as a standby system, a server switching control mechanism 3, and a storage 4. Here, the storage 4 is connected to the active server via a plurality of paths.
アクティブサーバ1には、図1に示すように、現有系パス監視機構11が併設されている。又、符号1〜nに示すFCカード12は現用系サーバのパス連結部を示す。
この現有系パス監視機構11は、パス監視定義ファイ11A、サーバ切替判別部11B、及び障害パス本数検出部11Cを備えた構成となっている。ここで、アクティブサーバ1は、CPU(図示せず)及びパス監視システムを実行させるパス監視制御プログラムを記憶するメモリ(図示せず)を備えている。そして、CPUは、パス監視制御プログラムを実行することにより、サーバ切替判別部11B及び障害パス本数検出部11Cの機能を実行させる。
As shown in FIG. 1, the active server 1 is provided with a current path monitoring mechanism 11. Further,
The existing path monitoring mechanism 11 includes a path
サーバ切替部判別部(障害パス本数判定手段、および切替え要求手段)11Bは、まず、(障害パス本数判定手段が作動して)障害パス本数検出部11Cからストレージ4に接続されているパスのうち障害が発生しているパスの本数(以下「障害パス」という)を定期的に取得し、パス監視定義ファイル11Aで定義されている設定情報に記述されている限界パス本数以上になっているか否かを判別する。サーバ切替部判別部11Bは、設定情報に記述されている限界パス本数以上になっていると判別した場合には、(切替え要求手段が機能して)待機しているスタンバイサーバ2に処理を切り替える切替え要求をサーバ切替制御機構3に出力する。限界パス本数とは、アクティブサーバ1をスタンバイサーバ2に処理を移す基準を成すもので障害が発生したパスの本数を示す。
The server switching unit discriminating unit (failed path number determining unit and switching requesting unit) 11B first (of the paths connected to the storage 4 from the failed path
設定情報記憶手段としてのパス監視定義ファイル11Aは、サーバ切替判別部11Bが実行するため設定情報を記憶する。この設定情報には、図2に示すように、情報採取の時間間隔項目11Aaと限界パス本数項目11Abとを有している。情報採取の時間間隔項目11Aaは、複数のパスの中から障害パスの本数を障害パス本数検出部11Cが検出する時間間隔、例えば60秒が記述されており、限界パス本数項目11Abは、上述した限界パス本数が記述されている。尚、限界パス本数項目11Abに記述されている限界パス本数がデフォルトの場合には、限界パス本数を「(サーバパス本数n÷2)+1」とする。
The path
障害パス検出手段としての障害パス本数検出部11Cは、サーバ切替判別部11Bからの要求に従って、設定情報中の情報採取時間間隔項目11Aaに記述されている情報採取時間間隔ごとに、アクティブサーバ2がストレージ4に接続する1〜nのパスの中から障害パスの本数を検出し、同時にこの検出した障害パスの本数をサーバ切替判別部11Bに出力する。
In response to a request from the server switching determination unit 11B, the failure path
符号1〜nのFCカード12は、シリアル伝送用のカードであって、一つのFCカードで一つのパスを有し、ストレージ4に搭載されている符号1〜nのFCモジュールの対応する箇所との間にデータや制御信号を入出力する。
The
スタンバイサーバ2は、アクティブサーバ1が故障した場合又は故障の可能性が高い場合に、アクティブサーバ1の処理を引き継ぐものであって、アクティブサーバ1と同一の構成を有する。すなわち、スタンバイサーバ2には、図1に示すように、待機系パス監視機構21が併設されている。符号1〜nに示すFCカード22は、ストレージ4との接続用端子を示す。ここで、スタンバイサーバ2は、アクティブサーバ1から処理を引き継いだ時点で、実際にはアクティブサーバの立場を有する。
The standby server 2 takes over the processing of the active server 1 when the active server 1 fails or when the possibility of failure is high, and has the same configuration as the active server 1. That is, the standby server 2 is provided with a standby path monitoring mechanism 21 as shown in FIG.
上述した待機系パス監視機構21は、パス監視定義ファイ21A、サーバ切替判別部21B、及び障害パス本数検出部21Cから構成されている。ここで、スタンバイサーバ2は、CPU(図示せず)、及びパス監視システムを実行させるアクティブサーバ1が有するものと同一なパス監視制御プログラムを記憶するメモリ(図示せず)を備えている。そして、CPUは、パス監視制御プログラムを実行することにより、サーバ切替判別部21B及び障害パス本数検出部21Cの機能を実行させる。
The standby path monitoring mechanism 21 described above includes a path monitoring
サーバ切替部判別部21Bは、障害パス本数検出部21Cから、ストレージ4に接続されているパスのうち障害が発生している障害パスと定期的に取得し、パス監視定義ファイル21Aで定義されている設定情報に記述されている限界パス本数以上になっているか否かを判別する。サーバ切替部判別部21Bは、設定情報に記述されている限界パス本数以上になっていると判別した場合には、待機しているスタンバイサーバ(実際には上述したアクティサーバ1)に処理を切り替える要求をサーバ切替制御機構3に出力する。
The server switching
パス監視定義ファイル21Aは、サーバ切替判別部21Bが実行するための設定情報を記憶する。この設定情報は、アクティブサーバ1を構成するパス監視定義ファイル11Aと同一である。
The path
障害パス本数検出部(障害パス検出手段)21Cは、サーバ切替判別部21Bからの要求に従って、設定情報中の情報採取時間間隔項目に記述されている情報採取時間間隔ごとに、アクティブサーバ2がストレージ4に接続する1〜nのパスの中から障害パスの本数を検出し、検出した障害パスの本数をサーバ切替判別部21Bに出力する。
The failure path number detection unit (failure path detection unit) 21C stores the active server 2 for each information collection time interval described in the information collection time interval item in the setting information in accordance with a request from the server switching determination unit 21B. 4 detects the number of failed paths from 1 to n paths connected to 4, and outputs the detected number of failed paths to the server
符号1〜nのFCカード22は、シリアル伝送用のカードであって、一つのFCカードで一つのパスを有し、ストレージ4に搭載されている符号1〜nのFCモジュールの対応する箇所との間にデータや制御信号を入出力する。
The
サーバ切替制御機構3は、アクティブサーバ1をスタンバイサーバ2に処理を引き継がせるものであって、サーバ切替え制御機能3Aと、サーバ稼働停止制御部としても機能するパス監視動作停止機能31と、サーバ稼働開始部としても機能するパス監視動作開始機能32とを備えている。
サーバ稼働停止部(パス監視動作停止機能)31は、サーバ切替判別部11Aから入力されたアクティブサーバ1からスタンバイサーバ2に処理を引き継がせる要求に基づき、アクティブサーバ1の稼働を停止させ(同時に又は続いて、パス監視動作を停止させ)、その旨をサーバ稼働開始部(パス監視動作開始機能)32に出力する。サーバ稼働開始部32は、サーバ稼働停止部31から入力されたアクティブサーバ1を停止された旨の情報に基づいて作動しスタンバイサーバ2の稼働を開始させる(同時に又は続いて、現有系となったスタンバイサーバ2側のパス監視動作を開始させる)。
The server switching control mechanism 3 takes over the processing of the active server 1 to the standby server 2, and includes a server
The server operation stop unit (path monitoring operation stop function) 31 stops the operation of the active server 1 (simultaneously or based on a request to transfer processing from the active server 1 to the standby server 2 input from the server
ストレージ4は、記憶装置であって、ディスク41とFCモジュール42とを備える。ディスク41は、データ等を記憶しており、FCモジュール42は、1〜nのコネクタ部分を有しており、各コネクタ部分は、アクティブサーバ1の1〜nの所定のFCカード、及びスタンバイサーバ2の1〜Nの所定のFCカードと接続されている。
The storage 4 is a storage device and includes a
次に、この実施形態のパス監視システムの動作を、図3に基づいて説明する。 Next, the operation of the path monitoring system of this embodiment will be described with reference to FIG.
アクティブサーバ1の電源が入ると、パス監視機構11を構成するサーバ切替判別部11Aは、パス監視定義ファイル11Aに記憶されている設定情報を読み出す(ステップ100)。その後、サーバ切替判別部11Bは、読み出した設定情報に記述されている情報採取時間間隔、例えば60秒が経過したか否かを判定する(ステップ101)。
When the power of the active server 1 is turned on, the server
サーバ切替判別部11Bは、情報採取時間が経過していないと判定した場合には(ステップ101;ノー)、情報採取時間が経過する迄この処理を続行し、一方、情報採取時間が経過したと判定した場合には(ステップ101;イエス)、障害パス本数検出部11Cに対してアクティブサーバ1とストレージ4との間に接続するn本のパスのうち障害のあるパスの本数の検出要求を出力する。
If the server switching determination unit 11B determines that the information collection time has not elapsed (
次に、障害パス本数検出部11Cは、1〜nのFCカード12を介してストレージ4の1〜NのFCモジュールに対して試験信号を出力し、その試験信号に対する応答信号の出力結果、例えば、応答信号がない場合、応答信号があっても正しい応答でない場合等を障害があるパスとして取り扱い、n本のパスのうち障害のある障害パスの本数を検出する(ステップ102)。その後、障害パス本数検出部11Cは、検出した障害パスの本数をサーバ切替判別部11Bに出力する。
Next, the failure path
サーバ切替判別部11Bは、障害パス本数検出部11Cから障害パスの本数が入力されると、先に読み出された設定情報の限界パス本数項目11Abに限界パス本数が記述されているか否かを判定する(ステップ103)。サーバ切替判別部11Bは、限界パス本数項目に限界パス本数が記述されていないと判定した場合、すなわち限界パス本数項目がデフォルトの場合には(ステップ103;ノー)、限界パス本数を「(全パスn/2)+1」とし決定し(ステップ104)、ステップ105に処理を移行する。一方、サーバ切替判別部11Bは、限界パス本数項目11Abに限界パス本数が記述されていると判定した場合(ステップ103;イエス)、記述されている数を限界パス本数と決定する(ステップ105)。
When the number of failure paths is input from the failure path
サーバ切替判別部11Bは、限界パス本数を決定すると、障害パス本数検出部11Cから入力された障害パスの本数が決定した限界パス本数以上であるか否かを判定する(ステップ106)。その結果、サーバ切替判別部11Bは、障害パスの本数が決定した限界パス本数未満であると判定した場合には(ステップ106;ノー)、情報採取時間の計時を再び開始し、ステップ101に処理を移行し、上述したと同一の処理を続行する。一方、サーバ切替判別部11Bは、障害パスの本数が決定した限界パス本数以上であると判定した場合には(ステップ106;イエス)、アクティブサーバ1とストレージ4との間にパス障害が発生する虞が高いものと判定し、パス障害の発生を未然に防止するためにアクティブサーバ1の替わりにスタンバイサーバ2を稼働させるべく、切替え制御機能3Aを作動させてアクティブサーバ1の停止要求をサーバ切替制御機構3のサーバ稼働停止制御部31に出力する(ステップ107)。
When the limit number of paths is determined, the server switching determination unit 11B determines whether or not the number of failure paths input from the failure path
サーバ稼働停止制御部31は、サーバ切替判別部11Bからアクティブサーバ1の停止要求が入力されると、直ちにサーバ切替え制御機能3Aが作動し、アクティブサーバ1の稼働を停止させと共にパス監視動作も停止させ、当該アクティブサーバ1を停止させた旨をサーバ稼働開始制御部32に出力する(ステップ108)。
When the server
その後、サーバ稼働開始制御部32は、スタンバイサーバ2の稼働要求を出力してスタンバイサーバ2を稼働させると共にパス監視動作も開始させ、スタンバイサーバ2にアクティブサーバ1と同一の処理を実行させる。これにより、アクティブサーバ1からスタンバイサーバ2への切替え処理を終了する(ステップ109、110)。
Thereafter, the server operation start
この実施形態によれば、サーバ切替判別部11Bにより、障害パス本数検出部3により検出された障害が発生したパスの本数が、限界パス本数以上であるか否かを判定し、障害が発生したパス本数が、限界パス本数以上であると判定した場合には、アクティブサーバ1からスタンバイサーバ2に処理を切り替える要求を出力するので、アクティブサーバ1とストレージとの間のパスの障害によるパフォーマンスの低下の虞を事前に確実に回避することができる。 According to this embodiment, the server switching determination unit 11B determines whether or not the number of failed paths detected by the failed path number detection unit 3 is greater than or equal to the limit path number, and a failure has occurred. When it is determined that the number of paths is equal to or greater than the limit number of paths, a request to switch processing from the active server 1 to the standby server 2 is output, so that performance degradation due to a path failure between the active server 1 and the storage The fear of this can be reliably avoided in advance.
1 アクティブサーバ(現有系サーバ)
2 スタンバイサーバ(待機系サーバ)
3 サーバ切替制御機構
4 ストレージ
11 現有系パス監視機構
11A パス監視定義ファイル(設定情報記憶手段)
11B サーバ切替判別部(障害パス本数判定手段、切替え要求手段)
11C 障害パス本数検出部(障害パス検出手段)
12 FCカード
21 待機系パス監視機構
22 FCカード
21A パス監視定義ファイル
21B サーバ切替判別部(障害パス本数判定手段、切替え要求手段)
21C 障害パス本数検出部
31 サーバ稼働停止制御部(パス監視動作停止機能)
32 サーバ稼働開始制御部(パス監視動作開始機能)
41 ディスク
42 FCモジュール
1 Active server (current server)
2 Standby server (standby server)
3 Server switching control mechanism 4 Storage 11 Current system
11B Server switching determination unit (failure path number determination means, switching request means)
11C Failure path number detection unit (failure path detection means)
12 FC card 21 standby
21C Failure path
32 Server operation start control unit (path monitoring operation start function)
41
Claims (7)
前記現有系サーバに、当該現有系サーバとストレージとを接続する複数本のパスの障害発生を監視する現有系バス監視機構を併設すると共に、
この現有系バス監視機構が、前記待機系サーバに処理を移す基準である障害発生パスの本数を示す限界パス本数を予め記憶する設定情報記憶手段と、
前記現有系サーバと前記ストレージとをつなぐ前記複数のパスの中から障害が発生したパスの本数を検出する障害パス検出手段と、
この障害パス検出手段により検出された前記障害発生パスの本数が、前記設定情報記憶手段に予め記憶された限界パス本数以上であるか否かを判定するパス本数判定手段と、
このパス本数判定手段によって前記障害発生パス本数が前記限界パス本数以上であると判定した場合に作動し前記現有系サーバから前記待機系サーバに切り替える要求を出力する切替え要求出力手段と、
を備えていることを特徴としたパス監視システム。 Path monitoring with the ability to monitor the failure of multiple paths that connect the active current server and storage, and to switch the current server to a standby server that functions equally when a failure occurs In the system,
The current server is provided with a current bus monitoring mechanism for monitoring the failure occurrence of a plurality of paths connecting the current server and the storage,
This existing bus monitoring mechanism is configured to store in advance a limit path number indicating the number of failure paths, which is a reference for transferring processing to the standby server;
A failure path detection means for detecting the number of paths in which a failure has occurred from among the plurality of paths connecting the current server and the storage;
A path number determination means for determining whether or not the number of the failure path detected by the failure path detection means is greater than or equal to a limit path number stored in advance in the setting information storage means;
A switching request output unit that operates when it is determined by the path number determination unit that the number of failed paths is greater than or equal to the limit path number, and outputs a request to switch from the current server to the standby server;
A path monitoring system characterized by comprising:
前記待機系サーバに、前記現有系サーバに装備された現有系バス監視機構と同等の構成を有し且つ同等に機能する待機系バス監視機構を併設したことを特徴とするパス監視システム。 The path monitoring system according to claim 1, wherein
A path monitoring system, wherein a standby bus monitoring mechanism having the same configuration and functioning as the current bus monitoring mechanism installed in the current server is added to the standby server.
前記現有系サーバに、前記ストレージとの間で成される処理動作を当該現有系サーバから前記待機系サーバに切替え制御するサーバ切替え制御機構を併設したことを特徴とするパス監視システム。 In the path monitoring system according to claim 1 or 2,
A path monitoring system, characterized in that a server switching control mechanism for switching a processing operation performed between the current server and the storage from the current server to the standby server is provided in the current server.
前記サーバ切替え制御機構が、前記現有系バス監視機構の切替え要求手段から出力される切替え要求に基づいて作動し前記現有サーバから待機系サーバへ切り替えるサーバ切替え制御機能と、このサーバの切替えと同時に作動し前記現有系バスの監視を停止する監視動作停止機能と、サーバの切替えが成された後に作動し当該新たな現有サーバと成った側のパスの監視を開始する監視動作開始機能とを備えていることを特徴としたパス監視システム。 The path monitoring system according to claim 3, wherein
The server switching control mechanism operates based on a switching request output from the switching request means of the existing bus monitoring mechanism and switches from the current server to the standby server, and operates simultaneously with the server switching. A monitoring operation stop function for stopping monitoring of the existing bus, and a monitoring operation start function for starting monitoring of a path on the side of the new existing server that is operated after the server is switched. A path monitoring system characterized by
前記現有系サーバと前記ストレージとをつなぐ前記複数のパスの中から障害が発生したパスの本数を検出する障害パス検出工程と、
検出した障害発生パスの本数が、予め記憶した切替え基準値である障害発生パスの本数を示す限界パス本数以上であるか否かを判定するパス本数判定工程と、
前記障害が発生したパス本数が前記限界パス本数以上であると判定した場合に作動しサーバの切替え要求を出力する切替え要求出力工程と、
を備えたことを特徴とするパス監視方法。 Monitors the failure of multiple paths that connect the active current server and storage, and also switches the current server to a standby server that functions equally when a failure occurs. A method,
A failure path detection step of detecting the number of paths in which a failure has occurred from among the plurality of paths connecting the current server and the storage;
A path number determination step for determining whether or not the number of detected faulty paths is equal to or greater than a limit path number indicating the number of faulty paths that are switching reference values stored in advance;
A switching request output step that operates when it is determined that the number of paths in which the failure has occurred is greater than or equal to the limit number of paths, and outputs a server switching request;
A path monitoring method comprising:
前記現有サーバから待機系サーバへの切替え要求に基づいてサーバを現有系サーバから待機系サーバへ切り替えるサーバ切替え制御工程と、
このサーバの切替え動作と同時に作動し前記現有系バスの監視を停止する監視動作停止工程と、サーバの切替えが成された後に作動し当該新たな現有サーバと成った側のパスの監視を開始する監視動作開始工程とを備えていることを特徴としたパス監視方法。 The path monitoring method according to claim 5, wherein
A server switching control step of switching the server from the current server to the standby server based on the switching request from the current server to the standby server;
A monitoring operation stop process that operates simultaneously with the server switching operation and stops monitoring the existing bus, and starts monitoring the path on the side that has become the new existing server that operates after the server switching. A path monitoring method comprising: a monitoring operation start step.
前記現有系サーバと前記ストレージとをつなぐ前記複数のパスの中から障害が発生したパスの本数を検出する障害パス検出機能、
検出した前記障害が発生したパスの本数が予め記憶されたサーバ切替え基準をなす障害発生パスの本数を示す限界パス本数以上であるか否かを判定する障害パス数判定機能、
前記障害が発生したパスの本数が前記限界パス本数以上であると判定した場合に作動し前記現有系サーバから前記待機系サーバに切り換え要求を出力する切替え要求出力機能、 をコンピュータに実行させることを特徴としたパス監視プログラム。 A path monitoring program that periodically monitors the failure occurrence status of multiple paths connecting the current server and storage.
A failure path detection function for detecting the number of paths in which a failure has occurred from among the plurality of paths connecting the current server and the storage;
A failure path number determination function for determining whether or not the number of detected failure paths is greater than or equal to a limit path number indicating the number of failure occurrence paths that constitute a server switching criterion stored in advance;
Causing the computer to execute a switching request output function that operates when it is determined that the number of failed paths is greater than or equal to the limit number of paths, and outputs a switching request from the current server to the standby server. A featured path monitoring program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005206568A JP2007026038A (en) | 2005-07-15 | 2005-07-15 | Path monitoring system, path monitoring method and path monitoring program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005206568A JP2007026038A (en) | 2005-07-15 | 2005-07-15 | Path monitoring system, path monitoring method and path monitoring program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007026038A true JP2007026038A (en) | 2007-02-01 |
Family
ID=37786711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005206568A Pending JP2007026038A (en) | 2005-07-15 | 2005-07-15 | Path monitoring system, path monitoring method and path monitoring program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007026038A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008337A1 (en) * | 2013-07-16 | 2015-01-22 | 富士通株式会社 | Information processing device, port control program, and port control method |
KR20200084074A (en) * | 2019-01-02 | 2020-07-10 | 나이스평가정보 주식회사 | A system for monitoring financial risk based on technology information and a method for the same |
-
2005
- 2005-07-15 JP JP2005206568A patent/JP2007026038A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015008337A1 (en) * | 2013-07-16 | 2015-01-22 | 富士通株式会社 | Information processing device, port control program, and port control method |
JPWO2015008337A1 (en) * | 2013-07-16 | 2017-03-02 | 富士通株式会社 | Information processing apparatus, port control program, and port control method |
US9921924B2 (en) | 2013-07-16 | 2018-03-20 | Fujitsu Limited | Information processing device, port control method, and computer-readable recording medium |
KR20200084074A (en) * | 2019-01-02 | 2020-07-10 | 나이스평가정보 주식회사 | A system for monitoring financial risk based on technology information and a method for the same |
KR102169066B1 (en) * | 2019-01-02 | 2020-10-22 | 나이스평가정보 주식회사 | A system for monitoring financial risk based on technology information and a method for the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6625761B1 (en) | Fault tolerant USB method and apparatus | |
CN101714108B (en) | Synchronization control apparatus, information processing apparatus, and synchronization management method | |
US6671831B1 (en) | Fault tolerant USB method and apparatus | |
JP4695705B2 (en) | Cluster system and node switching method | |
CN110213065B (en) | Method and device for switching paths | |
EP2784677A1 (en) | Processing apparatus, program and method for logically separating an abnormal device based on abnormality count and a threshold | |
US7676693B2 (en) | Method and apparatus for monitoring power failure | |
JP2007026038A (en) | Path monitoring system, path monitoring method and path monitoring program | |
JP5176914B2 (en) | Transmission device and system switching method for redundant configuration unit | |
JP2009110218A (en) | Virtualization switch and computer system using the same | |
JP2004007930A (en) | System and program for controlling power system monitoring | |
JP2014532236A (en) | Connection method | |
JP3266841B2 (en) | Communication control device | |
JP6654662B2 (en) | Server device and server system | |
JP4983806B2 (en) | System monitoring apparatus and monitoring method using dual timer | |
EP3779699A1 (en) | Method for checking program execution of a microcontroller, external device, system and non-transitory computer readable medium | |
CN111522718A (en) | Server power supply system and server | |
JP2007028118A (en) | Failure judging method of node device | |
JPH1196033A (en) | Information processor | |
JP2001175545A (en) | Server system, fault diagnosing method, and recording medium | |
JP3363579B2 (en) | Monitoring device and monitoring system | |
JP5556226B2 (en) | Interface test apparatus and interface test method | |
JP3298989B2 (en) | Failure detection / automatic embedded device | |
JP3107104B2 (en) | Standby redundancy method | |
JP3169488B2 (en) | Communication control device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090706 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090908 |