JP5763030B2 - Duplex network control system and duplex network control method - Google Patents
Duplex network control system and duplex network control method Download PDFInfo
- Publication number
- JP5763030B2 JP5763030B2 JP2012216201A JP2012216201A JP5763030B2 JP 5763030 B2 JP5763030 B2 JP 5763030B2 JP 2012216201 A JP2012216201 A JP 2012216201A JP 2012216201 A JP2012216201 A JP 2012216201A JP 5763030 B2 JP5763030 B2 JP 5763030B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- access
- network
- received
- slave
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、二重化されたネットワークを制御する技術に関するものである。 The present invention relates to a technique for controlling a duplexed network.
従来、二重化されたネットワーク構成を有するシステムにおいては、一方の系のネットワークに障害が発生した場合に他の系のネットワークに切り替える様々な技術が存在する。例えば、特許文献1では、ネットワークを構成する各系の装置から取得した通信状態情報からその装置の通信状態を評価・数値化し、その値が小さい系のネットワークの方が、より運用リスクが低いネットワークであると判断し、ネットワークの系を切り替えている。 Conventionally, in a system having a duplexed network configuration, there are various techniques for switching to another network when a failure occurs in one network. For example, in Patent Document 1, a communication state of a device is evaluated and digitized from communication state information acquired from each system device constituting the network, and a network with a smaller value has a lower operational risk. The network system is switched.
上述した特許文献1では、各装置から一定時間内に応答があった場合には通信状態が正常であると判断する一方、一定時間内に応答がなかった場合には通信状態が正常でないと判断し、正常ではないと判断された装置の数によって系の切替を判断している。しかしながら、特許文献1では各系の装置について通信状態を集約して判断する必要があるため、どちらの系に異常があるか否か容易に判別できないという問題があった。 In Patent Document 1 described above, if there is a response from each device within a certain time, it is determined that the communication state is normal, while if there is no response within a certain time, it is determined that the communication state is not normal. The switching of the system is determined based on the number of devices determined not to be normal. However, in Patent Document 1, since it is necessary to collectively determine the communication status for each system apparatus, there is a problem that it is not easy to determine which system has an abnormality.
本発明は、上記に鑑みてなされたものであって、二重化されたネットワークにおいて、どちらの系で障害が発生したのかを容易に判断することが可能な二重化ネットワーク制御システムおよび二重化ネットワーク制御方法を提供することを目的とする。 The present invention has been made in view of the above, and provides a duplexed network control system and a duplexed network control method capable of easily determining which system has failed in a duplexed network. The purpose is to do.
上述した課題を解決し、目的を達成するために、本発明にかかる二重化ネットワーク制御システムは、マスタノードと、前記マスタノードに第1のネットワークを介して接続されたスレーブノードと、前記マスタノードと前記スレーブノードと間で通信する他のノードと、が第2のネットワークで接続された二重化ネットワーク制御システムであって、前記マスタノードおよび前記スレーブノードは、互いに前記第2のネットワークを介してアクセスが可能であることを確認する監視部と、前記監視部による監視の結果、相手ノードから前記アクセスに対する応答を受信したか否かを判定し、前記相手ノードから前記アクセスに対する応答を受信していないと判定した場合、前記第2のネットワークを介して前記他のノードに対して前記アクセスをしてその実行結果を互いに前記第1のネットワークを介して送受信し、送受信した前記実行結果を比較することにより前記マスタノードまたは前記スレーブノードのいずれに障害があるかを判別する障害判断部と、前記他のノードは、前記マスタノードおよび前記スレーブノードから前記アクセスを受けた場合に前記アクセスに対する実行結果を送信する処理部と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, a duplex network control system according to the present invention includes a master node, a slave node connected to the master node via a first network, and the master node. A duplex network control system in which another node communicating with the slave node is connected by a second network, wherein the master node and the slave node can access each other via the second network. As a result of monitoring by the monitoring unit that confirms that it is possible, as a result of monitoring by the monitoring unit, it is determined whether a response to the access has been received from the counterpart node, and if a response to the access has not been received from the counterpart node If determined, the access to the other node via the second network is performed. The failure determination unit determines whether the master node or the slave node has a failure by transmitting and receiving the execution results to each other via the first network and comparing the transmitted and received execution results. The other node includes a processing unit that transmits an execution result for the access when the access is received from the master node and the slave node.
また、本発明は、上記二重化ネットワーク制御システムで行われる二重化ネットワーク制御方法である。 The present invention is also a duplex network control method performed in the duplex network control system.
本発明によれば、二重化されたネットワークにおいて、どちらの系で障害が発生したのかを容易に判断することが可能な二重化ネットワーク制御システムおよび二重化ネットワーク制御方法を提供することができる。 According to the present invention, it is possible to provide a duplexed network control system and a duplexed network control method that can easily determine which system has a failure in a duplexed network.
以下に添付図面を参照して、本発明にかかる二重化ネットワーク制御システムおよび二重化ネットワーク制御方法の実施の形態を詳細に説明する。 Exemplary embodiments of a duplex network control system and a duplex network control method according to the present invention will be explained below in detail with reference to the accompanying drawings.
図1は、本発明に係る二重化ネットワーク制御システムの構成例を示す図である。図1に示すように、二重化ネットワーク制御システム1000は、複数のノード100と、マスタノード200と、スレーブノード300と、ネットワークN1、N2およびN3とを有して構成されている。なお、ネットワークN1およびN2は、例えば、WAN(Wide Area Network)あるいはLAN(Local Area Network)等の一般的な通信網であり、ネットワークN3は、マスタノード200とスレーブノード300との間を接続する専用LANである。まず、ノード100について説明する。
FIG. 1 is a diagram showing a configuration example of a duplex network control system according to the present invention. As shown in FIG. 1, the duplex
ノード100は、例えば、PC(Personal Computer)やサーバ等の情報処理装置から構成される。後述するように、ノード100は、ネットワークN1およびN2を介したマスタノード200とスレーブノード300との間のアクセスが不可能となり、これらのノードでその原因が判別できず、マスタノード200およびスレーブノード300で実行されている他ノードへのアクセス処理(例えば、スレーブノード300の共有メモリをリードする処理)が、第三のノードであるいずれかのノード100(基本的には、マスタノード200またはスレーブノード300に近いノード)に対して実行された場合に、そのアクセス処理の実行結果を、マスタノード200およびスレーブノード300にフィードバックする。
The
図2は、ノード100の機能的な構成を示すブロック図である。図2に示すように、ノード100は、通信部101と、障害時処理部102と、制御部103とを有して構成されている。
FIG. 2 is a block diagram showing a functional configuration of the
通信部101は、例えば、NIC(Network Interface Card)等の通信機器であり、自身のノードと他のノード100、マスタノード200、スレーブノード300との間で通信するための種々の情報を送受信する。
The
障害時処理部102は、マスタノード200およびスレーブノード300からアクセス処理の実行を受けて、その結果をマスタノード200およびスレーブノード300に通信部101を介して送信する。
The
制御部103は、例えば、CPU(Central Processing Unit)であり、上述したノード100の各部の動作を制御する。また、制御部103の内部には、不図示のメモリを有しており、自ノードを識別するための識別情報(例えば、IPアドレス、MACアドレス等のアドレス情報)を記憶している。続いて、マスタノード200について説明する。なお、以下ではマスタノード200についてのみ説明しているが、スレーブノード300についても同様の構成を有している。
The
図3は、マスタノード200の機能的な構成を示すブロック図である。図3に示すように、マスタノード200は、通信部201と、監視部202と、障害判断部203と、記憶部204と、制御部205とを有して構成されている。
FIG. 3 is a block diagram showing a functional configuration of the
通信部201は、例えば、NIC等の通信機器であり、自ノードとスレーブノード300、および自ノードとノード100との間で通信するための種々の情報を送受信する。
The
監視部202は、ネットワークN3を介して、自ノードとの間の接続が有効な状態であるか否かを確認するためのアライブ情報(例えば、キーアライブパケット)をスレーブノード300から定期的に取得することにより、相手先ノードであるスレーブノード300の接続状態を確認する。例えば、監視部202は、200msごとにキーアライブパケットを受信しないことを確認した場合、スレーブノード300が有効な状態ではないと判断し、スレーブノード300との接続を切断する。スレーブノード300が有する監視部についても、これと同様に、ネットワークN3を介して、アライブ情報をマスタノード200から定期的に取得し、マスタノード200との間の接続状態を確認している。
The
なお、図1においては特に明示していないが、マスタノード200およびスレーブノード300は、不図示のバスにより接続され、監視部202は、互いの起動・停止状態を監視している。例えば、監視部202は、スレーブノード300の電源がON状態となっているか否か、CPUが起動している状態であるか否かを監視している。
Although not explicitly shown in FIG. 1, the
また、監視部202は、ネットワークN1またはN2を介して、スレーブノード300に対するアクセス処理を定期的に監視し、そのアクセス処理に異常が発生しているか否かを判定する。例えば、監視部202は、ネットワークN1またはN2を介して200msごとにスレーブノード300の共有メモリにアクセスし、記憶されているデータのリードが可能か否かを判断する。スレーブノード300が有する監視部についても、これと同様に、ネットワークN1またはN2を介して、マスタノード200に対するアクセスを定期的に監視し、そのアクセスに異常が発生しているか否かを判定している。
In addition, the
また、監視部202は、ネットワークN1またはN2を介してサイクリック通信を行い、自ノードが有する共有メモリが記憶するデータを定期的にスレーブノード300に送信し、互いの共有メモリに記憶されているデータの同期性を監視する。スレーブノード300が有する監視部についても、これと同様に、ネットワークN1またはN2を介してサイクリック通信を行い、自ノードが有する共有メモリのデータを周期的にマスタノード200に送信し、互いの共有メモリに記憶されているデータの同期性を監視している。
In addition, the
また、監視部202は、ネットワークN1またはN2に接続されるノードを定期的に監視し、これらのネットワークに接続される最新のノードのノード構成情報(後述)を記憶部204に記憶させる。
In addition, the
障害判断部203は、監視部202が監視しているスレーブノード300の接続状態や起動・停止状態を確認し、マスタノード200とスレーブノード300との間で接続が可能な状態であるか否か、スレーブノード300の電源がON状態であるかCPUが起動している状態であるか否かを判断し、その状態となっている原因を切り分ける処理(障害判定処理)およびアクセス処理を実行する。障害判断部203が行う処理の具体的な内容については、フローチャートを用いて後述する。
The
記憶部204は、例えば、一般的なメモリであり、スレーブノード300やノード100との間の通信に必要な各種の情報を記憶する。
The
図4は、記憶部204が記憶するネットワークN1またはN2が有するノードの構成情報(例えば、リングマップのようなノード構成情報)の例を示す図である。図4に示すように、ノード構成情報は、ノードを識別するためのノード識別情報と、そのノードのアドレス情報と、そのノードの構成スペック(CPU、メモリ、ディスク容量)とが対応付けて記憶されている。図4では、ネットワークN1のノードとして、ノード識別情報が「N101」で識別されるノードがあり、そのノードのIPアドレスは「123.456.012」であり、CPU、メモリ、ディスク容量はそれぞれ、3.4GHz、2GB、100GBであることを示している。このノード構成情報は、監視部202によって定期的に最新の状態に更新される。
FIG. 4 is a diagram illustrating an example of node configuration information (for example, node configuration information such as a ring map) included in the network N1 or N2 stored in the
また、記憶部204は、共有メモリとしての役割を有し、上述したノード構成情報のほか、マスタノード200とスレーブノード300との間で同期して記憶すべき各種の情報を記憶する。後述するように、マスタノード200とスレーブノード300との間でアクセスができない状態となった場合、障害判断部203は、図5に示すように、上述したノード構成情報の中から、その時点でマスタノード200またはスレーブノード300に最も近いIPアドレスを有したノード100(最小値ノード)に対してアクセス処理を実行することとなる。
The
制御部205は、例えば、CPU(Central Processing Unit)であり、マスタノード200の各部の動作を制御する。続いて、二重化ネットワーク制御システム1000で行われる障害判定処理について説明する。
The
図6A、6Bは、上述した障害判定処理の処理手順を示すフローチャートである。以下では、マスタノード200における障害判定処理について説明しているが、スレーブノード300でもこれと同様の処理を行っているものとする。
6A and 6B are flowcharts illustrating the processing procedure of the above-described failure determination processing. In the following, the failure determination process in the
図6Aに示すように、まず、マスタノード200の監視部202は、スレーブノード300から受信したアライブ情報を参照し、スレーブノード300に接続可能な状態か否かを確認し、通信判断部203は、監視部202がスレーブノード300に接続可能な状態と確認したか否かを判定する(ステップS601)。
As shown in FIG. 6A, first, the
そして、障害判断部203は、監視部202がスレーブノード300に接続可能な状態と確認したと判定した場合(ステップS601;Yes)、さらに監視部202がスレーブノード300の電源がON状態であってCPUが起動している状態を確認したか否かを判定する(ステップS602)。
When the
障害判断部202は、監視部202がスレーブノード300に接続可能な状態と確認していないと判定した場合(ステップS601;No)、または監視部202がスレーブノード300の電源がON状態であってCPUが起動している状態を確認していないと判定した場合(ステップS602;No)、スレーブノード300は停止中であるか、またはネットワークから孤立した状態であり、二重化されたネットワークの構成で運用されていないと判断し、ステップS601に戻ってそのまま待機する。
When the
一方、障害判断部203は、監視部202がスレーブノード300に接続可能な状態と確認したと判定し(ステップS601;Yes)、かつ監視部202がスレーブノード300の電源がON状態であってCPUが起動している状態を確認したと判定した場合(ステップS602;Yes)、さらにネットワークN1またはN2を介して監視部202がスレーブノード300の共有メモリに対してアクセス処理を実行し(ステップS603)、その実行が成功したか否かを判定する(ステップS604)。例えば、障害判断部203は、監視部202によるスレーブノード300が有する共有メモリのリード処理の実行が成功したか否かを判定する。
On the other hand, the
そして、障害判断部203は、監視部202によるアクセス処理の実行が成功したと判定した場合(ステップS604;Yes)、さらにスレーブノード300が実行したアクセス処理の実行が成功した旨を示す応答を受信したか否かを判定する(ステップS606)。すなわち、マスタノード200およびスレーブノード300の各ノードが、それぞれ互いにスレーブノード300およびマスタノード200に対してアクセス処理の実行が成功した旨の応答を受信する。
If the
一方、障害判断部203は、監視部202によるアクセス処理の実行が成功していないと判定した場合(ステップS604;No)、アクセス処理を行うためのコマンドの送信(例えば、共有メモリをリードするためのコマンドの送信)が出来ない、あるいはマスタノード200のソフトウェアの起動が出来ない等、マスタノード200の異常が原因でアクセス処理が実行出来ないと判断し、ログを出力する等のエラー処理を実行し、マスタノード200を停止させ(ステップS605)、障害判定処理を終了させる。この段階で以降の処理を行わずに処理を終了させることにより、より速やかに障害の切り分けを行うことができる。
On the other hand, when the
障害判断部203は、スレーブノード300が実行したアクセス処理の実行が成功した旨を示す応答を受信したと判定した場合(ステップS606;Yes)、ネットワークN1およびN2を介した通信は正常であると判断し、ステップS601に戻って待機する。すなわち、ネットワークN1またはN2を介して、マスタノード200およびスレーブノード300の双方でアクセス処理の実行が成功した場合、二重化ネットワーク制御システム1000での通信障害はないと判断し、そのまま待機する。
If the
一方、障害判断部203は、スレーブノード300が実行したアクセス処理の実行が成功した旨を示す応答を受信していないと判定した場合(ステップS606;No)、ネットワークN3を介して、その応答を受信していない旨の通信失敗メッセージをスレーブノード300に送信してその旨を報告し(ステップS607)。スレーブノード300が、マスタノード200からその応答を受信していない場合も同様に、通信失敗メッセージをマスタノード200に送信してその旨を報告する。例えば、マスタノード200およびスレーブノード300は、その応答を一定時間内に受信しない場合には、タイムアウトと判断して通信失敗メッセージを送信する。
On the other hand, when the
そして、障害判断部203は、記憶部204に記憶されているノード構成情報を参照し、ネットワークN1またはN2に他のノード100が存在するか否かを判定し(ステップS608)、ネットワークN1またはN2に他のノード100が存在しないと判定した場合(ステップS608;No)、障害を判別することが困難であると判断し、ログを出力する等のエラー処理を実行し(ステップS609)、障害判定処理を中断させる。この場合、一定時間が経過した後にあらためてステップS601に戻って障害判定処理を再実行させたり、あるいは管理者にその旨を通報し、原因を調査させることとしてもよい。
Then, the
一方、障害判断部203は、ネットワークN1またはN2に他のノード100が存在すると判定した場合(ステップS608;Yes)、図4に示したノード構成情報を参照し、その他のノード100のうちの最小値ノードに対してアクセス処理を実行し、その実行結果を受信する(ステップS610)。このとき、スレーブノード300も同様に、他のノード100に対してアクセス処理を実行し、その実行結果を受信する。例えば、マスタノード200およびスレーブノード300は、アクセス処理の対象となっていた相手方のノード(例えば、マスタノード200の場合には相手方のノードであるスレーブノード300)のIPアドレスを、他のノード100のIPアドレスや、その他のノード100と通信するためのプロトコルを変換した上で、他のノード100に対してアクセス処理を実行し、その実行結果を受信する。このように、最小値ノードに対してアクセス処理を行うことにより、効率よく速やかに障害判定処理を実行することができる。
On the other hand, when the
なお、本実施例においては、障害判断部203は、最小値ノードに対してアクセス処理を実行しているが、アクセス処理が複雑で処理時間がかかる場合には、さらにノード構成情報を参照して、構成スペックが高いノード100を選択してアクセス処理を実行させることとしてもよい。この場合、通常であれば処理時間がかかる場合でも迅速にアクセス処理の結果を受信することができ、障害判定処理全体の処理を速やかに実行することができる。
In this embodiment, the
そして、障害判断部203は、他のノード100から受信した実行結果を、ネットワークN3を介してスレーブノード300に送信し(ステップS611)、また、スレーブノード300も同様に、他のノード100から受信した実行結果を、ネットワークN3を介してマスタノード200に送信する(ステップS612)。
Then, the
障害判断部203は、自ノード(マスタノード200)が他のノード100から受信した実行結果の内容、およびスレーブノード300から受信した実行結果の内容を確認し、自ノードの実行結果のみ異常があったか否か(例えば、アクセス処理が実行できずにタイムアウトとなったか否か)を判定し(ステップS613)、自ノードの実行結果のみ異常があったと判定した場合(ステップS613;Yes)、マスタノード200の異常が原因でアクセス処理が実行出来ないと判断し、ログを出力する等のエラー処理を実行し、マスタノード200を停止させ(ステップS614)、障害判定処理を終了させる。
The
一方、障害判断部203は、自ノードの実行結果のみ異常がなかったと判定した場合(ステップS613;No)、さらに他ノード(スレーブノード300)の実行結果のみ異常があったか否かを判定し(ステップS615)、他ノードの実行結果のみ異常があったと判定した場合(ステップS615;Yes)、スレーブノード300の異常が原因でアクセス処理が実行出来ないと判断し、ログを出力する等のエラー処理を実行し、スレーブノード300を停止させ(ステップS616)、障害判定処理を終了させる。
On the other hand, when the
一方、障害判断部203は、他ノードの実行結果のみ異常がなかったと判定した場合(ステップS615;No)、自ノードであるマスタノード200および他ノードであるスレーブノード300の双方において、正常に実行結果の受信が成功したか否かを判定する(ステップS617)。
On the other hand, when the
そして、障害判断部203は、双方のノードにおいて正常に実行結果の受信が成功していないと判定した場合(ステップS617;No)、ネットワークN1またはN2全体の障害であると判断し、ログを出力する等のエラー処理を実行し(ステップS618)、障害判定処理を中断させる。この場合、管理者にその旨を通報し、原因を調査させることとしてもよい。
If the
障害判断部203は、双方のノードにおいて正常に実行結果の受信が成功したと判定した場合(ステップS617;Yes)、ネットワークN1またはN2における通信障害はないと判断し、さらにマスタノード200およびスレーブノード300の各ノードで取得されるログ情報の内容を読み取り、いずれのノードで障害が発生しているかを判定し、その原因を判別する(ステップS619)。
The
例えば、障害判断部203は、通信部201がスレーブノード300やノード100との間で通信した際のログ情報を読み取り、エラーが記録されているか否かを判別する。ログ情報として記録される内容およびエラーとして記録される内容(エラー名称、コードナンバー等)は、あらかじめログ出力設定情報として定められている。
For example, the
図7は、ログ出力設定情報の例を示す図である。図7に示すように、ログ出力設定情報は、エラーコードを識別するためのコードナンバーと、そのエラーコードの名称と、そのエラーコードによってエラーとされる基準値とが対応付けられている。図7に示す例では、コードナンバー「1」のエラーは、スレーブノード300から正常にフレームを受信した回数が、1分間あたり10回以下である場合にはエラーとする設定であり、コードナンバー「2」のエラーは、スレーブノード300から正常にフレームを受信できなかった回数が、1分間あたり1回以上である場合にはエラーとする設定等であることを示している。なお、このログ出力設定情報は、例えば、記憶部204にあらかじめ記憶されている。
FIG. 7 is a diagram illustrating an example of log output setting information. As shown in FIG. 7, in the log output setting information, a code number for identifying an error code, the name of the error code, and a reference value that is an error based on the error code are associated with each other. In the example illustrated in FIG. 7, the error of the code number “1” is set to be an error when the number of times of normal frame reception from the
このように、障害判断部203は、ログ情報に記録されているエラーを参照し、マスタノード200に障害が発生しているか否かを判定し、そのエラー名称あるいはコードナンバーによって、その原因を判別する。スレーブノード300もこれと同様に、ログ情報に記録されているエラーを参照し、自ノードであるスレーブノード300に障害が発生しているか否かを判定し、そのエラー名称あるいはコードナンバーによって、その原因を判別する。したがって、アクセス処理の実行結果による障害の判別が出来ない場合でも、障害の切り分けが可能となる。なお、その判別結果は、マスタノード200およびスレーブノード300との間で送受信され、互いに情報が共有される。
In this manner, the
なお、本実施例では、上述のようにエラーコードを参照して障害の原因を判別しているが、マスタノード200およびスレーブノード300は互いに同期をとっており、正常な状態であれば同じ内容のログ情報が出力されるため、所定の時間(例えば、1分間)におけるログ情報の出力量に違いがあるか否かを判定することによって、マスタノード200かスレーブノード300かのどちらに障害が発生しているかを判断することも可能である。これにより、具体的な障害の原因まで特定する必要がない場合において、速やかに障害が発生しているノードの特定が可能となる。
In the present embodiment, the cause of the failure is determined with reference to the error code as described above. However, the
そして、障害判断部203は、自ノードであるマスタノード200が出力したログ情報と、他ノードであるスレーブノード300から受信したログ情報とを比較し、マスタノード200にのみエラーが記録され、異常となっているか否かを判定し(ステップS620)、マスタノード200にのみエラーが記録され、異常となっていると判定した場合(ステップS620;Yes)、そのエラーが原因でマスタノード200の異常が生じていると判断し、ログを出力する等のエラー処理を実行し、マスタノード200を停止させ(ステップS621)、障害判定処理を終了させる。
Then, the
一方、障害判断部203は、マスタノード200にエラーが記録されておらず、異常となっていないと判定した場合(ステップS620;No)、さらにスレーブノード300にのみエラーが記録され、異常となっているか否かを判定し(ステップS622)、スレーブノード300にのみエラーが記録され、異常となっていると判定した場合(ステップS622;Yes)、そのエラーが原因でスレーブノード300の異常が生じていると判断し、ログを出力する等のエラー処理を実行し、スレーブノード300を停止させ(ステップS623)、障害判定処理を終了させる。
On the other hand, when the
そして、障害判断部203は、マスタノード200にエラーが記録されておらず、異常となっていない場合であって、かつスレーブノード300にもエラーが記録されておらず、異常となっていないと判定した場合(ステップS622;No)、ステップS618の場合と同様に、ネットワークN1またはN2全体の障害であると判断し、ログを出力する等のエラー処理を実行し(ステップS624)、障害判定処理を終了させる。この場合、管理者にその旨を通報し、原因を調査させることとしてもよい。このステップS624の処理が終了すると、図6A、6Bに示した障害判定処理の全ての処理が終了する。
Then, the
そして、ステップS605、S614、S621の各処理を行った場合には、マスタノード200に異常があるため、スレーブノード300側でマスタノード200と同じIPアドレスを引き継ぐ等の切替処理を行って、系がスレーブノード300側に切り替えられることとなる。
When each of the processes in steps S605, S614, and S621 is performed, the
一方、ステップS616、S623の各処理を行った場合には、スレーブノード300に異常があり、ステップS609、S618、S624の各処理を行った場合には、マスタノード200およびスレーブノード300以外のネットワークで異常があるため、障害判定処理を中断させたり、ログを出力する等のエラー処理を実行して障害判定処理を終了させ、その後、管理者等によって障害の対応が行われることとなる。
On the other hand, when each process of steps S616 and S623 is performed, there is an abnormality in the
このように、マスタノード200と、マスタノード200にネットワークN3を介して接続されたスレーブノード300と、マスタノード200とスレーブノード300と間で通信する他のノード100と、がネットワークN1またはN2で接続された二重化ネットワーク制御システムにおいて、マスタノード200およびスレーブノード300が、互いにネットワークN1またはN2を介してアクセスが可能であることを確認する監視部202と、監視部202による監視の結果、相手ノードからアクセスに対する応答を受信したか否かを判定し、相手ノードからアクセスに対する応答を受信していないと判定した場合、ネットワークN1またはN2を介して他のノード100に対してアクセスをしてその実行結果を互いにネットワークN3を介して送受信し、送受信した実行結果を比較することによりマスタノード200またはスレーブノード300のいずれに障害があるかを判別する障害判断部と、を有し、他のノード100が、マスタノード200およびスレーブノード300からアクセスを受けた場合にアクセスに対する実行結果を送信する障害時処理部102を有しているので、二重化されたネットワークにおいて、どちらの系で障害が発生したのかを容易に判断することが可能となる。また、従来技術のように、二重化されたネットワークの各系に接続された各装置の通信状態を把握する必要がなくなるため、簡易な構成で障害判断の切り分けができる。
In this way, the
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 In addition, this invention is not limited to an above-described Example, Various modifications are included. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.
1000 二重化ネットワーク制御システム
100 ノード
101 通信部
102 障害時処理部
103 制御部
200 マスタノード
201 通信部
202 監視部
203 障害判断部
204 記憶部
205 制御部
300 スレーブノード
N1〜N3 ネットワーク
1000 Duplex
Claims (7)
前記マスタノードおよび前記スレーブノードは、
互いに前記第2のネットワークを介してアクセスが可能であることを確認する監視部と、
前記監視部による監視の結果、相手ノードから前記アクセスに対する応答を受信したか否かを判定し、前記相手ノードから前記アクセスに対する応答を受信していないと判定した場合、前記第2のネットワークを介して前記他のノードに対して前記アクセスをしてその実行結果を互いに前記第1のネットワークを介して送受信し、送受信した前記実行結果を比較することにより前記マスタノードまたは前記スレーブノードのいずれに障害があるかを判別する障害判断部と、
前記他のノードは、
前記マスタノードおよび前記スレーブノードから前記アクセスを受けた場合に前記アクセスに対する実行結果を送信する処理部と、
を備えることを特徴とする二重化ネットワーク制御システム。 A duplex network in which a master node, a slave node connected to the master node via a first network, and another node communicating between the master node and the slave node are connected by a second network A control system,
The master node and the slave node are
A monitoring unit for confirming that each other can be accessed via the second network;
As a result of monitoring by the monitoring unit, it is determined whether or not a response to the access has been received from the counterpart node, and if it is determined that a response to the access has not been received from the counterpart node, Thus, the access to the other node is performed, and the execution results are transmitted / received to / from each other via the first network, and a failure occurs in either the master node or the slave node by comparing the execution results transmitted / received. A failure determination unit for determining whether there is,
The other nodes are
A processing unit that transmits an execution result for the access when the access is received from the master node and the slave node;
A duplex network control system comprising:
自らのノードで行われた処理のログ情報を記憶する記憶部をさらに備え、
前記障害判断部は、前記他のノードから前記実行結果を正常に受信できた場合には、さらに前記ログ情報を比較することにより、前記マスタノードまたは前記スレーブノードのいずれに障害があるかを判別する、
ことを特徴とする請求項1に記載の二重化ネットワーク制御システム。 The master node and the slave node are
It further includes a storage unit that stores log information of processing performed in its own node,
The failure determination unit determines whether the master node or the slave node has a failure by further comparing the log information when the execution result is normally received from the other node. To
The duplex network control system according to claim 1, wherein:
ことを特徴とする請求項1または2に記載の二重化ネットワーク制御システム。 The failure determination unit determines that the master node or the slave node has an abnormality when the execution result received from the other node cannot be received by the master node or the slave node due to timeout. To
The duplex network control system according to claim 1 or 2, wherein
ことを特徴とする請求項1〜3のいずれか1項に記載の二重化ネットワーク制御システム。 The failure determination unit, as a result of monitoring by the monitoring unit, if it is determined that the access is not possible from the counterpart node, it determines that its own node is abnormal without performing the access to the other node,
The duplex network control system according to any one of claims 1 to 3, wherein:
ことを特徴とする請求項1〜4のいずれか1項に記載の二重化ネットワーク制御システム。 The failure determination unit receives the execution result by performing the access to a minimum value node among the other nodes connected to the second network.
The duplex network control system according to any one of claims 1 to 4, wherein:
ことを特徴とする請求項1〜5のいずれか1項に記載の二重化ネットワーク制御システム。 The failure determination unit receives the execution result by performing the access to a node having the highest specification among the other nodes connected to the second network.
The duplex network control system according to any one of claims 1 to 5, wherein:
互いに前記第2のネットワークを介してアクセスが可能であることを確認する監視ステップと、
前記監視ステップにおける監視の結果、相手ノードから前記アクセスに対する応答を受信したか否かを判定する判定ステップと、
前記判定ステップにおいて前記相手ノードから前記アクセスに対する応答を受信していないと判定した場合、前記第2のネットワークを介して前記他のノードに対して前記アクセスをする第1アクセスステップと、
前記第1アクセスステップにおいて前記マスタノードおよび前記スレーブノードから前記アクセスを受けた場合に前記アクセスに対する実行結果を送信する処理ステップと、
前記処理ステップにおいて前記実行結果を受信した場合にその実行結果を互いに前記第1のネットワークを介して送受信する第2アクセスステップと、
前記第2アクセスステップにおいて送受信した前記実行結果を比較することにより前記マスタノードまたは前記スレーブノードのいずれに障害があるかを判別する障害判断ステップと、
を含むことを特徴とする二重化ネットワーク制御方法。 A duplex network in which a master node, a slave node connected to the master node via a first network, and another node communicating between the master node and the slave node are connected by a second network A duplex network control method performed in a control system,
A monitoring step for confirming that each other can be accessed via the second network;
As a result of monitoring in the monitoring step, a determination step of determining whether or not a response to the access has been received from the counterpart node;
A first access step of performing the access to the other node via the second network when it is determined in the determination step that a response to the access is not received from the counterpart node;
A processing step of transmitting an execution result for the access when the access is received from the master node and the slave node in the first access step;
A second access step of transmitting and receiving the execution results to and from each other via the first network when the execution results are received in the processing step;
A failure determination step of determining whether the master node or the slave node has a failure by comparing the execution results transmitted and received in the second access step;
A duplex network control method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216201A JP5763030B2 (en) | 2012-09-28 | 2012-09-28 | Duplex network control system and duplex network control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216201A JP5763030B2 (en) | 2012-09-28 | 2012-09-28 | Duplex network control system and duplex network control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014072631A JP2014072631A (en) | 2014-04-21 |
JP5763030B2 true JP5763030B2 (en) | 2015-08-12 |
Family
ID=50747486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012216201A Active JP5763030B2 (en) | 2012-09-28 | 2012-09-28 | Duplex network control system and duplex network control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5763030B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114251329B (en) * | 2021-12-17 | 2023-06-16 | 中铁隧道局集团有限公司 | Shield hydraulic system fault investigation system based on ZigBee |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344125A (en) * | 2000-06-05 | 2001-12-14 | Nec Soft Ltd | Dual node system |
JP4425841B2 (en) * | 2005-09-15 | 2010-03-03 | 株式会社日立製作所 | Relay system and call relief method |
JP2009081662A (en) * | 2007-09-26 | 2009-04-16 | Oki Electric Ind Co Ltd | Point-to-multipoint optical communication system |
-
2012
- 2012-09-28 JP JP2012216201A patent/JP5763030B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014072631A (en) | 2014-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10715411B1 (en) | Altering networking switch priority responsive to compute node fitness | |
US10693813B1 (en) | Enabling and disabling links of a networking switch responsive to compute node fitness | |
US10089028B2 (en) | Remote secure drive discovery and access | |
JP4695705B2 (en) | Cluster system and node switching method | |
EP2610750A1 (en) | Disk array, storage system and data storage path switching method | |
US9210059B2 (en) | Cluster system | |
US20130339663A1 (en) | Reset of processing core in multi-core processing system | |
WO2019049433A1 (en) | Cluster system, cluster system control method, server device, control method, and non-transitory computer-readable medium having program stored therein | |
CN103327060A (en) | Information processing apparatus and information processing method | |
JP5763030B2 (en) | Duplex network control system and duplex network control method | |
JP6337437B2 (en) | Information processing apparatus, information processing system, and program | |
JP5613119B2 (en) | Master / slave system, control device, master / slave switching method, and master / slave switching program | |
KR20150104435A (en) | Method of performing transition of operation mode for a routing processor | |
US8346996B2 (en) | Information processing system | |
JP6134720B2 (en) | Connection method | |
JP2012230446A (en) | Programmable controller station | |
JP6148039B2 (en) | Information processing apparatus, BMC switching method, BMC switching program | |
JP7220997B2 (en) | FACILITY MONITORING SYSTEM AND COMMUNICATION METHOD IN FACILITY MONITORING SYSTEM | |
JP5170000B2 (en) | Redundant pair detection method, communication device, redundant pair detection program, recording medium | |
EP2874067B1 (en) | Information processing system, information processing apparatus, terminal apparatus, control program, and control method | |
CN107423113B (en) | Method for managing virtual equipment, out-of-band management equipment and standby virtual equipment | |
JP2009224866A (en) | Failure detector, failure detection system and failure detection method of stack configuration, and program | |
WO2020089964A1 (en) | Communication system, communication device, method, and program | |
JP2013156963A (en) | Control program, control method, information processing apparatus, and control system | |
JP5609272B2 (en) | Server apparatus, server system, and server apparatus control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150528 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5763030 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |