JP2012138841A - Information processing device, operation control method, and program - Google Patents
Information processing device, operation control method, and program Download PDFInfo
- Publication number
- JP2012138841A JP2012138841A JP2010291093A JP2010291093A JP2012138841A JP 2012138841 A JP2012138841 A JP 2012138841A JP 2010291093 A JP2010291093 A JP 2010291093A JP 2010291093 A JP2010291093 A JP 2010291093A JP 2012138841 A JP2012138841 A JP 2012138841A
- Authority
- JP
- Japan
- Prior art keywords
- life message
- information processing
- message
- master
- life
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明の実施形態は、ネットワークを介して接続される他の情報処理装置と冗長構成を構築する情報処理装置に好適な動作制御技術に関する。 Embodiments described herein relate generally to an operation control technique suitable for an information processing apparatus that establishes a redundant configuration with another information processing apparatus connected via a network.
耐故障性を高めるため、または、負荷分散を図るために、複数の情報処理装置を疎結合して冗長構成を構築することが広く行われている。インターネットを介して各種サービスを提供するサーバ機能は、冗長構成で構築することがもはや一般的となっている。 In order to enhance fault tolerance or to achieve load distribution, it is widely performed to construct a redundant configuration by loosely coupling a plurality of information processing apparatuses. Server functions that provide various services via the Internet are now generally built in a redundant configuration.
そして、この冗長構成については、例えば異常発生箇所を速やかに特定するための機構など、様々な仕組みがこれまでも提案されている。 For this redundant configuration, various mechanisms have been proposed so far, for example, a mechanism for quickly identifying an abnormality occurrence location.
なお、近年のパブリックネットワークでの技術として、クラウド技術が存在する。クラウドでは、サーバの冗長構成だけではなく、サーバシステムで提供するサービスを構成するデータベース等のアプリケーション層を含む冗長構成技術が提案されている。クラウドで実現されている冗長構成技術としては、「コンシステントハッシング」、「分散ハッシュテーブル(DHT)」などがある。 In addition, cloud technology exists as a technology in recent public networks. In the cloud, not only a redundant configuration of servers, but also a redundant configuration technique including an application layer such as a database constituting a service provided by a server system has been proposed. Redundant configuration technologies implemented in the cloud include “consistent hashing”, “distributed hash table (DHT)”, and the like.
コンシステントハッシングは、複数のサーバで構成されるデータベースを維持するために、データの配置とサーバの増加(または入れ替え)とを実現する手法である。整数値を取るIDを生成するハッシュ関数を使用した空間を設定する。ID空間は、使用するハッシュ関数により2**128−1(MD5)や2**160−1(SHA−1)の規模である。格納したいデータのキーから当該ハッシュ関数によりハッシュ値を求め、そのハッシュ値の範囲を担当するサーバにデータを送信する。サーバを追加した場合、このハッシュ値の担当範囲を分割または再配置する。 Consistent hashing is a technique for realizing data placement and server increase (or replacement) in order to maintain a database composed of a plurality of servers. A space using a hash function for generating an ID that takes an integer value is set. The ID space has a scale of 2 ** 128-1 (MD5) or 2 ** 160-1 (SHA-1) depending on the hash function used. A hash value is obtained from the key of the data to be stored by the hash function, and the data is transmitted to a server in charge of the range of the hash value. When a server is added, the assigned range of the hash value is divided or rearranged.
分散ハッシュテーブルを用いた実装としては、「Windows(登録商標)AzureTable」が製品化されている。「Windows(登録商標)AzureTable」では、前述したコンシステントハッシングのアルゴリズムを使用して、入力されたデータのキーからハッシュ値を求め、データを管理するサービスインスタンス(サーバ上のソフトウェア)にデータを送信する。 As an implementation using a distributed hash table, “Windows (registered trademark) AzureTable” has been commercialized. In "Windows (registered trademark) AzureTable", the hash value is obtained from the key of the input data using the consistent hashing algorithm described above, and the data is sent to the service instance (software on the server) that manages the data. To do.
サービスインスタンスは、受信したデータを格納するが、このとき隣接するサービスインスタンスにデータの複製を送信する。これにより、3つのサービスインスタンスでデータを保持することになる。隣接するサービスインスタンスは、プライマリでデータを管理するサービスインスタンスが消滅(サーバ障害、メンテナンスなどで停止)した場合、代替サーバとして動作することになる。 The service instance stores the received data. At this time, a copy of the data is transmitted to the adjacent service instance. As a result, data is held by three service instances. Adjacent service instances operate as alternative servers when the service instance that manages data at the primary disappears (stopped due to server failure, maintenance, etc.).
ところで、専用サーバ機種ではないパーソナルコンピュータ(PC)等でサーバ機能の冗長構成を構築する場合、従来のサーバ機種の管理ソフトウェアのように24時間運用が必ずしも必須要件ではないことが多い。また、環境への配慮のため、PCの電源設定状態により、電源断、ハイバネーション、スリープなどのPC機能の停止または制限運用状態への対応が必要である。 By the way, when constructing a redundant configuration of server functions using a personal computer (PC) or the like that is not a dedicated server model, 24-hour operation is not always an indispensable requirement, unlike conventional server model management software. In consideration of the environment, it is necessary to stop the PC function such as power-off, hibernation, and sleep, or to cope with the restricted operation state depending on the power setting state of the PC.
また、複数台のPCで構成を組む場合、従来方式のサーバ監視方式で相互間監視を実施するとなると、組み合わせ数が膨大になる虞があり(nC2の組み合わせ)、また、特定の管理サーバで管理を集中する場合、管理サーバでの問題が発生すると代替サーバに切り替える必要があるが、この代替サーバを柔軟に設定することは難しかった。 In addition, when a configuration is made up of a plurality of PCs, the number of combinations may become enormous if mutual monitoring is performed using the conventional server monitoring method (nC2 combination), and management is performed by a specific management server. When a problem occurs in the management server, it is necessary to switch to an alternative server, but it is difficult to set up the alternative server flexibly.
本発明は、このような事情を考慮してなされたものであり、冗長構成を構築する情報処理装置を適宜に追加・削除すること等を可能とする冗長構成の運用機能を実現した情報処理装置、動作制御方法およびプログラムを提供することを目的とする。 The present invention has been made in consideration of such circumstances, and is an information processing apparatus that realizes an operation function of a redundant configuration that makes it possible to appropriately add and delete information processing apparatuses that construct a redundant configuration. An object of the present invention is to provide an operation control method and a program.
実施形態によれば、ネットワークを介して接続される他の情報処理装置と冗長構成を構築する情報処理装置は、前記冗長構成を構築する情報処理装置間でライフメッセージを巡回させて異常を検出するためのライフメッセージ処理手段と、前記ライフメッセージの巡回ルートをマスタとして管理し、他の情報処理装置から前記冗長構成への参加要求を受信した場合に、当該他の情報処理装置を前記ライフメッセージの巡回ルートにスレーブとして加えるためのマスタ処理手段と、前記ライフメッセージの巡回ルートをマスタとして管理する他の情報処理装置に対して前記冗長構成への参加要求を送信して、前記ライフメッセージの巡回ルートにスレーブとして加わるためのスレーブ処理手段と、を具備する。 According to the embodiment, an information processing device that constructs a redundant configuration with another information processing device connected via a network detects an abnormality by circulating a life message between the information processing devices that construct the redundant configuration. Life message processing means for managing the life message cyclic route as a master, and when receiving a request to participate in the redundant configuration from another information processing apparatus, the other information processing apparatus A master processing means for adding as a slave to the cyclic route, and a request for participation in the redundant configuration to another information processing apparatus that manages the cyclic route of the life message as a master, and the cyclic route of the life message Slave processing means for joining as a slave.
以下、実施の形態について図面を参照して説明する。 Hereinafter, embodiments will be described with reference to the drawings.
図1は、実施形態の情報処理装置の概略的なハードウェア構成を示す図である。 FIG. 1 is a diagram illustrating a schematic hardware configuration of the information processing apparatus according to the embodiment.
図1に示すように、本情報処理装置は、プロセッサ1、主メモリ2、外部記憶装置3、入力装置4、表示装置5および通信装置6を有している。
As illustrated in FIG. 1, the information processing apparatus includes a processor 1, a
プロセッサ1は、外部記憶装置3から主メモリ2にロードされる各種プログラムを実行することによって本情報処理装置内の各部の動作を制御する処理装置である。主メモリ2は、プロセッサ1によって実行される各種プログラムや当該各種プログラムによって入出力される各種データを一時的に記憶する記憶装置である。外部記憶装置3は、主メモリ2の補助装置として各種プログラムおよび各種データを大量かつ恒久的に記憶する記憶装置である。
The processor 1 is a processing device that controls the operation of each unit in the information processing apparatus by executing various programs loaded from the
入力装置4は、本情報処理装置が提供するユーザインタフェースのインプット側を司る装置である。表示装置5は、本情報処理装置が提供するユーザインタフェースのアウトプット側を司る装置である。そして、通信装置5は、ネットワークを介して他の情報処理装置との間で実行されるデータ通信を制御する装置である。
The input device 4 is a device that controls the input side of the user interface provided by the information processing apparatus. The
以上のようなハードウェア構成を持つ本情報処理装置は、ネットワークを介して他の情報処理装置(クライアント)に各種サービスを提供するサーバとして動作することが可能である。そこで、本情報処理装置は、ネットワークを介して接続される他の情報処理装置とサーバ機能の冗長構成を構築するにあたって、この冗長構成を構築する情報処理装置を適宜に追加・削除すること等を可能とする冗長構成の運用機能を実現したものであり、以下、この点について詳述する。 The information processing apparatus having the hardware configuration described above can operate as a server that provides various services to other information processing apparatuses (clients) via a network. Therefore, this information processing apparatus, when constructing a redundant configuration of server functions with other information processing apparatuses connected via a network, appropriately adds / deletes the information processing apparatus constructing this redundant configuration, etc. The operation function of the redundant configuration that can be realized is realized, and this point will be described in detail below.
図2は、本情報処理装置の冗長構成の運用機能に関わるソフトウェア構成を示す図である。 FIG. 2 is a diagram illustrating a software configuration related to a redundant configuration operation function of the information processing apparatus.
本情報処理装置の冗長構成の運用機能は、管理ループ運用プログラム10によって実現される。なお、この管理ループ運用プログラム10は、冗長構成を構築する情報処理装置の追加・削除等の運用機能を実現するものであって、複数の情報処理装置間での負荷分散制御等は既知の手法で別途司られているものとしてここでは考慮しない。また、ネットワークプロトコル20は、管理ループ運用プログラム10を含む各種ソフトウェアがハードウェアである通信装置6を用いて他の情報処理装置上の各種ソフトウェアとの間でネットワークを介したデータ通信を行うために設けられるプログラムである。OS(Operating system)/ドライバ30は、本情報処理装置のリソース管理やハードウェア制御を行うためのプログラムである。これら管理ループ運用プログラム10、ネットワークプロトコル20およびOS/ドライバ30のいずれも、外部記憶装置3から主メモリ2にロードされてプロセッサ1によって実行されることによって機能する。
The operation function of the redundant configuration of the information processing apparatus is realized by the management
図2に示すように、管理ループ運用プログラム10は、ノード管理機能モジュール11、参加ノード機能モジュール12、管理ノード機能モジュール13、ライフメッセージ管理機能モジュール14、ユニークIDメッセージ管理機能モジュール15、メッセージ送受信機能モジュール16およびユーザインタフェース機能モジュール17の処理部と、収集ノード一覧テーブル18のデータ部とを有している。
As shown in FIG. 2, the management
本情報処理装置が他の情報処理装置と構築する冗長構成では、当該冗長構成を構築する情報処理装置間でライフメッセージを巡回させる。ライフメッセージは、冗長構成を構築する複数の情報処理装置の中のいずれかの情報処理装置に異常が発生した場合に、この異常を(異常を発生させた情報処理装置以外の)他の情報処理装置が検出するために巡回させるメッセージである。このライフメッセージの巡回ルートを、ここでは、管理ループと称する。また、冗長構成を構築する情報処理装置であって、この管理ループ上でライフメッセージの送受信を実行する情報処理装置を、ここではノードと称する。ノードは、管理ループの管理を司るマスタの役割を担う1つの管理ノードと、管理ノード(マスタ)の配下で管理ループにスレーブとして参加するその他の参加ノードとに大別される。管理ループ運用プログラム10は、本情報処理装置を管理ノードまたは参加ノードのいずれとしても動作させることができるソフトウェアである。以下、管理ノードとして動作する情報処理装置を単に管理ノード、参加ノードとして動作する情報処理装置を単に参加ノードと称することがある。
In the redundant configuration that this information processing device is constructed with other information processing devices, the life message is circulated between the information processing devices that construct the redundant configuration. The life message indicates that when an abnormality occurs in any one of the information processing apparatuses that form a redundant configuration, this abnormality is indicated by other information processing (other than the information processing apparatus that caused the abnormality). This message is circulated for detection by the device. This life message circulation route is referred to herein as a management loop. In addition, an information processing apparatus that constructs a redundant configuration and that transmits and receives a life message on this management loop is referred to as a node here. The nodes are roughly classified into one management node that plays the role of a master that manages the management loop, and other participating nodes that participate in the management loop as slaves under the management node (master). The management
参加ノード機能モジュール12は、本情報処理装置を参加ノードとして動作させるためのモジュールである。また、管理ノード機能モジュール13は、本情報処理装置を管理ノードとして動作させるためのモジュールである。そして、ノード管理機能モジュール11は、参加ノード機能モジュール12または管理ノード機能モジュール13のいずれを稼働させるか、即ち、本情報処理装置を管理ノードまたは参加ノードのいずれとして動作させるかを決定するモジュールである。
The participating
管理ループ運用プログラム10が起動した際における初期動作として、ノード管理機能モジュール11は、本情報処理装置を参加ノードとして動作させるべく参加ノード機能モジュール12を稼働させるための設定を実施する。また、この初期動作時に、管理者等により管理ノードとして動作すべき指示が入力された場合には、ノード管理機能モジュール11は、本情報処理装置を管理ノードとして動作させるべく管理ノード機能モジュール13を稼働させるための設定を実施する。ユーザインタフェース機能モジュール17は、管理者等に対して情報の受け渡しのための仕組みを提供するモジュールである。
As an initial operation when the management
さらに、ノード管理機能モジュール11は、本情報処理装置が参加ノードとして動作を開始した後、管理ノードとして動作する他の情報処理装置がその動作を停止した場合、代替管理ノードへの移行を決断して、参加ノード機能モジュール12の稼働状態から管理ノード機能モジュール13の稼働状態へと移行するための設定を実施する。
Further, the node
管理ノード機能モジュール13は、管理ループの作成および管理を実行する。本情報処理装置が管理ノードとして動作している場合、管理ノード機能モジュール13は、他の情報処理装置から送信されてくるユニークID要求によって、管理ループに参加ノードとして参加する当該他の情報処理装置を認識する。ユニークIDは、各ノードが自分の参加する管理ループを識別するための識別情報である。
The management
管理ノード機能モジュール13は、このユニークID要求に対してユニークID応答を返信し、当該他の情報処理装置を参加ノードとして管理ループに追加する。ユニークIDメッセージ管理機能モジュール15は、このユニークID要求やユニークID応答、後述する管理ループからの脱退メッセージなどを作成するモジュールであり、メッセージ送受信機能モジュール16は、このユニークID要求やユニークID応答、後述する管理ループからの脱退メッセージなどの、管理ノードおよび参加ノード間におけるメッセージの送受信を実行するモジュールである。
The management
管理ノード機能モジュール13は、例えば、本情報処理装置が管理ノードとして動作を開始した後、他の情報処理装置から最初にユニークID要求を受けた時、当該他の情報処理装置との間で管理ループを作成するためのユニークIDを発番し、このユニークIDをユニークID応答として返信する。また、この管理ループの作成後にさらに別の情報処理装置からユニークID要求を受けた場合には、管理ノード機能モジュール13は、作成済みの管理ループへの参加が要求されたと判断する。この参加ノードの追加時、管理ノード機能モジュール13は、当該管理ループ用のユニークIDを再発番して更新し、すべての参加ノードにユニークID応答として送信する。
For example, when the information processing apparatus starts operating as a management node and receives a unique ID request from another information processing apparatus for the first time, the management
また、参加ノードの追加時、管理ノード機能モジュール13は、収集ノード一覧テーブル18を更新する。収集ノード一覧テーブル18は、管理ループ上の参加ノードに関する情報を保持するテーブルである。収集ノード一覧テーブル18に保持される情報は、ライフメッセージの生成に用いられる。ライフメッセージ管理機能モジュール14は、ライフメッセージの作成および送信を実行するモジュールであり、本情報処理装置が管理ノードとして動作している時、管理ノード機能モジュール13は、予め定められた期間毎に、ライフメッセージ管理機能モジュールに対し、ライフメッセージの作成および送信の実行を指示する。管理ノード機能モジュール13は、参加ノードを巡回してライフメッセージ管理機能モジュールによって回収されたライフメッセージを参照して、参加ノードの動作状況を確認する。
In addition, when adding a participating node, the management
ライフメッセージが回収されなかった場合、管理ノード機能モジュール13は、いずれかの参加ノードが停止したと判断して、(停止した参加ノード以外の)その他の参加ノードとの間で新たな管理ループを再作成する。そのために、管理ノード機能モジュール13は、(停止した参加ノード以外の)その他の参加ノードからのユニークID要求の送信を待機する。ユニークID要求を受信したら、管理ノード機能モジュール13は、再作成する管理ループ用のユニークIDを改めて発番して、このユニークIDをユニークID応答として返信する。また、この時、管理ノード機能モジュール13は、収集ノード一覧テーブル18の更新も実行する。これにより、管理ループの再作成および再作成された管理ループでのライフメッセージの巡回が実現される。
If the life message is not collected, the management
参加ノード機能モジュール12は、管理ループへの参加処理を実行する。管理ループ運用プログラム10が起動して本情報処理装置が参加ノードとして動作を開始した時、参加ノード機能モジュール12は、参加ノードとして管理ループに参加するべく前述のユニークID要求をブロードキャスト送信する。参加ノード機能モジュール12は、管理ノードから前述のユニークID応答が返信されたか否かによって管理ループへの参加可否を判断する。また、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14によるライフメッセージの送受信状況から自ノードが管理ループへ正しく参加できたことを確認する。
The participating
ライフメッセージには、ユニークIDのほか、管理ノードによってその巡回順位が記録されており、参加ノードとして管理ループに加わった後、参加ノード機能モジュール12は、この巡回順位に従って、ライフメッセージ管理機能モジュール14を介してライフメッセージの送受信を実行する。この時、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14によって送受信されるライフメッセージに、自ノードによる当該ライフメッセージの受信状況を記録する。
In the life message, in addition to the unique ID, the cyclic order is recorded by the management node. After joining the management loop as a participating node, the participating
また、参加ノードとして管理ループに加わった後、ライフメッセージが予め定められた期間を越えて受信されない時、または、ライフメッセージの送信が失敗した時、参加ノード機能モジュール12は、いずれかの参加ノードが停止したと判断して、管理ノードによって再作成されるであろう管理ループに加わるためのユニークID要求の送信を管理ノードに対して実行する。このユニークID要求に対して、ユニークID応答として新たなユニークIDが返信されてきたら、前述の手順で参加ノードとしての動作を再開する。
Also, after joining the management loop as a participating node, when the life message is not received beyond a predetermined period, or when the life message transmission fails, the participating
もし、ユニークID応答が返信されなかった場合、参加ノード機能モジュール12は、管理ノードが停止したと判断する。この場合、参加ノード機能モジュール12は、管理ループに参加する参加ノードの中で代替管理ノードに移行すべきノードを最後に送受信されたライフメッセージに記録された巡回順位に基づいて選定する。
If the unique ID response is not returned, the participating
自ノードでなかった場合、参加ノード機能モジュール12は、代替管理ノードとなるべき他ノードにユニークID要求を送信する。その後は、参加ノードとしての動作を再開する。一方、自ノードであった場合には、参加ノード機能モジュール12は、代替管理ノードへの移行指示をノード管理機能モジュール11に通知する。この通知を受けたノード管理機能モジュール11は、参加ノード機能モジュール12の稼働状態から管理ノード機能モジュール13の稼働状態へと本情報処理装置を移行させるための設定を実施する。この場合、他ノードからユニークID要求が送られてくるので、ユニークIDの発番やユニークID応答の返信、収集ノード一覧テーブル18の更新、ライフメッセージの作成および送信など、管理ノードとして動作を再開する。
If it is not the own node, the participating
また、参加ノード機能モジュール12は、ユニークID要求を受信すると、新たなノードが管理ループへの参加を要求していると判断し、当該新たなノードを加えた管理ループを再作成した管理ノードが送ってくるであろうユニークID応答を待機して受信する。このユニークID応答を受信すると、参加ノード機能モジュール12は、参加ノードとしての動作を再開する。
In addition, upon receiving the unique ID request, the participating
管理ノードからの脱退は、脱退メーセージをブロードキャスト送信することによって実施する。管理ノードとして参加ノードから脱退メーセージを受けた場合、管理ノード機能モジュール13は、この参加ノードに関する情報を削除すべく収集ノード一覧テーブル18を更新し、新たなユニークIDを発番してその他の参加ノードに対してユニークID更新として送信する。これにより、脱退メッセージを送信してきた参加ノードを除いた管理ループが再作成される。
The withdrawal from the management node is performed by broadcasting a withdrawal message. When a withdrawal message is received from a participating node as a management node, the management
また、参加ノードとして脱退メーセージを受けた場合、参加ノード機能モジュール12は、それが管理ノードからのものか否かを調べ、管理ノードからのものでなければ、管理ノードから送信されてくるであろうユニークID更新を待機する。一方、管理ノードからのものであった場合には、管理ループに参加する参加ノードの中で代替管理ノードに移行すべきノードを最後に送受信されたライフメッセージに記録された巡回順位に基づいて選定する。代替管理ノードに移行すべきノードが自ノードでなければ、代替管理ノードから送信されてくるであろうユニークID更新を待機する。
Also, when a withdrawal message is received as a participating node, the participating
そして、代替管理ノードに移行すべきノードが自ノードであった場合は、代替管理ノードへの移行指示をノード管理機能モジュール11に通知する。これに伴って稼働された管理ノード機能モジュール13は、最後に送受信されたライフメッセージから収集ノード一覧テーブル18を作成し、新たなユニークIDを発番してその他の参加ノードに対してユニークID更新として送信する。これにより、脱退メッセージを送信してきた管理ノードが除かれ、かつ、自ノードが代替管理ノードとなった管理ループが再作成される。
If the node to be transferred to the alternative management node is the local node, the node
なお、前述したように、ライフメッセージの巡回が途絶えると、いずれかのノードが停止したものと各ノードが判断し、管理ループを再作成すべく各々動作するので、脱退メーセージを用いることなく、脱退させたいノードを停止させることもできる。 As described above, when the life message circulation stops, each node determines that one of the nodes has stopped and operates to re-create the management loop, so it is possible to leave without using a withdrawal message. You can also stop the node you want to make.
つまり、以上のような構成を持つ本情報処理装置が(同等の構成を持つ)他の情報処理装置と構築する冗長構成は、当該冗長構成を構築する複数の情報処理装置それぞれが適応的に動作することで、全体として、適切な運用機能が実現される。 In other words, the redundant configuration constructed by the information processing apparatus having the above configuration with another information processing apparatus (having an equivalent configuration) operates adaptively for each of the plurality of information processing apparatuses constructing the redundant configuration. By doing so, an appropriate operation function is realized as a whole.
次に、図3乃至図12を参照して、本情報処理装置が他の情報処理装置と構築する冗長構成で実現される運用機能の基本原理の概要について説明する。 Next, with reference to FIG. 3 to FIG. 12, an outline of the basic principle of the operation function realized by the redundant configuration constructed by the information processing apparatus with another information processing apparatus will be described.
まず、図3乃至図6を参照して、管理ループ作成時の各ノードの動作原理について説明する。 First, the operation principle of each node when creating a management loop will be described with reference to FIGS.
ここでは、図3に示すように、ノードAが管理ノード、ノードBが参加ノードとして動作を開始したものとする。 Here, as shown in FIG. 3, it is assumed that the operation starts with node A as the management node and node B as the participating node.
参加ノードとして動作を開始したノードBは、ネットワーク上に存在すると思われる管理ノードに向けてユニークID要求a1を送信する(図3の(A))。このユニークID要求は、ブロードキャストまたはマルチキャストのネットワークプロトコル(例えばTCP/IP、NetBIOS、MACなど)によって送信される。図4は、ユニークID要求のメッセージフォーマットの一例を示す図である。 The node B that has started to operate as a participating node transmits a unique ID request a1 to a management node that seems to exist on the network ((A) in FIG. 3). This unique ID request is transmitted by a broadcast or multicast network protocol (for example, TCP / IP, NetBIOS, MAC, etc.). FIG. 4 is a diagram illustrating an example of the message format of the unique ID request.
一方、管理ノードとして動作を開始したノードAは、このブロードキャストを受信すると、ライフメッセージの送信リスト、つまり収集ノード一覧テーブル18にノードBを追加し、ユニークID応答a2をブロードキャストまたはマルチキャストのネットワークプロトコルで返信する(図3の(B))。図5は、ユニークID応答/ユニークID更新のメッセージフォーマットの一例を示す図である。 On the other hand, when receiving the broadcast, the node A that has started to operate as a management node adds the node B to the life message transmission list, that is, the collection node list table 18, and sends a unique ID response a 2 using a broadcast or multicast network protocol. Reply ((B) of FIG. 3). FIG. 5 is a diagram illustrating an example of a message format of the unique ID response / unique ID update.
参加ノードは、ユニークID応答を受信後、ライフメッセージの受信待ちに入る。管理ノードが同一ネットワークに存在する場合、参加ノードは、最初に受信したユニークID応答に含まれるユニークIDを識別子として、対応する管理ノードから直接送信されるか参加ノード間で転送されるライフメッセージを受信待ちする。図6は、ライフメッセージのメッセージフォーマットの一例を示す図である。 After receiving the unique ID response, the participating node waits to receive a life message. When the management node exists in the same network, the participating node uses the unique ID included in the first received unique ID response as an identifier to transmit a life message transmitted directly from the corresponding management node or transferred between the participating nodes. Wait for reception. FIG. 6 is a diagram illustrating an example of a message format of the life message.
そして、参加ノードは、(ライフメッセージに含まれる)送信リストへの登録順位に従って、このライフメッセージの転送(a3)を実行する(図3の(C))。ライフメッセージを転送する際、参加ノードは、自ノード情報のシーケンス番号の更新し、前回メッセージ受信時刻からの差分時間を更新する。なお、自ノードが参加ノードとして接続直後の場合は、前回メッセージ受信時刻からの差分時間は0とする。 Then, the participating node executes the transfer (a3) of this life message according to the registration order in the transmission list (included in the life message) ((C) in FIG. 3). When transferring the life message, the participating node updates the sequence number of its own node information and updates the difference time from the previous message reception time. Note that if the local node has just joined as a participating node, the difference time from the previous message reception time is zero.
一方、管理ノードは、ライフメッセージが参加ノードを一周して最後の参加ノードから返信された時間を元にライフメッセージに記載するタイムアウト値を更新し、各ノードにライフメッセージにより通知する。 On the other hand, the management node updates the timeout value described in the life message based on the time when the life message goes around the participating nodes and is returned from the last participating node, and notifies each node by the life message.
図7は、管理ループへのノード追加時の各ノードの動作原理について説明するための概念図である。 FIG. 7 is a conceptual diagram for explaining the operation principle of each node when adding a node to the management loop.
ここでは、ノードA(管理ノード)およびノードB(参加ノード)による既存の管理ループが存在し、既にライフメッセージを交換している状態で、新規の参加要求ノード(ノードC)が現れた場合を想定する。 Here, a case where an existing management loop by the node A (management node) and the node B (participating node) exists, and a new participation request node (node C) appears in a state where the life message has already been exchanged. Suppose.
参加要求ノードであるノードCは、前述のように、ユニークID要求b2をブロードキャスト(またはマルチキャスト)する(図7の(A))。このブロードキャストを受け取った、管理ループに参加するノードは、ライフメッセージの交換(b1)を停止して、管理ノードからのユニークID応答を待つ(図7の(B))。また、管理ノードは、このノードCを追加すべく送信リストを更新し、かつ、ユニークIDを更新して、すべての参加ノードにユニークID応答b3を送信する。 Node C, which is the participation request node, broadcasts (or multicasts) the unique ID request b2 as described above ((A) in FIG. 7). Upon receiving this broadcast, the node participating in the management loop stops life message exchange (b1) and waits for a unique ID response from the management node ((B) of FIG. 7). Further, the management node updates the transmission list to add this node C, updates the unique ID, and transmits the unique ID response b3 to all the participating nodes.
管理ノードより更新後のユニークIDが含まれるユニークID応答が送信されると、各ノードは、保持していたユニークIDを更新して、ライフメッセージ受信待ち状態に移行する。これにより、管理ノードを基点とした、新たなユニークIDに基づくライフメッセージ送信b4が再開される(図7の(C))。 When the unique ID response including the updated unique ID is transmitted from the management node, each node updates the held unique ID and shifts to a life message reception waiting state. Thereby, the life message transmission b4 based on the new unique ID with the management node as the base point is resumed ((C) in FIG. 7).
次に、図8および図9を参照して、管理ループからのノード脱退時の各ノードの動作原理について説明する。 Next, with reference to FIG. 8 and FIG. 9, the operation principle of each node when the node leaves the management loop will be described.
ここでは、ノードA(管理ノード)とノードBおよびノードC(参加ノード)とによる既存の管理ループが存在し、既にライフメッセージを交換している状態で、1つの参加ノード(ノードC)が管理ループから脱退する場合を想定する。 Here, there is an existing management loop consisting of node A (management node), node B, and node C (participating node), and one participating node (node C) manages it while exchanging life messages. Assume that you want to leave the loop.
管理ループから脱退するノードCは、脱退メッセージc2をブロードキャスト(またはマルチキャスト)する(図8の(A))。図9は、ユニークID要求のメッセージフォーマットの一例を示す図である。 The node C leaving the management loop broadcasts (or multicasts) the withdrawal message c2 ((A) in FIG. 8). FIG. 9 is a diagram illustrating an example of a message format of the unique ID request.
このブロードキャストを受け取った、管理ループに参加するノードは、ライフメッセージの交換(c1)を停止して、管理ノードからのユニークID更新c3を待つ。また、管理ノードは、このノードCを削除すべく送信リストを更新し、かつ、ユニークIDを更新して、残りのすべての参加ノードにユニークID更新c3を送信する(図8の(B))。 The node that receives this broadcast and participates in the management loop stops life message exchange (c1) and waits for the unique ID update c3 from the management node. Further, the management node updates the transmission list to delete this node C, updates the unique ID, and transmits the unique ID update c3 to all the remaining participating nodes ((B) in FIG. 8). .
管理ノードより更新後のユニークIDが含まれるユニークID応答が送信されると、各ノードは、保持していたユニークIDを更新して、ライフメッセージ受信待ち状態に移行する。これにより、管理ノードを基点とした、新たなユニークIDに基づくライフメッセージ送信c4が再開される(図8の(C))。 When the unique ID response including the updated unique ID is transmitted from the management node, each node updates the held unique ID and shifts to a life message reception waiting state. Thereby, the life message transmission c4 based on the new unique ID with the management node as the base point is resumed ((C) in FIG. 8).
図10は、管理ループ内の参加ノードの応答が停止した時の各ノードの動作原理について説明するための概念図である。 FIG. 10 is a conceptual diagram for explaining the operation principle of each node when the response of the participating node in the management loop stops.
ここでは、ノードA(管理ノード)とノードBおよびノードC(参加ノード)とによる既存の管理ループが存在し、既にライフメッセージを交換している状態で、1つの参加ノード(ノードC)からのライフメッセージ送信が停止された場合を想定する。 Here, there is an existing management loop of node A (management node), node B, and node C (participating node), and a life message has already been exchanged, and from one participating node (node C), Assume that the life message transmission is stopped.
管理ノードを含むすべてのノードは一定時間のタイムアウト値を共有しており、図6に示したライフメッセージフォーマットの「前回メッセージ受信時刻からの差分時間」から起算したタイムアウト処理の管理を各々が実施する。従って、ノードC自体の故障発生やネットワークの切断などによりライフメッセージd1の交換が止まった状態となると(図10の(A))、その他のすべてのノードでタイムアウトが検出されることになる。 All nodes including the management node share a timeout value for a certain time, and each executes management of timeout processing calculated from “difference time from previous message reception time” in the life message format shown in FIG. . Therefore, when the exchange of the life message d1 is stopped due to the failure of the node C itself or the disconnection of the network ((A) in FIG. 10), a timeout is detected in all other nodes.
そうすると、すべての参加ノードが、管理ノードに対してユニークID要求d2を送信する(図10の(B))。管理ノードは、ユニークID要求を送信してきたノードからなる送信リストを再作成し、かつ、ユニークIDを更新して、当該ユニークID要求を送信してきたノードにユニークID更新d3を送信する(図10の(C))。 Then, all the participating nodes transmit a unique ID request d2 to the management node ((B) in FIG. 10). The management node re-creates a transmission list including nodes that have transmitted the unique ID request, updates the unique ID, and transmits a unique ID update d3 to the node that has transmitted the unique ID request (FIG. 10). (C)).
管理ノードより更新後のユニークIDが含まれるユニークID更新が送信されると、各ノードは、保持していたユニークIDを更新して、ライフメッセージ受信待ち状態に移行する。これにより、管理ノードを基点とした、新たなユニークIDに基づくライフメッセージ送信d4が再開される(図10の(D))。 When the unique ID update including the updated unique ID is transmitted from the management node, each node updates the held unique ID and shifts to a life message reception waiting state. Thereby, the life message transmission d4 based on the new unique ID with the management node as the base point is resumed ((D) in FIG. 10).
また、図11および図12は、管理ループ内の管理ノードの応答が停止した時の各ノードの動作原理について説明するための概念図である。 FIGS. 11 and 12 are conceptual diagrams for explaining the operation principle of each node when the response of the management node in the management loop stops.
ここでは、ノードA(管理ノード)とノードBおよびノードC(参加ノード)とによる既存の管理ループが存在し、既にライフメッセージを交換している状態で、管理ノードであるノードAからのライフメッセージ送信が停止された場合を想定する。 Here, there is an existing management loop of node A (management node), node B, and node C (participating node), and the life message from node A, which is the management node, is already exchanged in the life message. Assume that transmission is stopped.
前述したように、管理ノードを含むすべてのノードは一定時間のタイムアウト値を共有しており、図6に示したライフメッセージフォーマットの「前回メッセージ受信時刻からの差分時間」から起算したタイムアウト処理の管理を各々が実施する。従って、ノードA自体の故障発生やネットワークの切断などによりライフメッセージe1の交換が止まった状態となると(図11の(A))、その他のすべてのノードでタイムアウトが検出されることになる。 As described above, all the nodes including the management node share a timeout value for a certain time, and management of timeout processing calculated from “difference time from previous message reception time” in the life message format shown in FIG. Each implements. Accordingly, when the exchange of the life message e1 is stopped due to the failure of the node A itself or the disconnection of the network ((A) in FIG. 11), a timeout is detected in all other nodes.
そうすると、すべての参加ノードが、管理ノードに対してユニークID要求e2を送信する(図10の(B))。しかしながら、管理ノードが存在しない状態のため、今度はユニークID要求に対するユニークID応答待ち処理がタイムアウトとなる。そこで、各参加ノードは、管理ノードが停止したものと判断する。 Then, all the participating nodes transmit a unique ID request e2 to the management node ((B) in FIG. 10). However, because there is no management node, the unique ID response wait process for the unique ID request times out this time. Therefore, each participating node determines that the management node has stopped.
この場合、図6に示すライフメッセージの順位番号で上位の参加ノードが代替管理ノードに昇格する。代替管理ノードに昇格した参加ノード以外の参加ノードは、昇格した代替管理ノードに対してユニークID要求e3を改めて送信する(図12の(A))。ここでは、ノードCよりも先に管理ループに参加したノードBが代替管理ノードに昇格している例を示しているが、ライフメッセージの順位番号は、管理ループへの参加順に限定されるものではない。管理ループを作成し直す都度、管理ノードが、ライフメッセージの効率的な巡回ルートを探索し、その結果に応じて決定するようにしてもよい。 In this case, the upper participating node is promoted to the alternative management node in the life message rank number shown in FIG. Participating nodes other than the participating node promoted to the alternative management node again transmit the unique ID request e3 to the promoted alternative management node ((A) of FIG. 12). Here, an example is shown in which Node B that participated in the management loop before Node C is promoted to an alternative management node, but the rank number of the life message is not limited to the order of participation in the management loop. Absent. Each time the management loop is re-created, the management node may search for an efficient patrol route of the life message and decide according to the result.
昇格した代替管理ノードは、ユニークID要求を送信してきたノードからなる送信リストを作成し、かつ、ユニークIDを更新して、当該ユニークID要求を送信してきたノードにユニークID更新e4を送信する(図12の(B))。 The promoted alternative management node creates a transmission list including the nodes that have transmitted the unique ID request, updates the unique ID, and transmits the unique ID update e4 to the node that has transmitted the unique ID request ( (B) of FIG.
昇格した代替管理ノードより更新後のユニークIDが含まれるユニークID更新が送信されると、各ノードは、保持していたユニークIDを更新して、ライフメッセージ受信待ち状態に移行する。これにより、昇格した代替管理ノードを基点とした、新たなユニークIDに基づくライフメッセージ送信e5が再開される(図12の(C))。 When a unique ID update including the updated unique ID is transmitted from the promoted alternative management node, each node updates the held unique ID and shifts to a life message reception waiting state. As a result, the life message transmission e5 based on the new unique ID is resumed with the promoted alternative management node as a base point ((C) of FIG. 12).
また、図13乃至図16は、本情報処理装置の冗長構成の運用機能に関わる動作手順を示すタイミングチャートである。 FIG. 13 to FIG. 16 are timing charts showing the operation procedure related to the operation function of the redundant configuration of the information processing apparatus.
まず、図13を参照して、管理ノードの開始処理の動作手順について説明する。 First, the operation procedure of the management node start process will be described with reference to FIG.
管理ノードの開始処理は、ノード管理機能モジュール11によって管理ノード初期設定読込処理が実行された場合に起動する(図13のf1)。この場合、ノード管理機能モジュール11は、管理ノードを構成すべく、管理ノード機能モジュール13に対し、初期化処理の実行を指示する(図13のf2)。これにより、管理ノード機能モジュール13の制御下で、ユニークIDメッセージ管理機能モジュール15、ライフメッセージ管理機能モジュール14、メッセージ送受信機能モジュール16の初期化処理が実行されることになる(図13のf3,f4,f5)。
The management node start process is started when the management node initial setting read process is executed by the node management function module 11 (f1 in FIG. 13). In this case, the node
この初期化処理が終了すると、管理ノード機能モジュール13が、管理ループの構成処理を開始し(図13のf6)、ユニークIDメッセージ管理機能モジュール15に対し、参加ノード情報の収集処理を指示する(図13のf7)。ユニークIDメッセージ管理機能モジュール15は、ユニークIDの収集を開始し(図13のf71)、メッセージ送受信機能モジュール16に対し、ユニークIDメッセージの受信要求を通知する(図13のf711)。これにより、メッセージ送受信機能モジュール16は、メッセージ受信待ち処理に入る(図13のf7111)。
When this initialization process ends, the management
メッセージ送受信機能モジュール16は、ユニークIDメッセージを受信すると、その旨をユニークIDメッセージ管理機能モジュール15に通知する(図13のf8)。ユニークIDメッセージ管理機能モジュール15は、管理ノード機能モジュール13に対し、参加ノードの追加を要求する(図13のf81)。管理ノード機能モジュール13は、この要求に対する返答を行い、収集ノード一覧の更新を実行する(図13のf9)。一方、管理ノード機能モジュール13からの返答を受けたユニークIDメッセージ管理機能モジュール15は、メッセージ送受信機能モジュール16に対し、ユニークID応答メッセージの送信要求を通知する(図13のf82)。これにより、メッセージ送受信機能モジュール16によるメッセージ送信処理が実行される(図13のf821)。
When receiving the unique ID message, the message transmission /
また、管理ノード機能モジュール13は、ライフメッセージ処理を起動する(図13のf10)。このライフメッセージ処理において、管理ノード機能モジュール13は、収集ノード一覧に基づくライフメッセージ情報の作成処理を行い(図13のf101)、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の開始を指示する(図13のf102)。ライフメッセージ管理機能モジュール14は、ライフメッセージ処理を起動し(図13のf1021)、メッセージ送受信機能モジュール16に対し、参加ノードへのライフメッセージの送信を指示する(図13のf10211)。これにより、メッセージ送受信機能モジュール16による参加ノードへのライフメッセージの送信が実行される(図13のf102111)。
Further, the management
次に、ライフメッセージ管理機能モジュール14は、メッセージ送受信機能モジュール16に対し、ライフメッセージの受信要求を通知する(図13のf11)。これにより、メッセージ送受信機能モジュール16は、メッセージ受信待ち処理に入る(図13のf111)。メッセージ送受信機能モジュール16は、ライフメッセージを受信すると、その旨をライフメッセージ管理機能モジュール14に通知する(図13のf112)。ライフメッセージ管理機能モジュール14は、ライフメッセージの確認処理を行い(図13のf1121)、問題がなければ、ライフメッセージの送信をメッセージ送受信機能モジュール16に指示する(図13のf1122)。以降、このライフメッセージの送信が繰り返される(図13のf11221,…)。
Next, the life message
図14は、参加ノードの開始処理手順を示すタイミングチャートである。 FIG. 14 is a timing chart showing the start processing procedure of the participating nodes.
参加ノードの開始処理では、まず、ノード管理機能モジュール11が、参加ノードを構成すべく、参加ノード機能モジュール12に対し、初期化処理の実行を指示する(図14のg1)。これにより、参加ノード機能モジュール12の制御下で、ユニークIDメッセージ管理機能モジュール15、ライフメッセージ管理機能モジュール14、メッセージ送受信機能モジュール16の初期化処理が実行されることになる(図14のg2,g3,g4)。
In the start process of the participating node, first, the node
この初期化処理が終了すると、参加ノード機能モジュール12が、管理ループへの参加処理を開始し(図14のg5)、ユニークIDメッセージ管理機能モジュール15に対し、管理ループへの参加処理を指示する(図14のg51)。ユニークIDメッセージ管理機能モジュール15は、メッセージ送受信機能モジュール16に対し、ユニークID要求メッセージの送信要求を通知する(図14のg511)。これにより、メッセージ送受信機能モジュール16によるメッセージ送信処理が実行される(図14のg5111)。
When this initialization process is completed, the participating
メッセージ送受信機能モジュール16は、ユニークID応答メッセージを受信すると、その旨をユニークIDメッセージ管理機能モジュール15に通知する(図14のg6)。ユニークIDメッセージ管理機能モジュール15は、参加ノード機能モジュール12に対し、管理ループへの参加確認を指示する(図14のg61)。
When receiving the unique ID response message, the message transmission /
また、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の開始を指示する(図14のg7)。ライフメッセージ管理機能モジュール14は、ライフメッセージ処理を起動し(図14のg71)、メッセージ送受信機能モジュール16に対し、ライフメッセージの受信要求を通知する(図14のg711)。これにより、メッセージ送受信機能モジュール16は、メッセージ受信待ち処理に入る(図14のg7111)。
Further, the participating
メッセージ送受信機能モジュール16は、ライフメッセージを受信すると、その旨をライフメッセージ管理機能モジュール14に通知する(図14のg8)。ライフメッセージ管理機能モジュール14は、受信されたライフメッセージの更新処理を行い(図14のg81)、メッセージ送受信機能モジュール16に対し、更新後のライフメッセージの送信を指示する(図14のg811)。これにより、メッセージ送受信機能モジュール16によるライフメッセージの送信が実行される(図14のg8111)。
When the message transmission /
以降、ライフメッセージ管理機能モジュール14は、このライフメッセージの送受信を繰り返す(図14のg82,…)。
Thereafter, the life message
また、図15は、管理ループへの参加ノードの追加処理手順を示すタイミングチャートである。 FIG. 15 is a timing chart showing a procedure for adding a node participating in the management loop.
管理ループへの参加ノードの追加処理は、管理ループに参加するノード間でライフメッセージの送受信が行われている状態において(図15のh1,…,h12)、新たなノード(参加要求ノード)の参加ノード機能モジュール12が管理ループへの参加処理を開始させたことによって起動する(図15のh2)。参加要求ノードの参加ノード機能モジュール12は、ユニークIDメッセージ管理機能モジュール15に対し、管理ループへの参加処理を指示する(図15のh3)。これにより、参加要求ノードからユニークID要求メッセージがブロードキャストされる(図15のh31,h32)。
In the state where life messages are transmitted and received between nodes participating in the management loop (h1,..., H12 in FIG. 15), the process of adding a participating node to the management loop is performed in a new node (participation request node). The participation
管理ノードでは、このユニークID要求メッセージを受信したユニークIDメッセージ管理機能モジュール15が、管理ノード機能モジュール13に対し、参加ノード追加要求を通知する(図15のh311)。これに応答して、管理ノード機能モジュール13は、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の停止を指示する(図15のh3111)。また、ユニークID要求メッセージを受信したユニークIDメッセージ管理機能モジュール15は、参加要求ノードに対し、ユニークID応答メッセージを送信する(図15のh312)。
In the management node, the unique ID message
一方、参加ノードでは、ユニークID要求メッセージを受信したユニークIDメッセージ管理機能モジュール15が、参加ノード機能モジュール12に対し、(自ノードが実行するライフメッセージ送受信のための)管理ループ再構成処理を指示する(図15のh321)。これに応答して、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の再初期化を指示する(図15のh3211)。この初期化後、ライフメッセージ管理機能モジュール14は、ライフメッセージの受信待ち処理に入る(図15のh32111)。
On the other hand, in the participating node, the unique ID message
参加要求ノードのユニークIDメッセージ管理機能モジュール15は、管理ノードからのユニークID応答メッセージを受けると、参加ノード機能モジュール12に対し、管理ループ参加確認を指示する(図15のh3121)。これに応答して、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の開始を指示する(図15のh31211)。これにより、ライフメッセージ管理機能モジュール14は、ライフメッセージ受信待ち処理に入る(図15のh312111)。
When receiving the unique ID response message from the management node, the unique ID message
また、管理ノードでは、管理ノード機能モジュール13が、収集ノード一覧の更新処理を実行して(図15のh4)、ライフメッセージ処理を再開する(図15のh5)。管理ノード機能モジュール13は、更新後の収集ノード一覧に基づき、ライフメッセージ情報の作成処理を実行し(図15のh51)、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理開始を要求する(図15のh52)。これにより、ライフメッセージ管理機能モジュール14によるライフメッセージの送信が実行され(図15のh521)、以降、参加要求ノードを追加した管理ループでのライフメッセージの送受信が実行されることになる(図15のh5211,…)。
In the management node, the management
図16は、代替管理ノードの処理手順を示すタイミングチャートである。 FIG. 16 is a timing chart showing the processing procedure of the alternative management node.
代替管理ノードの処理は、管理ループに参加するノード間でライフメッセージの送受信が行われている状態において(図16のj1,…,j121221)、管理ノードによるライフメッセージの送信が停止したことによって起動する(図16のj2)。各参加ノードのライフメッセージ管理機能モジュール14は、ライフメッセージ受信タイムアウト処理を開始し(図16のj3,j4)、参加ノード機能モジュール12に対し、管理ノードへの送信エラー通知処理を指示する(図16のj31,j41)。これに応答して、参加ノード機能モジュール12は、ユニークIDメッセージ管理機能モジュール15に対し、ユニークID再取得処理を指示する(図16のj311,j411)。
The process of the alternative management node is started when the life message is transmitted and received between the nodes participating in the management loop (j1,..., J122221 in FIG. 16) and the life message transmission by the management node is stopped. (J2 in FIG. 16). The life message
しかしながら、管理ノードは停止しているので、各参加ノードのユニークIDメッセージ管理機能モジュール15は、ユニークID要求送信タイムアウト処理を開始することになる(図16のj3111,j4111)。ユニークIDメッセージ管理機能モジュール15は、参加ノード機能モジュール12に対し、ユニークID取得エラーを通知する(図16のj3112,j4112)。この通知を受けた参加ノード機能モジュール12は、代替管理ノード移行判断処理を実行する(図16のj31121,j41121)。これにより、いずれか1つの参加ノードが代替管理ノードに昇格する。昇格した代替管理ノードの管理ノード機能モジュール13は、ユニークIDメッセージ管理機能モジュール15に対し、ユニークID受信処理を指示する(図16のj311211)。それ以外の参加ノードの参加ノード機能モジュール12は、ユニークID再取得処理を再度指示する(図16のj411211)。
However, since the management node is stopped, the unique ID message
そうすると、ユニークID再取得処理を再度指示された参加ノードのユニークIDメッセージ管理機能モジュール15と、ユニークID受信処理を指示された代替管理ノードのユニークIDメッセージ管理機能モジュール15との間で、ユニークID要求が送受信され(図16のj5)、代替管理ノードのユニークIDメッセージ管理機能モジュール15は、管理ノード機能モジュール13に対し、管理ループへの追加を指示する(図16のj51)。
Then, between the unique ID message
これに応答して、代替管理ノードの管理ノード機能モジュール12は、収集ノード一覧の更新処理を実行して(図16のj511)、管理ループへの追加の完了をIDメッセージ管理機能モジュール15に回答する(図16のj512)。これを受けて、IDメッセージ管理機能モジュール15は、参加ノードのユニークIDメッセージ管理機能モジュール15に対し、ユニークID応答を送信する(図16のj5121)。
In response to this, the management
参加ノードのユニークIDメッセージ管理機能モジュール15は、ユニークID応答を受信すると、参加ノード機能モジュール12に対し、管理ループへの参加完了を通知する(図16のj51211)。これに応答して、参加ノード機能モジュール12は、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の開始を指示する(図16のj512111)。
When receiving the unique ID response, the unique ID message
一方、代替管理ノードの管理ノード機能モジュール13も、ライフメッセージ管理機能モジュール14に対し、ライフメッセージ処理の開始を指示する(図16のj6)。これにより、新たな管理ループによるライフメッセージの送受信が開始される。
On the other hand, the management
以上のように、本情報処理装置は、冗長構成を構築する情報処理装置を適宜に追加・削除すること等を可能とする冗長構成の運用機能を実現する。 As described above, the information processing apparatus realizes an operation function of a redundant configuration that enables an information processing apparatus that constructs a redundant configuration to be added or deleted as appropriate.
なお、本実施形態の動作制御処理は、ソフトウェア(プログラム)によって実現することができるので、このソフトウェアを格納したコンピュータ読み取り可能な記憶媒体を通じてこのソフトウェアを通常のコンピュータにインストールして実行することにより、本実施形態と同様の効果を容易に実現することができる。 Note that the operation control processing of the present embodiment can be realized by software (program), and therefore by installing this software on a normal computer through a computer-readable storage medium storing this software, Effects similar to those of the present embodiment can be easily realized.
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although several embodiments of the present invention have been described, these embodiments are presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
1…プロセッサ、2…主メモリ、3…外部記憶装置、4…入力装置、5…表示装置、6…通信装置、10…管理ループ運用プログラム、11…ノード管理機能モジュール、12…参加ノード機能モジュール、13…管理ノード機能モジュール、14…ライフメッセージ管理機能モジュール、15…ユニークIDメッセージ管理機能モジュール、16…メッセージ送受信機能モジュール16、17…ユーザインタフェース機能モジュール、18…収集ノード一覧テーブル、20…ネットワークプロトコル、30…OS(Operating system)/ドライバ。
DESCRIPTION OF SYMBOLS 1 ... Processor, 2 ... Main memory, 3 ... External storage device, 4 ... Input device, 5 ... Display device, 6 ... Communication device, 10 ... Management loop operation program, 11 ... Node management function module, 12 ... Participating node function module , 13 ... management node function module, 14 ... life message management function module, 15 ... unique ID message management function module, 16 ... message transmission /
Claims (24)
前記冗長構成を構築する情報処理装置間でライフメッセージを巡回させて異常を検出するためのライフメッセージ処理手段と、
前記ライフメッセージの巡回ルートをマスタとして管理し、他の情報処理装置から前記冗長構成への参加要求を受信した場合に、当該他の情報処理装置を前記ライフメッセージの巡回ルートにスレーブとして加えるためのマスタ処理手段と、
前記ライフメッセージの巡回ルートをマスタとして管理する他の情報処理装置に対して前記冗長構成への参加要求を送信して、前記ライフメッセージの巡回ルートにスレーブとして加わるためのスレーブ処理手段と、
を具備する情報処理装置。 In an information processing apparatus that builds a redundant configuration with other information processing apparatuses connected via a network,
A life message processing means for detecting an anomaly by circulating a life message between the information processing apparatuses constructing the redundant configuration;
Managing the life message cyclic route as a master, and when receiving a request to join the redundant configuration from another information processing device, for adding the other information processing device as a slave to the life message cyclic route Master processing means;
A slave processing means for sending a request to participate in the redundant configuration to another information processing apparatus that manages the cyclic route of the life message as a master, and for joining the cyclic route of the life message as a slave;
An information processing apparatus comprising:
前記スレーブ処理手段は、前記冗長構成への参加要求として前記識別情報を要求し、
前記マスタ処理手段は、前記冗長構成への参加要求を受信した場合、新たな識別情報を生成して、当該冗長構成への参加要求の要求元を含む前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項1記載の情報処理装置。 The life message processing means performs transmission / reception of the life message based on identification information shared between information processing apparatuses that construct the redundant configuration,
The slave processing means requests the identification information as a request to participate in the redundant configuration,
When receiving the request for participation in the redundant configuration, the master processing means generates new identification information and participates as a slave in the cyclic route of the life message including the request source of the request for participation in the redundant configuration. Send to other information processing devices,
The information processing apparatus according to claim 1.
前記マスタ処理手段は、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たな識別情報を生成して、当該冗長構成からの脱退要求の要求元を除いた前記ライフメッセージの巡回ルートに参加する他の情報処理装置に送信し、
前記スレーブ処理手段は、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たに生成された識別情報の受信を待機する、
請求項2記載の情報処理装置。 The slave processing means and the master processing means send a withdrawal request from the redundant configuration to other information processing devices participating in the life message circulation route to leave the life message circulation route. Having means,
When the master processing unit receives a withdrawal request from the redundant configuration from another information processing apparatus that participates in the cyclic route of the life message, the master processing unit generates new identification information and sends a request for withdrawal from the redundant configuration. Send to other information processing devices participating in the cyclic route of the life message excluding the request source,
When the slave processing means receives a withdrawal request from the redundant configuration from another information processing apparatus that participates in the cyclic route of the life message, it waits for reception of newly generated identification information.
The information processing apparatus according to claim 2.
前記マスタ処理手段は、自装置が前記ライフメッセージの巡回ルートにスレーブとして参加している状態から前記ライフメッセージの巡回ルートを代替マスタとして管理すべく稼働した場合、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項3記載の情報処理装置。 The slave processing unit manages the cyclic route of the life message as an alternative master when the newly generated identification information is not received beyond a predetermined period after receiving the withdrawal request from the redundant configuration. And means for operating the master processing means,
When the master processing unit operates to manage the life message circulation route as an alternative master from the state in which the own device participates as a slave in the life message circulation route, generates new identification information, Send to other information processing devices participating as a slave in the cyclic route of the life message,
The information processing apparatus according to claim 3.
前記マスタ処理手段は、自装置が前記ライフメッセージの巡回ルートにスレーブとして参加している状態から前記ライフメッセージの巡回ルートを代替マスタとして管理すべく稼働した場合、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項6記載の情報処理装置。 The slave processing means requests new identification information from another information processing apparatus that manages the life message cyclic route as a master because the life message is not received beyond a predetermined period. When new identification information has not been returned from the other information processing device, the means for operating the master processing means to manage the circulation route of the life message as an alternative master,
When the master processing unit operates to manage the life message circulation route as an alternative master from the state in which the own device participates as a slave in the life message circulation route, generates new identification information, Send to other information processing devices participating as a slave in the cyclic route of the life message,
The information processing apparatus according to claim 6.
前記冗長構成を構築する情報処理装置間でライフメッセージを巡回させて異常を検出することと、
前記ライフメッセージの巡回ルートをマスタとして管理し、他の情報処理装置から前記冗長構成への参加要求を受信した場合に、当該他の情報処理装置を前記ライフメッセージの巡回ルートにスレーブとして加えることと、
前記ライフメッセージの巡回ルートをマスタとして管理する他の情報処理装置に対して前記冗長構成への参加要求を送信して、前記ライフメッセージの巡回ルートにスレーブとして加わることと、
を具備する動作制御方法。 An operation control method in an information processing apparatus that builds a redundant configuration with another information processing apparatus connected via a network,
Detecting an anomaly by circulating a life message between the information processing devices constructing the redundant configuration;
Managing the cyclic route of the life message as a master, and when receiving a request to participate in the redundant configuration from another information processing device, adding the other information processing device as a slave to the cyclic route of the life message; ,
Sending a request to participate in the redundant configuration to another information processing apparatus that manages the cyclic route of the life message as a master, and joining as a slave to the cyclic route of the life message;
An operation control method comprising:
前記ライフメッセージの巡回ルートにスレーブとして加わることは、前記冗長構成への参加要求として前記識別情報を要求し、
前記ライフメッセージの巡回ルートをマスタとして管理することは、前記冗長構成への参加要求を受信した場合、新たな識別情報を生成して、当該冗長構成への参加要求の要求元を含む前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項9記載の動作制御方法。 Detecting the abnormality is performed by transmitting and receiving the life message based on identification information shared between information processing devices that construct the redundant configuration,
To join as a slave in the cyclic route of the life message, request the identification information as a request to participate in the redundant configuration,
Managing the cyclic route of the life message as a master, when receiving a request to participate in the redundant configuration, generates new identification information and includes the request source of the request for participation in the redundant configuration. To other information processing devices participating as slaves in the traveling route of
The operation control method according to claim 9.
前記ライフメッセージの巡回ルートをマスタとして管理することは、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たな識別情報を生成して、当該冗長構成からの脱退要求の要求元を除いた前記ライフメッセージの巡回ルートに参加する情報処理装置に送信し、
前記ライフメッセージの巡回ルートにスレーブとして加わることは、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たに生成された識別情報の受信を待機する、
請求項10記載の動作制御方法。 Further comprising a request for withdrawal from the redundant configuration to another information processing apparatus participating in the cyclic route of the life message to leave the cyclic route of the life message,
Managing the life message cyclic route as a master, when receiving a withdrawal request from the redundant configuration from another information processing apparatus participating in the life message cyclic route, generating new identification information, Send to the information processing apparatus participating in the cyclic route of the life message excluding the request source of the withdrawal request from the redundant configuration,
Adding as a slave to the life message cyclic route means that when a withdrawal request from the redundant configuration is received from another information processing apparatus participating in the life message cyclic route, the newly generated identification information is received. stand by,
The operation control method according to claim 10.
前記ライフメッセージの巡回ルートを代替マスタとして管理することは、稼働時、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項11記載の動作制御方法。 When participating in the cyclic route of the life message as a slave, if the identification information newly generated over a predetermined period is not received after receiving the withdrawal request from the redundant configuration, the life message Further managing the tour route as an alternative master,
Managing the life message cyclic route as an alternative master is to generate new identification information during operation and transmit it to other information processing devices participating as slaves in the life message cyclic route.
The operation control method according to claim 11.
前記ライフメッセージの巡回ルートを代替マスタとして管理することは、稼働時、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項14記載の動作制御方法。 Another information processing apparatus that manages the life message circulation route as a master because the life message is not received beyond a predetermined period when participating in the life message circulation route as a slave. When the new identification information is not returned from the other information processing apparatus when requesting the new identification information, the life message circulation route is further managed as an alternative master,
Managing the life message cyclic route as an alternative master is to generate new identification information during operation and transmit it to other information processing devices participating as slaves in the life message cyclic route.
The operation control method according to claim 14.
前記冗長構成を構築する情報処理装置間でライフメッセージを巡回させて異常を検出するためのライフメッセージ処理手段、
前記ライフメッセージの巡回ルートをマスタとして管理し、他の情報処理装置から前記冗長構成への参加要求を受信した場合に、当該他の情報処理装置を前記ライフメッセージの巡回ルートにスレーブとして加えるためのマスタ処理手段、
前記ライフメッセージの巡回ルートをマスタとして管理する他の情報処理装置に対して前記冗長構成への参加要求を送信して、前記ライフメッセージの巡回ルートにスレーブとして加わるためのスレーブ処理手段、
として動作させるものであるプログラム。 A program executed by a computer that builds a redundant configuration with another computer connected via a network, the program
A life message processing means for detecting an anomaly by circulating a life message between the information processing apparatuses constructing the redundant configuration;
Managing the life message cyclic route as a master, and when receiving a request to join the redundant configuration from another information processing device, for adding the other information processing device as a slave to the life message cyclic route Master processing means,
A slave processing means for transmitting a request to participate in the redundant configuration to another information processing apparatus that manages the cyclic route of the life message as a master, and for joining the cyclic route of the life message as a slave;
A program that is intended to operate as
前記スレーブ処理手段は、前記冗長構成への参加要求として前記識別情報を要求し、
前記マスタ処理手段は、前記冗長構成への参加要求を受信した場合、新たな識別情報を生成して、当該冗長構成への参加要求の要求元を含む前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項15記載のプログラム。 The life message processing means performs transmission / reception of the life message based on identification information shared between information processing apparatuses that construct the redundant configuration,
The slave processing means requests the identification information as a request to participate in the redundant configuration,
When receiving the request for participation in the redundant configuration, the master processing means generates new identification information and participates as a slave in the cyclic route of the life message including the request source of the request for participation in the redundant configuration. Send to other information processing devices,
The program according to claim 15.
前記マスタ処理手段は、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たな識別情報を生成して、当該冗長構成からの脱退要求の要求元を除いた前記ライフメッセージの巡回ルートに参加する他の情報処理装置に送信し、
前記スレーブ処理手段は、前記ライフメッセージの巡回ルートに参加する他の情報処理装置から前記冗長構成からの脱退要求を受信した場合、新たに生成された識別情報の受信を待機する、
請求項18記載のプログラム。 The slave processing means and the master processing means send a withdrawal request from the redundant configuration to other information processing devices participating in the life message circulation route to leave the life message circulation route. Having means,
When the master processing unit receives a withdrawal request from the redundant configuration from another information processing apparatus that participates in the cyclic route of the life message, the master processing unit generates new identification information and sends a request for withdrawal from the redundant configuration. Send to other information processing devices participating in the cyclic route of the life message excluding the request source,
When the slave processing means receives a withdrawal request from the redundant configuration from another information processing apparatus that participates in the cyclic route of the life message, it waits for reception of newly generated identification information.
The program according to claim 18.
前記マスタ処理手段は、自装置が前記ライフメッセージの巡回ルートにスレーブとして参加している状態から前記ライフメッセージの巡回ルートを代替マスタとして管理すべく稼働した場合、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項19記載のプログラム。 The slave processing unit manages the cyclic route of the life message as an alternative master when the newly generated identification information is not received beyond a predetermined period after receiving the withdrawal request from the redundant configuration. And means for operating the master processing means,
When the master processing unit operates to manage the life message circulation route as an alternative master from the state in which the own device participates as a slave in the life message circulation route, generates new identification information, Send to other information processing devices participating as a slave in the cyclic route of the life message,
The program according to claim 19.
前記マスタ処理手段は、自装置が前記ライフメッセージの巡回ルートにスレーブとして参加している状態から前記ライフメッセージの巡回ルートを代替マスタとして管理すべく稼働した場合、新たな識別情報を生成して、前記ライフメッセージの巡回ルートにスレーブとして参加する他の情報処理装置に送信する、
請求項22記載のプログラム。 The slave processing means requests new identification information from another information processing apparatus that manages the life message cyclic route as a master because the life message is not received beyond a predetermined period. When new identification information has not been returned from the other information processing device, the means for operating the master processing means to manage the circulation route of the life message as an alternative master,
When the master processing unit operates to manage the life message circulation route as an alternative master from the state in which the own device participates as a slave in the life message circulation route, generates new identification information, Send to other information processing devices participating as a slave in the cyclic route of the life message,
The program according to claim 22.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010291093A JP2012138841A (en) | 2010-12-27 | 2010-12-27 | Information processing device, operation control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010291093A JP2012138841A (en) | 2010-12-27 | 2010-12-27 | Information processing device, operation control method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012138841A true JP2012138841A (en) | 2012-07-19 |
Family
ID=46675898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010291093A Withdrawn JP2012138841A (en) | 2010-12-27 | 2010-12-27 | Information processing device, operation control method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012138841A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020505798A (en) * | 2017-10-31 | 2020-02-20 | ティオネスタ・エルエルシー | Methods and systems for monitoring livestock |
JP2020510248A (en) * | 2017-10-31 | 2020-04-02 | ティオネスタ・エルエルシー | Method and system for monitoring physical assets |
-
2010
- 2010-12-27 JP JP2010291093A patent/JP2012138841A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020505798A (en) * | 2017-10-31 | 2020-02-20 | ティオネスタ・エルエルシー | Methods and systems for monitoring livestock |
JP2020510248A (en) * | 2017-10-31 | 2020-04-02 | ティオネスタ・エルエルシー | Method and system for monitoring physical assets |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5883466B2 (en) | Multicast distributed by endpoints | |
US11343599B2 (en) | System and method for topology discovery and fiber continuity verification in network | |
CN104054302A (en) | Scaling address resolution for massive data centers | |
CA2897118A1 (en) | System and method for providing p2p based reconfigurable computing and structured data distribution | |
CN105359457A (en) | Multi-tier push hybrid service control architecture for large scale conferencing over information centric network, icn | |
KR20090078721A (en) | Upnp ras apparatus for supporting multiple remote access and method thereof | |
CN110572808B (en) | Bluetooth Mesh network system, establishing method, network distributor, equipment and medium | |
TWI740210B (en) | Method for terminal device management and server | |
JPH11313059A (en) | Multicasting communication method/system and storage medium recording multicasting communication program | |
JP5962676B2 (en) | Information processing apparatus, information processing method, and program | |
CN109040184B (en) | Host node election method and server | |
CN104144124B (en) | Data forwarding method, Apparatus and system | |
CN104468854A (en) | Vertical converged framework constructing method and device | |
CN103259866B (en) | A kind of method and system of DNS zone file multi-node transmission | |
US8582422B2 (en) | Access point configuration propagation | |
JP2012138841A (en) | Information processing device, operation control method, and program | |
WO2010109767A1 (en) | Data synchronization system, data synchronization method, and synchronization control server | |
CN113194119B (en) | Configuration file acquisition method and device | |
JP2022172168A (en) | Point-to-point database synchronization over transport protocol | |
JP6256506B2 (en) | Information processing apparatus, information processing system, server, and program | |
CN102577249A (en) | Connected instance group of dynamically addressed hosts | |
JP5673268B2 (en) | Communication device and program | |
JP5169988B2 (en) | Network equipment | |
JP2015037267A (en) | Network apparatus setting system and network apparatus setting method | |
CN106878051B (en) | Multi-machine backup implementation method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140304 |