JP4318211B2 - 高信頼システム、冗長構成制御方法及びプログラム - Google Patents
高信頼システム、冗長構成制御方法及びプログラム Download PDFInfo
- Publication number
- JP4318211B2 JP4318211B2 JP2004063506A JP2004063506A JP4318211B2 JP 4318211 B2 JP4318211 B2 JP 4318211B2 JP 2004063506 A JP2004063506 A JP 2004063506A JP 2004063506 A JP2004063506 A JP 2004063506A JP 4318211 B2 JP4318211 B2 JP 4318211B2
- Authority
- JP
- Japan
- Prior art keywords
- pair
- devices
- failure
- hub
- same
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2007—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
(1)障害発生から監視者がそれを認識するまでの時間
(2)監視者が認識してから保守センタへ連絡するまでの時間
(3)保守センタが連絡を受け、保守員が現地に到着するまでの時間
(4)保守作業を始めてから、復旧が終わるまでの時間
(1)使用者による装置監視
(2)遠隔監視装置および自動通報装置とプロバイダによる24時間監視サービス
(1)異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
(2)異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
(3)異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
(4)異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
(5)同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築する。
装置ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置ペアを組んだ装置間でサービス処理部42による処理を同期させる同期処理ステップと、
ペア相手装置の障害を検出する障害検出ステップと、
障害検出ステップでペア相手装置の障害を検出した際に、ネットワークにペア要求を発行し、ペア申入れのあった装置との間で装置ペアを再構築する障害処理ステップと、
を備えたことを特徴とする。
装置ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置ペアを組んだ装置間で前記サービス処理ステップによる処理を同期させる同期処理ステップと、
ぺア相手装置の障害を検出する障害検出ステップと、
障害検出ステップでペア相手装置の障害を検出した際に、ネットワークにペア要求を発行し、ペア申入れのあった装置との間で装置ペアを再構築する障害処理ステップと、
を実行させることを特徴とする。
(1)装置固有のサービスを実行する装置
(2)予備のための装置
(3)装置固有の処理を実行すると共に、同期用ソフトウェアを配信する装置
(1)上位4ビットがペア番号で下位4ビットの値を全ハブ数(10進)で割った値の余 りがハブ番号となる値を入れる。
(2)上位1ビットで通信識別子0〜128,128〜255の2つのハブグループを表 わす。
(3)上位4ビットで通信識別子0〜15,16〜31,…240〜255の16個のハ ブグループを表わす。
ステップS1:システムを起動する。
ステップS2:同期先パラメータを読み込んでペア相手装置を認識する。
ステップS3:同期先パラメータを使用してペア相手装置との通信を行う。
ステップS4:ペア相手装置が運用状態か否かチェックし、運用状態にあればステップS5に進み、運用状態になければステップS6に進む。
ステップS5:ペア相手装置が運用状態にあることから、既に稼動しているペア相手装置を主、自己を従に決定する。
ステップS6:ペア相手装置が稼動していない場合であり、ペア相手装置が稼動するまで待ち合わせる。
ステップS7:稼動したペア相手装置との間で一定のアルゴリズムでペアの主従を決定する。この一定のアルゴリズムとしては、故障の有無、過去の故障履歴などを考慮し、故障が少なく且つ故障履歴が少ない方を主、そうでない方を従に決定する。
ステップS8:主従関係を決定した後に、ペア相手装置との間で同期処理を実行する。この同期処理はメモリコピー、HDDコピー、演算装置の値コピーを行った後、各部位の状態により必要に応じて同期処理を実行する。
ステップS9:運用状態であり、ペアとなった装置で同じサービス処理を実行する。
ステップS10:運用状態において故障発生の有無を検出しており、故障発生があるとステップS11に進む。
ステップS11:故障発生に基づき故障ノードを切り離し、内部ネットワークから離脱する。
(1)同一ハブ番号=00
(2)異なるハブ番号=1
(3)一番近いペア相手と同じペア番号とハブ番号=00,1
となり、この場合のペア相手の通信識別子は「001」となって、図5(A)の管理テーブル46からペア相手は装置番号#01の装置12−1となるが、この装置が故障装置であることから候補は存在しない。
ステップS1:同期処理におけるペア相手装置のステータスをチェックする。
ステップS2:ステータスから故障検出か否かチェックし、故障検出でなければステップS1に戻り、故障検出であればステップS3に進む。
ステップS3:同期処理部38及び障害処理部36に故障検出通知を行って処理を通知する。
ステップS1:ペア相手装置の故障検出通知結果の有無をチェックする。故障検出通知があればステップS2に進む。
ステップS2:内部ネットワークにペア要求を発行する。
ステップS3:ペア申し入れの有無をチェックし、ペア申し入れがあればステップS4に進み、なければステップS8に進む。
ステップS4:ペア申し入れのあったペア相手先に対し、例えば図10のルールテーブル54に従ってペア相手先装置を選出するペア選出処理を実行する。
ステップS5:選出したペア相手先装置にペア決定通知を発行する。
ステップS6:ペア決定通知を行ったペア相手装置からの確認応答の有無をチェックし、確認応答があればステップS7に進み、そうでなければステップS8に進む。
ステップS7:同期処理部38にペア相手装置を通知する。即ち同期先パラメータ40の更新を行う。
ステップS8:他の装置からペア要求を受信したか否かチェックしており、ペア要求を受信した場合はステップS9に進み、そうでなければステップS1に戻る。
ステップS9:ペア要求に対し自己は予備装置又は空き装置か否かチェックし、予備装置また空き装置であればステップS10に進み、そうでなければステップS1に戻る。
ステップS10:ペア要求を行った装置に対しペア申し入れを応答する。
ステップS11:ペア申し入れに対し、ペア決定通知の有無をチェックしており、ペア決定通知があればステップS12に進み、そうでなければステップS1に戻る。
ステップS12:ペア決定通知に対し確認応答を行う。
ステップS13:同期処理部38にペア相手装置の通知を行って同期先パラメータ40を更新する。
ステップS1:ネットワークに対し同期用ソフトウェアの配信要求を発行する。
ステップS2:同期用ソフトウェアを受信してインストールする。
(付記1)
複数の装置を内部ネットワークを介して相互に接続し、前記複数の装置について装置ペアを構築する共に予備装置を割り当てて冗長化した高信頼システムに於いて、
装置ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理部と、
装置ペアを組んだ装置間で前記サービス処理部による処理を同期させる同期処理部と、
ペア相手装置の障害を検出する障害検出部と、
前記障害検出部でペア相手装置の障害を検出した際に、ネットワークにペア要求を発行し、ペア申入れのあった装置との間で装置ペアを再構築する障害処理部と、
を備えたことを特徴とする高信頼システム。(1)
付記1記載の高信頼システムに於いて、前記障害処理部は、ペア相手装置に対し前記サービス処理部の機能を実現するソフトウェア及び処理データを内部ネットワークを介して転送コピーすることにより同じサービス処理部を構築して同期処理に移行させることを特徴とする高信頼システム。(2)
付記1記載の高信頼システムに於いて、前記障害処理部は、複数の処理装置からペア申入れを受けた場合、予備装置以外の空き装置を優先的に選択して装置ペアを再構築し、前記空き装置からの申入れがない場合に予備装置を選択して装置ペアを再構築することを特徴とする高信頼システム。(3)
付記1記載の高信頼システムに於いて、前記同期処理部は、装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行することを特徴とする高信頼システム。(4)
付記1記載の高信頼システムに於いて、前記同期処理部は、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納し、
前記障害処理部は、複数の処理装置からペア申入れを受けた場合、前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築することを特徴とする高信頼システム。(5)
付記5記載の高信頼システムに於いて、前記障害処理部は、複数の装置からペア申入れを受けた際に、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築することを特徴とする高信頼システム。(6)
付記5記載の高信頼システムに於いて、前記ペア番号とハブ番号の組合せを装置の通信識別子とすることを特徴とする高信頼システム。
付記1記載の高信頼システムに於いて、更に、故障装置を新たな装置と交換した際に、前記内部ネットワークに対し同期用ソフトウェアの配信を要求し、ソフトウェア配信装置の割当を受けた特定のペア装置の一方から前記同期用ソフトウェアの配信を受けて前記同期処理部、障害検出部及び障害処理部を構築する初期化処理部を備えたことを特徴とする高信頼システム。(7)
付記8記載の高信頼システムに於いて、前記初期化処理部により前記固定機能部に構築された前記障害処理部は、前記内部ネットワークに予備追加通知を発行し、ペア申入れのあった装置との間で予備装置ペアを構築することを特徴とする高信頼システム。(8)
複数の装置を内部ネットワークを介して相互に接続し、前記複数の装置について装置ペアを構築する共に予備装置を割り当てて冗長化した高信頼システムの冗長構成制御方法に於いて、
装置ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置ペアを組んだ装置間で前記サービス処理ステップによる処理を同期させる同期処理ステップと、
ペア相手装置の障害を検出する障害検出ステップと、
前記障害検出ステップでペア相手装置の障害を検出した際に、ネットワークにペア要求を発行し、ペア申入れのあった装置との間で装置ペアを再構築する障害処理ステップと、
を備えたことを特徴とする冗長構成制御方法。(9)
付記10記載の冗長構成制御方法に於いて、前記障害処理ステップは、ペア相手装置に対し前記サービス処理ステップの機能を実現するソフトウェア及び処理データを内部ネットワークを介して転送コピーすることにより同じサービス処理部を構築して同期処理に移行させることを特徴とする冗長構成制御方法。
付記10記載の冗長構成制御方法に於いて、前記障害処理ステップは、複数の処理装置からペア申入れを受けた場合、予備装置以外の空き装置を優先的に選択して装置ペアを再構築し、前記空き装置からの申入れがない場合に予備装置を選択して装置ペアを再構築することを特徴とする冗長構成制御方法。
付記10記載の冗長構成制御方法に於いて、前記同期処理ステップは、装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行することを特徴とする冗長構成制御方法。
付記10記載の冗長構成制御方法に於いて、前記同期処理ステップは、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納し、
前記障害処理ステップは、複数の処理装置からペア申入れを受けた場合、前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築することを特徴とする冗長構成制御方法。
付記14記載の冗長構成制御方法に於いて、前記障害処理ステップは、複数の装置からペア申入れを受けた際に、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築することを特徴とする冗長構成制御方法。
付記14記載の冗長構成制御方法に於いて、前記ペア番号とハブ番号の組合せを装置の通信識別子とすることを特徴とする冗長構成制御方法。
付記10記載の冗長構成制御方法に於いて、更に、故障装置を新たな装置と交換した際に、前記内部ネットワークに対し同期機能ソフトウェアの配信を要求し、ソフトウェア配信装置の割当を受けた特定のペア装置の一方から前記同期用ソフトウェアの配信を受けて前記同期処理部、障害検出部及び障害処理部を構築する初期化ステップを備えたことを特徴とする冗長構成制御方法。
付記17記載の冗長構成制御方法に於いて、前記初期化ステップにより前記固定機能部に構築された前記障害処理部は、前記内部ネットワークに予備追加通知を発行し、ペア申入れのあった装置との間で予備装置ペアを構築することを特徴とする冗長構成制御方法。
複数の装置を内部ネットワークを介して相互に接続し、前記複数の装置について装置ペアを構築する共に予備装置を割り当てて冗長化た高信頼システムの各装置を構成するコンピュータに、
装置ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置ペアを組んだ装置間で前記サービス処理ステップによる処理を同期させる同期処理ステップと、
ぺア相手装置の障害を検出する障害検出ステップと、
前記障害検出ステップでペア相手装置の障害を検出した際に、ネットワークにペア要求を発行し、ペア申入れのあった装置との間で装置ペアを再構築する障害処理ステップと、
を実行させることを特徴とするプログラム。(10)
付記19記載のプログラムに於いて、前記障害処理ステップは、ペア相手装置に対し前記サービス処理ステップの機能を実現するソフトウェア及び処理データを内部ネットワークを介して転送コピーすることにより同じサービス処理ステップを構築して同期処理に移行させることを特徴とするプログラム。
付記19記載のプログラムに於いて、前記障害処理ステップは、複数の処理装置からペア申入れを受けた場合、予備装置以外の空き装置を優先的に選択して装置ペアを再構築し、前記空き装置からの申入れがない場合に予備装置を選択して装置ペアを再構築することを特徴とするプログラム。
付記19記載のプログラムに於いて、前記同期処理ステップは、装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行することを特徴とするプログラム。
付記19記載のプログラムに於いて、前記同期処理ステップは、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納し、
前記障害処理ステップは、複数の処理装置からペア申入れを受けた場合、前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築することを特徴とするプログラム。
付記23記載のプログラムに於いて、前記障害処理ステップは、複数の装置からペア申入れを受けた際に、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築することを特徴とするプログラム。
付記23記載のプログラムに於いて、前記ペア番号とハブ番号の組合せを装置の通信識別子とすることを特徴とするプログラム。
付記19記載のプログラムに於いて、更に、故障装置を新たな装置と交換した際に、前記内部ネットワークに対し同期機能ソフトウェアの配信を要求し、ソフトウェア配信装置の割当を受けた特定のペア装置の一方から前記同期用ソフトウェアの配信を受けて前記同期処理ステップ、障害検出ステップ及び障害処理ステップを構築する初期化ステップを備えたことを特徴とするプログラム。
付記26記載のプログラムに於いて、前記初期化ステップにより前記交換装置の固定機能部に構築された前記障害処理ステップは、前記内部ネットワークに予備追加通知を発行し、ペア申入れのあった装置との間で予備装置ペアを構築することを特徴とするプログラム。
12−0〜12−11:装置
14,14−0〜14−5:ペア
15:内部ネットワーク
16,16−1,16−2,18−1,18−2:ハブ
20:外部ネットワーク
22:固定機能部
24:可変機能部
26:ハードウェア環境
28:ミドルウェア環境
30:アプリケーション環境
31:ネットワーク接続部
32:初期化処理部
34:障害検出部
36:障害処理部
38:同期処理部
40:同期先パラメータ
42:サービス処理部
44−0〜44−5:同期通信
46:管理テーブル
48:ペアテープル
Claims (7)
- コンピュータにより、
同期処理部、サービス処理部、障害検出部、障害処理部を有する装置をペアとして組合せ、複数ペアのうち一組のペアを予備装置とし、他の一組のペアを配信装置とし、残りのペアをそれぞれ独立した通信用として用い、各ペアはペアを組んだ他方の装置と内部ネットワークを介して同期動作を行うと共に一方を主装置に他方を従装置と設定して外部ネットワークを介して情報授受を行う高信頼システムに於いて、
前記サービス処理部はペア毎に固有のサービスを提供するソフトウェアを実行し、
前記同期処理部は、装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行すると共に、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納してペアを組んだ装置間で前記サービス処理部による処理を同期させ、
前記障害検出部は、ペア相手装置の障害を検出し、
前記障害処理部は、ペア相手先装置の障害を前記障害検出部が検出したとき内部ネットワークにペア要求を発行し、ペア申し入れのあった装置との間で装置ペアを再構築し、複数の処理装置からペア申入れを受けた場合は前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築し、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築することを特徴とする高信頼システム。
- 請求項1記載の高信頼システムに於いて、前記障害処理部は、装置再構築をしたペア相手装置に対し前記サービス処理部の機能を実現するソフトウェア及び処理データを内部ネットワークを介して転送コピーすることにより同じサービス処理部を構築して同期処理に移行させることを特徴とする高信頼システム。
- 請求項1記載の高信頼システムに於いて、前記障害処理部は、複数の処理装置からペア申入れを受けた場合、予備装置以外の空き装置を優先的に選択して装置ペアを再構築し、前記空き装置からの申入れがない場合に予備装置を選択して装置ペアを再構築することを特徴とする高信頼システム。
- 請求項1記載の高信頼システムに於いて、更に、故障装置を新たな装置と交換した際に、前記内部ネットワークに対し同期用ソフトウェアの配信を要求し、ソフトウェア配信装置の割当を受けた特定のペア装置の一方から前記同期用ソフトウェアの配信を受けて前記同期処理部、障害検出部及び障害処理部を構築する初期化処理部を備えたことを特徴とする高信頼システム。
- 請求項4記載の高信頼システムに於いて、前記初期化処理部により構築された前記障害処理部は、前記内部ネットワークに予備追加通知を発行し、ペア申入れのあった装置との間で予備装置ペアを構築することを特徴とする高信頼システム。
- 同一機能を有する2台を一組としたペアを複数用意し、複数ペアのうち一組のペアを予備装置とし、他の一組のペアを配信装置とし、残りのペアをそれぞれ独立した通信用として用い、各ペアはペアを組んだ他方の装置と内部ネットワークを介して同期動作を行うと共に一方を主装置に他方を従装置と設定して外部ネットワークを介して情報授受を行わせるため各装置が有するコンピュータに、
ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行すると共に、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納してペアを組んだ装置間で前記サービス処理ステップによる処理を同期さる同期処理ステップと、
ペア相手装置の障害を検出する障害検出ステップと、
前記障害検出ステップでペア相手先装置の障害を検出した際に、内部ネットワークにペア要求を発行し、ペア申し入れのあった装置との間で装置ペアを再構築し、複数の処理装置からペア申入れを受けた場合は前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築し、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築する障害処理ステップと、
を備えたことを特徴とする冗長構成制御方法。
- 同一機能を有する2台を一組としたペアを複数用意し、複数ペアのうち一組のペアを予備装置とし、他の一組のペアを配信装置とし、残りのペアをそれぞれ独立した通信用として用い、各ペアはペアを組んだ他方の装置と内部ネットワークを介して同期動作を行うと共に一方を主装置に他方を従装置と設定して外部ネットワークを介して情報授受を行わせるため各装置が有するコンピュータに、
ペア毎に固有のサービスを提供するソフトウェアを実行するサービス処理ステップと、
装置番号に対応してペア同士を示すペア番号を格納した管理テーブルを管理し、前記管理テーブルの自己と同じペア番号をもつ装置をペア相手装置と認識して同期処理を実行すると共に、前記管理テーブルに装置番号に対応したペア番号に加えて更に、外部ネットワークと接続するハブ番号、予備装置を示す予備フラグ、故障装置を示す故障フラグを格納してペアを組んだ装置間で前記サービス処理ステップによる処理を同期さる同期処理ステップと、
ペア相手装置の障害を検出する障害検出ステップと、
前記障害検出ステップでペア相手先装置の障害を検出した際に、内部ネットワークにペア要求を発行し、ペア申し入れのあった装置との間で装置ペアを再構築し、複数の処理装置からペア申入れを受けた場合は前記管理テーブルのペア番号とハブ番号に基づいて新たなペア相手装置を選択して装置ペアを再構築し、
異なるハブ番号且つ同一ペア番号で且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第1ルール、
異なるハブ番号且つ同一ペア番号の装置をペア相手装置とする第2ルール、
異なるハブ番号且つ異なるペア番号且つ一番最近のペアであった装置と同じハブ番号かつ同じペア番号の装置をペア相手装置とする第3ルール、
異なるハブ番号且つ異なるペア番号の装置をペア相手装置とする第4ルール、及び
同じハブ番号且つ異なるペア番号の装置をペア相手装置とする第5ルール、
を順次適用してペア相手装置を決定して再構築する障害処理ステップと、
を実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004063506A JP4318211B2 (ja) | 2004-03-08 | 2004-03-08 | 高信頼システム、冗長構成制御方法及びプログラム |
US10/892,240 US7752493B2 (en) | 2004-03-08 | 2004-07-16 | High reliability system, redundant construction control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004063506A JP4318211B2 (ja) | 2004-03-08 | 2004-03-08 | 高信頼システム、冗長構成制御方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005251055A JP2005251055A (ja) | 2005-09-15 |
JP4318211B2 true JP4318211B2 (ja) | 2009-08-19 |
Family
ID=34909313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004063506A Expired - Fee Related JP4318211B2 (ja) | 2004-03-08 | 2004-03-08 | 高信頼システム、冗長構成制御方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7752493B2 (ja) |
JP (1) | JP4318211B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122573A (ja) * | 2005-10-31 | 2007-05-17 | Nec Corp | 仮想サーバシステム、分散制御方法およびプログラム |
JP4757669B2 (ja) * | 2006-03-15 | 2011-08-24 | 日本電気通信システム株式会社 | エコーキャンセラ装置及び切替制御方法 |
JP4611922B2 (ja) * | 2006-03-28 | 2011-01-12 | 富士通株式会社 | 制御プログラム、制御方法および制御装置 |
JP5192226B2 (ja) | 2007-12-27 | 2013-05-08 | 株式会社日立製作所 | 待機系計算機の追加方法、計算機及び計算機システム |
JP5176231B2 (ja) * | 2008-03-10 | 2013-04-03 | 株式会社日立製作所 | 計算機システム、計算機制御方法及び計算機制御プログラム |
JP4621273B2 (ja) * | 2008-08-05 | 2011-01-26 | 株式会社日立製作所 | データ同期方法、データ同期プログラム、データベースサーバ装置、および、データベースシステム |
US8682495B2 (en) * | 2010-10-21 | 2014-03-25 | The Boeing Company | Microgrid control system |
US8635492B2 (en) | 2011-02-15 | 2014-01-21 | International Business Machines Corporation | State recovery and lockstep execution restart in a system with multiprocessor pairing |
US8930752B2 (en) | 2011-02-15 | 2015-01-06 | International Business Machines Corporation | Scheduler for multiprocessor system switch with selective pairing |
US8671311B2 (en) | 2011-02-15 | 2014-03-11 | International Business Machines Corporation | Multiprocessor switch with selective pairing |
JP6554801B2 (ja) * | 2015-01-30 | 2019-08-07 | 沖電気工業株式会社 | 冗長通信装置及びその制御方法 |
US10901399B2 (en) * | 2018-09-28 | 2021-01-26 | Rockwell Automation Technologies, Inc. | High availability industrial automation controller and method of operating the same |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4562575A (en) * | 1983-07-07 | 1985-12-31 | Motorola, Inc. | Method and apparatus for the selection of redundant system modules |
US4610013A (en) * | 1983-11-08 | 1986-09-02 | Avco Corporation | Remote multiplexer terminal with redundant central processor units |
US5251299A (en) * | 1985-12-28 | 1993-10-05 | Fujitsu Limited | System for switching between processors in a multiprocessor system |
JPH0760395B2 (ja) * | 1992-11-06 | 1995-06-28 | 日本電気株式会社 | フォールトトレラントコンピュータシステム |
US5751932A (en) * | 1992-12-17 | 1998-05-12 | Tandem Computers Incorporated | Fail-fast, fail-functional, fault-tolerant multiprocessor system |
JP2606107B2 (ja) | 1993-12-08 | 1997-04-30 | 日本電気株式会社 | プロセッサ冗長化方式 |
JP3160149B2 (ja) * | 1994-05-13 | 2001-04-23 | 株式会社日立製作所 | ディスク制御装置の無停止プログラム変更方法およびディスク制御装置 |
JP3427363B2 (ja) * | 1994-10-07 | 2003-07-14 | 富士通株式会社 | マルチプロセッサシステム |
JPH08185330A (ja) | 1994-12-28 | 1996-07-16 | Nippon Telegr & Teleph Corp <Ntt> | 冗長コンピュータシステム切り替え方法 |
US5696895A (en) * | 1995-05-19 | 1997-12-09 | Compaq Computer Corporation | Fault tolerant multiple network servers |
US5774668A (en) * | 1995-06-07 | 1998-06-30 | Microsoft Corporation | System for on-line service in which gateway computer uses service map which includes loading condition of servers broadcasted by application servers for load balancing |
US6104871A (en) * | 1996-04-30 | 2000-08-15 | International Business Machines Corporation | Utilizing batch requests to present membership changes to process groups |
US5923830A (en) * | 1997-05-07 | 1999-07-13 | General Dynamics Information Systems, Inc. | Non-interrupting power control for fault tolerant computer systems |
US7213167B1 (en) * | 2000-01-18 | 2007-05-01 | Verso Technologies, Inc. | Redundant state machines in network elements |
US6629264B1 (en) * | 2000-03-30 | 2003-09-30 | Hewlett-Packard Development Company, L.P. | Controller-based remote copy system with logical unit grouping |
JP3876692B2 (ja) * | 2001-11-13 | 2007-02-07 | 株式会社日立製作所 | ネットワークシステム障害分析支援方法およびその方式 |
US6931568B2 (en) * | 2002-03-29 | 2005-08-16 | International Business Machines Corporation | Fail-over control in a computer system having redundant service processors |
US7191357B2 (en) * | 2002-03-29 | 2007-03-13 | Panasas, Inc. | Hybrid quorum/primary-backup fault-tolerance model |
US7117390B1 (en) * | 2002-05-20 | 2006-10-03 | Sandia Corporation | Practical, redundant, failure-tolerant, self-reconfiguring embedded system architecture |
US7085959B2 (en) * | 2002-07-03 | 2006-08-01 | Hewlett-Packard Development Company, L.P. | Method and apparatus for recovery from loss of lock step |
US7257734B2 (en) * | 2003-07-17 | 2007-08-14 | International Business Machines Corporation | Method and apparatus for managing processors in a multi-processor data processing system |
US20050144524A1 (en) * | 2003-12-04 | 2005-06-30 | International Business Machines Corporation | Digital reliability monitor having autonomic repair and notification capability |
US7251746B2 (en) * | 2004-01-21 | 2007-07-31 | International Business Machines Corporation | Autonomous fail-over to hot-spare processor using SMI |
US7627781B2 (en) * | 2004-10-25 | 2009-12-01 | Hewlett-Packard Development Company, L.P. | System and method for establishing a spare processor for recovering from loss of lockstep in a boot processor |
-
2004
- 2004-03-08 JP JP2004063506A patent/JP4318211B2/ja not_active Expired - Fee Related
- 2004-07-16 US US10/892,240 patent/US7752493B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7752493B2 (en) | 2010-07-06 |
JP2005251055A (ja) | 2005-09-15 |
US20050197718A1 (en) | 2005-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107111457B (zh) | 跨集群冗余配置中的非间断的控制器替换 | |
EP2883147B1 (en) | Synchronous local and cross-site failover in clustered storage systems | |
JP4648447B2 (ja) | 障害復旧方法、プログラムおよび管理サーバ | |
WO2019085875A1 (zh) | 存储集群的配置修改方法、存储集群及计算机系统 | |
JP2005018510A (ja) | データセンタシステム及びその制御方法 | |
US7603581B2 (en) | Remote copying of updates to primary and secondary storage locations subject to a copy relationship | |
JP5352115B2 (ja) | ストレージシステム及びその監視条件変更方法 | |
JP5486793B2 (ja) | リモートコピー管理システム、方法及び装置 | |
JP4318211B2 (ja) | 高信頼システム、冗長構成制御方法及びプログラム | |
US20040243650A1 (en) | Shared nothing virtual cluster | |
JP5286212B2 (ja) | ストレージクラスタ環境でのリモートコピー制御方法及びシステム | |
JP2020021277A (ja) | 情報処理システム、情報処理システムの管理方法及びプログラム | |
JP4939271B2 (ja) | ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置 | |
JP6511739B2 (ja) | 冗長システムおよび冗長化方法 | |
JP2012190175A (ja) | フォールトトレラントシステム、サーバ、フォールトトレラント化方法およびプログラム | |
JP5124237B2 (ja) | ストレージシステムおよびストレージサブシステム | |
WO2016117129A1 (ja) | ストレージシステムおよびその制御方法 | |
CN112019601B (zh) | 一种基于分布式存储Ceph的两节点实现方法及系统 | |
JP2008276281A (ja) | データ同期システム、方法、及び、プログラム | |
JP6318902B2 (ja) | 冗長システムおよび冗長化方法 | |
JP5947974B2 (ja) | 情報処理装置及び情報処理装置の交換支援システム並びに交換支援方法 | |
CN112445652B (zh) | 远程复制系统 | |
JP7142052B2 (ja) | ハイブリッドクラウドにおけるデータを保護する方法 | |
JP4645435B2 (ja) | 情報処理装置、通信負荷分散方法及び通信負荷分散プログラム | |
JP2011081830A (ja) | サーバ切替方法、プログラムおよび管理サーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061013 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090521 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120605 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4318211 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120605 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130605 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130605 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |