JP6511739B2 - 冗長システムおよび冗長化方法 - Google Patents
冗長システムおよび冗長化方法 Download PDFInfo
- Publication number
- JP6511739B2 JP6511739B2 JP2014127732A JP2014127732A JP6511739B2 JP 6511739 B2 JP6511739 B2 JP 6511739B2 JP 2014127732 A JP2014127732 A JP 2014127732A JP 2014127732 A JP2014127732 A JP 2014127732A JP 6511739 B2 JP6511739 B2 JP 6511739B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- update information
- transfer path
- primary
- data update
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2041—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Description
図1は、実施例1に係る冗長化システムの全体構成例を示す図である。図1に示すように、このシステムは、DB4重化機能を実行してデータセンタがミラーリングされた冗長化システムであり、データセンタである正センタ1および副センタ5を有する。
次に、図1に示した各ノードの機能構成について説明する。ここでは、一例として、図1の状態における機能構成について説明するが、これに限定されるものではなく、各ノードが同じ機能構成を有することもできる。
図2は、正センタの各ノードの機能構成を示す機能ブロック図である。ここでは、正センタ1が有する正マスタノード10と正ミラーノード20とについて説明する。
図2に示すように、正マスタノード10は、通信制御部11、DB12、制御部13を有する。
図2に示すように、正ミラーノード20は、通信制御部21、DB22、制御部23を有する。
図7は、副センタの各ノードの機能構成を示す機能ブロック図である。ここでは、副センタ5が有する副マスタノード50と副ミラーノード60とについて説明する。
図7に示すように、副マスタノード50は、通信制御部51、DB52、制御部53を有する。
図7に示すように、副ミラーノード60は、通信制御部61、DB62、バッファ63、制御部64を有する。
次に、各ノードが実行するDB更新処理および更新情報の通知処理について説明する。なお、ここでは一例として、DB更新後にチェックポイント(リカバリポイントログ)を生成する例を説明するが、これに限定されるものではない。例えば、DB更新の処理とチェックポイントの生成処理とは、並行して実行することができ、別々のフローチャートで実行することもできる。
図8は、正マスタノードから正ミラーノードへの通知処理の流れを示すフローチャートである。
図9は、正マスタノードから副マスタノードへの通知処理の流れを示すフローチャートである。
図10は、正ミラーノードが実行する更新処理の流れを示すフローチャートである。図10に示すように、正ミラーノード20の受信部24は、正マスタノード10から情報を受信すると(S301:Yes)、受信した情報が更新ログであるか否かを判定する(S302)。
図11は、正ミラーノードが実行する通知処理の流れを示すフローチャートである。図11に示すように、正ミラーノード20のセンタ間通知部26は、通知タイミングに到達すると(S401:Yes)、蓄積した更新ログおよびリカバリポイントログを読出す(S402)。
図12は、副マスタノードが実行する更新および通知処理の流れを示すフローチャートである。図12に示すように、副マスタノード50のDB更新部55は、更新ファイルが受信されると(S501:Yes)、更新ファイルに含まれる各ログを抽出する(S502)。
図13は、副ミラーノードが実行する更新処理の流れを示すフローチャートである。図13に示すように、副ミラーノード60のDB更新部67は、センタ内受信部65によって副マスタノード50から情報が受信されると(S601:Yes)、受信した情報が更新ログか否かを判定する(S602)。
次に、図1に示した冗長化システムにおける系切替の具体例を説明する。図14は、冗長化システムの系切替例1を説明する図であり、図15は、冗長化システムの系切替例2を説明する図である。
図14に示す図は、正センタ1が保守を行うために、正マスタノード10および正ミラーノード20を意図的に停止させる場合の系切替例を説明する図である。図14に示すように、正マスタノード10は、保守開始の指示を管理者等から受信すると、現用DB12の最新の更新情報までを、第1のシステム内転送路で正ミラーノード20へ送信するとともに、第1のシステム間転送路で副マスタノード50へ送信する。
図15に示す図は、正センタ1にシステムダウンが発生し、正マスタノード10および正ミラーノード20を突然停止した場合の系切替例を説明する図である。図15に示すように、正マスタノード10は、突然停止する。このため、第1のシステム内転送路で正ミラーノード20へ送信された更新情報は、どの時点までの更新情報か判断できず、同様に、第1のシステム間転送路で副マスタノード50へ送信された更新情報も、どの時点までの更新情報か判断できない。
図16は、副ミラーノードが実行する系切替処理の流れを示すフローチャートである。図16に示すように、副ミラーノード60の切替制御部68は、正系システムである正センタ1の停止指示を検出すると(S701:Yes)、システム停止の理由が保守であるか否かを判定する(S702)。
上記実施例では、チェックポイントとしてシステム内で一意な通番を含むリカバリポイントログを用いる例を説明したが、これに限定されるものではなく、例えば日時や時刻などを含むリカバリポイントログを用いることもできる。つまり、システム内で昇順あるいは降順などの一意な順番が指定できるものであれば、様々な情報を使用することができる。
上記実施例では、障害等によってノードが停止する例を説明したが、保守等の作業時も同様に処理することができる。また、上記実施例では、いずれのかのノードが停止する例を説明したが、システム停止はこれに限定されるものではない。例えば、定期監視や監視ツールによって、各ノード間の通信が停止したことが検出された場合であっても、同様の切替処理を実行することができる。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
図17は、ハードウェア構成例を説明する図である。図1に示した各ノードは、同様のハードウェア構成を有するので、ここでは、一例として正マスタノード10を例にして説明する。
5 副センタ
10 正マスタノード
11 通信制御部
12 DB
13 制御部
14 DB更新部
15 センタ内通知部
16 挿入部
17 センタ間通知部
20 正ミラーノード
21 通信制御部
22 DB
23 制御部
24 受信部
25 DB更新部
26 センタ間通知部
50 副マスタノード
51 通信制御部
52 DB
53 制御部
54 受信部
55 DB更新部
56 センタ内通知部
57 切替制御部
60 副ミラーノード
61 通信制御部
62 DB
63 バッファ
64 制御部
65 センタ内受信部
66 センタ間受信部
67 DB更新部
68 切替制御部
Claims (5)
- 冗長システムにおいて、
第1のノードと、
第1のシステム内転送路を介して前記第1のノードにおけるデータ更新に応じて生成される第1のデータ更新情報を取得する第2のノードと、
を含む正系システムと、
前記第1のノードとの間で第1のシステム間転送路が設定され、該第1のシステム間転送路を介して前記第1のノードにおけるデータ更新に応じて生成される第2のデータ更新情報を定期的に取得する第3のノードと、
前記第2のノードとの間で第2のシステム間転送路が設定され、前記第2のノードが取得した前記第1のデータ更新情報を該第2のシステム間転送路を介して定期的に取得可能であるとともに、前記第3のノードが取得した前記第2のデータ更新情報を第2のシステム内転送路を介して取得可能であり、前記第1のデータ更新情報と前記第2のデータ更新情報とを保持する第4のノードと、
を含む副系システムと、
を備え、
前記副系システムを前記正系システムの代替として動作させる際に、前記第4のノードは、前記第2のシステム間転送路と前記第2のシステム内転送路とのうちいずれか一方から取得したデータ更新情報に基づいて前記正系システムを引き継ぐ第1の引き継ぎ処理と、前記第2のシステム間転送路から取得したデータ更新情報と前記第2のシステム内転送路から取得したデータ更新情報との双方に基づいて前記正系システムを引き継ぐ第2の引き継ぎ処理とのいずれの処理も実行可能であり、
前記第2の引き継ぎ処理は、前記第2のシステム間転送路から取得した前記第1のデータ更新情報と前記第2のシステム内転送路から取得した前記第2のデータ更新情報とを比較し、前記第1のデータ更新情報が最新である場合、前記第3のノードが前記正系システムのミラーノードに降格し、前記第4のノードが前記正系システムのマスタノードに昇格し、前記第2のデータ更新情報が最新である場合、前記第3のノードが前記正系システムのマスタノードに昇格し、前記第4のノードが前記正系システムのミラーノードに昇格する引き継ぎ処理を実行する、
ことを特徴とする冗長システム。 - 前記第1の引き継ぎ処理は、前記第3のノードと前記第4のノードとの間での主従の切替えは行わない一方、前記第2の引き継ぎ処理は、前記第3のノードと前記第4のノードとの間での主従の切替えを実行することを特徴とする請求項1記載の冗長システム。
- 前記第1の引き継ぎ処理は前記正系システムの保守に伴う引き継ぎ処理であり、前記第2の引き継ぎ処理は前記正系システムの異常停止に伴う引き継ぎ処理であることを特徴とする請求項1記載の冗長システム。
- 前記第2の引き継ぎ処理は、取り込まれた前記データ更新情報の前記第4のノードの記憶データへの反映完了に応じて、前記副系システムを正系システムに昇格させることを含むことを特徴とする請求項1記載の冗長システム。
- 冗長システムにおいて、
第1のノードと、
第1のシステム内転送路を介して前記第1のノードにおけるデータ更新に応じて生成される第1のデータ更新情報を取得する第2のノードと、
を含む正系システムと、
前記第1のノードとの間で第1のシステム間転送路が設定され、該第1のシステム間転送路を介して前記第1のノードにおけるデータ更新に応じて生成される第2のデータ更新情報を定期的に取得する第3のノードと、
前記第2のノードとの間で第2のシステム間転送路が設定され、前記第2のノードが取得した前記第1のデータ更新情報を該第2のシステム間転送路を介して定期的に取得可能であるとともに、前記第3のノードが取得した前記第2のデータ更新情報を第2のシステム内転送路を介して取得可能であり、前記第1のデータ更新情報と前記第2のデータ更新情報とを保持する第4のノードと、
を含む副系システムと、
を備え、
前記副系システムを前記正系システムの代替として動作させる際に、前記第4のノードが、前記第2のシステム間転送路と前記第2のシステム内転送路とのうちいずれか一方から取得したデータ更新情報に基づいて前記正系システムを引き継ぐ第1の引き継ぎ処理と、前記第2のシステム間転送路から取得したデータ更新情報と前記第2のシステム内転送路から取得したデータ更新情報との双方に基づいて前記正系システムを引き継ぐ第2の引き継ぎ処理とのいずれの処理も含み、
前記第2の引き継ぎ処理は、前記第2のシステム間転送路から取得した前記第1のデータ更新情報と前記第2のシステム内転送路から取得した前記第2のデータ更新情報とを比較し、前記第1のデータ更新情報が最新である場合、前記第3のノードが前記正系システムのミラーノードに降格し、前記第4のノードが前記正系システムのマスタノードに昇格し、前記第2のデータ更新情報が最新である場合、前記第3のノードが前記正系システムのマスタノードに昇格し、前記第4のノードが前記正系システムのミラーノードに昇格する引き継ぎ処理を実行する、
ことを特徴とする冗長化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014127732A JP6511739B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システムおよび冗長化方法 |
US14/721,479 US10049021B2 (en) | 2014-06-20 | 2015-05-26 | Redundant system and redundancy method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014127732A JP6511739B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システムおよび冗長化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016009219A JP2016009219A (ja) | 2016-01-18 |
JP6511739B2 true JP6511739B2 (ja) | 2019-05-15 |
Family
ID=54869733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014127732A Active JP6511739B2 (ja) | 2014-06-20 | 2014-06-20 | 冗長システムおよび冗長化方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10049021B2 (ja) |
JP (1) | JP6511739B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6318902B2 (ja) | 2014-06-20 | 2018-05-09 | 富士通株式会社 | 冗長システムおよび冗長化方法 |
US10409697B2 (en) * | 2017-02-23 | 2019-09-10 | Salesforce.Com, Inc. | Automated self-healing database system and method for implementing the same |
PL3617887T3 (pl) * | 2018-08-27 | 2021-09-27 | Ovh | Sposób i system do zapewniania nadmiarowości usług między serwerem nadrzędnym a serwerem podrzędnym |
US11010087B2 (en) * | 2019-03-29 | 2021-05-18 | Atlassian Pty Ltd. | System and method for consistent mirroring in a cluster |
US11334455B2 (en) * | 2019-09-28 | 2022-05-17 | Atlassian Pty Ltd. | Systems and methods for repairing a data store of a mirror node |
JPWO2021234933A1 (ja) * | 2020-05-22 | 2021-11-25 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4689137B2 (ja) | 2001-08-08 | 2011-05-25 | 株式会社日立製作所 | リモートコピー制御方法、及びストレージシステム |
KR100370232B1 (ko) * | 1999-04-28 | 2003-01-29 | 삼성전자 주식회사 | 결함 셀을 리던던시 셀로의 대체를 반복 수행할 수 있는 리던던시 회로 |
JP2001159985A (ja) * | 1999-12-02 | 2001-06-12 | Sun Corp | 二重化装置 |
US6813687B1 (en) * | 2000-08-25 | 2004-11-02 | Lsi Logic Corporation | Raid volume for sequential use that needs no redundancy pre-initialization |
US20030005350A1 (en) * | 2001-06-29 | 2003-01-02 | Maarten Koning | Failover management system |
US7016299B2 (en) * | 2001-07-27 | 2006-03-21 | International Business Machines Corporation | Network node failover using path rerouting by manager component or switch port remapping |
US20030177149A1 (en) * | 2002-03-18 | 2003-09-18 | Coombs David Lawrence | System and method for data backup |
JP3974538B2 (ja) * | 2003-02-20 | 2007-09-12 | 株式会社日立製作所 | 情報処理システム |
US7318133B2 (en) | 2003-06-03 | 2008-01-08 | Hitachi, Ltd. | Method and apparatus for replicating volumes |
US7467168B2 (en) * | 2003-06-18 | 2008-12-16 | International Business Machines Corporation | Method for mirroring data at storage locations |
JP4282464B2 (ja) * | 2003-12-17 | 2009-06-24 | 株式会社日立製作所 | リモートコピーシステム |
JP4422519B2 (ja) * | 2004-03-18 | 2010-02-24 | 株式会社日立製作所 | 情報処理システム |
US7490205B2 (en) | 2005-03-14 | 2009-02-10 | International Business Machines Corporation | Method for providing a triad copy of storage data |
US7702851B2 (en) * | 2005-09-20 | 2010-04-20 | Hitachi, Ltd. | Logical volume transfer method and storage network system |
JP5244332B2 (ja) | 2006-10-30 | 2013-07-24 | 株式会社日立製作所 | 情報システム、データ転送方法及びデータ保護方法 |
JP4902403B2 (ja) | 2006-10-30 | 2012-03-21 | 株式会社日立製作所 | 情報システム及びデータ転送方法 |
US9002800B1 (en) * | 2007-06-30 | 2015-04-07 | Emc Corporation | Archive and backup virtualization |
JP2010039986A (ja) | 2008-08-08 | 2010-02-18 | Hitachi Ltd | データのバックアップを管理する計算機システム及び方法 |
CN102761566B (zh) * | 2011-04-26 | 2015-09-23 | 国际商业机器公司 | 迁移虚拟机的方法和装置 |
US8799598B2 (en) * | 2012-02-17 | 2014-08-05 | Spansion Llc | Redundancy loading efficiency |
US8990263B2 (en) * | 2012-03-15 | 2015-03-24 | International Business Machines Corporation | Policy-based management of storage functions in data replication environments |
US9483362B2 (en) * | 2013-05-08 | 2016-11-01 | Commvault Systems, Inc. | Use of auxiliary data protection software in failover operations |
CN105144119A (zh) * | 2013-05-08 | 2015-12-09 | 株式会社日立制作所 | 存储系统及数据管理方法 |
US9348714B2 (en) * | 2014-03-20 | 2016-05-24 | Netapp Inc. | Survival site load balancing |
-
2014
- 2014-06-20 JP JP2014127732A patent/JP6511739B2/ja active Active
-
2015
- 2015-05-26 US US14/721,479 patent/US10049021B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10049021B2 (en) | 2018-08-14 |
JP2016009219A (ja) | 2016-01-18 |
US20150370648A1 (en) | 2015-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6511739B2 (ja) | 冗長システムおよび冗長化方法 | |
US7603581B2 (en) | Remote copying of updates to primary and secondary storage locations subject to a copy relationship | |
CN106062717A (zh) | 一种分布式存储复制系统和方法 | |
JP2007164769A (ja) | ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラム(ミラーリングされたシステム内の障害の管理) | |
WO2017071563A1 (zh) | 一种存储数据的方法及集群管理节点 | |
CN106605217B (zh) | 用于将应用从一个站点移动到另一站点的方法和系统 | |
JP2010033467A (ja) | 情報管理システム | |
CN106855869B (zh) | 一种实现数据库高可用的方法、装置和系统 | |
JP5900094B2 (ja) | データ整合システム、データ整合方法およびデータ整合プログラム | |
JP4318211B2 (ja) | 高信頼システム、冗長構成制御方法及びプログラム | |
JP6511737B2 (ja) | 冗長システム、冗長化方法および冗長化プログラム | |
JP6318902B2 (ja) | 冗長システムおよび冗長化方法 | |
US8977897B2 (en) | Computer-readable recording medium, data management method, and storage device | |
WO2007094041A1 (ja) | サーバ管理装置及びサーバ管理プログラム | |
JP6511738B2 (ja) | 冗長システム、冗長化方法および冗長化プログラム | |
JP6251965B2 (ja) | 情報システムおよびデータベース復旧方法 | |
JP5867902B2 (ja) | データベースの非同期レプリケーション方式 | |
JP5956940B2 (ja) | 冗長化システムおよび現用機決定方法 | |
JP2008276281A (ja) | データ同期システム、方法、及び、プログラム | |
CN115421971B (zh) | Etcd灾备故障恢复的方法及应用 | |
US11269922B2 (en) | Database server, database management method, and storage medium | |
JP6476718B2 (ja) | 情報処理システム、プログラム、及び情報処理方法 | |
JPWO2007116467A1 (ja) | ボリューム管理装置およびボリューム管理方法 | |
JP6282989B2 (ja) | データベースシステム及びそのマスター/スレーブ決定方法 | |
JP5153310B2 (ja) | フォールトトレラントコンピュータシステム、並びに再同期稼働化処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180320 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180515 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190115 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |