JP2006202220A - Program for causing computer to execute processing of confirming consistency of handover information, and method thereof - Google Patents
Program for causing computer to execute processing of confirming consistency of handover information, and method thereof Download PDFInfo
- Publication number
- JP2006202220A JP2006202220A JP2005015861A JP2005015861A JP2006202220A JP 2006202220 A JP2006202220 A JP 2006202220A JP 2005015861 A JP2005015861 A JP 2005015861A JP 2005015861 A JP2005015861 A JP 2005015861A JP 2006202220 A JP2006202220 A JP 2006202220A
- Authority
- JP
- Japan
- Prior art keywords
- standby
- information
- node
- storage area
- takeover
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は、運用システムと複数の待機システムとを有する構成において、引継ぎ情報の整合性をもって待機システムへの切り替えを行うコンピュータ実行可能なプログラム及びその方法に関する。 The present invention relates to a computer-executable program and method for switching to a standby system with consistency of takeover information in a configuration having an operation system and a plurality of standby systems.
近年におけるネットワークを介した情報提供等のサービスの24時間化、ビジネスのグローバル化に伴ない、企業及び社会にとって重要な情報システムの領域が急速に拡大している。万が一、これらの重要な情報システムに異常が発生し、長時間停止した場合、社会問題に発展することもあり、情報システムの連続稼動を阻害する要因への対策が重要な課題となっている。 In recent years, with the 24 hours of services such as information provision via networks and the globalization of business, the area of information systems important for companies and society is rapidly expanding. In the unlikely event that an abnormality occurs in these important information systems and the system is stopped for a long time, it may develop into a social problem, and countermeasures against factors that hinder the continuous operation of the information system are an important issue.
このような状況において、通常、実際に業務のために使用される運用システムと、運用システムが保守又は何らかの問題の発生によって停止した場合に切り替え可能な待機システムとが、所定の業務のために備えられている。このような構成において、下記に示すような運用システムから待機システムへ円滑に切り替え可能とする技術が提案されている。 Under such circumstances, an operation system that is normally used for business and a standby system that can be switched when the operation system is stopped due to maintenance or some problem is provided for a predetermined business. It has been. In such a configuration, a technique has been proposed that enables smooth switching from an operation system to a standby system as described below.
例えば、運用システム又は待機システムの何れとして起動する設定、優先順位、スタンバイ状態これらの情報を設定情報記憶手段で記憶しておき、待機システムが起動した場合に設定情報記憶手段を参照してシステムの移行を行う(例えば、特許文献1)。この技術によって、オペレータの負担を軽減するとともに、所定の情報処理装置に障害が発生した場合においても確実でしかも迅速な起動を行えるようになった。 For example, the setting information storage means stores the settings to be activated as either the operation system or the standby system, the priority order, and the standby state. When the standby system is activated, the setting information storage means is referred to Migration is performed (for example, Patent Document 1). This technique reduces the burden on the operator and enables reliable and quick start-up even when a failure occurs in a predetermined information processing device.
また、運用システムから待機システムへの切り替えが発生した場合に、ホットスタンバイの待機システムの所在管理ファイルを更新して接続経路を特定する(例えば、特許文献2)。この技術によって、3以上のホストコンピュータにおける柔軟なホットスタンバイの待機システムの運用や切り替え発生時の高速な切り替えを行えるようになった。 Further, when switching from the operation system to the standby system occurs, the location management file of the hot standby standby system is updated to specify the connection path (for example, Patent Document 2). With this technology, it has become possible to operate a flexible hot standby standby system in three or more host computers and to perform high-speed switching when switching occurs.
更に、運用システム内に待機システムの優先順位テーブルを持ち、障害の場合に優先度の高い待機システムに切り替え、また、切り替えられた待機システムは同様に優先順テーブルを持ち障害時に切り替えを行う(例えば、特許文献3)。この技術によって、疎結合マルチプロセッサシステムで、運用用と待機用の計算機システムから構成されるホットスタンバイシステムにおいて、待機用計算機システムの信頼性を向上させることができるようになった。 Furthermore, the standby system has a priority table in the operation system and switches to a standby system having a higher priority in the case of a failure, and the switched standby system similarly has a priority table and switches in the event of a failure (for example, Patent Document 3). This technology has made it possible to improve the reliability of a standby computer system in a hot standby system comprising a computer system for operation and standby in a loosely coupled multiprocessor system.
また、オンラインデータ処理を行う稼働系処理機能と異常時に同処理を続行する待機系処理機能とを対応付けしておき、障害発生時に稼働系処理機能のない待機系処理機能を選択する(例えば、特許文献4)。この技術によって、電子計算機の障害により稼動系処理機能に対応付けられた待機系処理機能が存在しなくなった場合に、操作員の操作なしに新たに対応付け可能な待機系処理機能を選択して対応付けを行い、自動的にホットスタンバイ関係を構築することにより信頼性を回復することができるようになった。
上述したような提案される技術によって、運用システムから待機システムへの切り替えが円滑に行えるようになった。しかしながら、1つの運用システムに対して2以上の待機システムを備えるように構成されたシステムでは、通常、上述したように切り替えるための優先順位が複数の待機システムに対して決められており、故障の発生のタイミングによっては、運用システムと待機システムとのデータに整合性がとれない場合が発生し、このような状況を上記従来技術では、解決することができない。例えば、図1に示すような場合である。 The proposed technology as described above has made it possible to smoothly switch from the operation system to the standby system. However, in a system configured to have two or more standby systems for one operational system, the priority order for switching is usually determined for a plurality of standby systems as described above, Depending on the timing of the occurrence, there may occur a case where the data of the operation system and the standby system cannot be consistent, and such a situation cannot be solved by the above-described conventional technology. For example, as shown in FIG.
図1に示す運用システムと切り替え順位1及び2となる待機システムとで構成される運用待機システムにおいて、運用システムと順位2の待機システムとが起動しており、順位1の待機システムが停止している場合(状態1)、運用システムは、順位2の待機システムとの接続を確立し、運用されているデータを順位2の待機システムに所定の手順によって反映させている。この状態から、順位2の待機システムより優先して切り替えられる順位1の待機システムが起動すると(状態2)、通常、運用システムは、順位2の待機システムが保持しているデータを消去(purge)して、順位1の待機システムへと接続を切り替えて、運用システムにて発生する障害に対応できるようにする。
In the operation standby system configured by the operation system shown in FIG. 1 and the standby systems having the
しかしながら、順位2の待機システムに保持しておいたデータを消去(purge)する前に運用システムがダウンしてしまうと(状態3)、起動している順位1の待機システムへの切り替えが行われ、順位1の待機システムが運用システムとして動作開始する(状態4)。このように、順位1の待機システムへの切り替えが完了し、運用が継続して開始されてしまうと、この時点での運用システム(順位1の待機システム)に保持された新しい(new)データと、順位2の待機システムに残されたままの古い(old)データ(引継ぎ情報)とが矛盾して存在することになる。
However, if the operation system goes down before the data stored in the standby system of rank 2 is purged (state 3), the system is switched to the standby system of
その状態で、再度、運用システム(順位1の待機システム)がダウンしてしまうと、順位2の待機システムに運用が切り替わり、古い引継ぎ情報で動作が再開されてしまい問題を引き起こすこととなる(状態5)。 In this state, if the operation system (standby system of rank 1) goes down again, the operation is switched to the stand-by system of rank 2, and the operation is resumed with old takeover information, causing a problem (state 5).
これは、整合性のとれていない引継ぎ情報が起動中のシステムに存在しているからである。 This is because inconsistent takeover information exists in the active system.
本発明は、上述の問題点に鑑みてなされたものであって、運用システムと複数の待機システムとを有する構成において、引継ぎ情報の整合性をもって待機システムへの切り替えを行うコンピュータ実行可能なプログラムを提供することを目的とする。 The present invention has been made in view of the above-described problems, and in a configuration having an operation system and a plurality of standby systems, a computer-executable program for switching to a standby system with consistency of takeover information The purpose is to provide.
上記課題を解決するため、本発明は、運用システムと複数の待機システムとで構成される運用待機システムにて、該運用システムから該複数の待機システムの1つへと切り替える際に引き継がれる引継ぎ情報の整合性を確認する処理をコンピュータに実行させるプログラムであって、該コンピュータに、前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出して内部記憶領域に格納する待機識別情報読出手順と、前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手順と、前記整合性確認手順によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手順とを実行させるように構成される。 In order to solve the above-described problem, the present invention provides a takeover information that is taken over when an operation standby system configured by an operation system and a plurality of standby systems is switched from the operation system to one of the plurality of standby systems. A program for causing a computer to execute processing for checking the consistency of data stored in the external shared storage area from the external shared storage area shared by the operation system and the plurality of standby systems. The standby identification information reading procedure for reading the standby identification information for identifying the switching standby system and storing it in the internal storage area, and the match between the standby identification information stored in the internal storage area and the self-identification information A consistency confirmation procedure for confirming the consistency of the information, and the standby identification information and the self-identification information by the consistency confirmation procedure. When the consistency of the takeover information is confirmed by the match, the operation switching procedure for starting the operation as the operation system is executed using the takeover information held in the internal storage area. .
このようなプログラムがインストールされたコンピュータでは、引継ぎ情報の送信先の待機システムの待機識別情報(例えば、IPアドレス)を外部共有記憶領域(例えば、共有ディスク装置)に格納しておくことによって、各待機システムは、運用システムへの切り替え時に、内部に保持している引継ぎ情報が有効な情報か否かを判断することができる。 In a computer in which such a program is installed, the standby identification information (for example, IP address) of the standby system that is the transmission destination of takeover information is stored in an external shared storage area (for example, a shared disk device). The standby system can determine whether or not the takeover information stored therein is valid information when switching to the operation system.
また、内部に保持している引継ぎ情報の整合性が確認された場合、外部共有記憶領域のデータ(データベースデータ)を読み出すことなく、そのまま運用を継続する高速切り替えが可能となる。 Further, when the consistency of the takeover information held inside is confirmed, it is possible to perform high-speed switching to continue the operation without reading the data (database data) in the external shared storage area.
上記課題を解決するための手段として、本発明は、上記運用待機システムでの処理を実行する引継ぎ情報整合性確認方法、又は、上記プログラムを実行することによって実現される待機システム又は運用システムとして動作するノード装置とすることもできる。 As means for solving the above problems, the present invention operates as a takeover information consistency confirmation method for executing processing in the active standby system, or as a standby system or operating system realized by executing the program. It can also be a node device.
本願発明は、複数の待機システムを構成する運用待機システムにおいて、引継ぎ情報の送信先の待機システムのIPアドレスを共有ディスク装置に格納しておくことによって、各待機システムは、運用システムへの切り替え時に、内部に保持している引継ぎ情報が有効な情報か否かを判断することができる。 According to the present invention, in an operation standby system that constitutes a plurality of standby systems, by storing the IP address of the standby system to which the takeover information is transmitted in a shared disk device, each standby system can be switched when switching to the operation system. It is possible to determine whether or not the takeover information held inside is valid information.
また、内部に保持している引継ぎ情報が有効な情報である場合、共有ディスク装置のDBデータを読み出すことなく、そのまま運用を継続する高速切り替えが可能となる。 Also, when the takeover information held inside is valid information, it is possible to perform high-speed switching that continues operation without reading the DB data of the shared disk device.
以下、本発明の実施の形態を図面に基づいて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図2は、本発明の一実施例に係る運用待機システムのネットワーク構成を示す図である。図2において、運用待機システム100は、サーバコンピュータとしてのノード0、1、2及び3と、二次媒体としての共有ディスク装置10とを有し、ネットーク2を介して互いに接続される。ノード0、1、2及び3は、リレーショナルデータベース管理システムのサーバコンピュータとして機能する。
FIG. 2 is a diagram showing a network configuration of an operation standby system according to an embodiment of the present invention. In FIG. 2, an
共有ディスク装置10は、1つ以上の業務で使用されるDBデータ16及び18を有すると共に、例えば、業務Aに対応する運用システム及び待機システムによって共有される業務A用共有ファイル12と、業務Bに対応する運用システム及び待機システムによって共有される業務B用共有ファイル14を有する。
The shared disk device 10 has
業務A用共有ファイル12には、運用システムによって設定された引継ぎ情報を保持する待機システムとしてのノードを識別するノード識別情報が格納される。業務B用共有ファイル14には、運用システムによって引継ぎ情報を保持する待機システムとしてのノードを識別するノード識別情報が格納される。ノード識別情報として、例えば、IPアドレスが設定される。
The business A shared
引継ぎ情報とは、DBデータ16のリカバリのためのログと、業務Aのために実際に使用されるDBデータ16を構成するユーザ定義体を示す複数のDBページである。
The takeover information is a plurality of DB pages indicating a log for recovery of the
業務A用としての運用待機構成(業務A用運用待機構成)では、ノード0が運用システム、ノード2及びノード3が業務A用の待機システムとして設定される。業務A用の待機システムとしてのノード2及びノード3には、運用システムがダウンした場合に優先的に切り替えるための優先順位が予め設定されている。例えば、ノード2が優先順位1で、ノード3が優先順位2などのように設定されている。業務A用運用待機構成において、業務を実際に行う各端末(図示せず)は、例えば、ネットワーク2又は別のネットワークを介して、運用システムとして動作しているノード0へ接続される。運用システムが切り替わる場合には、業務を実際に行う各端末との接続は、優先的にノード2、ノード3の順で切り替えられる。
In the operational standby configuration for business A (business standby configuration for business A),
このような業務A用運用待機構成において、運用システムとして動作するノード0は、業務A用に使用される共有ディスク装置10のDBデータ16を、ノード0内の記憶領域に保持し、所定の更新処理に従って共有ディスク装置10のDBデータ16を更新すると共に、起動中のサーバコンピュータの中で最も優先順位の高い(例えば、優先順位1)のノード2へ引き継ぎ情報として逐次転送する。ノード0が引き継ぎ情報をノード2へ転送する際には、予め業務A用共有ファイル12へノード2のノード識別情報を格納する。ノード0で保持されるDBデータ16は、共有ディスク装置10のDBデータ16の全部又は一部である。
In such a business A operation standby configuration, the
業務A用運用待機構成において、待機システムとしてのノード2へと運用システムが切り替えられた場合、ノード2は、業務A用共有ファイル12に格納されているノード識別子がノード2を示している場合には、ノード2内の記憶領域に既に保持している引継ぎ情報をDBデータ16として運用を即時開始する。一方、ノード識別子がノード2を示していない場合、共有ディスク10のDBデータ16を読み込んでから運用を開始する。
In the operation / standby configuration for business A, when the operation system is switched to the node 2 as the standby system, the node 2 indicates that the node identifier stored in the business A shared
業務B用運用待機構成においても同様である。この場合、業務B用としてDBデータ18がノード3に引継ぎ情報として転送され、業務システムB用共有ファイル14には、ノード3のIPアドレスが運用システムとしてのノード1によって格納される。
The same applies to the operation standby configuration for business B. In this case, the
説明の便宜のため、業務毎にDBデータ16及び18を示したが、DBデータ16及び18は1つの業務のために構成されていてもよく、また、複数の業務によって共有されてもよい。
For convenience of explanation, the
図3は、各ノードのハードウェア構成を示す図である。図3において、各ノード0から3(以下、単にノードと言う)は、CPU(Central Processing Unit)51と、メモリユニット52と、表示ユニット53と、出力ユニット54と、入力ユニット55と、通信ユニット56と、記憶装置57と、ドライバ58とで構成され、システムバスBに接続される。
FIG. 3 is a diagram illustrating a hardware configuration of each node. In FIG. 3, each of
CPU51は、メモリユニット52に格納されたプログラムに従って処理を実行する。メモリユニット52は、RAM(Random Access Memory)及びROM(Read-Only Memory)等にて構成され、CPU51にて実行されるプログラム、CPU51での処理に必要なデータ、CPU51での処理にて得られたデータ等を格納する。また、メモリユニット52の一部の領域が、CPU51での処理に利用されるワークエリアとして割り付けられている。
The
表示ユニット53は、CPU51の制御のもとに必要な各種情報を表示する。出力ユニット54は、プリンタ等を有し、利用者からの指示に応じて各種情報を出力するために用いられる。入力ユニット55は、マウス、キーボード等を有し、運用待機システムの管理者が必要な各種情報を入力するために用いられる。通信ユニット56は、例えばインターネット、LAN(Local Area Network)等を介してノード間通信及び共有ディスク装置10へアクセスする際の通信制御を行う装置である。記憶装置57は、例えば、ハードディスクユニットにて構成され、各種処理を実行するプログラム等のデータ、DBデータ16又は14、ノード間通信によって受信した引継ぎ情報などを格納する。
The
ノードよって行われる処理を実現するプログラムは、例えば、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体59によってノードに提供される。即ち、プログラムが保存された記憶媒体59がドライバ58にセットされると、ドライバ58が記憶媒体59からプログラムを読み出し、その読み出されたプログラムがシステムバスBを介して記憶装置57にインストールされる。そして、プログラムが起動されると、記憶装置57にインストールされたプログラムに従ってCPU51がその処理を開始する。尚、プログラムを格納する媒体としてCD−ROMに限定するものではなく、コンピュータが読み取り可能な媒体であればよい。本発明に係る処理を実現するプログラムは、通信ユニット56によってネットワークを介してダウンロードし、記憶装置57にインストールするようにしても良い。このようにしてインストールされるプログラムは、後述される各処理をコンピュータとしてのノードに実行させるプログラムである。
A program for realizing processing performed by the node is provided to the node by a
図4は、各ノードの機能構成を説明するための図である。図4において、各ノード0から3(以下、単にノードと言う)は、OS(オペレーティングシステム)61と、クラスタ管理部62と、データベース管理部63とを有し、これら処理部61から63に応じたプログラムをインストールすることによってノード内に処理部61から63として構成される。
FIG. 4 is a diagram for explaining the functional configuration of each node. In FIG. 4, each of the
OS61は、例えば、UNIX(登録商標)、Solaris(登録商標)及びLinax(登録商標)などのUNIX(登録商標)系OSである。また、クラスタ管理部62は、主に、ノード間通信によって、各ノード、及び各ノード上のデータベース管理部63によるプロセスの生死監視を行う。更に、データベース管理部63は、アプリケーションプログラムであって、クラスタ連携ではDBデータ16又は18と、データベース管理簿、ログファイルなどのシステムファイルとを、ノード内で保持しているデータと、共有ディスク装置10で保持しているデータと、更に、待機システムのノードで保持しているデータとの整合性を維持するように管理する。
The OS 61 is a UNIX (registered trademark) OS such as, for example, UNIX (registered trademark), Solaris (registered trademark), or Linux (registered trademark). In addition, the
クラスタ管理部62は、共有ディスク装置10と、ノード内の記憶領域(メモリユニット52内又は記憶装置57内のクラスタ管理部62に割り当てられた記憶領域)を用いて、切り替え優先順位を含むシステム一覧122を管理する。システム一覧122は、予め運用待機システム100の管理者によって設定された環境定義に基づいて決定される。
The
データベース管理部63は、データベース管理部63自身が起動される度に、システム一覧122をクラスタ管理部62から取得して、ノード内の記憶領域(メモリユニット52内又は記憶装置57内のデータベース管理部63に割り当てられた記憶領域)を用いて管理する。また、業務Aが稼動中であって、ノード自身が運用システムである場合、システム一覧122を参照して、待機システムとして動作するノードを識別するノード識別情報を接続先IPアドレス124として、ノード内の記憶領域と共有ディスク装置10の業務A用共有ファイル12とに設定する。
The
システム一覧122と接続先IPアドレス124とは、少なくとも共有ディスク装置10に格納される仕組みを持てばよく、図4に示されるように、業務に対応させた共有ファイル内に構成されることに限定されるものではない。
The
図5は、システム一覧に含まれる切り替え優先順位の例を示す図である。図5において、システム一覧122は、切り替え優先順位の高い順に、ノード名とIPアドレスとの対で示されるエントリを配置している。
FIG. 5 is a diagram illustrating an example of the switching priority order included in the system list. In FIG. 5, in the
運用システムと待機システム間の接続及び切断処理(運用待機間接続/切断処理)は、ノード0から3全てが起動される全系起動、ノード0から3全てが停止される全系停止、待機システムとして動作中のノードが単独に停止される待機系単独停止(例えば、保守作業による正常停止、障害によるダウン)、待機システムとして動作すべきノードが単独に起動される待機系単独起動(例えば、保守作業の終了に伴なう再起動、障害復帰による再起動)、待機システムの切り替え(運用システムから待機システムへの運用移行、又は、優先順位の高いノードへの待機システムの変更)時が契機となって、実行される。運用待機間接続/切断処理は、運用システムとして動作しているノードが主体で実行される処理であって、待機システムとして動作しているノードが自ら率先して実行することはない。
Connection and disconnection processing (operation / standby connection / disconnection processing) between the active system and the standby system is the entire system startup in which all
図6は、全系起動の処理フローを示す図である。図6において、運用システムとして動作するノードのデータベース管理部63は、起動すると、クラスタ管理部62からシステム一覧122を取得する(ステップS101)。また、共有ディスク装置10の接続先IPアドレス124に無効を設定する(ステップS102)。例えば、オールゼロ(以下、ゼロクリアという)を設定する。
FIG. 6 is a diagram showing a processing flow for starting the entire system. In FIG. 6, when the
続けて、運用システムとして動作するノードのデータベース管理部63は、取得したシステム一覧122に含まれている切り替え優先順位の全エントリについて、エントリの先頭から順に接続試行処理を実施し、接続したら、運用待機間接続処理(後述)を実行する(ステップS103)。運用待機間接続をしたノードのノード識別子を接続先IPアドレス124として共有ディスク装置10に格納する(ステップS104)。
Subsequently, the
一方、待機システムとして動作するノードのデータベース管理部63は、起動すると、運用システムと同様に、クラスタ管理部62からシステム一覧122を取得する(ステップS201)。ただし、待機システムとして動作する間は、システム一覧122を使用することはない。運用システムに切り替わった後に使用する。そして、待機システムとして動作するノードのデータベース管理部63は、運用システムとして動作するノードからの接続要求を受信した場合、応答を返して、運用待機間接続処理を実行する(ステップS202)。
On the other hand, when activated, the
図7は、全系停止の処理フローを示す図である。図7において、運用システムとして動作するノードのデータベース管理部63は、共有ディスク装置10の接続先IPアドレス124が無効化(ゼロに設定)されていない場合、接続先IPアドレス124(待機システムとして運用しているノード)に対する運用待機間切断処理を実行する(ステップS121)。この場合、共有ディスク装置10の接続先IPアドレス124がゼロクリアされる。
FIG. 7 is a diagram showing a processing flow for stopping the entire system. In FIG. 7, the
一方、待機システムとして動作するノードのデータベース管理部63は、運用システムとして動作するノードから切断要求を受信したら、運用待機間切断処理を実行する(ステップS221)。
On the other hand, when receiving the disconnection request from the node operating as the operation system, the
図8は、待機システム単独停止の処理フローを示す図である。図8において、運用システムとして動作するノードのデータベース管理部63は、クラスタ管理部62から停止したノード名の通知を受けると(ステップS131)、システム一覧122を使用して、停止したノード名をIPアドレスへ変換する(ステップS132)。データベース管理部63は、接続先IPアドレス124と停止したノードのIPアドレスとが一致する場合に、運用待機間切断処理(後述)を実行する(ステップS133)。この場合、共有ディスク装置10の接続先IPアドレス124が無効化(ゼロクリア)される。
FIG. 8 is a diagram showing a processing flow of stand-by system single stop. In FIG. 8, when receiving the notification of the stopped node name from the cluster management unit 62 (step S131), the
続けて、接続先IPアドレス124が無効化されている場合は、待機システムとして動作可能なノードと接続するために、運用システムとして動作するノードのデータベース管理部63は、システム一覧122の全エントリについて、エントリの先頭から順に接続試行処理を実施し、接続したら、運用待機間接続処理(後述)を実行する(ステップS134)。運用待機間接続をしたノードのノード識別子を接続先IPアドレス124として共有ディスク装置10に格納する(ステップS135)。
Subsequently, when the connection
この場合、待機システムとして動作するノードに関して特別な処理は行われない。 In this case, no special processing is performed on the node operating as the standby system.
図9は、待機システム単独起動の処理フローを示す図である。図9において、運用システムとして動作するノードのデータベース管理部63は、クラスタ管理部62から起動したノード名の通知を受けると(ステップS141)、システム一覧122を使用して、起動したノード名をIPアドレスへ変換する(ステップS142)。データベース管理部63は、システム一覧122を使用して、切り替え優先順位が、接続先IPアドレス124よりも起動したノードのIPアドレスの方が高い場合は、接続先IPアドレス124について 、運用待機間切断処理(後述)を実行する(ステップS143)。この場合、共有ディスク装置10の接続先IPアドレス124が無効化(ゼロクリア)される。
FIG. 9 is a diagram showing a processing flow of stand-by system independent activation. In FIG. 9, when the
続けて、接続先IPアドレス124が無効化されている場合は、待機システムとして動作可能なノードと接続するために、運用システムとして動作するノードのデータベース管理部63は、システム一覧122の全エントリについて、エントリの先頭から順に接続試行処理を実施し、接続したら、運用待機間接続処理(後述)を実行する(ステップS144)。運用待機間接続をしたノードのノード識別子を接続先IPアドレス124として共有ディスク装置10に格納する(ステップS145)。
Subsequently, when the connection
一方、待機システムとして動作するノードのデータベース管理部63は、起動すると、運用システムと同様に、クラスタ管理部62からシステム一覧122を取得する(ステップS241)。ただし、待機システムとして動作する間は、システム一覧122を使用することはない。運用システムに切り替わった後に使用する。そして、待機システムとして動作するノードのデータベース管理部63は、運用システムとして動作するノードからの接続要求を受信した場合、応答を返して、運用待機間接続処理を実行する(ステップS242)。
On the other hand, when activated, the
図10は、運用待機間接続処理フローを示す図である。図10において、運用システムとして動作するノードのデータベース管理部63は、システム一覧122に含まれている切り替え優先順位の全エントリについて、エントリの先頭から順に接続試行処理を実施することにより、応答のあったノードを待機システムとして接続する(ステップS301)。
FIG. 10 is a diagram showing an operation standby connection processing flow. In FIG. 10, the
待機システムとしてのノードのデータベース管理部63は、運用システムから接続要求を受信すると、接続処理を実行し(ステップS401)、引継ぎ情報を格納するための内部の記憶領域を消去(purge)し(ステップS402)、運用システムへ接続要求に対する応答を行う。
When receiving the connection request from the operation system, the
運用システムとして動作するノードのデータベース管理部63は、接続要求に対して応答をしたノードのIPアドレスを接続先IPアドレス124として共有ディスク装置10に書き込む(write)(ステップS302)。そして、応答をしたノードへ運用待機間引継ぎ情報転送処理を実行する(ステップS303)。この場合、運用システムが保持している全引継ぎ情報を全て待機システムへ転送する(全ページ一括転送)。
The
図11は、運用待機間切断処理フローを示す図である。図11において、運用システムとして動作するノードのデータベース管理部63は、共有ディスク装置の接続先IPアドレス124に無効を設定する(ステップS311)。例えば、オールゼロ(以下、単に「0」(ゼロ)という)を設定する。
FIG. 11 is a diagram showing a flow of a disconnection process during operation standby. In FIG. 11, the
そして、運用システムとして動作するノードのデータベース管理部63は、引継ぎ情報の送信を停止し(ステップS312)、待機システムとの接続を切断する(ステップS313)。待機システムとして動作するノードのデータベース管理部63は、運用システムとの接続を切断する(ステップS411)。
Then, the
図12は、運用待機間引継ぎ情報転送処理フローを示す図である。図12において、運用システムとして動作するノードのデータベース管理部63は、引継ぎ情報の送信開始状態か否かを判断する(ステップS501)。つまり、待機システムと接続状態にあるか否かを確認する。送信開始状態でない場合、運用待機間引継ぎ情報転送処理を終了する。一方、送信開始状態である場合、内部の記憶領域(メモリユニット52又は記憶装置57の記憶領域)に格納されたDBデータの先頭からnページ(nは1以上の整数)を読み出して、共有ディスク10に送信すると共に、待機システムとして動作するノードへも送信する(ステップS502)。
FIG. 12 is a diagram showing a processing flow for transferring information during operation standby. In FIG. 12, the
待機システムとして動作するノードのデータベース管理部63は、nページを受信して、内部の記憶領域(メモリユニット52又は記憶装置57の記憶領域)に格納し(ステップS601)、nページ全てを受信したことを示す完了通知を運用システムへ送信する(ステップS602)。
The
運用システムとして動作するノードのデータベース管理部63は、待機システムから完了通知を受信すると、全て送信完了したか否かを判断する(ステップS503)。全て送信完了していない場合、ステップS502を再度実行する。一方、全て送信完了した場合、運用待機間引継ぎ情報転送処理を終了する。
When receiving the completion notification from the standby system, the
図12に示す運用待機間引継ぎ情報転送処理において、nページは、起動時には、内部の記憶領域に格納されたDBデータの全DBページを示し、全ページの一括送信となる。また、引継ぎ情報の更新時には、内部の記憶領域に格納されたDBデータの更新されたDBページが対象となり、単ページ送信或いは複数ページ送信となる。 In the active / standby handover information transfer process shown in FIG. 12, page n indicates all DB pages of the DB data stored in the internal storage area at the time of activation, and is a batch transmission of all pages. In addition, when the takeover information is updated, the updated DB page of the DB data stored in the internal storage area is targeted, and single page transmission or multiple page transmission is performed.
次に、切り替え処理について説明する。図13は、切り替え処理フローを示す図である。 Next, the switching process will be described. FIG. 13 is a diagram showing a switching process flow.
図13において、データベース管理部63は、運用待機モードが待機を示していることを確認し(ステップS601)、共有ディスク装置10から接続先IPアドレス124を読み込む(ステップS602)。共有ディスク装置10から取得した接続先IPアドレス124が自IPアドレスと等しいか否かを判断する(ステップS603)。すなわち、IPアドレスを比較することによって、内部に保持している引継ぎ情報(DBデータ16又は18)の整合性を判断する。
In FIG. 13, the
接続先IPアドレス124と自IPアドレスが一致しない場合(つまり、引継ぎ情報が不整合である場合)、内部の引継ぎ情報を消去(purge)して、共有ディスク装置10から業務に対応するDBデータ16又は18を読み込む(ステップS604)。
When the connection
データベース管理部63は、内部に保持している引継ぎ情報にて業務を続行できるように、切り替え処理を行い(ステップS605)、運用待機モードに運用を設定する(ステップS606)。そして、データベース管理部63は、共有ディスク装置10の接続先IPアドレス124に無効を設定する(ステップS606)。
The
次に、データベース管理部63は、待機システムとして動作するノードとの接続を試みる。つまり、システム一覧122に含まれている切り替え優先順位の全エントリについて、エントリの先頭から順に接続試行処理を実施し、接続したら、運用待機間接続処理(前述)を実行する(ステップS608)。運用待機間接続をしたノードのノード識別子を接続先IPアドレス124として共有ディスク装置10に格納する(ステップS609)。
Next, the
このように、ステップS602及びS603において共有ディスク装置10から接続先IPアドレス124を読み込み、自IPアドレスと比較することによって、内部に保持されている引継ぎ情報が有効な情報か否かを判断することができる。
As described above, in steps S602 and S603, the connection
また、ステップS604において内部の引継ぎ情報を共有ディスク装置10のDBデータで書き換えることによって、古い引継ぎ情報によるDBデータの不整合を防止することが可能となる。 Further, by rewriting the internal takeover information with the DB data of the shared disk device 10 in step S604, it becomes possible to prevent inconsistency of the DB data due to the old takeover information.
更に、接続IPアドレスと自IPアドレスとが一致する場合、内部の引継ぎ情報をそのまま使用することになるため、高速に切り替え処理を行うことが可能となる。 Furthermore, when the connection IP address and the own IP address match, the internal takeover information is used as it is, so that the switching process can be performed at high speed.
つまり、上述した処理フローにおいて、運用システムから待機システムへの切り替え時の古い引継ぎ情報の使用を防止するために、接続先IPアドレス124を共有ディスク装置10で管理し、下記の契機にて接続先IPアドレス124を操作し、引継ぎ情報を消去(purge)する。
In other words, in the processing flow described above, the connection
[契機1]は、運用待機間接続処理完了直後、かつ、引継ぎ情報の送信開始前の契機である。この[契機1]では、運用システムは、共有ディスク装置10内の接続先IPアドレスを更新し(図10のステップS302)、待機システムは、引継ぎ情報を消去(purge)する(図10のステップS402)。 [Trigger 1] is a trigger immediately after the completion of the connection process during standby and before the transmission of takeover information. At [Trigger 1], the operation system updates the connection destination IP address in the shared disk device 10 (step S302 in FIG. 10), and the standby system purges the takeover information (step S402 in FIG. 10). ).
[契機2]は、運用待機間切断処理の直前の契機である。この[契機2]では、運用システムは、共有ディスク装置10の接続先IPアドレス124を初期化する(図11のステップS311)ことによって、全待機システムのIPアドレスと接続先IPアドレス124とを不一致化させ、古い引継ぎ情報が継続して使用されないようにする。
[Trigger 2] is a trigger immediately before the disconnection process during operation standby. At this [Trigger 2], the operation system initializes the connection
[契機3]は、切り替え開始時である。この[契機3]では、共有ディスク装置10の接続先IPアドレス124と自IPアドレスとの比較結果に応じた処理を実行する。一致する場合、内部の引継ぎ情報を消去(purge)せずに、そのまま使用する(高速切り替え)(図13のステップS605)。一方、不一致の場合、引継ぎ情報を消去(purge)して、共有ディスク装置10からDBデータを読み出す(再常駐による切り替え)(図13のステップS604及びS605)。また、いずれの比較結果においても、共有ディスク装置10の接続先IPアドレス124を初期化する(図13のステップS607)ことによって、全待機システムのIPアドレスと接続先IPアドレス124とを不一致化させ、古い引継ぎ情報が継続して使用されないようにする。
[Timing 3] is when switching is started. In [Trigger 3], processing according to the comparison result between the connection
切り替えの優先順序の高い待機システムとしてのノードが起動した場合に、上述した処理フローに従って待機システムをその優先順位の高いノードへ変更する処理について図14で説明する。図14は、切り替えの優先順序の高い待機システムが起動した場合を説明するための図である。 FIG. 14 illustrates a process for changing a standby system to a node having a higher priority according to the above-described processing flow when a node serving as a standby system having a higher switching priority is activated. FIG. 14 is a diagram for explaining a case where a standby system with a high switching priority is activated.
図14において、運用システムとして動作するノード0は、切り替えの優先順位1のノード1が停止中であるため、優先順位2のノード2をノード0の待機システムとしてノード間接続をし、共有ディスク装置10の接続先IPアドレス124にノード2のIPアドレスを設定する(状態A1)。そして、運用システムとして動作するノード0は、随時更新された引継ぎ情報をノード2へ転送する。
In FIG. 14, the
その後、優先順位1のノード1が起動すると(状態A2)、運用システムとして動作するノード0は、ノード間通信によって、優先順位1のノード1が起動したことを認識し、共有ディスク装置10の接続先IPアドレス124を初期化する([契機3])。ノード0は、運用待機間切断処理を実行して、運用待機間通信パスを切断する(状態A3)。この場合、ノード0は、ノード2への引継ぎ情報の送信を中断するため、ノード2内の引継ぎ情報は古い情報となる。
Thereafter, when the
運用システムとして動作するノード0は、優先順位の高いノード1に対して運用待機間接続処理を実行して、ノード1との間に運用待機間通信パスを確立し、接続先IPアドレス124を更新する(状態A4)([契機1])。この場合、ノード1は、起動直後で引継ぎ情報を保持していないため、引継ぎ情報の消去(purge)は行われない。また、共有ディスク装置10の接続先IPアドレス124は、ノード1のIPアドレスが設定される。
The
運用システムとして動作するノード0は、ノード1と運用待機間通信を開始し(状態A5)、更新された引継ぎ情報がノード1へと転送される。
The
この状態で運用システムとして動作するノード0がダウンすると、運用システムの切り替えが行われる(状態A6)([契機3])。通常は、ノード1へと優先的に運用システムが切り替わる。この場合、ノード1のIPアドレスと共有ディスク装置10の接続先IPアドレス124とが一致する。ノード1は、最新の引継ぎ情報を内部に保持しているため、高速切り替えとなる。また、何らかの事情で、ノード1が停止している場合、ノード2へと運用システムが切り替わる。この場合、ノード2のIPアドレスと共有ディスク装置10の接続先IPアドレス124とは一致しない。よって、ノード2は、共有ディスク装置10からDBデータを読み出して、引継ぎ情報として再常駐させる。
When
したがって、状態A5で、新旧の引継ぎ情報が存在したとしても、共有ディスク装置10の接続先IPアドレス124を参照することによって、最新の引継ぎ情報にて業務を続行することができる。
Therefore, even if new and old takeover information exists in the state A5, the operation can be continued with the latest takeover information by referring to the connection
次に、切り替えの優先順序の高い待機システムとしてのノードが停止した場合に、上述した処理フローに従って待機システムを次に優先順位の高いノードへ変更する処理について図15で説明する。図15は、切り替えの優先順序の高い待機システムが停止した場合を説明するための図である。 Next, FIG. 15 illustrates a process for changing a standby system to a node having the next highest priority according to the above-described processing flow when a node as a standby system having a higher priority for switching is stopped. FIG. 15 is a diagram for explaining a case where a standby system with a high priority of switching is stopped.
図15において、運用システムとして動作するノード0は、切り替えの優先順位1のノード1を待機システムとして引継ぎ情報を転送している状態(状態B1)で、ノード間通信によって、その優先順位1のノードの停止を認識すると(状態B2)、共有ディスク装置10の接続先IPアドレスを初期化し([契機1])、運用待機間切断処理を実行して、運用待機間通信パスを切断する(状態B3)。
In FIG. 15, the
そして、運用システムとして動作するノード0は、次に優先順位の高い優先順位2のノード2に対して運用待機間接続処理を実行して、ノード2との間に運用待機間通信パスを確立し、接続先IPアドレス124を更新する(状態B4)([契機1])。この場合、ノード2は、内部に古い引継ぎ情報をそのまま保持している可能性があるため、内部の引継ぎ情報を消去(purge)する。また、共有ディスク装置10の接続先IPアドレス124は、ノード2のIPアドレスが設定される。
Then, the
運用システムとして動作するノード0は、ノード2と運用待機間通信を開始し(状態B5)、更新された引継ぎ情報がノード2へと転送され、ノード2は、最新の引継ぎ情報を内部に保持することになる。
The
この状態で運用システムとして動作するノード0がダウンすると、運用システムの切り替えが行われる(状態B6)([契機3])。通常は、ノード1へと優先的に運用システムが切り替えようとするが、ノード1は停止状態のため、ノード1への切り替えは発生しない。従って、優先順位2のノード2へと運用システムが切り替えられる。ここで、ノード2のIPアドレスと共有ディスク装置10の接続先IPアドレス124とが一致する。ノード2は、最新の引継ぎ情報を内部に保持しているため、高速切り替えとなる。
When
上記より、複数の待機システムを構成する運用待機システム100において、引継ぎ情報の転送先の待機システムのIPアドレスを共有ディスク装置10に格納しておくことによって、各待機システムは、内部に保持している引継ぎ情報が有効な情報か否かを判断することができる。
As described above, in the
また、内部に保持している引継ぎ情報が有効な情報である場合、共有ディスク装置10のDBデータを読み出すことなく、そのまま運用を継続する高速切り替えが可能となる。 In addition, when the takeover information held inside is valid information, it is possible to perform high-speed switching that continues operation without reading the DB data of the shared disk device 10.
本実施例では、主に、1つの運用システムに対して複数の待機システムについて例示したが、図2に示されるように、2つ以上の運用システムに対して複数の待機システムを構成する運用待機システム100において適応可能である。
In the present embodiment, a plurality of standby systems are mainly exemplified for one operation system. However, as shown in FIG. 2, operation standby in which a plurality of standby systems are configured for two or more operation systems. Applicable in
以上の説明に関し、更に以下の項を開示する。
(付記1)
運用システムと複数の待機システムとで構成される運用待機システムにて、該運用システムから該複数の待機システムの1つへと切り替える際に引き継がれる引継ぎ情報の整合性を確認する処理をコンピュータに実行させるプログラムであって、該コンピュータに、
前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出して内部記憶領域に格納する待機識別情報読出手順と、
前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手順と、
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手順とを実行させることを特徴とするコンピュータ実行可能なプログラム。
(付記2)
前記コンピュータに、
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との不一致により前記引継ぎ情報の不整合を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を消去する引継ぎ情報消去手順と、
前記外部共有記憶領域から前記引継ぎ情報を読み出す引継ぎ情報読出手順とを実行させることを特徴とする付記1記載のコンピュータ実行可能なプログラム。
(付記3)
前記コンピュータに、
前記コンピュータが前記運用システムとして動作する場合、切り替えの優先順位に従って前記待機システムの1つと接続し、接続した該待機システムを識別する前記待機識別情報を前記外部共有記憶領域に書き出す待機識別情報書出手順と、
前記引継ぎ情報の更新に応じて、該引継ぎ情報を前記外部共有記憶領域に書き込むと共に、接続した前記待機システムに該引継ぎ情報を転送する引継ぎ情報更新手順とを実行させることを特徴とする付記1記載のコンピュータ実行可能なプログラム。
(付記4)
前記引継ぎ情報更新手順は、前記引継ぎ情報の全て又は該引継ぎ情報を構成する所定情報単位によって、前記外部共有記憶領域と接続した前記待機システムとに送信することを特徴とする付記3記載のコンピュータ実行可能なプログラム。
(付記5)
運用システムと複数の待機システムとで構成される運用待機システムにて、該運用システムから該複数の待機システムの1つへと切り替える際に引き継がれる引継ぎ情報の整合性を確認する処理をコンピュータが実行する引継ぎ情報整合性確認方法であって、該コンピュータが、
前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出す内部記憶領域に格納する待機識別情報読出手順と、
前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手順と、
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手順とを実行することを特徴とする引継ぎ情報整合性確認方法。
(付記6)
運用システムと複数の待機システムとで構成システムにて、該運用システムから該複数の待機システムの1つへと切り替える際に引き継がれる引継ぎ情報の整合性を確認する該待機システムとして動作するノード装置であって、
前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出す内部記憶領域に格納する待機識別情報読出手段と、
前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手段と、
前記整合性確認手段によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手段とを実行することを特徴とするノード装置。
(付記7)
運用システムと複数の待機システムとで構成システムにて、該運用システムから該複数の待機システムの1つへと切り替える際に引き継がれる引継ぎ情報の整合性を確認する運用システムとして動作するノード装置であって、
切り替えの優先順位に従って前記待機システムの1つと接続し、接続した該待機システムを識別する前記待機識別情報を前記外部共有記憶領域に書き出す待機識別情報書出手段と、
前記引継ぎ情報の更新に応じて、該引継ぎ情報を前記外部共有記憶領域に書き込むと共に、接続した前記待機システムに該引継ぎ情報を転送する引継ぎ情報更新手段とを実行させることを特徴とするノード装置。
Regarding the above description, the following items are further disclosed.
(Appendix 1)
In an active / standby system comprised of an active system and a plurality of standby systems, the computer executes processing for checking the consistency of the takeover information that is taken over when switching from the active system to one of the standby systems. A program that causes the computer to
Standby for reading standby identification information for identifying a switching standby system stored in the external shared storage area from the external shared storage area shared by the operation system and the plurality of standby systems and storing the standby identification information in the internal storage area An identification information reading procedure;
A consistency check procedure for checking the consistency of the takeover information by matching the standby identification information stored in the internal storage area with the self-identification information;
When the consistency confirmation procedure confirms the consistency of the takeover information by matching the standby identification information with the self-identification information, the operation system uses the takeover information held in the internal storage area. A computer-executable program for executing an operation switching procedure for starting an operation as
(Appendix 2)
In the computer,
Takeover information erasure procedure for erasing the takeover information held in the internal storage area when the consistency confirmation procedure confirms inconsistency of the takeover information due to a mismatch between the standby identification information and the self identification information When,
The computer-executable program as set forth in
(Appendix 3)
In the computer,
When the computer operates as the operation system, it is connected to one of the standby systems in accordance with the switching priority order, and the standby identification information that identifies the connected standby system is written to the external shared storage area. Procedure and
In accordance with the update of the takeover information, the takeover information is written to the external shared storage area, and a takeover information update procedure for transferring the takeover information to the connected standby system is executed. Computer executable program.
(Appendix 4)
The computer-implemented operation according to claim 3, wherein the takeover information update procedure is transmitted to the standby system connected to the external shared storage area in accordance with a predetermined information unit constituting all of the takeover information or the takeover information. Possible program.
(Appendix 5)
In an active / standby system comprised of an active system and a plurality of standby systems, the computer executes processing for checking the consistency of the takeover information that is taken over when switching from the active system to one of the standby systems. A takeover information consistency check method, wherein the computer
Standby identification information that reads standby identification information for identifying the switching standby system stored in the external shared storage area is read from the external shared storage area shared by the operation system and the plurality of standby systems. Information reading procedure;
A consistency check procedure for checking the consistency of the takeover information by matching the standby identification information stored in the internal storage area with the self-identification information;
When the consistency confirmation procedure confirms the consistency of the takeover information by matching the standby identification information with the self-identification information, the operation system uses the takeover information held in the internal storage area. A method for confirming the takeover information consistency, comprising performing an operation switching procedure for starting the operation as
(Appendix 6)
A node device that operates as the standby system for confirming the consistency of takeover information that is taken over when switching from the operation system to one of the plurality of standby systems in a configuration system of an operation system and a plurality of standby systems; There,
Standby identification information that reads standby identification information for identifying the switching standby system stored in the external shared storage area is read from the external shared storage area shared by the operation system and the plurality of standby systems. Information reading means;
Consistency confirmation means for confirming the consistency of the takeover information based on a match between the standby identification information stored in the internal storage area and the self identification information;
When the consistency confirmation unit confirms the consistency of the takeover information by matching the standby identification information with the self identification information, the operation system uses the takeover information held in the internal storage area. A node device characterized by executing operation switching means for starting operation as
(Appendix 7)
A node device that operates as an operation system for confirming the consistency of takeover information that is taken over when switching from the operation system to one of the plurality of standby systems in a configuration system composed of an operation system and a plurality of standby systems. And
Standby identification information writing means for connecting to one of the standby systems according to the priority of switching, and writing the standby identification information for identifying the connected standby system in the external shared storage area;
In response to the update of the takeover information, the node device writes the takeover information to the external shared storage area, and causes the connected standby system to execute takeover information update means for transferring the takeover information.
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。 The present invention is not limited to the specifically disclosed embodiments, and various modifications and changes can be made without departing from the scope of the claims.
ノード0から3 運用システム又は待機システム
2 ネットワーク
10 共有ディスク装置
12 業務A用共有ファイル
14 業務B用共有ファイル
16 DBデータ
18 DBデータ
51 CPU
52 メモリユニット
53 表示ユニット
54 出力ユニット
55 入力ユニット
56 通信ユニット
57 記憶装置
58 ドライバ
59 記憶媒体
100 運用待機システム
52
Claims (5)
前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出して内部記憶領域に格納する待機識別情報読出手順と、
前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手順と、
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手順とを実行させることを特徴とするコンピュータ実行可能なプログラム。 In an active / standby system comprised of an active system and a plurality of standby systems, the computer executes processing for checking the consistency of the takeover information that is taken over when switching from the active system to one of the standby systems. A program that causes the computer to
Standby for reading standby identification information for identifying a switching standby system stored in the external shared storage area from the external shared storage area shared by the operation system and the plurality of standby systems and storing the standby identification information in the internal storage area An identification information reading procedure;
A consistency check procedure for checking the consistency of the takeover information by matching the standby identification information stored in the internal storage area with the self-identification information;
When the consistency confirmation procedure confirms the consistency of the takeover information by matching the standby identification information with the self-identification information, the operation system uses the takeover information held in the internal storage area. A computer-executable program for executing an operation switching procedure for starting an operation as
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との不一致により前記引継ぎ情報の不整合を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を消去する引継ぎ情報消去手順と、
前記外部共有記憶領域から前記引継ぎ情報を読み出す引継ぎ情報読出手順とを実行させることを特徴とする請求項1記載のコンピュータ実行可能なプログラム。 In the computer,
Takeover information erasure procedure for erasing the takeover information held in the internal storage area when the consistency confirmation procedure confirms inconsistency of the takeover information due to a mismatch between the standby identification information and the self identification information When,
The computer-executable program according to claim 1, wherein a takeover information reading procedure for reading the takeover information from the external shared storage area is executed.
前記コンピュータが前記運用システムとして動作する場合、切り替えの優先順位に従って前記待機システムの1つと接続し、接続した該待機システムを識別する前記待機識別情報を前記外部共有記憶領域に書き出す待機識別情報書出手順と、
前記引継ぎ情報の更新に応じて、該引継ぎ情報を前記外部共有記憶領域に書き込むと共に、接続した前記待機システムに該引継ぎ情報を転送する引継ぎ情報更新手順とを実行させることを特徴とする請求項1又は2記載のコンピュータ実行可能なプログラム。 In the computer,
When the computer operates as the operation system, it is connected to one of the standby systems in accordance with the switching priority order, and the standby identification information that identifies the connected standby system is written to the external shared storage area. Procedure and
2. The takeover information update procedure for writing the takeover information to the external shared storage area and transferring the takeover information to the connected standby system in response to the update of the takeover information. Or the computer-executable program of 2 description.
前記運用システムと前記複数の待機システムとで共有される外部共有記憶領域から、該外部共有記憶領域に格納されている切り替え用待機システムを識別する待機識別情報を読み出す内部記憶領域に格納する待機識別情報読出手順と、
前記内部記憶領域に格納された前記待機識別情報と自識別情報との一致によって、該引継ぎ情報の整合性を確認する整合性確認手順と、
前記整合性確認手順によって、前記待機識別情報と前記自識別情報との一致により前記引継ぎ情報の整合性を確認した場合、前記内部記憶領域に保持している前記引継ぎ情報を用いて、前記運用システムとして動作を開始する運用切り替え手順とを実行することを特徴とする引継ぎ情報整合性確認方法。
In an active / standby system comprised of an active system and a plurality of standby systems, the computer executes processing for checking the consistency of the takeover information that is taken over when switching from the active system to one of the standby systems. A takeover information consistency check method, wherein the computer
Standby identification information that reads standby identification information for identifying the switching standby system stored in the external shared storage area is read from the external shared storage area shared by the operation system and the plurality of standby systems. Information reading procedure;
A consistency check procedure for checking the consistency of the takeover information by matching the standby identification information stored in the internal storage area with the self-identification information;
When the consistency confirmation procedure confirms the consistency of the takeover information by matching the standby identification information with the self-identification information, the operation system uses the takeover information held in the internal storage area. A method for confirming the takeover information consistency, comprising performing an operation switching procedure for starting the operation as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005015861A JP2006202220A (en) | 2005-01-24 | 2005-01-24 | Program for causing computer to execute processing of confirming consistency of handover information, and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005015861A JP2006202220A (en) | 2005-01-24 | 2005-01-24 | Program for causing computer to execute processing of confirming consistency of handover information, and method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006202220A true JP2006202220A (en) | 2006-08-03 |
Family
ID=36960144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005015861A Pending JP2006202220A (en) | 2005-01-24 | 2005-01-24 | Program for causing computer to execute processing of confirming consistency of handover information, and method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006202220A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009223780A (en) * | 2008-03-18 | 2009-10-01 | Hitachi Ltd | Data replication method and data replication system |
JP2021149133A (en) * | 2020-03-16 | 2021-09-27 | Necソリューションイノベータ株式会社 | Clustering system, operation method for clustering system, and program |
-
2005
- 2005-01-24 JP JP2005015861A patent/JP2006202220A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009223780A (en) * | 2008-03-18 | 2009-10-01 | Hitachi Ltd | Data replication method and data replication system |
JP2021149133A (en) * | 2020-03-16 | 2021-09-27 | Necソリューションイノベータ株式会社 | Clustering system, operation method for clustering system, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4659062B2 (en) | Failover method, program, management server, and failover system | |
JP3992427B2 (en) | File system | |
US7260625B2 (en) | Data center system and method for controlling the same | |
JP5026145B2 (en) | Failover method for remotely mirrored cluster file server | |
US6134673A (en) | Method for clustering software applications | |
US8352720B2 (en) | Method for changing booting configuration and computer system capable of booting OS | |
US7904746B2 (en) | Information processing system and data recovery method | |
JP4648447B2 (en) | Failure recovery method, program, and management server | |
EP2477111B1 (en) | Computer system and program restoring method thereof | |
JP4572250B2 (en) | Computer switching method, computer switching program, and computer system | |
US20100228960A1 (en) | Virtual memory over baseboard management controller | |
US20010056554A1 (en) | System for clustering software applications | |
US7836162B2 (en) | Transaction processing system and transaction processing method | |
JP6001773B2 (en) | Nondisruptive controller replacement in network storage systems | |
CN109446169B (en) | Double-control disk array shared file system | |
US7652982B1 (en) | Providing high availability network services | |
CN102597963B (en) | Dynamic copies volume in cluster exchanges | |
US7228352B1 (en) | Data access management system in distributed processing system | |
WO2021004256A1 (en) | Node switching method in node failure and related device | |
JP2009251786A (en) | Data processing method, storage apparatus, and storage system | |
US7752493B2 (en) | High reliability system, redundant construction control method, and program | |
JP4806382B2 (en) | Redundant system | |
JP2006202220A (en) | Program for causing computer to execute processing of confirming consistency of handover information, and method thereof | |
JP2001154896A (en) | Computer and method for updating file | |
JP2004272318A (en) | System changeover system, processing method therefor, and processing program therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080311 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080603 |