JP2776442B2 - Compound computer system - Google Patents
Compound computer systemInfo
- Publication number
- JP2776442B2 JP2776442B2 JP3014986A JP1498691A JP2776442B2 JP 2776442 B2 JP2776442 B2 JP 2776442B2 JP 3014986 A JP3014986 A JP 3014986A JP 1498691 A JP1498691 A JP 1498691A JP 2776442 B2 JP2776442 B2 JP 2776442B2
- Authority
- JP
- Japan
- Prior art keywords
- session
- opening
- standby
- computer system
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は、ハードウェア/ソフト
ウェアの突発的な障害において、稼働コンピュータシス
テム(以下、単に稼働システムと略す)が停止してしま
った場合に、サービスを速やかに再開させるために、稼
働システム実行時に待機システムを予め起動状態にして
おき、稼働システム停止時に自動的に待機システムにて
運用を引き継ぐことで、サービス停止時間を極力小さく
することを実現する複合コンピュータシステムに関する
ものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is intended to quickly restart services when an operating computer system (hereinafter simply referred to as "operating system") stops due to a sudden hardware / software failure. In addition, it relates to a complex computer system that realizes minimizing the service stop time by setting the standby system in the activated state in advance when the operating system is executed and automatically taking over the operation in the standby system when the operating system is stopped. is there.
【0002】[0002]
【従来の技術】複合コンピュータシステムでは、稼働シ
ステムがサービス開始をする際、待機システムを起動さ
せておき、オンライン業務がすぐにでも実行できるよう
な状態にしておくことで、稼働システムのシステム障害
時に系を切り替えることで連続的なオンラインサービス
運用を実現する。従来の複合コンピュータシステムで
は、系切り替え時に旧稼働システム停止を共有通信制御
装置に通知するか、もしくは共有通信制御装置のシステ
ム動作監視機能による稼働システムの停止検知によっ
て、共有通信制御装置はそのとき開設しているセション
をすべて切断し、初期状態と同じ状態を作り出す。新た
な稼働システムは、定義端末についてセション開設動作
を行い、共有通信制御装置配下の端末は再接続される。
このため、端末利用者にとっては、サービスが一旦停止
し、再接続されたようにとれる。2. Description of the Related Art In a complex computer system, when an operating system starts a service, a standby system is activated so that an online job can be executed immediately, so that a system failure of the operating system can be performed. Realize continuous online service operation by switching systems. In a conventional complex computer system, the shared communication control device is opened when the old operating system is stopped by notifying the shared communication control device when the system is switched, or when the operating system is stopped by the system operation monitoring function of the shared communication control device. Disconnect all the sessions you are doing to create the same state as the initial state. The new operating system performs a session opening operation for the defined terminal, and terminals under the shared communication control device are reconnected.
Therefore, for the terminal user, the service can be temporarily stopped and re-connected.
【0003】[0003]
【発明が解決しようとする課題】稼働システム障害時に
おける系切り替えにおいて、上述した端末再接続処理
は、端末数が増加すればするほど長くなる。また端末セ
ションの切断、再接続は、オンラインネットワーク上を
接続手順に基づいた制御電文が流れるため、非常に時間
がかかっていた。このため、系切り替え処理全体にかか
る時間が長くなり、端末利用者にとってはシステム規模
の増大に伴い、サービス停止時間が非常に長くなり、実
際の業務運用にとって問題となっていた。In the case of system switching in the event of a failure in the operating system, the above-described terminal reconnection process becomes longer as the number of terminals increases. Also, disconnection and reconnection of a terminal session took a very long time because control messages based on the connection procedure flowed on the online network. For this reason, the time required for the entire system switchover process becomes longer, and for the terminal user, the service suspension time becomes extremely long with the increase in the system scale, which has been a problem in actual business operation.
【0004】本発明は、このような問題点を解決するた
めになされたもので、その目的は端末数に依存すること
なく速やかな系の切り替えを実現できるようにした複合
コンピュータシステムを提供することにある。SUMMARY OF THE INVENTION The present invention has been made to solve such a problem, and an object of the present invention is to provide a compound computer system capable of realizing quick system switching without depending on the number of terminals. It is in.
【0005】[0005]
【課題を解決するための手段】稼働システムがセション
を開設している端末に対し、待機システムからも予め待
機セションを開設する。このときの待機セションは、共
有通信制御装置と待機システム上のオンラインサービス
システムとの間の仮想的なものであり、このセションが
存在するときは、系切り替え時において端末と共有通信
制御装置間のセションを切断しない。このため、新稼働
システム活性時は、セションの再接続を実行せずに、オ
ンラインサービスを即時再開可能である。SUMMARY OF THE INVENTION A standby session is established in advance from a standby system for a terminal whose operating system has established a session. The standby session at this time is a virtual one between the shared communication control device and the online service system on the standby system. When this session exists, the terminal and the shared communication control device Do not disconnect the session. For this reason, when the new operating system is active, the online service can be immediately restarted without reconnecting the session.
【0006】[0006]
【作用】(1)予め待機システムを起動しておき、オン
ラインサービスが実行できる状態にしておき、稼働シス
テムのサービスを開始する。(1) The standby system is activated in advance, the online service can be executed, and the service of the operating system is started.
【0007】稼働システムと待機システムは、同一の端
末に対して同時にセションを開設する。このとき待機シ
ステムからのセションは、オンラインサービスシステム
と共有通信制御装置間のみの仮想的なものである。[0007] The operating system and the standby system open a session for the same terminal at the same time. At this time, the session from the standby system is virtual only between the online service system and the shared communication control device.
【0008】共有通信制御装置は、稼働システムにおけ
る実際の端末とのセションが存在しているときに、仮想
的な待機セションが存在するときは、系切り替え時にお
ける共有通信制御装置に対する旧稼働システム停止通知
もしくは共有通信制御装置の稼働システム停止監視にお
いて、端末とのセションを切断することなく、また新稼
働システムのオンラインシステムは、すでに開設されて
いるセションに再接続することもなく、端末数に依存し
ない速やかな系切り替えが実現される。 (2)/(3)予め起動されている待機システムに対
し、稼働システムの起動は系間通信手段および系間通信
装置によって通知される。これに対し、セションの開設
事象を待機システムに伝達することを、系間通信手段に
よって実現することは、非常に負担が大きい。これは、
稼働システムにおけるセション開設が一気に発生する場
合、系間通信手段の能力を越えてしまう危険性があるか
らである。また、系間通信手段の障害時の回避方式も困
難なものとなる。When a virtual standby session exists while a session with an actual terminal in the operating system exists, the shared communication control device stops the old operating system with respect to the shared communication control device at the time of system switching. Depends on the number of terminals without disconnecting the session with the terminal in the notification or monitoring of the operating system stoppage of the shared communication control device, and the online system of the new operating system does not reconnect to the already opened session Quick system switching is realized. (2) / (3) The activation of the operating system is notified to the standby system that has been activated in advance by the inter-system communication means and the inter-system communication device. On the other hand, it is very burdensome to transmit the session opening event to the standby system by the inter-system communication means. this is,
This is because, when a session is opened in the operating system at once, there is a risk that the capacity of the inter-system communication means may be exceeded. In addition, a method of avoiding a failure of the inter-system communication means becomes difficult.
【0009】稼働セションのセション接続の事象は、セ
ション開設の度に状態引き継ぎファイルに記録すること
で伝達される。ファイルには、セション開設の度に開設
端末名を記録し、どこまで記録したかがわかるようにす
る。[0009] The event of the session connection of the operating session is transmitted by recording it in the status takeover file every time a session is opened. Each time a session is opened, the name of the terminal to be opened is recorded in the file so that the user can know how far the terminal has been recorded.
【0010】待機システムにおいては、稼働システム起
動を感知したときから周期的に、状態引き継ぎファイル
の内容を確認し、稼働システムにおけるセション状態変
化があったかどうかを最新情報の有効位置から判断す
る。稼働システムのセション開設が一気に生じたときで
も、ファイルへの記録および読み込みによって、ファイ
ルの最後まで達するまでは確実にセション状態を引き継
ぐことができる。 (4)/(5)稼働セションは稼働システムのネットワ
ーク定義に基づいたセション属性によって開設される。
また、待機セションも同様であるが、実際に端末とオン
ラインサービスシステムとの間の会話制御に用いられる
セション属性は、いうまでもなく稼働セションにおける
属性である。すなわち、稼働セションのセション属性
と、待機セションのセション属性とが一致していない場
合、系切り替え時に端末とオンラインサービスシステム
との会話制御に矛盾が生じてしまう。In the standby system, the content of the status takeover file is periodically checked from the time of detecting the activation of the operating system, and it is determined from the effective position of the latest information whether or not the session status has changed in the operating system. Even when a session is opened in the operating system at a stretch, the session state can be surely taken over by recording and reading the file until the end of the file is reached. (4) / (5) The operation session is established by the session attribute based on the network definition of the operation system.
The same applies to the standby session, but the session attribute actually used for controlling the conversation between the terminal and the online service system is, of course, the attribute in the active session. That is, when the session attribute of the active session does not match the session attribute of the standby session, inconsistency occurs in conversation control between the terminal and the online service system at the time of system switching.
【0011】これを回避するために、稼働セションのセ
ション属性と待機セションのセション属性を比較し、も
し異なれば、待機セションの開設を行わないようにす
る。これによって、その端末に対するセションについて
は、系切り替え時は従来と同様の切断、ならびに再接続
を実行する。 (6)待機セションは、稼働セションのあるなしに拘ら
ず開設しておいてもよいような共有通信制御装置を有す
るシステムにおいては、待機セションをずっと開設して
おくことが可能となる。これによって、これまでにセシ
ョンを開設した情報をセション状態引き継ぎファイルに
記録したかどうかを記録しておき、一旦セション開設事
象を記録したら、以降はセション開設事象をセション状
態引き継ぎファイルに記録しないことによって、有限な
セション状態引き継ぎファイルに対して、稼働セション
が接続および切断を繰り返すシステムにおいても、ファ
イルの最後まで達することがないようにし、確実な待機
セションの開設を実現する。 (7)共有通信制御装置の障害時は、待機セションも切
断される。従って、共有通信制御装置の障害による稼働
セションの切断後の再接続においては、一旦セション開
設事象を記録した後でも、稼働システムにおいてセショ
ン開設事象を記録しなくてはならない。To avoid this, the session attribute of the active session is compared with the session attribute of the standby session, and if they are different, the opening of the standby session is not performed. As a result, for the session for the terminal, disconnection and reconnection are performed at the time of system switching in the same manner as in the related art. (6) In a system having a shared communication control device that can be set up regardless of whether there is an active session or not, a standby session can be set up all the time. As a result, whether or not the information that has established a session so far has been recorded in the session status takeover file is recorded. Even in a system in which an active session repeatedly connects and disconnects a finite session state takeover file, the file is prevented from reaching the end of the file, and a reliable standby session is opened. (7) When a failure occurs in the shared communication control device, the standby session is also disconnected. Therefore, in the reconnection after the disconnection of the operating session due to the failure of the shared communication control device, the session opening event must be recorded in the operating system even after the session opening event is once recorded.
【0012】この場合、引き継ぎ情報は有限なものとは
ならない。引き継ぎファイルはファイルの最後に達した
ときに、ファイルの先頭から再使用するようにすること
で、永続的なセション状態の引き継ぎを実現する。有限
な引き継ぎファイルにおいて、待機システムが読み取る
前に、再使用による引き継ぎデータの上書きが生じない
ように、前回接続事象を記録した時刻から、待機システ
ムが読み込みを行う周期より長い期間を経過したあと
で、障害復旧後の再接続を行うようにすることで、確実
なセション状態の引き継ぎを実現する。In this case, the takeover information is not finite. The takeover file is reused from the beginning of the file when the end of the file is reached, thereby realizing a permanent takeover of the session state. In a finite takeover file, before the standby system reads, in order to prevent overwriting of takeover data due to reuse, after a period longer than the standby system read cycle from the time of the last connection event recording, By performing the reconnection after the recovery from the failure, the session state is surely taken over.
【0013】[0013]
【実施例】次に、本発明の一実施例について、図面を参
照して詳細に説明する。図1は本発明の一実施例を示す
ブロック図である。図において、100はオンラインサ
ービスを提供する稼働ホストコンピュータであって、系
間通信手段101、通信制御手段102及び本発明の特
徴とするところの起動制御手段111と、セション開設
状態記録手段112と、セション開設手段113と、セ
ション再接続手段114と、端末名116、セション属
性117、セション引継履歴118、障害記録119、
セション引継時刻120の情報記録域を含む端末状態テ
ーブル115とを含むオンラインサービスシステム11
0とで構成されている。Next, an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the present invention. In the figure, reference numeral 100 denotes an operation host computer for providing an online service, which includes an inter-system communication unit 101, a communication control unit 102, an activation control unit 111 which is a feature of the present invention, a session opening state recording unit 112, Session opening means 113, session reconnecting means 114, terminal name 116, session attribute 117, session takeover history 118, fault record 119,
An online service system 11 including a terminal status table 115 including an information recording area of a session takeover time 120
0.
【0014】また、200は待機ホストコンピュータで
あり、系間通信手段201、通信制御手段202及び本
発明の特徴とするところの切り替え制御手段211と、
セション開設状態読み取り手段212と、待機セション
チェック手段214を含むセション開設手段213と、
引継ファイル監視手段215と、端末名217、セショ
ン属性218の情報記憶域を含む端末状態テーブル21
6とを含むオンラインサービスシステム210とで構成
されている。A standby host computer 200 includes an inter-system communication unit 201, a communication control unit 202, and a switching control unit 211 which is a feature of the present invention.
A session opening means 213 including a session opening state reading means 212, a standby session checking means 214,
Handover file monitoring means 215 and terminal status table 21 including information storage area of terminal name 217 and session attribute 218
6 and an online service system 210 including
【0015】更に、103,203は両システム間の情
報交換を行う系間通信装置、204は稼働ホストコンピ
ュータ100のシステム障害を監視し、システム障害に
よるシステム停止時にオンラインサービスシステム21
0に通知をあげる障害検出装置である。また、400は
端末名411、セション属性412、レコード世代41
3の記憶情報域を含む、端末数分以上のセション状態レ
コード410で構成されるセション状態引継ファイル、
300は待機セション開設手段301と、セション保持
手段302を含む稼働/待機共有通信制御装置(以降、
共有通信装置と略す)、800は端末装置である。Further, reference numerals 103 and 203 denote inter-system communication devices for exchanging information between the two systems, and 204 monitors a system failure of the operating host computer 100.
This is a fault detection device that gives a notification to 0. Reference numeral 400 denotes a terminal name 411, a session attribute 412, and a record generation 41.
3, a session status takeover file including session status records 410 equal to or more than the number of terminals including the storage information area of No. 3
Reference numeral 300 denotes an operation / standby shared communication control device (hereinafter, referred to as a standby session opening means 301 and a session holding means 302).
800 is a terminal device.
【0016】なお、説明の便宜上、オンラインサービス
システム110からのセションを稼働セション500、
オンラインサービスシステム210からのセションを待
機セション600、実際の端末装置800とのセション
を端末セション700で表している。For convenience of explanation, a session from the online service system 110 is assumed to be an operation session 500,
A session from the online service system 210 is represented by a standby session 600, and a session with the actual terminal device 800 is represented by a terminal session 700.
【0017】次に、本実施例の動作について、図面を参
照して説明する。 (システムの起動)複合コンピュータシステムでは、オ
ンラインサービスシステム110を起動する前に、オン
ラインサービスシステム210を起動する。オンライン
サービスシステム210がオンラインサービスの準備が
できあがった段階で、オンラインサービスシステム11
0を起動する。Next, the operation of this embodiment will be described with reference to the drawings. (Starting of System) In the multifunction computer system, the online service system 210 is started before the online service system 110 is started. When the online service system 210 is ready for the online service, the online service system 11
Start 0.
【0018】起動制御手段111は、まず自システムの
サービスの準備を実行する。また、通信制御手段102
に対して稼働システム宣言を実行する。これによって、
オンラインサービスシステム110が要求する端末装置
800に対するセション開設は、稼働セション500と
して実際に端末セション700が開設されるように通信
制御手段102が制御する。起動制御手段111は準備
が完了すると、系間通信手段101を使用してオンライ
ンサービスシステム210に対して稼働システム起動宣
言を伝達する。The start control means 111 first prepares for the service of its own system. Also, the communication control means 102
Execute the operating system declaration for. by this,
The session opening for the terminal device 800 requested by the online service system 110 is controlled by the communication control means 102 so that the terminal session 700 is actually opened as the operation session 500. When the preparation is completed, the activation control means 111 transmits an operating system activation declaration to the online service system 210 using the inter-system communication means 101.
【0019】この要求は、系間通信装置103,203
を経由して、系間通信手段201に伝達される。系間通
信手段201はこれをオンラインサービスシステム21
0に通知すると、引継ファイル監視手段215はタイマ
をかけることで、セション開設状態読み取り手段212
を使用して周期的にセション状態引継ファイル400を
読み取る。これによって、オンラインサービスシステム
210は、オンラインサービスシステム110にセショ
ン開設などの事象変化が生じたときに記録される、最新
のセション状態レコード410情報を取得することがで
きる。This request is sent to the inter-system communication devices 103 and 203.
Is transmitted to the inter-system communication means 201 via The inter-system communication means 201 transmits this to the online service system 21
0, the inherited file monitoring means 215 sets a timer to cause the session open state reading means 212
Is used to periodically read the session state takeover file 400. As a result, the online service system 210 can acquire the latest session state record 410 information recorded when an event change such as a session opening occurs in the online service system 110.
【0020】オンラインサービスシステム210は、系
間通信手段201を使用して、稼働システム起動宣言の
確認通知を送る。この通知は、系間通信手段101によ
ってオンラインサービスシステム110に届けられる。
起動制御手段111は、この確認通知を受け取ると、稼
働システムはサービスを開始する。系間通信装置10
3,203間の系間通信路は、障害を起こしている場合
がある。このような場合には、起動宣言や確認通知は失
われてしまう。これらの再送制御は、系間通信手段10
1ならびに起動制御手段111にて行われる。 (セションの開設)オンラインサービスシステム110
はサービスすべき端末装置800に対して、オンライン
サービスシステム110起動時、セション開設コマンド
投入時に、セションを開設する。セション開設手段11
3は、目的の端末装置800に対応する端末状態テーブ
ル115を検索し、通信制御手段102にセション開設
指示を発行することでセションを開設する。通信制御手
段102は、起動制御手段111による稼働システム宣
言を受けているため、稼働セション500を共有通信制
御装置300に開設要求する。このとき、もし障害記録
119が障害後と記録されていれば、セション引継時刻
120を参照して現時刻が引継ファイル監視手段215
が監視する周期よりも十分多く経過しているかどうかを
判断する。もし十分な時間が経過していなければ、セシ
ョン再接続手段114によって時間経過後にセションを
再接続するよう要求する。セション再接続手段114は
当該端末に対し、十分な時間が経過するまで待ったあ
と、セション開設手段113に対してセション開設要求
を発行し、上記処理を再実行する。十分な時間が経過し
ていれば、障害記録119をクリアし、セション開設を
行う。Using the inter-system communication means 201, the online service system 210 sends a confirmation notice of the operating system activation declaration. This notification is sent to the online service system 110 by the inter-system communication means 101.
When the activation control unit 111 receives this confirmation notification, the operating system starts the service. Inter-system communication device 10
The inter-system communication path between the nodes 3 and 203 may have a failure. In such a case, the activation declaration and the confirmation notification are lost. These retransmission controls are performed by the inter-system communication means 10.
1 and activation control means 111. (Open Session) Online Service System 110
Opens a session with the terminal device 800 to be serviced when the online service system 110 is started and when a session opening command is input. Session opening means 11
3 searches the terminal status table 115 corresponding to the target terminal device 800 and issues a session opening instruction to the communication control means 102 to open a session. Since the communication control unit 102 has received the operation system declaration from the activation control unit 111, it requests the shared communication control device 300 to open the operation session 500. At this time, if the failure record 119 is recorded as “after failure”, the current time is referenced by referring to the session takeover time 120 and the takeover file monitoring unit 215
It is determined whether or not the monitoring period has elapsed sufficiently. If sufficient time has not elapsed, the session reconnection means 114 requests that the session be reconnected after the time has elapsed. The session reconnection means 114 waits for a sufficient time to elapse from the terminal, issues a session opening request to the session opening means 113, and executes the above processing again. If a sufficient time has elapsed, the failure record 119 is cleared and a session is opened.
【0021】セション開設手段113は、通信制御手段
102のセション開設受諾時に、稼働ホストコンピュー
タ100のネットワーク定義上のセション属性を取得
し、セション属性117に記録する。さらに、セション
引継履歴118を確認して、もし内容がクリアされてい
れば、セション開設状態記録手段112に対して端末状
態テーブル115を指定してセション開設記録要求を出
す。セション引継履歴118がセション引き継ぎ済みで
あれば、何もしない。セション開設状態記録手段112
はセション開設記録要求を受けると、指定された端末状
態テーブル115の端末名116、およびセション属性
117を、セション状態引継ファイル400の前回書き
込んだレコードの次に、端末名411およびセション属
性412を設定してセション状態レコード410を書き
込む。また、現在時刻をレコード世代413およびセシ
ョン引継時刻120に書き込み、セション引継履歴11
8をセション引き継ぎ済みとする。前回書き込んだレコ
ードがファイルの最終レコードであれば、先頭に同様に
書き込む。 (待機セションの開設)オンラインサービスシステム2
10では、起動時に引継ファイル監視手段215で開始
された周期にて、セション開設状態読み取り手段212
によってセション状態引継ファイル400を読む。読み
込みレコードのレコード世代413が新しくなっている
レコードは、引き継ぎ対象の情報であると認識し、次々
に読む。レコード世代413が過去に戻っている場合に
は、そのレコードはまだオンラインサービスシステム1
10にて記録されていないものであるとみなす。なお、
オンラインサービスシステム210起動時の最初の読み
込みにおけるレコード世代413の判断時刻は、オンラ
インサービスシステム110起動時の起動宣言通知に含
まれるので、これを参照する。The session opening means 113 acquires a session attribute on the network definition of the operating host computer 100 when the communication control means 102 accepts the session opening, and records it in the session attribute 117. Further, the session takeover history 118 is confirmed, and if the contents are cleared, the session establishment record request is issued to the session establishment state recording means 112 by specifying the terminal state table 115. If the session takeover history 118 has been taken over, no action is taken. Session opening status recording means 112
Receives the session opening record request, sets the terminal name 116 and the session attribute 117 of the specified terminal status table 115, and sets the terminal name 411 and the session attribute 412 after the previously written record of the session status takeover file 400. Then, the session status record 410 is written. Further, the current time is written in the record generation 413 and the session takeover time 120, and the session takeover history 11
Assume that session 8 has been taken over. If the record written last time is the last record of the file, write the same at the beginning. (Opening a waiting session) Online service system 2
10, the session opening status reading unit 212 is executed at the cycle started by the takeover file monitoring unit 215 at the time of startup.
To read the session state takeover file 400. Records whose read record 413 has a new record generation 413 are recognized as information to be taken over and are read one after another. If the record generation 413 has returned to the past, the record is still in the online service system 1
At 10 it is assumed that it is not recorded. In addition,
The determination time of the record generation 413 in the first reading at the time of starting the online service system 210 is included in the start declaration notification at the time of starting the online service system 110, and is referred to.
【0022】引継ファイル監視手段215では読み取っ
たセション状態レコード410の端末名411から、該
当する端末状態テーブル216を検索しセション属性4
12をセション属性218に記録し、セション開設手段
213にセション開設指示を発行する。セション開設手
段213は通信制御手段202にセション開設指示を発
行すると、通信制御手段202は待機セション600を
共有通信制御装置300に開設要求する。セション開設
手段213は、通信制御手段202のセション開設受諾
時に、待機ホストコンピュータ200のオンライン定義
上のセション属性を取得することができる。ただし、こ
のセション属性は実際の端末セション700を制御する
ものと必ずしも一致しているものとは限らないため、待
機セションチェック手段214にて属性チェックを行
う。待機セションチェック手段214は取得したセショ
ン属性と、引き継ぎ情報読取時にセション属性218に
記録された内容とを比較する。もし等しくなければ、待
機セション600の開設は却下する。 (セション障害時の動作)共有通信制御装置300が障
害となった場合、通信制御手段102の障害通知がオン
ラインサービスシステム110に通知される。障害通知
をセション再接続手段114が受けると、該当セション
の端末状態テーブル115を検索し、セション引継履歴
118をクリアし、障害記録119に障害後と記入す
る。当該端末が障害時の自動復旧対象である場合、セシ
ョン引継時刻120を参照して現時刻が引継ファイル監
視手段215が監視する周期よりも十分多く経過してい
るかどうかを判断する。もし十分な時間が経過していれ
ば、セション開設手段113にセション開設要求を発行
し、上記のセション開設処理を試みる。そうでない場合
は、当該端末についてはその時間だけ処理を待ち合わせ
た後、本処理を再実行する。待機セション600が開設
されている場合、通信制御手段202の障害通知がオン
ラインサービスシステム210に通知されるが、オンラ
インサービスシステム210ではセションが単に切断さ
れただけとする。 (待機セションの役割)起動制御手段111が稼働シス
ムテ宣言を通信制御手段102に対して行うと、オンラ
インサービスシステム110から端末装置800に対す
るセション開設要求を通信制御手段102に発行すると
き、通信制御手段102は共有通信制御装置300に対
して稼働セション500を開設する。共有通信制御装置
300では端末装置800に対して端末セション700
を開設し、オンラインサービスシステム110は端末装
置800と電文送受信が実現できるようになる。The succeeding file monitoring means 215 searches the corresponding terminal status table 216 from the terminal name 411 of the read session status record 410 and retrieves the session attribute 4
12 is recorded in the session attribute 218, and a session opening instruction is issued to the session opening means 213. When the session opening means 213 issues a session opening instruction to the communication control means 202, the communication control means 202 requests the shared communication control device 300 to open the standby session 600. The session opening means 213 can acquire a session attribute in the online definition of the standby host computer 200 when the communication control means 202 accepts the session opening. However, since this session attribute does not always coincide with the one that actually controls the terminal session 700, the standby session check unit 214 checks the attribute. The standby session check unit 214 compares the acquired session attribute with the content recorded in the session attribute 218 when the handover information is read. If not, the establishment of the waiting session 600 is rejected. (Operation at the Time of Session Failure) When the shared communication control device 300 fails, a notification of a failure of the communication control means 102 is sent to the online service system 110. When the session reconnection means 114 receives the failure notification, the terminal status table 115 of the relevant session is searched, the session takeover history 118 is cleared, and the failure record 119 is written as "after failure". If the terminal is a target for automatic recovery in the event of a failure, it is determined with reference to the session takeover time 120 whether or not the current time has passed sufficiently longer than the period monitored by the takeover file monitoring means 215. If a sufficient time has elapsed, a session opening request is issued to the session opening means 113, and the above-described session opening processing is attempted. Otherwise, the terminal waits for the process for that time, and then executes the process again. When the standby session 600 has been opened, a notification of a failure of the communication control unit 202 is sent to the online service system 210. In the online service system 210, it is assumed that the session is simply disconnected. (Role of a standby session) When the activation control unit 111 issues an operation system declaration to the communication control unit 102, when the online service system 110 issues a session opening request to the terminal device 800 to the communication control unit 102, the communication control unit 102 establishes an operation session 500 with the shared communication control device 300. In the shared communication control device 300, a terminal session 700
Is established, and the online service system 110 can realize transmission and reception of a message with the terminal device 800.
【0023】一方、稼働システム宣言を受けていない通
信制御手段202では、オンラインサービスシステム2
10から端末装置800に対するセション開設要求を通
信制御手段202に発行するとき、通信制御手段202
は共有通信制御装置300に対して待機セション600
を開設する。共有通信制御装置300ではこれをうける
と、待機セション開設手段301においてセションは制
御維持される。待機セション開設手段301では、稼働
セション500が開設されているかどうかに拘らず、待
機セション600を制御する。On the other hand, in the communication control means 202 which has not received the operation system declaration, the online service system 2
10 issues a session opening request to the terminal device 800 to the communication control means 202, the communication control means 202
Represents a standby session 600 for the shared communication control device 300.
Is established. When the shared communication control device 300 receives this, the session is controlled and maintained by the standby session opening means 301. The standby session opening means 301 controls the standby session 600 irrespective of whether the operation session 500 has been opened.
【0024】共有通信制御装置300は稼働ホストコン
ピュータ100を監視しており、これによってシスムテ
停止が検出される場合、もしくは障害検出装置204に
よる稼働ホストコンピュータ100の障害停止検出によ
るオンラインサービスシステム210からの稼働ホスト
コンピュータ100の停止通知を受けた場合、待機セシ
ョン開設手段301は稼働セション500ならびに待機
セション600の開設されていた端末装置800につい
てのみ、セション保持手段302においてセションを保
持する。稼働セション500のない待機セション600
は通信制御手段202に対して待機セション600の障
害切断を、また、待機セション600のない稼働セショ
ン500は端末装置800に対して端末セション700
の障害切断を、それぞれ実施する。The shared communication control device 300 monitors the operating host computer 100. When the system communication stoppage is detected by this, or when the failure detection device 204 detects the failure stop of the operating host computer 100, the shared communication control device 300 When receiving the stop notification of the active host computer 100, the standby session opening unit 301 holds the session in the session holding unit 302 only for the terminal device 800 in which the active session 500 and the standby session 600 have been opened. Standby session 600 without running session 500
Indicates that the communication control means 202 has disconnected the failure of the standby session 600, and that the operation session 500 without the standby session 600 has transmitted the terminal session 700 to the terminal device 800.
The fault disconnection of each is performed.
【0025】障害検出装置204による稼働ホストコン
ピュータ100の障害停止の検出を切り替え制御手段2
11が行うと、上記システム停止検出を通知したあと、
切り替え制御手段211はオンラインサービスシステム
210が実行中であったオンライントランザクションサ
ービスの引継処理を実行する。この引継処理が終了した
時点において、オンラインサービスシステム210は稼
働システムとしてサービスを再開すべく、切り替え制御
手段211が稼働システム宣言を通信制御手段202に
通知する。通信制御手段202は稼働システム宣言を受
けると、共有通信制御装置300との間で端末セション
700の通信状態の引き継ぎを実施する。セション保持
手段302では待機セション600を稼働セションとし
てみなし、以降待機ホストコンピュータ200は端末セ
ション700を介して送受信できるようにする。Switching control means 2 for detecting the failure stop of operating host computer 100 by failure detection device 204
11 performs, after notifying the above-mentioned system stop detection,
The switching control unit 211 executes a takeover process of the online transaction service that the online service system 210 was executing. When this handover process is completed, the switching control unit 211 notifies the communication control unit 202 of the operating system declaration so that the online service system 210 resumes the service as the operating system. When receiving the operating system declaration, the communication control unit 202 takes over the communication state of the terminal session 700 with the shared communication control device 300. The session holding means 302 regards the standby session 600 as an active session, and thereafter allows the standby host computer 200 to transmit and receive via the terminal session 700.
【0026】[0026]
【発明の効果】以上説明したように本発明では、複合コ
ンピュータシステムにおいて稼働システム障害停止時の
系切り替え時に、サービスしていた端末のセションを切
断、再接続することなく継続できるため、端末数に依存
しない速やかな系切り替えが実現できる。また、端末の
接続、切断が何度おこなわれても、共有通信制御装置が
障害とならないかぎり、セション状態引き継ぎファイル
には記録されない。このため、有限のセション状態引き
継ぎファイルであっても、端末数分のレコードがあれ
ば、端末状態の引き継ぎを確実に実行できる。更に、共
有通信制御装置の障害時には、待機セションも切断され
るため、セション引き継ぎ記録をしなくてはならない
が、障害復旧後のセション再開設は、待機システムの監
視周期時間以上待った後で書き込むため、端末状態の引
き継ぎは確実に実現される。As described above, according to the present invention, in a multicomputer system, at the time of system switchover when an operating system fails, a session of a serviced terminal can be continued without disconnecting and reconnecting. Quick system switching that does not depend can be realized. Also, no matter how many times the terminal is connected or disconnected, it is not recorded in the session state takeover file unless the shared communication control device causes a failure. For this reason, even if the file is a finite session state takeover file, the terminal state can be taken over reliably if there are records for the number of terminals. Further, when a failure occurs in the shared communication control device, the standby session is also disconnected, so the session takeover record must be recorded.However, the session re-establishment after recovery from the failure is performed after the standby system has been monitored for at least the monitoring cycle time. In addition, the handover of the terminal state is reliably realized.
【図面の簡単な説明】[Brief description of the drawings]
【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.
100 稼働ホストコンピュータ 101 系間通信手段 102 通信制御手段 103 系間通信装置 110 オンラインサービスシステム 111 起動制御手段 112 セション開設状態記録手段 113 セション開設手段 114 セション再接続手段 115 端末状態テーブル 200 待機ホストコンピュータ 201 系間通信手段 202 通信制御手段 203 系間通信装置 204 障害検出装置 210 オンラインサービスシステム 211 切り替え制御手段 212 セション開設状態読み取り手段 213 セション開設手段 214 待機セションチェック手段 215 引き継ぎファイル監視手段 216 端末状態テーブル 300 稼働/待機共有通信制御装置 301 待機セション開設手段 302 セション保持手段 400 セション状態引き継ぎファイル 800 端末装置 REFERENCE SIGNS LIST 100 operating host computer 101 inter-system communication means 102 communication control means 103 inter-system communication device 110 online service system 111 activation control means 112 session opening status recording means 113 session opening means 114 session reconnecting means 115 terminal status table 200 standby host computer 201 Inter-system communication means 202 Communication control means 203 Inter-system communication apparatus 204 Fault detection apparatus 210 Online service system 211 Switching control means 212 Session opening status reading means 213 Session opening means 214 Standby session checking means 215 Handover file monitoring means 216 Terminal status table 300 Operation / standby shared communication control device 301 standby session opening means 302 session holding means 400 session state takeover file Le 800 terminal devices
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 15/00 320 G06F 11/20 310 G06F 15/16 470──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 6 , DB name) G06F 15/00 320 G06F 11/20 310 G06F 15/16 470
Claims (7)
装置構成ならびにソフトウェア構成をとった待機システ
ムを予めオンラインサービスが即実行可能な状態で待機
させ、前記稼働コンピュータシステムがオンラインサー
ビスを提供しているときに該コンピュータシステムに障
害が生じた場合、前記待機システムでの運用に切り替え
るようにした複合コンピュータシステムにおいて、前記
稼働コンピュータシステムと待機システムから同一端末
の接続を同時に開設する待機セション開設手段及び前記
稼働コンピュータシステムの障害時にセションを切断す
ることなく待機システムが運用を開始したときにセショ
ンを再開させるセション保持手段を有する稼働/待機共
有通信制御装置を備え、前記稼働コンピュータシステム
でセション開設時に、待機システムで同一端末に対する
セションを開設することで、前記共有通信制御装置にお
いて待機セションを生成し、稼働コンピュータシステム
障害時に待機システムにおいて系切り替えが生じたこと
を前記共有通信制御装置に通知することで、保持されて
いたセションを再開させることによって、障害時にセシ
ョンの切断、再接続を実行することなく高速の系切り替
えを実現することを特徴とする複合コンピュータシステ
ム。1. A standby system having the same device configuration and software configuration as an operating computer system is made to stand by in advance in a state where an online service can be immediately executed, and when the operating computer system provides an online service. In a composite computer system configured to switch to operation in the standby system when a failure occurs in the computer system, standby session opening means for simultaneously opening the same terminal from the active computer system and the standby system, and the active computer An operation / standby shared communication control device having a session holding means for restarting a session when the standby system starts operation without disconnecting the session in the event of a system failure; Opening a session for the same terminal in the standby system, generating a standby session in the shared communication control device, and notifying the shared communication control device that system switching has occurred in the standby system when an operating computer system fails. And restarting the held session to realize high-speed system switching without executing disconnection and reconnection of the session when a failure occurs.
は、システム起動時の制御を行う起動制御手段と、端末
とのセションを開設するセション開設手段と、セション
開設の情報をセション状態引継ファイルに記録するため
のセション開設状態記録手段とを含むオンラインサービ
スシステムを有することを特徴とする請求項1の複合コ
ンピュータシステム。2. The operating computer system according to claim 1, wherein the starting control means for controlling the system at the time of starting, the session opening means for opening a session with the terminal, and the information of the opening of the session are recorded in the session state transfer file. 2. The composite computer system according to claim 1, further comprising an online service system including a session opening status recording unit for storing the information.
ュータの障害停止を検出する障害検出手段の検出情報に
基づいて系の切り替えを制御する切り替え制御手段と、
端末とのセションを開設するセション開設手段と、セシ
ョン状態引継ファイルの内容を読み取るセション開設状
態読み取り手段と、稼働コンピュータシステムのセショ
ン開設を監視するための引継ファイル監視手段とを含む
オンラインサービスシステムを有することを特徴とする
請求項1の複合コンピュータシステム。3. The standby system according to claim 1, wherein the switching control unit controls switching of a system based on detection information of a failure detection unit that detects a failure stop of the active computer;
An online service system including session opening means for opening a session with the terminal, session opening status reading means for reading the contents of the session status handover file, and handover file monitoring means for monitoring the session opening of the active computer system; 2. The composite computer system according to claim 1, wherein:
ルは、稼動セションのセション属性を記録することので
きる属性フィールドを含み、セション開設状態記録手段
は、上記セション属性フィールドに稼動セションのセシ
ョン属性を記録するセション属性記録手段を含むことを
特徴とする請求項2の複合コンピュータシステム。4. The session takeover status file according to claim 2, wherein the session attribute of the active session is recorded.
Including session attribute field, session opening status recording means
Is the active session's session in the session attribute field above.
3. The composite computer system according to claim 2, further comprising session attribute recording means for recording the session attribute .
段は、稼動セションのセション属性取得手段を含み、セ
ション開設手段は、セション開設時に待機セションのセ
ション属性と引き継いだ稼動コンピュータシステムの稼
動セション属性を比較し、双方が異なっていたときに待
機セションの開設を行わないようにチェックする待機セ
ションチェック手段を含むことを特徴とする請求項3の
複合コンピュータシステム。5. The session opening status reading means according to claim 3, wherein said session opening status reading means includes a session attribute obtaining means for an active session.
The method for opening a session is as follows:
Attribute and the operating computer system
Dynamic session attributes and wait if they are different.
Waiting session to check not to open a machine session
4. The composite computer system according to claim 3, further comprising an operation check unit .
でにセションを開設した情報をセション状態引き継ぎフ
ァイルに記録したかどうかを示すセション引き継ぎ履歴
情報を端末状態テーブルに記録することによって、セシ
ョン開設状態の変化量に左右されない状態引き継ぎを実
現することを特徴とする請求項2の複合コンピュータシ
ステム。6. The session opening means according to claim 2, wherein session inheritance history information indicating whether or not information on session establishment so far has been recorded in the session status inheritance file is recorded in the terminal status table, thereby establishing the session. 3. The composite computer system according to claim 2 , wherein state transition is realized irrespective of a state change amount.
は、共有通信制御装置の障害記録情報と最初のセション
接続事象の記録時刻を記録する引き継ぎ時刻情報とを記
録する端末状態テーブルと、障害後の再接続を前記最初
のセション接続事象の記録時刻から一定時間経ったあと
で行わせるセション再接続手段とを有することを特徴と
する請求項2の複合コンピュータシステム。7. The online service system according to claim 2, wherein the terminal status table for recording the failure record information of the shared communication control device and the takeover time information for recording the recording time of the first session connection event; 3. The multi-computer system according to claim 2, further comprising session reconnection means for performing connection after a lapse of a predetermined time from the recording time of the first session connection event.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3014986A JP2776442B2 (en) | 1991-01-16 | 1991-01-16 | Compound computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3014986A JP2776442B2 (en) | 1991-01-16 | 1991-01-16 | Compound computer system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04242467A JPH04242467A (en) | 1992-08-31 |
JP2776442B2 true JP2776442B2 (en) | 1998-07-16 |
Family
ID=11876277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3014986A Expired - Lifetime JP2776442B2 (en) | 1991-01-16 | 1991-01-16 | Compound computer system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2776442B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2545763B2 (en) * | 1993-08-24 | 1996-10-23 | 日本電気株式会社 | Restart method of batch processing in hot standby system |
JP5363505B2 (en) * | 2008-12-04 | 2013-12-11 | 株式会社ソニー・コンピュータエンタテインメント | Virtual space management system |
US8332499B2 (en) | 2008-12-04 | 2012-12-11 | Sony Computer Entertainment Inc. | Virtual space management system |
CN103309838B (en) * | 2012-03-16 | 2018-02-27 | 联想(北京)有限公司 | Switching method, terminal device and the multi-terminal equipment system of information collecting device |
-
1991
- 1991-01-16 JP JP3014986A patent/JP2776442B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH04242467A (en) | 1992-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5027269A (en) | Method and apparatus for providing continuous availability of applications in a computer network | |
US7694177B2 (en) | Method and system for resynchronizing data between a primary and mirror data storage system | |
KR100411978B1 (en) | Fault tolerant system and duplication method thereof | |
JPH03164837A (en) | Spare switching system for communication control processor | |
JPH086910A (en) | Cluster type computer system | |
CN105426213A (en) | Software update method and system | |
CN110109772B (en) | CPU restarting method, communication equipment and readable storage medium | |
JP2776442B2 (en) | Compound computer system | |
US6625753B1 (en) | Recovery facility for an SNA communication network | |
KR20030048503A (en) | Communication system and method for data synchronization of duplexing server | |
CN100372302C (en) | Remote disaster allowable system and method | |
JP2003006018A (en) | System, method for restoring processing request, client device and server device | |
JP2513127B2 (en) | Hot standby high-speed switching system | |
JPH06243059A (en) | Interruption/resumption system for film transfer | |
JP2002149439A (en) | Method for switching server and server device in distributed processing system | |
JPH1027159A (en) | Communication line recovering system and its method | |
JP2000148525A (en) | Method for reducing load of active system in service processor duplex system | |
JP4193754B2 (en) | Data duplication method and program | |
JPH04102152A (en) | Virtual line communication system | |
JP2000057095A (en) | Method and system for processing communication | |
JPH03111954A (en) | On-line system | |
CN118019034A (en) | Disaster recovery method, device and equipment for 5G core network | |
JP2000076158A (en) | Application downloading resume method and system therefor | |
JPS62159241A (en) | Back-up method for data processor | |
JPH11143848A (en) | Maintaining method of distribued information processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090501 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100501 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110501 Year of fee payment: 13 |