[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH1091467A - 多重系計算機およびそのバックアップ方法 - Google Patents

多重系計算機およびそのバックアップ方法

Info

Publication number
JPH1091467A
JPH1091467A JP8267882A JP26788296A JPH1091467A JP H1091467 A JPH1091467 A JP H1091467A JP 8267882 A JP8267882 A JP 8267882A JP 26788296 A JP26788296 A JP 26788296A JP H1091467 A JPH1091467 A JP H1091467A
Authority
JP
Japan
Prior art keywords
backup
computer
business
report message
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8267882A
Other languages
English (en)
Inventor
Tamotsu Kanazawa
保 金沢
Katsuo Suzuki
克男 鈴木
Hiroyuki Hori
裕之 保里
Masaru Tomobe
優 友部
Tetsuo Sato
哲夫 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Control Systems Inc
Original Assignee
Hitachi Ltd
Hitachi Process Computer Engineering Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Process Computer Engineering Inc filed Critical Hitachi Ltd
Priority to JP8267882A priority Critical patent/JPH1091467A/ja
Publication of JPH1091467A publication Critical patent/JPH1091467A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】 稼働率の低下を招くことなくバックアップを
行うことのできる多重系計算機を提供する。 【解決手段】 各計算機において実行する業務それぞれ
プライオリティを設定する。構成制御部113は当該計算
機上の各業務(あるいは、これを実行しているAP業務
部115)の状態を示すメッセージ104を、適宜、他の計算
機に送る。生存報告メッセージを受け取った計算機は、
当該メッセージ104の発信元である業務のバックアップ
が必要であるか否かを該メッセージ104の内容に基づい
て判定する。バックアップ必要な場合には、当該バック
アップが必要な業務のプライオリティと、自らの有する
AP業務115に割り当てられている業務のプライオリテ
ィとを比較する。バックアップが必要な業務の方がプラ
イオリティが高い場合には、自らのAP業務部115によ
ってバックアップを行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の計算機が伝
送路により相互結合された多重系計算機および該多重系
計算機における計算機業務のバックアップ方法に関す
る。
【0002】
【従来の技術】現代社会において必須の技術となった計
算機システムにおいては、単に処理速度の向上だけでな
く高い信頼性が求められている。そのため、計算機シス
テムを多重化することで万が一の場合における信頼性を
高めた多重系計算機システムがある。このような従来の
多重系計算機システムにおけるバックアップ方式を、図
12を用いて説明する。
【0003】多重系計算機システムは、複数の計算機を
伝送路により相互結合することで構成されている。各計
算機1001は、業務メッセージ入出力制御を行うフィ
ルタ1014を有している。業務処理プログラム101
5は、これらフィルタ1014を介して業務メッセージ
1004を伝送路1003へ出力している。また、伝送
路1003を通じて送られてきた業務メッセージ100
4は、フィルタ1014を介して業務処理プログラム1
015に入力される。
【0004】各計算機1001の動作状態には、マスタ
と、スレーブとがある。通常は、マスタとなっている計
算機(以下“マスタ系”と呼ぶ)と、スレーブとなって
いる計算機(以下“スレーブ系”と呼ぶ)とで同じ業務
処理プログラムを動作させておく。そして、マスタ系の
みが業務メッセージ1004を伝送路1003へ出力す
る。スレーブ系は、業務メッセージ1004を伝送路1
003へは出力しない。このような動作モードに応じた
メッセージ出力の実行/停止は、フィルタ1014によ
って実現される。つまり、上述したフィルタ1014
は、業務処理プログラム1015の生成したメッセージ
の廃棄/非廃棄を制御する機能を備えている。そして、
メッセージ廃棄の系(スレーブ系)では、伝送路100
3からのメッセージ入力を受け付けるが、出力は行わな
い。これに対しメッセージ非廃棄の系(マスタ系)では
伝送路1003からのメッセージ入力のみならず伝送路
1003への出力も行う。
【0005】各計算機1001における動作状態(マス
タ/スレーブ)の切換は、構成制御部1013によって
行われる。スレーブ系の構成制御部1013は、マスタ
系での障害の発生を検知した時、当該計算機1001内
のフィルタ1014をメッセージ廃棄から非廃棄に切り
替えることでバックアップを行う。一方、マスタ系の構
成制御部1013は、当該計算機内のフィルタ1014
をメッセージ非廃棄から廃棄に切り替える。なお、障害
発生の検出は、生存報告カウンタの受信停止を検出して
行うのが一般的である。
【0006】このような多重系計算機システムにおける
バックアップに関する技術については、例えば、特開平
1−124050号公報に記載されている。
【0007】
【発明が解決しようとする課題】上記従来技術では障害
発生系の稼働率およびバックアップ系の負荷率について
配慮されていなかった。例えば、一つの系で複数の異な
る業務を行っている場合を考える。この系においてたっ
た1つの業務でも障害が発生すると、その系は業務継続
不可と判定される。そして、障害の発生した業務のみな
らず正常に動いていた業務についてまでも、他系でバッ
クアップすることになる。その結果、障害発生系の稼働
率が低下するという問題があった。さらに、バックアッ
プ系の負荷の必要以上増大するという問題があった。
【0008】本発明は、障害発生系の稼働率向上および
バックアップ系の負荷増大の極小化、さらには、システ
ム全体としての信頼性の向上を図った、多重系計算機シ
ステムおよび多重系計算機システムにおけるバックアッ
プ方法を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は上記目的を達成
するためになされたものでその第1の態様としては、複
数の計算機を伝送路により相互結合して構成された多重
系計算機において、上記計算機は、それぞれ、あらかじ
め割り当てられた業務を実行する1または2以上の業務
実行部と、上記業務実行部のそれぞれに割り当てられて
いる上記業務の名称および優先度に関する情報を記憶し
た記憶手段と、上記業務実行部による上記業務の実行状
態を検出すると共に上記記憶手段に記憶されている情報
を参照することで、当該業務実行部の実行している業務
の名称と当該業務の優先度とその時当該業務に対しバッ
クアップを行うことが必要であるか否かの判定の基にな
る情報(以下“判定情報”という)とを含んだ生存報告
メッセージを各業務毎に生成し、該生存報告メッセージ
を他の計算機に対して送付する生存報告メッセージ生成
手段と、他の計算機から送られてくる上記生存報告メッ
セージを受信し、該受信した生存報告メッセージに含ま
れている上記判定情報に基づいて当該生存報告メッセー
ジの発信元である業務にはバックアップが必要であるか
否かを判定するバックアップ要否判定手段と、上記バッ
クアップ要否判定手段がバックアップが必要であると判
定した場合には、当該生存報告メッセージの発信元であ
る業務の優先度と自らの属する計算機の有している上記
業務実行部に割り当てられている業務の優先度とを比較
する優先度判定手段と、上記優先度判定手段による上記
比較の結果、当該生存報告メッセージの発信元である業
務の優先度の方が優先度が高かった場合には、自らの属
する計算機が有している上記業務実行部に当該生存報告
メッセージの発信元である業務のバックアップを行わせ
るバックアップ制御手段とを有するものであることを特
徴とする多重系計算機が提供される。
【0010】本発明の第2の態様としては、複数の計算
機を伝送路により相互結合して構成された多重系計算機
において、上記計算機は、それぞれ、あらかじめ割り当
てられた業務を実行する1または2以上の業務実行部
と、上記業務実行部のそれぞれに割り当てられている上
記業務の名称および優先度に関する情報を記憶した記憶
手段と、上記業務実行部による上記業務の実行状態を検
出するとともに上記記憶手段に記憶されている情報を参
照することで、当該業務実行部の実行している業務の名
称と当該業務の優先度とその時当該業務に対しバックア
ップを行うことが必要であるか否かの判定の基になる情
報(以下“判定情報”という)とを含んだ生存報告メッ
セージを各業務毎に生成し、該生存報告メッセージを他
の計算機に対して送付する生存報告メッセージ生成手段
と、他の計算機から送られてくる上記生存報告メッセー
ジを受信し、該受信した生存報告メッセージに含まれて
いる上記判定情報に基づいて当該生存報告メッセージの
発信元である業務にはバックアップが必要であるか否か
を判定するバックアップ要否判定手段と、上記バックア
ップ要否判定手段がバックアップが必要であると判定し
た場合には、当該生存報告メッセージの発信元である業
務の優先度と、自らの属する計算機の有している上記業
務実行部に割り当てられている業務の優先度とを比較す
る優先度判定手段と、上記優先度判定手段による上記比
較の結果、当該生存報告メッセージの発信元である業務
の優先度の方が優先度が高かった場合には、自らの属す
る計算機の有している上記業務実行部によって当該生存
報告メッセージの発信元である業務のバックアップを行
うことが可能であることを示すバックアップ候補宣言メ
ッセージを生成し、これを当該生存報告メッセージの発
信元である業務の存在する計算機に送信するバックアッ
プ候補宣言手段と、上記バックアップ候補宣言メッセー
ジを受信した場合には、当該バックアップ候補宣言メッ
セージを送信してきた計算機のうちのいずれにバックア
ップを行わせるかをあらかじめ定められた基準に基づい
て決定し、該決定した計算機に対してバックアップを指
示するバックアップ指示メッセージを出力するバックア
ップ指示手段と、上記バックアップ指示メッセージを受
信した場合には、自らの属する計算機の有している上記
業務実行部に該バックアップ指示メッセージの発信元で
ある業務のバックアップを行わせるバックアップ制御手
段とを有するものであることを特徴とする多重系計算機
が提供される。
【0011】本発明の第3の態様としては、複数の計算
機を伝送路により相互結合して構成された多重系計算機
において、上記計算機は、それぞれ、あらかじめ割り当
てられた業務を実行する1または2以上の業務実行部
と、上記業務実行部のそれぞれに割り当てられている上
記業務の名称,負荷の大きさおよび当該計算機の処理能
力に関する情報を記憶した記憶手段と、上記業務実行部
による上記業務の実行状態を検出するとともに上記記憶
手段に記憶されている情報を参照することで、当該業務
実行部の実行している業務の名称と当該業務の負荷の大
きさとその時当該業務に対しバックアップを行うことが
必要であるか否かの判定の基になる情報(以下“判定情
報”という)とを含んだ生存報告メッセージを各業務毎
に生成し、該生存報告メッセージを他の計算機に対して
送付する生存報告メッセージ生成手段と、他の計算機か
ら送られてくる上記生存報告メッセージを受信し、該受
信した生存報告メッセージに含まれている上記判定情報
に基づいて当該生存報告メッセージの発信元である業務
にはバックアップが必要であるか否かを判定するバック
アップ要否判定手段と、上記バックアップ要否判定手段
がバックアップが必要であると判定した場合には、当該
生存報告メッセージの発信元である業務の負荷の大きさ
と、自らの属する計算機の有している上記業務実行部に
割り当てられている業務の負荷の大きさとの合計を求め
る負荷算定手段と、上記負荷算定手段の求めた負荷の合
計値を当該計算機の処理能力と比較する負荷判定手段
と、上記負荷判定手段による上記比較の結果上記負荷算
定手段の求めた負荷の合計値が自らの属する計算機の処
理能力を超えていない場合には、自らの属する計算機の
有している上記業務実行部に当該生存報告メッセージの
発信元である業務のバックアップを行わせるバックアッ
プ制御手段とを有するものであることを特徴とする多重
系計算機が提供される。
【0012】本発明の第4の態様としては、複数の計算
機を伝送路により相互結合して構成された多重系計算機
において、上記計算機は、それぞれ、あらかじめ割り当
てられた業務を実行する1または2以上の業務実行部
と、上記業務実行部のそれぞれに割り当てられている上
記業務の名称、負荷の大きさおよび当該計算機の処理能
力に関する情報を記憶した記憶手段と、上記業務実行部
による上記業務の実行状態を検出するとともに上記記憶
手段に記憶されている情報を参照することで、当該業務
実行部の実行している業務の名称と当該業務の負荷の大
きさとその時当該業務に対しバックアップを行うことが
必要であるか否かの判定の基になる情報(以下“判定情
報”という)とを含んだ生存報告メッセージを各業務毎
に生成し、該生存報告メッセージを他の計算機に対して
送付する生存報告メッセージ生成手段と、他の計算機か
ら送られてくる上記生存報告メッセージを受信し、該受
信した生存報告メッセージに含まれている上記判定情報
に基づいて当該生存報告メッセージの発信元である業務
にはバックアップが必要であるか否かを判定するバック
アップ要否判定手段と、上記バックアップ要否判定手段
がバックアップが必要であると判定した場合には、当該
生存報告メッセージの発信元である業務の負荷の大きさ
と、当該計算機の有する上記業務実行部に割り当てられ
ている業務の負荷の大きさとの合計を求める負荷算定手
段と、上記負荷算定手段の求めた負荷の合計値を当該計
算機の処理能力と比較する負荷判定手段と、上記負荷判
定手段による上記比較の結果、上記負荷算定手段の求め
た負荷の合計値が当該計算機の処理能力を超えていない
場合には、自らの属する計算機の有している上記業務実
行部によって当該生存報告メッセージの発信元である業
務のバックアップを行うことが可能であることを示すバ
ックアップ候補宣言メッセージを生成し、これを当該生
存報告メッセージの発信元である業務の存在する計算機
に送信するバックアップ候補宣言手段と、上記バックア
ップ候補宣言メッセージを受信した場合には、当該バッ
クアップ候補宣言メッセージを送信してきた計算機のう
ちのいずれにバックアップを行わせるかをあらかじめ定
められた基準に基づいて決定し、該決定した計算機に対
してバックアップを指示するバックアップ指示メッセー
ジを出力するバックアップ指示手段と、上記バックアッ
プ指示メッセージを受信した場合には、自らの属する計
算機の有している上記業務実行部に当該バックアップ指
示メッセージの発信元である業務のバックアップを行わ
せるバックアップ制御手段とを有するものであること、
を特徴とする多重系計算機が提供される。
【0013】上述した第1、第2、第3、第4の態様に
おいて、上記判定情報は、上記生存報告メッセージが生
成される度毎にその値があらかじめ定められた量だけ変
更されてゆく生存カウンタ情報であり、上記バックアッ
プ要否判定手段は、前回当該業務を発信元とした生存報
告メッセージに含まれていた上記生存カウンタ情報の値
と、今回当該業務を発信元とした生存報告メッセージに
含まれていた上記生存カウンタ情報の値とを比較し、該
比較の結果、前回の値と今回の値とが一致している場合
には、上記バックアップが必要であると判定するもので
あってもよい。
【0014】上述した第2、第4の態様において、上記
記憶手段は、さらに、当該計算機の信頼性を示す信頼性
指標に関する情報を記憶したものであり、上記バックア
ップ候補宣言メッセージは、当該計算機の信頼性指標を
含んだものであり、上記バックアップ指示手段は、上記
バックアップ候補宣言メッセージを受信した場合には、
上記バックアップ候補宣言メッセージを送信してきた計
算機のうちのいずれにバックアップを行わせるかを、上
記バックアップ候補宣言メッセージに含まれている上記
信頼性指標に基づいて決定するものであってもよい。
【0015】作用を説明する。
【0016】まず第1の態様の作用を説明する。
【0017】生存報告メッセージ生成手段は、生存報告
メッセージを各業務毎に生成する。そして、その生存報
告メッセージを他の計算機に対して送付する。なお、生
存報告メッセージには、業務実行部の実行している業務
の名称と、当該業務の優先度と、判定情報とが含まれて
いる。
【0018】バックアップ要否判定手段は、他の計算機
から送られてくる生存報告メッセージを受信する。そし
て、その中に含まれている判定情報に基づいて、当該生
存報告メッセージの発信元である業務にはバックアップ
が必要であるか否かを判定する。
【0019】バックアップ要否判定手段がバックアップ
が必要であると判定した場合、優先度判定手段は、当該
生存報告メッセージの発信元である業務の優先度と自ら
の属する計算機の有している上記業務実行部に割り当て
られている業務の優先度とを比較する。当該生存報告メ
ッセージの発信元である業務の優先度の方が優先度が高
かった場合、バックアップ制御手段は、自らの属する計
算機が有している業務実行部に当該生存報告メッセージ
の発信元である業務のバックアップを行わせる。
【0020】本発明の第2の態様の作用を説明する。
【0021】生存報告メッセージ生成手段は、生存報告
メッセージを各業務毎に生成する。そして、その生存報
告メッセージを他の計算機に対して送付する。なお、生
存報告メッセージには、業務実行部の実行している業務
の名称と、当該業務の優先度と、判定情報とが含まれて
いる。
【0022】バックアップ要否判定手段は、他の計算機
から送られてくる生存報告メッセージを受信する。そし
て、その中に含まれている判定情報に基づいて、当該生
存報告メッセージの発信元である業務にはバックアップ
が必要であるか否かを判定する。
【0023】バックアップ要否判定手段がバックアップ
が必要であると判定した場合、優先度判定手段は、当該
生存報告メッセージの発信元である業務の優先度と自ら
の属する計算機の有している業務実行部に割り当てられ
ている業務の優先度とを比較する。該比較の結果当該生
存報告メッセージの発信元である業務の優先度の方が優
先度が高かった場合、バックアップ候補宣言手段は、自
らの属する計算機の有している業務実行部によってバッ
クアップを行うことが可能であることを示すバックアッ
プ候補宣言メッセージを生成する。そして、これを当該
生存報告メッセージの発信元である業務の存在する計算
機に送信する。
【0024】バックアップ候補宣言メッセージを受信し
た場合には、バックアップ指示手段は、バックアップ候
補宣言メッセージを送信してきた計算機のうちのいずれ
にバックアップを行わせるかをあらかじめ定められた基
準に基づいて決定する。例えば、バックアップ候補宣言
メッセージに当該計算機の信頼性指標を含めておき、こ
の信頼性指標に基づいて、いずれにバックアップを行わ
せるかを決定することが考えられる。バックアップ指示
手段は、このようにして決定した計算機に対してバック
アップを指示するバックアップ指示メッセージを出力す
る。
【0025】バックアップ指示メッセージを受信した場
合、バックアップ制御手段は、自らの属する計算機の有
している業務実行部にバックアップを行わせる。
【0026】本発明の第3の態様の作用を説明する。
【0027】生存報告メッセージ生成手段は、生存報告
メッセージを各業務毎に生成する。そして、その生存報
告メッセージを他の計算機に対して送付する。なお、生
存報告メッセージには、業務実行部の実行している業務
の名称と当該業務の負荷の大きさと判定情報とが含まれ
ている。バックアップ要否判定手段は、他の計算機から
送られてくる生存報告メッセージを受信する。そして、
これに含まれている判定情報に基づいて当該生存報告メ
ッセージの発信元である業務にはバックアップが必要で
あるか否かを判定するバックアップ要否判定手段がバッ
クアップが必要であると判定した場合には、負荷算定手
段は、当該生存報告メッセージの発信元である業務の負
荷の大きさと、自らの属する計算機の有している上記業
務実行部に割り当てられている業務の負荷の大きさとの
合計を求める。負荷判定手段は、負荷算定手段の求めた
負荷の合計値を当該計算機の処理能力と比較する。その
結果、負荷の合計値が自らの属する計算機の処理能力を
超えていない場合、バックアップ制御手段は、当該計算
機の有する業務実行部にバックアップを行わせる。
【0028】本発明の第4の態様の作用を説明する。
【0029】生存報告メッセージ生成手段は、生存報告
メッセージを各業務毎に生成する。そして、その生存報
告メッセージを他の計算機に対して送付する。なお、生
存報告メッセージには、業務実行部の実行している業務
の名称と当該業務の負荷の大きさと判定情報とが含まれ
ている。バックアップ要否判定手段は、他の計算機から
送られてくる生存報告メッセージを受信する。そして、
これに含まれている判定情報に基づいて当該生存報告メ
ッセージの発信元である業務にはバックアップが必要で
あるか否かを判定するバックアップ要否判定手段がバッ
クアップが必要であると判定した場合には、負荷算定手
段は、当該生存報告メッセージの発信元である業務の負
荷の大きさと、自らの属する計算機の有している上記業
務実行部に割り当てられている業務の負荷の大きさとの
合計を求める。負荷判定手段は、負荷算定手段の求めた
負荷の合計値を当該計算機の処理能力と比較する。
【0030】負荷の合計値が当該計算機の処理能力を超
えていない場合、バックアップ候補宣言手段は、自らの
属する計算機の有している上記業務実行部によって当該
生存報告メッセージの発信元である業務のバックアップ
を行うことが可能であることを示すバックアップ候補宣
言メッセージを生成する。そして、これを当該生存報告
メッセージの発信元である業務の存在する計算機に送信
する。
【0031】バックアップ候補宣言メッセージを受信し
た場合、バックアップ指示手段は、バックアップ候補宣
言メッセージを送信してきた計算機のうちのいずれにバ
ックアップを行わせるかをあらかじめ定められた基準に
基づいて決定する。例えば、バックアップ候補宣言メッ
セージに当該計算機の信頼性指標を含めておき、この信
頼性指標に基づいて、いずれにバックアップを行わせる
かを決定することが考えられる。バックアップ指示手段
は、このようにして決定した計算機に対してバックアッ
プを指示するバックアップ指示メッセージを出力する。
【0032】バックアップ指示メッセージを受信した場
合、バックアップ制御手段は、バックアップ指示メッセ
ージの発信元である業務のバックアップを当該計算機の
有する業務実行部に行わせる。
【0033】
【発明の実施の形態】以下に本発明の一実施形態を図面
を用いて説明する。
【0034】図1は本発明による分散システムにおける
バックアップ方式の一実施形態を示すシステム構成図で
ある。
【0035】本実施形態の多重系計算機システムは、図
1に示すとおり、複数の計算機101を伝送路103に
より相互結合することで構成されている。
【0036】各計算機101内には、メッセージ104
を送信する送信処理部111、メッセージを受信する受
信処理部112、これらを制御する構成制御部113を
備えている。さらに、所定の業務を実行するための1ま
たは2以上のAP業務部115を備えている。本実施形
態は、このAP業務部115単位でバックアップを行う
ことを特徴としている。
【0037】構成制御部113は、AP業務部115の
生死監視及びバックアップ要否の判断等を行うものであ
る。該構成制御部113は、該監視結果等の情報を含ん
だメッセージ104を、送信処理部111および受信処
理部112を通じて他の計算機と授受するようになって
いる。該メッセージ104には、生存報告メッセージ3
01(図2参照)、バックアップ候補宣言メッセージ3
11(図3参照)、バックアップ指示メッセージ321
(図4参照)がある。これらメッセージの詳細について
は後ほど述べる。該構成制御部113は、他の計算機か
ら送られてきた各種メッセージの内容を保存するための
ノード生死監視テーブル(図5参照)を備えている。該
構成制御部113は、このノード監視テーブルの内容を
適宜参照することで、他の計算機の状態を確認できるよ
うになっている。
【0038】AP業務部115は、所定の業務を実行す
るものである。個々のAP業務部115の具体的構成
は、実現する業務内容に応じてそれぞれ異なる。また、
各計算機に備えるAP業務部115の個数は特に限定さ
れない。AP業務部115によって実行される業務に
は、その属性として、業務名称、プライオリティ、バッ
クアップの要否、業務負荷があらかじめ(あるいは、そ
の都度)定められている。これらの属性は、上述した各
種メッセージ301,311,321の内容に反映され
る。各属性の意味については、後ほど述べるメッセージ
の説明の際に行うこととする。
【0039】本実施形態の装置は、所定のプログラムを
格納されたメモリ、該プログラムを実行するプロセッサ
等から構成されている。上述した各部は、プロセッサ
(CPU)が所定のプログラムを実行することで実現さ
れている。
【0040】次に、上述した各種メッセージの詳細を説
明する。
【0041】生存報告メッセージ301とは、該生存報
告メッセージ301の送信元である業務の状態を、他の
計算機に対して知らせるためのものである。該生存広告
メッセージ301は、構成制御部113によって各業務
ごとに一定周期で作成され、ブロードキャスト方式で、
一斉に他のすべての計算機に対して送付されるようにな
っている。生存報告メッセージ301は、具体的には図
2に示すとおり、当該メッセージの内容(ここでは生存
報告メッセージであること)を示すコード302と、メ
ッセージ発信元計算機のアドレス303と、生存カウン
タ304と、業務名称305と、プライオリティ306
と、バックアップ要否フラグ307と、業務負荷308
とからなる。
【0042】生存カウンタ304とは、該生存報告メッ
セージ301を受け取った計算機の構成制御部113
が、該生存報告メッセージ301の発信元(計算機)が
正常に作動しているか否かを判定するための情報であ
る。該生存カウンタ304の値は、生存報告メッセージ
301を送信する度毎に所定数づつインクリメントされ
てゆく。例えば、前回送信した生存報告メッセージ30
1に含まれている生存カウンタ304の値が4であれ
ば、次回送信する生存報告メッセージ301に含まれる
生存カウンタ304の値は5にされる。生存報告メッセ
ージ301を受け取った構成制御部113は、該生存カ
ウンタ304の連続性が保たれているか否か(つまり、
前回の生存カウンタ304の値から所定数だけ増えてい
るか否か)を判定することで、当該生存報告メッセージ
の発信元が正常に作動しているか否かを判定できるよう
になっている。
【0043】業務名称305とは、該生存報告メッセー
ジ301の送信元である業務を識別するためのものであ
り、各計算機内においてユニークな名称が設定されてい
る。
【0044】プライオリティ306とは、該生存報告メ
ッセージ301の送信元である業務の優先度を示すもの
である。本実施形態では、プライオリティの高い業務を
実行しているAP業務部115115に障害が発生した
場合には、プライオリティの低い業務を実行しているA
P業務部115によってバックアップを行うようになっ
ている。この場合、プライオリティの低い業務の実行は
停止されることになる。
【0045】バックアップ要否フラグ307とは、該生
存報告メッセージ301の送信元である業務が、バック
アップの必要な状態に陥ったことを他の計算機に示すた
めのフラグである。AP業務部115に発生する障害に
は様々な種類がある。例えば、当該AP業務部115自
身が障害の発生を検知してバックアップを他の計算機に
依頼できる場合もあれば、当該AP業務部自身では障害
の発生を検知できず、従って、他の計算機に対してバッ
クアップを依頼できない場合もある。このバックアップ
要否フラグ307は、AP業務部自身が当該AP業務自
身に障害が発生したことを検知した場合に、自分が行っ
ていた業務のバックアップを他の計算機に対して要求す
る際に用いられる。該バックアップ要否フラグ307
は、通常(正常に作動している場合)、バックアップが
不要であることを示す“バックアップ否”とされてい
る。しかし、何らかの障害が発生した場合等には、該バ
ックアップ要否フラグ307は、バックアップが必要な
ことを示す“バックアップ要”とされる。
【0046】業務負荷308は、該生存報告メッセージ
301の送信元である業務を実行するために、CPUに
加わる負荷の大きさを示す値である。該業務負荷308
の値は、あらかじめ業務の種類毎に設定されている。
【0047】バックアップ候補宣言メッセージ311と
は、他のAP業務部115がバックアップが必要な状況
に陥った場合、該バックアップ候補宣言メッセージ31
1の発信元である計算機のAP業務部115がバックア
ップを行うことができる旨を、当該バックアップの必要
な計算機に対して知らせるためのメッセージである。バ
ックアップ候補宣言メッセージ311は、具体的には図
3に示すとおり、メッセージ内容(メッセージの種類)
を示すコード312と、メッセージ発信元計算機のアド
レス313と、業務名称314と、プライオリティ31
5と、CPU負荷316とからなる。
【0048】プライオリティ315は、該バックアップ
候補宣言メッセージ311の送信元となる業務のプライ
オリティの値である。
【0049】CPU負荷316とは、該バックアップ候
補宣言メッセージ311の送信元となる計算機のAP業
務部がバックアップを行った場合における、当該計算機
のCPU負荷の値である。
【0050】バックアップを行うことの可能な計算機が
複数あった場合(つまり、バックアップ候補宣言メッセ
ージ311を複数の計算機から受け取った場合)には、
バックアップを実際に行わせる計算機を一つだけ選択し
た上で、当該選択した計算機に対してバックアップを依
頼する必要がある。また、保守点検などの際には、バッ
クアップを行わせるAP業務部を指定した上で、バック
アップを依頼する必要がある。このようにある特定のA
P業務部に対してバックアップを依頼する場合に使用さ
れるのが、バックアップ指示メッセージ321である。
バックアップ指示メッセージ321は、具体的には図4
に示すとおり、メッセージ内容(メッセージの種類)を
示すコード322と、メッセージ発信元計算機のアドレ
ス323と、業務名称324と、バックアップ指示32
5からなる。該バックアップ指示メッセージ321は、
他のメッセージとは異なり、バックアップの依頼先とな
る計算機にのみ送られる。
【0051】次に、ノード生死状態監視テーブル401
について説明する。
【0052】ノード生死状態監視テーブル401は、図
5に示すとおり、自計算機以外のすべての計算機の状
態,属性を記載した計算機管理テーブル401と、自計
算機に関する情報を記載した自計算機管理テーブル40
3とからなる。このノード生死監視テーブルは、すべて
の計算機がそれぞれ備えている。
【0053】計算機管理テーブル401は、この後述べ
る業務管理テーブル402を、当該システム上に存在す
るすべての計算機についてまとめたものである。業務管
理テーブル402には、当該計算機上に存在するAP業
務部が実行している業務のすべてについて、それぞれの
業務の状態を示す情報,属性(当該業務の生死状態43
1、生存カウンタ432、業務名称433、プライオリ
ティ434、生存カウンタ前回値435、バックアップ
要否436、バックアップ指示437、業務負荷43
8)が記載される。
【0054】生死状態フラグ431は、当該業務を実行
しているAP業務部115の生(正常)/死(異常)状
態を示すフラグである。該生死状態フラグ431は、構
成制御部113によって確認された生死状態に応じて構
成制御部113によって書き換えられるようになってい
る。
【0055】生存カウンタ432には、最後に受け取っ
た生存報告メッセージ301に含まれている生存カウン
タ304の値が格納される。該生存カウンタ432は、
当該生存報告メッセージ301を発進したAP業務部1
15に異常が発生したか否かを判定するのに用いられ
る。
【0056】業務名称433には、当該業務の名称が格
納される。該業務名称は、生存報告メッセージ301に
含まれている業務名称305から獲得される。
【0057】プライオリティ434には、生存報告メッ
セージ301に含まれているプライオリティ306の値
が格納される。
【0058】生存カウンタ前回値435は、生存カウン
タ432が更新される度毎に、それまで生存カウンタ4
32に格納されていた値(すなわち、前回受け取った生
存報告メッセージ301に含まれていた生存カウンタ3
04の値)が格納される。
【0059】バックアップ要否436には、生存報告メ
ッセージ301に含まれているバックアップ要否フラグ
307の値が格納される。
【0060】バックアップ指示437とは、当該業務を
実行しているAP業務部115を発信元としたバックア
ップ指示メッセージ321を受信したか否かを示す情報
が格納される。
【0061】業務負荷438とは、生存報告メッセージ
301に含まれている業務負荷308の値が格納され
る。
【0062】自計算機管理テーブル403は、自業務定
義テーブル405と、自CPU全体負荷404と、CP
U能力値406とからなる。自業務定義テーブル405
には、自計算機上において実行されているすべての業務
について、それぞれのプライオリティ461および業務
負荷462が記載されている。自CPU全体負荷404
とは、当該計算機上においてその時実行されている業務
それぞれの負荷の合計値である。CPU能力値406
は、当該計算機のCPUの最大能力(100%)を示す
値である。
【0063】各計算機、AP業務115への名称、プラ
イオリティ設定の一例を図6に示した。
【0064】伝送路201に結合されている計算機20
2には、システム全体でユニークとなる計算機名称Cn
(但し、nは任意)を付与されている。また、AP業務
203には、当該計算機内においてユニークな業務名称
Gn(但し、nは任意)を付与されている。プライオリテ
ィ204(括弧内の数字)としては、システム全体でユ
ニークな値を付与されている。
【0065】特許請求の範囲において言う“優先度”と
は、本実施形態におけるプライオリティに相当する。
“判定情報”とは、バックアップ要否フラグ、生存カウ
ンタに相当する。“バックアップ要求情報”とは、バッ
クアップ要否フラグに相当する。“業務実行部”とは、
AP業務部に相当する。“生存報告メッセージ生成手
段”、“バックアップ要否判定手段”、“優先度判定手
段”、“バックアップ制御手段”、“バックアップ候補
宣言手段”、“バックアップ指示手段”、“負荷算定手
段”、“負荷判定手段”は、構成制御部113、送信処
理部111、受信処理部112によって実現されてい
る。
【0066】次に、バックアップおよびこれに関連する
処理動作を説明する。
【0067】まず、生存報告メッセージの送信処理につ
いて図7を用いて説明する。
【0068】ここでは当初、AP業務部115は正常に
作動しているものとする。
【0069】構成制御113は、生存報告メッセージ3
01を作成し、これを生存送信部111を介して伝送路
103へ送り出す(ステップ501)。該生存報告メッ
セージ301の送信は、ブロードキャスト方式ですべて
の他の計算機に送られる。ここでは、当初、AP業務部
115は正常に作動しているものと仮定している。従っ
て、この場合に送信されている生存報告メッセージ31
1のバックアップ要否フラグ307は、バックアップが
不要であることを示す“バックアップ否”とされてい
る。
【0070】この後、構成制御部113は一定時間スリ
ープ状態となる(ステップ502)。続いて、構成制御
部113は、スリープ状態となっていた間に業務停止指
示があったか否かを判定する(ステップ503)。該判
定の結果、業務停止指示がなければ、ステップ501に
戻り同様の処理を繰り返す。一方、業務停止指示があっ
た場合には、ステップ504に進む。
【0071】ステップ504において、構成制御部11
3はバックアップ要否フラグ307を“バックアップ
要”にした生存報告メッセージ301を作成し、これを
他の計算機にブロードキャスト方式で送信する。
【0072】この後は、該生存報告メッセージ301に
対する返答、すなわち、バックアップ候補宣言メッセー
ジ311が送られてくるのを待って、構成制御部113
は、一定時間、待機状態となる(ステップ505,50
6)。該待機中、バックアップ候補宣言メッセージ31
1を受信した場合には、これを受け付けてメモリの所定
の領域に登録する。
【0073】一定時間待機を続けた後、構成制御部11
3は、登録結果を確認することで、該待機中にバックア
ップ候補宣言メッセージ311を受信したか否か、すな
わち、バックアップを行うことのできるAP業務部を有
する計算機があったか否かを判定する(ステップ50
7)。判定の結果、バックアップを行うことのできる計
算機が存在した場合には、ステップ508へ進み、当該
計算機へバックアップを依頼するべくバックアップ指示
メッセージ321を送る。この場合、バックアップを行
うことのできる計算機が複数存在した場合には、最も負
荷の軽い計算機へバックアップを依頼する。この場合の
負荷の判定は、バックアップ候補宣言メッセージ311
に記載されているCPU負荷316に基づいて行う。
【0074】バックアップ指示メッセージ321を送信
した後は、バックアップが実行されたタイミングを見計
らって当該AP業務部115を停止させる(ステップ5
10)。この後は、当該AP業務部115についての生
存報告メッセージの送信処理を終了する。
【0075】なお、一の計算機上に複数のAP業務部1
15がある場合、あるAP業務部115が停止されても
他のAP業務部115は停止されることはない。従っ
て、正常に作動しているAP業務部115が残っている
限り構成制御部113自体が停止することはない。
【0076】ところで、ステップ507において、バッ
クアップ候補宣言メッセージ321を全く受信していな
いと判定された場合(すなわち、バックアップを行うこ
とのできるAP業務部115が存在しなかった場合)に
は、ステップ509に進み、ステップ503において検
出された業務停止指示は、強制終了指示であったか否か
を判定する。強制終了指示とは、当該業務のその時の処
理内容を保存(あるいはバックアップ)できるか否かに
関わらず当該業務の実行を強制終了する指示である。該
判定の結果、強制終了指示であった場合には、ステップ
510に進み当該業務を実行していたAP業務部115
を停止させる。強制終了指示ではなかった場合には、構
成制御部113は、当該業務停止指示を無視し、当該A
P業務部115をそのまま作動させたままとする。この
場合には、ステップ501に戻り、これまでと同様の処
理を繰り返す。
【0077】次に、生存報告メッセージ301を受信し
た場合の処理を図8を用いて説明する。
【0078】構成制御部113は、受信処理部112を
介して生存報告メッセージ301を伝送路103より取
り込む(ステップ601)。そして、この時取り込んだ
生存報告メッセージ301の内容に従って、業務管理テ
ーブル402(図5参照)中における当該生存報告メッ
セージ301の発信元である業務に関する内容を更新す
る(ステップ602)。
【0079】次にバックアップ指示メッセージ321を
受信した場合の処理を図9を用いて説明する。
【0080】構成制御113は、受信処理部112を介
してバックアップ指示メッセージ321を伝送路103
より取り込む(ステップ701)。そして、業務管理テ
ーブル402(図5参照)における当該バックアップ指
示メッセージ321の発信元である業務についてのバッ
クアップ指示437に、バックアップの指示があったこ
とを書き込む(ステップ702)。
【0081】次に、他のAP業務部に障害が発生してい
ることを生存カウンタの値に基づいて発見した場合にお
ける処理を図10を用いて説明する。
【0082】構成制御113は、業務管理テーブル40
2の生存カウンタ432と生存カウンタ前回値435と
を比較する(ステップ801、802)。該比較の結
果、両者の値が一致している場合には、ステップ803
に進み、当該生存報告メッセージ301の発信元である
業務の生死状態フラグ431(図5参照)を“死”へ切
り換える(ステップ803)。続いて、当該障害の発生
したAP業務部115と同種のAP業務部115(つま
り、バックアップを行うことのできるAP業務部11
5)が自CPU内に存在するか否か、さらに、そのよう
なAP業務部115が存在する場合には当該AP業務部
115が待機状態にあるか否かを判定する(ステップ8
04)。同種のAP業務部115が自CPU内に存在す
るか否かは、自業務定義テーブル405に当該AP業務
部に関する情報が格納されているか否かをチェックする
ことで判定できる。該判定の結果、そのようなAP業務
部115が自CPU内に存在していた場合には、ステッ
プ805に進む。
【0083】ステップ805において、構成制御部11
3は、障害の発生しているAP業務部の実行していた業
務は自CPU内のAP業務部に割り当てられている業務
よりもプライオリティが高いか否かを判定する。なお、
障害の発生しているAP業務部の実行している業務のプ
ライオリティは、業務管理テーブル402における当該
業務についてのプライオリティ434を参照することで
獲得できる(図5参照)。自CPU内のAP業務部に割
り当てられている業務のプライオリティは、自業務定義
テーブル406のプライオリテイ461を参照すること
で獲得できる。
【0084】該判定の結果、障害の発生しているAP業
務部の方がプライオリティが高い場合には、構成制御部
113は、バックアップを行わせるべく、自CPU内の
当該AP業務部を起動する(ステップ806)。この後
は、ステップ807に進む。
【0085】なお、ステップ802において生存カウン
タの値が前回値とは異なっていた場合(つまり、異常が
検出されなかった場合)、また、ステップ804におい
て自CP内には同種のAP業務部が存在しなかった場
合、さらに、ステップ805において自CPU内のAP
業務部の方がプライオリティが高かった場合には、直
接、ステップ807に進む。
【0086】ステップ807において、構成制御部11
3は、計算機管理テーブル401上における次の業務を
検索する。続いて、計算機管理テーブル401に記載さ
れている全ての業務を検索したか否かを判定する(ステ
ップ808)。該判定の結果、すべての業務について検
索が完了していた場合には、ステップ809に進み、一
定時間スリープ状態となる。続いて、監視を終了するか
否かを判定する(ステップ810)。監視を終了する場
合としては、例えば、装置が停止されるような場合があ
る。監視を終了する場合にはそのまま処理を終了する。
【0087】なお、ステップ807においてまだ検索し
ていない業務が残っていると判定された場合、また、ス
テップ810において監視を終了しないと判定された場
合には、ステップ801に戻り同様の処理を繰り返す。
【0088】該図10に示した処理では、生存カウンタ
のみを監視の対象とし、バックアップ指示メッセージ受
信の有無、バックアップ要否フラグの状態については監
視の対象としていなかった。従って、この図10のよう
な処理動作を行う場合には、生存報告メッセージ301
にはバックアップ要否フラグ307は設けなくても構わ
ない。また、業務管理テーブル402には、バックアッ
プ要否436およびバックアップ指示437は設けなく
ても構わない。さらに、構成制御部113は、バックア
ップ指示メッセージ321を生成する機能を備える必要
はない。該図10に示した例では、CPU負荷を考慮し
ていないため、生存報告メッセージ301には業務負荷
308も含める必要はない。
【0089】次に、 CPUの負荷を考慮すると共に、
バックアップ要否フラグ307、バックアップ指示メッ
セージ321等を利用する場合の動作を図11を用いて
説明する。
【0090】構成制御部113は、計算機管理テーブル
401に記載されている業務のそれぞれについて、順次
以下の処理を行う。
【0091】構成制御部113は、バックアップ指示メ
ッセージ321を受け取っているか否か(つまり、自計
算機内のAP業務部に対してバックアップの依頼があっ
たか否か)を確認する(ステップ901)。該確認は、
業務管理テーブル402(図5)のバックアップ指示4
37を参照することで行われる。確認の結果、バックア
ップの依頼があった場合には、ステップ910に進み、
待機中のAP業務部115を起動してバックアップを行
わせる。この後は、ステップ911に進む。
【0092】ステップ901における確認の結果、バッ
クアップ指示メッセージ321を受け取っていなかった
場合には、続いて、当該業務はバックアップが必要な状
態になっているか否かを、当該業務についてのバックア
ップ要否436(図5参照)の値に基づいて判定する
(ステップ902)。該判定の結果、バックアップ要否
436が“バックアップ要”であった場合(つまり、バ
ックアップが必要であった場合)には、ステップ906
に進む。
【0093】ステップ902における判定の結果、バッ
クアップ要否436が“バックアップ否”であった場合
(つまり、バックアップ要否436においてはバックア
ップが要求されていなかった場合)には、今度は、生存
カウンタの値に基づいて、当該AP業務はバックアップ
が必要な状態に陥っているか否かを判定する(ステップ
903、904)。該判定は具体的には、構成制御11
3が、業務管理テーブル402の生存カウンタ432と
生存カウンタ前回値435とを比較することで行われ
る。該判定の結果、両者の値が一致している場合(つま
り、バックアップが必要な状態になっている場合)に
は、ステップ905に進み、当該業務についての生死状
態フラグ431を“死”へ切り換える。この後は、ステ
ップ906に進む。
【0094】ステップ906においては、当該障害の発
生したAP業務部115と同種のAP業務部115(つ
まり、バックアップを行うことのできるAP業務部11
5)が自CPU内に存在するか否か、さらに、そのよう
なAP業務部115が存在する場合には当該AP業務部
115が待機状態にあるか否かを判定する。同種のAP
業務部115が自CPU内に存在するか否かは、自業務
定義テーブル405に当該AP業務部に関する情報が格
納されているかをチェックすることで判定できる。該判
定の結果、そのようなAP業務部115が自CPU内に
存在していた場合には、ステップ907に進む。
【0095】ステップ907において、構成制御部11
3は、バックアップの対象となっている業務のプライオ
リティは、自CPU内のAP業務部に割り当てられてい
る業務のプライオリティよりも高いか否かを判定する。
なお、バックアップの対象となっている業務のプライオ
リティは、当該業務についてのプライオリティ434
(図5参照)を参照することで獲得できる(図5参
照)。自CPU内のAP業務部に割り当てられている業
務のプライオリティは、自業務定義テーブル405のプ
ライオリテイ461を参照することで獲得できる。該判
定の結果、バックアップの対象となっている業務の方が
プライオリティが高い場合には、構成制御部113は、
ステップ908に進む。
【0096】ステップ908において、構成制御部11
3は、仮に当該業務のバックアップを行った場合、自C
PUの負荷が100%を超えてしまうことがないかを確
認する。該確認は、自CPU全体負荷404(図5参
照)の値に、バックアップの対象となっている業務につ
いての業務負荷438(図5参照)の値を加算し、該加
算後の値をCPU能力値406(図5参照)と比較する
ことで行う。該確認の結果、バックアップを行っても自
CPUの負荷が100%を超えることがない場合には、
ステップ909に進む。ステップ909において構成制
御部113は、バックアップ候補宣言メッセージ311
を作成し送信する。この後は、ステップ911に進む。
【0097】なお、ステップ904において生存カウン
タの値が前回値とは異なっていた場合、また、ステップ
907において自CP内には同種のAP業務部が存在し
なかった場合、さらに、ステップ907において自CP
U内のAP業務部の方がプライオリティが高かった場
合、ステップ908においてCPU負荷が100%を超
えてしまう場合には、直接、ステップ911に進む。
【0098】ステップ911において、構成制御部11
3は、計算機管理テーブル401条における次の業務を
検索する。続いて、全ての業務を検索したか否かを判定
する(ステップ912)。該判定の結果、すべての業務
について検索が完了していた場合には、ステップ913
に進み、一定時間スリープ状態となる。続いて、監視を
終了するか否かを判定する(ステップ914)。監視を
終了する場合としては、例えば、装置が停止されるよう
な場合がある。監視を終了する場合にはそのまま処理を
終了する。
【0099】なお、ステップ912においてまだ検索し
ていない業務が残っていると判定された場合、また、ス
テップ914において監視を終了しないと判定された場
合には、ステップ901に戻り同様の処理を繰り返す。
【0100】以上説明した実施形態によれば、バックア
ップを業務を単位として行うことができるため、計算機
の稼働率低下を招くことはない。また、バックアップを
行う計算機の負荷が過大になることもない。特に、業務
それぞれのプライオリティ、負荷を考慮してバックアッ
プを行うAP業務部を決定しているため、システム全体
のしての負荷を分散させることができる。
【0101】上述した実施形態では、あらかじめ定めら
れたプライオリティ、負荷に基づいて、バックアップを
行わせる計算機を決定していた。但し、バックアップを
行わせる計算機の決定に際して、必ずしもこれらのすべ
てを同時に採用する必要はない。これらのうちのいずれ
かを適宜選択し組み合わせて採用しても構わない。さら
には、これ以外にも各計算機の信頼性を示す信頼性指標
を設定しておきこれに基づいてバックアップを行わせる
計算機を決定してもよい。信頼性指標としては、例え
ば、平均故障間隔、平均修復時間などを使用可能であ
る。平均故障間隔とは、ある故障が発生してから次の故
障が発生するまでの時間間隔の平均値である。該平均故
障間隔が大きいほど信頼性が高い。平均修復時官途は、
故障が発生してから当該故障を直すまでの時間の平均で
ある。実際には全修理時間を故障回数で除することで求
められる。この平均修復時間が短いほど信頼性が高い。
【0102】
【発明の効果】本発明によれば、業務単位の重要度や業
務ごとの負荷を考慮して、バックアップ制御を行うこと
ができ、またネットワーク内の任意の計算機でCPU負
荷を均一化させたバックアップを行うことが可能とな
り、システム全体としての負荷分散が容易に実現でき
る。
【図面の簡単な説明】
【図1】本発明の実施形態である多重系計算機システム
および該システムにおけるバックアップ方法を示すブロ
ック図である。
【図2】生存報告メッセージ301のデータフォーマッ
トを示す図である。
【図3】バックアップ候補宣言メッセージ311のデー
タフォーマットを示す図である。
【図4】バックアップ指示メッセージ321のデータフ
ォーマットを示す図である。
【図5】ノード生死監視テーブルの構成を示す図であ
る。
【図6】バックアップ処理の構成制御単位を示す図であ
る。
【図7】生存報告メッセージ301の送信処理を示すフ
ローチャートである。
【図8】生存報告メッセージ301を受信した場合にお
ける処理を示すフローチャートである。
【図9】バックアップ指示メッセージ321を受け付け
る処理を示すフローチャートである。
【図10】バックアップ処理を示すフローチャートであ
る。
【図11】バックアップ処理を示すフローチャートであ
る。
【図12】従来の多重系計算機システムを示すブロック
図である。
【符号の説明】
101…計算機、103…伝送路、104…メッセー
ジ、111…送信処理部、112受信処理部、113…
構成制御部、115…AP業務部、301…生存報告メ
ッセージ、311…バックアップ候補宣言メッセージ、
321…バックアップ指示メッセージ、401…計算機
管理テーブル、402…業務管理テーブル、403…自
計算機定義テーブル、404…自CPU全体負荷、40
5…自業務定義テーブル、1001…計算機、1003
…伝送路、1004…メッセージ、1014…フィル
タ、1015…業務処理プログラム、
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 克男 茨城県日立市大みか町五丁目2番1号 日 立プロセスコンピュータエンジニアリング 株式会社内 (72)発明者 保里 裕之 茨城県日立市大みか町五丁目2番1号 日 立プロセスコンピュータエンジニアリング 株式会社内 (72)発明者 友部 優 茨城県日立市大みか町五丁目2番1号 日 立プロセスコンピュータエンジニアリング 株式会社内 (72)発明者 佐藤 哲夫 茨城県日立市大みか町五丁目2番1号 株 式会社日立製作所大みか工場内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】複数の計算機を伝送路により相互結合して
    構成された多重系計算機において、 上記計算機は、それぞれ、 あらかじめ割り当てられた業務を実行する1または2以
    上の業務実行部と、 上記業務実行部のそれぞれに割り当てられている上記業
    務の名称および優先度に関する情報を記憶した記憶手段
    と、 上記業務実行部による上記業務の実行状態を検出すると
    共に上記記憶手段に記憶されている情報を参照すること
    で、当該業務実行部の実行している業務の名称と当該業
    務の優先度とその時当該業務に対しバックアップを行う
    ことが必要であるか否かの判定の基になる情報(以下
    “判定情報”という)とを含んだ生存報告メッセージを
    各業務毎に生成し、該生存報告メッセージを他の計算機
    に対して送付する生存報告メッセージ生成手段と、 他の計算機から送られてくる上記生存報告メッセージを
    受信し、該受信した生存報告メッセージに含まれている
    上記判定情報に基づいて当該生存報告メッセージの発信
    元である業務にはバックアップが必要であるか否かを判
    定するバックアップ要否判定手段と、 上記バックアップ要否判定手段がバックアップが必要で
    あると判定した場合には、当該生存報告メッセージの発
    信元である業務の優先度と自らの属する計算機の有して
    いる上記業務実行部に割り当てられている業務の優先度
    とを比較する優先度判定手段と、 上記優先度判定手段による上記比較の結果、当該生存報
    告メッセージの発信元である業務の優先度の方が優先度
    が高かった場合には、自らの属する計算機が有している
    上記業務実行部に当該生存報告メッセージの発信元であ
    る業務のバックアップを行わせるバックアップ制御手段
    とを有するものであること、 を特徴とする多重系計算機。
  2. 【請求項2】複数の計算機を伝送路により相互結合して
    構成された多重系計算機において、 上記計算機は、それぞれ、 あらかじめ割り当てられた業務を実行する1または2以
    上の業務実行部と、 上記業務実行部のそれぞれに割り当てられている上記業
    務の名称および優先度に関する情報を記憶した記憶手段
    と、 上記業務実行部による上記業務の実行状態を検出すると
    ともに上記記憶手段に記憶されている情報を参照するこ
    とで、当該業務実行部の実行している業務の名称と当該
    業務の優先度とその時当該業務に対しバックアップを行
    うことが必要であるか否かの判定の基になる情報(以下
    “判定情報”という)とを含んだ生存報告メッセージを
    各業務毎に生成し、該生存報告メッセージを他の計算機
    に対して送付する生存報告メッセージ生成手段と、 他の計算機から送られてくる上記生存報告メッセージを
    受信し、該受信した生存報告メッセージに含まれている
    上記判定情報に基づいて当該生存報告メッセージの発信
    元である業務にはバックアップが必要であるか否かを判
    定するバックアップ要否判定手段と、 上記バックアップ要否判定手段がバックアップが必要で
    あると判定した場合には、当該生存報告メッセージの発
    信元である業務の優先度と、自らの属する計算機の有し
    ている上記業務実行部に割り当てられている業務の優先
    度とを比較する優先度判定手段と、 上記優先度判定手段による上記比較の結果、当該生存報
    告メッセージの発信元である業務の優先度の方が優先度
    が高かった場合には、自らの属する計算機の有している
    上記業務実行部によって当該生存報告メッセージの発信
    元である業務のバックアップを行うことが可能であるこ
    とを示すバックアップ候補宣言メッセージを生成し、こ
    れを当該生存報告メッセージの発信元である業務の存在
    する計算機に送信するバックアップ候補宣言手段と、 上記バックアップ候補宣言メッセージを受信した場合に
    は、当該バックアップ候補宣言メッセージを送信してき
    た計算機のうちのいずれにバックアップを行わせるかを
    あらかじめ定められた基準に基づいて決定し、該決定し
    た計算機に対してバックアップを指示するバックアップ
    指示メッセージを出力するバックアップ指示手段と、 上記バックアップ指示メッセージを受信した場合には、
    自らの属する計算機の有している上記業務実行部に該バ
    ックアップ指示メッセージの発信元である業務のバック
    アップを行わせるバックアップ制御手段とを有するもの
    であること、を特徴とする多重系計算機。
  3. 【請求項3】複数の計算機を伝送路により相互結合して
    構成された多重系計算機において、 上記計算機は、それぞれ、 あらかじめ割り当てられた業務を実行する1または2以
    上の業務実行部と、 上記業務実行部のそれぞれに割り当てられている上記業
    務の名称,負荷の大きさおよび当該計算機の処理能力に
    関する情報を記憶した記憶手段と、 上記業務実行部による上記業務の実行状態を検出すると
    ともに上記記憶手段に記憶されている情報を参照するこ
    とで、当該業務実行部の実行している業務の名称と当該
    業務の負荷の大きさとその時当該業務に対しバックアッ
    プを行うことが必要であるか否かの判定の基になる情報
    (以下“判定情報”という)とを含んだ生存報告メッセ
    ージを各業務毎に生成し、該生存報告メッセージを他の
    計算機に対して送付する生存報告メッセージ生成手段
    と、 他の計算機から送られてくる上記生存報告メッセージを
    受信し、該受信した生存報告メッセージに含まれている
    上記判定情報に基づいて当該生存報告メッセージの発信
    元である業務にはバックアップが必要であるか否かを判
    定するバックアップ要否判定手段と、 上記バックアップ要否判定手段がバックアップが必要で
    あると判定した場合には、当該生存報告メッセージの発
    信元である業務の負荷の大きさと、自らの属する計算機
    の有している上記業務実行部に割り当てられている業務
    の負荷の大きさとの合計を求める負荷算定手段と、 上記負荷算定手段の求めた負荷の合計値を当該計算機の
    処理能力と比較する負荷判定手段と、 上記負荷判定手段による上記比較の結果上記負荷算定手
    段の求めた負荷の合計値が自らの属する計算機の処理能
    力を超えていない場合には、自らの属する計算機の有し
    ている上記業務実行部に当該生存報告メッセージの発信
    元である業務のバックアップを行わせるバックアップ制
    御手段とを有するものであること、 を特徴とする多重系計算機。
  4. 【請求項4】複数の計算機を伝送路により相互結合して
    構成された多重系計算機において、 上記計算機は、それぞれ、 あらかじめ割り当てられた業務を実行する1または2以
    上の業務実行部と、 上記業務実行部のそれぞれに割り当てられている上記業
    務の名称、負荷の大きさおよび当該計算機の処理能力に
    関する情報を記憶した記憶手段と、 上記業務実行部による上記業務の実行状態を検出すると
    ともに上記記憶手段に記憶されている情報を参照するこ
    とで、当該業務実行部の実行している業務の名称と当該
    業務の負荷の大きさとその時当該業務に対しバックアッ
    プを行うことが必要であるか否かの判定の基になる情報
    (以下“判定情報”という)とを含んだ生存報告メッセ
    ージを各業務毎に生成し、該生存報告メッセージを他の
    計算機に対して送付する生存報告メッセージ生成手段
    と、 他の計算機から送られてくる上記生存報告メッセージを
    受信し、該受信した生存報告メッセージに含まれている
    上記判定情報に基づいて当該生存報告メッセージの発信
    元である業務にはバックアップが必要であるか否かを判
    定するバックアップ要否判定手段と、 上記バックアップ要否判定手段がバックアップが必要で
    あると判定した場合には、当該生存報告メッセージの発
    信元である業務の負荷の大きさと、当該計算機の有する
    上記業務実行部に割り当てられている業務の負荷の大き
    さとの合計を求める負荷算定手段と、 上記負荷算定手段の求めた負荷の合計値を当該計算機の
    処理能力と比較する負荷判定手段と、 上記負荷判定手段による上記比較の結果、上記負荷算定
    手段の求めた負荷の合計値が当該計算機の処理能力を超
    えていない場合には、自らの属する計算機の有している
    上記業務実行部によって当該生存報告メッセージの発信
    元である業務のバックアップを行うことが可能であるこ
    とを示すバックアップ候補宣言メッセージを生成し、こ
    れを当該生存報告メッセージの発信元である業務の存在
    する計算機に送信するバックアップ候補宣言手段と、 上記バックアップ候補宣言メッセージを受信した場合に
    は、当該バックアップ候補宣言メッセージを送信してき
    た計算機のうちのいずれにバックアップを行わせるかを
    あらかじめ定められた基準に基づいて決定し、該決定し
    た計算機に対してバックアップを指示するバックアップ
    指示メッセージを出力するバックアップ指示手段と、 上記バックアップ指示メッセージを受信した場合には、
    自らの属する計算機の有している上記業務実行部に当該
    バックアップ指示メッセージの発信元である業務のバッ
    クアップを行わせるバックアップ制御手段とを有するも
    のであること、 を特徴とする多重系計算機。
  5. 【請求項5】上記判定情報は、上記生存報告メッセージ
    が生成される度毎にその値があらかじめ定められた量だ
    け変更されてゆく生存カウンタ情報であり、 上記バックアップ要否判定手段は、前回当該業務を発信
    元とした生存報告メッセージに含まれていた上記生存カ
    ウンタ情報の値と、今回当該業務を発信元とした生存報
    告メッセージに含まれていた上記生存カウンタ情報の値
    とを比較し、該比較の結果、前回の値と今回の値とが一
    致している場合には、上記バックアップが必要であると
    判定するものであること、 を特徴とする請求項1、2、3または4記載の多重系計
    算機。
  6. 【請求項6】上記記憶手段は、さらに、当該計算機の信
    頼性を示す信頼性指標に関する情報を記憶したものであ
    り、 上記バックアップ候補宣言メッセージは、当該計算機の
    信頼性指標を含んだものであり、 上記バックアップ指示手段は、上記バックアップ候補宣
    言メッセージを受信した場合には、上記バックアップ候
    補宣言メッセージを送信してきた計算機のうちのいずれ
    にバックアップを行わせるかを、上記バックアップ候補
    宣言メッセージに含まれている上記信頼性指標に基づい
    て決定すること、 を特徴とする請求項2または4記載の多重系計算機。
JP8267882A 1996-09-17 1996-09-17 多重系計算機およびそのバックアップ方法 Pending JPH1091467A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8267882A JPH1091467A (ja) 1996-09-17 1996-09-17 多重系計算機およびそのバックアップ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8267882A JPH1091467A (ja) 1996-09-17 1996-09-17 多重系計算機およびそのバックアップ方法

Publications (1)

Publication Number Publication Date
JPH1091467A true JPH1091467A (ja) 1998-04-10

Family

ID=17450949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8267882A Pending JPH1091467A (ja) 1996-09-17 1996-09-17 多重系計算機およびそのバックアップ方法

Country Status (1)

Country Link
JP (1) JPH1091467A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031893A (ja) * 2003-07-10 2005-02-03 Hitachi Ltd 運用管理方法及び装置
JP2009187090A (ja) * 2008-02-04 2009-08-20 Nec Corp クラスタシステムおよび情報処理方法
JP5152426B1 (ja) * 2012-07-02 2013-02-27 富士電機株式会社 情報処理装置及び冗長化システム、並びに、これらにおけるエラー検出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005031893A (ja) * 2003-07-10 2005-02-03 Hitachi Ltd 運用管理方法及び装置
US8250400B2 (en) 2003-07-10 2012-08-21 Hitachi, Ltd. Method and apparatus for monitoring data-processing system
JP2009187090A (ja) * 2008-02-04 2009-08-20 Nec Corp クラスタシステムおよび情報処理方法
JP5152426B1 (ja) * 2012-07-02 2013-02-27 富士電機株式会社 情報処理装置及び冗長化システム、並びに、これらにおけるエラー検出方法

Similar Documents

Publication Publication Date Title
US6859889B2 (en) Backup system and method for distributed systems
US6839752B1 (en) Group data sharing during membership change in clustered computer system
US4628508A (en) Computer of processor control systems
US8375363B2 (en) Mechanism to change firmware in a high availability single processor system
US9208029B2 (en) Computer system to switch logical group of virtual computers
US20030005350A1 (en) Failover management system
CN111209110B (zh) 一种实现负载均衡的任务调度管理方法、系统和存储介质
US7185236B1 (en) Consistent group membership for semi-active and passive replication
CN114553900B (zh) 一种分布式块存储管理系统、方法及电子设备
US20050234919A1 (en) Cluster system and an error recovery method thereof
CN114422335B (zh) 通信方法、装置、服务器及存储介质
JPH1091467A (ja) 多重系計算機およびそのバックアップ方法
JPH09293059A (ja) 分散システム及びその運用管理方法
JPH06348527A (ja) 多重要素処理システム
CN115145782A (zh) 一种服务器切换方法,MooseFS系统及存储介质
JPH09247194A (ja) Lan制御方式
CN115333983B (zh) 心跳管理方法及节点
CN114598711B (zh) 一种数据迁移方法、装置、设备及介质
US20050265362A1 (en) Message relay program and message relay device
CN116032932A (zh) 针对边缘服务器的集群管理方法、系统、设备及介质
KR100832543B1 (ko) 계층적 다중 백업 구조를 갖는 고가용성 클러스터 시스템및 이를 이용한 고가용성 구현 방법
CN113190183B (zh) 一种存储集群装置及设备挂载方法
JP2000148525A (ja) サービスプロセッサ二重化システムの現用系負荷軽減方法
JP2002014938A (ja) クラスタソフトウェア搭載システム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
CN110290159B (zh) 一种调度管理的方法和设备