JP2790134B1 - ディスクアレイシステム - Google Patents
ディスクアレイシステムInfo
- Publication number
- JP2790134B1 JP2790134B1 JP9056234A JP5623497A JP2790134B1 JP 2790134 B1 JP2790134 B1 JP 2790134B1 JP 9056234 A JP9056234 A JP 9056234A JP 5623497 A JP5623497 A JP 5623497A JP 2790134 B1 JP2790134 B1 JP 2790134B1
- Authority
- JP
- Japan
- Prior art keywords
- magnetic disk
- state
- hdd
- unique information
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2289—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F2003/0697—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers device management, e.g. handlers, drivers, I/O schedulers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Debugging And Monitoring (AREA)
Abstract
【要約】
【課題】 磁気ディスク装置の状態に応じて適切に復旧
処理を行うこと。 【解決手段】 ディスクアレイコントローラ3が、HD
D装置541〜545の障害発生の有無及び復旧処理中か
否かの動作状態を管理する状態情報をHDD装置541
〜545の状態の変化に応じて書き換える状態情報制御
手段6と、HDD装置541〜545を再立ち上げをする
ときに状態情報に基づいて当該再立ち上げ直前の各HD
D装置541〜545の動作状態を再現する直前状態再現
手段7と、不揮発性メモリ551〜555及びHDD装置
541〜545にそれぞれ格納された固有情報を比較する
と共に当該比較結果に基づいて再立ち上げ直前から当該
HDD装置541〜545が入れ替えられたか否かの接続
状態を判定する接続状態判定手段8と、この接続状態情
報と動作状態情報とに基づいて復旧処理の継続又は開始
を制御する復旧制御手段9とを備えている。
処理を行うこと。 【解決手段】 ディスクアレイコントローラ3が、HD
D装置541〜545の障害発生の有無及び復旧処理中か
否かの動作状態を管理する状態情報をHDD装置541
〜545の状態の変化に応じて書き換える状態情報制御
手段6と、HDD装置541〜545を再立ち上げをする
ときに状態情報に基づいて当該再立ち上げ直前の各HD
D装置541〜545の動作状態を再現する直前状態再現
手段7と、不揮発性メモリ551〜555及びHDD装置
541〜545にそれぞれ格納された固有情報を比較する
と共に当該比較結果に基づいて再立ち上げ直前から当該
HDD装置541〜545が入れ替えられたか否かの接続
状態を判定する接続状態判定手段8と、この接続状態情
報と動作状態情報とに基づいて復旧処理の継続又は開始
を制御する復旧制御手段9とを備えている。
Description
【0001】
【発明の属する技術分野】本発明は、ディスクアレイシ
ステムに係り、特に、データを冗長構成にして複数の磁
気ディスク装置(HDD装置)に格納するディスクアレ
イシステムに関する。
ステムに係り、特に、データを冗長構成にして複数の磁
気ディスク装置(HDD装置)に格納するディスクアレ
イシステムに関する。
【0002】
【従来の技術】従来、データを1台のHDD装置に格納
するRAID(Redundant Arrays ofInexpensive Dis
k)のレベル0の磁気ディスク装置が一般的であった。
その後、信頼性をより向上させるため、同じデータを複
数のHDD装置に格納するRAIDのレベル1のディス
クアレイシステムや、データを複数のHDD装置に分散
して格納するRAIDのレベル3、4および5のディス
クアレイシステムが用いられている。
するRAID(Redundant Arrays ofInexpensive Dis
k)のレベル0の磁気ディスク装置が一般的であった。
その後、信頼性をより向上させるため、同じデータを複
数のHDD装置に格納するRAIDのレベル1のディス
クアレイシステムや、データを複数のHDD装置に分散
して格納するRAIDのレベル3、4および5のディス
クアレイシステムが用いられている。
【0003】RAIDのレベル0の磁気ディスク装置
は、HDD装置に格納していたデータが失われた場合、
そのデータを使用することはできなくなる。
は、HDD装置に格納していたデータが失われた場合、
そのデータを使用することはできなくなる。
【0004】RAIDのレベル1、3、4および5のデ
ィスクアレイシステムでは、データを冗長構成とするた
め、内蔵するHDD装置の1台に格納していたデータが
失われても、ディスクアレイシステム全体としてみた場
合、そのデータを復元することができる。このため、大
容量の外部記憶装置が必要とされるワークステーション
やネットワークサーバーなどでは、RAIDのレベル
1、3、4または5を使用したディスクアレイシステム
が用いられるようになってきている。
ィスクアレイシステムでは、データを冗長構成とするた
め、内蔵するHDD装置の1台に格納していたデータが
失われても、ディスクアレイシステム全体としてみた場
合、そのデータを復元することができる。このため、大
容量の外部記憶装置が必要とされるワークステーション
やネットワークサーバーなどでは、RAIDのレベル
1、3、4または5を使用したディスクアレイシステム
が用いられるようになってきている。
【0005】図9を用いてRAIDレベル1と呼ばれる
2重化磁気ディスク装置の動作を簡単に説明する。ディ
スクアレイコントローラ53は、上位装置からの書き込
み要求がなされると、書き込み要求がなされたデータ6
0を、HDD装置541 、142 の両方に書き込む。こ
のような書き込み動作により、HDD装置が両方とも読
み出し可能な場合には、HDD装置541 とHDD装置
542 のデータを比較することにより、信頼性の高いデ
ータの読み出しが可能となる。
2重化磁気ディスク装置の動作を簡単に説明する。ディ
スクアレイコントローラ53は、上位装置からの書き込
み要求がなされると、書き込み要求がなされたデータ6
0を、HDD装置541 、142 の両方に書き込む。こ
のような書き込み動作により、HDD装置が両方とも読
み出し可能な場合には、HDD装置541 とHDD装置
542 のデータを比較することにより、信頼性の高いデ
ータの読み出しが可能となる。
【0006】また、一方のHDD装置のデータの読み出
しが不可能になった場合でも、他方のHDD装置のデー
タを読み出すことにより、データを得ることができる。
たとえばHDD装置541 のデータが読み出し不可能と
なった場合には、HDD142 のデータだけを読み出せ
ば、データを得ることができる。
しが不可能になった場合でも、他方のHDD装置のデー
タを読み出すことにより、データを得ることができる。
たとえばHDD装置541 のデータが読み出し不可能と
なった場合には、HDD142 のデータだけを読み出せ
ば、データを得ることができる。
【0007】図10はRAIDのレベル4と呼ばれる冗
長構成を用いた場合のディスクアレイシステムの構成を
示す説明図である。ディスクアレイコントローラ53
は、上位装置からの書き込み要求がなされると、書き込
み要求がなされたデータ60を、セクタ単位に分割し、
HDD装置541 〜144 の記録領域581 〜584 に
分散して書き込む。
長構成を用いた場合のディスクアレイシステムの構成を
示す説明図である。ディスクアレイコントローラ53
は、上位装置からの書き込み要求がなされると、書き込
み要求がなされたデータ60を、セクタ単位に分割し、
HDD装置541 〜144 の記録領域581 〜584 に
分散して書き込む。
【0008】このとき、ディスクアレイコントローラ5
3は、単にデータを分散するだけでなく、対応する記録
領域581 〜584 に格納されるデータD1 、D2 、D
3 、D4 の排他的論理和演算を行い、その演算結果であ
るパリティPをHDD装置545 の記録領域585 に書
き込む。このような書き込み動作により、データに冗長
性が付与され、いずれのデータも他のデータパリティを
基に再構築可能な形態で格納される。
3は、単にデータを分散するだけでなく、対応する記録
領域581 〜584 に格納されるデータD1 、D2 、D
3 、D4 の排他的論理和演算を行い、その演算結果であ
るパリティPをHDD装置545 の記録領域585 に書
き込む。このような書き込み動作により、データに冗長
性が付与され、いずれのデータも他のデータパリティを
基に再構築可能な形態で格納される。
【0009】たとえば、データD4 は、データD1 、D
2 、D3 とパリティPの排他的論理和演算結果と等しく
なっている。このため、記録領域584 が読み出し不可
能となった場合には、このHDD装置の記録領域のデー
タと、パリティとを読み出してこれらの排他的論理和演
算を行うことにより、記録領域584 を読み出すことな
く、データD4 を得ることができる。
2 、D3 とパリティPの排他的論理和演算結果と等しく
なっている。このため、記録領域584 が読み出し不可
能となった場合には、このHDD装置の記録領域のデー
タと、パリティとを読み出してこれらの排他的論理和演
算を行うことにより、記録領域584 を読み出すことな
く、データD4 を得ることができる。
【0010】また、従来のディスクアレイシステムで
は、障害HDD装置を特定する情報を揮発性メモリに格
納していたため、停電等によるシステムダウンが発生し
たとき、障害HDD装置を特定する情報が失われてい
た。このため、磁気ディスク装置では、障害HDD装置
を特定する情報を不揮発性メモリに格納する装置が各種
提案されている。
は、障害HDD装置を特定する情報を揮発性メモリに格
納していたため、停電等によるシステムダウンが発生し
たとき、障害HDD装置を特定する情報が失われてい
た。このため、磁気ディスク装置では、障害HDD装置
を特定する情報を不揮発性メモリに格納する装置が各種
提案されている。
【0011】たとえば、特開平7−56694号公報に
は、磁気ディスク装置の状態記憶に不揮発性メモリを用
いるシステムの制御方法が提案されている。
は、磁気ディスク装置の状態記憶に不揮発性メモリを用
いるシステムの制御方法が提案されている。
【0012】図11にこの従来のディスクアレイシステ
ムの構成を示す。ディスクアレイシステム51は、イン
ターフェース52と、磁気ディスク制御装置(ディスク
アレイコントローラ)53と、例えば5台の磁気ディス
ク装置(HDD装置)541〜545 と、各HDD装置
に対応した不揮発性メモリ551 〜155 と、時計回路
16とを備えている。
ムの構成を示す。ディスクアレイシステム51は、イン
ターフェース52と、磁気ディスク制御装置(ディスク
アレイコントローラ)53と、例えば5台の磁気ディス
ク装置(HDD装置)541〜545 と、各HDD装置
に対応した不揮発性メモリ551 〜155 と、時計回路
16とを備えている。
【0013】インターフェース52は、上位装置61か
らのデータのアクセス要求(読み出しまたは書き込み要
求)をディスクアレイコントローラ53に入力する。
らのデータのアクセス要求(読み出しまたは書き込み要
求)をディスクアレイコントローラ53に入力する。
【0014】ディスクアレイコントローラ53は、上位
装置から出力された要求内容に応じてHDD装置54を
制御してデータの読み出しまたは書き込みを行う手段
と、不揮発性メモリ55内情報とそれぞれのディスク媒
体上に設けられた管理情報記録領域17に格納された情
報とに基づいて各HDD装置の状態の判定を行う手段と
を備えている。時計回路16は、障害が発生した際不揮
発性メモリ55の管理情報中の日付や時刻情報を書き替
えるときに用いる。
装置から出力された要求内容に応じてHDD装置54を
制御してデータの読み出しまたは書き込みを行う手段
と、不揮発性メモリ55内情報とそれぞれのディスク媒
体上に設けられた管理情報記録領域17に格納された情
報とに基づいて各HDD装置の状態の判定を行う手段と
を備えている。時計回路16は、障害が発生した際不揮
発性メモリ55の管理情報中の日付や時刻情報を書き替
えるときに用いる。
【0015】この従来例の概略動作を図12及び図13
を参照して説明する。この従来例では、複数の磁気ディ
スク装置を順次特定する変数「i」と、障害HDD装置
があるときに障害HDD装置を特定するパラメータ「N
DISK」と、障害HDD装置台数のカウント値が格納され
る「NEER」とを用いる。また、図11に示す各不揮発
性メモリ55に格納された管理情報は配列A(i)に、
管理情報記憶部17に格納された管理情報は配列B
(i)に格納される。
を参照して説明する。この従来例では、複数の磁気ディ
スク装置を順次特定する変数「i」と、障害HDD装置
があるときに障害HDD装置を特定するパラメータ「N
DISK」と、障害HDD装置台数のカウント値が格納され
る「NEER」とを用いる。また、図11に示す各不揮発
性メモリ55に格納された管理情報は配列A(i)に、
管理情報記憶部17に格納された管理情報は配列B
(i)に格納される。
【0016】この従来例では、1台分のデータが失われ
ても復旧可能とする冗長構成を採るため、障害HDD装
置台数のカウント値が格納される「NEER」の値が2以
上の場合には、ディスクアレイシステム全体の異常とす
る。また、この従来例では、障害HDD装置を特定する
パラメータに基づいて、障害HDD装置が新しいHDD
装置と交換されたか否かを判定し、新しいHDD装置と
判定されたときには、自動的に復旧処理を行う。
ても復旧可能とする冗長構成を採るため、障害HDD装
置台数のカウント値が格納される「NEER」の値が2以
上の場合には、ディスクアレイシステム全体の異常とす
る。また、この従来例では、障害HDD装置を特定する
パラメータに基づいて、障害HDD装置が新しいHDD
装置と交換されたか否かを判定し、新しいHDD装置と
判定されたときには、自動的に復旧処理を行う。
【0017】また、この従来例では、ディスクアレイコ
ントローラ53は、初期化時に、日付時刻情報を含んだ
管理情報をHDD装置の管理情報記録領域57と当該H
DD装置に併設された不揮発性メモリ55に格納する。
また、ディスクアレイコントローラは、HDD装置に障
害が発生すると、その障害HDD装置に併設された不揮
発性メモリ55に障害が発生した日付時刻情報を格納す
る。従って、不揮発性メモリ55の内容と管理情報記録
領域57の内容とを比較することで、当該HDD装置が
障害ディスクであるか否かを確認することができる。
ントローラ53は、初期化時に、日付時刻情報を含んだ
管理情報をHDD装置の管理情報記録領域57と当該H
DD装置に併設された不揮発性メモリ55に格納する。
また、ディスクアレイコントローラは、HDD装置に障
害が発生すると、その障害HDD装置に併設された不揮
発性メモリ55に障害が発生した日付時刻情報を格納す
る。従って、不揮発性メモリ55の内容と管理情報記録
領域57の内容とを比較することで、当該HDD装置が
障害ディスクであるか否かを確認することができる。
【0018】具体的には、まず、図12に示すように、
配列変数A(i)、B(i)に”0”を、カウンタi
に”1”、障害HDD装置台数カウンタNEER に”
0”、障害HDD装置識別パラメータNDISKに”0”を
セット(S201)する。
配列変数A(i)、B(i)に”0”を、カウンタi
に”1”、障害HDD装置台数カウンタNEER に”
0”、障害HDD装置識別パラメータNDISKに”0”を
セット(S201)する。
【0019】そして、i番の不揮発性メモリのテストを
行い、不揮発性メモリが正常でない場合(N)には、そ
のHDD装置を使用不可と判断して、NEER を”1”増
加させるとともに、NDISKにiをセット(S207)
し、S208へ進む。
行い、不揮発性メモリが正常でない場合(N)には、そ
のHDD装置を使用不可と判断して、NEER を”1”増
加させるとともに、NDISKにiをセット(S207)
し、S208へ進む。
【0020】不揮発性メモリが正常である場合(S20
2:Y)には、その不揮発性メモリの内容を、配列変数
A(i)に書き込む。次いで、i番のHDD装置の管理
情報記録領域のテストを行い、管理情報記録領域が正常
でない場合(S204N)には、S207へ進む。管理
情報記録領域が正常である場合(S204:Y)には、
その管理情報記録領域の内容をB(i)にセット(S2
05)する。
2:Y)には、その不揮発性メモリの内容を、配列変数
A(i)に書き込む。次いで、i番のHDD装置の管理
情報記録領域のテストを行い、管理情報記録領域が正常
でない場合(S204N)には、S207へ進む。管理
情報記録領域が正常である場合(S204:Y)には、
その管理情報記録領域の内容をB(i)にセット(S2
05)する。
【0021】配列変数A(i)とB(i)が一致してい
ないときには(S206:N)i番のHDD装置は正常
なHDD装置ではないので、NEER を”1”増加させる
とともに、NDISKにiをセットする(S207)。次い
で、iに”1”を加算(S208)し、iがHDD装置
台数より大きくないときには(S209:Y)、S20
2へ戻り、次の不揮発性メモリ、管理情報記録領域のテ
ストを行う。このような動作をiが全HDD装置台数よ
り大きくなるまで繰り返す。
ないときには(S206:N)i番のHDD装置は正常
なHDD装置ではないので、NEER を”1”増加させる
とともに、NDISKにiをセットする(S207)。次い
で、iに”1”を加算(S208)し、iがHDD装置
台数より大きくないときには(S209:Y)、S20
2へ戻り、次の不揮発性メモリ、管理情報記録領域のテ
ストを行う。このような動作をiが全HDD装置台数よ
り大きくなるまで繰り返す。
【0022】次いで、障害HDD装置台数NEER の判定
を行い(S301)、NEER が”0”であるときには、
全HDD装置が正常であるので、正常に立ち上げ動作を
終了させる。NEER が”2”以上であるときには、エラ
ーメッセージを出力(S302)して、再立ち上げ動作
を終了する。NEER が”1”であるときには、A(N
DISK)と”0”との比較を行い、A(NDISK)が”0”
であるときには(S303:Y)、ステップS202で
不揮発性メモリが異常と判断されその不揮発性メモリの
内容が配列A(NDISK)に格納されていないため、N
DISK番目の不揮発性メモリが異常であり、従って、N
DISK番のHDD装置を使用不可能とする(S306)。
を行い(S301)、NEER が”0”であるときには、
全HDD装置が正常であるので、正常に立ち上げ動作を
終了させる。NEER が”2”以上であるときには、エラ
ーメッセージを出力(S302)して、再立ち上げ動作
を終了する。NEER が”1”であるときには、A(N
DISK)と”0”との比較を行い、A(NDISK)が”0”
であるときには(S303:Y)、ステップS202で
不揮発性メモリが異常と判断されその不揮発性メモリの
内容が配列A(NDISK)に格納されていないため、N
DISK番目の不揮発性メモリが異常であり、従って、N
DISK番のHDD装置を使用不可能とする(S306)。
【0023】A(NDISK)が”0”でないときには(S
303N)、NDISK番のHDD装置が使用可能な場合が
考えられるので、そのHDD装置のテストを行う(S2
04)。
303N)、NDISK番のHDD装置が使用可能な場合が
考えられるので、そのHDD装置のテストを行う(S2
04)。
【0024】そして、そのHDD装置を異常と判断した
ときには(S305:N)、そのHDD装置を使用不可
とし(S306)、正常と判断したときには(S30
5:Y)そのHDD装置に他のHDD装置内のデータか
ら再構築されたデータを書き込む復旧作業を行う(S3
07)。復旧作業が完了したならば、そのHDD装置の
管理情報記録領域にA(NDISK)を書き込み、再立ち上
げ動作を完了する。
ときには(S305:N)、そのHDD装置を使用不可
とし(S306)、正常と判断したときには(S30
5:Y)そのHDD装置に他のHDD装置内のデータか
ら再構築されたデータを書き込む復旧作業を行う(S3
07)。復旧作業が完了したならば、そのHDD装置の
管理情報記録領域にA(NDISK)を書き込み、再立ち上
げ動作を完了する。
【0025】
【発明が解決しようとする課題】しかしながら、この従
来例では、障害HDD装置を取り替えるときに、間違え
て、データがすでに格納されているHDD装置を新しい
HDD装置として接続した場合には、なんらエラーが検
出されず、このため、データがすでに格納されているH
DD装置へ復旧データが書き込まれてしまい、元のデー
タが失われてしまう、という不都合があった。
来例では、障害HDD装置を取り替えるときに、間違え
て、データがすでに格納されているHDD装置を新しい
HDD装置として接続した場合には、なんらエラーが検
出されず、このため、データがすでに格納されているH
DD装置へ復旧データが書き込まれてしまい、元のデー
タが失われてしまう、という不都合があった。
【0026】すなわち、図11に示した構成を持つディ
スクアレイシステムが複数あり、障害HDD装置が複数
台になった場合、図12及び図13に示す手法では、障
害HDD装置交換後の再立ち上げ時に誤動作を生ずる。
スクアレイシステムが複数あり、障害HDD装置が複数
台になった場合、図12及び図13に示す手法では、障
害HDD装置交換後の再立ち上げ時に誤動作を生ずる。
【0027】たとえば、図14に示すように図11の磁
気ディスク装置が2台あり、交換するHDD装置が2台
ある場合で、ディスクアレイシステム51aのHDD装
置54a1 とディスクアレイシステム51bのHDD装
置54b2 が障害HDD装置になった場合を考える。
気ディスク装置が2台あり、交換するHDD装置が2台
ある場合で、ディスクアレイシステム51aのHDD装
置54a1 とディスクアレイシステム51bのHDD装
置54b2 が障害HDD装置になった場合を考える。
【0028】ディスクアレイシステム51aとディスク
アレイシステム51bはそれぞれ独立して動作している
ため、HDD装置54a1 〜54a5 と54b1 〜54
b5に書き込まれているデータは異なるものである。
アレイシステム51bはそれぞれ独立して動作している
ため、HDD装置54a1 〜54a5 と54b1 〜54
b5に書き込まれているデータは異なるものである。
【0029】障害HDD装置54a1 および54b2 を
新しいHDD装置54c1 および14c2 に交換する際
に、ディスクアレイシステム51aの障害HDD装置5
4a1 ではなく、正常に動作していたHDD装置54a
2 を取り外し、新しいHDD装置54c1 と交換し、デ
ィスクアレイシステム51bの障害HDD装置54b2
を取り外し、先に取り外したディスクアレイシステム5
1aで正常に動作していたHDD装置54a2 を取り付
け、両方の磁気ディスク装置の交換作業が終了後同時に
再起動したとする。
新しいHDD装置54c1 および14c2 に交換する際
に、ディスクアレイシステム51aの障害HDD装置5
4a1 ではなく、正常に動作していたHDD装置54a
2 を取り外し、新しいHDD装置54c1 と交換し、デ
ィスクアレイシステム51bの障害HDD装置54b2
を取り外し、先に取り外したディスクアレイシステム5
1aで正常に動作していたHDD装置54a2 を取り付
け、両方の磁気ディスク装置の交換作業が終了後同時に
再起動したとする。
【0030】すなわち、障害のない磁気ディスク装置を
新しい交換用の磁気ディスク装置に変更したり、障害の
ある磁気ディスク装置を交換用の磁気ディスク装置と間
違って交換したとする。
新しい交換用の磁気ディスク装置に変更したり、障害の
ある磁気ディスク装置を交換用の磁気ディスク装置と間
違って交換したとする。
【0031】この場合、ディスクアレイシステム51a
は、障害HDD装置54a1 と新しいHDD装置54c
1 (HDD装置54a2 があった場所)が障害HDD装
置となるため、使用不可能な状態になる。一方、ディス
クアレイシステム51bは障害HDD装置54b2 が正
常動作するHDD装置54a2 となるので、復旧動作を
開始することになる。
は、障害HDD装置54a1 と新しいHDD装置54c
1 (HDD装置54a2 があった場所)が障害HDD装
置となるため、使用不可能な状態になる。一方、ディス
クアレイシステム51bは障害HDD装置54b2 が正
常動作するHDD装置54a2 となるので、復旧動作を
開始することになる。
【0032】ディスクアレイシステム51bの復旧動作
を行うとディスクアレイシステム51aのHDD装置5
4a2 のデータがなくなることになるので、ディスクア
レイシステム51aはHDD装置54a1 と54a2 の
2つのデータがなくなることになり、復旧作業が行えな
くなる。
を行うとディスクアレイシステム51aのHDD装置5
4a2 のデータがなくなることになるので、ディスクア
レイシステム51aはHDD装置54a1 と54a2 の
2つのデータがなくなることになり、復旧作業が行えな
くなる。
【0033】すなわち、一方のディスクアレイシステム
から正常な磁気ディスク装置を取り外し、他方のディス
クアレイシステムに接続して復旧作業を行うと、一方の
ディスクアレイシステムは障害復旧が行えなくなる、と
いう不都合があった。
から正常な磁気ディスク装置を取り外し、他方のディス
クアレイシステムに接続して復旧作業を行うと、一方の
ディスクアレイシステムは障害復旧が行えなくなる、と
いう不都合があった。
【0034】このような問題は、HDD装置の交換接続
作業を磁気ディスク装置の使用者が間違いなく行えば、
生じない問題である。しかし、磁気ディスク装置がデー
タを冗長構成とすることにより、記憶装置としての信頼
性を向上させた装置である以上、このような人為的なミ
スにも対応し得る装置であることが望まれる。
作業を磁気ディスク装置の使用者が間違いなく行えば、
生じない問題である。しかし、磁気ディスク装置がデー
タを冗長構成とすることにより、記憶装置としての信頼
性を向上させた装置である以上、このような人為的なミ
スにも対応し得る装置であることが望まれる。
【0035】このように、従来例では、復旧処理をする
ことでデータが失われてしまう可能性が考慮されておら
ず、従って、適切な局面での復旧処理を行うことができ
ない、という不都合があった。
ことでデータが失われてしまう可能性が考慮されておら
ず、従って、適切な局面での復旧処理を行うことができ
ない、という不都合があった。
【0036】また、不揮発性メモリ551 〜154 を1
つの不揮発性メモリにして、管理情報を格納する領域を
区別することにより、各HDD装置に対応させることが
可能になっているが、不揮発性メモリを1つにした場合
は、図12および図13に示すシステムの制御方法の不
揮発性メモリテストは、それぞれの不揮発性メモリの管
理情報記憶領域のテストを行うことになり、不揮発性メ
モリ自体の障害を検出できない場合がある。
つの不揮発性メモリにして、管理情報を格納する領域を
区別することにより、各HDD装置に対応させることが
可能になっているが、不揮発性メモリを1つにした場合
は、図12および図13に示すシステムの制御方法の不
揮発性メモリテストは、それぞれの不揮発性メモリの管
理情報記憶領域のテストを行うことになり、不揮発性メ
モリ自体の障害を検出できない場合がある。
【0037】たとえば、HDD装置に障害が発生して不
揮発性メモリの管理情報記録領域を書き替えるとき、今
まで正常に動作していた不揮発性メモリが書き込み障害
を起こし、データが書き替えられなかったか、または書
き替えたデータが書き替える前と同じであったとする。
揮発性メモリの管理情報記録領域を書き替えるとき、今
まで正常に動作していた不揮発性メモリが書き込み障害
を起こし、データが書き替えられなかったか、または書
き替えたデータが書き替える前と同じであったとする。
【0038】その後、障害に気づかずに装置を再起動す
ると不揮発性メモリに書き込み障害を起こした管理情報
記録領域のテストは正常に終了し、装置は障害がなかっ
たようになる。また、不揮発性メモリの書き込み障害を
起こした管理情報記録領域のテストがエラーとなっても
他の管理情報記録領域は正常に見える。
ると不揮発性メモリに書き込み障害を起こした管理情報
記録領域のテストは正常に終了し、装置は障害がなかっ
たようになる。また、不揮発性メモリの書き込み障害を
起こした管理情報記録領域のテストがエラーとなっても
他の管理情報記録領域は正常に見える。
【0039】これは、1つの不揮発性メモリを使用した
磁気ディスク装置で不揮発性メモリの障害が発生した際
に、HDD装置の障害を検出することができない場合
や、障害が発生した領域は使用できないがその他の領域
は使用できる場合などが生じることになり、正しい磁気
ディスク装置の状態を知ることができなくなる。
磁気ディスク装置で不揮発性メモリの障害が発生した際
に、HDD装置の障害を検出することができない場合
や、障害が発生した領域は使用できないがその他の領域
は使用できる場合などが生じることになり、正しい磁気
ディスク装置の状態を知ることができなくなる。
【0040】この問題は、回路上の様々な障害が原因と
なって生じることが考えられる。そのため、このような
問題が生じ際に、障害を検出する機構を持つ装置が望ま
れる。
なって生じることが考えられる。そのため、このような
問題が生じ際に、障害を検出する機構を持つ装置が望ま
れる。
【0041】
【発明の目的】本発明は、係る従来例の有する不都合を
改善し、特に、磁気ディスク装置の状態に応じて適切に
復旧処理を行うことのできるディスクアレイシステムを
提供することを、その目的とする。
改善し、特に、磁気ディスク装置の状態に応じて適切に
復旧処理を行うことのできるディスクアレイシステムを
提供することを、その目的とする。
【0042】具体的には、各HDD装置の状態を立ち上
げ時に自動検出するとともに不揮発性メモリの障害も検
出することにより、システムダウン後の再立ち上げ時に
誤動作を生じることがくなるようにして、システムの信
頼性の向上を図る。
げ時に自動検出するとともに不揮発性メモリの障害も検
出することにより、システムダウン後の再立ち上げ時に
誤動作を生じることがくなるようにして、システムの信
頼性の向上を図る。
【0043】また、HDD装置の接続ミスも検出するこ
とにより、人為的ミスによりデータが失われることがな
くなるようにしてシステムの信頼性の向上を図る。
とにより、人為的ミスによりデータが失われることがな
くなるようにしてシステムの信頼性の向上を図る。
【0044】さらに、障害HDD装置が交換された時
に、人手介入により復旧を開始することにより、交換時
のミスによりデータが失われることを防げるようにし、
復旧を開始した後は、システムがダウンしても再立ち上
げ時に自動検出して復旧を開始することにより、上位装
置を介して入力する必要がなくなるようにしてシステム
の保守性の向上を図る。
に、人手介入により復旧を開始することにより、交換時
のミスによりデータが失われることを防げるようにし、
復旧を開始した後は、システムがダウンしても再立ち上
げ時に自動検出して復旧を開始することにより、上位装
置を介して入力する必要がなくなるようにしてシステム
の保守性の向上を図る。
【0045】
【課題を解決するための手段】そこで、本発明では、上
位装置から送信されたデータを冗長構成として格納する
複数の磁気ディスク装置と、この複数の磁気ディスク装
置を識別する固有情報を各磁気ディスク装置毎に記憶す
る不揮発性の固有情報記憶部と、この固有情報記憶部に
格納された固有情報に基づいて磁気ディスク装置の接続
状態を判定すると共に磁気ディスク装置に異常が発生し
たときに冗長構成に基づいて当該異常により失われたデ
ータを復旧させる磁気ディスク制御装置とを備えてい
る。しかも、磁気ディスク制御装置が、各磁気ディスク
装置の初期化時に当該各磁気ディスク装置から固有情報
を読み出すと共に当該各固有情報をそれぞれの固有情報
記憶部へ格納する初期化制御手段と、磁気ディスク装置
の障害発生の有無及び復旧処理中か否かの動作状態を管
理する状態情報を磁気ディスク装置の状態の変化に応じ
て書き換える状態情報制御手段とを備えている。さら
に、磁気ディスク制御装置に、状態情報制御手段によっ
て編集された状態情報を記憶する不揮発性の状態情報記
憶部を併設している。そして、磁気ディスク制御装置
が、磁気ディスク装置を再立ち上げをするときに状態情
報記憶部に格納された状態情報に基づいて当該再立ち上
げ直前の各磁気ディスク装置の動作状態を再現する直前
状態再現手段と、固有情報記憶部及び磁気ディスク装置
にそれぞれ格納された固有情報を比較すると共に当該比
較結果に基づいて再立ち上げ直前から当該磁気ディスク
装置が入れ替えられたか否かの接続状態を判定する接続
状態判定手段と、この接続状態判定手段によって判定さ
れた接続状態情報と直前状態再現手段によって再現され
た直前の各磁気ディスク装置の動作状態情報とに基づい
て復旧処理の継続又は開始を制御する復旧制御手段とを
備えた、という構成を採っている。これにより前述した
目的を達成しようとするものである。
位装置から送信されたデータを冗長構成として格納する
複数の磁気ディスク装置と、この複数の磁気ディスク装
置を識別する固有情報を各磁気ディスク装置毎に記憶す
る不揮発性の固有情報記憶部と、この固有情報記憶部に
格納された固有情報に基づいて磁気ディスク装置の接続
状態を判定すると共に磁気ディスク装置に異常が発生し
たときに冗長構成に基づいて当該異常により失われたデ
ータを復旧させる磁気ディスク制御装置とを備えてい
る。しかも、磁気ディスク制御装置が、各磁気ディスク
装置の初期化時に当該各磁気ディスク装置から固有情報
を読み出すと共に当該各固有情報をそれぞれの固有情報
記憶部へ格納する初期化制御手段と、磁気ディスク装置
の障害発生の有無及び復旧処理中か否かの動作状態を管
理する状態情報を磁気ディスク装置の状態の変化に応じ
て書き換える状態情報制御手段とを備えている。さら
に、磁気ディスク制御装置に、状態情報制御手段によっ
て編集された状態情報を記憶する不揮発性の状態情報記
憶部を併設している。そして、磁気ディスク制御装置
が、磁気ディスク装置を再立ち上げをするときに状態情
報記憶部に格納された状態情報に基づいて当該再立ち上
げ直前の各磁気ディスク装置の動作状態を再現する直前
状態再現手段と、固有情報記憶部及び磁気ディスク装置
にそれぞれ格納された固有情報を比較すると共に当該比
較結果に基づいて再立ち上げ直前から当該磁気ディスク
装置が入れ替えられたか否かの接続状態を判定する接続
状態判定手段と、この接続状態判定手段によって判定さ
れた接続状態情報と直前状態再現手段によって再現され
た直前の各磁気ディスク装置の動作状態情報とに基づい
て復旧処理の継続又は開始を制御する復旧制御手段とを
備えた、という構成を採っている。これにより前述した
目的を達成しようとするものである。
【0046】本発明によるディスクアレイシステムは、
データを冗長構成として各磁気ディスク装置に格納して
いる。このため、例えば1台の磁気ディスク装置に障害
が発生し、データの読み出しができなくなったとして
も、他の磁気ディスク装置に格納されたデータから当該
障害が発生した磁気ディスク装置に格納されていたデー
タを復旧することができる。
データを冗長構成として各磁気ディスク装置に格納して
いる。このため、例えば1台の磁気ディスク装置に障害
が発生し、データの読み出しができなくなったとして
も、他の磁気ディスク装置に格納されたデータから当該
障害が発生した磁気ディスク装置に格納されていたデー
タを復旧することができる。
【0047】また、本発明では、初期化制御手段が、各
磁気ディスク装置の初期化時に当該各磁気ディスク装置
から固有情報を読み出すと共に当該各固有情報をそれぞ
れの固有情報記憶部へ格納する。この固有情報は、各磁
気ディスク装置に必ず付されている情報を用いる。例え
ば、ベンダー名と各磁気ディスク装置の識別番号(シリ
アルナンバー)を用いるとよい。このため、磁気ディス
ク制御装置が独自に固有情報を付する場合と比較して、
より確実な各磁気ディスク装置の識別が行われる。従っ
て、接続状態判定手段は、固有情報の比較により、電源
の投入や障害発生後の再立ち上げのときに、磁気ディス
ク装置が交換されたか否かを確実に判定する。
磁気ディスク装置の初期化時に当該各磁気ディスク装置
から固有情報を読み出すと共に当該各固有情報をそれぞ
れの固有情報記憶部へ格納する。この固有情報は、各磁
気ディスク装置に必ず付されている情報を用いる。例え
ば、ベンダー名と各磁気ディスク装置の識別番号(シリ
アルナンバー)を用いるとよい。このため、磁気ディス
ク制御装置が独自に固有情報を付する場合と比較して、
より確実な各磁気ディスク装置の識別が行われる。従っ
て、接続状態判定手段は、固有情報の比較により、電源
の投入や障害発生後の再立ち上げのときに、磁気ディス
ク装置が交換されたか否かを確実に判定する。
【0048】さらに、本発明では、状態情報制御手段
が、磁気ディスク装置の障害発生の有無及び復旧処理中
か否かの動作状態を管理する状態情報を磁気ディスク装
置の状態の変化に応じて書き換え、復旧制御手段が、接
続状態判定手段によって判定された接続状態情報と直前
状態再現手段によって再現された直前の各磁気ディスク
装置の動作状態情報とに基づいて復旧処理の継続又は開
始を制御する。従って、立ち上げ前の直前の状態と、現
在の接続状態とに応じて、復旧処理を行うか否かを定め
る。このため、人為的な接続ミスがあった場合には、こ
れを確実に検出し、復旧処理を中止する等の処理が可能
となる。
が、磁気ディスク装置の障害発生の有無及び復旧処理中
か否かの動作状態を管理する状態情報を磁気ディスク装
置の状態の変化に応じて書き換え、復旧制御手段が、接
続状態判定手段によって判定された接続状態情報と直前
状態再現手段によって再現された直前の各磁気ディスク
装置の動作状態情報とに基づいて復旧処理の継続又は開
始を制御する。従って、立ち上げ前の直前の状態と、現
在の接続状態とに応じて、復旧処理を行うか否かを定め
る。このため、人為的な接続ミスがあった場合には、こ
れを確実に検出し、復旧処理を中止する等の処理が可能
となる。
【0049】
【発明の実施の形態】図1は本発明の一実施形態の構成
を示すブロック図である。本実施形態によるディスクア
レイシステムは、図1に示すように、上位装置から送信
されたデータを冗長構成として格納する複数の磁気ディ
スク装置(HDD装置)541〜545と、この複数のH
DD装置541〜545を識別する固有情報を各HDD装
置毎に記憶する不揮発性の不揮発性メモリ(不揮発性メ
モリ)551〜555と、この不揮発性メモリ551〜5
55に格納された固有情報に基づいてHDD装置541〜
545の接続状態を判定すると共にHDD装置541〜5
45に異常が発生したときに冗長構成に基づいて当該異
常により失われたデータを復旧させる磁気ディスク制御
装置(ディスクアレイコントローラ)3とを備えてい
る。
を示すブロック図である。本実施形態によるディスクア
レイシステムは、図1に示すように、上位装置から送信
されたデータを冗長構成として格納する複数の磁気ディ
スク装置(HDD装置)541〜545と、この複数のH
DD装置541〜545を識別する固有情報を各HDD装
置毎に記憶する不揮発性の不揮発性メモリ(不揮発性メ
モリ)551〜555と、この不揮発性メモリ551〜5
55に格納された固有情報に基づいてHDD装置541〜
545の接続状態を判定すると共にHDD装置541〜5
45に異常が発生したときに冗長構成に基づいて当該異
常により失われたデータを復旧させる磁気ディスク制御
装置(ディスクアレイコントローラ)3とを備えてい
る。
【0050】しかも、ディスクアレイコントローラ3
が、HDD装置541〜545の初期化時に当該各HDD
装置541〜545から固有情報を読み出すと共に当該各
固有情報をそれぞれの不揮発性メモリ551〜555へ格
納する初期化制御手段5と、HDD装置541〜545の
障害発生の有無及び復旧処理中か否かの動作状態を管理
する状態情報をHDD装置541〜545の状態の変化に
応じて書き換える状態情報制御手段6とを備えている。
が、HDD装置541〜545の初期化時に当該各HDD
装置541〜545から固有情報を読み出すと共に当該各
固有情報をそれぞれの不揮発性メモリ551〜555へ格
納する初期化制御手段5と、HDD装置541〜545の
障害発生の有無及び復旧処理中か否かの動作状態を管理
する状態情報をHDD装置541〜545の状態の変化に
応じて書き換える状態情報制御手段6とを備えている。
【0051】さらに、ディスクアレイコントローラ3
に、状態情報制御手段6によって編集された状態情報を
記憶する不揮発性の状態情報記憶部19を併設してい
る。
に、状態情報制御手段6によって編集された状態情報を
記憶する不揮発性の状態情報記憶部19を併設してい
る。
【0052】そして、ディスクアレイコントローラ3
が、HDD装置541〜545を再立ち上げをするときに
状態情報記憶部19に格納された状態情報に基づいて当
該再立ち上げ直前の各HDD装置541〜545の動作状
態を再現する直前状態再現手段7と、不揮発性メモリ5
51〜555及びHDD装置541〜545にそれぞれ格納
された固有情報を比較すると共に当該比較結果に基づい
て再立ち上げ直前から当該HDD装置541〜545が入
れ替えられたか否かの接続状態を判定する接続状態判定
手段8と、この接続状態判定手段8によって判定された
接続状態情報と直前状態再現手段7によって再現された
直前の各HDD装置541〜545の動作状態情報とに基
づいて復旧処理の継続又は開始を制御する復旧制御手段
9とを備えている。
が、HDD装置541〜545を再立ち上げをするときに
状態情報記憶部19に格納された状態情報に基づいて当
該再立ち上げ直前の各HDD装置541〜545の動作状
態を再現する直前状態再現手段7と、不揮発性メモリ5
51〜555及びHDD装置541〜545にそれぞれ格納
された固有情報を比較すると共に当該比較結果に基づい
て再立ち上げ直前から当該HDD装置541〜545が入
れ替えられたか否かの接続状態を判定する接続状態判定
手段8と、この接続状態判定手段8によって判定された
接続状態情報と直前状態再現手段7によって再現された
直前の各HDD装置541〜545の動作状態情報とに基
づいて復旧処理の継続又は開始を制御する復旧制御手段
9とを備えている。
【0053】初期化制御手段5が、HDD装置に固有な
情報を不揮発性メモリ55に格納するため、接続状態判
定手段8は、不揮発性メモリ551〜555及びHDD装
置541〜545にそれぞれ格納された固有情報を比較す
ると共に当該比較結果に基づいて再立ち上げ直前から当
該HDD装置541〜545が入れ替えられたか否かの接
続状態を判定することができる。すなわち、HDD装置
が交換された場合、不揮発性メモリに格納された固有情
報とその交換されたHDD装置の固有情報は必ず異な
り、一方、交換されていない場合には必ず一致するた
め、接続状態判定手段8は、現在のHDD装置の接続状
態を正確に判定することができる。
情報を不揮発性メモリ55に格納するため、接続状態判
定手段8は、不揮発性メモリ551〜555及びHDD装
置541〜545にそれぞれ格納された固有情報を比較す
ると共に当該比較結果に基づいて再立ち上げ直前から当
該HDD装置541〜545が入れ替えられたか否かの接
続状態を判定することができる。すなわち、HDD装置
が交換された場合、不揮発性メモリに格納された固有情
報とその交換されたHDD装置の固有情報は必ず異な
り、一方、交換されていない場合には必ず一致するた
め、接続状態判定手段8は、現在のHDD装置の接続状
態を正確に判定することができる。
【0054】さらに、状態情報制御手段6が、HDD装
置541〜545の障害発生の有無及び復旧処理中か否か
の動作状態を管理する状態情報をHDD装置541〜5
45の状態の変化に応じて書き換え、この状態情報を不
揮発性の状態情報記憶部19に格納する。このため、停
電等によるシステムダウンが生じても、HDD装置54
1〜545を再立ち上げをするときに、直前状態再現手段
7は、この状態情報記憶部19に格納された状態情報に
基づいて当該再立ち上げ直前の各HDD装置541〜5
45の動作状態を再現することができる。すなわち、シ
ステムダウンなど不慮の事態が生じても、「正常」,
「障害」,「復旧処理中」などの直前の各HDD装置の
動作状態が再現される。
置541〜545の障害発生の有無及び復旧処理中か否か
の動作状態を管理する状態情報をHDD装置541〜5
45の状態の変化に応じて書き換え、この状態情報を不
揮発性の状態情報記憶部19に格納する。このため、停
電等によるシステムダウンが生じても、HDD装置54
1〜545を再立ち上げをするときに、直前状態再現手段
7は、この状態情報記憶部19に格納された状態情報に
基づいて当該再立ち上げ直前の各HDD装置541〜5
45の動作状態を再現することができる。すなわち、シ
ステムダウンなど不慮の事態が生じても、「正常」,
「障害」,「復旧処理中」などの直前の各HDD装置の
動作状態が再現される。
【0055】このため、本実施形態では、直前状態再現
手段7によって再現された直前状態と、接続状態判定手
段8によって判定された現在のHDD装置の接続状態と
に基づいて、復旧処理の可否を制御することができる。
復旧制御手段9は、直前状態情報及び接続状態情報に基
づいて復旧の可否を判定し、例えば、復旧継続制御機能
により、直前に行われていた復旧処理を継続させ、また
は、復旧中止制御機能により直前に行われていた復旧処
理を中止させる。
手段7によって再現された直前状態と、接続状態判定手
段8によって判定された現在のHDD装置の接続状態と
に基づいて、復旧処理の可否を制御することができる。
復旧制御手段9は、直前状態情報及び接続状態情報に基
づいて復旧の可否を判定し、例えば、復旧継続制御機能
により、直前に行われていた復旧処理を継続させ、また
は、復旧中止制御機能により直前に行われていた復旧処
理を中止させる。
【0056】すなわち、ある実施例では、復旧制御手段
9は、直前状態再現手段7によって直前に復旧中であっ
たと判定されたHDD装置54が接続状態判定手段8に
よって当該直前から現在まで入れ替えられていないと判
定されたときには当該復旧を継続させる制御をする復旧
継続制御機能(S503→S518)と、直前状態再現
手段7によって直前に復旧中であったと判定されたHD
D装置54が接続状態判定手段8によって当該直前から
現在まで入れ替えられたと判定されたときには当該復旧
を中止させる制御をする復旧中止制御機能(S503→
S517)とを備える。
9は、直前状態再現手段7によって直前に復旧中であっ
たと判定されたHDD装置54が接続状態判定手段8に
よって当該直前から現在まで入れ替えられていないと判
定されたときには当該復旧を継続させる制御をする復旧
継続制御機能(S503→S518)と、直前状態再現
手段7によって直前に復旧中であったと判定されたHD
D装置54が接続状態判定手段8によって当該直前から
現在まで入れ替えられたと判定されたときには当該復旧
を中止させる制御をする復旧中止制御機能(S503→
S517)とを備える。
【0057】復旧継続制御機能により、直前に復旧処理
中であり、また復旧データを記録しているHDD装置と
他のHDD装置とが誤って交換されていない場合にのみ
自動的に復旧処理を継続することで、他のデータが格納
されているHDD装置を誤って接続した場合であって
も、この他のデータが格納されているHDD装置のデー
タに上書きしてしまうことがない。
中であり、また復旧データを記録しているHDD装置と
他のHDD装置とが誤って交換されていない場合にのみ
自動的に復旧処理を継続することで、他のデータが格納
されているHDD装置を誤って接続した場合であって
も、この他のデータが格納されているHDD装置のデー
タに上書きしてしまうことがない。
【0058】また、実施例によっては、復旧制御手段9
は、直前状態再現手段7によって直前に復旧中ではない
と判定されたHDD装置54が接続状態判定手段8によ
って当該直前から現在まで入れ替えられたと判定された
ときには当該HDD装置54を復旧させるか否かを上位
装置へ問い合わせる復旧可否問い合わせ機能(S504
→S505)を備える。これにより、新しくHDD装置
を障害HDD装置と入れ替えて、復旧可能な場合には、
当該HDD装置のデータの復旧の可否を必ず上位装置に
問い合わせることとなり、従って、他のデータが格納さ
れたHDD装置が誤って接続されたときであっても、上
位装置に確認を求めることで、復旧処理によりデータを
喪失してしまう事態を有効に防止することができる。
は、直前状態再現手段7によって直前に復旧中ではない
と判定されたHDD装置54が接続状態判定手段8によ
って当該直前から現在まで入れ替えられたと判定された
ときには当該HDD装置54を復旧させるか否かを上位
装置へ問い合わせる復旧可否問い合わせ機能(S504
→S505)を備える。これにより、新しくHDD装置
を障害HDD装置と入れ替えて、復旧可能な場合には、
当該HDD装置のデータの復旧の可否を必ず上位装置に
問い合わせることとなり、従って、他のデータが格納さ
れたHDD装置が誤って接続されたときであっても、上
位装置に確認を求めることで、復旧処理によりデータを
喪失してしまう事態を有効に防止することができる。
【0059】さらに、実施例によっては、復旧制御手段
9は、直前状態再現手段7によって直前に復旧中ではな
いと判定されたHDD装置54が接続状態判定手段8に
よって当該直前から現在まで入れ替えられていない判定
されたときには当該HDD装置54の動作テストを行う
と共に当該動作テストによってエラーが生じなければ当
該HDD装置54を復旧させる制御をする復旧開始制御
機能(S504→S5)506)を備える。すなわち、
一旦障害が発生したと判定されたHDD装置が交換され
ずに動作テストでエラーが生じなかった場合には、当該
HDD装置に他のデータが格納されていることはないた
め、自動的に復旧処理を開始する。
9は、直前状態再現手段7によって直前に復旧中ではな
いと判定されたHDD装置54が接続状態判定手段8に
よって当該直前から現在まで入れ替えられていない判定
されたときには当該HDD装置54の動作テストを行う
と共に当該動作テストによってエラーが生じなければ当
該HDD装置54を復旧させる制御をする復旧開始制御
機能(S504→S5)506)を備える。すなわち、
一旦障害が発生したと判定されたHDD装置が交換され
ずに動作テストでエラーが生じなかった場合には、当該
HDD装置に他のデータが格納されていることはないた
め、自動的に復旧処理を開始する。
【0060】このように、本実施形態では、HDD装置
の接続ミスを検出するため、人為的ミスによりデータが
失われることがなくなる。さらに、障害HDD装置が交
換された時には、人手介入により復旧を開始するため、
交換時のミスによりデータが失われることを防げ、復旧
を開始した後は、システムがダウンしても再立ち上げ時
に自動検出して復旧を開始するため、上位装置を介して
入力する必要がなくなる。
の接続ミスを検出するため、人為的ミスによりデータが
失われることがなくなる。さらに、障害HDD装置が交
換された時には、人手介入により復旧を開始するため、
交換時のミスによりデータが失われることを防げ、復旧
を開始した後は、システムがダウンしても再立ち上げ時
に自動検出して復旧を開始するため、上位装置を介して
入力する必要がなくなる。
【0061】
【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。本実施例では、上述した各手段によ
りディスクアレイシステムの信頼性を向上させるほか、
各記憶部の状態のチェックを行う。具体的には、各記憶
部に各種の情報を書き込むときにベリファイを行う。
て詳細に説明する。本実施例では、上述した各手段によ
りディスクアレイシステムの信頼性を向上させるほか、
各記憶部の状態のチェックを行う。具体的には、各記憶
部に各種の情報を書き込むときにベリファイを行う。
【0062】すなわち、本実施例では、ディスクアレイ
コントローラ3が、固有情報を各不揮発性メモリ55に
書き込んだときに当該不揮発性メモリ55に書き込んだ
固有情報を読み出すと共に当該読み出した固有情報が書
き込もうとした固有情報と一致するか否かを確認する固
有情報記憶部確認手段を備えている。しかも、状態情報
制御手段6が、固有情報記憶部確認手段によって一致し
ないと判定されたときに当該固有情報のHDD装置54
を障害有りと判定する固有情報記憶部障害判定機能を備
える。
コントローラ3が、固有情報を各不揮発性メモリ55に
書き込んだときに当該不揮発性メモリ55に書き込んだ
固有情報を読み出すと共に当該読み出した固有情報が書
き込もうとした固有情報と一致するか否かを確認する固
有情報記憶部確認手段を備えている。しかも、状態情報
制御手段6が、固有情報記憶部確認手段によって一致し
ないと判定されたときに当該固有情報のHDD装置54
を障害有りと判定する固有情報記憶部障害判定機能を備
える。
【0063】また、実施例によっては、固有情報記憶部
が、単一の不揮発性メモリを各HDD装置54に割り当
てた記憶領域を備える。この場合、固有情報記憶部障害
判定機能は、固有情報記憶部確認手段によって記憶領域
に格納した固有情報が一致しないと判定されたときには
各HDD装置54の全てが障害有りと判定する機能を備
える。
が、単一の不揮発性メモリを各HDD装置54に割り当
てた記憶領域を備える。この場合、固有情報記憶部障害
判定機能は、固有情報記憶部確認手段によって記憶領域
に格納した固有情報が一致しないと判定されたときには
各HDD装置54の全てが障害有りと判定する機能を備
える。
【0064】さらに、本実施例では、ディスクアレイコ
ントローラが、状態情報を状態情報記憶部(不揮発性メ
モリ)19に書き込んだときに当該状態情報記憶部に書
き込んだ状態情報を読み出すと共に当該読み出した状態
情報が書き込もうとした状態情報と一致するか否かを確
認する状態情報記憶部確認手段を備える。
ントローラが、状態情報を状態情報記憶部(不揮発性メ
モリ)19に書き込んだときに当該状態情報記憶部に書
き込んだ状態情報を読み出すと共に当該読み出した状態
情報が書き込もうとした状態情報と一致するか否かを確
認する状態情報記憶部確認手段を備える。
【0065】しかも、状態情報制御手段6が、状態情報
記憶部確認手段によって一致しないと判定されたときに
は各HDD装置54の全てが障害有りであると判定する
状態情報記憶部障害判定機能を備える。
記憶部確認手段によって一致しないと判定されたときに
は各HDD装置54の全てが障害有りであると判定する
状態情報記憶部障害判定機能を備える。
【0066】このように、本実施例では、各HDD装置
の状態を立ち上げ時に自動検出するとともに不揮発性メ
モリの障害も検出するため、システムダウン後の再立ち
上げ時に誤動作を生じることがくなる。
の状態を立ち上げ時に自動検出するとともに不揮発性メ
モリの障害も検出するため、システムダウン後の再立ち
上げ時に誤動作を生じることがくなる。
【0067】次に、本実施例の動作を説明する。上位装
置61からのアクセス要求(読み出しまたは書き込み要
求)は、インターフェース52を介してディスクアレイ
コントローラ3に入力される。ディスクアレイコントロ
ーラ53は、その要求内容に応じて、HDD装置54を
制御して、データの読み出しまたは書き込みを行う。ま
た、不揮発性メモリ19内の情報を基にHDD装置の状
態の判定を行い、不揮発性メモリ55内の情報とHDD
装置の固有情報22を基にHDD装置の状態を判定す
る。
置61からのアクセス要求(読み出しまたは書き込み要
求)は、インターフェース52を介してディスクアレイ
コントローラ3に入力される。ディスクアレイコントロ
ーラ53は、その要求内容に応じて、HDD装置54を
制御して、データの読み出しまたは書き込みを行う。ま
た、不揮発性メモリ19内の情報を基にHDD装置の状
態の判定を行い、不揮発性メモリ55内の情報とHDD
装置の固有情報22を基にHDD装置の状態を判定す
る。
【0068】本実施例のディスクアレイコントローラ3
は、制御用プロセッサとその制御用プロセッサを規定す
るプログラムが格納されたプログラムメモリと、動作時
に使用するパラメータを格納するメモリと、各HDD装
置54に読み出しまたは書き込みを行うためのインター
フェースと、各HDD装置54にそれぞれ対応した不揮
発性メモリ55へのインターフェースと管理情報を格納
する不揮発性メモリ19へのインターフェースとにより
実現できる。
は、制御用プロセッサとその制御用プロセッサを規定す
るプログラムが格納されたプログラムメモリと、動作時
に使用するパラメータを格納するメモリと、各HDD装
置54に読み出しまたは書き込みを行うためのインター
フェースと、各HDD装置54にそれぞれ対応した不揮
発性メモリ55へのインターフェースと管理情報を格納
する不揮発性メモリ19へのインターフェースとにより
実現できる。
【0069】〔初期化〕まず、初期化時の動作について
説明する。
説明する。
【0070】本実施例では、HDD装置から読み出して
不揮発性メモリ55へ書き込む固有情報D(i)とし
て、ベンダー名とシリアル番号を含む36バイトのIn
quiryデータを用いている。固有情報はこれに限ら
れるものではなく、たとえば、乱数を用いることや、ス
ロット番号を用いることや、日付や時間を示す情報を用
いることができるが、HDD装置ごとに、対応する固有
情報が異なるものを使用する。
不揮発性メモリ55へ書き込む固有情報D(i)とし
て、ベンダー名とシリアル番号を含む36バイトのIn
quiryデータを用いている。固有情報はこれに限ら
れるものではなく、たとえば、乱数を用いることや、ス
ロット番号を用いることや、日付や時間を示す情報を用
いることができるが、HDD装置ごとに、対応する固有
情報が異なるものを使用する。
【0071】図2は固有情報記憶部である不揮発性メモ
リ1655と、状態情報記憶部である不揮発性メモリ1
9とが正常か否かを検査する動作例を示すフローチャー
トであり、図3はこの各メモリ55,19が正常か又は
異常と判断されたHDD装置が1台であるときに引き続
き初期化処理を行う動作例を示すフローチャートであ
る。この動作は、上位装置からの初期化指示により開始
される。
リ1655と、状態情報記憶部である不揮発性メモリ1
9とが正常か否かを検査する動作例を示すフローチャー
トであり、図3はこの各メモリ55,19が正常か又は
異常と判断されたHDD装置が1台であるときに引き続
き初期化処理を行う動作例を示すフローチャートであ
る。この動作は、上位装置からの初期化指示により開始
される。
【0072】初期化指示を受信したディスクアレイコン
トローラ53は、各HDD装置を順次特定する変数i
に”1”、障害HDD装置台数カウンタNEER に”
0”、障害と判定したHDD装置を特定する管理情報配
列C(i)に”0”をセットする(S101)。
トローラ53は、各HDD装置を順次特定する変数i
に”1”、障害HDD装置台数カウンタNEER に”
0”、障害と判定したHDD装置を特定する管理情報配
列C(i)に”0”をセットする(S101)。
【0073】カウンタiはHDD装置を識別するための
カウンタであり、障害HDD装置台数カウンタN
EER は、使用不可能なHDD装置の台数のカウントに用
いられ、管理情報配列C(i)では、使用不可とするH
DD装置に”1”をセットする。
カウンタであり、障害HDD装置台数カウンタN
EER は、使用不可能なHDD装置の台数のカウントに用
いられ、管理情報配列C(i)では、使用不可とするH
DD装置に”1”をセットする。
【0074】これらのパラメータの格納には、ディスク
アレイコントローラ3内のメモリが用いられる。この
後、ディスクアレイコントローラ3は管理情報格納用の
不揮発性メモリ19が正常であるか否かのテストを、ベ
リファイにより行う(S102)。
アレイコントローラ3内のメモリが用いられる。この
後、ディスクアレイコントローラ3は管理情報格納用の
不揮発性メモリ19が正常であるか否かのテストを、ベ
リファイにより行う(S102)。
【0075】管理情報格納用の不揮発性メモリ19が正
常でない場合(N)には、ディスクアレイシステム障害
としてエラーメッセージを上位装置に出力し(S12
0)、初期化動作を終了する。
常でない場合(N)には、ディスクアレイシステム障害
としてエラーメッセージを上位装置に出力し(S12
0)、初期化動作を終了する。
【0076】管理情報格納用の不揮発性メモリ19が正
常である場合(S102:Y)には、i番の不揮発性メ
モリ55が正常であるか否かのテストをベリファイによ
り行う(S103)。
常である場合(S102:Y)には、i番の不揮発性メ
モリ55が正常であるか否かのテストをベリファイによ
り行う(S103)。
【0077】i番の不揮発性メモリ55が正常である場
合(S103:Y)には、S106へ進み、i番の不揮
発性メモリ55が正常でない場合(S103:N)に
は、NEER に”1”を加算、C(i)に”1”をセット
し、管理情報を格納するための不揮発性メモリ19へC
(i)を書き込む(S104,初期化制御手段5)。す
なわち、固有情報記憶部である不揮発性メモリ55が異
常である場合には、当該不揮発性メモリ55に併設され
たHDD装置を障害有りとする。
合(S103:Y)には、S106へ進み、i番の不揮
発性メモリ55が正常でない場合(S103:N)に
は、NEER に”1”を加算、C(i)に”1”をセット
し、管理情報を格納するための不揮発性メモリ19へC
(i)を書き込む(S104,初期化制御手段5)。す
なわち、固有情報記憶部である不揮発性メモリ55が異
常である場合には、当該不揮発性メモリ55に併設され
たHDD装置を障害有りとする。
【0078】この不揮発性メモリ19への管理情報C
(i)の書き込みが正常でない場合(S105:N)に
は、ディスクアレイシステム障害としてエラーメッセー
ジを上位装置に出力(S120)して処理を終了する。
すなわち、状態情報記憶部である不揮発性メモリ19が
異常である場合には、ディスクアレイシステム全体を障
害有りとする。一方、不揮発性メモリ19への書き込み
が正常である場合(S105:Y)には、S106へ進
む。
(i)の書き込みが正常でない場合(S105:N)に
は、ディスクアレイシステム障害としてエラーメッセー
ジを上位装置に出力(S120)して処理を終了する。
すなわち、状態情報記憶部である不揮発性メモリ19が
異常である場合には、ディスクアレイシステム全体を障
害有りとする。一方、不揮発性メモリ19への書き込み
が正常である場合(S105:Y)には、S106へ進
む。
【0079】S106では、パラメータiに”1”が加
算され、iが全HDD装置の台数以下の場合(S10
7:Y)には、S103へ戻り、次の不揮発性メモリ5
5のテストを行う。変数iが全HDD装置台数より大き
くなったとき(S107:N)には、全ての不揮発性メ
モリ55の検査が終了したため、NEER 値の判定(S1
08)を行う。
算され、iが全HDD装置の台数以下の場合(S10
7:Y)には、S103へ戻り、次の不揮発性メモリ5
5のテストを行う。変数iが全HDD装置台数より大き
くなったとき(S107:N)には、全ての不揮発性メ
モリ55の検査が終了したため、NEER 値の判定(S1
08)を行う。
【0080】NEER が”2”以上である場合(S10
8:Y)には、1台のHDD装置のデータを復旧させる
システムでは、ディスクアレイシステムの動作が不可能
となるので、ディスクアレイシステム障害としてエラー
メッセージを上位装置に出力し(S120)、初期化動
作を終了する。NEER が”1”以下である場合(S10
8:N)には、磁気ディスク装置としての動作が可能で
あるため、図3のS109へ進む。
8:Y)には、1台のHDD装置のデータを復旧させる
システムでは、ディスクアレイシステムの動作が不可能
となるので、ディスクアレイシステム障害としてエラー
メッセージを上位装置に出力し(S120)、初期化動
作を終了する。NEER が”1”以下である場合(S10
8:N)には、磁気ディスク装置としての動作が可能で
あるため、図3のS109へ進む。
【0081】図3では、S109ではカウンタiに”
1”、固有情報配列D(i)に”0”をセットする。固
有情報配列D(i)は、各HDD装置54に予め格納さ
れた固有情報を格納する配列である。この固有情報配列
D(i)は、再立ち上げ処理において、各固有情報記憶
部である不揮発性メモリ55に格納された固有情報の配
列E(i)と比較される。
1”、固有情報配列D(i)に”0”をセットする。固
有情報配列D(i)は、各HDD装置54に予め格納さ
れた固有情報を格納する配列である。この固有情報配列
D(i)は、再立ち上げ処理において、各固有情報記憶
部である不揮発性メモリ55に格納された固有情報の配
列E(i)と比較される。
【0082】i番の不揮発性メモリ55が正常でなかっ
た場合(S110:Y)は、S117へ進む。i番の不
揮発性メモリ55が正常だった場合(S110:N)に
は、i番のHDD装置からHDD装置の固有情報D
(i)を読み出し(S111)、読み出しが正常に行え
なかった場合(S112:N)には、NEER に”1”を
加算、C(i)に”1”をセットし、管理情報を格納す
るための不揮発性メモリ19へC(i)を書き込み(S
115)、書き込みが正常でない場合(S116:N)
には、ディスクアレイシステム障害としてエラーメッセ
ージを上位装置に出力(S120)して処理を終了し、
書き込みが正常である場合(S116:Y)には、S1
17へ進む。
た場合(S110:Y)は、S117へ進む。i番の不
揮発性メモリ55が正常だった場合(S110:N)に
は、i番のHDD装置からHDD装置の固有情報D
(i)を読み出し(S111)、読み出しが正常に行え
なかった場合(S112:N)には、NEER に”1”を
加算、C(i)に”1”をセットし、管理情報を格納す
るための不揮発性メモリ19へC(i)を書き込み(S
115)、書き込みが正常でない場合(S116:N)
には、ディスクアレイシステム障害としてエラーメッセ
ージを上位装置に出力(S120)して処理を終了し、
書き込みが正常である場合(S116:Y)には、S1
17へ進む。
【0083】i番のHDD装置のD(i)が正常に読み
出せたとき(S112:Y)には、i番の不揮発性メモ
リ55にD(i)を書き込み(S113)、書き込みが
正常に行えなかった場合(S114:N)には、NEER
に”1”を加算、C(i)に”1”をセットし、管理情
報を格納するための不揮発性メモリ19へC(i)を書
き込む(S115)。
出せたとき(S112:Y)には、i番の不揮発性メモ
リ55にD(i)を書き込み(S113)、書き込みが
正常に行えなかった場合(S114:N)には、NEER
に”1”を加算、C(i)に”1”をセットし、管理情
報を格納するための不揮発性メモリ19へC(i)を書
き込む(S115)。
【0084】この不揮発性メモリへの書き込みが正常で
ない場合(S116:N)には、ディスクアレイシステ
ム障害としてエラーメッセージを上位装置に出力(S1
20)して処理を終了し、書き込みが正常である場合
(S116:Y)には、S117へ進む。
ない場合(S116:N)には、ディスクアレイシステ
ム障害としてエラーメッセージを上位装置に出力(S1
20)して処理を終了し、書き込みが正常である場合
(S116:Y)には、S117へ進む。
【0085】i番の不揮発性メモリ55へD(i)の書
き込みが正常に行えた場合(S114:Y)には、S1
17へ進む。S117では、パラメータiに”1”が加
算され、iが全HDD装置の台数以下の場合(S11
8:Y)には、S110へ戻り、次のHDD装置からの
固有情報の読み込みと不揮発性メモリ55への書き込み
が行われる。
き込みが正常に行えた場合(S114:Y)には、S1
17へ進む。S117では、パラメータiに”1”が加
算され、iが全HDD装置の台数以下の場合(S11
8:Y)には、S110へ戻り、次のHDD装置からの
固有情報の読み込みと不揮発性メモリ55への書き込み
が行われる。
【0086】iが全HDD装置台数より大きくなったと
き(S118:N)に、NEER 値の判定(S119)が
行われる。NEER が”0”である場合には、全HDD装
置および不揮発性メモリ55が正常であるので、初期動
作を完了させる。
き(S118:N)に、NEER 値の判定(S119)が
行われる。NEER が”0”である場合には、全HDD装
置および不揮発性メモリ55が正常であるので、初期動
作を完了させる。
【0087】NEER が”2”以上の値であるときには、
磁気ディスク装置の動作が不可能となるので、障害磁気
ディスク装置としてのエラーメッセージを上位装置に出
力(S120)して、初期化動作を終了する。障害磁気
ディスク装置と判断された磁気ディスク装置は、記憶装
置として動作させることはできない。
磁気ディスク装置の動作が不可能となるので、障害磁気
ディスク装置としてのエラーメッセージを上位装置に出
力(S120)して、初期化動作を終了する。障害磁気
ディスク装置と判断された磁気ディスク装置は、記憶装
置として動作させることはできない。
【0088】また、NEER が”1”であるときには、デ
ータをデータを冗長構成とすることはできないが、記憶
装置として動作させることは可能であるので、C(i)
が”1”のHDD装置を使用不可として(S121)、
初期化動作を終了する。
ータをデータを冗長構成とすることはできないが、記憶
装置として動作させることは可能であるので、C(i)
が”1”のHDD装置を使用不可として(S121)、
初期化動作を終了する。
【0089】この図3に示す初期化処理は、初期化制御
手段5により制御される。
手段5により制御される。
【0090】〔障害発生時〕次に、ディスクアレイシス
テムが記憶装置として動作しているときに、HDD装置
541 〜145 のうちの1台に障害が発生した場合の動
作を説明する。ディスクアレイコントローラ3は、個々
のHDD装置で障害が発生した場合、不揮発性メモリ1
9の管理情報の変更を行う。具体的には、このディスク
アレイシステムでは、障害が発生したHDD装置に対応
する管理情報のビットを”1”に書き換える。
テムが記憶装置として動作しているときに、HDD装置
541 〜145 のうちの1台に障害が発生した場合の動
作を説明する。ディスクアレイコントローラ3は、個々
のHDD装置で障害が発生した場合、不揮発性メモリ1
9の管理情報の変更を行う。具体的には、このディスク
アレイシステムでは、障害が発生したHDD装置に対応
する管理情報のビットを”1”に書き換える。
【0091】管理情報として他の形式の方法を用いた場
合には、この変更方法もそれに応じて修正される。たと
えば、正常時には管理情報を示すビットが全て”1”と
する場合には、障害が発生すると、管理情報のビット
を”0”にするように装置を構成すればよい。
合には、この変更方法もそれに応じて修正される。たと
えば、正常時には管理情報を示すビットが全て”1”と
する場合には、障害が発生すると、管理情報のビット
を”0”にするように装置を構成すればよい。
【0092】〔復旧処理時〕また、本実施例では、不揮
発性メモリ19へ書き込むHDD装置の状態を示す管理
情報C(i)として、障害HDD装置を示すビットと復
旧中のHDD装置であることを示すビットをそれぞれの
HDD装置に対応させて用いている。HDD装置が全て
正常に動作しているときは、障害HDD装置を示すビッ
トは全て”0”であり、障害HDD装置がある場合はそ
の障害HDD装置にに対応するビットは”1”である。
発性メモリ19へ書き込むHDD装置の状態を示す管理
情報C(i)として、障害HDD装置を示すビットと復
旧中のHDD装置であることを示すビットをそれぞれの
HDD装置に対応させて用いている。HDD装置が全て
正常に動作しているときは、障害HDD装置を示すビッ
トは全て”0”であり、障害HDD装置がある場合はそ
の障害HDD装置にに対応するビットは”1”である。
【0093】復旧を行っているHDD装置は、復旧中の
HDD装置を示すビットが”1”であるが、このとき復
旧中を示すビットが”1”になっているものは1つだけ
である。本実施例では、この復旧中であるか否かを示す
情報に基づいて、再立ち上げ処理を制御する。
HDD装置を示すビットが”1”であるが、このとき復
旧中を示すビットが”1”になっているものは1つだけ
である。本実施例では、この復旧中であるか否かを示す
情報に基づいて、再立ち上げ処理を制御する。
【0094】〔再立ち上げ〕本実施例のディスクアレイ
システムでは、不揮発性メモリ19の管理情報と、HD
D装置の固有情報と不揮発性メモリ55に格納されてい
る固有情報を基に、装置の再立ち上げが行われたときに
は、以下のような手順で、各HDD装置の状態の判定を
行う。
システムでは、不揮発性メモリ19の管理情報と、HD
D装置の固有情報と不揮発性メモリ55に格納されてい
る固有情報を基に、装置の再立ち上げが行われたときに
は、以下のような手順で、各HDD装置の状態の判定を
行う。
【0095】図4乃至図8に、再立ち上げ時のディスク
アレイコントローラ53の動作の流れを示す。図4乃至
図8に示す処理では、符号A,B,C,D,E,Fでそ
れぞれ連続している。
アレイコントローラ53の動作の流れを示す。図4乃至
図8に示す処理では、符号A,B,C,D,E,Fでそ
れぞれ連続している。
【0096】まず、カウンタiに”1”、障害HDD装
置台数NEER に”0”、障害HDD装置識別パラメータ
NDISKに”0”、不揮発性メモリ19に格納されている
障害状態を示す管理情報配列C(i)に”0”、各HD
D装置から読み出した固有情報の配列D(i)に”
0”、各不揮発性メモリ55から読み出した固有情報の
配列E(i)に”0”、不揮発性メモリ19に格納され
ている復旧状態を示す管理情報配列F(i)に”0”を
セット(S401)する。
置台数NEER に”0”、障害HDD装置識別パラメータ
NDISKに”0”、不揮発性メモリ19に格納されている
障害状態を示す管理情報配列C(i)に”0”、各HD
D装置から読み出した固有情報の配列D(i)に”
0”、各不揮発性メモリ55から読み出した固有情報の
配列E(i)に”0”、不揮発性メモリ19に格納され
ている復旧状態を示す管理情報配列F(i)に”0”を
セット(S401)する。
【0097】そして、不揮発性メモリ19から、各HD
D装置の状態を示す管理情報配列C(i)と、復旧状態
を示す管理情報配列F(i)とを読み出す(S40
2)。読み出しが正常に行えなかった場合(S403:
N)には、ディスクアレイシステムの障害としてエラー
メッセージを出力し(S516)、処理を終了する。
D装置の状態を示す管理情報配列C(i)と、復旧状態
を示す管理情報配列F(i)とを読み出す(S40
2)。読み出しが正常に行えなかった場合(S403:
N)には、ディスクアレイシステムの障害としてエラー
メッセージを出力し(S516)、処理を終了する。
【0098】読み出しが正常に行えた場合(S403:
Y)には、C(i)が”1”であれば(S404:
Y)、図5に示すS415に処理を移行し、i番のHD
D装置から固有情報を読み出して、D(i)に格納する
(S415)。読み出しが正常でなければ(S417:
N)S420へ進む。
Y)には、C(i)が”1”であれば(S404:
Y)、図5に示すS415に処理を移行し、i番のHD
D装置から固有情報を読み出して、D(i)に格納する
(S415)。読み出しが正常でなければ(S417:
N)S420へ進む。
【0099】一方、読み出しが正常であれば(S41
7:Y)、i番の不揮発性メモリからE(i)を読み出
し(S416)、この読み出しが正常でなければ(S4
18:N)、S420へ進み、読み出しが正常であれば
(S418:Y)S412へ進む。
7:Y)、i番の不揮発性メモリからE(i)を読み出
し(S416)、この読み出しが正常でなければ(S4
18:N)、S420へ進み、読み出しが正常であれば
(S418:Y)S412へ進む。
【0100】S420では、i番のHDD装置から読み
出した固有情報D(i)とi番の不揮発性メモリから読
み出した固有情報が異なるように、固有情報の一部の書
き換えをおこない、S412へ進む。このステップS4
20での固有情報の書き換えにより、i番の不揮発性メ
モリ55に異常があることを記憶する。S412では、
NEER に1を加算、NDISKにiをセットし、図6に示す
S413へ進む。
出した固有情報D(i)とi番の不揮発性メモリから読
み出した固有情報が異なるように、固有情報の一部の書
き換えをおこない、S412へ進む。このステップS4
20での固有情報の書き換えにより、i番の不揮発性メ
モリ55に異常があることを記憶する。S412では、
NEER に1を加算、NDISKにiをセットし、図6に示す
S413へ進む。
【0101】図4に示すステップS404において、C
(i)が1でなければ(S404:N)、すなわち、再
立ち上げ直前に障害なしであったHDD装置について
は、図6に示すステップS405に処理を移行し、この
i番のHDD装置から固有情報D(i)を読み出す(S
405)。読み出しが正常に行えなかった場合(S40
6:N)には、S419へ進み、読み出しが正常に行え
た場合(S406:Y)には、i番の不揮発性メモリ5
5から格納されている固有情報E(i)を読み出す(S
407)。固有情報E(i)の読み出しが正常に行えな
かった場合(S408:N)には、S419へ進む。
(i)が1でなければ(S404:N)、すなわち、再
立ち上げ直前に障害なしであったHDD装置について
は、図6に示すステップS405に処理を移行し、この
i番のHDD装置から固有情報D(i)を読み出す(S
405)。読み出しが正常に行えなかった場合(S40
6:N)には、S419へ進み、読み出しが正常に行え
た場合(S406:Y)には、i番の不揮発性メモリ5
5から格納されている固有情報E(i)を読み出す(S
407)。固有情報E(i)の読み出しが正常に行えな
かった場合(S408:N)には、S419へ進む。
【0102】S419では、HDD装置の異常又はその
不揮発性メモリ55に異常がある場合には、i番のHD
D装置から読み出した固有情報D(i)とi番の不揮発
性メモリから読み出した固有情報が異なるように、固有
情報の一部の書き換えをおこない、S410へ進む。
不揮発性メモリ55に異常がある場合には、i番のHD
D装置から読み出した固有情報D(i)とi番の不揮発
性メモリから読み出した固有情報が異なるように、固有
情報の一部の書き換えをおこない、S410へ進む。
【0103】固有情報E(i)の読み出しが正常に行え
た場合(S408:Y)には、i番のHDD装置から読
み出した固有情報D(i)とi番の不揮発性メモリ55
から読み出した固有情報E(i)を比較し、D(i)と
E(i)が異なる場合(S409:N)にはS410へ
進み、D(i)とE(i)が等しい場合(S409:
Y)には、S413へ進む。このS409で一致しない
場合には、そのHDD装置が交換されたことを意味す
る。
た場合(S408:Y)には、i番のHDD装置から読
み出した固有情報D(i)とi番の不揮発性メモリ55
から読み出した固有情報E(i)を比較し、D(i)と
E(i)が異なる場合(S409:N)にはS410へ
進み、D(i)とE(i)が等しい場合(S409:
Y)には、S413へ進む。このS409で一致しない
場合には、そのHDD装置が交換されたことを意味す
る。
【0104】このため、S410ではNEER に”1”を
加算、NDISKにiをセット、C(i)に”1”をセット
し、管理情報を格納するための不揮発性メモリ19へC
(i)を書き込み(S410)、書き込みが正常でない
場合(S411:N)には、処理2を行い、書き込みが
正常である場合(S411:Y)には、S413へ進
む。
加算、NDISKにiをセット、C(i)に”1”をセット
し、管理情報を格納するための不揮発性メモリ19へC
(i)を書き込み(S410)、書き込みが正常でない
場合(S411:N)には、処理2を行い、書き込みが
正常である場合(S411:Y)には、S413へ進
む。
【0105】さらに、S413では、パラメータiに”
1”が加算され、iが全HDD装置の台数以下の場合
(S414:Y)には、図4のS404へ戻り、次のH
DD装置の固有情報と不揮発性メモリ55の固有情報と
の比較が行われる。
1”が加算され、iが全HDD装置の台数以下の場合
(S414:Y)には、図4のS404へ戻り、次のH
DD装置の固有情報と不揮発性メモリ55の固有情報と
の比較が行われる。
【0106】このような動作をiが全HDD装置台数よ
り大きくなるまで、繰り返すことにより(S414:
N)、NEER には正常でないHDD装置の数がセットさ
れ、管理情報C(i)には、障害の発生しているHDD
装置を識別するビットがセットされることになる。
り大きくなるまで、繰り返すことにより(S414:
N)、NEER には正常でないHDD装置の数がセットさ
れ、管理情報C(i)には、障害の発生しているHDD
装置を識別するビットがセットされることになる。
【0107】また、管理情報を格納する不揮発性メモリ
55の障害によるディスクアレイシステム障害が検出さ
れたことになる。S419およびS420では、D
(i)に”FFh”、E(i)に”00h”を書き込ん
でいるが異なるようにすれば良いので値はこれに限らな
い。これは、読み出しには失敗するがデータは正常なも
のが送られてくる場合があるためで、回路の設計方法や
データの格納方法によっては使用しなくても構わない場
合もある。
55の障害によるディスクアレイシステム障害が検出さ
れたことになる。S419およびS420では、D
(i)に”FFh”、E(i)に”00h”を書き込ん
でいるが異なるようにすれば良いので値はこれに限らな
い。これは、読み出しには失敗するがデータは正常なも
のが送られてくる場合があるためで、回路の設計方法や
データの格納方法によっては使用しなくても構わない場
合もある。
【0108】この図4乃至図6に示す処理により、現在
のHDD装置の接続状態が確認され、交換されている場
合には、その交換されたHDD装置の番号がNDISKに格
納された。この接続状態の確認は、接続状態判定手段8
により行われる。
のHDD装置の接続状態が確認され、交換されている場
合には、その交換されたHDD装置の番号がNDISKに格
納された。この接続状態の確認は、接続状態判定手段8
により行われる。
【0109】次いで、図7及び図8に示す処理を行う。
まず、障害HDD装置台数カウンタNEER の判定を行い
(S501)、NEER が”0”であるときには、全HD
D装置が正常であるので、立ち上げ動作を終了する。
まず、障害HDD装置台数カウンタNEER の判定を行い
(S501)、NEER が”0”であるときには、全HD
D装置が正常であるので、立ち上げ動作を終了する。
【0110】NEER が”2”以上であるときには、実施
例のディスクアレイシステムの冗長構成ではカバーでき
ない障害であるため、障害磁気ディスク装置とし、エラ
ーメッセージを出力して(S516)、処理を終了す
る。
例のディスクアレイシステムの冗長構成ではカバーでき
ない障害であるため、障害磁気ディスク装置とし、エラ
ーメッセージを出力して(S516)、処理を終了す
る。
【0111】NEER が”1”であるときには、復旧状態
を示す管理情報F(NDISK)から電源切断前の状態が復
旧中であるかを判断する(S502)。電源切断前の状
態が復旧中であれば(S502:Y)、HDD装置から
読み出した固有情報D(NDI SK)と不揮発性メモリ55
から読み出した固有情報E(NDISK)が同じであるか比
較する(S504)。この比較により、F(NDISK)で
特定されるHDD装置が交換されていないと判定された
場合には、ステップS518以下の自動復旧処理を行
う。一方、異なれば(S503:N)当該HDD装置を
使用不可とする(S517)。
を示す管理情報F(NDISK)から電源切断前の状態が復
旧中であるかを判断する(S502)。電源切断前の状
態が復旧中であれば(S502:Y)、HDD装置から
読み出した固有情報D(NDI SK)と不揮発性メモリ55
から読み出した固有情報E(NDISK)が同じであるか比
較する(S504)。この比較により、F(NDISK)で
特定されるHDD装置が交換されていないと判定された
場合には、ステップS518以下の自動復旧処理を行
う。一方、異なれば(S503:N)当該HDD装置を
使用不可とする(S517)。
【0112】S502において、電源切断前が復旧中で
ない場合には、HDD装置から読み出した固有情報D
(NDISK)と不揮発性メモリ55から読み出した固有情
報E(NDISK)が同じであるか比較し、同じであれば
(S504:Y)、一旦障害有りと判定されたHDD装
置であるため、再度このNDISK番のHDD装置が正常か
否かのテストを行う(S506)。そして、正常であれ
ば(S507:Y)、復旧状態を示す管理情報配列F
(NDISK)に1を格納し、自動復旧処理を行う(S51
8)。一方、NDISK番のHDD装置のテストが正常でな
ければ(S507:N)、当該HDD装置を使用不可能
とする(S517)。
ない場合には、HDD装置から読み出した固有情報D
(NDISK)と不揮発性メモリ55から読み出した固有情
報E(NDISK)が同じであるか比較し、同じであれば
(S504:Y)、一旦障害有りと判定されたHDD装
置であるため、再度このNDISK番のHDD装置が正常か
否かのテストを行う(S506)。そして、正常であれ
ば(S507:Y)、復旧状態を示す管理情報配列F
(NDISK)に1を格納し、自動復旧処理を行う(S51
8)。一方、NDISK番のHDD装置のテストが正常でな
ければ(S507:N)、当該HDD装置を使用不可能
とする(S517)。
【0113】また、S504において、HDD装置から
読み出した固有情報D(NDISK)と不揮発性メモリ55
から読み出した固有情報E(NDISK)が同じであるか比
較し、異なる場合(S504:N)には、すなわち、障
害処理中ではないHDD装置が交換された場合には、図
8に示すステップS505に処理を移行し、上位装置か
らの復旧命令を待つ(S505)。そして、復旧命令を
受信したら(S505:Y)、NDISK番のHDD装置の
テストを行い(S508)、HDD装置のテストの結果
が正常でない場合(S509:N)には、使用不可とし
(ステップS517)、HDD装置のテストが正常な場
合(S509:Y)には、NDISK番のHDD装置からD
(NDISK)を読み出す(S510)。
読み出した固有情報D(NDISK)と不揮発性メモリ55
から読み出した固有情報E(NDISK)が同じであるか比
較し、異なる場合(S504:N)には、すなわち、障
害処理中ではないHDD装置が交換された場合には、図
8に示すステップS505に処理を移行し、上位装置か
らの復旧命令を待つ(S505)。そして、復旧命令を
受信したら(S505:Y)、NDISK番のHDD装置の
テストを行い(S508)、HDD装置のテストの結果
が正常でない場合(S509:N)には、使用不可とし
(ステップS517)、HDD装置のテストが正常な場
合(S509:Y)には、NDISK番のHDD装置からD
(NDISK)を読み出す(S510)。
【0114】読み出しが正常に行えなかった場合(S5
11:N)にはS517へ進み、読み出しが正常に行え
た場合(S511:Y)には、NDISK番の不揮発性メモ
リ55へD(NDISK)を書き込む(S512)。
11:N)にはS517へ進み、読み出しが正常に行え
た場合(S511:Y)には、NDISK番の不揮発性メモ
リ55へD(NDISK)を書き込む(S512)。
【0115】不揮発性メモリ55へD(NDISK)が正常
に書き込めなかった場合(S513:N)には、S51
7へ進み、正常に書き込めた場合(S513:Y)に
は、復旧状態を示す管理情報F(NDISK)に”1”をセ
ットして、不揮発性メモリ19へF(NDISK)を書き込
む(S514)。
に書き込めなかった場合(S513:N)には、S51
7へ進み、正常に書き込めた場合(S513:Y)に
は、復旧状態を示す管理情報F(NDISK)に”1”をセ
ットして、不揮発性メモリ19へF(NDISK)を書き込
む(S514)。
【0116】書き込みが正常に行えなかった場合(S5
15:N)には、処理2へ進み、書き込みが正常に行え
た場合(S515:Y)には、復旧作業を開始する(S
518)。
15:N)には、処理2へ進み、書き込みが正常に行え
た場合(S515:Y)には、復旧作業を開始する(S
518)。
【0117】図7及び図8に示すS518では、はN
DISK番のHDD装置を他のHDD装置内のデータから再
構築されたデータを書き込む復旧作業を行い(S51
8)、復旧作業が終了したら、管理情報C(NDISK)、
F(NDISK)にそれぞれ”0”をセット(S519)し
て再立ち上げ動作を終了する。
DISK番のHDD装置を他のHDD装置内のデータから再
構築されたデータを書き込む復旧作業を行い(S51
8)、復旧作業が終了したら、管理情報C(NDISK)、
F(NDISK)にそれぞれ”0”をセット(S519)し
て再立ち上げ動作を終了する。
【0118】以上説明した実施例の磁気ディスク装置で
は、固有情報を格納する不揮発性メモリを個々のHDD
装置に対応して備え、それとは別に管理情報を格納する
不揮発性メモリを用いた構成をしているが、固有情報を
格納する不揮発性メモリを1つにして、個々のHDD装
置の固有情報を格納する領域に分けた場合や、管理情報
と固有情報を全て1つの不揮発性メモリに領域を分けて
格納する場合があるが、このときは、S103のN、S
113のNの場合がS120へ、S408のN、S41
8のNが処理2へ、S512のNがS516へ行くよう
に変更する必要がある。
は、固有情報を格納する不揮発性メモリを個々のHDD
装置に対応して備え、それとは別に管理情報を格納する
不揮発性メモリを用いた構成をしているが、固有情報を
格納する不揮発性メモリを1つにして、個々のHDD装
置の固有情報を格納する領域に分けた場合や、管理情報
と固有情報を全て1つの不揮発性メモリに領域を分けて
格納する場合があるが、このときは、S103のN、S
113のNの場合がS120へ、S408のN、S41
8のNが処理2へ、S512のNがS516へ行くよう
に変更する必要がある。
【0119】これは固有情報を格納する不揮発性メモリ
を1つにした場合、1つの領域の読み出し、または書き
込みに失敗するということは、その不揮発性メモリ自体
の動作がおかしいことになるためであり、1つの不揮発
性メモリの他の領域の読み込み、または書き込みが成功
してもそのデータの信頼性が著しく低下するため、この
不揮発性メモリを使用しないようにするためである。
を1つにした場合、1つの領域の読み出し、または書き
込みに失敗するということは、その不揮発性メモリ自体
の動作がおかしいことになるためであり、1つの不揮発
性メモリの他の領域の読み込み、または書き込みが成功
してもそのデータの信頼性が著しく低下するため、この
不揮発性メモリを使用しないようにするためである。
【0120】実施例の磁気ディスク装置では、1台のH
DD装置の復旧しか行えない冗長構成を採用している
が、障害HDD装置識別パラメータを復旧可能な台数に
応じて増やし、障害HDD装置台数カウンタによる分岐
条件をすることで、2台以上のHDD装置を復旧できる
冗長構成をとることができる。
DD装置の復旧しか行えない冗長構成を採用している
が、障害HDD装置識別パラメータを復旧可能な台数に
応じて増やし、障害HDD装置台数カウンタによる分岐
条件をすることで、2台以上のHDD装置を復旧できる
冗長構成をとることができる。
【0121】また、実施例の磁気ディスク装置では、立
ち上げ時に一部自動的に復旧可能なディスクに対しては
復旧を行うように構成してあるが、この機構を設けず
に、上位装置からの指示により、復旧作業が開始される
ように構成してもよい。
ち上げ時に一部自動的に復旧可能なディスクに対しては
復旧を行うように構成してあるが、この機構を設けず
に、上位装置からの指示により、復旧作業が開始される
ように構成してもよい。
【0122】以上説明したように、本実施例によると、
各HDD装置の状態を立ち上げ時に立ち上げ時に自動検
出するとともに不揮発性メモリの障害も検出するため、
システムダウン後の再立ち上げ時に誤動作を生じること
がない。また、HDD装置の接続ミスも検出するため、
人為的ミスによりデータが失われることがない。さら
に、障害HDD装置が交換された時に、人手介入により
復旧を開始するため、交換時のミスによりデータが失わ
れることを防げ、復旧を開始した後は、システムがダウ
ンしても再立ち上げ時に自動検出して復旧を開始するた
め、上位装置を介して入力する必要がない。
各HDD装置の状態を立ち上げ時に立ち上げ時に自動検
出するとともに不揮発性メモリの障害も検出するため、
システムダウン後の再立ち上げ時に誤動作を生じること
がない。また、HDD装置の接続ミスも検出するため、
人為的ミスによりデータが失われることがない。さら
に、障害HDD装置が交換された時に、人手介入により
復旧を開始するため、交換時のミスによりデータが失わ
れることを防げ、復旧を開始した後は、システムがダウ
ンしても再立ち上げ時に自動検出して復旧を開始するた
め、上位装置を介して入力する必要がない。
【0123】
【発明の効果】本発明は以上のように構成され機能する
ので、これによると、状態情報制御手段が、磁気ディス
ク装置(HDD装置)の障害発生の有無及び復旧処理中
か否かの動作状態を管理する状態情報(C(i),F
(i))を磁気ディスク装置の状態の変化に応じて書き
換え、復旧制御手段が、接続状態判定手段によって判定
された接続状態情報(D(i),E(i))と直前状態
再現手段によって再現された直前の各磁気ディスク装置
の動作状態情報(C(i))とに基づいて復旧処理の継
続又は開始を制御するため、立ち上げ前の直前の状態
と、現在の接続状態とに応じて、復旧処理を行うか否か
を定めることができ、例えば、人為的な接続ミスがない
場合にのみ自動的に復旧処理を開始し、また、交換がさ
れたときには上位装置へ問い合わせを行うことができる
ため、復旧処理により必要なデータを上書きすることな
く、従って、信頼性をより向上させることができる従来
にない優れたディスクアレイシステムを提供することが
できる。
ので、これによると、状態情報制御手段が、磁気ディス
ク装置(HDD装置)の障害発生の有無及び復旧処理中
か否かの動作状態を管理する状態情報(C(i),F
(i))を磁気ディスク装置の状態の変化に応じて書き
換え、復旧制御手段が、接続状態判定手段によって判定
された接続状態情報(D(i),E(i))と直前状態
再現手段によって再現された直前の各磁気ディスク装置
の動作状態情報(C(i))とに基づいて復旧処理の継
続又は開始を制御するため、立ち上げ前の直前の状態
と、現在の接続状態とに応じて、復旧処理を行うか否か
を定めることができ、例えば、人為的な接続ミスがない
場合にのみ自動的に復旧処理を開始し、また、交換がさ
れたときには上位装置へ問い合わせを行うことができる
ため、復旧処理により必要なデータを上書きすることな
く、従って、信頼性をより向上させることができる従来
にない優れたディスクアレイシステムを提供することが
できる。
【図1】本発明の一実施形態の構成を示すブロック図で
ある。
ある。
【図2】本実施例による初期化処理の前段を示すフロー
チャートである。
チャートである。
【図3】本実施例による初期化処理の図2に続く後段を
示すフローチャートである。
示すフローチャートである。
【図4】本実施例による立ち上げ処理での立ち上げ直前
のHDD装置の障害状態によって処理を分岐する動作の
一例を示すフローチャートである。
のHDD装置の障害状態によって処理を分岐する動作の
一例を示すフローチャートである。
【図5】本実施例による立ち上げ処理での立ち上げ直前
に障害HDD装置であった場合の図4に続く接続状態確
認処理の一例を示すフローチャートである。
に障害HDD装置であった場合の図4に続く接続状態確
認処理の一例を示すフローチャートである。
【図6】本実施例による立ち上げ処理での立ち上げ直前
に諸害HDD装置ではなかった場合の図4に続く接続状
態確認処理の一例を示すフローチャートである。
に諸害HDD装置ではなかった場合の図4に続く接続状
態確認処理の一例を示すフローチャートである。
【図7】図5及び図6に示す接続状態確認処理に続く再
立ち上げ動作の一例を示すフローチャートである。
立ち上げ動作の一例を示すフローチャートである。
【図8】図7に示す立ち上げ処理で直前に復旧処理が行
われておらずかつHDD装置が交換された場合の処理を
示すフローチャートである。
われておらずかつHDD装置が交換された場合の処理を
示すフローチャートである。
【図9】従来例のRAIDのレベル0の磁気ディスク装
置の書き込み動作の概要を示す説明図である。
置の書き込み動作の概要を示す説明図である。
【図10】従来例のRAIDのレベル4のディスクアレ
イシステムの書き込み動作の概要を示す説明図である。
イシステムの書き込み動作の概要を示す説明図である。
【図11】従来のディスクアレイシステムの概略構成の
一例を示すブロック図である。
一例を示すブロック図である。
【図12】従来例のディスクアレイシステムの立ち上げ
時における各HDD装置の状態判定を行う動作のフロー
チャートであるである。
時における各HDD装置の状態判定を行う動作のフロー
チャートであるである。
【図13】従来例の磁気ディスク装置の立ち上げ時に、
図12の流れ図に引き続いて行われる動作を示すフロー
チャートである。
図12の流れ図に引き続いて行われる動作を示すフロー
チャートである。
【図14】従来例の構成を2つ以上持つディスクアレイ
システムの障害HDD装置交換例を示す説明図である。
システムの障害HDD装置交換例を示す説明図である。
3,53,53a,53b 磁気ディスク制御装置(デ
ィスクアレイコントローラ) 5 初期化制御手段 6 状態情報制御手段 7 直前状態再現手段 8 接続状態判定手段 9 復旧制御手段 19 状態情報記憶部(不揮発性メモリ) 51,51a,51b ディスクアレイシステム 52,52a,52b インターフェース 54,541 〜545 ,54a1 〜54a5 ,54b1
〜54b5 磁気ディスク装置(HDD装置) 55,551 〜555 ,55a1 〜55a5 ,55b1
〜55b5 固有情報記憶部(不揮発性メモリ) 56,56a,56b 時計回路 57,571 〜575 ,57a1 〜57a5 ,57b1
〜57b5 管理情報記録領域 581 〜585 記録領域 60 書き込み要求データ 61 上位装置
ィスクアレイコントローラ) 5 初期化制御手段 6 状態情報制御手段 7 直前状態再現手段 8 接続状態判定手段 9 復旧制御手段 19 状態情報記憶部(不揮発性メモリ) 51,51a,51b ディスクアレイシステム 52,52a,52b インターフェース 54,541 〜545 ,54a1 〜54a5 ,54b1
〜54b5 磁気ディスク装置(HDD装置) 55,551 〜555 ,55a1 〜55a5 ,55b1
〜55b5 固有情報記憶部(不揮発性メモリ) 56,56a,56b 時計回路 57,571 〜575 ,57a1 〜57a5 ,57b1
〜57b5 管理情報記録領域 581 〜585 記録領域 60 書き込み要求データ 61 上位装置
Claims (7)
- 【請求項1】 上位装置から送信されたデータを冗長構
成として格納する複数の磁気ディスク装置と、この複数
の磁気ディスク装置を識別する固有情報を前記各磁気デ
ィスク装置毎に記憶する不揮発性の固有情報記憶部と、
この固有情報記憶部に格納された固有情報に基づいて前
記磁気ディスク装置の接続状態を判定すると共に前記磁
気ディスク装置に異常が発生したときに前記冗長構成に
基づいて当該異常により失われたデータを復旧させる磁
気ディスク制御装置とを備えたディスクアレイシステム
において、 前記磁気ディスク制御装置が、前記各磁気ディスク装置
の初期化時に当該各磁気ディスク装置から固有情報を読
み出すと共に当該各固有情報をそれぞれの前記固有情報
記憶部へ格納する初期化制御手段と、前記磁気ディスク
装置の障害発生の有無及び復旧処理中か否かの動作状態
を管理する状態情報を前記磁気ディスク装置の状態の変
化に応じて書き換える状態情報制御手段とを備え、 前記磁気ディスク制御装置に、前記状態情報制御手段に
よって編集された状態情報を記憶する不揮発性の状態情
報記憶部を併設し、 前記磁気ディスク制御装置が、前記磁気ディスク装置を
再立ち上げをするときに前記状態情報記憶部に格納され
た状態情報に基づいて当該再立ち上げ直前の各磁気ディ
スク装置の動作状態を再現する直前状態再現手段と、前
記固有情報記憶部及び前記磁気ディスク装置にそれぞれ
格納された固有情報を比較すると共に当該比較結果に基
づいて前記再立ち上げ直前から当該磁気ディスク装置が
入れ替えられたか否かの接続状態を判定する接続状態判
定手段と、この接続状態判定手段によって判定された接
続状態情報と前記直前状態再現手段によって再現された
直前の各磁気ディスク装置の動作状態情報とに基づいて
前記復旧処理の継続又は開始を制御する復旧制御手段と
を備えたことを特徴とするディスクアレイシステム。 - 【請求項2】 前記復旧制御手段が、前記直前状態再現
手段によって前記直前に復旧処理中であったと判定され
た磁気ディスク装置が前記接続状態判定手段によって当
該直前から現在まで入れ替えられていないと判定された
ときには当該復旧処理を継続させる制御をする復旧継続
制御機能と、前記直前状態再現手段によって前記直前に
復旧処理中であったと判定された磁気ディスク装置が前
記接続状態判定手段によって当該直前から現在まで入れ
替えられたと判定されたときには当該復旧処理を中止さ
せる制御をする復旧中止制御機能とを備えたことを特徴
とする請求項1記載のディスクアレイシステム。 - 【請求項3】 前記直前状態再現手段によって前記直前
に復旧処理中ではないと判定された磁気ディスク装置が
前記接続状態判定手段によって当該直前から現在まで入
れ替えられたと判定されたときには当該磁気ディスク装
置を復旧させるか否かを前記上位装置へ問い合わせる復
旧可否問い合わせ機能を備えたことを特徴とする請求項
2記載のディスクアレイシステム。 - 【請求項4】 前記直前状態再現手段によって前記直前
に復旧中ではないと判定された磁気ディスク装置が前記
接続状態判定手段によって当該直前から現在まで入れ替
えられていない判定されたときには当該磁気ディスク装
置の動作テストを行うと共に当該動作テストによってエ
ラーが生じなければ当該磁気ディスク装置を復旧させる
制御をする復旧開始制御機能を備えたことを特徴とする
請求項2記載のディスクアレイシステム。 - 【請求項5】 前記磁気ディスク制御装置が、前記固有
情報を前記各固有情報記憶部に書き込んだときに当該固
有情報記憶部に書き込んだ固有情報を読み出すと共に当
該読み出した固有情報が書き込もうとした固有情報と一
致するか否かを確認する固有情報記憶部確認手段を備
え、 前記状態情報制御手段が、前記固有情報記憶部確認手段
によって一致しないと判定されたときに当該固有情報の
磁気ディスク装置を障害有りと判定する固有情報記憶部
障害判定機能を備えたことを特徴とする請求項1記載の
ディスクアレイシステム。 - 【請求項6】 前記固有情報記憶部が、単一の不揮発性
メモリを各磁気ディスク装置に割り当てた記憶領域を備
え、 前記固有情報記憶部障害判定機能が、前記固有情報記憶
部確認手段によって前記記憶領域に格納した固有情報が
一致しないと判定されたときには前記各磁気ディスク装
置の全てが障害有りと判定する機能を備えたことを特徴
とする請求項5記載のディスクアレイシステム。 - 【請求項7】 前記磁気ディスク制御装置が、前記状態
情報を前記状態情報記憶部に書き込んだときに当該状態
情報記憶部に書き込んだ状態情報を読み出すと共に当該
読み出した状態情報が書き込もうとした状態情報と一致
するか否かを確認する状態情報記憶部確認手段を備え、 前記状態情報制御手段が、前記状態情報記憶部確認手段
によって一致しないと判定されたときには前記各磁気デ
ィスク装置の全てが障害有りであると判定する状態情報
記憶部障害判定機能を備えたことを特徴とする請求項1
記載のディスクアレイシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9056234A JP2790134B1 (ja) | 1997-03-11 | 1997-03-11 | ディスクアレイシステム |
US09/037,634 US6192484B1 (en) | 1997-03-11 | 1998-03-10 | Method and system for recovering lost data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9056234A JP2790134B1 (ja) | 1997-03-11 | 1997-03-11 | ディスクアレイシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2790134B1 true JP2790134B1 (ja) | 1998-08-27 |
JPH10254636A JPH10254636A (ja) | 1998-09-25 |
Family
ID=13021423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9056234A Expired - Fee Related JP2790134B1 (ja) | 1997-03-11 | 1997-03-11 | ディスクアレイシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US6192484B1 (ja) |
JP (1) | JP2790134B1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6546500B1 (en) * | 1999-03-19 | 2003-04-08 | Fujitsu Limited | Computer, computer network system, and recording medium |
US6370604B1 (en) * | 1999-05-07 | 2002-04-09 | Intel Corporation | Hot replacement of storage device in serial array of storage devices |
US6401170B1 (en) * | 1999-08-18 | 2002-06-04 | Digi-Data Corporation | RAID systems during non-fault and faulty conditions on a fiber channel arbitrated loop, SCSI bus or switch fabric configuration |
US6687850B1 (en) * | 2001-01-31 | 2004-02-03 | Western Digital Technologies, Inc. | Disk drive for storing sector-reconstruction sectors and for storing a sector-reconstruction status in sectors distributed around a disk |
US6820212B2 (en) * | 2001-02-20 | 2004-11-16 | Digi-Data Corporation | RAID system having channel capacity unaffected by any single component failure |
JP4012420B2 (ja) * | 2002-03-12 | 2007-11-21 | 株式会社日立製作所 | 磁気ディスク装置及びディスク制御装置 |
EP1795993B1 (en) * | 2002-07-30 | 2018-02-28 | Fujitsu Limited | Method and apparatus for reproducing information using a security module |
JP4369101B2 (ja) | 2002-09-04 | 2009-11-18 | 富士通株式会社 | ゲートウェイカード、ゲートウェイ装置、ゲートウェイ制御方法およびゲートウェイ制御プログラム |
JP4149221B2 (ja) * | 2002-09-13 | 2008-09-10 | 富士通株式会社 | ゲートウェイカード、ゲートウェイ装置、ゲートウェイ制御方法およびゲートウェイ制御プログラム |
JP3895691B2 (ja) | 2002-09-13 | 2007-03-22 | 富士通株式会社 | ゲートウェイカード、ゲートウェイ制御プログラムおよびゲートウェイ装置 |
JP3989383B2 (ja) | 2003-02-06 | 2007-10-10 | 富士通株式会社 | 情報処理装置、情報処理システム、プログラム、ゲートウェイカード、ゲートウェイ装置およびゲートウェイ制御プログラム |
JP4824950B2 (ja) * | 2005-06-15 | 2011-11-30 | パナソニック株式会社 | 車載情報端末 |
WO2007096977A1 (ja) * | 2006-02-24 | 2007-08-30 | Fujitsu Limited | 情報処理装置の保守管理プログラム |
JP2008084291A (ja) * | 2006-08-28 | 2008-04-10 | Fujitsu Ltd | 記憶装置、制御方法及び制御装置 |
WO2008090620A1 (ja) | 2007-01-25 | 2008-07-31 | Fujitsu Limited | 記憶装置、記録復旧方法、記録復旧プログラム |
JP4354494B2 (ja) * | 2007-02-09 | 2009-10-28 | 富士通株式会社 | ディスク制御装置 |
US8051090B2 (en) * | 2007-12-28 | 2011-11-01 | Realtek Semiconductor Corp. | File management method of a ring buffer and related file management apparatus |
US9032271B2 (en) * | 2012-12-07 | 2015-05-12 | Western Digital Technologies, Inc. | System and method for lower page data recovery in a solid state drive |
CN103455395B (zh) * | 2013-08-08 | 2016-12-07 | 华为技术有限公司 | 一种硬盘故障的检测方法及装置 |
JP6446948B2 (ja) * | 2014-09-25 | 2019-01-09 | 富士通株式会社 | 電子機器、電源装置および電源監視方法 |
US9612896B1 (en) * | 2015-08-24 | 2017-04-04 | EMC IP Holding Company LLC | Prediction of disk failure |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03144716A (ja) * | 1989-10-31 | 1991-06-20 | Toshiba Corp | パーソナルコンピュータ |
US5195100A (en) * | 1990-03-02 | 1993-03-16 | Micro Technology, Inc. | Non-volatile memory storage of write operation identifier in data sotrage device |
JPH0731582B2 (ja) | 1990-06-21 | 1995-04-10 | インターナショナル・ビジネス・マシーンズ・コーポレイション | パリティ保護データを回復するための方法および装置 |
JP2597060B2 (ja) * | 1991-12-13 | 1997-04-02 | 富士通株式会社 | アレイディスク装置 |
JP3506448B2 (ja) * | 1992-11-25 | 2004-03-15 | 富士通株式会社 | 交換可能記憶媒体のデータ保護方式 |
US5644767A (en) * | 1993-06-01 | 1997-07-01 | At&T Global Information Solutions Company | Method and apparatus for determining and maintaining drive status from codes written to disk drives of an arrayed storage subsystem |
JPH0756694A (ja) | 1993-08-19 | 1995-03-03 | Fuji Xerox Co Ltd | ディスクアレイ装置 |
JP3243919B2 (ja) * | 1994-02-23 | 2002-01-07 | 三菱電機株式会社 | ディスク装置、および、このディスク装置を使用したfaコントローラ |
US5574882A (en) | 1995-03-03 | 1996-11-12 | International Business Machines Corporation | System and method for identifying inconsistent parity in an array of storage |
-
1997
- 1997-03-11 JP JP9056234A patent/JP2790134B1/ja not_active Expired - Fee Related
-
1998
- 1998-03-10 US US09/037,634 patent/US6192484B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6192484B1 (en) | 2001-02-20 |
JPH10254636A (ja) | 1998-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2790134B1 (ja) | ディスクアレイシステム | |
JP3511576B2 (ja) | ディスク記録再生方法および装置 | |
US7818556B2 (en) | Storage apparatus, control method, and control device which can be reliably started up when power is turned on even after there is an error during firmware update | |
US5822782A (en) | Methods and structure to maintain raid configuration information on disks of the array | |
JP3058743B2 (ja) | ディスクアレイ制御装置 | |
US5325497A (en) | Method and apparatus for assigning signatures to identify members of a set of mass of storage devices | |
US20080126784A1 (en) | Storage apparatus, control method, and control device | |
JP2001344076A (ja) | ディスクアレイ装置 | |
JPH08305499A (ja) | ミラーディスク制御方法およびミラーディスク装置 | |
JP2868001B1 (ja) | ディスクアレイ装置制御方法およびディスクアレイ装置 | |
US20090177916A1 (en) | Storage system, controller of storage system, control method of storage system | |
JP2009104369A (ja) | ディスクサブシステム | |
JP4248164B2 (ja) | ディスクアレイのエラー回復方法、ディスクアレイ制御装置及びディスクアレイ装置 | |
US7779293B2 (en) | Technology to control input/output device bridges | |
JPH0756694A (ja) | ディスクアレイ装置 | |
JP2004054616A (ja) | ファームウェア自動修復機能を有する情報処理装置 | |
JP2010198314A (ja) | 情報管理装置 | |
JP3790756B2 (ja) | ディスクアレイ装置、ディスク制御装置及びディスクアレイのデータ障害を復旧する方法 | |
JP2000059981A (ja) | ディジタル形保護継電装置 | |
JP2006260141A (ja) | 記憶システムの制御方法、記憶システム、記憶制御装置、記憶システムの制御プログラム、情報処理システム | |
TWI826287B (zh) | 管理平台系統及其映像檔修復與除錯方法 | |
JPH07121449A (ja) | 二重化システム装置 | |
JP2006260025A (ja) | ディスクアレイ装置、ディスクアレイ装置の制御方法、及び電子機器 | |
JP2004126878A (ja) | データ書込み、データ書込み読出し装置、データ書込み、データ書込み読出し方法 | |
JP2005284449A (ja) | 情報記録媒体アレイシステムおよびその復旧方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19980512 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080612 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090612 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100612 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |