JP3778171B2 - ディスクアレイ装置 - Google Patents
ディスクアレイ装置 Download PDFInfo
- Publication number
- JP3778171B2 JP3778171B2 JP2003042027A JP2003042027A JP3778171B2 JP 3778171 B2 JP3778171 B2 JP 3778171B2 JP 2003042027 A JP2003042027 A JP 2003042027A JP 2003042027 A JP2003042027 A JP 2003042027A JP 3778171 B2 JP3778171 B2 JP 3778171B2
- Authority
- JP
- Japan
- Prior art keywords
- point
- reference value
- disk
- failure
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/36—Monitoring, i.e. supervising the progress of recording or reproducing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/40—Combinations of multiple record carriers
- G11B2220/41—Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
【発明の属する技術分野】
本発明はディスクアレイ装置に関し、特に構成部品の縮退機能を有するディスクアレイ装置に関する。
【0002】
【従来の技術】
従来のディスクアレイ装置による構成部品の縮退方法では、構成部品(例えばディスク)に対する処理が異常終了すると、リトライ(リトライ回数は任意)を実施して救済すればその構成部品の使用を継続し、リトライで異常終了した場合にその構成部品を縮退していた(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開平11―194898号公報(第4−5頁、図2)
【0004】
【発明が解決しようとする課題】
上述した従来技術では、リトライでは救済できるが高頻度で異常終了するような間欠障害が発生しても、その不良部品を縮退することができないという問題点があった。このようなケースでは、ホストに対する応答が遅延するためにオンライン業務などでは支障をきたしていた。
【0005】
また、正常終了するがコマンド処理時間が大きい(応答遅延)状態が続くと、同じようにホストに対する応答が遅延するという問題点があった。
【0006】
本発明の第1の目的は、障害の発生頻度および応答遅延の発生頻度に応じた構成部品の縮退を行うことによりホストに対する性能低下を回避するディスクアレイ装置を提供することにある。
【0007】
本発明の第2の目的は、従来技術では縮退できないような間欠障害でも、障害の発生頻度が許容範囲を越えた場合に不良部品を縮退することにより性能低下を回避するディスクアレイ装置を提供することにある。
【0008】
本発明の第3の目的は、障害には到らなくともコマンド処理時間が処理時間基準値を越える応答遅延の場合も同様に管理して不調部品を縮退することにより性能低下を回避するディスクアレイ装置を提供することにある。
【0009】
本発明の第4の目的は、ミラーディスク構成のディスクアレイ装置で縮退処理するまでの障害の発生頻度でなくとも基準値を越えた場合には不調ディスクの処理比率を下げることにより性能低下を回避するディスクアレイ装置を提供することにある。
【0010】
本発明のディスクアレイ装置は、構成部品毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、障害の発生時に前記障害時テーブルの障害が発生した構成部品のポイントを減点する障害時ポイント更新部と、構成部品のコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの対応する構成部品のポイントを減点する処理時間基準値オーバ時ポイント更新部と、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良部品を縮退する縮退判定部と、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する経過時間ポイント回復部と、不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部とを備えることを特徴とする。
【0011】
また、本発明のディスクアレイ装置は、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部と、ディスクのコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部と、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良ディスクを縮退する縮退判定部と、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部と、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部とを備えることを特徴とする。
【0012】
さらに、本発明のディスクアレイ装置は、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部と、ディスクのコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部と、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部と、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部と、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部と、前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合に、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻すミラーディスク処理比率調整部とを備えることを特徴とする。
【0013】
さらにまた、前記障害時ポイント更新部が、ディスク番号のコマンド処理結果を受信して、処理結果が異常終了であれば、前記障害時テーブルのディスク番号に該当するポイントから規定ポイントを減算して更新し、ポイント更新を前記縮退判定部に通知することを特徴とする。
【0014】
また、本発明のディスクアレイ装置は、前記処理時間基準値オーバ時ポイント更新部が、コマンド処理時間が処理時間基準値を越えた場合に、前記処理時間基準値オーバ時テーブルの該当するディスク番号のポイントを規定ポイントだけ減点して更新し、ポイント更新を前記縮退判定部に通知することを特徴とする。
【0016】
さらにまた、本発明のディスクアレイ装置は、前記縮退判定部が、前記障害時ポイント更新部あるいは前記処理時間基準値オーバ時ポイント更新部からディスク番号に該当するポイント更新通知を受信し、通信元が前記障害時ポイント更新部であれば前記障害時テーブルからディスク番号に該当するポイントを読み出し、通信元が前記処理時間基準値オーバ時ポイント更新部であれば前記処理時間基準値オーバ時テーブルからディスク番号に該当するポイントを読み出し、ポイントが第1のポイント基準値以下であるかどうかを判定し、第1のポイント基準値以下であれば縮退処理を行うことを特徴とする。
【0017】
また、本発明のディスクアレイ装置は、前記ミラーディスク処理比率調整部が、一定時間待機毎に、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルから全ディスク番号のポイントを読み出し、第2のポイント基準値以下だったディスク番号に基準値以下フラグをセットし、第2のポイント基準値以上だったディスク番号に基準値以下フラグをリセットして基準値以下ディスク番号テーブルを作成し、前記基準値以下ディスク番号テーブルと比率調整テーブルとの各ディスク番号のフラグをEXOR演算し、演算結果がセットのディスクを抽出し、前記基準値以下ディスク番号テーブルの基準値以下フラグがセットであるかリセットであるかを判定し、基準値以下フラグがリセットであれば処理比率を初期設定に戻し、基準値以下フラグがセットであれば処理比率の調整を行うことを特徴とする。
【0018】
一方、本発明のディスクアレイ装置の部品縮退方法は、障害時ポイント更新部が、構成部品の障害の発生時に前記障害時テーブルの障害が発生した構成部品のポイントを減点する工程と、処理時間基準値オーバ時ポイント更新部が、構成部品のコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えた構成部品のポイントを減点する工程と、縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良部品を縮退する工程と、経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する工程と、ポイント初期化部が、不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程とを含むことを特徴とする。
【0019】
また、本発明のディスクアレイ装置のディスク縮退方法は、障害時ポイント更新部が、障害の発生時に障害時テーブルの障害が発生したディスクのポイントを減点する工程と、処理時間基準値オーバ時ポイント更新部が、ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する工程と、縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良ディスクを縮退する工程と、経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する工程と、ポイント初期化部が、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程とを含むことを特徴とする。
【0020】
さらに、本発明のディスクアレイ装置の性能低下回避方法は、障害時ポイント更新部が、障害の発生時に障害時テーブルの障害が発生したディスクのポイントを減点する工程と、処理時間基準値オーバ時ポイント更新部が、ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する工程と、縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する工程と、経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点する工程と、ポイント初期化部が、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程と、ミラーディスク処理比率調整部が、前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻す工程とを含むことを特徴とする。
【0021】
他方、本発明のプログラムは、コンピュータを、構成部品毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生した構成部品のポイントを減点する障害時ポイント更新部,構成部品のコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良部品を縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する経過時間ポイント回復部,ならびに不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部として動作させることを特徴とする。
【0022】
また、本発明のプログラムは、コンピュータを、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部,ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部,ならびに不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部として動作させることを特徴とする。
【0023】
さらに、本発明のプログラムは、コンピュータを、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部,ディスクのコマンドのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部,不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部,ならびに前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合に、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻すミラーディスク処理比率調整部として動作させることを特徴とする。
【0024】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0025】
[第1の実施の形態]
図1を参照すると、本発明の第1の実施の形態に係るディスクアレイ装置1は、ディスクユニット部21,22と、キャッシュ部6と、ディスク制御部71,72と、ホスト制御部81,82と、障害ポイント記憶部100と、障害時ポイント更新部110と、処理時間基準値オーバ時ポイント更新部120と、経過時間ポイント回復部130と、ポイント初期化部140と、縮退判定部150とから、その主要部が構成されている。
【0026】
ディスクユニット部21,22は、複数のディスク31〜3N(Nは2以上の整数),41〜4Nから構成される。
【0027】
ディスク制御部71,72は、ホスト制御部81,82からの指示により、あるいはディスク制御部71,72自身の判断により、ディスク31〜3N,41〜4Nに対してデータの読み出しや書き込みなどの種々のコマンド処理を行う。
【0028】
ホスト制御部81,82は、図示しないホストインタフェースを介してホストと接続され、ホストとのコマンド受信,データ転送,ステータス応答などのホストサービスを行う。また、ホスト制御部81,82は、内部バスによりキャッシュ部6およびディスク制御部71,72に接続されており、お互いにデータの送受を行う。
【0029】
図2を参照すると、障害ポイント記憶部100は、障害時テーブル101と、処理時間基準値オーバ時テーブル102とを持ち、ディスク毎のディスク番号対応にポイントを記憶する。ディスク番号は、ディスク31〜3N,41〜4Nをディスクアレイ装置1内部で一意に割り振った番号である。障害時テーブル101および処理時間基準値オーバ時テーブル102は、ポイント初期化部140によりディスクアレイ装置1の立ち上げ時に初期化される。本例では、初期値を600点とする。
【0030】
障害時ポイント更新部110は、コマンド処理が異常終了するなどして障害を検出した場合に、障害ポイント記憶部100の障害時テーブル101の該当するディスク番号のポイントを規定ポイントだけ減点して更新する。
【0031】
図3を参照すると、障害時ポイント更新部110の処理は、コマンド処理結果受信ステップS101と、処理結果判定ステップS102と、ポイント読み出しステップS103と、規定ポイント減算ステップS104と、ポイント更新ステップS105と、ポイント更新通知ステップS106とからなる。
【0032】
処理時間基準値オーバ時ポイント更新部120は、コマンド処理が正常終了したがコマンド処理時間が定められた処理時間基準値を越えた場合に、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102の該当するディスク番号のポイントを規定ポイントだけ減点して更新する。
【0033】
図4を参照すると、処理時間基準値オーバ時ポイント更新部120の処理は、コマンド開始時刻受信ステップS201と、コマンド終了時刻受信ステップS202と、コマンド処理時間算出ステップS203と、処理時間基準値超過判定ステップS204と、ポイント読み出しステップS205と、規定ポイント減算ステップS206と、ポイント更新ステップS207と、ポイント更新通知ステップS208とからなる。
【0034】
経過時間ポイント回復部130は、一定時間(例えば1秒)毎に障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102の全ディスク番号のポイントを規定ポイントだけ加点して更新する。ただし、加点により初期値を越える場合には、ポイントを初期値に更新する。
【0035】
図5を参照すると、経過時間ポイント回復部130の処理は、一定時間待機ステップS301と、ポイント読み出しステップS302と、規定ポイント加算ステップS303と、初期値超過判定ステップS304と、ポイント初期値置き換えステップS305と、ポイント更新ステップS306とからなる。
【0036】
ポイント初期化部140は、ディスクアレイ装置1の最初の立ち上げ時、障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102の全ディスク番号のポイントを定められた初期値に設定する。また、縮退したディスクが交換されたときには、新しく交換されたディスク番号のポイントを定められた初期値に設定する。
【0037】
縮退判定部150は、障害ポイント記憶部100の障害時テーブル101あるいは処理時間基準値オーバ時テーブル102のポイントが定められた基準値(以下、第1のポイント基準値という)を下回ったことを検出すると、該当するディスクを縮退する。
【0038】
図6を参照すると、縮退判定部150の処理は、ポイント更新通知受信ステップS401と、通信元判定ステップS402と、ポイント読み出しステップS403と、ポイント読み出しステップS404と、第1のポイント基準値以下判定ステップS405と、縮退処理ステップS406とからなる。
【0039】
次に、このように構成された第1の実施の形態に係るディスクアレイ装置1の動作について、図1ないし図6を参照して説明する。
【0040】
なお、以下の動作例では、構成部品としてディスクに対するコマンド処理の動作について説明するが、本発明による縮退対象はディスクに限定されるものではない。例えば、キャッシュ部6,ディスク制御部71,72,ホスト制御部81,82等についても、冗長構成を採用する場合には、縮退対象とすることができる。
【0041】
いま、ディスク制御部71,72によるディスク31〜3N,41〜4Nに対するコマンド処理において障害が発生したとする。ここで、障害とは、ディスク31〜3N,41〜4N自身からチェックコンディション報告を受けた場合,コマンド処理時間が処理時間基準値(許容時間)を超えたタイムアウト障害,パリティ/CRC(Cyclic Redundancy Check)エラー等のインタフェース障害などである。
【0042】
障害時ポイント更新部110は、ディスク制御部71,72からディスク番号n(nは1≦n≦Nの整数)のコマンド処理結果を受信し(ステップS101)、処理結果を判定する(ステップS102)。処理結果が正常終了であれば、障害時ポイント更新部110は、直ちに処理を終了する。処理結果が異常終了であれば、障害時ポイント更新部110は、障害ポイント記憶部100の障害時テーブル101からディスク番号nに該当するポイントを読み出し(ステップS103)、読み出したポイントから規定ポイント(100点)を減算する(ステップS104)。次に、障害時ポイント更新部110は、障害ポイント記憶部100の障害時テーブル101のディスク番号nに該当するポイントを更新し(ステップS105)、ポイント更新を縮退判定部150に通知する(ステップS106)。
【0043】
また、処理時間基準値オーバ時ポイント更新部120は、コマンド処理が正常終了したがコマンド処理時間が定められた処理時間基準値を越えた場合に、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102の該当するディスク番号のポイントを規定ポイントだけ減点して更新する。詳しくは、処理時間基準値オーバ時ポイント更新部120は、ディスク制御部71,72からディスク番号nのコマンド開始時刻を受信し(ステップS201)、ディスク制御部71,72からディスク番号nのコマンド終了時刻を受信する(ステップS202)。次に、処理時間基準値オーバ時ポイント更新部120は、コマンド開始時刻とコマンド終了時刻との差からコマンド処理時間を算出し(ステップS203)、コマンド処理時間が処理時間基準値を越えるかどうかを判定する(ステップS204)。コマンド処理時間が処理時間基準値を越えない場合には、処理時間基準値オーバ時ポイント更新部120は、直ちに処理を終了する。コマンド処理時間が処理時間基準値を越える場合には、処理時間基準値オーバ時ポイント更新部120は、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102からディスク番号nに該当するポイントを読み出し(ステップS205)、読み出したポイントから規定ポイント(50点)を減算する(ステップS206)。次に、処理時間基準値オーバ時ポイント更新部120は、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102のディスク番号nに該当するポイントを更新し(ステップS207)、ポイント更新を縮退判定部150に通知する(ステップS208)。
【0044】
このように、コマンド処理結果が正常終了であってもコマンド処理時間が処理時間基準値を越える応答遅延のケースにおいて規定ポイントの減算を行うようにしたので、応答遅延の発生頻度に応じて後段の縮退判定部150で不良ディスクとして縮退できるようになり、ホストに対する性能低下を回避可能となる。
【0045】
一方、経過時間ポイント回復部130は、一定時間(1秒)経過毎に障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102の全ディスク番号のポイントを規定ポイント加算して更新する。ただし、ポイントは初期値である600点を満点とし、これを越える場合には加点しない。詳しくは、経過時間ポイント回復部130は、一定時間(1秒)経過毎に(ステップS301)、障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102から全ディスク番号のポイントを読み出す(ステップS302)。次に、経過時間ポイント回復部130は、読み出した各ポイントに規定ポイント(1点)を加算し(ステップS303)、各ポイントが初期値を越えるかどうかを判定し(ステップS304)、各ポイントが初期値を越えれば、初期値を超えたディスク番号のポイントは初期値(600点)に置き換える(ステップS305)。各ポイントが初期値を越えなければ、経過時間ポイント回復部130は、ステップS305をスキップする。続いて、経過時間ポイント回復部130は、障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102の全ディスク番号のポイントを更新する(ステップS306)。
【0046】
このように、経過時間によりポイントを回復しているので、従来技術による処理の正常終了によりポイントを回復する方法(正常系処理にポイント更新処理を行う必要がある)と比べて、ポイントの更新回数を削減し更新によるオーバヘッド時間を低減できる。また、経過時間によりポイントを回復する場合であってもポイントの更新処理が全く要らないわけではないが、通常の読み出しまたは書き込みの処理でポイントの更新処理を行う場合は、一定時間(1秒)に数千回等の処理があるので(基幹システム等の場合)相当のオーバヘッドとなるが、経過時間で処理すれば一定時間(1秒)に1回の処理で済むので、更新によるオーバヘッドは事実上無視できる。
【0047】
縮退判定部150は、障害の発生頻度や応答遅延の発生頻度が高くなると、ポイントが定められたポイント基準値(以下、第1のポイント基準値という)を下回るので、縮退処理を起動し該当するディスク番号のディスクを縮退する。詳しくは、縮退判定部150は、障害時ポイント更新部110あるいは処理時間基準値オーバ時ポイント更新部120から障害ポイント記憶部100のディスク番号nに該当するポイント更新通知を受信すると(ステップS401)、通信元を判定する(ステップS402)。通信元が障害時ポイント更新部110であれば、縮退判定部150は、障害ポイント記憶部100の障害時テーブル101からディスク番号nに該当するポイントを読み出す(ステップS403)。通信元が処理時間基準値オーバ時ポイント更新部120であれば、縮退判定部150は、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102からディスク番号nに該当するポイントを読み出す(ステップS404)。次に、縮退判定部150は、読み出したポイントが第1のポイント基準値(0点)以下であるかどうかを判定し(ステップS405)、第1のポイント基準値より大きければ(1点以上)であれば、直ちに処理を終了し、第1のポイント基準値(0点)以下であれば、縮退処理を行う(ステップS406)。
【0048】
よって、第1の実施の形態によれば、従来技術では縮退できないような間欠障害のケースでも、発生頻度が1分間で7回、2分間で8回、3分間で8回、4分間で9回、5分間で9回、10分間で12回を越えた場合に縮退を実施する。
【0049】
また、第1の実施の形態によれば、ディスク制御部71,72によるディスク31〜3N,41〜4Nに対するコマンド処理において、タイムアウト障害時間までは要さないが、定められた処理時間基準値を超えて正常終了報告されると、処理時間基準値オーバ時ポイント更新部120が、障害ポイント記憶部100の処理時間基準値オーバ時テーブル102の該当するディスク番号のポイントを規定ポイント(50点)減算して更新するので、正常終了するがコマンド処理時間が処理時間基準値を越える頻度が高くなるとポイントが第1のポイント基準値(0点)を下回り、縮退判定部150により縮退処理が起動され該当するディスク番号のディスクが縮退される。よって、従来技術では縮退できないような正常終了するが応答遅延が発生するケースでも、発生頻度が1分間で14回、2分間で15回、3分間で16回、4分間で17回、5分間で18回、10分間で24回を越えた場合に縮退を実施する。
【0050】
なお、障害時テーブル101や処理時間基準値オーバ時テーブル102のポイントの初期値や、障害時ポイント更新部110や処理時間基準値オーバ時ポイント更新部120が障害時テーブル101や処理時間基準値オーバ時テーブル102を更新する際に減点する規定ポイントや、縮退判定部150が縮退すると判断する第1のポイント基準値などのパラメータは、図示しない保守端末などから変更可能としてもよい。
【0051】
[第2の実施の形態]
図7は、本発明の第2の実施の形態に係るディスクアレイ装置1’の構成を示すブロック図である。本実施の形態に係るディスクアレイ装置1’は、アレイタイプがミラーディスクのものであり、図1に示した第1の実施の形態に係るディスクアレイ装置1に対して、ミラーディスク処理比率調整部200が付加されている点だけが異なっている。よって、その他の対応する部分には同一符号を付して、それらの詳しい説明を省略する。
【0052】
図8を参照すると、基準値以下ディスク番号テーブル103は、ディスク番号と基準値以下フラグとの組を複数登録している。
【0053】
図9を参照すると、比率調整テーブル104は、ディスク番号と調整フラグとの組を複数登録している。比率調整テーブル104には、処理比率の調整が必要なディスクのディスク番号対応に“1”があらかじめ登録され、処理比率の調整が不要なディスクのディスク番号対応に“0”があらかじめ登録されている。
【0054】
ミラーディスク処理比率調整部200は、障害ポイント記憶部100の障害時テーブル101あるいは処理時間基準値オーバ時テーブル102のポイントが縮退判定部150で用いられた第1のポイント基準値(0点)とは異なる第2のポイント基準値(300点)を下回ったことを検出すると、該当するディスクの処理比率を下げ、そのディスクにペアリングされたディスクの処理比率を上げる。また、ミラーディスク処理比率調整部200は、ポイントが第2のポイント基準値に回復した場合には、通常の処理比率に戻す。
【0055】
図10を参照すると、ミラーディスク処理比率調整部200の処理は、一定時間待機ステップS501と、ポイント読み出しステップS502と、基準値以下ディスク番号テーブル作成ステップS503と、EXOR演算ステップS504と、ディスク抽出ステップS505と、フラグ判定ステップS506と、処理比率初期設定戻しステップS507と、処理比率調整ステップS508とからなる。
【0056】
次に、このように構成された第2の実施の形態に係るディスクアレイ装置1’の動作について、第1の実施の形態に係るディスクアレイ装置1との相違点を中心に説明する。
【0057】
一般的に、ミラーディスクでは2台のディスクを均等に使用することによりディスクの負荷分散を行っている。通常は、障害の発生頻度あるいは正常終了するがコマンド処理時間が処理時間基準値を越える応答遅延の発生頻度が高くなる場合で、第1の実施の形態のようにポイントが第1のポイント基準値(0点)を下回らない場合でも、性能低下の要因となる。本実施の形態では、ポイントが第2のポイント基準値(300点)を下回ると、ミラーディスク処理比率調整部200は、不調である該当するディスク番号のディスクの処理比率を下げ、ペアリングされたディスクの処理比率を高める。ポイントが第2のポイント基準値(300点)以上に回復した場合には、ミラーディスク処理比率調整部200は、通常の処理比率に戻す。
【0058】
詳しくは、ミラーディスク処理比率調整部200は、一定時間待機毎に(ステップS501)、障害ポイント記憶部100の障害時テーブル101および処理時間基準値オーバ時テーブル102から全ディスク番号のポイントを読み出す(ステップS502)。次に、ミラーディスク処理比率調整部200は、第2のポイント基準値(300点)以下だったディスク番号に基準値以下フラグ“1”を設定し、第2のポイント基準値(300点)以上だったディスク番号に基準値以下フラグ“0”を設定して基準値以下ディスク番号テーブル103を作成する(ステップS503)。続いて、ミラーディスク処理比率調整部200は、基準値以下ディスク番号テーブル103と比率調整テーブル104との各ディスク番号のフラグ同士をEXOR演算する(ステップS504)。次に、ミラーディスク処理比率調整部200は、演算結果が“1”のディスクを抽出し(ステップS505)、基準値以下ディスク番号テーブル103の基準値以下フラグが“0”であるか“1”であるかを判定する(ステップS506)。基準値以下フラグが“0”であれば、ミラーディスク処理比率調整部200は、処理比率を初期設定に戻し(ステップS507)、基準値以下フラグが“1”であれば、処理比率の調整を行う(ステップS508)。
【0059】
初期設定の処理比率と調整後の処理比率との具体的な相違について説明すると、書き込み時は2台のディスクに書く必要があるので処理比率は同じである。読み出し時は、通常は2台のディスクを読み出しアドレスにより振り分けるなどして50%対50%で使用するのが負荷分散の観点から一般的であるが、この振り分けを、例えば70%(正常ディスク)対30%(不調ディスク)の処理比率にして、不調ディスクの処理比率を下げることにより性能低下を防ぐ。
【0060】
第2の実施の形態によれば、アレイタイプがミラーディスクのディスクアレイ装置1’において、縮退に至らなくとも障害の発生頻度や応答遅延の発生頻度に応じてポインタが第2のポインタ基準値を越えた場合に不調ディスクの処理比率を下げることにより、性能低下を回避できる。
【0061】
[第3の実施の形態]
図11は、本発明の第3の実施の形態に係るディスクアレイ装置1の構成を示すブロック図である。本実施の形態に係るディスクアレイ装置1は、図1に示した第1の実施の形態に係るディスクアレイ装置1に対してディスクアレイ制御プログラム400を付加するようにした点だけが異なる。したがって、その他の特に言及しない部分には同一符号を付して、それらの詳しい説明を省略する。
【0062】
ディスクアレイ制御プログラム400は、ディスクアレイ装置1に読み込まれ、ディスクアレイ装置1の動作を、ディスクユニット部21,22,キャッシュ部6,ディスク制御部71,72,ホスト制御部81,82,障害ポイント記憶部100,障害時ポイント更新部110,処理時間基準値オーバ時ポイント更新部120,経過時間ポイント回復部130,ポイント初期化部140,および縮退判定部150として制御する。ディスクアレイ制御プログラム400の制御によるディスクアレイ装置1の動作は、第1の実施の形態におけるディスクアレイ装置1の動作と全く同様になるので、その詳しい説明を割愛する。
【0063】
[第4の実施の形態]
図12は、本発明の第4の実施の形態に係るディスクアレイ装置1’の構成を示すブロック図である。本実施の形態に係るディスクアレイ装置1’は、図7に示した第2の実施の形態に係るディスクアレイ装置1’に対してディスクアレイ制御プログラム500を付加するようにした点だけが異なる。したがって、その他の特に言及しない部分には同一符号を付して、それらの詳しい説明を省略する。
【0064】
ディスクアレイ制御プログラム500は、ディスクアレイ装置1’に読み込まれ、ディスクアレイ装置1’の動作を、ディスクユニット部21,22,キャッシュ部6,ディスク制御部71,72,ホスト制御部81,82,障害ポイント記憶部100,障害時ポイント更新部110,処理時間基準値オーバ時ポイント更新部120,経過時間ポイント回復部130,ポイント初期化部140,縮退判定部150,およびミラーディスク処理比率調整部200として制御する。ディスクアレイ制御プログラム500の制御によるディスクアレイ装置1’の動作は、第2の実施の形態におけるディスクアレイ装置1’の動作と全く同様になるので、その詳しい説明を割愛する。
【0065】
【発明の効果】
第1の効果は、間欠障害が頻発した場合でも不良部品を縮退することができ、ホストに対する性能低下を回避できる。その理由は、障害毎にポイントを減算または加算して、ポイントがポイント基準値を越えたときに(障害の発生頻度に応じて)不良部品を縮退するようにしたからである。
【0066】
第2の効果は、従来技術による処理の正常終了によりポイントを回復する方法(正常系処理にポイント更新処理を行う必要がある)と比べて、ポイントの更新回数を削減し更新によるオーバヘッド時間を低減できることである。その理由は、経過時間によりポイントを回復するようにしたからである。
【0067】
第3の効果は、正常終了であってもコマンド処理時間が処理時間基準値を越える応答遅延の場合でも、その発生頻度に応じて不良部品を縮退することができ、ホストに対する性能低下を回避できることである。その理由は、コマンド処理時間が処理時間基準値を越えた場合にポイントを減算または加算して、ポイントがポイント基準値を越えたときに(応答遅延の発生頻度に応じて)不良部品を縮退するようにしたからである。
【0068】
第4の効果は、アレイタイプがミラーディスクのディスクアレイ装置において、縮退に至なくとも障害の発生頻度や応答遅延の発生頻度が第2のポイント基準値を越えた場合に、不調ディスクの処理比率を下げることにより性能低下を回避できることである。その理由は、一定時間毎にポイントを調べて、ディスクが不調の場合にペアリングされたディスクの処理比率の調整を行うようにしたからである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係るディスクアレイ装置の構成を示すブロック図である。
【図2】図1中の障害ポイント記憶部に存在する障害時テーブルおよび処理時間基準値オーバ時テーブルの内容を説明する図である。
【図3】図1中の障害時ポイント更新部の処理を示すフローチャートである。
【図4】図1中の処理時間基準値オーバ時ポイント更新部の処理を示すフローチャートである。
【図5】図1中の経過時間ポイント回復部の処理を示すフローチャートである。
【図6】図1中の縮退判定部の処理を示すフローチャートである。
【図7】本発明の第2の実施の形態に係るディスクアレイ装置の構成を示すブロック図である。
【図8】図7中のミラーディスク処理比率調整部が作成する基準値以下ディスク番号テーブルの内容を説明する図である。
【図9】図7中のミラーディスク処理比率調整部が使用する比率調整テーブルの内容を説明する図である。
【図10】図1中のミラーディスク処理比率調整部の処理を示すフローチャートである。
【図11】本発明の第3の実施の形態に係るディスクアレイ装置の構成を示すブロック図である。
【図12】本発明の第4の実施の形態に係るディスクアレイ装置の構成を示すブロック図である。
【符号の説明】
1,1’ ディスクアレイ装置
6 キャッシュ部
21,22 ディスクユニット部
71,72 ディスク制御部
81,82 ホスト制御部
100 障害ポイント記憶部
110 障害時ポイント更新部
120 処理時間基準値オーバ時ポイント更新部
130 経過時間ポイント回復部
140 ポイント初期化部
150 縮退判定部
200 ミラーディスク処理比率調整部
400,500 ディスクアレイ制御プログラム
Claims (13)
- 構成部品毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、
障害の発生時に前記障害時テーブルの障害が発生した構成部品のポイントを減点する障害時ポイント更新部と、
構成部品のコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの対応する構成部品のポイントを減点する処理時間基準値オーバ時ポイント更新部と、
前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良部品を縮退する縮退判定部と、
一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する経過時間ポイント回復部と、
不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部と
を備えることを特徴とするディスクアレイ装置。 - ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、
障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部と、
ディスクのコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部と、
前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良ディスクを縮退する縮退判定部と、
一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部と、
不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部と
を備えることを特徴とするディスクアレイ装置。 - ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部と、
障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部と、
ディスクのコマンド処理結果が正常終了で、かつコマンド処理時間が処理時間基準値を越えたときに、前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部と、
前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部と、
一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部と、
不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部と、
前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合に、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻すミラーディスク処理比率調整部と
を備えることを特徴とするディスクアレイ装置。 - 前記障害時ポイント更新部が、ディスク番号のコマンド処理結果を受信して、処理結果が異常終了であれば、前記障害時テーブルのディスク番号に該当するポイントから規定ポイントを減算して更新し、ポイント更新を前記縮退判定部に通知することを特徴とする請求項2または請求項3記載のディスクアレイ装置。
- 前記処理時間基準値オーバ時ポイント更新部が、コマンド処理時間が処理時間基準値を越えた場合に、前記処理時間基準値オーバ時テーブルの該当するディスク番号のポイントを規定ポイントだけ減点して更新し、ポイント更新を前記縮退判定部に通知することを特徴とする請求項2または請求項3記載のディスクアレイ装置。
- 前記縮退判定部が、前記障害時ポイント更新部あるいは前記処理時間基準値オーバ時ポイント更新部からディスク番号に該当するポイント更新通知を受信し、通信元が前記障害時ポイント更新部であれば前記障害時テーブルからディスク番号に該当するポイントを読み出し、通信元が前記処理時間基準値オーバ時ポイント更新部であれば前記処理時間基準値オーバ時テーブルからディスク番号に該当するポイントを読み出し、ポイントが第1のポイント基準値以下であるかどうかを判定し、第1のポイント基準値以下であれば縮退処理を行うことを特徴とする請求項2または請求項3記載のディスクアレイ装置。
- 前記ミラーディスク処理比率調整部が、一定時間待機毎に、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルから全ディスク番号のポイントを読み出し、第2のポイント基準値以下だったディスク番号に基準値以下フラグをセットし、第2のポイント基準値以上だったディスク番号に基準値以下フラグをリセットして基準値以下ディスク番号テーブルを作成し、前記基準値以下ディスク番号テーブルと比率調整テーブルとの各ディスク番号のフラグをEXOR演算し、演算結果がセットのディスクを抽出し、前記基準値以下ディスク番号テーブルの基準値以下フラグがセットであるかリセットであるかを判定し、基準値以下フラグがリセットであれば処理比率を初期設定に戻し、基準値以下フラグがセットであれば処理比率の調整を行うことを特徴とする請求項3記載のディスクアレイ装置。
- 障害時ポイント更新部が、構成部品の障害の発生時に障害時テーブルの障害が発生した構成部品のポイントを減点する工程と、
処理時間基準値オーバ時ポイント更新部が、構成部品のコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えた構成部品のポイントを減点する工程と、
縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良部品を縮退する工程と、
経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する工程と、
ポイント初期化部が、不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程と
を含むことを特徴とするディスクアレイ装置の部品縮退方法。 - 障害時ポイント更新部が、障害の発生時に障害時テーブルの障害が発生したディスクのポイントを減点する工程と、
処理時間基準値オーバ時ポイント更新部が、ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する工程と、
縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に、対応する不良ディスクを縮退する工程と、
経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する工程と、
ポイント初期化部が、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程と
を含むことを特徴とするディスクアレイ装置のディスク縮退方法。 - 障害時ポイント更新部が、障害の発生時に障害時テーブルの障害が発生したディスクのポイントを減点する工程と、
処理時間基準値オーバ時ポイント更新部が、ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する工程と、
縮退判定部が、前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する工程と、
経過時間ポイント回復部が、一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する工程と、
ポイント初期化部が、不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻す工程と、
ミラーディスク処理比率調整部が、前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻す工程と
を含むことを特徴とするディスクアレイ装置の性能低下回避方法。 - コンピュータを、構成部品毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生した構成部品のポイントを減点する障害時ポイント更新部,構成部品のコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良部品を縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの構成部品のポイントを規定ポイント加点して更新する経過時間ポイント回復部,ならびに不良部品が交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部として動作させるためのプログラム。
- コンピュータを、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部,ディスクのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントがポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部,ならびに不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部として動作させるためのプログラム。
- コンピュータを、ディスク毎のポイントをそれぞれ記憶する障害時テーブルおよび処理時間基準値オーバ時テーブルを持つ障害ポイント記憶部,障害の発生時に前記障害時テーブルの障害が発生したディスクのポイントを減点する障害時ポイント更新部,ディスクのコマンドのコマンド処理結果が正常終了でかつコマンド処理時間が処理時間基準値を越えたときに前記処理時間基準値オーバ時テーブルの処理時間基準値を越えたディスクのポイントを減点する処理時間基準値オーバ時ポイント更新部,前記障害時テーブルまたは前記処理時間基準値オーバ時テーブルのポイントが第1のポイント基準値を下回った場合に対応する不良ディスクを縮退する縮退判定部,一定時間経過毎に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルのディスクのポイントを規定ポイント加点して更新する経過時間ポイント回復部,不良ディスクが交換された場合に前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの対応するポイントを初期値に戻すポイント初期化部,ならびに前記障害時テーブルあるいは前記処理時間基準値オーバ時テーブルのディスクのポイントが第2のポイント基準値を下回ったことが検出された場合に、該ディスクの処理比率を下げるとともに該ディスクにペアリングされたディスクの処理比率を上げ、前記障害時テーブルおよび前記処理時間基準値オーバ時テーブルの該ディスクのポイントが第2のポイント基準値に回復した場合に前記ペアリングされたディスクの処理比率を通常に戻すミラーディスク処理比率調整部として動作させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003042027A JP3778171B2 (ja) | 2003-02-20 | 2003-02-20 | ディスクアレイ装置 |
US10/781,709 US7409579B2 (en) | 2003-02-20 | 2004-02-20 | Disk array device having point value added or subtracted for determining whether device is degraded |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003042027A JP3778171B2 (ja) | 2003-02-20 | 2003-02-20 | ディスクアレイ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004252692A JP2004252692A (ja) | 2004-09-09 |
JP3778171B2 true JP3778171B2 (ja) | 2006-05-24 |
Family
ID=33025417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003042027A Expired - Lifetime JP3778171B2 (ja) | 2003-02-20 | 2003-02-20 | ディスクアレイ装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7409579B2 (ja) |
JP (1) | JP3778171B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4313650B2 (ja) | 2003-11-07 | 2009-08-12 | 株式会社日立製作所 | ファイルサーバ、冗長度回復方法、プログラム及び記録媒体 |
JP2007004297A (ja) * | 2005-06-21 | 2007-01-11 | Fujitsu Ltd | 記憶ユニット管理装置 |
JP2009059280A (ja) * | 2007-09-03 | 2009-03-19 | Mitsubishi Electric Corp | ストレージ制御方式 |
JP4542163B2 (ja) | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
JP2010097385A (ja) * | 2008-10-16 | 2010-04-30 | Fujitsu Ltd | データ管理プログラム、ストレージ装置診断プログラム、およびマルチノードストレージシステム |
JP4747203B2 (ja) | 2009-01-30 | 2011-08-17 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 |
EP2560089B1 (en) * | 2010-04-14 | 2018-07-04 | Hitachi, Ltd. | Storage control device and control method of storage control device |
JP5545108B2 (ja) | 2010-08-04 | 2014-07-09 | 富士通株式会社 | ストレージシステム、制御装置および制御方法 |
JP5887757B2 (ja) * | 2011-08-17 | 2016-03-16 | 富士通株式会社 | ストレージシステム、ストレージ制御装置およびストレージ制御方法 |
JP5348300B2 (ja) * | 2012-09-07 | 2013-11-20 | 富士通株式会社 | データ管理プログラム、およびマルチノードストレージシステム |
JP6347055B2 (ja) * | 2014-03-28 | 2018-06-27 | パナソニックIpマネジメント株式会社 | 不揮発性メモリ装置 |
JP2016212512A (ja) | 2015-04-30 | 2016-12-15 | 富士通株式会社 | ストレージシステム、制御装置および制御プログラム |
JP6481490B2 (ja) | 2015-04-30 | 2019-03-13 | 富士通株式会社 | ストレージシステム、制御装置および制御プログラム |
CN106201339B (zh) * | 2016-06-27 | 2019-05-10 | 浪潮(北京)电子信息产业有限公司 | 一种定位延迟磁盘的方法及系统 |
JP6965626B2 (ja) | 2017-08-17 | 2021-11-10 | 富士通株式会社 | ストレージ制御装置、および制御プログラム |
CN110413218B (zh) * | 2018-04-28 | 2023-06-23 | 伊姆西Ip控股有限责任公司 | 用于存储系统中的故障恢复的方法、装置和计算机程序产品 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278838A (en) * | 1991-06-18 | 1994-01-11 | Ibm Corp. | Recovery from errors in a redundant array of disk drives |
JP3078972B2 (ja) * | 1993-11-05 | 2000-08-21 | 富士通株式会社 | ディスクアレイ装置 |
JPH087498A (ja) * | 1994-06-17 | 1996-01-12 | Hitachi Ltd | 記録情報再生装置 |
US6006016A (en) * | 1994-11-10 | 1999-12-21 | Bay Networks, Inc. | Network fault correlation |
JP2861846B2 (ja) | 1995-01-25 | 1999-02-24 | 日本電気株式会社 | 磁気ディスク制御システム |
US5631909A (en) * | 1995-05-31 | 1997-05-20 | Quantum Corporation | Method and apparatus for determining burst errors in an error pattern |
JPH09167427A (ja) * | 1995-12-14 | 1997-06-24 | Fujitsu Ltd | ディスクアレイ装置 |
US6145052A (en) * | 1997-11-04 | 2000-11-07 | Western Digital Corporation | Disk drive with adaptive pooling for command reordering |
JP2914369B1 (ja) * | 1997-12-26 | 1999-06-28 | 日本電気株式会社 | アレイ状入出力装置の縮退判定方法及び装置並びに縮退判定プログラムを記録した媒体 |
JP3184171B2 (ja) * | 1998-02-26 | 2001-07-09 | 日本電気株式会社 | ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体 |
JP2000003255A (ja) * | 1998-06-12 | 2000-01-07 | Nec Corp | ディスクアレイ装置 |
JP2001014227A (ja) * | 1999-06-30 | 2001-01-19 | Nec Corp | タイムアウト時間更新方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 |
JP2001256000A (ja) * | 2000-03-09 | 2001-09-21 | Nec Eng Ltd | ディスクアレイ装置及びそれに用いる縮退制御方法 |
US6687846B1 (en) * | 2000-03-30 | 2004-02-03 | Intel Corporation | System and method for error handling and recovery |
US6859888B2 (en) * | 2000-09-19 | 2005-02-22 | Matsushita Electric Industrial Co., Ltd. | Data storage array apparatus storing error information without delay in data access, and method, program recording medium, and program for the same |
US6810491B1 (en) * | 2000-10-12 | 2004-10-26 | Hitachi America, Ltd. | Method and apparatus for the takeover of primary volume in multiple volume mirroring |
JP2002149500A (ja) | 2000-11-08 | 2002-05-24 | Matsushita Electric Ind Co Ltd | ハードディスク装置 |
US6957291B2 (en) * | 2001-03-29 | 2005-10-18 | Quantum Corporation | Removable disk storage array emulating tape library having backup and archive capability |
JP3536829B2 (ja) * | 2001-06-14 | 2004-06-14 | 日本電気株式会社 | Fc−alシステムのリンク診断方法及び装置 |
JP3964212B2 (ja) * | 2002-01-16 | 2007-08-22 | 株式会社日立製作所 | 記憶装置システム |
JP4325843B2 (ja) * | 2002-12-20 | 2009-09-02 | 株式会社日立製作所 | 論理ボリュームコピー先性能調整方法及び装置 |
JP4063694B2 (ja) * | 2003-03-11 | 2008-03-19 | 株式会社日立グローバルストレージテクノロジーズ | 磁気ディスク装置 |
JP3909062B2 (ja) * | 2004-03-25 | 2007-04-25 | 株式会社日立製作所 | Nasの制御装置及びバックアップ方法並びにプログラム |
-
2003
- 2003-02-20 JP JP2003042027A patent/JP3778171B2/ja not_active Expired - Lifetime
-
2004
- 2004-02-20 US US10/781,709 patent/US7409579B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004252692A (ja) | 2004-09-09 |
US20040205381A1 (en) | 2004-10-14 |
US7409579B2 (en) | 2008-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3778171B2 (ja) | ディスクアレイ装置 | |
US10318380B2 (en) | Multi-stage slice recovery in a dispersed storage network | |
JP4303187B2 (ja) | プログラム、記憶制御方法及び記憶装置 | |
JP2010033287A (ja) | ストレージサブシステム及びこれを用いたデータ検証方法 | |
JP2005100259A (ja) | ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法 | |
JP2005122338A (ja) | スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法 | |
CN109062600B (zh) | 一种固态硬盘内固件在线升级的实现方法及系统 | |
US20190146894A1 (en) | Processing a health condition message on a health condition to determine whether to perform a swap operation | |
US10782913B2 (en) | Apparatus, method, and program product for data integrity during asynchronous remote copy | |
CN112148204A (zh) | 用于管理独立冗余盘阵列的方法、设备和计算机程序产品 | |
US10908988B2 (en) | Storage apparatus | |
CN111399766B (zh) | 存储系统中的数据存储方法、数据读取方法、装置及系统 | |
JPH05324579A (ja) | 分散ファイルシステム及び記憶装置 | |
US11481274B2 (en) | Raid data storage device and data storage system including the same | |
CN114253460B (zh) | 管理存储池的方法、设备和计算机程序产品 | |
US11494089B2 (en) | Distributed storage system, data control method and storage medium | |
CN115344214A (zh) | 数据读写方法、装置、服务器和计算机可读存储介质 | |
JP2002169660A (ja) | データ記憶アレイ装置、その制御方法、プログラム記録媒体及びプログラム | |
WO2021043246A1 (zh) | 数据读取方法及装置 | |
CN114816221A (zh) | 存储管理方法、设备和计算机程序产品 | |
CN110389713B (zh) | 数据同步方法、设备和计算机可读介质 | |
CN112084058A (zh) | 进程处理方法、装置和电子设备 | |
CN111858126B (zh) | 一种基于k+m纠删集群的数据处理方法及装置 | |
CN112395263B (zh) | 一种osd的数据恢复方法及装置 | |
CN117851271A (zh) | 一种故障修复的方法和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050524 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060220 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100310 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100310 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110310 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120310 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120310 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130310 Year of fee payment: 7 |