[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2019138999A1 - ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体 - Google Patents

ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体 Download PDF

Info

Publication number
WO2019138999A1
WO2019138999A1 PCT/JP2019/000206 JP2019000206W WO2019138999A1 WO 2019138999 A1 WO2019138999 A1 WO 2019138999A1 JP 2019000206 W JP2019000206 W JP 2019000206W WO 2019138999 A1 WO2019138999 A1 WO 2019138999A1
Authority
WO
WIPO (PCT)
Prior art keywords
storage device
raid
spare
storage
storage devices
Prior art date
Application number
PCT/JP2019/000206
Other languages
English (en)
French (fr)
Inventor
小林 健介
Original Assignee
Necプラットフォームズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Necプラットフォームズ株式会社 filed Critical Necプラットフォームズ株式会社
Publication of WO2019138999A1 publication Critical patent/WO2019138999A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers

Definitions

  • the present invention relates to a technology for recovering redundancy in RAID when a storage device constituting a RAID (Redundant Arrays of Inexpensive Disks) fails.
  • RAID logical disk
  • RAID1 logical disk
  • RAID5 When a part of disks (physical disks) constituting a logical disk (RAID) having redundancy such as RAID1, RAID5, RAID6 fail, RAID is degenerated (loss of redundancy or redundancy is reduced).
  • RAID logical disk
  • the same data as the data held by the failed disk may be reconfigured (rebuilt), and the RAID may be restored to a non-degenerate state.
  • Patent Document 1 discloses an example of a technology for reducing the time required for rebuilding.
  • the storage system of Patent Document 1 includes a storage control device, a plurality of storage devices constituting one RLU (RAID Logical Unit), and a spare storage device.
  • the storage control device includes a rebuild control unit and an access processing unit.
  • the rebuild control unit divides the rebuilding process into partial processes, and instructs the access processing unit to execute partial processes.
  • the same data as the data recorded in a storage device configuring the RLU is generated based on the data read from the remaining storage devices configuring the RLU, and is used as a spare storage device. It is a process to write.
  • the partial process includes a combination of a process of reading data from a divided area obtained by dividing a data read target area by a fixed size and a process of writing data in another storage device based on the data read from the divided area.
  • the access control unit executes the instructed partial processes P1 and P2 in parallel according to the execution instruction of the plurality of partial processes P1 and P2 received from the rebuild control unit.
  • the storage system of Patent Document 1 speeds up the rebuilding process.
  • Patent Document 2 discloses an example of a technique for starting a rebuilding process before a storage device failure is detected.
  • the storage system of Patent Document 2 includes a plurality of HDDs (Hard Disk Drives), spare HDDs, and a control unit.
  • the plurality of HDDs configure a RAID according to one type of RAID scheme using parity calculation.
  • the spare HDD stores second data having the same content as the first data stored in any HDD among the data for which redundancy has been secured by RAID.
  • the control unit spares the data stored in the replaced HDD based on the data stored in the other HDD and the spare HDD. Rebuild on the HDD.
  • the storage system of Patent Document 2 stores, in the spare HDD, the second data having the same content as the first data stored in the replaced HDD. There is.
  • a plurality of HDDs configure RAID according to one type of RAID method (either RAID 5 or RAID 6).
  • one of a plurality of RAID methods (such as RAID 1 and RAID 5, RAID 1 and / or RAID 6) should be individually applied to each group of HDDs according to the type of data to be held, etc. There is.
  • the present invention has been made in view of the above problems, and in the case where a plurality of storage devices constitute a plurality of types of RAID, the time required for restoration of redundancy in the RAID after occurrence of a failure of the storage device.
  • the main purpose is to shorten the
  • the disk array controller is configured to use a partial mirroring unit configured to mirror a predetermined block in each of all the storage devices configuring a plurality of types of RAID to a spare storage device, or when any of the storage devices fails.
  • a storage apparatus comprises: a plurality of storage devices constituting a plurality of types of RAID; a spare storage device; and partial mirroring means for mirroring predetermined blocks in all the storage devices to the spare storage device And reconfiguring in the spare storage device a block not held by the spare storage device in the failed storage device when any of the storage devices fails, and replacing the failed storage device with the spare storage device.
  • a disk array controller including reconstruction means for restoring redundancy.
  • a method of recovering a storage device is a method of recovering a storage device comprising a plurality of storage devices constituting a plurality of types of RAID and a spare storage device. While mirroring a predetermined block to a spare storage device, if any of the storage devices fail, a block not retained by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failure The redundancy is restored by replacing the generated storage with spare storage.
  • a recovery program of a disk array controller or a non-temporary storage medium storing the recovery program is connected to a plurality of storage devices constituting a plurality of types of RAID and a spare storage device.
  • FIG. 1 is a block diagram showing an example of the configuration of a storage apparatus according to the first embodiment of this invention.
  • FIG. 1 illustrates an example in which the storage device D1 and the storage device D2 configure a RAID according to the RAID1 method, and the storage device D3, the storage device D4, and the storage device D5 configure a RAID according to the RAID5 method.
  • A1, A2, A3, ... indicate blocks (data in) a certain series of data
  • B1, B2, B3, ... indicate blocks in another series of data To indicate).
  • PB12 is a block including parity data calculated from block B1 and block B2. That is, one remaining block can be calculated from any two blocks among the block B1, the block B2, and the block PB12.
  • the blocks PB34, PB56,... are similar to the block PB12.
  • the RAID method in the present embodiment, the number of storage devices configuring each RAID, and the like are not limited to this example.
  • the storage apparatus 100 in the present embodiment includes a plurality of storage devices 140, a spare storage device 150, and a disk array controller 110.
  • the plurality of storage devices 140 configure a plurality of types of RAID.
  • Each storage device 140 is, for example, an HDD, a solid state drive (SSD), or a non-volatile memory.
  • the spare storage device 150 mirrors a predetermined partial block for each storage device 140.
  • the spare storage device 150 is, for example, an HDD, an SSD, or a non-volatile memory.
  • the disk array controller 110 controls each storage device 140 according to any of a plurality of types of RAID schemes.
  • the disk array controller 110 includes a partial mirroring unit 120 and a reconfiguration unit 130.
  • the plurality of types of RAID schemes are, for example, RAID 1 and RAID 5, or RAID 1 and RAID 6.
  • RAID 6 when RAID 6 is used instead of RAID 5, a storage device 140 configuring RAID may be added.
  • the partial mirroring unit 120 mirrors predetermined blocks in all the storage devices 140 to the spare storage device 150.
  • the spare storage device 150 includes the block A1 of the storage device D1, the block A2 of the storage device D2, the block PB56 of the storage device D3, the block B8 of the storage device D4, and the block B0 of the storage device D5. It is mirrored to the spare storage device 150.
  • the reconfiguration unit 130 reconfigures, in the spare storage device 150, blocks not held by the spare storage device 150 in the storage device 140 in which the failure has occurred when any of the storage devices 140 has failed. Then, the reconfiguration unit 130 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150.
  • FIG. 2 is a flowchart showing the operation of the storage device in the first embodiment of the present invention.
  • the storage apparatus 100 mirrors a predetermined block in each of all the storage devices 140 configuring a plurality of types of RAID in the spare storage device 150 (step S110).
  • a predetermined block is selected in each of the storage devices 140 configuring a plurality of types of RAID.
  • the total size of the blocks selected in each storage device 140 is preferably set so as to equalize the time required for reconfiguration of the storage device 140 in which a failure has occurred (described later in step S130).
  • the storage device 100 detects whether any one of the storage devices 140 has failed (step S120).
  • a failure of the storage device 140 is detected using, for example, Self-Monitoring Analysis and Reporting Technology (S.M.A.R.T.).
  • step S120 No
  • the storage device 100 returns the process to step S110.
  • step S120 If any of the storage devices 140 fails (step S120: Yes), the storage device 100 stores the blocks not held by the spare storage device 150 in the storage device 140 in which the failure occurred in the spare storage device 150. At step S130.
  • the storage device 100 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150 (step S140).
  • FIG. 3 is a diagram for explaining an operation example of the storage device in the first embodiment of the present invention.
  • the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D5 breaks down.
  • the storage device 100 starts reconfiguration (rebuild) of the storage device D5 in the spare storage device 150.
  • block B0 is already mirrored, data is rebuilt based on the data held by storage device D3 and storage device D4 for the data of PB12, B4, B6, PB78, ... in storage device D5. .
  • the time required for rebuilding is reduced by the time required for rebuilding the block B0 that has been mirrored in the spare storage device 150.
  • FIG. 4 is a diagram for explaining another operation example of the storage apparatus in the first embodiment of the present invention.
  • the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D2 fails.
  • the storage device 100 starts rebuilding of the storage device D2 in the spare storage device 150.
  • the blocks A1 and A2 are already mirrored, the blocks are rebuilt based on the data held by the storage device D1 for A3, A4, A5,... In the storage device D2.
  • the time required for rebuilding is reduced by the time required for rebuilding the blocks A1 and A2 that have been mirrored in the spare storage device 150.
  • the storage apparatus 100 mirrors, to the spare storage apparatus 150, a predetermined partial block for each storage apparatus 140 with respect to all of the storage apparatuses 140 configuring a plurality of types of RAID. Then, when any of the storage devices 140 fails, the storage device 100 reconfigures, in the spare storage device 150, blocks not held by the spare storage device 150 in the storage device 140 in which the failure has occurred. Then, the storage device 100 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150.
  • the storage apparatus 100 when a plurality of storage devices constitute a plurality of types of RAID, it is possible to shorten the time required for the redundancy in the RAID to be restored after occurrence of a failure of the storage device. It has the effect of
  • the time required from restoration of a certain storage device 140 to restoration of redundancy in RAID is equalized.
  • FIG. 5 is a block diagram showing an example of a hardware configuration that can realize the storage apparatus according to each embodiment of the present invention.
  • the storage device 907 includes a storage device 902, a central processing unit (CPU) 903, a keyboard 904, a monitor 905, and an input / output (I / O) device 908, which are connected by an internal bus 906. There is.
  • the storage device 902 stores an operation program of the CPU 903 such as the partial mirroring unit 120 and the reconfiguration unit 130.
  • the CPU 903 controls the entire storage device 907, executes an operation program stored in the storage device 902, and executes programs such as the partial mirroring unit 120 and the reconfiguration unit 130 by the I / O device 908 and transmits / receives data.
  • the internal configuration of the storage device 907 described above is an example.
  • the storage device 907 may have a device configuration in which a keyboard 904 and a monitor 905 are connected as necessary.
  • the storage device 907 in each embodiment of the present invention described above may be realized by a dedicated device, a computer (an information processing device other than the operation of hardware in which the I / O device 908 executes communication with the outside) It can also be realized by In each embodiment of the present invention, the I / O device 908 is, for example, an input / output unit with the storage device 140, the spare storage device 150, and the like.
  • the computer reads the software program stored in the storage device 902 to the CPU 903 and causes the CPU 903 to execute the read software program.
  • the software program may be described so as to realize the functions of the storage device 907 or the respective units of the storage device 907 shown in FIG. 1 described above. However, it is also assumed that these parts include hardware as appropriate. And, in such a case, such software program (computer program) can be understood to constitute the present invention.
  • a computer readable storage medium storing such a software program can be considered to constitute the present invention.
  • the present invention can be used in applications that reduce the recovery time when a storage device constituting a RAID fails.
  • Storage device 110 Disk array controller 120 Partial mirroring unit 130 Reconfiguration unit 140 Storage device 150 Spare storage device 902 Storage device 903 CPU 904 keyboard 905 monitor 906 internal bus 907 storage device 908 I / O device

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Hardware Redundancy (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

(課題)複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮する。 (解決手段)複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成手段とを備える。

Description

ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体
 本発明は、RAID(Redundant Arrays of Inexpensive Disks)を構成する記憶装置の故障時にRAIDにおける冗長性を復旧する技術に関する。
 RAID1、RAID5、RAID6等の冗長性を有する論理ディスク(RAID)を構成する一部のディスク(物理ディスク)が故障すると、RAIDが縮退(冗長性を喪失又は冗長性が低下)する。この際、予め実装されていたホットスペアディスクにおいて、故障したディスクが保持していたデータと同じデータを再構成(リビルド)し、RAIDを縮退していない状態に復旧することがある。
 近年、ディスク容量の増大に伴い、リビルドに要する時間が増大している。そのため、RAIDが縮退状態にある時間や、リビルド中の性能低下時間の長時間化が問題になっている。
 リビルドに要する時間を短縮する技術の一例が特許文献1に開示されている。特許文献1のストレージシステムは、ストレージ制御装置と、1つのRLU(RAID Logical Unit)を構成する複数台の記憶装置と、予備用の記憶装置とを含む。ストレージ制御装置は、リビルド制御部と、アクセス処理部とを含む。リビルド制御部は、リビルド処理を部分処理に分割して、部分処理の実行をアクセス処理部に指示する。リビルド処理は、当該RLUを構成するある記憶装置に記録されていたデータと同一のデータを、当該RLUを構成する残りの記憶装置から読み出したデータを基に生成して、予備用の記憶装置に書き込む処理である。部分処理は、データの読み出し対象範囲を一定サイズごとに分割した分割範囲からデータを読み出す処理と、この分割範囲から読み出したデータに基づいて他の記憶装置にデータを書き込む処理との組み合わせを含む。アクセス制御部は、リビルド制御部から受け付けた複数の部分処理P1、P2の実行指示に応じて、指示された部分処理P1、P2を並列に実行する。上記構成の結果、特許文献1のストレージシステムは、リビルド処理を高速化する。
 特許文献1の技術では、記憶装置の故障が検出された後にリビルド処理を開始する。そのため、特許文献1の技術には、リビルドの開始が遅いという問題がある。
 記憶装置の故障が検出される前にリビルド処理を開始する技術の一例が特許文献2に開示されている。特許文献2のストレージシステムは、複数のHDD(Hard Disk Drive)と、スペアHDDと、制御部とを備える。複数のHDDは、パリティ計算を利用する1種類のRAID方式に従って、RAIDを構成する。スペアHDDは、RAIDにより冗長性が確保されたデータのうち何れかのHDDに記憶される第1のデータと同内容の第2のデータを記憶する。制御部は、複数のHDDのうちの1つがスペアHDDに取り換えられた場合、当該取り換えられたHDDに記憶されていたデータを、他のHDD及びスペアHDDに記憶されているデータに基づいて、スペアHDDにおいてリビルドする。上記構成の結果、特許文献2のストレージシステムは、あるHDDが取り換えられた時点で、当該取り換えられたHDDに記憶される第1のデータと同内容の第2のデータをスペアHDDに記憶している。
特開2013-054407号公報 特開2012-185575号公報
 特許文献2のストレージシステムでは、複数のHDDは、1種類のRAID方式(RAID5又はRAID6の何れか)に従って、RAIDを構成している。
 一般的なストレージシステムでは、保持するデータの種類等に応じて、一群のHDDのそれぞれに、複数の種類のRAID方式(RAID1及びRAID5、RAID1及び又はRAID6等)の何れかを個別に適用することがある。
 ところが、特許文献2のストレージシステムには、複数のHDDが複数の種類のRAID方式に従ってRAIDを構成している場合に、全ての種類のRAID方式(RAID1等)における冗長性を復旧することができないという問題がある。
 本発明は、上記の課題に鑑みてなされたもので、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮することを主たる目的とする。
 本発明の一態様において、ディスクアレイコントローラは、複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成手段とを備える。
 本発明の一態様において、ストレージ装置は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置と、全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成手段とを含むディスクアレイコントローラとを備える。
 本発明の一態様において、ストレージ装置の復旧方法は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置とを備えたストレージ装置の復旧方法であって、全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングすると共に、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する。
 本発明の一態様において、ディスクアレイコントローラの復旧プログラム又は、係る復旧プログラムが格納された非一時的な記憶媒体は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置とに接続されたディスクアレイコントローラが備えるコンピュータに、複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング処理と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成処理とを実行させる。
 本発明によれば、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮できるという効果がある。
本発明の第1の実施形態におけるストレージ装置の構成の一例を示すブロック図である。 本発明の第1の実施形態におけるストレージ装置の動作を示すフローチャートである。 本発明の第1の実施形態におけるストレージ装置の動作例を説明する図である。 本発明の第1の実施形態におけるストレージ装置の別の動作例を説明する図である。 本発明の各実施形態におけるストレージ装置を実現可能なハードウェア構成の一例を示すブロック図である。
 以下、本発明の実施形態について、図面を参照して詳細に説明する。なお、すべての図面において、同等の構成要素には同じ符号を付し、適宜説明を省略する。
(第1の実施形態)
 本実施形態における構成について説明する。
 図1は、本発明の第1の実施形態におけるストレージ装置の構成の一例を示すブロック図である。図1では、記憶装置D1及び記憶装置D2がRAID1方式によってRAIDを構成し、記憶装置D3、記憶装置D4、及び記憶装置D5がRAID5方式によってRAIDを構成する例を示している。ここで、A1、A2、A3、・・・はある一連のデータを構成するブロック(におけるデータ)を示し、B1、B2、B3、・・・は別の一連のデータを構成するブロック(におけるデータ)を示すこととする。又、PB12は、ブロックB1及びブロックB2から算出されるパリティデータを含むブロックであることとする。即ち、ブロックB1、ブロックB2、又はブロックPB12のうち何れか2つのブロックから、残りの1つのブロックを算出できる。ブロックPB34、PB56、・・・についても、ブロックPB12と同様である。又、本実施形態におけるRAID方式、各RAIDを構成する記憶装置の台数等は本例には限定されない。
 本実施形態におけるストレージ装置100は、複数台の記憶装置140と、予備記憶装置150と、ディスクアレイコントローラ110とを含む。
 複数台の記憶装置140は、複数種類のRAIDを構成する。各記憶装置140は、例えば、HDD、SSD(Solid State Drive)、又は不揮発性メモリである。
 予備記憶装置150は、記憶装置140毎に所定の一部ブロックをミラーリングする。予備記憶装置150は、例えば、HDD、SSD、又は不揮発性メモリである。
 ディスクアレイコントローラ110は、複数種類のRAID方式の何れかに従って、各記憶装置140を制御する。ディスクアレイコントローラ110は、部分ミラーリング部120と、再構成部130とを含む。ここで、複数種類のRAID方式は、例えば、RAID1及びRAID5、又はRAID1及びRAID6である。ここで、RAID5の代わりにRAID6が使用される場合には、RAIDを構成する記憶装置140が追加されてもよい。
 部分ミラーリング部120は、全ての記憶装置140それぞれにおける所定のブロックを予備記憶装置150にミラーリングする。図1では、予備記憶装置150は、記憶装置D1のブロックA1と、記憶装置D2のブロックA2と、記憶装置D3のブロックPB56と、記憶装置D4のブロックB8と、記憶装置D5のブロックB0とを予備記憶装置150にミラーリングしている。
 再構成部130は、記憶装置140の何れかが故障した際に、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを、予備記憶装置150において再構成する。そして、再構成部130は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する。
 本実施形態における動作について説明する。
 図2は、本発明の第1の実施形態におけるストレージ装置の動作を示すフローチャートである。
 まず、ストレージ装置100は、複数種類のRAIDを構成する全ての記憶装置140それぞれにおける所定のブロックを予備記憶装置150にミラーリングする(ステップS110)。ここで、所定のブロックは、複数種類のRAIDを構成する各記憶装置140において少なくとも1つ選択されることとする。各記憶装置140において選択されたブロックの合計サイズは、故障が発生した記憶装置140の再構成(ステップS130において後述)に要する時間が均等化されるように設定されることが望ましい。
 次に、ストレージ装置100は、記憶装置140の何れかが故障したか否かを検出する(ステップS120)。ここで、記憶装置140の故障は、例えば、S.M.A.R.T.(Self-Monitoring Analysis and Reporting Technology)を用いて検出される。
 記憶装置140の何れも故障しなければ(ステップS120:No)、ストレージ装置100は、ステップS110に処理を戻す。
 続いて、記憶装置140の何れかが故障すれば(ステップS120:Yes)、ストレージ装置100は、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを、予備記憶装置150において再構成する(ステップS130)。
 続いて、ストレージ装置100は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する(ステップS140)。
 本実施形態における動作例について説明する。
 図3は、本発明の第1の実施形態におけるストレージ装置の動作例を説明する図である。
 故障発生前において、記憶装置D1、D2、D3、D4、D5のブロックA1、A2、PB56、B8、B0はそれぞれ予備記憶装置にミラーリングされている(図1)。ある時点において、記憶装置D5が故障することとする。
 このとき、ストレージ装置100は、予備記憶装置150において記憶装置D5の再構成(リビルド)を開始する。ところが、ブロックB0は既にミラーリングされているので、記憶装置D5におけるPB12、B4、B6、PB78、・・・のデータについて、記憶装置D3及び記憶装置D4によって保持されるデータに基づいてデータをリビルドする。その結果、予備記憶装置150においてミラーリング済みであったブロックB0のリビルドに要する時間の分、リビルドに要する時間が短縮される。
 図4は、本発明の第1の実施形態におけるストレージ装置の別の動作例を説明する図である。
 故障発生前において、記憶装置D1、D2、D3、D4、D5のブロックA1、A2、PB56、B8、B0はそれぞれ予備記憶装置にミラーリングされている(図1)。ある時点において、記憶装置D2が故障することとする。
 このとき、ストレージ装置100は、予備記憶装置150において記憶装置D2のリビルドを開始する。ところが、ブロックA1、A2は既にミラーリングされているので、記憶装置D2におけるA3、A4、A5、・・・について、記憶装置D1によって保持されるデータに基づいてブロックをリビルドする。その結果、予備記憶装置150においてミラーリング済みであったブロックA1及びA2のリビルドに要する時間の分、リビルドに要する時間が短縮される。
 以上説明したように、本実施形態におけるストレージ装置100は、複数種類のRAIDを構成する全ての記憶装置140について、記憶装置140毎の所定の一部ブロックを予備記憶装置150にミラーリングする。そして、ストレージ装置100は、記憶装置140の何れかが故障した際に、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを予備記憶装置150において再構成する。そして、ストレージ装置100は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する。従って、本実施形態におけるストレージ装置100には、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮できるという効果がある。
 特に、記憶装置D1又はD2から予備記憶装置150にミラーリングされた所定のブロックの合計サイズの総和と、記憶装置D3、D4、D5、・・・それぞれから予備記憶装置150にミラーリングされた所定のブロックの合計サイズとが均等化されている場合には、ある記憶装置140の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間が均等化されるという効果がある。
 図5は、本発明の各実施形態におけるストレージ装置を実現可能なハードウェア構成の一例を示すブロック図である。
 ストレージ装置907は、記憶装置902と、CPU(Central Processing Unit)903と、キーボード904と、モニタ905と、I/O(Input/Output)装置908とを備え、これらが内部バス906によって接続されている。記憶装置902は、部分ミラーリング部120、再構成部130等のCPU903の動作プログラムを格納する。CPU903は、ストレージ装置907の全体を制御し、記憶装置902に格納された動作プログラムを実行し、I/O装置908によって部分ミラーリング部120、再構成部130等のプログラムの実行やデータの送受信を行なう。尚、上記のストレージ装置907の内部構成は一例である。ストレージ装置907は、必要に応じて、キーボード904、モニタ905を接続する装置構成であってもよい。
 上述した本発明の各実施形態におけるストレージ装置907は、専用の装置によって実現してもよいが、I/O装置908が外部との通信を実行するハードウェアの動作以外は、コンピュータ(情報処理装置)によっても実現可能である。本発明の各実施形態において、I/O装置908は、例えば、記憶装置140、予備記憶装置150等との入出力部である。この場合、係るコンピュータは、記憶装置902に格納されたソフトウェア・プログラムをCPU903に読み出し、読み出したソフトウェア・プログラムをCPU903において実行する。上述した各実施形態の場合、係るソフトウェア・プログラムには、上述したところの、図1に示した、ストレージ装置907又はストレージ装置907の各部の機能を実現可能な記述がなされていればよい。但し、これらの各部には、適宜ハードウェアを含むことも想定される。そして、このような場合、係るソフトウェア・プログラム(コンピュータ・プログラム)は、本発明を構成すると捉えることができる。更に、係るソフトウェア・プログラムを格納した、コンピュータ読み取り可能な記憶媒体も、本発明を構成すると捉えることができる。
 以上、本発明を、上述した各実施形態およびその変形例によって例示的に説明した。しかしながら、本発明の技術的範囲は、上述した各実施形態およびその変形例に記載した範囲に限定されない。当業者には、係る実施形態に対して多様な変更又は改良を加えることが可能であることは明らかである。そのような場合、係る変更又は改良を加えた新たな実施形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、請求の範囲に記載した事項から明らかである。
 この出願は、2018年1月10日に出願された日本出願特願2018-002031を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明は、RAIDを構成する記憶装置の故障時における復旧時間を短縮する用途において利用できる。
 100 ストレージ装置
 110 ディスクアレイコントローラ
 120 部分ミラーリング部
 130 再構成部
 140 記憶装置
 150 予備記憶装置
 902 記憶装置
 903 CPU
 904 キーボード
 905 モニタ
 906 内部バス
 907 ストレージ装置
 908 I/O装置

Claims (7)

  1.  複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、
     前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する再構成手段と
    を備えたディスクアレイコントローラ。
  2.  RAID1を構成する全ての前記記憶装置における前記所定のブロックの合計サイズの総和とRAID5又はRAID6の何れか一方を構成する各前記記憶装置における前記所定のブロックの合計サイズとが均等化された
    請求項1に記載のディスクアレイコントローラ。
  3.  請求項1又は2に記載のディスクアレイコントローラと、
      前記記憶装置と、
      前記予備記憶装置と、
    を備えたストレージ装置。
  4.  複数種類のRAIDを構成する複数台の記憶装置と、
     予備記憶装置と
    を備えたストレージ装置の復旧方法であって、
     全ての前記記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングすると共に、
     前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する、
    ストレージ装置の復旧方法。
  5.  RAID1を構成する全ての前記記憶装置における前記所定のブロックの合計サイズの総和とRAID5又はRAID6の何れか一方を構成する各前記記憶装置における前記所定のブロックの合計サイズとが均等化された
    請求項4に記載のストレージ装置の復旧方法。
  6.  複数種類のRAIDを構成する複数台の記憶装置と、
     予備記憶装置と
    に接続されたディスクアレイコントローラが備えるコンピュータに、
     複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング処理と、
     前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する再構成処理と
    を実行させる、ディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体。
  7.  RAID1を構成する全ての前記記憶装置における前記所定のブロックの合計サイズの総和とRAID5又はRAID6の何れか一方を構成する各前記記憶装置における前記所定のブロックの合計サイズとが均等化された
    請求項6に記載のディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体。
PCT/JP2019/000206 2018-01-10 2019-01-08 ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体 WO2019138999A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018002031A JP6734305B2 (ja) 2018-01-10 2018-01-10 ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラム
JP2018-002031 2018-02-02

Publications (1)

Publication Number Publication Date
WO2019138999A1 true WO2019138999A1 (ja) 2019-07-18

Family

ID=67218306

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/000206 WO2019138999A1 (ja) 2018-01-10 2019-01-08 ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体

Country Status (2)

Country Link
JP (1) JP6734305B2 (ja)
WO (1) WO2019138999A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102697634B1 (ko) * 2022-06-07 2024-08-23 삼성전자주식회사 스토리지 장치 및 전자 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272548A (ja) * 1995-02-10 1996-10-18 Hewlett Packard Co <Hp> 保留された量の不使用の記憶スペースを使用する方法
JP2004118837A (ja) * 2002-09-20 2004-04-15 Quantum Corp 耐故障性の記憶サブシステムにデータを格納するための方法、記憶サブシステムおよびそのシステムのためのデータ編成管理プログラム
JP2012185575A (ja) * 2011-03-03 2012-09-27 Nec Corp ストレージシステム及びリビルド処理高速化方法
JP2013041394A (ja) * 2011-08-15 2013-02-28 Fujitsu Ltd ストレージ装置、およびストレージ装置制御方法
US20170147437A1 (en) * 2015-11-22 2017-05-25 International Business Machines Corporation Intelligent stress testing and raid rebuild to prevent data loss

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272548A (ja) * 1995-02-10 1996-10-18 Hewlett Packard Co <Hp> 保留された量の不使用の記憶スペースを使用する方法
JP2004118837A (ja) * 2002-09-20 2004-04-15 Quantum Corp 耐故障性の記憶サブシステムにデータを格納するための方法、記憶サブシステムおよびそのシステムのためのデータ編成管理プログラム
JP2012185575A (ja) * 2011-03-03 2012-09-27 Nec Corp ストレージシステム及びリビルド処理高速化方法
JP2013041394A (ja) * 2011-08-15 2013-02-28 Fujitsu Ltd ストレージ装置、およびストレージ装置制御方法
US20170147437A1 (en) * 2015-11-22 2017-05-25 International Business Machines Corporation Intelligent stress testing and raid rebuild to prevent data loss

Also Published As

Publication number Publication date
JP6734305B2 (ja) 2020-08-05
JP2019121279A (ja) 2019-07-22

Similar Documents

Publication Publication Date Title
JP3595099B2 (ja) デバイスアレイ・システム
CN101523353B (zh) 在存在全局热备用磁盘的情况下用于故障驱动器的优化重建和向回复制的方法
JP5391993B2 (ja) ディスクアレイ装置
US7480909B2 (en) Method and apparatus for cooperative distributed task management in a storage subsystem with multiple controllers using cache locking
KR100275900B1 (ko) 알에이아이디 서브시스템에 있어서 분할패러티 예비 디스크 구현방법
US8473779B2 (en) Systems and methods for error correction and detection, isolation, and recovery of faults in a fail-in-place storage array
JP3732869B2 (ja) 外部記憶装置
JP3187730B2 (ja) Raid記憶サブシステムにおけるデータのスナップショットコピー作成方法及びその装置
US20060190683A1 (en) Disk array apparatus and backup method of data
JP2006079418A (ja) 記憶制御装置、制御方法及びプログラム
JP2006252126A (ja) ディスクアレイ装置及びその再構築方法
JP3681766B2 (ja) ディスクアレイ装置
JP5891890B2 (ja) ストレージシステム、ストレージ装置およびデータ復元方法
JP2005099995A (ja) 磁気ディスク装置のディスク共有方法及びシステム
WO2019138999A1 (ja) ディスクアレイコントローラ、ストレージ装置、ストレージ装置の復旧方法、及びディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体
JP3776438B2 (ja) 記憶装置
US20140149787A1 (en) Method and system for copyback completion with a failed drive
US20050097390A1 (en) Method and apparatus for copying data of disk drive in disk array system
JP2005166016A (ja) ディスクアレイ装置
JP3991947B2 (ja) 2種類のパリティと複数のデータ復旧方式とを有するディスクアレイ装置
JP2004164675A (ja) ディスクアレイ装置
JP2014041523A (ja) データ管理装置、及び、データ管理方法
JP2015060346A (ja) ディスクアレイ装置、ディスクアレイ装置の冗長化方法およびプログラム
JP7513294B2 (ja) ストレージ装置、ストレージシステム、障害復旧方法、及びプログラム
JP3699473B2 (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19738260

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19738260

Country of ref document: EP

Kind code of ref document: A1