JP2010092176A - Information processor and operation method for the information processor - Google Patents
Information processor and operation method for the information processor Download PDFInfo
- Publication number
- JP2010092176A JP2010092176A JP2008260037A JP2008260037A JP2010092176A JP 2010092176 A JP2010092176 A JP 2010092176A JP 2008260037 A JP2008260037 A JP 2008260037A JP 2008260037 A JP2008260037 A JP 2008260037A JP 2010092176 A JP2010092176 A JP 2010092176A
- Authority
- JP
- Japan
- Prior art keywords
- vol
- data
- information processing
- processing apparatus
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、及び情報処理装置の運用方法に関し、特にスナップショット差分データのデータコピー処理を、コピー元及びコピー先において記憶領域を効率的に使用しつつ確実に継続するための技術に関する。 The present invention relates to an information processing apparatus and an operation method of the information processing apparatus, and in particular, a technique for reliably continuing data copy processing of snapshot difference data while efficiently using a storage area at a copy source and a copy destination. About.
ストレージシステムの機能として、運用中のボリューム(以下、「運用ボリューム」と称する。)のある時点の状態(以下、「スナップショット」と称する。)を、ユーザ等からの要求に応じて提供する機能(以下、「スナップショット機能」と称する。)がある。このスナップショット機能は、通常は運用ボリュームのある時点のスナップショットを再現するためのデータ(以下、「差分データ」と称する。)を運用ボリュームとは別のボリューム(以下、「差分ボリューム」と称する。)に退避しておき、ユーザ等からの要求に応じて、現在の運用ボリュームのデータと差分ボリュームに退避しておいた差分データとによってある時点のスナップショットを再現するという方法で実現される。 As a function of the storage system, a function of providing a state (hereinafter referred to as “snapshot”) at a certain point in time for an operating volume (hereinafter referred to as “active volume”) in response to a request from a user or the like. (Hereinafter referred to as “snapshot function”). In this snapshot function, data for reproducing a snapshot at a certain point in the operation volume (hereinafter referred to as “differential data”) is usually referred to as a volume different from the operation volume (hereinafter referred to as “differential volume”). )), And in response to a request from the user or the like, it is realized by a method of reproducing a snapshot at a certain point of time based on the data of the current operation volume and the difference data saved in the difference volume. .
一方、データセンタ等の大量のデータが記憶されているサイトについて、災害等によるデータ喪失のリスクを低減ないし排除するために、当該サイトから物理的に離隔した場所に別のデータ記憶領域を提供するサイトを設けて両者間を通信ネットワークにより接続し、データセンタ等に記憶されるデータを定期的に前記別サイトの記憶領域にコピーして二重化する処理が行われている(以下、このようなデータコピー処理を「リモートコピー」と称する。また、データ原本が記憶されている場所にある装置等を示す場合には「ローカル」と、データコピーが記憶されている場所にある装置等を示す場合には「リモート」と付して区別するものとする。)。 On the other hand, in order to reduce or eliminate the risk of data loss due to disasters, etc. for sites storing a large amount of data such as data centers, another data storage area is provided at a location physically separated from the site A site is established, the two are connected by a communication network, and data stored in a data center or the like is periodically copied to the storage area of the other site to be duplicated (hereinafter such data is used). The copy process is referred to as “remote copy.” In addition, when referring to a device or the like at a location where the original data is stored, “local” is used to indicate a device or the like at a location where the data copy is stored. Will be distinguished from "Remote".)
最初に述べたスナップショットについても、このリモートコピー処理の対象となる(例えば特許文献1を参照)。スナップショットのリモートコピーを確実に実施するための技術として、コピー先において差分データを記憶する差分ボリュームの容量不足を防止する技術が開示されている(例えば特許文献2を参照)。
例えばローカルサイトのシステムにハードウェア障害等が発生した場合、システムの運用を継続するために、所定の手順でリモートサイトのシステムに自動的に切り換える、フェイルオーバー処理が採用される。前記スナップショットのリモートコピーをローカル−リモートサイト間で実施している場合、ローカル−リモート間で差分ボリュームの容量に差異が生じるという問題がある。これは、例えばハードウェアによるシンプロビジョニング(Thin-provisioning)で管理されているボリュームが差分ボリュームに割当てられている場合、一時的なハードウェア障害により記憶領域の動的割当てができなくなると、割当て済みの記憶領域しか使用できなくなり、差分ボリュームの容量不足につながる。ローカルサイトでこのような状態になると、ローカル−リモートサイト間で差分ボリューム容量の差異が生じ、フェイルオーバーの契機となる。 For example, when a hardware failure or the like occurs in the local site system, a failover process is adopted in which the system is automatically switched to the remote site system in a predetermined procedure in order to continue the operation of the system. When the remote copy of the snapshot is performed between the local and remote sites, there is a problem that a difference occurs in the capacity of the differential volume between the local and remote sites. For example, if a volume managed by hardware thin provisioning (Thin-provisioning) is assigned to a differential volume, it will be allocated if dynamic storage cannot be allocated due to a temporary hardware failure. Only the storage area can be used, which leads to a shortage of differential volume capacity. When such a state occurs at the local site, a difference in the differential volume capacity occurs between the local and remote sites, which triggers a failover.
また、ローカルサイトにおいて、ストレージシステムの利用効率を向上するための運用、例えば未使用領域の多いボリュームに記憶されているデータをより容量の小さいボリュームに移動させる運用が行われている場合、前記データ移動によって、差分ボリュームの容量不足が生じる可能性がある。この場合にも、ローカル−リモートサイト間で差分ボリューム容量の差異が生じ、フェイルオーバーの契機となる。 In addition, in the local site, when the operation for improving the use efficiency of the storage system, for example, the operation of moving the data stored in the volume with a large unused area to the volume with a smaller capacity is performed, the data Due to the movement, there is a possibility that the capacity of the differential volume will be insufficient. Also in this case, a difference in the difference volume capacity occurs between the local and remote sites, which triggers failover.
このような差分ボリュームの容量不足に対しては、未割当の予備ボリュームを差分ボリュームとして追加する処理で対応するが、予備ボリューム容量にローカル−リモートサイト間で差異が生じることがあり、このような場合には、予備ボリューム容量が少ない方のサイトにおいて、差分ボリュームの追加ができないことがあり得るという問題がある。 Such a shortage of differential volume capacity is handled by adding an unallocated spare volume as a differential volume, but there may be a difference in spare volume capacity between the local and remote sites. In this case, there is a problem that a difference volume may not be added at a site having a smaller spare volume capacity.
予備ボリューム容量の差異は、例えばハードウェア障害により生じることがある。あるいは、ローカルとリモートで運用が独立しており、ボリュームの追加等が個々で行われている場合、予備ボリューム数に差異が生じることが考えられる。 The difference in spare volume capacity may be caused by a hardware failure, for example. Alternatively, if the operation is independent between the local and remote, and the addition of volumes is performed individually, there may be a difference in the number of spare volumes.
そこで本発明は、スナップショット差分データのデータコピー処理を、コピー元及びコピー先において記憶領域を効率的に使用しつつ確実に継続することを可能とする、情報処理装置、及び情報処理装置の運用方法を提供することを目的とする。 Therefore, the present invention provides an information processing apparatus and an operation of the information processing apparatus that can reliably continue data copy processing of snapshot difference data while efficiently using a storage area at a copy source and a copy destination It aims to provide a method.
上記の、及び他の課題を解決するための本発明の態様のうちの一つは、複数の論理ボリュームを提供するストレージ装置に通信可能に接続し、前記複数の論理ボリュームを、外部装置とのデータ入出力に使用するP−VOL、ある時点における前記P−VOLの状態であるスナップショットを再現すべく、前記P−VOLのデータが更新されることにより生じた差分データを格納するD−VOL、及び前記D−VOLとして追加割当てすることができる予備ボリュームとに割り当てて管理し、前記P−VOLにそれぞれアクセス可能とされているファイルシステムと、前記外部装置が前記ファイルシステムと通信をするための通信インターフェイスとを備えた情報処理装置であって、所定の時間間隔で、前記D−VOLの差分データを、前記通信インターフェイスを介して、前記ストレージ装置外にある他のD−VOLにコピーするデータコピー処理部と、前記データコピー処理部が前記D−VOLの差分データを前記他のD−VOLにコピーする処理を完了した際に、前記他のD−VOLに新規のD−VOLとして追加されるべく設けられている他の予備ボリュームの数を取得して、自身が有する予備ボリュームの数と比較し、両者の差があらかじめ規定しておいた閾値を超えており、かつ前記他の予備ボリュームの数が自身の予備ボリュームの数よりも大であると判定した場合に、前記データコピー処理部の当該データコピー処理のコピー元の機能をコピー先の機能に切り換えるフェイルオーバー処理を行うフェイルオーバー処理部とを備えている。 One of the aspects of the present invention for solving the above-mentioned and other problems is that the plurality of logical volumes are connected to an external device so as to be communicably connected to a storage apparatus that provides a plurality of logical volumes. P-VOL used for data input / output and D-VOL for storing differential data generated by updating the data of the P-VOL in order to reproduce a snapshot which is the state of the P-VOL at a certain point in time , And a spare volume that can be additionally assigned as the D-VOL and managed, and the P-VOL can be accessed respectively, and the external device communicates with the file system. And an information processing apparatus having the communication interface of the D-VOL at a predetermined time interval. A data copy processing unit that copies to another D-VOL outside the storage apparatus via the communication interface, and a process in which the data copy processing unit copies differential data of the D-VOL to the other D-VOL Is completed, the number of other spare volumes provided to be added as a new D-VOL to the other D-VOL is obtained, and compared with the number of spare volumes that it has. The data copy processing unit determines that the number of the other spare volumes is greater than the number of its own spare volumes. A failover processing unit for performing a failover process for switching the function of the process copy source to the function of the copy destination.
その他、本願が開示する課題、及びその解決方法は、発明を実施するための最良の形態の欄、及び図面により明らかにされる。 In addition, the problems disclosed by the present application and the solutions thereof will be clarified by the column of the best mode for carrying out the invention and the drawings.
本発明によれば、スナップショット差分データのデータコピー処理を、コピー元及びコピー先において記憶領域を効率的に使用しつつ確実に継続することが可能となる。 According to the present invention, it is possible to reliably continue the data copy process of the snapshot difference data while efficiently using the storage area at the copy source and the copy destination.
以下、図面を参照しつつ実施の形態について説明する。
図1Aに一実施形態として説明する情報処理システム1のハードウェア構成を示している。同図に示すように、この情報処理システム1は、サーバ装置10、ストレージ装置20、ホスト/クライアント装置30、及びLANスイッチ40を含む。ホスト/クライアント装置30とサーバ装置10との間は通信ネットワーク50を介して通信可能に接続されている。2台のサーバ装置10の間は、通信ネットワーク51を介して通信可能に接続されている。各サーバ装置10にはストレージ装置20が接続されており、いずれかがローカルサイト、他方がリモートサイトとして機能することでストレージ装置20に記憶されているデータを二重化している。
Hereinafter, embodiments will be described with reference to the drawings.
FIG. 1A shows a hardware configuration of an information processing system 1 described as an embodiment. As shown in the figure, the information processing system 1 includes a server device 10, a storage device 20, a host / client device 30, and a LAN switch 40. The host / client device 30 and the server device 10 are communicably connected via a communication network 50. The two server apparatuses 10 are communicably connected via the communication network 51. Each server device 10 is connected to a storage device 20, one of which functions as a local site and the other as a remote site, thereby duplicating data stored in the storage device 20.
通信ネットワーク50は例えばLAN(Local Area Network)である。通信ネットワーク51は例えばインターネットである。サーバ装置10とストレージ装置20との間は、例えばファイバチャネル(Fibre Channel)を用いて構成されるSAN(Storage Area network)によって接続されている(図示省略)。なお、通信ネットワーク50と通信ネットワーク51との間は、図示を省略するルータ、スイッチ等の通信機器を介して接続されている。 The communication network 50 is, for example, a LAN (Local Area Network). The communication network 51 is, for example, the Internet. The server apparatus 10 and the storage apparatus 20 are connected by a SAN (Storage Area Network) configured using, for example, a fiber channel (not shown). Note that the communication network 50 and the communication network 51 are connected via communication devices such as routers and switches (not shown).
ホスト/クライアント装置30は、例えばパーソナルコンピュータやワークステーション等のコンピュータ(情報処理装置)である。サーバ装置10は、クライアント装置30から送られてくる要求に応じて、クライアント装置30に対し、ストレージ装置20の記憶領域を提供する。尚、サーバ装置10は、ホスト/クライアント装置30に対してファイルサーバとして機能するNAS(Network Attached Storage)である。サーバ装置10は、クライアント装置30から送信されてくるI/O要求(データ書き込み要求、データ読み出し要求)を受け付け、ストレージ装置20へのデータの書き込み又はデータの読み出しを行う。またサーバ装置10は、データの書き込み完了報告、読み出したデータ等をクライアント装置30に適宜送信する。 The host / client device 30 is a computer (information processing device) such as a personal computer or a workstation. The server device 10 provides the storage area of the storage device 20 to the client device 30 in response to a request sent from the client device 30. The server device 10 is a NAS (Network Attached Storage) that functions as a file server for the host / client device 30. The server device 10 receives an I / O request (data write request, data read request) transmitted from the client device 30 and writes data to or reads data from the storage device 20. In addition, the server device 10 appropriately transmits a data write completion report, read data, and the like to the client device 30.
LANスイッチ40は、NASであるサーバ装置10とホスト/クライアント装置30との間に設けられ、後述するファイル共有システムを通信ネットワーク50(LAN)に接続するインターフェイスである。ファイル共有システムに割り得てられている一つのIPアドレスに対して、複数のLANポートをマッピングすることで、そのIPアドレスの負荷等に応じて帯域を増減させるようにしている。 The LAN switch 40 is an interface that is provided between the server device 10 that is a NAS and the host / client device 30 and connects a file sharing system, which will be described later, to the communication network 50 (LAN). By mapping a plurality of LAN ports to one IP address allocated to the file sharing system, the bandwidth is increased or decreased according to the load of the IP address.
図1Bにサーバ装置10又はクライアント装置30として利用可能なコンピュータの一例を示している。このコンピュータ100は、中央処理装置101(例えばCPU(Central Processing Unit)やMPU(Micro Processing Unit))、主記憶装置102(例えばRAM(Random Access Memory)やROM(Read Only Memory))、補助記憶装置103(例えばハードディスク)、ユーザの操作入力を受け付ける入力装置104(例えばキーボードやマウス)、出力装置105(例えば液晶モニタ)、他の装置との間の通信を実現する通信インターフェイス106(例えばNIC(Network Interface Card)やHBA(Host Bus Adapter))を備えている。 FIG. 1B shows an example of a computer that can be used as the server device 10 or the client device 30. The computer 100 includes a central processing unit 101 (for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit)), a main storage device 102 (for example, a RAM (Random Access Memory) or a ROM (Read Only Memory)), an auxiliary storage device. 103 (for example, a hard disk), an input device 104 (for example, a keyboard or a mouse) that accepts user operation input, an output device 105 (for example, a liquid crystal monitor), and a communication interface 106 (for example, NIC (Network)) that realizes communication with other devices Interface Card) and HBA (Host Bus Adapter)).
ストレージ装置20は、クライアント装置30が利用する上記記憶領域を提供する。ストレージ装置20は、キャッシュメモリ21、サーバ装置10との間で通信を行うとともに、キャッシュメモリ21へのデータの書き込み又は読み出しを行うチャネルアダプタ22、キャッシュメモリ21へのデータの書き込み又は読み出しを行うとともにハードディスク24へのデータの書き込み又は読み出しを行うディスクコントローラ23を有する。ストレージ装置20は、ハードディスク24をRAID(Redundant Array of Inexpensive Disks)方式で運用する。 The storage device 20 provides the storage area used by the client device 30. The storage device 20 communicates with the cache memory 21 and the server device 10, writes / reads data to / from the cache memory 21, and writes / reads data to / from the cache memory 21. A disk controller 23 for writing or reading data to or from the hard disk 24 is included. The storage apparatus 20 operates the hard disk 24 by a RAID (Redundant Array of Inexpensive Disks) method.
図2にサーバ装置10の機能を示している。尚、同図に示す機能は、サーバ装置10のCPU11が、メモリ12又はハードディスク13に記憶されているプログラムを実行することによって、又はサーバ装置10のハードウェアが本来的に備える機能によって実現される。同図に示す機能のうち、ファイル共有システム211は、通信ネットワーク50に接続する装置に対し、ストレージ装置20によって提供される記憶領域に記憶されるデータをファイル単位又はディレクトリ単位(フォルダ単位)で共有する仕組みを実現する。ファイル共有システム211の具体例として、NFS(Network File System)やCIFS(Common Internet File System)がある。 FIG. 2 shows functions of the server device 10. Note that the functions shown in the figure are realized by the CPU 11 of the server device 10 executing a program stored in the memory 12 or the hard disk 13, or by functions originally provided in the hardware of the server device 10. . Among the functions shown in the figure, the file sharing system 211 shares data stored in a storage area provided by the storage device 20 in units of files or directories (folders) to devices connected to the communication network 50. Realize the mechanism to do. Specific examples of the file sharing system 211 include NFS (Network File System) and CIFS (Common Internet File System).
ファイルシステム212は、通信ネットワーク50に接続する装置に対し、ストレージ装置20によって提供される記憶領域に記憶されるデータをファイル単位又はディレクトリ単位(フォルダ単位)でアクセスさせるための機能を実現する。ファイルシステム212の具体例として、UNIX(登録商標)系のファイルシステム、Windows(登録商標)系のファイルシステムがある。尚、本実施形態では、サーバ装置10において互いに独立して機能する一つ以上のファイルシステム212が実現されているものとする。 The file system 212 realizes a function for allowing a device connected to the communication network 50 to access data stored in a storage area provided by the storage device 20 in file units or directory units (folder units). Specific examples of the file system 212 include a UNIX (registered trademark) file system and a Windows (registered trademark) file system. In the present embodiment, it is assumed that one or more file systems 212 functioning independently of each other are realized in the server device 10.
ファイルシステム212は、上記仕組みを実現するための情報(以下、ファイル管理情報310と称する。)を管理している。例えばUNIX系のファイルシステムは、図3Aに示すように、上記情報としてスーパーブロック3101、ディレクトリエントリ3102、iノードテーブル3103、及びデータブロック3104を管理する。このうちのスーパーブロック311には、ファイルシステム212の管理対象である記憶領域のサイズや空き領域のサイズ等が管理される。図3Bに示すように、ディレクトリエントリ312には、ファイル名(ディレクトリパス名3121)とiノード番号3122の対応関係が管理される。図3Cに示すように、iノードテーブル313には、iノード番号3131に対応づけて、ファイルの所有者を特定する情報(所有者3132)、アクセス権3133、ファイルサイズ3134、ファイルの格納位置(当該ファイルのデータが格納されているデータブロック314のアドレス)が管理されている。 The file system 212 manages information for realizing the above mechanism (hereinafter referred to as file management information 310). For example, as shown in FIG. 3A, a UNIX file system manages a super block 3101, a directory entry 3102, an i-node table 3103, and a data block 3104 as the above information. Of these, the super block 311 manages the size of the storage area, the size of the free area, and the like that are the management targets of the file system 212. As shown in FIG. 3B, the directory entry 312 manages the correspondence between the file name (directory path name 3121) and the i-node number 3122. As shown in FIG. 3C, in the i-node table 313, information (owner 3132) for specifying the owner of the file in association with the i-node number 3131, the access right 3133, the file size 3134, the storage location of the file ( The address of the data block 314 in which the file data is stored is managed.
図2に示したLVM216(LVM: Logical Volume Manager)は、ストレージ装置20によって提供される論理的な記憶装置の単位である論理装置(論理ユニット(LU: Logical Unit))に基づいて、論理的な記憶領域たる論理ボリューム(Logical Volume(以下、LVと称する。))を、ファイルシステム212等の上位層に提供する。即ちLVM216は、論理ユニット(LU)を論理ボリューム(LV)として利用できるようにする機能と、論理ボリューム(LV)に対するブロック単位のデータの書き込み又は読み出しを行うためのデバイスドライバとしての機能を有する。論理ユニット(LU)は、例えばSCSI(SCSI: Small Computer System Interface)やATAPI(Attachment Packet Interface)規格においてイニシエータがターゲットとして指定可能な記憶領域の単位である。前述したiノードテーブル313におけるデータブロックアドレス3135,3136,3137は、論理ボリューム(LV)のブロックアドレスである。オペレーティングシステム217は、サーバ装置10のデータ入出力制御を行っている。 The LVM 216 (LVM: Logical Volume Manager) shown in FIG. 2 is logically based on a logical unit (LU: Logical Unit) which is a unit of a logical storage device provided by the storage apparatus 20. A logical volume (Logical Volume (hereinafter referred to as LV)) serving as a storage area is provided to an upper layer such as the file system 212. That is, the LVM 216 has a function of making a logical unit (LU) available as a logical volume (LV) and a function of a device driver for writing or reading data in block units with respect to the logical volume (LV). A logical unit (LU) is a unit of a storage area that an initiator can specify as a target in, for example, SCSI (SCSI: Small Computer System Interface) or ATAPI (Attachment Packet Interface) standards. The data block addresses 3135, 3136, and 3137 in the i-node table 313 described above are block addresses of the logical volume (LV). The operating system 217 performs data input / output control of the server device 10.
後述するように、スナップショット機能におけるプライマリボリューム(以下、P−VOL71(P-VOL: Primary VOLume)と称する。)、及び差分ボリューム(以下、D−VOL72(D-VOL: Differential VOLume)と称する。)は、いずれもLVを単位として実現される。図3Dは以上の内容を纏めたものであり、ストレージ装置20から図外のホスト/クライアント装置30に記憶領域が提供される様子を説明している。 As will be described later, it is referred to as a primary volume (hereinafter referred to as P-VOL 71 (P-VOL)) and a differential volume (hereinafter referred to as D-VOL 72 (D-VOL)) in the snapshot function. ) Is realized in units of LV. FIG. 3D summarizes the above contents, and explains how a storage area is provided from the storage apparatus 20 to the host / client apparatus 30 outside the figure.
図示のように、LVM216によって、P−VOL71、D−VOL72とともに、D−VOL72の容量が不足してきたときに追加される予備ボリューム74があらかじめ提供されている。また、V−VOL73は、P−VOL71とD−VOL72とを合成して得られる読み込みのみが可能なスナップショットである。 As shown in the figure, the LVM 216 provides in advance a P-VOL 71 and a D-VOL 72, as well as a spare volume 74 to be added when the capacity of the D-VOL 72 becomes insufficient. The V-VOL 73 is a snapshot that can only be read and is obtained by combining the P-VOL 71 and the D-VOL 72.
サーバ装置10は、ホスト/クライアント装置30に対して、あらかじめ割り当てられているIPアドレス217経由でファイル単位での記憶領域へのアクセスを提供している。このIPアドレス単位でまとめられたリソース群を、ここではリソースグループRG(RG: Resource Group)と呼ぶこととする。各リソースグループRGには、そのIPアドレス217についてのデータ入出力負荷等に応じて複数のLANポート218が割り当てられている。ホスト/クライアント装置30にファイル共有機能を提供する為に必要なリソースとしては、IPアドレス217、ファイルシステム212がある。ローカルサイト及びリモートサイトに設置されているサーバ装置10間でのフェイルオーバー処理は、このリソースグループを単位として行われる。 The server device 10 provides the host / client device 30 with access to a storage area in units of files via an IP address 217 assigned in advance. Here, the resource group collected in units of IP addresses is referred to as a resource group RG (RG: Resource Group). Each resource group RG is assigned a plurality of LAN ports 218 in accordance with the data input / output load for the IP address 217 and the like. Resources necessary for providing the host / client device 30 with a file sharing function include an IP address 217 and a file system 212. Failover processing between the server apparatuses 10 installed at the local site and the remote site is performed in units of this resource group.
図2に示すスナップショット処理部213は、スナップショット機能に関する様々な処理を実行する。ここでスナップショット機能とは、運用中の論理ボリューム(P−VOL71)のある時点の状態(これをスナップショットと称する。)をユーザ等からの要求に応じて提供する機能である。スナップショット機能は、複数世代分のスナップショット(複数の異なる時点におけるP−VOL71の状態)を管理することができる。 The snapshot processing unit 213 illustrated in FIG. 2 executes various processes related to the snapshot function. Here, the snapshot function is a function that provides a state at a certain point of time for the logical volume (P-VOL 71) in operation (this is referred to as a snapshot) in response to a request from a user or the like. The snapshot function can manage snapshots for a plurality of generations (the state of the P-VOL 71 at a plurality of different time points).
スナップショット処理部213は、クライアント装置30から送信されてくるスナップショット取得要求の受け付け、ある時点のスナップショットの取得、スナップショットの参照要求の受け付け、クライアント装置30へのスナップショットの提供、スナップショットの削除等を行う。ここでスナップショットの取得とは、P−VOL71において更新されたブロックのデータ(以下、差分データと称する。)をD−VOL72に退避することをいう。またスナップショットの提供とは、現在のP−VOL71のデータとD−VOL72に退避された差分データとに基づいて、過去のある時点におけるP−VOL71の状態を再現することをいう。またスナップショットの削除とは、D−VOL72から削除対象の差分データを削除することをいう。 The snapshot processing unit 213 receives a snapshot acquisition request transmitted from the client device 30, acquires a snapshot at a certain point in time, receives a snapshot reference request, provides a snapshot to the client device 30, and snapshots Is deleted. Here, the acquisition of the snapshot means saving the block data updated in the P-VOL 71 (hereinafter referred to as difference data) to the D-VOL 72. The provision of the snapshot means that the state of the P-VOL 71 at a certain past time point is reproduced based on the current data of the P-VOL 71 and the difference data saved in the D-VOL 72. The deletion of the snapshot means deletion of the difference data to be deleted from the D-VOL 72.
同図に示すように、上記機能に加えて、スナップショット処理部213は、D−VOL拡張処理部2131、書き込み要求処理部2132、読み出し要求処理部2133、及びスナップショット取得処理部2134の機能を有する。 As shown in the figure, in addition to the above functions, the snapshot processing unit 213 has functions of a D-VOL extension processing unit 2131, a write request processing unit 2132, a read request processing unit 2133, and a snapshot acquisition processing unit 2134. Have.
D−VOL拡張処理部2131は、後述するリモートコピー処理部214からの要求を受け付けて、所定の手順で選択した予備ボリュームをD−VOLとして追加しD−VOLの容量を拡張する処理を行う。
書き込み要求処理部2132は、クライアント装置30からP−VOL71に対する書き込みが生じる場合に、上記レベルに応じた処理を行う。
読み出し要求処理部2133は、クライアント装置30からスナップショットの参照要求があった場合に、上記レベルに応じてスナップショットをクライアント装置30に提供するための処理を行う。
スナップショット取得処理部2134は、クライアント装置30からスナップショットの取得要求(特定のP−VOL71についてのスナップショットの取得を開始する旨の要求)があった場合に、上記レベルに応じて、スナップショットの取得に関する処理を行う。
The D-VOL expansion processing unit 2131 receives a request from the remote copy processing unit 214, which will be described later, and performs processing for adding a spare volume selected in a predetermined procedure as a D-VOL and expanding the capacity of the D-VOL.
The write request processing unit 2132 performs processing according to the above level when writing from the client device 30 to the P-VOL 71 occurs.
When there is a snapshot reference request from the client device 30, the read request processing unit 2133 performs processing for providing a snapshot to the client device 30 according to the above level.
When there is a snapshot acquisition request (request to start acquisition of a snapshot for a specific P-VOL 71) from the client device 30, the snapshot acquisition processing unit 2134 performs a snapshot according to the above level. Perform processing related to acquisition.
図2に示すように、スナップショット処理部213は、スナップショットに関する情報が管理されるテーブルであるスナップショット管理テーブル2135を管理している。スナップショット管理テーブル2135には、各世代のスナップショットについて、P−VOL71のデータブロックへの書き込みによる複製(CoW: Copy On Write)が管理される。 As shown in FIG. 2, the snapshot processing unit 213 manages a snapshot management table 2135, which is a table for managing information related to snapshots. In the snapshot management table 2135, replication (CoW: Copy On Write) by writing to the data block of the P-VOL 71 is managed for each generation of snapshots.
各世代に対応するスナップショットは、P−VOL71に格納されているデータ、D−VOL72に格納されているデータ、及びスナップショット管理テーブル2135に管理される情報によって管理される。図4A等に示すように、スナップショット管理テーブル2135には、各データブロックのブロックアドレス21351に対応づけて、CoWビットマップ21352、及び各スナップショットを特定する情報(ここではスナップショット名21353)が管理されている。尚、CoWビットマップ21352は、取得可能なスナップショットの各世代に対応する個数のビット列で構成されている。尚、以下の説明では、各ビットは最上位ビット(左端ビット)から順に第1世代、第2世代に対応するものとする。 The snapshot corresponding to each generation is managed by data stored in the P-VOL 71, data stored in the D-VOL 72, and information managed in the snapshot management table 2135. As shown in FIG. 4A and the like, the snapshot management table 2135 includes a CoW bitmap 21352 and information (here, snapshot name 21353) for identifying each snapshot in association with the block address 21351 of each data block. It is managed. The CoW bitmap 21352 is composed of a number of bit strings corresponding to each generation of snapshots that can be acquired. In the following description, each bit corresponds to the first generation and the second generation in order from the most significant bit (leftmost bit).
リモートコピー処理部214は、ローカル及びリモートサイトのサーバ装置10間で、それぞれが接続しているストレージ装置20に記憶されているデータを、RG単位で定期的にコピーして二重化する処理を行う。リモートコピー処理部214は、リモートコピー要求処理部2141、リモートコピー応答処理部2142、及びレベル判定処理部2143を備える。 The remote copy processing unit 214 performs a process of periodically copying and duplicating data stored in the storage apparatus 20 to which the server is connected between the local and remote site server 10 in units of RG. The remote copy processing unit 214 includes a remote copy request processing unit 2141, a remote copy response processing unit 2142, and a level determination processing unit 2143.
リモートコピー要求処理部2141は、ローカルサイトのサーバ装置10からのリモートコピー要求を受け付けて、ローカルサイトから通知されたスナップショットの差分データに関する情報に基づいて、リモート側にあるP−VOL71及びD−VOL72に記憶されているデータを更新する処理を行う。
リモートコピー応答処理部2142は、各RGについて、後述するレベル判定処理部2143の判定結果に従って、そのRGについてレベルに応じたリモートコピー処理を行う。なお、RGのレベル判定結果によっては、リモートコピー処理自体を実行しないこともあり得る。
レベル判定処理部2143は、サーバ装置10のリソースグループRG毎に実行すべきリモートコピー処理内容を決定するための情報であるレベルの設定を行う。
The remote copy request processing unit 2141 receives a remote copy request from the server device 10 at the local site, and based on the information about the difference data of the snapshot notified from the local site, the remote copy request P-VOL 71 and D-VOL 71 and D- A process of updating the data stored in the VOL 72 is performed.
The remote copy response processing unit 2142 performs remote copy processing for each RG according to the level according to the determination result of the level determination processing unit 2143 described later. Depending on the RG level determination result, the remote copy process itself may not be executed.
The level determination processing unit 2143 sets a level that is information for determining the remote copy processing content to be executed for each resource group RG of the server device 10.
フェイルオーバー処理部215は、監視/切り換え処理部2151を備えている。監視/切り換え処理部2151は、ローカルサイト及びリモートサイトのサーバ装置10間で相互に予備ボリュームの個数を監視する処理を行う。また、リモートコピー応答処理部2142からの要求に応じて、サーバ装置10間において、RG単位でフェイルオーバー処理を行う。 The failover processing unit 215 includes a monitoring / switching processing unit 2151. The monitoring / switching processing unit 2151 performs processing for mutually monitoring the number of spare volumes between the server devices 10 at the local site and the remote site. Further, in response to a request from the remote copy response processing unit 2142, failover processing is performed in units of RG between the server apparatuses 10.
次に、図4A乃至図4Dとともに、P−VOL71へのデータの書き込みが発生した場合を例として、スナップショット処理部213によって行われるスナップショットの管理方法について説明する。尚、以下の説明において、P−VOL71及びD−VOL72はいずれも8個データブロックを有し、管理可能なスナップショットの世代数は4であるものとし、CoWビットマップ21352は4ビットで構成されているものとする。 Next, a snapshot management method performed by the snapshot processing unit 213 will be described with reference to FIGS. 4A to 4D, taking as an example a case where data writing to the P-VOL 71 occurs. In the following description, it is assumed that both P-VOL 71 and D-VOL 72 have 8 data blocks, the number of snapshot generations that can be managed is 4, and the CoW bitmap 21352 is composed of 4 bits. It shall be.
図4AはP−VOL71にデータが書き込まれる前のP−VOL71、D−VOL72、及びスナップショット管理テーブル2135の状態(以下、初期状態と称する。)を示している。同図に示すように、初期状態では、P−VOL71のブロックアドレス0〜7(ブロックアドレス21351)に対応する各データブロック21352に、夫々、「A」、「B」、「C」、「D」、「E」、「F」、「G」、「H」の各データが格納されている。初期状態ではスナップショットが1つも取得されていないのでD−VOL72の各データブロックには何も格納されていない(例えばスペースやNULLが格納されている。)。またスナップショット管理テーブル2135のCoWビットマップ21352の各ビットはいずれも0であり、スナップショット名21353には何も格納されていない(例えばスペースやNULLが格納されている。)。 FIG. 4A shows the state of the P-VOL 71, D-VOL 72, and snapshot management table 2135 (hereinafter referred to as the initial state) before data is written to the P-VOL 71. As shown in the figure, in the initial state, “A”, “B”, “C”, “D” are assigned to the data blocks 21352 corresponding to the block addresses 0 to 7 (block address 21351) of the P-VOL 71, respectively. ”,“ E ”,“ F ”,“ G ”, and“ H ”are stored. Since no snapshot has been acquired in the initial state, nothing is stored in each data block of the D-VOL 72 (for example, a space or NULL is stored). Each bit of the CoW bitmap 21352 of the snapshot management table 2135 is 0, and nothing is stored in the snapshot name 21353 (for example, a space or NULL is stored).
図4Bは図4Aの初期状態においてクライアント装置30から1つめのスナップショット(スナップショット名21353=「SS−1」)の取得要求を受け付けた後の状態である。同図に示すように、各ブロックアドレス0〜7に対応するCoWビットマップ21352の最上位ビット(左端ビット)が1に設定されている。スナップショット名21353は、実際にスナップショットが取得されていないので何も格納されていない。 FIG. 4B shows a state after receiving an acquisition request for the first snapshot (snapshot name 21353 = “SS-1”) from the client apparatus 30 in the initial state of FIG. 4A. As shown in the figure, the most significant bit (leftmost bit) of the CoW bitmap 21352 corresponding to each block address 0 to 7 is set to 1. No snapshot name 21353 is stored because no snapshot is actually acquired.
図4Cは図4Bの状態でP−VOL71のブロックアドレス0〜4のデータブロックの夫々が「a」、「b」、「c」、「d」、「e」で更新された後の状態である。同図に示すように、ブロックアドレス0〜4に格納されていた古いデータ「A」、「B」、「C」、「D」、「E」が、D−VOL72のブロックアドレス0〜4のデータブロックに格納(退避)されている。また第1世代のスナップショットが取得された(D−VOL72に必要なデータが退避された)ので、CoWビットマップ21352の最上位ビット(左端ビット)が0に設定(リセット)されている。尚、CoWビットマップ21352の全てのビットが0であるので、この状態でP−VOL71のデータが更新されてもスナップショットが取得されることはない。スナップショット名21353の「SS−1」の欄には、各ブロックアドレス21351に対応づけて、古いデータ「A」、「B」、「C」、「D」、「E」の退避先のD−VOL72のブロックアドレス「0」、「1」、「2」、「3」、「4」が設定される。 FIG. 4C shows a state after the data blocks of the block addresses 0 to 4 of the P-VOL 71 are updated with “a”, “b”, “c”, “d”, and “e” in the state of FIG. 4B. is there. As shown in the figure, the old data “A”, “B”, “C”, “D”, and “E” stored in the block addresses 0 to 4 are stored in the block addresses 0 to 4 of the D-VOL 72. Stored (saved) in data block. Since the first generation snapshot is acquired (data necessary for the D-VOL 72 is saved), the most significant bit (leftmost bit) of the CoW bitmap 21352 is set (reset) to 0. Since all the bits of the CoW bitmap 21352 are 0, no snapshot is acquired even if the data of the P-VOL 71 is updated in this state. In the “SS-1” column of the snapshot name 21353, the old data “A”, “B”, “C”, “D”, “E” save destination D is associated with each block address 21351. -The block address “0”, “1”, “2”, “3”, “4” of the VOL 72 is set.
図4Dは図4Cの状態でクライアント装置30から第1世代のスナップショットの参照要求があった場合におけるスナップショット処理部213の処理を説明している。 FIG. 4D illustrates the processing of the snapshot processing unit 213 when there is a first generation snapshot reference request from the client device 30 in the state of FIG. 4C.
まずスナップショット処理部213は、ブロックアドレス0−4のデータブロックのスナップショットを生成すべく、D−VOL72のブロックアドレス0−4のデータブロックに格納されているデータを取得する。尚、スナップショット処理部213は、ブロックアドレス0−4のデータブロックの第1世代のスナップショットがD−VOL72に存在することをスナップショット管理テーブル2135のスナップショット名21353の「SS−1」の内容を参照して把握する。次にスナップショット処理部213は、ブロックアドレス5−7のデータブロックについて、P−VOL71のデータブロックからデータを取得する。そしてスナップショット処理部213は、D−VOL72から取得したブロックアドレス0−4のデータと、P−VOL71から取得したブロックアドレス5−7のデータを組み合わせてP−VOL71全体のスナップショットを生成し、生成したスナップショットを要求元(クライアント装置30)に送信する。 First, the snapshot processing unit 213 acquires data stored in the data block of the block address 0-4 of the D-VOL 72 in order to generate a snapshot of the data block of the block address 0-4. Note that the snapshot processing unit 213 confirms that the first generation snapshot of the data block with the block address 0-4 exists in the D-VOL 72, and that the “SS-1” in the snapshot name 21353 of the snapshot management table 2135 exists. Refer to the contents to understand. Next, the snapshot processing unit 213 acquires data from the data block of the P-VOL 71 for the data block of the block address 5-7. The snapshot processing unit 213 generates a snapshot of the entire P-VOL 71 by combining the data of the block address 0-4 acquired from the D-VOL 72 and the data of the block address 5-7 acquired from the P-VOL 71. The generated snapshot is transmitted to the request source (client device 30).
以上、図4A乃至図4Dとともに第1世代のスナップショット取得要求があった場合について説明したが、第2世代〜第4世代のスナップショット取得要求があった場合も同様に処理がなされる。 The case where there is a first generation snapshot acquisition request has been described with reference to FIGS. 4A to 4D, but the same processing is performed when there is a second generation to fourth generation snapshot acquisition request.
次に、スナップショットのリモートコピー処理について、主に図5ないし図5Cを参照しつつ説明する。前記のように、ローカルサイトのサーバ装置10では、ユーザが設定した時間間隔にしたがって、定期的にスナップショットが生成されている。このスナップショットのリモートコピー処理においては、スナップショット間の差分を抽出してリモートサイトのサーバ装置10へのコピー処理を行う。個々のスナップショット間の差分データサイズは、スナップショット取得時間間隔内でユーザが実行したファイル更新のサイズに依存する。したがって、リモートコピー処理における転送データ量及びリモートコピー処理に要する時間も変化する。 Next, snapshot remote copy processing will be described with reference mainly to FIGS. 5 to 5C. As described above, in the server device 10 at the local site, snapshots are periodically generated according to the time interval set by the user. In this snapshot remote copy process, the difference between the snapshots is extracted and the copy process to the server device 10 at the remote site is performed. The difference data size between individual snapshots depends on the size of the file update performed by the user within the snapshot acquisition time interval. Accordingly, the amount of transfer data in the remote copy process and the time required for the remote copy process also change.
まずローカルサイトとリモートサイトのサーバ装置10では、初期コピーによって両者のスナップショットは同期している。ここでは、どちらのスナップショットも第1世代のスナップショット「SS−1」が取得された状態で同期しているものとする(前出の図4Bに図示の状態)。 First, in the server device 10 at the local site and the remote site, the snapshots of both are synchronized by the initial copy. Here, it is assumed that both snapshots are synchronized in a state where the first generation snapshot “SS-1” is acquired (the state illustrated in FIG. 4B above).
ローカルサイトのサーバ装置10で更新が発生して第2世代のスナップショット「SS−2」が生成された状態を図5Aに示す。図5Aは図4Bの状態でP−VOL71のブロックアドレス0〜4のデータブロックの夫々が「x」、「y」、「c」、「d」、「e」で更新された後の状態である。同図に示すように、ブロックアドレス0〜4に格納されていた古いデータ「A」、「B」、「C」、「D」、「E」が、D−VOL72のブロックアドレス0〜4のデータブロックに格納(退避)されている。また第2世代のスナップショットが取得されたので、CoWビットマップ21352のブロックアドレス0〜4に対応する最上位ビット(左端ビット)が0に設定(リセット)されている。また差分が発生していない(データ更新がない)ため、CoWビットマップ21352の第2位ビット(左から2番目のビット)がすべて1に設定されている。スナップショット名21353の「SS−2」の欄には、各ブロックアドレス21351に対応づけて、古いデータ「A」、「B」、「C」、「D」、「E」の退避先のD−VOL72のブロックアドレス「0」、「1」、「2」、「3」、「4」が設定される。このとき、リモートサイトのスナップショットにはまだ更新が反映されていないので、図5Bに示すように、図4Bの状態のままである。 FIG. 5A shows a state in which the second generation snapshot “SS-2” is generated by the update in the server device 10 at the local site. FIG. 5A shows a state after the data blocks of the block addresses 0 to 4 of the P-VOL 71 are updated with “x”, “y”, “c”, “d”, and “e” in the state of FIG. 4B. is there. As shown in the figure, the old data “A”, “B”, “C”, “D”, and “E” stored in the block addresses 0 to 4 are stored in the block addresses 0 to 4 of the D-VOL 72. Stored (saved) in data block. Since the second generation snapshot is acquired, the most significant bit (leftmost bit) corresponding to the block addresses 0 to 4 of the CoW bitmap 21352 is set (reset) to 0. Further, since no difference occurs (no data is updated), all the second-order bits (second bit from the left) of the CoW bitmap 21352 are set to 1. In the “SS-2” column of the snapshot name 21353, the old data “A”, “B”, “C”, “D”, “E” save destination D is associated with each block address 21351. -The block address “0”, “1”, “2”, “3”, “4” of the VOL 72 is set. At this time, since the update has not yet been reflected in the snapshot at the remote site, the state of FIG. 4B remains as shown in FIG. 5B.
次いで、ローカルサイトで更新があってから最初のリモートコピー処理が実行されるときに、ローカルサイトのサーバ装置10にあるリモートコピー処理部214は、リモートサイトサーバ装置10のリモートコピー処理部214に対してスナップショット管理テーブル2135の送信を要求してこれを取得する。ローカルサイトのリモートコピー処理部214は、取得したリモートサイトのスナップショット管理テーブル2135を自身のものと比較照合する。図5A、図5Bの例では、第1世代のスナップショット「SS−1」について、CoWビットマップ21352の最上位ビットをブロックアドレス順に比較していくと、ブロックアドレス0〜4で不一致となっており、データ更新があったことがわかる。差分データは、D−VOL72のブロックアドレス0〜4に格納されている「x」、「y」、「c」、「d」、「e」である。次に、CoWビットマップ21352の第2位ビット(左端から2番目のビット)をアドレス順に調べていくと,データ更新に伴うCoWが発生していないので、第2世代のスナップショット「SS−2」を取得しただけで、差分データが発生していないことがわかる。このローカルサイトのサーバ装置10で抽出された差分データは、リモートサイトのサーバ装置10に通知される。 Next, when the first remote copy processing is executed after the update at the local site, the remote copy processing unit 214 in the server device 10 at the local site sends the remote copy processing unit 214 of the remote site server device 10 to the remote copy processing unit 214. Requesting the transmission of the snapshot management table 2135 to obtain it. The remote copy processing unit 214 at the local site compares the acquired remote site snapshot management table 2135 with its own. In the example of FIGS. 5A and 5B, when the most significant bit of the CoW bitmap 21352 is compared in block address order for the first generation snapshot “SS-1”, the block addresses 0 to 4 are inconsistent. This shows that there was data update. The difference data is “x”, “y”, “c”, “d”, “e” stored in the block addresses 0 to 4 of the D-VOL 72. Next, when the second most significant bit (second bit from the left end) of the CoW bitmap 21352 is examined in the order of addresses, no CoW is generated due to data update, so the second generation snapshot “SS-2 It can be seen that no difference data has been generated. The difference data extracted by the server device 10 at the local site is notified to the server device 10 at the remote site.
リモートサイトのサーバ装置10では、通知された差分データに基づいて、リモートコピー処理部214によって、P−VOL71のブロックアドレス0〜4を「x」、「y」、「c」、「d」、「e」と更新して、CoWビットマップ21352の最上位ビットを0に設定するとともに、第2世代のスナップショット「SS−2」を取得する。この「SS−2」についてはデータ更新がないため、CoWビットマップ21352の第2位ビットに1を設定する(図5C)。 In the server device 10 at the remote site, the remote copy processing unit 214 sets the block addresses 0 to 4 of the P-VOL 71 to “x”, “y”, “c”, “d”, based on the notified difference data. It is updated to “e”, the most significant bit of the CoW bitmap 21352 is set to 0, and the second generation snapshot “SS-2” is acquired. Since there is no data update for “SS-2”, 1 is set in the second bit of the CoW bitmap 21352 (FIG. 5C).
次に、RG毎に適用するリモートコピー処理の内容を変更するための判定基準となるRGのレベルについてその定義を説明する。このRGのレベルは、各RGについて実行されているデータ入出力がどの程度の重要性を有するものであるかを判定する目的で定義されている。このレベル定義に従って客観的に各RGの重要性を判定することにより、各RGに対してどのような形態でリモートコピー処理を実行するか決定し、例えば重要性が高いとされたRGについてはリモートコピー処理が確実に継続されるような形態を選択し、またさほど重要性がないとされたRGについては場合によってはリモートコピー処理を行わないといった選択肢もとれるようにしている。 Next, the definition of the RG level that is a criterion for changing the content of the remote copy process applied to each RG will be described. This RG level is defined for the purpose of determining how important the data input / output being executed for each RG is. By objectively determining the importance of each RG according to this level definition, it is determined in what form the remote copy processing is executed for each RG. A mode is selected so that the copy process can be surely continued, and an option such that the remote copy process is not performed in some cases is selected for an RG that is not so important.
本実施形態では、次の3つの項目を、各RGのレベルを判定するための判断基準として採用している。
(1)各RGに割当てられているIPアドレスの帯域
各RGのIPアドレス218に割当てられている帯域を、LANポート219の個数を調べることで取得する。LANポート219の個数が多いほど広い帯域が割り当てられていることとなり、利用規模が大きい重要度の高いRGであると推定される。
(2)RG内のファイルシステム数
各RG内に設定されているファイルシステム数を取得し、ファイルシステム数が多いほど、ファイル共有の規模が大きく重要度の高いRGであると推定される。
(3)ユーザ数
各RGのユーザ数を取得することで、ユーザ数が多いほどファイル共有の規模が大きく重要度の高いRGであると推定される。
In the present embodiment, the following three items are adopted as determination criteria for determining the level of each RG.
(1) Bandwidth of IP address assigned to each RG The bandwidth assigned to the IP address 218 of each RG is obtained by examining the number of LAN ports 219. As the number of LAN ports 219 increases, a wider band is allocated, and it is estimated that the RG is a highly important RG having a large use scale.
(2) Number of file systems in RG The number of file systems set in each RG is obtained, and it is estimated that the larger the number of file systems, the larger the size of file sharing and the higher the importance.
(3) Number of users By acquiring the number of users of each RG, it is estimated that the larger the number of users, the larger the file sharing scale and the higher the importance.
本実施形態においては、前記の3つの項目に従って、各RGのレベルを次のように3段階で定義している。
レベル1:0<LANポートの個数≦2かつ0<ファイルシステム数≦5かつ0<ユーザ数≦10
レベル2:2<LANポートの個数≦5かつ5<ファイルシステム数≦20かつ10<ユーザ数≦50
レベル3:5<LANポートの個数≦10かつ20<ファイルシステム数≦30かつ50<ユーザ数≦200
In the present embodiment, according to the above three items, the level of each RG is defined in three stages as follows.
Level 1: 0 <number of LAN ports ≦ 2 and 0 <number of file systems ≦ 5 and 0 <number of users ≦ 10
Level 2: 2 <number of LAN ports ≦ 5 and 5 <number of file systems ≦ 20 and 10 <number of users ≦ 50
Level 3: 5 <number of LAN ports ≦ 10 and 20 <number of file systems ≦ 30 and 50 <number of users ≦ 200
なお、前記のRGレベル判断基準の項目、及びレベル定義については例示した項目や範囲に限ることなく他の適当な基準や範囲を採用することができる。またこのレベル定義は、レベル定義ファイルとして、例えばリモートコピー処理部214に記録される。 Note that the RG level determination criterion items and level definitions are not limited to the exemplified items and ranges, and other appropriate criteria and ranges can be adopted. The level definition is recorded as a level definition file, for example, in the remote copy processing unit 214.
次に、本実施形態において参照されるテーブルについて説明する。
まず、RG管理テーブル600について説明する。図6にRG管理テーブル600の一例を示す。このRG管理テーブル600は、サーバ装置10が有する各RGの状態を管理するためのもので、RG名601、現在のレベル602、現在のレベルが適用された日時603、各レベルの状態であった累計時間604、RGに割当てられているIPアドレス605、及びRGに含まれるファイルシステム名606が記録されている。
Next, a table referred to in the present embodiment will be described.
First, the RG management table 600 will be described. FIG. 6 shows an example of the RG management table 600. This RG management table 600 is for managing the state of each RG that the server device 10 has. The RG management table 600 includes the RG name 601, the current level 602, the date and time 603 when the current level was applied, and the state of each level. The cumulative time 604, the IP address 605 assigned to the RG, and the file system name 606 included in the RG are recorded.
RG名601は、各RGを識別するために付与されるユニークな符号である。現在のレベル602は、そのRGについて判定された最新のレベルである。後述するように、各RGのレベルはサーバ装置10のリモートコピー処理部214にあるレベル判定処理部2413によって定期的に判定されている。 The RG name 601 is a unique code assigned to identify each RG. The current level 602 is the latest level determined for the RG. As will be described later, the level of each RG is periodically determined by a level determination processing unit 2413 in the remote copy processing unit 214 of the server device 10.
現在のレベルが適用された日時603は、そのRGについて直近のレベル変更があった時点を記録している。各レベルの状態であった累計時間604は、日時603に基づいて、そのRGが各レベル1〜3と判定されていた累計時間を、レベル毎に記録している。RGに割当てられているIPアドレス605は、そのRGが有するLANポートの個数を取得する際にレベル判定処理部2143によって参照される。RGに含まれるファイルシステム名606は、各RGが持っているファイルシステム名を記録しており、これをキーとして各RGが使用しているボリュームを知ることができる。 The date and time 603 when the current level was applied records the time when the most recent level change has occurred for the RG. The accumulated time 604 that has been in the state of each level records, for each level, the accumulated time in which the RG is determined to be each level 1 to 3 based on the date and time 603. The IP address 605 assigned to the RG is referred to by the level determination processing unit 2143 when acquiring the number of LAN ports included in the RG. The file system name 606 included in the RG records the file system name that each RG has, and the volume used by each RG can be known using this as a key.
次に、ファイルシステム管理テーブル700について説明する。図7にファイルシステム管理テーブル700の一例を示す。このファイルシステム管理テーブル700は、サーバ装置10が有するファイルシステムとそれぞれが使用しているボリュームとを対応付けて管理しており、ファイルシステム名701、P−VOL名及びそれが属するボリューム名702、D−VOL名及びそれが属するボリューム名703、及びD−VOL残容量704が記録されている。 Next, the file system management table 700 will be described. FIG. 7 shows an example of the file system management table 700. The file system management table 700 manages the file system of the server apparatus 10 in association with the volumes used by each, and includes a file system name 701, a P-VOL name, and a volume name 702 to which the file system belongs. A D-VOL name, a volume name 703 to which the D-VOL name belongs, and a D-VOL remaining capacity 704 are recorded.
ファイルシステム名701は各サーバ装置10内にあるファイルシステムそれぞれを識別するために付与されたユニークな符号である。P−VOL名及びそれが属するボリューム名702と、D−VOL名及びそれが属するボリューム名703とは、各ファイルシステムが使用しているP−VOL71、D−VOL72、及びそれらが対応しているボリュームを表す識別符号を記録している。D−VOL残容量704は、各ファイルシステムが使用しているD−VOL72の残り容量をMB単位で記録している。 The file system name 701 is a unique code assigned to identify each file system in each server apparatus 10. The P-VOL name and the volume name 702 to which the P-VOL name belongs, and the D-VOL name and the volume name 703 to which the P-VOL name belongs belong to the P-VOL 71 and D-VOL 72 used by each file system, and they correspond to each other. An identification code representing the volume is recorded. The D-VOL remaining capacity 704 records the remaining capacity of the D-VOL 72 used by each file system in MB units.
次に、予備ボリューム管理テーブル800について説明する。図8に予備ボリューム管理テーブル800の一例を示す。この予備ボリューム管理テーブル800は、各サーバ装置10が保有しているD−VOL72に追加可能な予備ボリューム74を管理するためのもので、ボリューム名801、ボリューム容量802、及び割当状態803が記録されている。 Next, the spare volume management table 800 will be described. FIG. 8 shows an example of the spare volume management table 800. This spare volume management table 800 is for managing the spare volume 74 that can be added to the D-VOL 72 possessed by each server device 10, and records a volume name 801, a volume capacity 802, and an allocation state 803. ing.
ボリューム名801は、各サーバ装置10に接続されているストレージ装置20に設定されている各ボリュームに付与された識別符号であり、ボリューム容量802はそれらボリュームの容量をMB単位で示している。また割当状態803は、各ボリュームがD−VOL72に割当済みであるかどうかを示している。割り当て状態803に「未済み」である旨が記録されていれば、そのボリュームは予備ボリューム74であることがわかる。 The volume name 801 is an identification code given to each volume set in the storage apparatus 20 connected to each server apparatus 10, and the volume capacity 802 indicates the capacity of these volumes in MB units. An allocation status 803 indicates whether each volume has been allocated to the D-VOL 72. If “not yet completed” is recorded in the allocation state 803, it is understood that the volume is the spare volume 74.
次に、リモートコピー設定管理テーブル900について説明する。図9にリモートコピー設定管理テーブル900の一例を示す。このリモートコピー設定管理テーブル900は、ローカル、リモートいずれのサイトにあるサーバ装置10がリモートコピー処理におけるプライマリ側あるいはセカンダリ側であるかを、RG毎に管理するもので、RG名901と、そのRGについてリモートコピー処理を行う場合のプライマリ側サーバ名902及びセカンダリ側サーバ名903が記録されている。ローカルサイト、リモートサイトのサーバ装置10間でRG毎にフェイルオーバー処理が実行されると、そのRGについてのプライマリ側及びセカンダリ側が入れ替わることになるので、フェイルオーバー処理部215によってこのリモートコピー設定管理テーブル900が更新される。 Next, the remote copy setting management table 900 will be described. FIG. 9 shows an example of the remote copy setting management table 900. This remote copy setting management table 900 manages, for each RG, whether the server apparatus 10 at the local or remote site is the primary side or the secondary side in the remote copy process. The RG name 901 and its RG Is recorded with a primary server name 902 and a secondary server name 903 when remote copy processing is performed. When the failover process is executed for each RG between the server devices 10 at the local site and the remote site, the primary side and the secondary side of the RG are switched, so the failover processing unit 215 performs this remote copy setting management table. 900 is updated.
次に、本実施形態に係るリモートコピー制御装置において実行される処理フローについて、図面を参照しながら順次説明する。 Next, a processing flow executed in the remote copy control apparatus according to the present embodiment will be sequentially described with reference to the drawings.
==レベル判定処理==
図10に、サーバ装置10のリモートコピー処理部214にあるレベル判定処理部2143で実行されるRGのレベル判定処理のフローを示す。レベル判定処理は、各RGについて適切なリモートコピー処理を実行するために、定期的にローカル又はリモートサイトのサーバ装置10において、各RGのレベルを判定する処理である。
== Level judgment processing ==
FIG. 10 shows a flow of RG level determination processing executed by the level determination processing unit 2143 in the remote copy processing unit 214 of the server apparatus 10. The level determination process is a process of periodically determining the level of each RG in the server device 10 at the local or remote site in order to execute an appropriate remote copy process for each RG.
レベル判定処理部2143は、処理を開始すると、すべてのRGについてレベル判定が完了したかを調べ、完了していればそのまま処理を終わる(S1001、Yes)。なお、各処理を示す符号の先頭に付した文字Sは「ステップ」を表す。
レベル未判定のRGが残っていれば(S1001、No)、次のRGを選択して(S1002)、そのRGの特性情報を取得する(S1003)。本実施形態では、レベル判定処理部2143が、サーバ装置10に実装した適宜の情報収集プログラム(図示せず)と通信して当該特性情報(ここでは例えばLANポートの個数、ファイルシステム数、及びユーザ数である。)を取得している。
When the process is started, the level determination processing unit 2143 checks whether or not the level determination has been completed for all RGs, and if it has been completed, the process is ended as it is (Yes in S1001). Note that the letter S added to the head of the code indicating each process represents “step”.
If an RG whose level is not determined remains (S1001, No), the next RG is selected (S1002), and the characteristic information of the RG is acquired (S1003). In the present embodiment, the level determination processing unit 2143 communicates with an appropriate information collection program (not shown) installed in the server device 10 to communicate the characteristic information (here, for example, the number of LAN ports, the number of file systems, and the user). Is a number.)
次いで、取得した当該RGの特性情報を前記レベル定義ファイルのレベル定義と照合して、そのRGのレベルを決定する(S1004)。決定されたレベルをRG管理テーブル600の当該RGの現在レベル602と比較して、レベルの変更があると判定されれば(S1005、Yes)、RG管理テーブル600の記録を更新する(S1006)。レベルの変更がないと判定されれば(S1005、No)、判定すべきRGが残っているかの判断ステップS1001に戻る。 Next, the obtained characteristic information of the RG is compared with the level definition in the level definition file to determine the level of the RG (S1004). The determined level is compared with the current level 602 of the RG in the RG management table 600. If it is determined that there is a level change (S1005, Yes), the record in the RG management table 600 is updated (S1006). If it is determined that there is no level change (No in S1005), the process returns to step S1001 for determining whether or not there is an RG to be determined.
==リモートコピー要求処理==
図11に、サーバ装置10のリモートコピー処理部214にあるリモートコピー要求処理部2141で実行されるリモートコピー要求処理のフローを示す。リモートコピー要求処理は、上位のOS又はアプリケーションからの命令によって、あらかじめ決められた時間間隔で各RGについてのリモートコピー処理を要求する処理であり、本実施形態ではリモートサイトのサーバ装置10からローカルサイトのサーバ装置10に対して起動要求するように構成しているが、ローカルサイトから起動させるようにしてもかまわない。
== Remote copy request processing ==
FIG. 11 shows a flow of remote copy request processing executed by the remote copy request processing unit 2141 in the remote copy processing unit 214 of the server apparatus 10. The remote copy request processing is processing for requesting remote copy processing for each RG at a predetermined time interval in accordance with a command from a higher-level OS or application. In this embodiment, the remote copy request processing is performed from the server device 10 at the remote site. However, the server device 10 may be activated from the local site.
リモートサイトのサーバ装置10にあるリモートコピー要求処理部2141は、処理を開始すると、まず自身が保持しているスナップショット管理テーブル2135をローカルサイトのサーバ装置10に送信し(S1101)、ローカルサイトのサーバ装置10で処理された結果が送信されてくるのを待つ(S1102)。ローカルサイトのサーバ装置10からの処理結果を受信したら(S1102、Yes)、その処理結果に従ってリモートサイトのサーバ装置10にある当該RGのスナップショットを更新すべく、P−VOL71、D−VOL72のデータを更新して終了する。 When the remote copy request processing unit 2141 in the server device 10 at the remote site starts processing, it first transmits the snapshot management table 2135 held by itself to the server device 10 at the local site (S1101). It waits for the result processed by the server device 10 to be transmitted (S1102). When the processing result from the local site server apparatus 10 is received (S1102, Yes), the data of the P-VOL 71 and D-VOL 72 are updated in order to update the snapshot of the RG in the remote site server apparatus 10 according to the processing result. Update and exit.
==リモートコピー応答処理==
図12に、サーバ装置10のリモートコピー処理部214にあるリモートコピー応答処理部2142で実行されるリモートコピー応答処理のフローを示す。リモートコピー応答処理は、本実施形態にあってはリモートサイトのサーバ装置10にあるリモートコピー要求処理部2141からの処理要求取得、すなわちリモート側スナップショット管理テーブル2135の受信を契機としてローカルサイトのサーバ装置10で実行される処理である。なお前記のように、ローカル及びリモートサイトの役割を入れ替えて構成することは差し支えない。
== Remote copy response processing ==
FIG. 12 shows a flow of remote copy response processing executed by the remote copy response processing unit 2142 in the remote copy processing unit 214 of the server apparatus 10. In this embodiment, the remote copy response process is a process for acquiring a processing request from the remote copy request processing unit 2141 in the server apparatus 10 at the remote site, that is, receiving the remote snapshot management table 2135 as a trigger. This process is executed by the device 10. As described above, the roles of the local site and the remote site may be interchanged.
リモートコピー応答処理部2142は、処理を開始すると、リモートサイトのサーバ装置10から処理要求が受信されるのを(リモート側スナップショット管理テーブル2135の受信を)待つ(S1201)。受信したら(S1201、Yes)、自身のRG管理テーブル600を参照して、当該RGについて記録されている現在のレベル602を取得する(S1202)。 When starting the processing, the remote copy response processing unit 2142 waits for a processing request to be received from the server device 10 at the remote site (reception of the remote-side snapshot management table 2135) (S1201). When received (S1201, Yes), the current level 602 recorded for the RG is acquired with reference to its own RG management table 600 (S1202).
次いで、リモートコピー応答処理部2142は、取得した当該RGのレベルに応じて前処理を行い(S1203)、前処理の結果に応じた処理を実行して(S1204)処理フローを終わる。これらのRGレベルに応じた処理の内容については、後述する。 Next, the remote copy response processing unit 2142 performs preprocessing according to the acquired RG level (S1203), executes processing according to the result of the preprocessing (S1204), and ends the processing flow. The contents of processing according to these RG levels will be described later.
==RGレベル別処理==
図13に、リモートコピー応答処理部2142において判定されたRGレベルに応じたRGレベル別処理の処理フローを示す。この処理フローは、RGレベル判定結果に基づいてその後のリモートコピー処理内容を変更する処理に相当する、RGレベルに応じた前処理と、RGレベルがレベル1であると判定された場合に引き続き実行される処理とを含んでいる。レベル1の処理内容については、理解を助けるために、図14にその模式的な説明図を併せて示している。
== Process by RG level ==
FIG. 13 shows a processing flow of processing by RG level according to the RG level determined by the remote copy response processing unit 2142. This processing flow is executed continuously when it is determined that the RG level is level 1 and the pre-processing corresponding to the RG level, which corresponds to the processing for changing the contents of the remote copy processing thereafter based on the RG level determination result. Processing. The processing contents of level 1 are shown in FIG. 14 together with a schematic explanatory diagram for easy understanding.
レベル1での処理では、当該RGが使用しているD−VOL72の容量を使い切るまで(残り容量が一定の閾値以下となるまで)リモートコピー処理を実行する。この場合、同一のD−VOLに上書きしながら反復使用(ラップアラウンド)し、所定の回数反復使用した時点でリモートコピー処理を中止する構成としてもよい。 In the processing at level 1, remote copy processing is executed until the capacity of the D-VOL 72 used by the RG is used up (until the remaining capacity falls below a certain threshold). In this case, it may be configured to repeatedly use (wrap around) while overwriting the same D-VOL, and stop the remote copy process when it is repeatedly used a predetermined number of times.
リモートコピー応答処理部2142は、処理を開始すると、まずリモートコピー処理が要求されたRGについて記録されている現在のレベル602を、RG管理テーブル600から取得し、取得したRGのレベルが1であるかを判定する(S1301)。RGレベルが1でなければ(S1301、No)、引き続きRGレベルが2であるか(S1309)、あるいは3であるか(S1311)を判定し、各レベルに該当すると判定されれば(S1309又はS1311、Yes)、それぞれのレベルに対応するリモートコピー処理を実行して(S1310又はS1312)処理を終わる。 When starting the process, the remote copy response processing unit 2142 first acquires the current level 602 recorded for the RG for which the remote copy process is requested from the RG management table 600, and the level of the acquired RG is 1. Is determined (S1301). If the RG level is not 1 (No in S1301), it is determined whether the RG level is 2 (S1309) or 3 (S1311), and if it is determined that each level is applicable (S1309 or S1311). Yes), the remote copy process corresponding to each level is executed (S1310 or S1312), and the process ends.
なお、取得した現在のレベルがレベル1〜3のいずれとも判定することができなかった場合は、RG管理テーブル600等の記録に以上があるなど、なんらかの問題が生じている可能性があるため、サーバ装置10の別の機能ブロックに処理を渡してユーザへ警告通知を行うといった処理を組み込むことが考えられる。 Note that if the acquired current level cannot be determined as any of levels 1 to 3, some problem may have occurred, such as the fact that there is a record in the RG management table 600 or the like. It is conceivable to incorporate a process of passing the process to another functional block of the server device 10 and notifying the user of a warning.
当該RGのレベルが1であると判定された場合には(S1301、Yes)、引き続き当該RGが使用しているD−VOL72の残り容量を算出する。D−VOL72の残り容量は、RG管理テーブル600に記録されているファイルシステム名606と、ファイルシステム管理テーブル700に記録されている、ファイルシステム毎のD−VOL72の残り容量704とを参照することによって算出することができる。 If it is determined that the level of the RG is 1 (S1301, Yes), the remaining capacity of the D-VOL 72 used by the RG is calculated. For the remaining capacity of the D-VOL 72, refer to the file system name 606 recorded in the RG management table 600 and the remaining capacity 704 of the D-VOL 72 for each file system recorded in the file system management table 700. Can be calculated.
このレベル1に対応した処理では、算出されたD−VOL72の残り容量に応じて実行するリモートコピー処理の内容を変更している。すなわち、D−VOL72の残り容量に対する3つの閾値、第1の閾値から第3の閾値を処理プログラム中にあらかじめデータとして設定しておき、これらの閾値と算出されたD−VOL72の残り容量との比較結果に応じて対応するリモートコピー処理を行う。なお、本実施形態では第1閾値から第3閾値(閾値B〜D)の順でD−VOL72の残り容量が減少するように設定しているが、これに限らずいくつの閾値をどのような設定値で設定するかは適宜決定すればよい。 In the processing corresponding to level 1, the content of the remote copy processing to be executed is changed according to the calculated remaining capacity of the D-VOL 72. That is, three threshold values for the remaining capacity of the D-VOL 72, the first threshold value to the third threshold value are set as data in the processing program in advance, and these threshold values and the calculated remaining capacity of the D-VOL 72 are set. Corresponding remote copy processing is performed according to the comparison result. In the present embodiment, the remaining capacity of the D-VOL 72 is set to decrease in the order from the first threshold value to the third threshold value (threshold values B to D). Whether to set with a set value may be determined as appropriate.
まず、リモートコピー応答処理部2142は、算出したD−VOL72の残り容量が第1の閾値以下で第2の閾値より大であるか判定し、その旨の判定がされれば(S1303、Yes)、リモートコピー応答処理部2142は、出力装置105等を通じてユーザにD−VOL72の残り容量が少なくなっている旨の警告メッセージを出力する(S1304)。この場合、当該RGについてのリモートコピー処理は通常通りに実行される。 First, the remote copy response processing unit 2142 determines whether the calculated remaining capacity of the D-VOL 72 is equal to or less than the first threshold and greater than the second threshold, and if a determination to that effect is made (Yes in S1303). The remote copy response processing unit 2142 outputs a warning message to the user that the remaining capacity of the D-VOL 72 is low through the output device 105 or the like (S1304). In this case, the remote copy process for the RG is executed as usual.
算出したD−VOL72の残り容量が第1の閾値以下で第2の閾値より大でないと判定された場合は(S1303、No)、次いで算出したD−VOL72の残り容量が第2の閾値以下で第3の閾値より大であるか判定し、その旨の判定がされれば(S1304、Yes)、リモートコピー応答処理部2142は、記録されているスナップショットのD−VOL72から一部のデータを消去してD−VOL72の残り容量を増加させると共に、出力装置105等を通じてユーザにD−VOL72のデータを一部消去した旨の警告メッセージを出力する(S1306)。この場合も、当該RGについてのリモートコピー処理は通常通りに実行される。なお、残り容量を増加させるために、どのスナップショットのデータを消去するか(例えば新しいスナップショットからか、古いスナップショットからか)は、あらかじめ適宜決定して設定すればよい。 If it is determined that the calculated remaining capacity of the D-VOL 72 is equal to or smaller than the first threshold and not larger than the second threshold (No in S1303), then the calculated remaining capacity of the D-VOL 72 is equal to or smaller than the second threshold. If it is determined whether or not it is larger than the third threshold value and a determination to that effect is made (S1304, Yes), the remote copy response processing unit 2142 receives some data from the recorded D-VOL 72 of the snapshot. The data is erased to increase the remaining capacity of the D-VOL 72, and a warning message to the effect that a part of the data in the D-VOL 72 is erased is output to the user through the output device 105 or the like (S1306). Also in this case, the remote copy process for the RG is executed as usual. In order to increase the remaining capacity, which snapshot data is to be erased (for example, from a new snapshot or an old snapshot) may be determined and set appropriately in advance.
算出したD−VOL72の残り容量が第2の閾値以下で第3の閾値より大でないと判定された場合は(S1305、No)、次いで算出したD−VOL72の残り容量が第3の閾値以下であるか判定し、その旨の判定がされれば(S1307、Yes)、リモートコピー応答処理部2142は、当該RGについてのリモートコピー処理を中止する共に、出力装置105等を通じてユーザに、D−VOL72の残り容量が不足しているためにリモートコピー処理を中止した旨のエラーメッセージを出力する(S1304)。この場合も、当該RGについてのリモートコピー処理は通常通りに実行される。なお、残り容量を増加させるために、どのスナップショットのデータを消去するか(例えば新しいスナップショットからか、古いスナップショットからか)は、あらかじめ適宜決定して設定すればよい。 If it is determined that the calculated remaining capacity of the D-VOL 72 is equal to or smaller than the second threshold and not larger than the third threshold (No in S1305), then the calculated remaining capacity of the D-VOL 72 is equal to or smaller than the third threshold. If it is determined that there is a determination (S1307, Yes), the remote copy response processing unit 2142 cancels the remote copy processing for the RG and notifies the user via the output device 105 or the like to the D-VOL 72. An error message indicating that the remote copy process has been canceled because the remaining capacity is insufficient is output (S1304). Also in this case, the remote copy process for the RG is executed as usual. In order to increase the remaining capacity, which snapshot data is to be erased (for example, from a new snapshot or an old snapshot) may be determined and set appropriately in advance.
当該RGが使用しているD−VOL72の残り容量が前記いずれの条件にも該当しないと判定されれば(S1307、No)、リモートコピー応答処理部2142はレベル1に対応した処理を終了する。 If it is determined that the remaining capacity of the D-VOL 72 used by the RG does not correspond to any of the above conditions (No in S1307), the remote copy response processing unit 2142 ends the processing corresponding to level 1.
このRGレベル1に対応する処理によれば、各RGについてリモートコピー処理を継続しながらD−VOL72の容量を有効に利用することができる。 According to the processing corresponding to RG level 1, the capacity of the D-VOL 72 can be effectively used while continuing the remote copy processing for each RG.
次に、当該RGがレベル2と判定された場合の処理について説明する。図15に、レベル2の場合に実行される処理フローを示す。なお、この処理内容の理解を助けるために、図16A〜図16Bに処理の概要を表す模式的な説明図を示す。 Next, processing when the RG is determined to be level 2 will be described. FIG. 15 shows a processing flow executed in the case of level 2. In order to facilitate understanding of the processing contents, FIGS. 16A to 16B are schematic explanatory diagrams showing an outline of the processing.
図13に示したように、リモートサイトのサーバ装置10から要求があったRGのレベルがレベル2であると判定された場合、リモートコピー応答処理部2142の処理は、図15のレベル2処理(S1310)に移る。 As shown in FIG. 13, when it is determined that the RG level requested from the server device 10 at the remote site is level 2, the processing of the remote copy response processing unit 2142 is the level 2 processing ( Move to S1310).
まずリモートコピー応答処理部2142は、RG管理テーブル600及びファイルシステム管理テーブル700を検索する(S1501)。この際、リモートコピー応答処理部2142は、現在のレベル602がレベル2であると判定したRGを抽出し、ファイルシステム管理テーブル700を参照して各RGに関してD−VOL72の残り容量を取得すると共に、RG管理テーブル600に記録されている各レベルの状態であった累計時間604からレベル3であった累計時間及びレベル2であった累計時間を取得する。 First, the remote copy response processing unit 2142 searches the RG management table 600 and the file system management table 700 (S1501). At this time, the remote copy response processing unit 2142 extracts the RG determined that the current level 602 is level 2, acquires the remaining capacity of the D-VOL 72 for each RG by referring to the file system management table 700. , The cumulative time at level 3 and the cumulative time at level 2 are acquired from the cumulative time 604 recorded in the RG management table 600 at each level.
そして、取得結果をD−VOL残り容量の少ない順にソートする。D−VOL残容量が等しい場合は、過去にレベル3であった累計時間の多い方を上位とする。さらに、レベル3の累計時間が等しい場合は、レベル2の累計時間が少ない方を上位とする。このように取得及びソートされた各RGについての一覧テーブルの一例を図16Aに示す。 Then, the acquisition results are sorted in ascending order of remaining D-VOL capacity. If the D-VOL remaining capacity is equal, the higher cumulative time that was level 3 in the past is set as the higher rank. Furthermore, when the cumulative time of level 3 is equal, the one with the shortest cumulative time of level 2 is ranked higher. FIG. 16A shows an example of the list table for each RG acquired and sorted in this way.
リモートコピー応答処理部2142は、一覧テーブルを参照してフェイルオーバー対象とするRGを決定する(S1502)。決定手順は次の通りである。まずあらかじめD−VOL72の残り容量に下限値を設けておき、残り容量が設定した下限値より少ないRGをフェイルオーバー対象とする。そして、対象とされたRGのうち、D−VOL72の残り容量が等しいRGが複数ある場合には、レベル2及びレベル3であった累計時間に基づいて、より上位にあるRGをフェイルオーバー対象と決定する。 The remote copy response processing unit 2142 determines an RG to be failed over with reference to the list table (S1502). The determination procedure is as follows. First, a lower limit value is set for the remaining capacity of the D-VOL 72 in advance, and an RG having a remaining capacity smaller than the set lower limit value is set as a failover target. Then, when there are a plurality of RGs having the same remaining capacity of the D-VOL 72 among the targeted RGs, based on the accumulated time of the level 2 and the level 3, the RGs higher in level are set as failover targets. decide.
このように、D−VOL72の残り容量に下限値を設けておくことで、フェイルオーバー処理後にD−VOL72の残り容量に余裕がなくなるようなRGを排除することができる。また、過去にレベル3であった累計時間がより長いRGの優先度を高くしているので、過去において重要度が高いと判定されていた期間が長いRGについて優先的にフェイルオーバー処理が実行される。また過去にレベル3であった累計時間が等しい場合には、レベル2の累計時間が短いRGを優先するので、一時的に高位から低位へ(レベル3からレベル2へ)判定レベルが変更されても過度に低い評価がなされることを回避できる。 In this way, by setting a lower limit value for the remaining capacity of the D-VOL 72, it is possible to eliminate an RG that leaves no room for the remaining capacity of the D-VOL 72 after failover processing. Further, since the priority of the RG having a longer cumulative time that was Level 3 in the past is made higher, the failover process is preferentially executed for the RG having a longer period that has been determined to be higher in the past. The If the cumulative time of level 3 in the past is equal, priority is given to RG with a short cumulative time of level 2, so the judgment level is temporarily changed from high to low (from level 3 to level 2). It is possible to avoid an excessively low evaluation.
次に、リモートコピー応答処理部2142は、実際にフェイルオーバー処理を実行するフェイルオーバー処理部215の監視/切り換え処理部2151に処理を渡して(S1503)終了する。 Next, the remote copy response processing unit 2142 passes the processing to the monitoring / switching processing unit 2151 of the failover processing unit 215 that actually executes the failover processing (S1503) and ends.
以上のレベル2に対応する処理を実行することで、ローカルサイト及びリモートサイトにおけるRG毎の予備ボリューム74の数がアンバランスとなった場合に、プライマリ側における予備ボリューム74の数を優先して割り当てるようにすることができる。 By executing the processing corresponding to level 2 above, when the number of spare volumes 74 for each RG at the local site and the remote site is unbalanced, the number of spare volumes 74 on the primary side is assigned with priority. Can be.
なお、例えば図16C、16Dに示すように、所定の手順によって、フェイルオーバー処理を実行した後に、予備ボリューム74からD−VOL72へボリュームを追加する処理を実行するように構成してもよい。D−VOL72をこのように拡張した場合には、フェイルオーバー対象のRGを選択する処理の検索結果において優先度が下がる。これによりそのRGはフェイルオーバー対象から外れることとなり、続けてフェイルオーバー処理対象となる機会は低減される。 For example, as shown in FIGS. 16C and 16D, a process for adding a volume from the spare volume 74 to the D-VOL 72 may be executed after performing a failover process according to a predetermined procedure. When the D-VOL 72 is expanded in this way, the priority is lowered in the search result of the process for selecting the failover target RG. As a result, the RG is excluded from the failover target, and the opportunity to be subsequently subject to the failover process is reduced.
次に、当該RGがレベル3と判定された場合の処理について説明する。図17に、レベル3の場合に実行される処理フローを示す。なお、この処理内容の理解を助けるために、図19に処理の概要を表す模式的な説明図を示す。 Next, processing when the RG is determined to be level 3 will be described. FIG. 17 shows a processing flow executed in the case of level 3. In order to help understanding of the processing contents, FIG. 19 shows a schematic explanatory diagram showing an outline of the processing.
図13に示したように、リモートサイトのサーバ装置10から要求があったRGのレベルがレベル3であると判定された場合、リモートコピー応答処理部2142の処理は、図17のレベル2処理(図13のS1312)に移る。 As shown in FIG. 13, when it is determined that the level of RG requested from the server device 10 at the remote site is level 3, the processing of the remote copy response processing unit 2142 is the level 2 processing ( The process moves to S1312) in FIG.
まずリモートコピー応答処理部2142は、当該RGが使用しているD−VOL72の残り容量をRG管理テーブル600及びファイルシステム管理テーブル700を参照して取得する(S1700)。そして、あらかじめ決定しておいた閾値(閾値A)とその残り容量とを比較し、残り容量が閾値以下であると判定すれば(S1701、Yes)、D−VOL72の割当容量を増加させるために、後述するD−VOL拡張処理へ処理を移して終了する(S1702)。
取得した残り容量が閾値より大であると判定されれば(S1701、No)、D−VOL72の容量を増加させる必要はないと判定してそのまま終了する。
First, the remote copy response processing unit 2142 acquires the remaining capacity of the D-VOL 72 used by the RG with reference to the RG management table 600 and the file system management table 700 (S1700). Then, a predetermined threshold value (threshold value A) is compared with the remaining capacity, and if it is determined that the remaining capacity is equal to or less than the threshold value (S1701, Yes), in order to increase the allocated capacity of the D-VOL 72 Then, the process shifts to a D-VOL extension process, which will be described later, and ends (S1702).
If it is determined that the acquired remaining capacity is greater than the threshold value (S1701, No), it is determined that there is no need to increase the capacity of the D-VOL 72, and the process ends.
このようなレベル3の処理によれば、重要度が高いと判定されているRGについて、リモートコピー処理のために十分なD−VOL72の容量を確保しておくことができる。 According to such level 3 processing, it is possible to secure a sufficient capacity of the D-VOL 72 for remote copy processing for an RG determined to have high importance.
==D−VOL拡張処理==
図18A及び図18Bに、レベル3の処理フローにおいて所定の条件が成立した場合に起動されるD−VOL拡張処理部2131による処理フローを示す。この処理は、各サーバ装置10のリモートコピー処理部214にあるD−VOL拡張処理部2131により実行され、プライマリ側RG、セカンダリ側RGのある各サーバ装置10間で連係して実行される処理であるため、図18Aはプライマリ側での処理フローを、図18Bはセカンダリ側での処理フローを示している。なお、このD−VOL拡張処理は、レベル2の処理に関して述べたように、レベル2の処理におけるフェイルオーバー処理実行後にD−VOL72へ予備ボリューム74を追加する処理を実行するように構成した場合にも適用することができる。
== D-VOL extension processing ==
18A and 18B show a processing flow by the D-VOL extension processing unit 2131 that is activated when a predetermined condition is satisfied in the level 3 processing flow. This processing is executed by the D-VOL extension processing unit 2131 in the remote copy processing unit 214 of each server device 10 and executed in cooperation between the server devices 10 having the primary side RG and the secondary side RG. Therefore, FIG. 18A shows the processing flow on the primary side, and FIG. 18B shows the processing flow on the secondary side. This D-VOL expansion process is performed when the process for adding the spare volume 74 to the D-VOL 72 is executed after the failover process in the level 2 process is executed, as described with respect to the level 2 process. Can also be applied.
まずプライマリ側での処理について図18Aを参照しつつ説明する。D−VOL拡張処理部2131は、リモートコピー応答処理部2142からの処理要求を待機しており(S1801、No)、処理要求を取得すると(S1801、Yes)、リモートコピー設定管理テーブル900を検索して(S1803)、プライマリ側902及びセカンダリ側903の項目の記録によって、自身がプライマリ側902であるか判定する(S1803)。 First, processing on the primary side will be described with reference to FIG. 18A. The D-VOL extension processing unit 2131 waits for a processing request from the remote copy response processing unit 2142 (S1801, No), and when the processing request is acquired (S1801, Yes), searches the remote copy setting management table 900. (S1803), it is determined whether or not it is the primary side 902 by recording the items of the primary side 902 and the secondary side 903 (S1803).
プライマリ側902でないと判定した場合(S1803、No)、後述するセカンダリ側903の処理に移る(S1804)。 When it is determined that it is not the primary side 902 (S1803, No), the process proceeds to the secondary side 903 described later (S1804).
プライマリ側902であると判定した場合(S1803、Yes)、D−VOL拡張処理部2131は、自身のサーバ装置10が保持する予備ボリューム管理テーブル800を参照して未割当状態となっている、D−VOL72として使用可能なボリューム名801をすべて取得する(S1805)。次いで、セカンダリ側のサーバ装置10にあるD−VOL拡張処理部2131に、予備ボリューム管理テーブル800を参照して予備ボリューム名801の取得するよう要求を発行する(S1806)。 When the primary side 902 is determined (S1803, Yes), the D-VOL expansion processing unit 2131 is in an unallocated state with reference to the spare volume management table 800 held by its own server device 10. -All the volume names 801 that can be used as the VOL 72 are acquired (S1805). Next, a request is issued to the D-VOL expansion processing unit 2131 in the secondary server apparatus 10 to acquire the spare volume name 801 with reference to the spare volume management table 800 (S1806).
次に、セカンダリ側から取得された予備ボリューム名801を受信してこれを自身が取得した予備ボリューム名801と比較し、D−VOL72として追加する予備ボリューム74を決定する。本実施形態では、追加する予備ボリューム74として、比較した結果容量が同一でかつ最大の予備ボリューム74を選択することとしている。これは、D−VOL72を最大限拡張すると共に、プライマリ側−セカンダリ側間でD−VOL72の容量がアンバランスとならないようにするためである。 Next, the backup volume name 801 acquired from the secondary side is received and compared with the backup volume name 801 acquired by itself, and the backup volume 74 to be added as the D-VOL 72 is determined. In the present embodiment, as the spare volume 74 to be added, the spare volume 74 having the same capacity and the maximum capacity as a result of comparison is selected. This is for the purpose of expanding the D-VOL 72 to the maximum and preventing the capacity of the D-VOL 72 from becoming unbalanced between the primary side and the secondary side.
次いでD−VOL拡張処理部2131は、セカンダリ側のD−VOL拡張処理部2131に、選択した予備ボリューム74を追加してD−VOL72を拡張するように要求する(S1808)。そして、自身も選択した予備ボリューム74を追加し(S1809)、予備ボリューム管理テーブル800の該当割当状態に「済み」と記録し、ファイルシステム管理テーブル700のD−VOL名及び属するボリューム名703及びD−VOL残り容量704を変更する更新を行って終了する(S1810)。 Next, the D-VOL expansion processing unit 2131 requests the secondary D-VOL expansion processing unit 2131 to add the selected spare volume 74 and expand the D-VOL 72 (S1808). Then, the selected spare volume 74 is also added (S 1809), “Done” is recorded in the corresponding allocation state of the spare volume management table 800, and the D-VOL name and the volume name 703 and D of the file system management table 700 are recorded. -The update which changes the VOL remaining capacity 704 is performed and it complete | finishes (S1810).
次に、セカンダリ側での処理につき、図18Bを参照して説明する。セカンダリ側のD−VOL拡張処理部2131は、プライマリ側からの予備ボリューム74名一覧の取得要求があったか判定し(S1851)、要求を取得した場合(S1851、Yes)、自身の予備ボリューム管理テーブル800を検索して、D−VOL72として未割当状態で使用可能な予備ボリューム名801を取得し(S1852)、これをプライマリ側D−VOL拡張処理部2131に送信する(S1853)。 Next, processing on the secondary side will be described with reference to FIG. 18B. The D-VOL expansion processing unit 2131 on the secondary side determines whether or not there is a request for acquiring the spare volume 74 name list from the primary side (S1851), and when the request is acquired (Yes in S1851), its own spare volume management table 800. And a spare volume name 801 that can be used in an unallocated state as the D-VOL 72 is acquired (S1852), and this is transmitted to the primary D-VOL expansion processing unit 2131 (S1853).
次いでD−VOL拡張処理部2131は、プライマリ側D−VOL拡張処理部2131からD−VOL拡張処理要求があったかを判定する(S1854)。要求があった場合は(S1854、Yes)、プライマリ側D−VOL拡張処理部2131で選択した予備ボリューム74をD−VOL72に追加し(S1855)、自身の予備ボリューム管理テーブル800の該当割当状態に「済み」と記録し、ファイルシステム管理テーブル700のD−VOL名及び属するボリューム名703及びD−VOL残り容量704を変更する更新を行って終了する(S1856)。 Next, the D-VOL extension processing unit 2131 determines whether or not there is a D-VOL extension processing request from the primary D-VOL extension processing unit 2131 (S1854). If there is a request (S1854, Yes), the spare volume 74 selected by the primary-side D-VOL expansion processing unit 2131 is added to the D-VOL 72 (S1855), and the corresponding allocation state of its own spare volume management table 800 is set. “Done” is recorded, the D-VOL name, the volume name 703 to which the file system management table 700 belongs, and the update that changes the remaining D-VOL capacity 704 are performed, and the process ends (S1856).
==監視/切り換え処理==
図20A及び図20Bに、ローカルサイト又はリモートサイトの各サーバ装置10にあるフェイルオーバー処理部215の監視/切り換え処理部2151で実行される処理フローを示す。この処理では、ローカル又はリモートサイトのサーバ装置10相互間における予備ボリューム74の数を監視すると共に、所定の条件が成立した場合、ローカル又はリモートサイトのサーバ装置10間でフェイルオーバー処理をRG毎に実行する。プライマリ側RG、セカンダリ側RGのある各サーバ装置10間で連係して実行される処理であるため、図20Aはプライマリ側での処理フローを、図20Bはセカンダリ側での処理フローを示している。
== Monitoring / switching process ==
20A and 20B show a processing flow executed by the monitoring / switching processing unit 2151 of the failover processing unit 215 in each server device 10 at the local site or the remote site. In this process, the number of spare volumes 74 between the local or remote site server apparatuses 10 is monitored, and when a predetermined condition is satisfied, a failover process is performed for each RG between the local or remote site server apparatuses 10. Execute. FIG. 20A shows a processing flow on the primary side, and FIG. 20B shows a processing flow on the secondary side because the processing is executed in cooperation between the server devices 10 having the primary side RG and the secondary side RG. .
まずプライマリ側での処理について、図20Aを参照しつつ説明する。監視/切り換え処理部2151は、リモートコピー応答処理部2142からの処理要求を待機しており(S2001、No)、処理要求を取得すると(S2001、Yes)、リモートコピー設定管理テーブル900を検索して(S2002)、プライマリ側902及びセカンダリ側903の項目の記録によって、自身がプライマリ側902であるか判定する(S2003)。 First, processing on the primary side will be described with reference to FIG. 20A. The monitoring / switching processing unit 2151 waits for a processing request from the remote copy response processing unit 2142 (S2001, No), and when the processing request is acquired (S2001, Yes), searches the remote copy setting management table 900. (S2002), it is determined whether or not it is the primary side 902 by recording the items on the primary side 902 and the secondary side 903 (S2003).
プライマリ側902でないと判定した場合(S1803、No)、後述するセカンダリ側903の処理に移る(S2004)。
プライマリ側902であると判定した場合(S2003、Yes)、監視/切り換え処理部2151は、自身のサーバ装置10が保持する予備ボリューム管理テーブル800を参照して未割当状態となっている、D−VOL72として使用可能なボリューム名801をすべて取得する(S2005)。次いで、セカンダリ側のサーバ装置10にある監視/切り換え処理部2151に、予備ボリューム管理テーブル800を参照して予備ボリューム名801を取得するよう要求を発行する(S2006)。
If it is determined that it is not the primary side 902 (S1803, No), the process proceeds to the secondary side 903 described later (S2004).
If it is determined that it is the primary side 902 (S2003, Yes), the monitoring / switching processing unit 2151 refers to the spare volume management table 800 held by its own server device 10 and is in an unallocated state. All the volume names 801 that can be used as the VOL 72 are acquired (S2005). Next, a request is issued to the monitoring / switching processing unit 2151 in the secondary server apparatus 10 to acquire the spare volume name 801 with reference to the spare volume management table 800 (S2006).
次に、定期的に実行されているローカル及びリモートサイトのサーバ装置10間でのリモートコピー処理が実行され両者間でスナップショットの同期がとれたことを契機として、セカンダリ側から取得された予備ボリューム名801を受信してこれを自身が取得した予備ボリューム名801と比較し、両者の予備ボリューム74の数の差を算出する。算出した予備ボリューム74の数の差と、あらかじめ設定してある閾値とを比較して、前記の差が当該閾値より大であり、セカンダリ側の予備ボリューム74の数の方が多いと判定された場合(S2008、Yes)、セカンダリ側サーバ装置10へ通知してからフェイルオーバー処理を実行して処理を終了する(S2009)。 Next, the spare volume acquired from the secondary side when the remote copy processing between the local and remote site server apparatuses 10 is executed periodically and the snapshots are synchronized between the two. The name 801 is received and compared with the spare volume name 801 acquired by itself, and the difference between the numbers of the two spare volumes 74 is calculated. The difference between the calculated number of spare volumes 74 and a preset threshold value are compared, and it is determined that the difference is larger than the threshold value and the number of spare volumes 74 on the secondary side is larger. In the case (S2008, Yes), after notifying the secondary server apparatus 10, a failover process is executed and the process is terminated (S2009).
次に、セカンダリ側での処理につき、図20Bを参照して説明する。セカンダリ側の監視/切り換え処理部2151は、プライマリ側からの予備ボリューム74名一覧の取得要求があったか判定し(S2051)、要求を取得した場合(S2051、Yes)、自身の予備ボリューム管理テーブル800を検索して、D−VOL72として未割当状態で使用可能な予備ボリューム名801を取得し、これをプライマリ側監視/切り換え処理部2151に送信する(S2052)。 Next, processing on the secondary side will be described with reference to FIG. 20B. The monitoring / switching processing unit 2151 on the secondary side determines whether or not there is a request for acquiring the list of spare volume 74 names from the primary side (S2051). By searching, a spare volume name 801 that can be used in an unallocated state as the D-VOL 72 is acquired and transmitted to the primary side monitoring / switching processing unit 2151 (S2052).
監視/切り換え処理部2151は、プライマリ側監視/切り換え処理部2151からフェイルオーバー処理実行に伴う引き継ぎ処理要求があったか判定する(S2053)。要求があった場合は(S2053、Yes)、引き継ぎ処理を実行して(S2054)、自身のリモートコピー設定管理テーブル900を更新して終了する(S2055)。 The monitoring / switching processing unit 2151 determines whether there is a takeover processing request accompanying the failover processing execution from the primary-side monitoring / switching processing unit 2151 (S2053). If there is a request (S2053, Yes), the takeover process is executed (S2054), and the remote copy setting management table 900 of its own is updated and the process ends (S2055).
プライマリ側からの予備ボリューム74名一覧の取得要求がない場合(S2051、No)、セカンダリ側監視/切り換え処理部2151は、プライマリ側の予備ボリューム管理テーブル800を監視して(S2056)、予備ボリューム74の追加があるか判定する(S2057)。予備ボリューム74のD−VOL72としての追加があれば(S2057、Yes)、自身のサーバ装置10においても対応する予備ボリューム74を追加して、自身の予備ボリューム管理テーブル800及びファイルシステム管理テーブル700を更新して終了する(S2058)。 When there is no acquisition request for the spare volume 74 name list from the primary side (No in S2051), the secondary side monitoring / switching processing unit 2151 monitors the spare volume management table 800 on the primary side (S2056), and reserve volume 74 It is determined whether there is any additional (S2057). If the spare volume 74 is added as the D-VOL 72 (S2057, Yes), the corresponding spare volume 74 is also added in the server device 10 of itself, and the own spare volume management table 800 and the file system management table 700 are stored. Update and end (S2058).
以上詳細に説明したように、本発明の一実施形態によれば、スナップショット差分データのリモートコピー処理を、コピー元及びコピー先において記憶領域を効率的に使用しつつ確実に継続することができるという効果を奏する。 As described above in detail, according to an embodiment of the present invention, remote copy processing of snapshot difference data can be reliably continued while efficiently using storage areas at the copy source and the copy destination. There is an effect.
1 情報処理システム
10 サーバ装置
20 ストレージ装置
30 ホスト/クライアント装置
40 LANスイッチ
71 P−VOL
72 D−VOL
74 予備ボリューム
75 ファイルシステム
211 ファイル共有システム
212 ファイルシステム
213 スナップショット処理部
2131 D−VOL拡張処理部
214 リモートコピー処理部(データコピー処理部)
2143 レベル判定処理部
215 フェイルオーバー処理部
2151 監視/切り換え処理部
600 RG管理テーブル
700 ファイルシステム管理テーブル
800 予備ボリューム管理テーブル
900 リモートコピー設定管理テーブル
1 Information processing system 10 Server device 20 Storage device 30 Host / client device 40 LAN switch 71 P-VOL
72 D-VOL
74 Backup Volume 75 File System 211 File Sharing System 212 File System 213 Snapshot Processing Unit 2131 D-VOL Extension Processing Unit 214 Remote Copy Processing Unit (Data Copy Processing Unit)
2143 Level determination processing unit 215 Failover processing unit 2151 Monitoring / switching processing unit 600 RG management table 700 File system management table 800 Spare volume management table 900 Remote copy setting management table
Claims (10)
前記複数の論理ボリュームを、
外部装置とのデータ入出力に使用するP−VOL、ある時点における前記P−VOLの状態であるスナップショットを再現すべく、前記P−VOLのデータが更新されることにより生じた差分データを格納するD−VOL、及び前記D−VOLとして追加割当てすることができる予備ボリュームとに割り当てて管理し、前記P−VOLにそれぞれアクセス可能とされているファイルシステムと、
前記外部装置が前記ファイルシステムと通信をするための通信インターフェイスと
を備えた情報処理装置であって、
所定の時間間隔で、前記D−VOLの差分データを、前記通信インターフェイスを介して、前記ストレージ装置外にある他のD−VOLにコピーするデータコピー処理部と、
前記データコピー処理部が前記D−VOLの差分データを前記他のD−VOLにコピーする処理を完了した際に、前記他のD−VOLに新規のD−VOLとして追加されるべく設けられている他の予備ボリュームの数を取得して、自身が有する予備ボリュームの数と比較し、両者の差があらかじめ規定しておいた閾値を超えており、かつ前記他の予備ボリュームの数が自身の予備ボリュームの数よりも大であると判定した場合に、前記データコピー処理部の当該データコピー処理のコピー元の機能をコピー先の機能に切り換えるフェイルオーバー処理を行うフェイルオーバー処理部と、を備えている
ことを特徴とする情報処理装置。 Connect to a storage device that provides multiple logical volumes,
The plurality of logical volumes;
Stores differential data generated by updating the P-VOL data in order to reproduce a P-VOL used for data input / output with an external device and a snapshot of the P-VOL at a certain point in time A D-VOL and a spare volume that can be additionally allocated as the D-VOL and managed, and each of the P-VOL can be accessed by the file system,
An information processing apparatus comprising a communication interface for the external device to communicate with the file system,
A data copy processing unit that copies the difference data of the D-VOL to another D-VOL outside the storage device via the communication interface at a predetermined time interval;
Provided to be added as a new D-VOL to the other D-VOL when the data copy processing unit completes the process of copying the difference data of the D-VOL to the other D-VOL. The number of other spare volumes is obtained and compared with the number of spare volumes that the self has, the difference between the two exceeds a predetermined threshold, and the number of other spare volumes is A failover processing unit for performing a failover process for switching the copy source function of the data copy processing unit to the copy destination function when it is determined that the number is larger than the number of spare volumes. An information processing apparatus characterized by that.
前記データコピー処理部及び前記フェイルオーバー処理部の処理は、前記通信ネットワークに割り当てられた各通信アドレスに対応付けられている前記ファイルシステムが使用する論理ボリューム群を単位として実行される
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1,
The processing of the data copy processing unit and the failover processing unit is executed for each logical volume group used by the file system associated with each communication address assigned to the communication network. Information processing apparatus.
前記フェイルオーバー処理が完了した際に、自身が有する予備ボリュームの数が所定値よりも多いと判定した場合に、自身が有する予備ボリュームの中から所定の手順で選択した予備ボリュームをあらたにD−VOLとして追加し、その旨をあらたにコピー元となった情報処理装置へ通知する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1,
When it is determined that the number of spare volumes owned by itself is greater than a predetermined value when the failover process is completed, a new spare volume selected by the predetermined procedure from the spare volumes owned by itself is newly added to the D- An information processing apparatus that is added as a VOL and notifies the information processing apparatus that has newly been copied to that effect.
前記各ネットワークアドレスに対応付けられている前記ファイルシステムが使用する論理ボリューム群を単位として各論理ボリューム群の重要度を所定の基準値を適用してレベル分けし、当該レベル分けの結果によって前記データコピー及びフェイルオーバー処理の内容を変更する
ことを特徴とする情報処理装置。 An information processing apparatus according to claim 2,
Applying a predetermined reference value to the level of importance of each logical volume group in units of logical volume groups used by the file system associated with each network address, the data depending on the result of the level division An information processing apparatus that changes contents of copy and failover processing.
前記各論理ボリューム群をレベル分けするために適用される所定の基準値が、当該各論理ボリューム群に対応付けられている各ネットワークアドレスのユーザ数、前記各論理ボリューム群に対応付けられているファイルシステム数、又は前記各ネットワークアドレスに割り当てられている通信ポート数のいずれかを含んでいることを特徴とする情報処理装置。 The information processing apparatus according to claim 4,
A predetermined reference value applied for leveling each logical volume group includes the number of users of each network address associated with each logical volume group, and the file associated with each logical volume group. An information processing apparatus comprising either the number of systems or the number of communication ports assigned to each network address.
前記各ネットワークアドレスに対応付けられている前記ファイルシステムが使用する論理ボリューム群を単位として各論理ボリューム群の重要度が前記所定の基準値を適用して最も高いと判定された場合に、当該論理ボリューム群に含まれる前記D−VOLの残り容量を取得してその残り容量について規定した所定の閾値Aと比較し、取得した前記D−VOLの残り容量が当該所定の閾値A以下であると判定された場合に、当該論理ボリューム群に含まれている予備ボリュームをあらたにD−VOLとして追加する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 4,
When it is determined that the degree of importance of each logical volume group is the highest by applying the predetermined reference value with the logical volume group used by the file system associated with each network address as a unit, the logical volume group The remaining capacity of the D-VOL included in the volume group is acquired and compared with a predetermined threshold A defined for the remaining capacity, and it is determined that the acquired remaining capacity of the D-VOL is equal to or less than the predetermined threshold A. In this case, the information processing apparatus is characterized in that a spare volume included in the logical volume group is newly added as a D-VOL.
前記各ネットワークアドレスに対応付けられている前記ファイルシステムが使用する論理ボリューム群を単位として各論理ボリューム群の重要度が前記所定の基準値を適用して最も低いと判定された場合に、当該論理ボリューム群に含まれる前記D−VOLの残り容量を取得してその残り容量について規定した所定の閾値Bと比較し、取得した前記D−VOLの残り容量が当該所定の閾値B以下であると判定された場合に、当該論理ボリューム群についてのデータコピー処理を中止させる
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 4,
When it is determined that the importance of each logical volume group is the lowest by applying the predetermined reference value with the logical volume group used by the file system associated with each network address as a unit, the logical volume The remaining capacity of the D-VOL included in the volume group is acquired and compared with a predetermined threshold B defined for the remaining capacity, and it is determined that the acquired remaining capacity of the D-VOL is equal to or less than the predetermined threshold B. An information processing apparatus that suspends the data copy processing for the logical volume group in the case of being performed.
前記D−VOLの残り容量についてさらに、前記所定の閾値Bよりも大である閾値Cを規定し、当該論理ボリューム群に含まれる前記D−VOLの残り容量を取得してその残り容量について規定した所定の閾値B及びCと比較し、取得した前記D−VOLの残り容量が当該所定の閾値Bを超え閾値C以下であると判定された場合に、前記D−VOLに記録されているデータの一部を削除した上で当該論理ボリューム群についてのデータコピー処理を実行させる
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 7,
For the remaining capacity of the D-VOL, a threshold C that is larger than the predetermined threshold B is further defined, and the remaining capacity of the D-VOL included in the logical volume group is acquired and the remaining capacity is defined. When it is determined that the remaining capacity of the acquired D-VOL exceeds the predetermined threshold B and is equal to or lower than the threshold C in comparison with the predetermined thresholds B and C, the data recorded in the D-VOL An information processing apparatus that executes data copy processing for the logical volume group after deleting a part thereof.
前記D−VOLの残り容量についてさらに、前記所定の閾値Cよりも大である閾値Dを規定し、当該論理ボリューム群に含まれる前記D−VOLの残り容量を取得してその残り容量について規定した所定の閾値C及びDと比較し、取得した前記D−VOLの残り容量が当該所定の閾値Cを超え閾値D以下であると判定された場合に、当該論理ボリューム群についてのデータコピー処理を実行させると共に、前記D−VOLの残り容量が少なくなっている旨のメッセージを管理者に通知する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 8,
For the remaining capacity of the D-VOL, a threshold D that is larger than the predetermined threshold C is further defined, and the remaining capacity of the D-VOL included in the logical volume group is acquired and the remaining capacity is defined. Compare with predetermined threshold values C and D, and execute data copy processing for the logical volume group when it is determined that the remaining capacity of the acquired D-VOL exceeds the predetermined threshold value C and is equal to or less than the threshold value D An information processing apparatus that notifies the administrator that the remaining capacity of the D-VOL is low.
前記複数の論理ボリュームを、
外部装置とのデータ入出力に使用するP−VOL、ある時点における前記P−VOLの状態であるスナップショットを再現すべく、前記P−VOLのデータが更新されることにより生じた差分データを格納するD−VOL、及び前記D−VOLとして追加割当てすることができる予備ボリュームとに割り当てて管理し、前記P−VOLにそれぞれアクセス可能とされているファイルシステムと、
前記外部装置が前記ファイルシステムと通信をするための通信インターフェイスと
を備えた情報処理装置の運用方法であって、
所定の時間間隔で、前記D−VOLの差分データを、前記通信インターフェイスを介して、前記ストレージ装置外にある他のD−VOLにコピーし、
前記データコピー処理部が前記D−VOLの差分データを前記他のD−VOLにコピーする処理を完了した際に、前記他のD−VOLに新規のD−VOLとして追加されるべく設けられている他の予備ボリュームの数を取得して、自身が有する予備ボリュームの数と比較し、両者の差があらかじめ規定しておいた閾値を超えており、かつ前記他の予備ボリュームの数が自身の予備ボリュームの数よりも大であると判定した場合に、前記データコピー処理部の当該データコピー処理のコピー元の機能をコピー先の機能に切り換えるフェイルオーバー処理を行う、
ことを特徴とする情報処理装置の運用方法。 Connect to a storage device that provides multiple logical volumes,
The plurality of logical volumes;
Stores differential data generated by updating the P-VOL data in order to reproduce a P-VOL used for data input / output with an external device and a snapshot of the P-VOL at a certain point in time A D-VOL and a spare volume that can be additionally allocated as the D-VOL and managed, and each of the P-VOL can be accessed by the file system,
An operation method of an information processing apparatus provided with a communication interface for the external device to communicate with the file system,
At a predetermined time interval, the difference data of the D-VOL is copied to another D-VOL outside the storage device via the communication interface,
Provided to be added as a new D-VOL to the other D-VOL when the data copy processing unit completes the process of copying the difference data of the D-VOL to the other D-VOL. The number of other spare volumes is obtained and compared with the number of spare volumes that the self has, the difference between the two exceeds a predetermined threshold, and the number of other spare volumes is When it is determined that the number is larger than the number of spare volumes, a failover process is performed to switch the copy source function of the data copy process to the copy destination function of the data copy processing unit.
An operation method of an information processing apparatus characterized by the above.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008260037A JP2010092176A (en) | 2008-10-06 | 2008-10-06 | Information processor and operation method for the information processor |
US12/326,943 US8161008B2 (en) | 2008-10-06 | 2008-12-03 | Information processing apparatus and operation method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008260037A JP2010092176A (en) | 2008-10-06 | 2008-10-06 | Information processor and operation method for the information processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010092176A true JP2010092176A (en) | 2010-04-22 |
Family
ID=42076580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008260037A Pending JP2010092176A (en) | 2008-10-06 | 2008-10-06 | Information processor and operation method for the information processor |
Country Status (2)
Country | Link |
---|---|
US (1) | US8161008B2 (en) |
JP (1) | JP2010092176A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016119062A (en) * | 2014-12-19 | 2016-06-30 | 富士通株式会社 | Storage device, storage system, and storage control program |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5297250B2 (en) * | 2009-03-30 | 2013-09-25 | 富士通株式会社 | Storage system and information storage method |
US8849758B1 (en) | 2010-12-28 | 2014-09-30 | Amazon Technologies, Inc. | Dynamic data set replica management |
US8745344B2 (en) * | 2011-07-01 | 2014-06-03 | Hitachi, Ltd. | Storage system using thin provisioning pool and snapshotting, and controlling method of the same |
JP5816303B2 (en) * | 2011-09-13 | 2015-11-18 | 株式会社日立製作所 | Storage system including flash memory and storage control method |
US10456686B2 (en) | 2012-09-05 | 2019-10-29 | Zynga Inc. | Methods and systems for adaptive tuning of game events |
US9675889B2 (en) | 2014-09-10 | 2017-06-13 | Zynga Inc. | Systems and methods for determining game level attributes based on player skill level prior to game play in the level |
US10561944B2 (en) | 2014-09-10 | 2020-02-18 | Zynga Inc. | Adjusting object adaptive modification or game level difficulty and physical gestures through level definition files |
US10402275B2 (en) * | 2015-01-28 | 2019-09-03 | DataStax | Backup to and restore from an offsite backup location |
US10402276B2 (en) * | 2015-01-28 | 2019-09-03 | DataStax | Backup to and clone from an offsite backup location |
US20170220282A1 (en) * | 2016-01-29 | 2017-08-03 | Dell Products L.P. | Dynamic capacity expansion of raid volumes |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4689137B2 (en) * | 2001-08-08 | 2011-05-25 | 株式会社日立製作所 | Remote copy control method and storage system |
US6643795B1 (en) * | 2000-03-30 | 2003-11-04 | Hewlett-Packard Development Company, L.P. | Controller-based bi-directional remote copy system with storage site failover capability |
US6691245B1 (en) * | 2000-10-10 | 2004-02-10 | Lsi Logic Corporation | Data storage with host-initiated synchronization and fail-over of remote mirror |
JP2005196683A (en) * | 2004-01-09 | 2005-07-21 | Hitachi Ltd | Information processing system, information processor and control method of information processing system |
JP4507249B2 (en) * | 2004-10-19 | 2010-07-21 | 株式会社日立製作所 | System and method for controlling storage device updates |
JP2007188267A (en) * | 2006-01-12 | 2007-07-26 | Hitachi Ltd | Storage controller and control method therefor |
JP4842703B2 (en) * | 2006-05-18 | 2011-12-21 | 株式会社日立製作所 | Storage system and recovery volume creation method thereof |
-
2008
- 2008-10-06 JP JP2008260037A patent/JP2010092176A/en active Pending
- 2008-12-03 US US12/326,943 patent/US8161008B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016119062A (en) * | 2014-12-19 | 2016-06-30 | 富士通株式会社 | Storage device, storage system, and storage control program |
Also Published As
Publication number | Publication date |
---|---|
US20100088279A1 (en) | 2010-04-08 |
US8161008B2 (en) | 2012-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010092176A (en) | Information processor and operation method for the information processor | |
US8200631B2 (en) | Snapshot reset method and apparatus | |
JP4800031B2 (en) | Storage system and snapshot management method | |
US8635427B2 (en) | Data storage control on storage devices | |
US7664771B2 (en) | Optimizing defragmentation operations in a differential snapshotter | |
JP4990066B2 (en) | A storage system with a function to change the data storage method using a pair of logical volumes | |
KR100439675B1 (en) | An efficient snapshot technique for shated large storage | |
US10547678B2 (en) | Data transfer techniques within data storage devices, such as network attached storage performing data migration | |
US8656123B2 (en) | Snapshot preserved data cloning | |
US7783850B2 (en) | Method and apparatus for master volume access during volume copy | |
US7424491B2 (en) | Storage system and control method | |
JP4267420B2 (en) | Storage apparatus and backup acquisition method | |
US7054960B1 (en) | System and method for identifying block-level write operations to be transferred to a secondary site during replication | |
US7334084B2 (en) | Disk array apparatus and control method for disk array apparatus | |
US20090216973A1 (en) | Computer system, storage subsystem, and data management method | |
US9075755B1 (en) | Optimizing data less writes for restore operations | |
JP4225206B2 (en) | Replicated data storage system for storage device and replicated data storage program | |
US20060095695A1 (en) | Copy operations in storage networks | |
CN106528338B (en) | Remote data copying method, storage device and storage system | |
US9063892B1 (en) | Managing restore operations using data less writes | |
US7849264B2 (en) | Storage area management method for a storage system | |
JP4518485B2 (en) | Database reorganization method, storage apparatus and storage system |