[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5537732B2 - ストレージシステム - Google Patents

ストレージシステム Download PDF

Info

Publication number
JP5537732B2
JP5537732B2 JP2013506814A JP2013506814A JP5537732B2 JP 5537732 B2 JP5537732 B2 JP 5537732B2 JP 2013506814 A JP2013506814 A JP 2013506814A JP 2013506814 A JP2013506814 A JP 2013506814A JP 5537732 B2 JP5537732 B2 JP 5537732B2
Authority
JP
Japan
Prior art keywords
area
control information
ldev
data
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013506814A
Other languages
English (en)
Other versions
JP2013525912A (ja
JP2013525912A5 (ja
Inventor
講平 鑪
賢哲 江口
久治 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2013525912A publication Critical patent/JP2013525912A/ja
Publication of JP2013525912A5 publication Critical patent/JP2013525912A5/ja
Application granted granted Critical
Publication of JP5537732B2 publication Critical patent/JP5537732B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/0223User address space allocation, e.g. contiguous or non contiguous base addressing
    • G06F12/023Free address space management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、記憶デバイスで構成されたボリュームのデータ配置を管理するためのストレージシステムに関する。
ストレージサブシステムあるいはストレージ装置として、記憶デバイスに、例えば、ディスクドライブを用いたものが知られている。記憶デバイスに対するデータの入出力処理を制御する場合、ディスクのヘッドを位置決めすることが行われている。
例えば、特許文献1によると、記憶デバイスで構成されたボリュームは一つまたは複数のトラックを備えている。記憶デバイスの実記憶領域は、トラック内の先頭に制御情報部(ホームアドレス、レコード0)があり、その後ろにデータ部(レコード1、レコード2、・・・)が配置されている。メインフレーム(MF)ホスト計算機が、トラックのリードまたはライトをストレージコントローラに要求した場合、ストレージコントローラは、リードコマンドまたはライトコマンドに従ってディスクから、トラックを読み出し、トラックの制御情報部の値(ホームアドレス)を読んで、トラックの位置情報を確認し、トラックに対するヘッドの位置決めが正しく行われたことを確認した後に、データ部に対してリードまたはライトアクセスを実施する。
米国特許公報第5506979号
近年、オンライン商取引の活発化に伴い、ネットワークに接続されたストレージ装置に対して発行されるリードまたはライトアクセスの性能向上が望まれる。こうした環境下では、前述したストレージコントローラが、トラックの位置情報を確認する処理を省き、データ部のみをディスクに対して読み書きすることで、リードアクセスまたはライトアクセス処理の高速化を行う。
例えば、ストレージコントローラが、ホスト計算機から、あるトラックに対するリードアクセスまたはライトアクセスを受領した場合に、このトラック内の制御情報の値を参照せず、トラックの先頭にディスクのヘッドを位置づける処理が正しく行われたことを確認する処理を省くときには、ディスクからストレージコントローラへの制御情報部の転送は不要となり、リードアクセスまたはライトアクセス処理を高速化できる。
しかし、特許文献1に記載されている、ボリュームのデータ配置を採用したのでは、ストレージコントローラが、ディスクからデータ部のみを読み出すようにしたとしても、ディスクのヘッドを、トラックの先頭にある制御情報部の位置をスキップして、データ部に位置付ける処理がオーバヘッドとなる。
本発明の目的は、ディスクに対するリード/ライトアクセスの性能を向上させることができるストレージシステムを提供することにある。
前記目的を達成するために、本発明は、複数の一定サイズのページにて形成される仮想的な記憶領域である仮想ボリュームと、前記仮想ボリューム上にデータを格納するデータ部を纏めたデータ領域と前記データ部へのアクセスに用いられる制御情報を格納する制御情報部を纏めた制御情報領域とを形成するストレージコントローラと、前記仮想ボリュームに実記憶領域を提供する記憶媒体とを備え、前記ストレージコントローラは、前記仮想ボリュームを設定後、当該仮想ボリュームの容量を一定の第1のサイズの前記データ領域と一定の第2のサイズの前記制御情報領域とを備えたグループの単位で拡張し、
前記仮想ボリューム上の第1のデータ部を対象とするライト要求があった場合に、前記第1のサイズと前記第2のサイズとに基づいて、前記第1のデータ部を含む第1のページへの実記憶領域の割り当ての有無を判断し、当該割り当てが行われていない場合は前記第1のページに実記憶領域を割り当て、前記第1のデータ部へのアクセスに用いられる制御情報を格納する第1の制御情報部を含む第2のページへの実記憶領域割り当ての有無を判断し、当該割り当てが行われていない場合は前記第2のページに実記憶領域を割り当てるストレージシステムであることを特徴とする。
本発明によれば、制御情報部を参照する必要がない場合、ディスクに対するリード/ライトアクセスの性能を向上させることができる。
ストレージシステムの全体構成を示すブロック構成図である。 ストレージコントローラ内で実行するマイクロプログラムの構成を示す構成図である。 ストレージ装置内の論理構成を示す構成図である。 HDEV番号とLDEV番号との対応関係を管理するための管理テーブルの構成図である。 LDEV番号とボリューム属性及びボリューム容量の対応関係を管理するための管理テーブルの構成図である。 LDEV番号とディスク番号との対応関係を管理するための管理テーブルの構成図である。 LDEV番号とプール番号との対応関係を管理するための管理テーブルの構成図である。 プール番号とディスク番号との対応関係を管理するための管理テーブルの構成図である。 3390形式のLDEV内のデータ配置を説明するための構成図である。 3390形式のLDEV内のデータ配置と実億領域上のデータ配置を説明するための構成図である。 分散ユーザデータ領域と分散制御情報領域のサイズを管理するための管理テーブルの構成図である。 分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブルの構成図である。 第1実施例におけるアドレス変換処理を説明するためのフローチャートである。 3390‐A形式のLDEV内のデータ配置を説明するための構成図である。 シリンダグループ内の構成を説明するための構成図である。 3390形式のLDEV上のアドレスと3390‐A形式のLDEV上のアドレスとの対応関係を説明するための構成図である。 分散ユーザデータ領域と分散制御情報領域のサイズを管理するための管理テーブルの構成図である。 分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブルの構成図である。 3390‐A形式のLDEVの容量拡張処理を示すフローチャートである。 容量拡張後における3390形式のLDEV上のアドレスと3390‐A形式のLDEV上のアドレスとの対応関係を説明するための構成図である。 第2実施例におけるアドレス変換処理を説明するためのフローチャートである。 第3実施例におけるHDEVとLDEVとの関係を説明するための構成図である。 第3実施例における分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブルの構成図である。 第4実施例におけるコピー処理を説明するためのフローチャートである。 ページ管理テーブルの構成図である。 ページ管理ディレクトリの構成図である。 第5実施例におけるMFホストライトコマンド処理を説明するためのフローチャートである。 第6実施例におけるコピーデータ受信処理を説明するためのフローチャートである。
以下、本発明の実施例を説明する。
なお、以下の説明では、「管理テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。また、データ構造に依存しないことを示すために「管理テーブル」を「管理情報」と呼ぶことができる。
また、以後の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ例えば、CPU(Central Processing Unit)によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び通信インタフェース装置(例えば通信ポート)を用いながら行うため、処理の主語がプロセッサとされてもよい。プロセッサは、CPUの他に専用ハードウェアを有していても良い。コンピュータプログラムは、プログラムソースから各計算機にインストールされても良い。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアであっても良い。
また、各要素例えば、LDEV(Logical DEVice)は、番号などで識別可能であるが、識別可能な情報であれば、名前など他種の識別情報が用いられても良い。
以下、図を用いて、本発明の実施例を説明する。以下の図中、同一の部分には同一の符号を付加する。ただし、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。
<ストレージシステムの全体構成>
図1に、ストレージシステムの全体構成を示す。
図1において、ストレージシステムは、例えば、複数のストレージ装置101と、複数のメインフレーム(MF)ホスト計算機102と、管理ホスト計算機103とを備える計算機システムとして構成される。
各ストレージ装置101と各MFホスト計算機102は、例えば、ネットワーク111を介して接続され、複数のストレージ装置のうち一つのストレージ装置(以下、第一のストレージ装置と称することもある。)101と管理ホスト計算機103は、例えば、ネットワーク113を介して接続される。
第1のストレージ装置101は、例えば、ネットワーク111を介して、異なるストレージ装置(以下、第二のストレージ装置と称することもある。)101に接続される。
各MFホスト計算機102は、通信線114を介してネットワーク111に接続される。
各ストレージ装置101は、通信線115を介してネットワーク111に接続される。
管理ホスト計算機103は、通信線116を介してネットワーク113に接続される。
第1のストレージ装置101は、通信線117を介してネットワーク113に接続される。
なお、上述の通信線114〜117は、例えば、メタルケーブルや光ファイバケーブル等の有線として構成される。しかし、各MFホスト計算機102と各ストレージ装置101、第1のストレージ装置101と管理計算機103、各MFホスト計算機102と管理計算機103をそれぞれ無線で接続することも可能である。この場合は、通信線114〜117は省略される。
また、ネットワーク111とネットワーク113は、共通のネットワークであっても良い。各ネットワーク111、113は、通信ネットワークであり、例えば、SAN(Storage Area Network)又はLAN(Local Area Network)である。
次に、各ストレージ装置101の構成を説明する。
各ストレージ装置101は、例えば、一つまたは複数のストレージコントローラ131と、一つまたは複数のディスク132を備える。なお、各ストレージ装置101は同一の構成であるので、以下、第一のストレージ装置101の構成について説明する。
一つまたは複数のディスク132には、データを格納する記憶デバイスとして、少なくとも、SSD(Solid State Drive)、SAS(Serial Attached SCSI)−HDD(Hard Disk Drive)、SATA(Serial Advanced Technology Attachment)−HDDが含まれている。なお、ディスク132は、それらのうちの少なくとも1つに代えて、またはそれらに加えて、他の種類の物理的な記憶デバイスであっても良い。
一つまたは複数のディスク132は、例えば、ファイバチャネルケーブル等の通信線112を介して、ストレージコントローラ131に接続される。なお、複数のディスク132で、一つまたは複数のRAID(Redundant Array of Independent Disks)グループを構成することができる。
次に、ストレージコントローラ131の構成を説明する。
ストレージコントローラ131は、各MFホスト計算機102から受信したコマンドに従って、ディスク132に対するデータの入出力処理、即ち、ディスク132へのデータのライト(書き込み)やリード(読み出し)を制御する。
ストレージコントローラ131は、アクセス要求元である各MFホスト計算機102に対して、実記憶領域が既に割り当てられている状態の論理デバイス、または後述するシン・プロビジョニング機能で用いられる仮想記憶領域で構成される論理デバイスを、アクセス対象の論理デバイスあるいは論理ボリュームとして提供する。
仮想記憶領域からなる論理デバイスは、実記憶領域が既に割り当て済みであってもよいし、割り当て済みでなくともよい。
この際、ストレージコントローラ131は、実記憶領域、または仮想記憶領域を、例えば、シリンダ・ヘッド番号(以下、トラック番号)によって参照したり、識別したりすることができる。
ストレージコントローラ131は、例えば、記憶資源と、通信インタフェース装置(以下、インタフェース装置を「I/F」と略記)と、それらに接続されたCPU122とを有する。
記憶資源は、例えば、主メモリ123、及びキャッシュメモリ124である。
通信I/Fとしては、例えば、ホストI/F121と、管理ホストI/F127と、ディスクI/F125とを備える。これら主メモリ123、キャッシュメモリ124、CPU122、ホストI/F121、管理ホストI/F127、ディスクI/F125は、バス等の通信線からなるネットワーク126を介して相互に接続される。管理ホストI/F127は、例えば、NIC(Network Interface Card)である。
各MFホスト計算機102や管理ホスト計算機103のハードウェア構成は、一般的な計算機と同じである。すなわち、各MFホスト計算機102や管理ホスト計算機103は、通信インタフェース装置と、記憶資源と、それらに接続されたCPUとを有する。通信インタフェース装置としては、例えば、ネットワーク111を介した通信を行うためのホストバスアダプタ(HBA)と、ネットワーク113を介した通信を行うためのNICである。記憶資源は、例えば、メモリや内蔵HDDで構成される。
図2に、ストレージコントローラ131内で実行するマイクロプログラム231の構成を示す。
図2において、主メモリ123には、一つまたは複数のマイクロプログラム231がCPU122によって読み込まれる。このマイクロプログラム231には、コマンド制御部251、RAID制御部252、構成制御部253、アドレス変換部254が含まれる。CPU122が、主メモリ123に読み込まれたマイクロプログラム231内の各制御部251〜254を実行することにより、後述する種々の処理が行われる。
キャッシュメモリ124は、例えば、各MFホスト計算機102から受信したライトデータおよびマイクロプログラム231内のRAID制御部252がディスク132から読み出したデータを一時的に記憶するバッファを構成する。
ホストI/F121は、ネットワーク111を介して、各MFホスト計算機102に接続され、各MFホスト計算機102から、アクセス要求としてアクセスコマンド(ライトコマンド又はリードコマンド)を受信し、受信したアクセスコマンドをコマンド制御部251に転送する。
管理ホストI/F127は、ネットワーク113を介して、管理ホスト計算機103に接続され、管理ホスト計算機103から、例えば、後述するLDEVの容量拡張を行う指示や、LDEV間のデータコピー指示を受信した場合、受信した指示をコマンド制御部251または構成制御部253に転送する。
ディスクI/F125は、各ディスク132と記憶資源(主メモリ123とキャッシュメモリ124)との間のデータ送受信を行う。ディスクI/F125は、通信路112を介して各ディスク132にそれぞれ接続される。
次に、ストレージ装置101の基本的動作を簡単に説明する。
ストレージコントローラ131は、ホストI/F121を介して、いずれかのMFホスト計算機102からライトコマンドを受信した場合、MFホスト計算機102から受信したライトデータをキャッシュメモリ124に記憶する。
ストレージコントローラ131は、キャッシュメモリ124に記憶しているライトデータを、ディスクI/F125を介してディスク132に書き込む。なお、ストレージコントローラ131は、ライトデータをキャッシュメモリ124に記憶した時点で、ライトコマンドの処理が完了した旨をMFホスト計算機102に通知する構成でもよいし、或いは、ライトデータをディスク132に書き込んだ時点で、ライトコマンドの処理が完了した旨をMFホスト計算機102に通知する構成でもよい。
MFホスト計算機102からリードコマンドを受信した場合、ストレージコントローラ131は、そのリードコマンドにパラメータで指定されるデータ(リード対象データ)がキャッシュメモリ124に記憶されているか否かを調べる。
リード対象データがキャッシュメモリ124に記憶されている場合、ストレージコントローラ131は、リード対象データをキャッシュメモリ124から読み出し、読み出したリード対象データを、ホストI/F121を介してMFホスト計算機102に送信する。一方、リード対象データがキャッシュメモリ124に記憶されていない場合は、ストレージコントローラ131は、ディスクI/F125を介して、一つまたは複数のディスク132からリード対象データを読み出し、読み出したリード対象データをキャッシュメモリ124に記憶する。その後、ストレージコントローラ131は、キャッシュメモリ124に記憶されているリード対象データを、ホストI/F121を介してMFホスト計算機102に送信する。
<ストレージ装置内の論理構成>
図3に、ストレージ装置101内の論理構成を示す。
図3において、ストレージ装置101は、各MFホスト計算機102や管理ホスト計算機103から参照される記憶領域を構成するホスト用論理デバイスとして、一つまたは複数のホスト用論理デバイス(以下、HDEVと称することがある。)321を有する。
HDEV321には、ストレージ装置101内で固有のHDEV番号が付けられ、MFホスト計算機102や管理ホスト計算機103は、HDEV番号により、HDEV321を識別する。例えば、各MFホスト計算機102上のOS331は、HDEV321に対してリードアクセスまたはライトアクセスを行う。
HDEV321は、例えば、トラックの集合(トラック1、トラック2、・・・)で構成されており、各トラックに付与されたシリンダ・ヘッド番号(トラック番号)は、各MFホスト計算機102や管理ホスト計算機103が、各トラックを識別するときの参照対象となる。
HDEV321には、一つまたは複数の論理デバイス(以下、LDEVまたはボリュームと称することがある。)322が対応付けられている。
LDEV322には、ストレージ装置101内で固有のLDEV番号が付けられ、マイクロプログラム231は、LDEV番号により、LDEV322を識別する。
LDEV322は、例えば、一つまたは複数のディスク132内の記憶領域として定義される。また、LDEV322は、複数のRAIDグループで構成される記憶領域として定義されていてもよい。
LDEV322は、トラックに対応した複数のデータ部325と複数の制御情報部326から構成される。各データ部325は、トラック(トラック番号)に対応した1または複数のレコード(図示せず)で構成され、各レコードには、MFホスト計算機102がリードまたはライトするデータが格納される。各制御情報部326は、各トラックのデータ部325をアクセスするための制御情報あるいは、各トラックのデータ部325を参照または更新するための制御情報で構成される。
この際、ストレージ装置101内で、全てのトラックサイズは一定の値である。ストレージ装置101内で、全てのデータ部325と全ての制御情報部326のサイズは一定の値である。
各ディスク132には、ストレージ装置101内で固有のディスク番号がつけられ、マイクロプログラム231は、ディスク番号により、各ディスク132を識別する。
また、LDEV322は、後述するシン・プロビジョニング機能で用いられる仮想ボリューム上に保存されていてもよい。
LDEV322のデータが保存される仮想ボリュームは、この仮想ボリュームに対して実記憶領域を提供するプール323と関連付けられる。
プール323には、ストレージ装置101内で固有のプール番号がつけられ、マイクロプログラム231は、プール番号により、プール323を識別する。
プール323は、一つまたは複数のディスク132から構成される。また、プール323は、一つまたは複数のRAIDグループから構成されていてもよい。一つまたは複数のディスク132は、ストレージ装置の内部にあってもよいし、外部にあってもよい。
図4に、HDEV番号とLDEV番号との対応関係を管理するための管理テーブル400の構成を示す。
管理テーブル400は、HDEV番号フィールド401とLDEV番号フィールド402から構成される。HDEV番号は、ストレージ装置101内でHDEV321を一意に識別するための番号であって、HDEV番号フィールド401の各エントリには、HDEV321に対応した番号が格納される。LDEV番号は、ストレージ装置101内でLDEV322を一意に識別するための番号であって、LDEV番号フィールド402の各エントリには、LDEV322に対応した番号が格納される。
図5に、LDEV番号とボリューム属性との対応関係を管理するための管理テーブル500の構成を示す。
管理テーブル500は、LDEV番号フィールド501とボリューム属性フィールド502及びボリューム容量フィールド503から構成される。LDEV番号は、ストレージ装置101内でLDEV322を一意に識別するための番号であって、LDEV番号フィールド501の各エントリには、LDEV322に対応した番号が格納される。ボリューム属性は、LDEV322のボリューム属性が、通常ボリュームまたは仮想ボリュームであることを特定するものであり、ボリューム属性フィールド502の各エントリには、通常ボリュームまたは仮想ボリュームの名称が格納される。
LDEV322のボリューム属性が通常ボリュームであるとき、このLDEV322は、一つまたは複数のディスク132内の実記憶領域で構成されたボリュームであることを示す。
ボリューム容量は、通常ボリュームまたは仮想ボリュームにデータを格納することができる最大容量であり、ボリューム容量フィールド503の各エントリには、通常ボリュームまたは仮想ボリュームの容量が数値で格納される。
図6に、LDEV番号とディスク番号との対応関係を管理するための管理テーブル600の構成を示す。
管理テーブル600は、LDEV322のボリューム属性が通常ボリュームであるときの管理テーブルであって、LDEV番号フィールド601とディスク番号フィールド602から構成される。LDEV番号は、ストレージ装置101内でLDEV322を一意に識別するための番号であって、LDEV番号フィールド601の各エントリには、LDEV322に対応した番号が格納される。ディスク番号は、ストレージ装置101内でディスク132を一意に識別するための番号であって、ディスク番号フィールド602の各エントリには、LDEV322を構成するディスク132の番号が格納される。
図7に、LDEV番号とプール番号との対応関係を管理するための管理テーブル700の構成を示す。
管理テーブル700は、LDEV322のボリューム属性が仮想ボリュームであるときの管理テーブルであって、LDEV番号フィールド701とプール番号フィールド702から構成される。LDEV番号は、ストレージ装置101内でLDEV322を一意に識別するための番号であって、LDEV番号フィールド701の各エントリには、LDEV322に対応した番号が格納される。プール番号は、ストレージ装置101内でプール323を一意に識別するための番号であって、プール番号フィールド702の各エントリには、LDEV322に対応したプール323の番号が格納される。
図8に、プール番号とディスク番号との対応関係を管理するための管理テーブル800の構成を示す。
管理テーブル800は、LDEV322のボリューム属性が仮想ボリュームであるときの管理テーブルであって、プール番号フィールド801とディスク番号フィールド802から構成される。プール番号は、ストレージ装置101内でプール323を一意に識別するための番号であって、プール番号フィールド801の各エントリには、プール323に対応した番号が格納される。ディスク番号は、ストレージ装置101内でディスク132を一意に識別するための番号であって、ディスク番号フィールド602の各エントリには、プール323に実記憶領域が割り当てられるディスク132の番号が格納される。
本実施例は、データ部と制御情報部を異なる領域に格納、ストレージコントローラが、ディスクからデータ部のみを読み書きする場合に、前述した制御情報部の位置をスキップする処理を省き、ディスクのヘッドを直接データ部に位置付けできるようにしたものである。
この際、データ部を配置するユーザデータ領域と、このユーザデータ領域に連なる記憶領域であって、制御情報部を配置する制御情報領域を、それぞれ容量変更の対象となる記憶領域、例えば、容量を拡張または縮小する場合の記憶領域として管理し、記憶領域として、ユーザデータ領域と制御情報領域が並ぶデータ配置(第1データ配置)を採用するボリューム(LDEV)を3390形式のボリュームとして管理する。
<3390形式のLDEV322内のデータ配置>
図9に、HDEV321を構成する3390形式のLDEV322内のデータ配置を示す。
図9において、LDEV322の記憶領域901は、ユーザデータ領域902と制御情報領域903から構成される。ユーザデータ領域902は、複数のデータ部(トラックに対応した1または複数のレコードを含む)325を格納する第1データ領域として構成され、制御情報領域903は、ユーザデータ領域902に連なり、かつユーザデータ領域902に格納された各データ部325をそれぞれアクセスするための制御情報で構成された制御情報部326を格納する第1制御情報領域として構成される。この際、ストレージコントローラ131は、ユーザデータ領域902に連続して制御情報領域903が配置された記憶領域901のデータ配置を第1データ配置とする第1ボリューム形式(以下、3390形式と称することもある。)でLDEV322を管理する。マイクロプログラム231は、各トラック内のデータ部325をトラック番号により識別し、各トラック内の制御情報部326をトラック番号により識別する。
3390形式のLDEV322は、HDEV321内のトラック数が大きくなると、ユーザデータ領域902および制御情報領域903内のトラック数も大きくなる。即ち、3390形式のLDEV322は、容量の拡張に伴ってHDEV321内のトラック数が増加した場合、HDEV321内のトラック数の増加に応じて、ユーザデータ領域902および制御情報領域903内のトラック数も増加する。
3390形式のLDEV322のデータ配置としては、ユーザデータ領域902の手前に、制御情報領域903を配置することもできる。
<3390形式のLDEV322に対するライトコマンドまたはリードコマンド処理の一例>
以下、MFホスト計算機102が、ホストI/F121を介して、ストレージコントローラ131に対して、ライトコマンドを要求した場合の処理を説明する。ライトコマンドのパラメータは、HDEV番号とHDEV321内のライト対象トラックのトラック番号と、ライト対象データである。
ストレージコントローラ131内のコマンド制御部251は、MFホスト計算機102からのライトコマンドを受信した場合、ライトコマンドのパラメータであるHDEV番号を基に管理テーブル400を参照し、HDEV番号に対応したLDEV番号を取得する。
コマンド制御部251は、取得したLDEV番号からLDEV322を特定し、ライト対象トラックのトラック番号を基に、特定したLDEV322上のトラック番号(HDEV321内のライト対象トラックのトラック番号と同一のトラック番号)のデータ部325のアドレスと、特定したLDEV322上のトラック番号(HDEV321内のライト対象トラックのトラック番号と同一のトラック番号)の制御情報部326のアドレスを計算する。
次に、コマンド制御部251は、前述したライトコマンドが、トラック番号の制御情報部326を参照する必要があるかどうかを判定する。トラック番号の制御情報部326を参照する必要がある場合、例えば、MFホスト計算機102が、制御情報部326の参照結果として、ディスクに対するヘッドの位置決め状態に関する情報の返送を求めている場合、RAID制御部252は、LDEV番号を基に管理テーブル600を参照し、制御情報部326のアドレスに基づき、一つまたは複数のディスク132から、トラック番号の制御情報部326を、キャッシュメモリ124に読み込む。コマンド制御部251は、キャッシュメモリ124に読み込まれたトラック番号の制御情報部326を参照する。
コマンド制御部251が、トラック番号の制御情報部326を参照する必要がなければ、前述した制御情報部326のリード処理は省略してもよい。
即ち、データ部325と制御情報部326をそれぞれ異なる領域に格納し、データ部325を格納するトラックのサイズを設定した値とした場合、コマンド制御部251が、制御情報部326の制御情報を参照せずに、ディスク側でディスクのヘッドをデータ部325に直接位置づける。この場合、ディスクのヘッド位置付けにおいて、制御情報部326の領域をスキップする処理が不要となるので、ストレージコントローラ131は、制御情報部326を参照するときよりも、リードアクセスまたはライトアクセス処理を高速化できる。
次に、コマンド制御部251は、ライト対象データを、キャッシュメモリ124に書き込む。
この後、RAID制御部252は、LDEV番号を基に管理テーブル600を参照し、LDEV番号に対応したディスク番号を取得し、LDEV322を構成するディスク132を特定し、データ部325のアドレスに基づき、キャッシュメモリ124上のライト対象データを特定した一つまたは複数のディスク132に書き込む。即ち、3390形式のデータ配置が実記憶領域上のデータ配置と同じである場合、アドレス変換部254によるアドレス変換で得られたアドレスを用いることなく、RAID制御部252は、コマンド制御部251の計算結果によるアドレスを用いることで、キャッシュメモリ124上のライト対象データを、特定した一つまたは複数のディスク132に書き込むことができる。
次に、ストレージコントローラ131は、ホストI/F121を介して、ライトコマンドの処理が完了した旨をMFホスト計算機102に通知する。
以上が、MFホスト計算機102が、ホストI/F121を介して、ストレージコントローラ131に対して、ライトコマンドを要求した場合の処理である。
次に、MFホスト計算機102が、ホストI/F121を介して、ストレージコントローラ131に対して、リードコマンドを要求した場合の処理を説明する。リードコマンドのパラメータは、HDEV番号とHDEV321内のリード対象トラックのトラック番号である。
ストレージコントローラ131内のコマンド制御部251は、MFホスト計算機102からのリードコマンドを受信した場合、リードコマンドのパラメータであるHDEV番号を基に管理テーブル400を参照し、HDEV番号に対応したLDEV番号を取得する。
コマンド制御部251は、取得したLDEV番号でLDEV322を特定し、リード対象トラックのトラック番号(HDEV321内のリード対象トラックのトラック番号と同一のトラック番号)を基に、特定したLDEV322上のトラック番号のデータ部325のアドレスと、リード対象トラックのトラック番号(HDEV321内のリード対象トラックのトラック番号と同一のトラック番号)の制御情報部326のアドレスを計算する。
次に、コマンド制御部251は、前述したリードコマンドが、トラック番号の制御情報部326を参照する必要があるかどうかを判定する。トラック番号の制御情報部326を参照する必要がある場合、RAID制御部252は、LDEV番号を基に管理テーブル600を参照し、制御情報部326のアドレスに基づき、一つまたは複数のディスク132から、トラック番号の制御情報部326を、キャッシュメモリ124に読み込む。コマンド制御部251は、キャッシュメモリ124に読み込まれたトラック番号の制御情報部326を参照する。トラック番号942の制御情報部326を参照する必要がなければ、前述した制御情報部326のリード処理は省略してもよい。
次に、RAID制御部252は、LDEV番号を基に管理テーブル600を参照し、LDEV番号に対応したディスク番号を取得してディスク132を特定し、データ部325のアドレスに基づき、リード対象トラックのトラック番号のデータ部325を、特定した一つまたは複数のディスク132から、キャッシュメモリ124に読み込む。
ストレージコントローラ131は、キャッシュメモリ124にある、リード対象トラックのトラック番号のデータ部325を、ホストI/F121を介して、MFホスト計算機102に送信する。
以上が、MFホスト計算機102が、ホストI/F121を介して、ストレージコントローラ131に対して、リードコマンドを要求した場合の処理である。
前述したリードコマンドに対する処理では、リード対象トラックのトラック番号のデータ部325または制御情報部326が、キャッシュメモリ124に既に存在していた場合、一つまたは複数のディスク132からキャッシュメモリ124に、リード対象トラックのトラック番号のデータ部325または制御情報部326を読み込む処理を省略することができる。
また、リードコマンドに対する処理でも、コマンド制御部251が、制御情報部326の制御情報を参照せずに、ディスクのヘッドを直接データ部325に位置付けることができるので、ストレージコントローラ131は、制御情報部326を参照しない場合は、制御情報部326をスキップする処理が不要であるため、リードアクセスまたはライトアクセス処理を高速化できる。
<3390形式のLDEV322の容量拡張>
図10に、3390形式のLDEV322の容量拡張を実施する際の一例を示す。
3390形式のLDEV322の容量を変更する必要が生じた場合、例えば、図9に示す3390形式のLDEV322の容量を拡張する必要が生じた場合、アクセス要求元が、アクセス対象のボリュームを3390形式のボリュームとして認識できるとともに、コマンド制御部251が、LDEV322を、容量拡張後でも3390形式のLDEV322としてアクセスできるように、ユーザデータ領域に連続して制御情報領域を形成するデータ配置が採用される。
具体的には、容量拡張後における3390形式のLDEV322の記憶領域910は、分散ユーザデータ領域1001、1002と、分散制御情報領域1011、1012から構成される。
即ち、容量拡張前のLDEV322の記憶領域が、分散ユーザデータ領域1001と分散制御情報領域1011で構成され、この記憶領域に、分散ユーザデータ領域1002と分散制御情報領域1012を追加する場合、分散ユーザデータ領域1001に連続して、分散ユーザデータ領域1002を、新たなに確保された記憶領域として配置し、分散ユーザデータ領域1002に連続して分散制御情報領域1011を配置し、分散制御情報領域1011に連続して、新たに確保された記憶領域として分散制御情報領域1012を配置し、記憶領域910全体として、ユーザデータ領域に連続して制御情報領域を形成するデータ配置(3390形式によるデータ配置)としている。
一方、ディスク132上に構築される実記憶領域920は、分散ユーザデータ領域1001、分散制御情報領域1011、分散ユーザデータ領域1002、分散制御情報領域1012の順で構成される。
即ち、容量拡張前の実記憶領域の記憶領域が、分散ユーザデータ領域1001と分散制御情報領域1011で構成され、この記憶領域に、分散ユーザデータ領域1002と分散制御情報領域1012を追加する場合、分散制御情報領域1011に連続して、新たに確保された記憶領域である分散ユーザデータ領域1002を配置し、分散ユーザデータ領域1002に連続して、新たに確保された記憶領域である分散制御情報領域1012を配置するデータ配置としている。
この際、マイクロプログラム231内の構成制御部253は、管理ホストI/F127を介して、管理ホスト計算機103から容量拡張指示を受領した場合、分散制御情報領域1011に連なる実記憶領域として、新たに確保した実記憶領域を形成し、この実記憶領域に、分散ユーザデータ領域1002と、分散制御情報領域1012とを連続して配置する。
各分散ユーザデータ領域1001、1002と分散制御情報領域1011、1012は、図9の記憶領域901に構成されるユーザデータ領域902と制御情報領域903と同一のもので構成することができる。
実記憶領域920上において、分散ユーザデータ領域1001と分散制御情報領域1011という2つの領域からなる実記憶領域のデータ配置は、3390形式のデータ配置となり、分散ユーザデータ領域1002と分散制御情報領域1012という2つの領域からなる実記憶領域のデータ配置は、3390形式のデータ配置となる。即ち、実記憶領域920上において、3390形式のデータ配置が2組構成されたことになる。
分散ユーザデータ領域1002の大きさは、管理ホスト計算機103上の管理画面において指定される拡張容量によって決まり、例えば、前述したトラックサイズの整数倍となる。
分散ユーザデータ領域1001のサイズと分散制御情報領域1011のサイズの比は、分散ユーザデータ領域1002のサイズと分散制御情報領域1012のサイズの比に等しい。
また、記憶領域910に配置された分散ユーザデータ領域1002におけるアドレス1021が示すデータ部325のトラック番号と、実記憶領域920に配置された分散ユーザデータ領域1002におけるアドレス1022が指すデータ部325のトラック番号は等しい。
図10では、容量拡張後の実記憶領域920には、分散ユーザデータ領域1001、分散制御情報領域1011、分散ユーザデータ領域1002、分散制御情報領域1012の順番で、データが配置されることになる(以下、このデータ配置を、実記憶領域上のデータ配置と称することもある)。
コマンド制御部251が参照する記憶領域910のデータ配置と、実記憶領域920のデータ配置が異なる構成の場合、3390形式のデータ配置である記憶領域910におけるトラック番号のデータ部325を指すアドレス(以下、データアドレスと称することもある)1021と、実記憶領域上のデータ配置である実記憶領域920におけるトラック番号のデータ部325を指すアドレス(以下、データアドレスと称することもある)1022は、トラック番号が同一であっても、各分散ユーザデータ領域1002におけるアドレスの値が異なる。このため、マイクロプログラム231内のアドレス変換部254は、例えば、記憶領域910の分散ユーザデータ領域1002におけるトラック番号のデータ部325を指すアドレス1021を、実記憶領域920におけるトラック番号のデータ部325を指すアドレス1022に変換するためのアドレス変換を実行する。
同様に、マイクロプログラム231内のアドレス変換部254は、3390形式のデータ配置上である記憶領域910におけるトラック番号の制御情報部326を指すアドレス(以下、制御情報アドレスと称することもある。)を、実記憶領域上のデータ配置である実記憶領域920におけるトラック番号の制御情報部326を指すアドレス(以下、制御情報アドレスと称することもある。)に変換するためのアドレス変換を行う。
コマンド制御部251は、LDEV322の容量拡張後も、アドレス変換部254のアドレス変換で得られたアドレスを用いることで、実記憶領域上のデータ配置に従うボリュームを、3390形式のボリュームとしてアクセスすることができる。
<3390形式のデータ配置上のアドレス1021と、実記憶領域上のデータ配置におけるアドレス1022のアドレス変換処理>
図11に、分散ユーザデータ領域と分散制御情報領域のサイズを管理するための管理テーブル1100の構成を示す。
図11において、管理テーブル1100は、主メモリ123またはキャッシュメモリ124に格納されるテーブルであって、iフィールド1101と、分散ユーザデータ領域iのサイズフィールド1102と、分散制御情報領域iのサイズフィールド1103から構成される。iフィールド1101の各エントリには、分散ユーザデータ領域と分散制御情報領域を識別するための番号が格納される。分散ユーザデータ領域iサイズフィールド1102の各エントリには、例えば、分散ユーザデータ領域1001、1002のサイズが数値(150、100)で格納される。分散制御情報領域iのサイズフィールド1103の各エントリには、例えば、分散制御情報領域1011、1012のサイズが数値(15、10)で格納される。
分散ユーザデータ領域と分散制御情報領域のサイズに関する情報は、前述した3390形式のボリュームの容量拡張を実施する度に、管理テーブル1100のエントリに追加される。
図11における管理テーブル1100の各エントリにおいて、分散ユーザデータ領域のサイズと、分散制御情報領域のサイズと、は一定ではない。但し、管理テーブル1100の各エントリにおいて、分散ユーザデータ領域のサイズと分散制御情報領域のサイズとの比は一定である。
図12に、分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブル1200を示す。
図12において、管理テーブル1200は、iフィールド1201と、分散ユーザデータ領域iの先頭アドレスフィールド(3390形式)1202と、分散ユーザデータ領域iの先頭アドレスフィールド(実記憶領域上のデータ配置)1203、分散制御情報領域iの先頭アドレスフィールド1204と、分散制御情報領域iの先頭アドレスフィールド(実記憶領域上のデータ配置)1205から構成され、例えば、主メモリ123またはキャッシュメモリ124に格納される。
iフィールド1201の各エントリには、分散ユーザデータ領域と分散制御情報領域を識別するための番号が格納される。分散ユーザデータ領域iの先頭アドレスフィールド1202の各エントリには、例えば、記憶領域910における分散ユーザデータ領域1001、1002の先頭アドレスが、数値(0、150)で格納される。分散ユーザデータ領域iの先頭アドレスフィールド1203の各エントリには、例えば、実記憶領域920における分散ユーザデータ領域1001、1002の先頭アドレスが、数値(0、165)で格納される。
分散制御情報領域iの先頭アドレスフィールド1204の各エントリには、例えば、記憶領域910における分散制御情報領域1011、1012の先頭アドレスが、数値(250、265)で格納される。分散制御情報領域iの先頭アドレスフィールド1205の各エントリには、例えば、実記憶領域920における分散制御情報領域1011、1012の先頭アドレスが、数値(150、165)で格納される。
分散ユーザデータ領域と分散制御情報領域の先頭アドレスに関する情報は、前述した3390形式のボリュームの容量拡張を実施する度に、管理テーブル1200のエントリに追加される。
次に、前述した3390形式のデータ配置上のトラック番号のデータ部325を指すアドレスから、実記憶領域920上のデータ配置のトラック番号のデータ部325を指すアドレスを計算する処理を図13のフローチャートに従って説明する。
マイクロプログラム231内のアドレス変換部254は、まず、iを0とし(S11)、管理テーブル1100、1200を参照して、3390形式上の0番目(i番目)の分散ユーザデータ領域の先頭アドレスとサイズに関する情報を取得し(S12)、次に、例えば、記憶領域910における分散ユーザデータ領域1002におけるアドレス1021が、0番目(i番目)の分散ユーザデータ領域に含まれるか否かを判定し(S13)、このステップS13で否定の判定結果を得たときには、iをインクリメント(例えば、iを1に)し(S14)、ステップS13で肯定の判定結果が得られるまで、ステップS12〜S14の処理を繰り返す。
ステップS13で肯定の判定結果が得られた場合、例えば、記憶領域910における分散ユーザデータ領域1002におけるアドレス1021は、2番目の分散ユーザデータ領域1002に含まれる場合、アドレス変換部254は、管理テーブル1100に格納された各分散ユーザデータ領域と分散制御領域のサイズと、管理テーブル1200に格納された各分散ユーザデータ領域と分散制御情報領域のアドレスと、3390形式のデータ配置上でトラック番号のデータ部325を指すアドレス1021と、を基に、アドレス1021が含まれる分散ユーザデータ領域1002の番号(2)と、分散ユーザデータ領域1002の先頭アドレスからアドレス1021までのオフセットアドレスと、を計算する(S15)。
次に、アドレス変換部254は、分散ユーザデータ領域と分散制御情報領域のアドレスと、分散ユーザデータ領域1002の番号(2)と、を基に、管理テーブル1200を参照して、分散ユーザデータ領域1002の番号(2)が表す分散ユーザデータ領域1002の先頭アドレス(実記憶領域920における分散ユーザデータ領域1002の先頭アドレス)を取得する(S16)。
最後に、アドレス変換部254は、前述した実記憶領域920における分散ユーザデータ領域1002の先頭アドレスと、記憶領域910における先頭アドレスからアドレス1021までのオフセットアドレスと、を基に、実記憶領域920上のトラック番号のデータ部325を指すアドレス1022を計算する(S17)。
上記処理を実行することで、アドレス変換部254は、3390形式のデータ配置上のトラック番号のデータ部325を指すアドレス1021を、実記憶領域920上のデータ配置のトラック番号のデータ部325を指すアドレス1022に変換することができる。
また、アドレス変換部254は、アドレス1021をアドレス1022に変換する処理と同様の処理を実行することで、前述した3390形式のデータ配置上のトラック番号1031の制御情報部326を指すアドレスから、実記憶領域920上のトラック番号の制御情報部326を指すアドレスを計算することができる。
本実施例によれば、トラックの制御情報部326をスキップして、ディスクのヘッドをデータ部325に位置付ける処理のオーバヘッドを減らせるので、ストレージコントローラ131は、トラックの制御情報部326を参照するときよりも、ディスクに対するリードアクセスまたはライトアクセスの性能を向上させることができる。
また、本実施例によれば、3390形式の記憶領域910の容量が拡張された場合でも、3390形式のデータ配置上のトラック番号のデータ部325を指すアドレス1021を、実記憶領域920上のデータ配置のトラック番号のデータ部325を指すアドレス1022に変換することができるとともに、3390形式のデータ配置上のトラック番号の制御情報部326を指すアドレスを、実記憶領域920上のトラック番号の制御情報部326を指すアドレスに変換することができる。
このため、コマンド制御部251は、3390形式のデータ配置である、LDEV322の容量拡張後も、アドレス変換部254のアドレス変換で得られたアドレスを用いることで、実記憶領域上のデータ配置に従うボリュームを、3390形式のボリュームとしてアクセスすることができる。
本実施例は、一つの分散ユーザデータ領域(第2データ領域)と一つの分散制御情報領域を一つのシリンダグループ(CG)として、シリンダグループを複数グループ有し、各シリンダグループを容量拡張単位の記憶領域として管理し、記憶領域として、複数のシリンダグループが並ぶデータ配置(第2データ配置)を採用するボリュームを第2ボリューム形式(以下、3390−A形式と称することもある。)のボリューム(LDEV322)として管理し、3390形式のボリュームに関するアドレスを3390−A形式のボリュームに関するアドレスに変換するものである。
<3390‐A形式のLDEV322内のデータ配置>
図14に、3390‐A形式のLDEV322内のデータ配置を示す。
図14において、LDEV322の実記憶領域930は、分散ユーザデータ領域1401と、分散ユーザデータ領域1401に連なる分散制御情報領域1411を含むシリンダグループ(CG)1421と、分散ユーザデータ領域1402と、分散ユーザデータ領域1402に連なる分散制御情報領域1412を含むシリンダグループ(CG)1422から構成される。各分散ユーザデータ領域1401、1402は、それぞれ同一のサイズで構成され、各分散制御情報領域1411、1412もそれぞれ同一のサイズで構成される。即ち、各シリンダグループ(CG)1411、1422はそれぞれ同一のサイズで構成され、シリンダグループの容量が、容量拡張の単位になっている。
この際、ストレージコントローラ131は、例えば、シリンダグループ(CG)1421を構成する記憶領域であって、分散ユーザデータ領域(第2データ領域)1401に連続して分散制御情報領域(第2制御情報領域)1411が配置された実記憶領域930のデータ配置を第2データ配置とする第2ボリューム形式(以下、3390−A形式と称することもある。)でLDEV322を管理する。
3390‐A形式のLDEV322を構成する一つまたは複数のCG1421は、CG番号によって参照されてもよい。また、当該LDEV322を構成する一つまたは複数の分散ユーザデータ領域1401は、後述する分散ユーザデータ領域の番号によって参照されてもよい。また、当該LDEV322を構成する一つまたは複数の分散制御情報領域1411は、後述する分散制御情報領域の番号によって参照されてもよい。
図15に、シリンダグループ1421内の構成を示す。
シリンダグループ(CG)1421は、分散ユーザデータ領域1401と分散制御情報領域1411から構成される。分散ユーザデータ領域1401は、複数(D個)のデータ部(トラック1〜Dに対応した1または複数のレコードを含む)325を格納する第2データ領域として構成される。
分散制御情報領域1411は、分散ユーザデータ領域1401に連なり、かつ分散ユーザデータ領域1401に格納された各データ部325をそれぞれアクセスするための制御情報で構成された複数(D個)の制御情報部326と、各データ部325の各トラックにレコードが存在するか否かを示すレコード有無情報で構成された複数(D個)のレコード有無情報部327と、LDEV322をストレージコントローラ131が管理するためのストレージ機能管理情報328と、ストレージコントローラ131がシリンダグループを拡張するためのモードか否かを判定するための拡張モード判定情報329を格納する第2制御情報領域として構成される。
この際、マイクロプログラム231は、各トラック内のデータ部325をトラック番号により識別し、各トラック内の制御情報部326をトラック番号により識別する。
各制御情報部326と各レコード有無情報部327は、例えば、ビットマップで構成することもできる。レコードは、各トラックのデータ部325に一つまたは複数保存される。このレコードは、例えば、MFホスト計算機102からのライトデータなどである。
また、各シリンダグループ1421、1422において、分散ユーザデータ領域1401、1402内のトラックのデータ部325の数(D個)と、分散制御情報領域1411、1412内のトラックの制御情報部326の数(D個)及び分散制御情報領域1411、1412内のトラックのレコード有無情報部327の数(D個)は等しい。
図16に、3390形式のLDEV322上のアドレスと3390‐A形式のLDEV322上のアドレスの対応を示す。
図16において、3390形式のLDEV322の記憶領域910は、分散ユーザデータ領域1401、1402、1403と、分散制御情報領域1411、1412、1413から構成され、3390−A形式のLDEVの実記憶領域930は、分散ユーザデータ領域1401と分散制御情報領域1411を含むシリンダグループ1421と、分散ユーザデータ領域1402と分散制御情報領域1412を含むシリンダグループ1422と、分散ユーザデータ領域1403と分散制御情報領域1413を含むシリンダグループ1423から構成される。
3390形式のボリュームのデータ配置は、分散ユーザデータ領域1401、分散ユーザデータ領域1402、分散ユーザデータ領域1403、分散制御情報領域1411、分散制御情報領域1412、分散制御情報領域1413の順番であり、3390‐A形式のボリュームのデータ配置は、シリンダグループ1421、シリンダグループ1422、シリンダグループ1423の順番である。
3390形式のボリュームのデータ配置と3390‐A形式のボリュームのデータ配置が異なる構成を採用すると、3390形式のデータ配置である記憶領域910におけるトラック番号のデータ部325を指すアドレスと、3390−A形式のデータ配置である実記憶領域930におけるトラック番号のデータ部325を指すアドレスは、トラック番号が同一であっても、各分散ユーザデータ領域や各分散制御情報領域におけるアドレスの値が異なる。このため、マイクロプログラム231内のアドレス変換部254は、例えば、記憶領域910の分散ユーザデータ領域1403におけるトラック番号のデータ部325を指すアドレス1031を、実記憶領域930におけるトラック番号のデータ部325を指すアドレス1032に変換するためのアドレス変換を実行する。
同様に、マイクロプログラム231内のアドレス変換部254は、3390形式のデータ配置上である記憶領域910におけるトラック番号の制御情報部326を指すアドレスを、3390−A形式のデータ配置である実記憶領域930におけるトラック番号の制御情報部326を指すアドレスに変換するためのアドレス変換を行う。
コマンド制御部251は、アドレス変換部254のアドレス変換により得られたアドレスを用いることで、実記憶領域上は3390‐A形式のデータ配置に従うLDEV322を、3390形式のLDEV322としてアクセスすることができる。即ち、コマンド制御部251は、3390形式のデータ配置のLDEV322にアクセスしても、3390形式のデータ配置のLDEV322にアドレスが、アドレス変換部254のアドレス変換によって、3390‐A形式のデータ配置に従うLDEV322のアドレスが変換されるので、結果として、実記憶領域上のデータ部325をアクセスすることができる。
<3390‐A形式のLDEV322の容量拡張>
図17に、分散ユーザデータ領域と分散制御情報領域のサイズを管理するための管理テーブル1700の構成を示す。
図17において、管理テーブル1700は、3390‐A形式のLDEV322を管理するためのテーブルとして、分散ユーザデータ領域長フィールド1701と、分散制御情報領域長フィールド1702から構成され、例えば、主メモリ123またはキャッシュメモリ124に格納される。分散ユーザデータ領域長フィールド1701のエントリには、各分散ユーザデータ領域共通の長さを示す情報が数値で格納される。分散制御情報領域長フィールド1702のエントリには、各分散制御情報領域共通の長さを示す情報が数値で格納される。
図18に、分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブル1800の構成を示す。
図18において、管理テーブル1800は、iフィールド1801と、分散ユーザデータ領域iの先頭アドレスフィールド(3390形式)1802と、分散ユーザデータ領域iの先頭アドレスフィールド(3390−A形式のデータ配置)1803、分散制御情報領域iの先頭アドレスフィールド(3390形式)1804と、分散制御情報領域iの先頭アドレスフィールド(3390−A形式のデータ配置)1805から構成され、例えば、主メモリ123またはキャッシュメモリ124に格納される。
iフィールド1201の各エントリには、分散ユーザデータ領域と分散制御情報領域を識別するための番号が格納される。分散ユーザデータ領域iの先頭アドレスフィールド1802の各エントリには、例えば、記憶領域910における分散ユーザデータ領域1401、1402の先頭アドレスが数値(0、100)で格納される。分散ユーザデータ領域iの先頭アドレスフィールド1803の各エントリには、例えば、実記憶領域930における分散ユーザデータ領域1401、1402の先頭アドレスが数値(0、150)で格納される。
分散制御情報領域iの先頭アドレスフィールド1804の各エントリには、例えば、記憶領域910における分散制御情報領域1411、1412の先頭アドレスが数値(500、550)で格納される。分散制御情報領域iの先頭アドレスフィールド1805の各エントリには、例えば、実記憶領域930における分散制御情報領域1411、1412の先頭アドレスが数値(100、250)で格納される。
各分散ユーザデータ領域と各分散制御情報領域の先頭アドレスに関する情報は、3390形式のボリュームの容量拡張を実施する度に、管理テーブル1800のエントリに追加される。
次に、3390‐A形式のLDEV322の容量拡張処理を図19のフローチャートに従って説明する。
管理ホスト計算機103が、管理ホストI/F127を介して、構成制御部253にLDEV322の容量拡張指示を行うと、構成制御部253は、管理テーブル1700を参照し、分散ユーザデータ領域のサイズ(100)と分散制御情報領域のサイズ(50)を取得する(S21)。
次に、構成制御部253は、管理ホスト103において指定された拡張容量が、取得した分散ユーザデータ領域のサイズ(100)の整数倍であるかどうかをチェックする(S22)。
この管理画面で指定される拡張容量が、分散ユーザデータ領域のサイズ(100)の整数倍でない場合、構成制御部253は、このLDEV322の容量拡張は失敗したことを、管理ホストI/F127を介して、管理ホスト計算機103に通知して、容量拡張処理を終了する。
一方、拡張容量が、分散ユーザデータ領域のサイズ(100)の整数倍である場合、構成制御部253は、拡張容量を分散ユーザデータ領域のサイズ(100)で割った商を、拡張シリンダグループ数として、主メモリ123に保存する。
次に、構成制御部253は、前述した拡張シリンダグループ数の数だけ、シリンダグループ(CG)を保存できる記憶領域(以下、拡張CG領域と称することもある。)を確保する(S23)。この場合、容量拡張において、確保する拡張CG領域のサイズは、拡張前領域の容量単位であるCGのサイズの整数倍である。
この後、構成制御部253は、拡張する容量分のCG領域確保に成功したか否かを判定し(S24)、拡張CG領域の確保に失敗した場合、管理ホストI/F127を介して、LDEV322の容量拡張に失敗したことを管理ホスト計算機103に通知して、容量拡張処理を終了する。
拡張CG領域の確保に成功した場合、構成制御部253は、ボリューム管理情報内のボリューム容量に変更後のサイズを設定し(S25)、ホストI/F121を介して、MFホスト計算機102に対して容量変更が行われたことを通知するとともに、容量拡張が成功したことを通知し、このルーチンでの処理を終了する。
なお、拡張CG領域上に存在する、一つまたは複数の分散制御情報領域は予め初期化していてもいいし、していなくても良い。
また、容量拡張指示は、前述したMFホスト計算機102およびストレージ装置101からなるストレージシステムがオンライン中に行ってもよい。
図20に、容量拡張後における3390形式のLDEV322上のアドレスと3390‐A形式のLDEV322上のアドレスの対応を示す。
マイクロプログラム231内の構成制御部253が、管理ホストI/F127を介して、管理ホスト計算機103から容量拡張指示を受領すると、構成制御部253は、3390形式のLDEV322上のデータ配置として、分散ユーザデータ領域1403の後に、分散ユーザデータ領域1404、1405を配置し、3390−A形式のLDEV322上のデータ配置として、シリンダグループ1423の後ろに、新たに確保した実記憶領域として、拡張シリンダグループ1424、1415を配置する。
図20において、3390形式のLDEV322の記憶領域910は、分散ユーザデータ領域1401、1402、1403、1404、1405と、分散制御情報領域1411、1412、1413、1414、1415から構成され、3390−A形式のLDEVの実記憶領域930は、分散ユーザデータ領域1401と分散制御情報領域1411を含むシリンダグループ1421と、分散ユーザデータ領域1402と分散制御情報領域1412を含むシリンダグループ1422と、分散ユーザデータ領域1403と分散制御情報領域1413を含むシリンダグループ1423と、分散ユーザデータ領域1404と分散制御情報領域1414を含む拡張シリンダグループ1424と、分散ユーザデータ領域1405と分散制御情報領域1415を含む拡張シリンダグループ1425から構成される。
3390形式のボリュームのデータ配置は、分散ユーザデータ領域1401、分散ユーザデータ領域1402、分散ユーザデータ領域1403、分散ユーザデータ領域1404、分散ユーザデータ領域1405、分散制御情報領域1411、分散制御情報領域1412、分散制御情報領域1413、分散制御情報領域1414、分散制御情報領域1415の順番であり、実記憶領域となる3390‐A形式のボリュームのデータ配置は、シリンダグループ(CG)1421、シリンダグループ1422、シリンダグループ1423、拡張シリンダグループ1424、拡張シリンダグループ1425の順番である。
3390形式のボリュームのデータ配置と3390‐A形式のボリュームのデータ配置が異なる構成を採用すると、3390形式のデータ配置である記憶領域910におけるトラック番号のデータ部325を指すアドレスと、3390−A形式のデータ配置である実記憶領域930におけるトラック番号のデータ部325を指すアドレスは、トラック番号が同一であっても、各分散ユーザデータ領域や各分散制御情報領域におけるアドレスの値が異なる。このため、マイクロプログラム231内のアドレス変換部254は、例えば、記憶領域910の分散ユーザデータ領域1405におけるトラック番号のデータ部325を指すアドレス1051を、実記憶領域930におけるトラック番号のデータ部325を指すアドレス1052に変換するためのアドレス変換を実行する。
同様に、マイクロプログラム231内のアドレス変換部254は、3390形式のデータ配置上である記憶領域910におけるトラック番号の制御情報部326を指すアドレスを、3390−A形式のデータ配置である実記憶領域930におけるトラック番号の制御情報部326を指すアドレスに変換するためのアドレス変換を行う。
コマンド制御部251は、3390‐A形式のLDEV322の容量拡張後も、アドレス変換部254のアドレス変換により得られたアドレスを用いることで、実記憶領域上は3390‐A形式のデータ配置に従うLDEV322を、3390形式のLDEV322としてアクセスすることができる。
次に、3390形式のボリューム上のトラック番号のデータ部を指すアドレス1051から、3390‐A形式のボリューム上のトラック番号のデータ部を指すアドレス1052を計算する処理を図21のフローチャートに従って説明する。
マイクロプログラム231内のアドレス変換部254は、アドレス変換処理の開始とともに、3390形式のデータ配置上でトラック番号のデータ部325を指すアドレス1051を基に、管理テーブル1700と管理テーブル1800を参照し、アドレス1051が含まれる、3390形式の分散ユーザデータ領域1405の番号(5)と、3390形式の分散ユーザデータ領域1405の先頭アドレス(400)からアドレス1051までのオフセットアドレスと、を計算する(S31)。
次に、アドレス変換部254は、アドレス1051が含まれる、3390形式の分散ユーザデータ領域1405の番号(5)と、3390形式の分散ユーザデータ領域1405の先頭アドレス(400)からアドレス1051までのオフセットアドレスと、を基に、管理テーブル1800を参照して、分散ユーザデータ領域1405の番号(5)が表す、3390−A形式の分散ユーザデータ領域1405の先頭アドレス(600)を取得する(S32)。
最後に、アドレス変換部254は、取得した3390−A形式上の分散ユーザデータ領域1405の先頭アドレス(600)と、3390形式の分散ユーザデータ領域1405の先頭アドレス(400)からアドレス1051までのオフセットアドレスと、を基に、3390‐A形式上のトラック番号のデータ部325を指すアドレス1052を計算し(S33)、このルーチンでの処理を終了する。
同様に、アドレス変換部254は、前述した3390形式のデータ配置上のトラック番号の制御情報部326を指すアドレスから、3390‐A形式上のトラック番号の制御情報部326を指すアドレスを計算することもできる。
<3390‐A形式のLDEV322に対するリードコマンド処理の一例>
次に、ストレージコントローラ131が、ホストI/F121を介して、MFホスト計算機102からリードコマンドを受信した場合の処理を説明する。
マイクロプログラム231内のコマンド制御部251は、前述した3390形式のLDEV322内のリード対象トラックのトラック番号のデータ部325のアドレスを計算し、計算結果をアドレス変換部254に通知する。
次に、アドレス変換部254は、計算で得られたアドレスを基に実記憶領域上のトラックのデータ部325のアドレスと制御情報部326のアドレスを計算し、これらの値をコマンド制御部251に通知する。この際、LDEV322の実記憶領域上のデータ配置は3390‐A形式に従って構成されるものとする。
コマンド制御部251が受信したアドレスが指すトラック番号のデータ部325と、コマンド制御部251が受信したアドレスが指すトラック番号の制御情報部326がキャッシュメモリ124に記憶されていない場合、コマンド制御部251は、RAID制御部252にデータの読み出しを指示する。RAID制御部252は、ディスクI/F125を介して、一つまたは複数のディスク132から、各アドレスに対応するデータを読み出し、それぞれ読み出したデータをキャッシュメモリ124に記憶する。
コマンド制御部251が受信したアドレスが指すトラック番号のデータ部325と、コマンド制御部251が受信したアドレスが指すトラック番号の制御情報部326がキャッシュメモリ124に記憶されている場合、コマンド制御部251は、アドレスが指すトラックのデータ部325をキャッシュメモリ124から読み出し、アドレスが指すトラックの制御情報の値を確認した後に、キャッシュメモリ124から読み出したデータ部325をホストI/F121を介して、MFホスト計算機102に送信する。
前述したリードコマンド処理のアドレス変換に関わる処理は、ライトコマンド処理においても同様に実行することができる。
本実施例によれば、コマンド制御部251は、3390‐A形式のLDEV322の容量拡張後も、アドレス変換部254のアドレス変換により得られたアドレスを用いることで、実記憶領域上は3390‐A形式のデータ配置に従うLDEV322を、3390形式のLDEV322としてアクセスすることができる。
本実施例は、実記憶領域上のボリュームであって、3390−A形式のボリュームを複数ボリューム用意し、一方のボリュームに分散ユーザデータ領域を配置し、他方のボリュームに分散制御情報領域を配置して、実記憶領域上のボリュームを管理するものである。
<ユーザデータ領域と制御情報領域を異なるボリュームに保存して管理する方式>
図22に、シリンダグループ1421内の分散ユーザデータ領域1401と分散制御情報領域1411を違うボリュームに保存して管理する一例を示す。
図22において、HDEV2201は、HDEV321と同一の構成であり、このHDEV2201には、複数(m個)のトラックが配置され、2つのLDEV2202、2203が対応付けられている。LDEV2202は、複数(n個)の分散ユーザデータ領域1401、・・・を格納するボリュームとして構成され、LDEV2203は、複数(n個)の分散制御情報領域1411、・・・を格納するボリュームとして構成される。
この際、シリンダグループ1421を分散ユーザデータ領域1401と分散制御情報領域1411で構成した場合、分散ユーザデータ領域1401がLDEV2202に配置され、分散制御情報領域1411が、LDEV2202とは異なるLDEV2203に配置される。このため、LDEV2202を大容量のもので構成し、LDEV2203を小容量のもので構成しても、ボリュームの容量拡張に対応することができる。
また、例えば、LDEV2202に保存した分散ユーザデータ領域1401と、LDEV2203に保存した分散ユーザデータ領域1401に対応する分散制御情報領域1411を組み合わせて、一つのシリンダグループと見なしてもよい。さらに、LDEV2202の各分散ユーザデータ領域と、各分散ユーザデータ領域に対応するLDEV2203の制御情報領域を組み合わせた一つまたは複数のシリンダグループを纏めて、3390‐A形式のLDEVと見なしてもよい。
図23に、分散ユーザデータ領域と分散制御情報領域のアドレスを管理するための管理テーブル2300の構成を示す。
図23において、管理テーブル2300は、分散ユーザデータ領域番号フィールド2301と、LDEV内のアドレスフィールド2302と、分散制御情報領域番号フィールド2303と、LDEV内のアドレスフィールド2304から構成される。
分散ユーザデータ領域番号フィールド2301の各エントリには、LDEV2202内に配置される分散ユーザデータ領域の番号が格納され、LDEV内のアドレスフィールド2302の各エントリには、LDEV2202内に配置される分散ユーザデータ領域のアドレスが格納される。分散制御情報領域番号フィールド2303の各エントリには、LDEV2203内に配置される分散制御情報領域の番号が格納され、LDEV内のアドレスフィールド2304の各エントリには、LDEV2203内に配置される分散制御情報領域のアドレスが格納される。
次に、MFホスト計算機102が、前述したHDEV2201に対してリードアクセスを行う場合の処理を説明する。
MFホスト計算機102によるリードアクセスのパラメータは、例えば、HDEV番号とトラック番号である。
MFホスト計算機102が、リードコマンドをストレージコントローラ131に送信すると、マイクロプログラム231内のコマンド制御部251は、MFホスト計算機102からのリードコマンドのパラメータに従ってHDEV2201を参照する。この後、マイクロプログラム231内のコマンド制御部251は、前述したHDEV番号とトラック番号を基に、LDEV番号と、3390形式のLDEV上におけるトラック内のデータ部325のアドレスと、制御情報部326のアドレスと、を計算し、アドレス変換部254に通知する。
アドレス変換部254は、管理テーブル1700と管理テーブル1800を参照して、分散ユーザデータ領域と分散制御情報領域のサイズと、3390形式の分散ユーザデータ領域と分散制御情報領域の先頭アドレスを取得し、取得した情報と、トラック内のデータ部325のアドレスと、制御情報部326のアドレスと、に基づき、3390‐A形式のLDEV内のLDEV番号と、トラック番号と、を計算し、コマンド制御部251に通知する。
コマンド制御部251は、ホストI/F121を介して、MFホスト計算機102からリードアクセスを受領すると、受信したトラック番号から3390‐A形式のLDEV内の分散ユーザデータ領域の番号と、分散ユーザデータ領域の先頭アドレスからトラック番号のデータ部325までのオフセットアドレスと、3390‐A形式のLDEV内の分散制御情報領域の番号と、分散制御情報領域の先頭アドレスからトラック番号の制御情報部326までのオフセットアドレスと、を計算する。
コマンド制御部251は、管理テーブル2300を参照して、分散ユーザデータ領域のアドレスを取得し、取得したアドレスと、分散ユーザデータ領域の番号と、オフセットアドレスと、に基づき、LDEV2202における分散ユーザデータ領域内のトラック番号のデータ部325を指すアドレスを取得する。
また、コマンド制御部251は、管理テーブル2300を参照して、分散制御情報領域のアドレスを取得し、取得したアドレスと、分散制御情報領域の番号と、オフセットアドレスと、に基づき、LDEV2203における分散制御情報領域内のトラック番号の制御情報部326を指すアドレスを取得する。
次に、コマンド制御部251は、取得したアドレスに基づき、分散ユーザデータ領域内のリード対象トラックのデータ部325に対してアクセスを行う。
また、コマンド制御部251は、取得したアドレスに基づき、分散制御情報領域内のリード対象トラックの制御情報部326を参照し、または更新してもよい。なお、リード対象トラックの制御情報部326を参照する必要がない場合には、コマンド制御部251は、リード対象トラックの制御情報部326を参照する処理を省略することができる。
コマンド制御部251は、リード対象トラック内のデータ部325をホストI/F121を介して、MFホスト計算機102に送信する。
以上が、分散ユーザデータ領域と分散制御情報領域を異なるボリュームに保存して管理した場合の、リードアクセスの一例である。
なお、MFホスト計算機102からのアクセスの種類がライトアクセスであった場合も、前述したトラックに対するアクセスの処理は同様に実行することができる。
本実施例によれば、実記憶領域上のボリュームであって、3390−A形式のボリュームを複数ボリューム用意し、一方のボリュームにユーザデータ領域を配置し、他方のボリュームに制御情報領域を配置して、実記憶領域上のボリュームを管理するようにしたため、分散制御情報領域を配置するボリューム(LDEV2203)を小容量のもので構成し、分散ユーザデータ領域を配置するボリューム(LDEV2202)を大容量のもので構成することができる。この場合、LDEV2203を小容量のもので構成しても、LDEV2202を大容量のもので構成することで、ボリュームの容量拡張に対応することができる。
本実施例は、3390形式のLDEV322から3390‐A形式のLDEV322へのデータコピーを行うものである。
<3390形式のLDEV322から3390‐A形式のLDEV322へのデータコピー処理>
次に、3390形式のLDEV322から、3390‐A形式のLDEV322への、トラックのデータ部をコピーする処理を図24のフローチャートに従って説明する。
まず、コピー元の3390形式のLDEV322は、アドレス(s)によって参照され、コピー先は、3390−A形式のLDEV322であって、3390−A形式のLDEV322は、一つまたは複数のシリンダグループ1421から構成されることを前提する。この際、3390‐A形式のLDEV内のトラックのデータ部325は、例えば、分散ユーザデータ領域の番号(n)と、n番目の分散ユーザデータ領域の先頭アドレスからのオフセットアドレス(d)によってアクセスされる。
管理ホスト計算機103から、管理ホストI/F127を介してコピー開始指示をコマンド制御部251が受領すると、マイクロプログラム231内のコマンド制御部251は、コピー処理を開始する。
コマンド制御部251は、コピー元のLDEV322の先頭アドレスを、コピー元アドレス(s)に設定し、コピー元アドレス(s)を0にする(S41)。
次に、コマンド制御部251は、コピー元アドレス(s)がコピー元LDEV322の終端アドレスか否かを判定し(S42)、コピー元アドレス(s)がコピー元LDEV322の終端アドレスを指していた場合、コピー処理が完了したことを、管理ホストI/F127を介して、管理ホスト計算機103に通知して、コピー処理を終了する。
一方、コマンド制御部251は、コピー元アドレス(s)がコピー元LDEV322の終端アドレスを指していないと判定した場合、アドレス変換部254に、コピー元アドレス(s)を通知する。
次に、アドレス変換部254は、管理テーブル1700を参照して、分散ユーザデータ領域のサイズを取得し、管理テーブル1800を参照して、分散ユーザデータ領域と分散制御情報領域の先頭アドレスを取得し、取得したサイズ及び先頭アドレス、コピー元アドレス(s)と、を基に、分散ユーザデータ領域の番号(n)と、コピー先の分散ユーザデータ領域(n)の先頭アドレスからのオフセットアドレス(d)の値を計算し、計算結果をコマンド制御部251に通知する(S43)。
コマンド制御部251は、分散ユーザデータ領域(n)が、コピー先LDEVの終端分散ユーザデータ領域であるか否かを判定し(S44)、分散ユーザデータ領域(n)が、コピー先LDEVの終端分散ユーザデータ領域である場合、コピー元LDEVの容量が、コピー先LDEV322の容量より大きいため、コピーに失敗したことを、管理ホストI/F127を介して、管理ホスト計算機103に通知し、コピー処理を終了する。
一方、コマンド制御部251は、分散ユーザデータ領域(n)が、コピー先LDEVの終端分散ユーザデータ領域でないと判定した場合、コピー先の分散ユーザデータ領域(n)内の先頭アドレスからのオフセットアドレス(d)の指す記憶領域に、コピー元アドレス(s)の指す記憶領域からデータ(データ部325)をコピーする(S45)。
この後、コマンド制御部251は、コピー元アドレス(s)をインクリメントし(s=s+1)、ステップS32の処理に戻る(S46)。この後、ステップS32で肯定の判定結果が得られるまで、ステップS32〜S36の処理が繰り返えされる。
ステップS41〜S46の処理を実行することで、例えば、3390形式の記憶領域910における分散ユーザデータ領域1401内のデータ部325を、3390−A形式の実記憶領域930における分散ユーザデータ領域1401内にコピーすることができる。
また、3390形式のLDEV322から3390‐A形式のLDEV322への、トラックの制御情報部326をコピーする処理も同様に実行することができる。この場合、例えば、3390形式の記憶領域910における分散制御情報領域1411内の制御情報部326を、3390−A形式の実記憶領域930における分散制御情報領域1411内にコピーすることができる。
コピーするデータ量は、コピー元LDEV322内の全部のデータ、または一部のデータのどちらであってもよい。
前述した3390形式のLDEV322から3390‐A形式のLDEV322へのデータコピー処理では、分散ユーザデータ領域のコピーを終了した後、分散制御情報領域のコピーを行うか、その逆の順番で行ってもよい。また、一部の分散ユーザデータ領域のコピー終了後、一部の分散制御情報領域をコピーすることを交互に行っても良い。
また、3390−A形式のLDEV322から、3390形式のLDEV322へのデータコピーを行う処理も、3390−A形式のLDEV322のアドレスを3390形式のLDEV322のアドレスに変更する処理を行うことで、同様に実行することができる。
本実施例によれば、3390形式のLDEV322から3390‐A形式のLDEV322へのデータコピーを行うことで、3390形式のLDEV322に属するデータ部325と制御情報部326から、実記憶領域上のデータ部325と制御情報部326を構築することができる。
本実施例は、LDEV322を、仮想記憶領域を有する仮想ボリュームとして管理し、仮想ボリュームに対してアクセスがある場合、仮想ボリュームに、プールから実記憶領域を割り当てるようにしたものである。
<仮想ボリュームへの実記憶領域割り当てに関わる処理>
仮想ボリュームへの実記憶領域割り当てに関わる処理として、前述したアドレス変換処理と、後述のページ割り当て処理とがある。ページ割り当て処理では、後述するページ管理テーブルとページ管理ディレクトリを基に、仮想ボリュームに対するホストライトを契機とした仮想記憶領域への実記憶領域の割り当てが行われる。以下、仮想ボリュームへの実記憶領域割り当てに関わる処理を行う機能を、シン・プロビジョニング機能と呼ぶ。
図25に、ページ割り当て処理で用いるページ管理テーブル25000の構成を示す。
図25において、ページ管理テーブル25000は、仮想ボリュームへの実記憶領域割り当て処理を実行するときに用いるテーブルであって、ページ番号フィールド2501と、LDEV内のページ先頭アドレスフィールド2502と、ディスク番号フィールド2503と、ディスク内のページ先頭アドレスフィールド2504と、割り当て済み判定情報フィールド2505から構成され、LDEV322毎に存在し、例えば、主メモリ123またはキャッシュメモリ124に格納される。
ページ番号フィールド2501の各エントリには、LDEV322内に割り当てられるページのページ番号が格納される。LDEV内のページ先頭アドレスフィールド2502の各エントリには、LDEV322内に割り当てられるページの先頭アドレスが格納される。ディスク番号フィールド2503の各エントリには、LDEV322を構成するディスク132の番号が格納される。
ディスク内のページ先頭アドレスは、ディスク内の実記憶領域の先頭アドレスであって、ディスク内のページ先頭アドレスフィールド2504の各エントリには、LDEV322を構成するディスク132の先頭アドレスが格納される。割り当て済み判定情報フィールド2505の各エントリには、LDEV322にページが割り当てられている場合には、「割り当て済み」の情報が格納され、LDEV322にページが割り当てられていない場合には、「未割り当て」の情報が格納される。即ち、この割り当て済み判定情報は、ページを単位として、仮想記憶領域への実記憶領域の割り当て状態を管理するために用いられる。
ページは、プール323に格納される、一定のサイズの記憶領域であり、LDEV322の記憶領域を分割管理するための単位である。また、ページは、例えば、一つまたは複数のトラックの集まりである。トラックは、ストレージ装置101内において、一定サイズで、例えば、59392バイトで構成することができる。
図26に、ページ割り当て処理で用いるページ管理ディレクトリ2600の構成を示す。
図26において、ページ管理ディレクトリ2600は、LDEV322とページ管理テーブル25000との対応関係を管理するためのテーブルであって、LDEV番号フィールド2601と、ページ管理テーブルのアドレスフィールド2602から構成され、例えば、主メモリ123またはキャッシュメモリ124あるいはディスク132上に保存される。
LDEV番号フィールド2601の各エントリには、LDEV322の番号が格納される。ページ管理テーブルのアドレスフィールド2602の各エントリには、LDEV322のページを管理するためのページ管理テーブル25000のアドレスが格納される。
次に、コマンド制御部251が、MFホスト計算機102からのライトアクセスを受領した際の処理の一例を説明する。ライトアクセス時のパラメータは、例えば、LDEV番号とLDEV内のトラック番号である。
コマンド制御部251は、MFホスト計算機102からライトアクセスのパラメータを受信した場合、LDEV322のトラック番号とトラックサイズを基に、LDEV322内のアドレスを計算する。
この後、コマンド制御部251は、ページ管理ディレクトリ2600を参照して、LDEV番号に対応するページ管理テーブル25000のアドレスを取得する。
次に、コマンド制御部251は、取得したアドレスに対応したページ管理テーブル25000を参照して、ライトアクセス先のアドレスが示すトラックを含むページを検索し、この検索で得られたページ番号と、ページ先頭アドレスからライトアクセス先トラックまでのオフセットアドレスを取得する。
この後、コマンド制御部251は、取得したページ番号のページエントリ内の割り当て済み判定情報を参照し、割り当て済み判定情報が割り当て済み状態を示す場合は、このページエントリに対応したディスク内のページ先頭アドレスで特定された、ライトアクセス先トラック番号のデータ部325に対してライトアクセスを行う。
割り当て済み判定情報が未割り当て状態の場合、コマンド制御部251は、管理テーブル700を参照して、LDEV番号に対応したプール番号を取得し、取得したプール番号を基に管理テーブル800を参照して、プール番号に対応したディスク番号を取得し、取得したディスク番号を基に、LDEV番号322に対応するプール323に属する一つまたは複数のディスク132から、ページ単位で実記憶領域の割り当てを行う。
この際、コマンド制御部251は、ページ管理テーブル25000を参照して、ライトアクセス先のアドレスが示すトラックを含むページエントリを探し、新たに割り当てたページの先頭アドレスをページ管理テーブル25000に登録し、割り当て済み判定情報フィールド2502の「未割り当て」を「割り当て済み」として、ページ管理テーブル25000を更新する。
以上が、仮想ボリュームに対してプールからページ割り当てを行う処理である。
<3390‐A形式のLDEV322が仮想ボリューム上で構成されている場合のページ割り当て処理>
次に、3390‐A形式のLDEV322を仮想ボリューム上で構成する場合において、MFホスト計算機102のライトアクセス契機に、ユーザデータ領域と、このユーザデータ領域に対応する制御情報領域のそれぞれにページを割り当てる処理を図27のフローチャートに従って説明する。
コマンド制御部251が、MFホストI/F121を介して、MFホスト計算機102からのライトアクセスを受領した際の処理は、以下の通りとなる。
ライトアクセス時のパラメータは、例えば、3390形式のLDEV322におけるLDEV番号とLDEV内のトラック番号である。
まず、コマンド制御部251は、MFホストライトコマンド処理を開始すると、図5の管理テーブル500を参照して、LDEV322のボリューム容量を取得し、取得したLDEV322のボリューム容量と予め設定されているトラックサイズを基に、LDEV322のトラック番号に対応するLDEV322内のトラックのデータ部325のアドレスと、同じくトラックの制御情報部326のアドレスを計算する。
次に、コマンド制御部251は、管理テーブル1700を参照して、分散ユーザデータと分散制御情報のサイズを取得し、管理テーブル1800を参照して、分散ユーザデータ領域と分散制御情報領域の先頭アドレスを取得し、取得した分散ユーザデータと分散制御情報のサイズと、分散ユーザデータ領域と分散制御情報領域の先頭アドレスと、計算で得られたデータ部325のアドレス(データアドレス)および制御情報部326のアドレス(制御情報アドレス)と、を基に、3390‐A形式のLDEV上におけるトラックのデータ部325のアドレス(データアドレス)と、制御情報部326のアドレス(制御情報アドレス)と、を計算する(S51)。
この後、コマンド制御部251は、LDEV番号を基にページ管理ディレクトリ2600を参照して、LDEV番号に対応するページ管理テーブル25000のアドレスを取得する。
コマンド制御部251は、取得したアドレスに対応したページ管理テーブル25000を参照して、計算で得られたアドレス(データアドレス)およびアドレス(制御情報アドレス)が指すデータを含むページの、ページ番号をそれぞれ取得する。
コマンド制御部251は、ページ管理テーブル25000のうち、取得したページ番号に対応したページエントリ内の割り当て済み判定情報を参照し、アドレス(データアドレス)が含まれるページは、実記憶領域が割り当て済みか否かを判定し(S52)、割り当て済み判定情報が割り当て済み状態を示す場合、即ち、実記憶領域が割り当て済みと判定した場合は、ステップS56の処理に移行する。
一方、割り当て済み判定情報が未割り当て状態の場合、即ち、アドレス(データアドレス)が含まれるページは、実記憶領域が割り当て済みでないと判定した場合、コマンド制御部251は、管理テーブル700を参照して、LDEV番号に対応したプール番号を取得し、取得したプール番号を基に管理テーブル800を参照して、プール番号に対応したディスク番号を取得し、取得したディスク番号を基に、LDEV番号322に対応するプール323に属する一つまたは複数のディスク132から、ページ単位で実記憶領域の割り当てを行う(S53)。即ち、アドレス(データアドレス)が含まれるページに対してページ割り当てを実行する。
この後、コマンド制御部251は、アドレス(制御情報アドレス)が含まれるページは、実記憶領域が割り当て済みか否かを判定し(S54)、割り当て済み判定情報が割り当て済み状態を示す場合、即ち、実記憶領域が割り当て済みと判定した場合は、ステップS56の処理に移行する。
ステップS54で、アドレス(制御情報アドレス)が含まれるページは、実記憶領域が割り当て済みでないと判定した場合、コマンド制御部251は、管理テーブル700を参照して、LDEV番号に対応したプール番号を取得し、取得したプール番号を基に管理テーブル800を参照して、プール番号に対応したディスク番号を取得し、取得したディスク番号を基に、LDEV番号322に対応するプール323に属する一つまたは複数のディスク132から、ページ単位で実記憶領域の割り当てを行い(S55)、ステップS56の処理に移行する。即ち、ステップS55では、アドレス(制御情報アドレス)が含まれるページに対してページ割り当てを実行する。
ステップS56において、コマンド制御部251は、アドレス(制御情報アドレス)が示す領域に、トラックのデータ部325に対応する制御情報を生成する。
次に、アドレス(データアドレス)が含まれるページは、実記憶領域が割り当て済みである場合、コマンド制御部251は、アドレス(データアドレス)が示す領域に、データをライトする。即ち、コマンド制御部251は、ページ内のライトアクセス先トラック番号のデータ部325に対してライトアクセスを行う(S57)。
この際、コマンド制御部251は、ページ管理テーブル25000を参照して、ライトアクセス先のアドレスが示すトラックを含むページエントリを探し、新たに割り当てたページの先頭アドレスをページ管理テーブル25000に登録し、割り当て済み判定情報フィールド2502の「未割り当て」を「割り当て済み」として、ページ管理テーブル25000を更新し、このルーチンでの処理を終了する。
コマンド制御部251は、前述したページ割り当て処理の中で、アドレス(制御情報アドレス)が属する制御情報領域を初期化後に、ライトアクセスを行ってもよい。
本実施例によれば、仮想ボリュームに実記憶領域を割り当てる場合、データ部325のページと制御情報部326のページをプールから割り当てることができる。
本実施例は、コピー元のストレージコントローラからコピー先のストレージコントローラに、リモートコピー処理に伴うデータとしてコピー対象データを送信し、このコピー対象データをコピー先ストレージコントローラが受信した場合、コピー先ストレージコントローラが、受信したコピー対象データの中にレコードの有無に関する情報を判定し、この判定結果に従った処理を実行するものである。
<3390‐A形式のLDEV322が仮想ボリューム上で構成されている場合のリモートコピー処理に同期する0データページ破棄処理>
図28は、第二のストレージ装置において、仮想ボリューム上に保存された3390‐A形式のLDEV322に対して、第一のストレージ装置101からデータを送信するリモートコピー処理に同期して、受信側のLDEV322内のページ状態を未割り当てにする処理を示すフローチャートである。
以下、ページ状態を未割り当てに戻すことを、ページ破棄と呼ぶ。
第一のストレージ装置101と第二のストレージ装置101において、リモートコピー処理を以下のように行う。
第一のストレージ装置101内の管理ホストI/F127を介して、管理ホスト103から、第一のストレージ装置101内の第一のコマンド制御部251が、リモートコピーの実施要求を受け取ると、第一のコマンド制御部251は、第一のストレージ装置101内の第一のLDEV322(3390形式、または、3390‐A形式)の一部または全部のトラックのデータ部325と、一部または全部のトラックの制御情報部326と、をコピー対象データとして、一つまたは複数のディスク132から、第一のキャッシュメモリ124に読み込む。
第一のコマンド制御部251は、第一のキャッシュメモリ上のLDEV322の一部または全部のトラックを、第一のストレージ装置101内の第一のホストI/F121と、ネットワーク111と、を介して、一定のデータ単位で送信する。データ単位は、例えば、一つまたは複数のトラックのデータ部325であったり、一つまたは複数のトラックの制御情報部326であったりしてもよい。
一方、第二のストレージ装置101内の第二のホストI/F121を介して、第二のストレージ装置101内の第二のコマンド制御部251が、第一のコマンド制御部251からコピー対象データを受信すると、第二のコマンド制御部251は、コピーデータ受信処理を開始し、第二のストレージ装置101内の第二のキャッシュメモリ124に、受信したコピー対象データを書き込む(S61)。
この際、第二のストレージ装置101内の第二のLDEV322は、3390‐A形式に従い、前述したシン・プロビジョニング機能で用いられる仮想ボリューム上で構成される。
第二のコマンド制御部251は、第二のキャッシュメモリ124に保存されているコピー対象データの中の各データ部325に対して、トラック内に、前述したレコードが存在するか否かを判定し(S62)、キャッシュメモリ124上のトラックのデータ部325はレコード無し、と判定した場合は、ステップS66の処理に移行し、キャッシュメモリ124上のトラックのデータ部325はレコード有り、と判定した場合は、ステップS63の処理に移行する。このとき、第二のコマンド制御部251は、トラック毎にレコード有無を調べた結果を、第二のLDEV322の各トラックのデータ部325に対応するレコード有無情報部327に保存する。
ステップS63において、第二のコマンド制御部251は、データ部325または制御情報部26を含むページは、実記憶領域が割り当て済みか否かを判定する。
具体的には、第二のコマンド制御部251は、LDEV322のLDEV番号を基にページ管理テーブル25000とページ管理ディレクトリ2600を参照し、第二のキャッシュメモリ124上にある書き込み先仮想領域であって、コピー対象データに属するデータ部325と制御情報部326の書き込み先仮想領域に、プール323からライト先ページが割り当てられているかどうかをチェックする。
データ部325または制御情報部26を含むページは、実記憶領域が割り当て済みでないと判定した場合、第二のコマンド制御部251は、データ部325または制御情報部26を含むページに対して、プール323内の実記憶領域を割り当てる(S64)。
具体的には、第二のキャッシュメモリ124上の、一つまたは複数のトラックのデータ部325のライト先ページが、未割り当て状態であり、かつ、これらのトラックのデータ部325にレコードがある場合、第二のコマンド制御部251は、LDEV322のLDEV番号を基に管理テーブル700を参照して、LDEV番号に対応したプール番号を取得し、取得したプール番号を基に管理テーブル800を参照して、プール番号に対応したディスク番号を取得し、取得したディスク番号を基に、LDEV322のLDEV番号に対応するプール323に属する一つまたは複数のディスクから、ページ単位で実記憶領域の割り当てを行う。
同様に、第二のキャッシュメモリ124上の、前述した一つまたは複数のトラックの制御情報部326のライト先ページが、未割り当て状態である場合、第二のコマンド制御部251は、LDEV322のLDEV番号を基に管理テーブル700を参照して、LDEV番号に対応したプール番号を取得し、取得したプール番号を基に管理テーブル800を参照して、プール番号に対応したディスク番号を取得し、取得したディスク番号を基に、LDEV322のLDEV番号に対応するプールに属する一つまたは複数のディスクから、ページ単位で実記憶領域の割り当てを行う。
次に、第二のコマンド制御部251は、第二のキャッシュメモリ124上のデータ部325と制御情報部326を、割り当て済み実記憶領域に対して書き込む(S65)。
具体的には、第二のキャッシュメモリ124上の書き込み先仮想領域に、コピー対象データに属するデータ部325のライト先ページが、割り当て済み状態である場合、第二のコマンド制御部251は、第二のキャッシュメモリ124上の、コピー対象データに属するデータ部325を、プール323内の実記憶領域を構成する第二の一つまたは複数のディスク132に書き込む。
同様に、第二のキャッシュメモリ124上の書き込み先仮想領域に、コピー対象データに属する制御情報部326のライト先ページが、割り当て済み状態である場合、第二のコマンド制御部251は、第二のキャッシュメモリ124上の、コピー対象データに属する制御情報部326を、プール323内の実記憶領域を構成する第二の一つまたは複数のディスク132に書き込む。
この後、第二のコマンド制御部251は、ページ管理テーブル25000を基に、ライトアクセス先のトラックのデータ部325を含むページエントリを探し、新たに割り当てたページの先頭アドレスを登録し、割り当て済み判定情報を割り当て済み状態に更新する。同様に、第二のコマンド制御部251は、ページ管理テーブル2500を基に、ライトアクセス先のトラックの制御情報部326を含むページエントリを探し、新たに割り当てたページの先頭アドレスを登録し、割り当て済み判定情報を割り当て済み状態に更新する。
次に、第二のコマンド制御部251は、前述した一つまたは複数のトラックのデータ部325をプール323内の実記憶領域を構成する第二の一つまたは複数のディスク132に書き込み、前述した一つまたは複数のトラックの制御情報部326をプール323内の実記憶領域を構成する第二の一つまたは複数のディスク132に書き込む。
この後、ステップ66において、第二のコマンド制御部251は、第二のLDEV322の前述した一つまたは複数のトラックのデータ部325に対応するレコード有無情報部327に、レコードが有ることを示す情報を保存して、レコード有無情報部327を更新する。
第二のキャッシュメモリ124上の、前述した一つまたは複数のトラックのデータ部のライト先ページが未割り当て状態であり、かつ、これらのトラックのデータ部にレコードが無い場合、第二のコマンド制御部251は、第二のキャッシュメモリ124の書き込み先仮想領域に、プール323からページを割り当てない。この場合、第二のコマンド制御部251は、前述した一つまたは複数のトラックのデータ部325を、第二の一つまたは複数のディスク132に書き込まない。さらに、第二のコマンド制御部251は、第二のLDEV322のトラックのデータ部325に対応するレコード有無情報部327には、レコード無し状態を示す情報を保存する。
第二のキャッシュメモリ124上の、前述した一つまたは複数のトラックのデータ部のライト先ページが未割り当て状態であり、かつ、これらのトラックのデータ部にレコードが無い場合、第二のコマンド制御部251は、プール323からページを割り当てた後に、レコードが無いことを示す初期値を書き込んでもよい。
また、ステップS66では、第二のコマンド制御部251は、第二のLDEV322の割り当て済みページ内のトラックのデータ部325のレコード有無をチェックし、レコードが存在しないトラックのレコード有無情報部327に、レコードが無いことを示す情報を保存して、レコード有無情報部327を更新する。
次に、第二のコマンド制御部251は、第二のLDEV322の全てのトラックのレコード有無情報部327の値に基づき、第二のLDEV322の割り当て済みページ内の、トラックのデータ部325のレコード有無をチェックし、レコードが存在しないページを未割り当て状態、即ち、ページ破棄を実行し(S67)、このルーチンでの処理を終了する。
本実施例においては、第二のストレージ装置における第二のストレージコントローラ131は、第一のストレージ装置101における第一のストレージコントローラ131を他のコントローラとして、第一のストレージコントローラ131とネットワーク111を介して情報の授受を行い、第一のストレージコントローラ131から受信した情報の中に、第1データ部325または第2データ部325に関する情報として、トラックに対応したレコードに関するする情報が存在するか否かを判定し、この判定の結果を、仮想ボリューム(3390‐A形式のLDEV322)の第2制御情報領域に格納し、仮想ボリュームの第2制御情報領域に格納された判定結果が、トラックに対応したレコードが存在しないことを示す場合、トラックに対応した実記憶領域として、プールから仮想ボリュームに割り当てられているページを開放する処理を、リモートコピー処理に同期して実行することになる。
前述したページ破棄処理は、第二のキャッシュメモリ124上の、一つまたは複数のトラックに対応したコピー対象データを、一つまたは複数のディスク132に書き込む前に行ってもよい。
以上が、第一のストレージ装置101内の第一のLDEV322から、第二のストレージ装置101内の第二のLDEV322に対して、リモートデータコピーを実施する処理の一例である。
本実施例によれば、第二のストレージ装置101内の第二のストレージコントローラ131は、第一のストレージ装置101内の第一のストレージコントローラ131からコピー対象データを受信した場合、トラックのデータ部325のレコード有無をチェックし、レコードが存在しないページを未割り当て状態、即ち、ページ破棄の処理を実行することができる。
本実施例では、第一のコマンド制御部251が、送信側の第一のLDEV322の一つまたは複数のトラックのデータ部325と、一つまたは複数のトラックの制御情報部326と、を含むコピー対象データを、一つまたは複数のディスク132から、第一のキャッシュメモリ124に読み込む処理において、第一のコマンド制御部251は、第一のキャッシュメモリ124上の、一つまたは複数のトラックのデータ部325に対応するレコード有無情報部327を参照し、コピー対象データに属するデータ部325にレコードが無い場合には、これらのトラックのデータ部325を第二のストレージ装置に送信しなくてもよい。また、これらのトラックのデータ部325にレコードが無いことを、第二のストレージ装置にメッセージで通知してもよい。
3390形式のLDEV322により、MFホスト計算機102は、トラックの制御情報部326の値を確認しない処理を行う場合には、トラックの制御情報部326をスキップして、ディスクのヘッドをトラックのデータ部325に位置付ける処理のオーバヘッドを減らすことができる。
以上、本発明の実施例を説明したが、本発明は、各実施例に限定されるものでなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、シリンダグループの削除などで、ボリュームの容量を縮小する場合、ボリュームの容量を拡張するときのアドレス変換処理を、ボリュームの容量を縮小するときのアドレス変換処理に適用することもできる。
101 ストレージ装置、102 MFホスト計算機、103 管理ホスト計算機、111、113、126 ネットワーク、122 CPU、123 主メモリ、231 マイクロプログラム、124 キャッシュメモリ、131 ストレージコントローラ、132 ディスク、322 LDEV、323 プール、325 データ部、326 制御情報部、327 レコード有無情報部、901 記憶領域 920、930 実記憶領域、1401〜1405 分散ユーザデータ領域、1411〜1415 分散制御情報領域、1421〜1425 シリンダグループ(CG)、2202、2203 LDEV。

Claims (3)

  1. 複数の一定サイズのページにて形成される仮想的な記憶領域である仮想ボリュームと、前記仮想ボリューム上にデータを格納するデータ部を纏めたデータ領域と前記データ部へのアクセスに用いられる制御情報を格納する制御情報部を纏めた制御情報領域とを形成するストレージコントローラと、
    前記仮想ボリュームに実記憶領域を提供する記憶媒体と
    を備え、
    前記ストレージコントローラは、
    前記仮想ボリュームを設定後、当該仮想ボリュームの容量を一定の第1のサイズの前記データ領域と一定の第2のサイズの前記制御情報領域とを備えたグループの単位で拡張し、
    前記仮想ボリューム上の第1のデータ部を対象とするライト要求があった場合に、前記第1のサイズと前記第2のサイズとに基づいて、前記第1のデータ部を含む第1のページへの実記憶領域の割り当ての有無を判断し、当該割り当てが行われていない場合は前記第1のページに実記憶領域を割り当て、前記第1のデータ部へのアクセスに用いられる制御情報を格納する第1の制御情報部を含む第2のページへの実記憶領域割り当ての有無を判断し、当該割り当てが行われていない場合は前記第2のページに実記憶領域を割り当てるストレージシステム。
  2. 請求項1に記載のストレージシステムであって、
    前記ストレージコントローラは、前記グループの単位で前記仮想ボリュームの容量を拡張した場合に、前記データ領域と制御情報領域とを交互に配置するストレージシステム。
  3. 請求項1に記載のストレージシステムであって、
    前記ストレージコントローラは、前記仮想ボリュームとして第一の仮想ボリュームと第二の仮想ボリュームとを有し、前記第一の仮想ボリューム上に前記データ領域を形成し、前記第二の仮想ボリューム上に前記制御情報領域を形成するストレージシステム。
JP2013506814A 2010-08-11 2010-08-11 ストレージシステム Active JP5537732B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/005042 WO2012020454A1 (en) 2010-08-11 2010-08-11 Storage apparatus and control method thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014092147A Division JP5770884B2 (ja) 2014-04-25 2014-04-25 ストレージ装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2013525912A JP2013525912A (ja) 2013-06-20
JP2013525912A5 JP2013525912A5 (ja) 2013-09-26
JP5537732B2 true JP5537732B2 (ja) 2014-07-02

Family

ID=43759648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013506814A Active JP5537732B2 (ja) 2010-08-11 2010-08-11 ストレージシステム

Country Status (5)

Country Link
US (3) US8484426B2 (ja)
EP (1) EP2603847B1 (ja)
JP (1) JP5537732B2 (ja)
CN (1) CN103229134B (ja)
WO (1) WO2012020454A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8539150B2 (en) 2010-12-27 2013-09-17 Hitachi, Ltd. Storage system and management method of control information using a cache memory with multiple cache partitions
US9519496B2 (en) * 2011-04-26 2016-12-13 Microsoft Technology Licensing, Llc Detecting and preventing virtual disk storage linkage faults
US9348769B2 (en) 2012-05-24 2016-05-24 Red Hat, Inc. Managing zeroed logical volume
US9104590B2 (en) * 2012-07-20 2015-08-11 Hitachi, Ltd. Storage system including multiple storage apparatuses and pool virtualization method
US9778860B2 (en) 2012-09-12 2017-10-03 Microsoft Technology Licensing, Llc Re-TRIM of free space within VHDX
CN103634379B (zh) * 2013-11-13 2017-02-01 华为技术有限公司 一种分布式存储空间的管理方法和分布式存储系统
US9971525B2 (en) * 2015-02-26 2018-05-15 Red Hat, Inc. Peer to peer volume extension in a shared storage environment
EP3474146B1 (en) 2017-04-14 2022-02-23 Huawei Technologies Co., Ltd. Data processing method, storage system and exchange device
US10152271B1 (en) * 2017-06-07 2018-12-11 Micron Technology, Inc. Data replication
US10402095B1 (en) * 2018-04-30 2019-09-03 EMC IP Holding Company LLC Online data expansion in redundant data storage systems
CN112015522B (zh) * 2020-11-02 2021-02-05 鹏城实验室 系统功能扩展方法、装置及计算机可读存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5506979A (en) 1991-04-02 1996-04-09 International Business Machines Corporation Method and means for execution of commands accessing variable length records stored on fixed block formatted DASDS of an N+2 DASD synchronous array
JP3121387B2 (ja) * 1991-08-29 2000-12-25 株式会社日立製作所 磁気テ−プ制御装置
US6041386A (en) * 1998-02-10 2000-03-21 International Business Machines Corporation Data sharing between system using different data storage formats
JP3404289B2 (ja) * 1998-05-22 2003-05-06 富士通株式会社 ディスク制御装置及びその制御方法
JP2002055862A (ja) * 2000-08-08 2002-02-20 Hitachi Ltd 計算機システム
EP1668486A2 (en) * 2003-08-14 2006-06-14 Compellent Technologies Virtual disk drive system and method
JP4715286B2 (ja) * 2004-05-11 2011-07-06 株式会社日立製作所 計算機システムおよび計算機システムの制御方法
JP2006092124A (ja) * 2004-09-22 2006-04-06 Fujitsu Ltd 記憶装置、記憶制御方法および記憶制御プログラム
JP2006127106A (ja) * 2004-10-28 2006-05-18 Hitachi Ltd ストレージシステム及びその制御方法
JPWO2006054334A1 (ja) * 2004-11-16 2008-05-29 富士通株式会社 記憶領域割当装置、記憶領域割当方法および記憶領域割当プログラム
JP4574408B2 (ja) * 2005-03-24 2010-11-04 株式会社日立製作所 記憶装置システムの制御技術
JP2007233901A (ja) * 2006-03-03 2007-09-13 Hitachi Ltd ホスト計算機で認識可能なデータを別のホスト計算機で認識可能とすることを自動で行うサーバ及び方法
JP2007265270A (ja) * 2006-03-29 2007-10-11 Hitachi Ltd ストレージシステム及び記憶領域割当て方法
JP5073259B2 (ja) * 2006-09-28 2012-11-14 株式会社日立製作所 仮想化システム及び領域割当て制御方法
JP4990066B2 (ja) * 2007-08-21 2012-08-01 株式会社日立製作所 論理ボリュームのペアを利用したデータ保存の方式を変更する機能を備えたストレージシステム
JP2009175824A (ja) * 2008-01-22 2009-08-06 Hitachi Ltd メインフレーム用記憶制御装置及びメインフレーム用ボリュームの仮想化方法
JP5302582B2 (ja) 2008-07-09 2013-10-02 株式会社日立製作所 上位装置から指定されるデバイスに関する記憶容量を変更するストレージシステム及び方法
JP5130169B2 (ja) * 2008-09-17 2013-01-30 株式会社日立製作所 仮想化ボリュームへの物理ボリューム領域割り当方法及びストレージ装置

Also Published As

Publication number Publication date
CN103229134A (zh) 2013-07-31
US20130290663A1 (en) 2013-10-31
EP2603847B1 (en) 2018-06-27
JP2013525912A (ja) 2013-06-20
US9423984B2 (en) 2016-08-23
US20120042141A1 (en) 2012-02-16
US8832400B2 (en) 2014-09-09
EP2603847A1 (en) 2013-06-19
WO2012020454A1 (en) 2012-02-16
CN103229134B (zh) 2016-01-20
US8484426B2 (en) 2013-07-09
US20140351513A1 (en) 2014-11-27

Similar Documents

Publication Publication Date Title
JP5537732B2 (ja) ストレージシステム
US10853139B2 (en) Dynamic workload management based on predictive modeling and recommendation engine for storage systems
US8639898B2 (en) Storage apparatus and data copy method
US8650381B2 (en) Storage system using real data storage area dynamic allocation method
JP6114397B2 (ja) 複合型ストレージシステム及び記憶制御方法
JP7116381B2 (ja) クラウド・ベースのランクを使用するデータの動的再配置
CN109791522B (zh) 数据迁移的方法、系统及智能网卡
CN107615261B (zh) 多个云环境之间的共享存储的方法和装置
JP4935331B2 (ja) ストレージシステムと記憶領域の選択方法並びにプログラム
JP2014516442A (ja) 計算機システム及びデータ管理方法
US20190243758A1 (en) Storage control device and storage control method
US20180307426A1 (en) Storage apparatus and storage control method
US8527732B2 (en) Storage system and method of controlling storage system
JP6039149B2 (ja) ストレージ装置及びその制御方法
US11347641B2 (en) Efficient memory usage for snapshots based on past memory usage
CN104426965A (zh) 自管理存储方法和系统
JP5597266B2 (ja) ストレージシステム
JP5770884B2 (ja) ストレージ装置及びその制御方法
JP5472930B2 (ja) ディスクアレイ装置を備えたストレージシステム、ディスクアレイ装置及びエクステントサイズ変更方法
JP2020027433A (ja) 情報システム
JP6657990B2 (ja) ストレージ装置、仮想ボリューム制御システム、仮想ボリューム制御方法および仮想ボリューム制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140425

R150 Certificate of patent or registration of utility model

Ref document number: 5537732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350