[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4721379B2 - ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法 - Google Patents

ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法 Download PDF

Info

Publication number
JP4721379B2
JP4721379B2 JP2001294048A JP2001294048A JP4721379B2 JP 4721379 B2 JP4721379 B2 JP 4721379B2 JP 2001294048 A JP2001294048 A JP 2001294048A JP 2001294048 A JP2001294048 A JP 2001294048A JP 4721379 B2 JP4721379 B2 JP 4721379B2
Authority
JP
Japan
Prior art keywords
disk
unit
shared memory
data
disk control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001294048A
Other languages
English (en)
Other versions
JP2003099206A (ja
Inventor
和久 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001294048A priority Critical patent/JP4721379B2/ja
Priority to US10/067,332 priority patent/US6868438B2/en
Publication of JP2003099206A publication Critical patent/JP2003099206A/ja
Priority to US11/006,592 priority patent/US7260613B2/en
Application granted granted Critical
Publication of JP4721379B2 publication Critical patent/JP4721379B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/329Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the application layer [OSI layer 7]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/10015Access to distributed or replicated servers, e.g. using brokers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、データを複数のディスク装置に格納するストレージシステムとそれを構成するディスク制御クラスタに関する。
【0002】
【従来の技術】
半導体記憶装置を記憶媒体とするコンピュータの主記憶のI/O性能に比べて、磁気ディスクを記憶媒体とするディスクサブシステム(以下「サブシステム」という。)のI/O性能は3〜4桁程度小さく、従来からこの差を縮めること、すなわちサブシステムのI/O性能を向上させる努力がなされている。
サブシステムのI/O性能を向上させるための1つの方法として、複数のディスク装置でサブシステムを構成し、データを複数のディスク装置に格納する、いわゆるディスクと呼ばれるシステムが知られている。
例えば、従来技術では、図2に示すようにホストコンピュータ3とディスク制御装置4との間のデータ転送を実行する複数のチャネルIF部11と、ディスク装置2とディスク制御装置4間のデータ転送を実行する複数のディスクIF部16と、ディスク装置2のデータとディスク制御装置4に関する制御情報(例えば、ディスク制御装置4内のデータ転送制御に関する情報、ディスク装置2に格納するデータの管理情報)を格納する共有メモリ部20とを備え、1つのディスク制御装置4内において、共有メモリ部20は全てのチャネルIF部11及びディスクIF部16からアクセス可能な構成となっている。
このディスク制御装置4では、チャネルIF部11及びディスクIF部16と共有メモリ部20との間は相互結合網30で接続される。
チャネルIF部11は、ホストコンピュータ3と接続するためのインターフェース及びホストコンピュータ3に対する入出力を制御するマイクロプロセッサ(図示せず)を有している。
また、ディスクIF部16は、ディスク装置2と接続するためのインターフェース及びディスク装置2に対する入出力を制御するマイクロプロセッサ(図示せず)を有している。また、ディスクIF部16は、RAID機能の実行も行う。
【0003】
インターネットの普及等により企業で扱うデータは爆発的に増大しており、データセンタ等では一台のディスク制御装置で扱えるデータ量以上のデータを記憶する必要がある。
このため、図2に示すようにディスク制御装置4を複数台設置し、それらのホストコンピュータ3とのインターフェースをSANスイッチ5を介して、ホストコンピュータ3に接続していた。
また、データ量の増大に伴いSANスイッチ5に接続するディスク制御装置4の台数が増えると、ホストコンピュータ3とSANスイッチ5を含めたシステム全体(このシステムをストレージ・エリア・ネットワーク(SAN)と呼ぶ)の管理が複雑化する。
それに対処するため、SANスイッチ5にSANアプライアンス6を接続し、SANアプライアンス6においてSANスイッチ5に繋がる全てのディスク制御装置4が管理するデータのディレクトリサービスを行い、ホストコンピュータ3に対して複数のディスク制御装置4を1つのストレージシステムに見せる処理、言い換えると、個々のディスク制御装置4が提供する記憶領域を1つの大きな記憶領域の固まりに見せ、その中から必要な量の記憶領域をホストコンピュータ3に割当てるという処理を行っていた。
【0004】
【発明が解決しようとする課題】
銀行、証券、電話会社等に代表される大企業では、従来各所に分散していたコンピュータ及びストレージを、データセンターの中に集中化してコンピュータシステム及びストレージシステム構成することにより、コンピュータシステム及びストレージシステムの運用、保守、管理に要する費用を削減する傾向にある。
このような傾向の中で、大型/ハイエンドのディスク制御装置には、数百台以上のホストコンピュータへ接続するためのチャネルインターフェースのサポート(コネクティビティ)、数百テラバイト以上の記憶容量のサポートが要求されている。
一方、近年のオープン市場の拡大、ストレージ・エリア・ネットワーク(SAN)の普及により、大型/ハイエンドのディスク制御装置と同様の高機能・高信頼性を備えた小規模構成(小型筐体)のディスク制御装置への要求が高まっている。
前者の要求に対しては、従来の大型/ハイエンドのディスク制御装置を複数接続して超大規模なストレージシステムを構成する方法が考えられる。
また後者の要求に対しては、従来の大型/ハイエンドのディスク制御装置の最小構成のモデルにおいて筐体を小型化した装置を構成する方法が考えられる。
また、この小型化した装置を複数台接続することにより、従来のディスク制御装置がサポートしている中規模から大規模の構成をサポートするストレージシステムを構成する方法が考えられる。
ストレージシステムでは、上記のように、小規模な構成から超大規模な構成まで、同一の高機能・高信頼なアーキテクチャで対応可能な、スケーラビリティのある構成のシステムが必要となってきており、そのためには、複数のディスク制御装置をクラスタリングし、1つのシステムとして運用できるストレージシステムが必要となる。
図2に示す従来技術では、複数のディスク制御装置4をSANスイッチ5を介してホストコンピュータ3に接続し、SANアプライアンス6によりホストコンピュータ3に対して複数のディスク制御装置4を1つのストレージシステムに見せていた。
しかし、SANアプライアンス6上で動作するソフトウェアで複数のディスク制御装置4を1つのシステムとして運用するため、従来の単体の大型のディスク制御装置に比べて信頼性、可用性が低いという問題があった。
また、SANアプライアンス6上でホストコンピュータ3から要求されたデータが存在するディスク制御装置4を検索するため、性能が低下するという問題があった。
本発明の目的は、小規模な構成から超大規模な構成まで、同一の高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することにある。
より具体的には、本発明の目的は、複数台のディスク制御装置をまとめて1つのシステムとしたストレージシステムにおいて高信頼・高性能なシステムを提供することにある。
【0005】
【課題を解決するための手段】
上記目的を達成するため、本発明は、ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、ディスク装置に対しリード/ライトされるデータとデータの転送に関する制御情報及びディスク装置の管理情報を格納するローカル共有メモリ部とを有し、チャネルインターフェース部はホストコンピュータからのデータのリード/ライト要求に対し、ホストコンピュータとのインターフェースとローカル共有メモリ部との間のデータ転送を実行し、ディスクインターフェース部は、ディスク装置とローカル共有メモリ部との間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、前記各ディスク制御クラスタの管理情報を格納するグローバル共有メモリ部を有するストレージシステムであり、
該各ディスク制御クラスタと他の各ディスク制御クラスタは相互結合網に接続され、該相互結合網に前記グローバル共有メモリ部が接続されたことによって達成される。
また、前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部と前記ローカル共有メモリ部とが接続された接続部と他の各ディスク制御クラスタ内の該接続部が前記相互結合網を介して接続されたことによって達成される。
また、前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部に前記ディスク制御クラスタ内で直接接続され、該各ディスク制御クラスタ内の該ローカル共有メモリ部と他の各ディスク制御クラスタ内の該ローカル共有メモリ部が前記相互結合網を介して接続されたことによって達成される。
また、前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部に前記ディスク制御クラスタ内で直接接続され、該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との接続部と他の各ディスク制御クラスタ内の該接続部が前記相互結合網を介して接続されたことによって達成される。
また、ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、該1または複数のチャネルインターフェース部と該1または複数のディスクインターフェース部を接続する接続部を有する複数のディスク制御クラスタと、ディスク装置に対しリード/ライトされるデータとデータの転送に関する制御情報、ディスク装置の管理情報、及びディスク制御クラスタの管理情報を格納するグローバル共有メモリ部を有するストレージシステムであり、
前記各ディスク制御クラスタ内の接続部と他の各ディスク制御クラスタ内の該接続部が相互結合網を介して接続され、該相互結合網に前記グローバル共有メモリ部が接続されたことによって達成される。
また、ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、ディスク装置に対しリード/ライトされるデータを格納する第1のメモリと、チャネルインターフェース部及びディスクインターフェース部と第1のメモリとの間のデータ転送に関する制御情報及びディスク装置の管理情報を格納する第2のメモリとを有するローカル共有メモリ部とを有し、チャネルインターフェース部はホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部内の第1のメモリとの間のデータ転送を実行し、ディスクインターフェース部は、ディスク装置とローカル共有メモリ部内の第1のメモリとの間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、前記各ディスク制御クラスタの管理情報を格納するグローバル共有メモリ部を有するストレージシステムであり、
前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第2のメモリに前記ディスク制御クラスタ内で直接接続され、
該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との第1の接続部と他の各ディスク制御クラスタ内の該第1の接続部が第1の相互結合網を介して接続され、
前記グローバル共有メモリ部が該第1の相互結合網に接続され、
前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部と前記ローカル共有メモリ部の第1のメモリとが接続された第2の接続部と他の各ディスク制御クラスタ内の該第2の接続部が第2の相互結合網を介して接続されたことによって達成される。
また、ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、ディスク装置に対しリード/ライトされるデータを格納する第1のメモリと、チャネルインターフェース部及びディスクインターフェース部と第1のメモリとの間のデータ転送に関する制御情報及び前記ディスク装置の管理情報を格納する第2のメモリとを有するローカル共有メモリ部とを有し、チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、ホストコンピュータとのインターフェースとローカル共有メモリ部内の第1のメモリとの間のデータ転送を実行し、ディスクインターフェース部は、ディスク装置とローカル共有メモリ部内の第1のメモリとの間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、前記各ディスク制御クラスタの管理情報を格納するグローバル共有メモリ部を有するストレージシステムであり、
前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第2のメモリに前記ディスク制御クラスタ内で直接接続され、
該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との第1の接続部と他の各ディスク制御クラスタ内の該第1の接続部が第1の相互結合網を介して接続され、
前記グローバル共有メモリ部が該第1の相互結合網に接続され、
前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第1のメモリに前記ディスク制御クラスタ内で直接接続され、
該各ディスク制御クラスタ内の該ローカル共有メモリ部の第1のメモリと他の各ディスク制御クラスタ内の該ローカル共有メモリ部の第1のメモリが第2の相互結合網を介して接続されたことによって達成される。
【0006】
【発明の実施形態】
以下、本発明の実施例を図面を用いて説明する。
《実施例1》
図1、図3、図12、及び図13に、本発明の一実施例を示す。
以下の実施例において、相互結合網はスイッチを利用したものを例にして説明してあるが、相互に接続され制御情報やデータが転送されれば良いのであり、例えばバスで構成されても良い。
図1に示すように、ストレージシステム1は複数のディスク制御クラスタ1−1乃至1−nから構成される。
ディスク制御クラスタ1−1は、ホストコンピュータ3とのインターフェース部(チャネルIF部)11と、ディスク装置2とのインターフェース部(ディスクIF部)16と、ローカル共有メモリ部22を有し、チャネルIF部11及びディスクIF部16とローカル共有メモリ部22の間は複数のディスク制御クラスタ1−1乃至1−nに跨る相互結合網31を介して接続され、グローバル共有メモリ部21は相互結合網31に接続されている。
すなわち、相互結合網31を介して、全てのチャネルIF部11及びディスクIF部12から、グローバル共有メモリ部22へアクセス可能な構成となっている。
【0007】
チャネルIF部11の具体的な一例を図12に示す。
チャネルIF部11は、ホストコンピュータ3との2つのIF(ホストIF)202と、ホストコンピュータ3に対する入出力を制御する2つのマイクロプロセッサ201と、グローバル共有メモリ部21あるいはローカル共有メモリ部22へのアクセスを制御するアクセス制御部(メモリアクセス制御部)206を有し、ホストコンピュータ3とグローバル共有メモリ部21あるいはローカル共有メモリ部22間のデータ転送、及びマイクロプロセッサ201とグローバル共有メモリ部21あるいはローカル共有メモリ部22間の制御情報の転送を実行する。
マイクロプロセッサ201及びホストIF202は内部バス205によって接続され、メモリアクセス制御部206は2つのホストIF202に直接接続され、また内部バス205に接続されている。
【0008】
ディスクIF部16の具体的な一例を図13に示す。
ディスクIF部16は、ディスク装置2との2つのIF(ドライブIF)203と、ディスク装置2に対する入出力を制御する2つのマイクロプロセッサ201と、グローバル共有メモリ部21あるいはローカル共有メモリ部22へのアクセスを制御するアクセス制御部(メモリアクセス制御部)206を有し、ディスク装置2とグローバル共有メモリ部21あるいはローカル共有メモリ部22間のデータ転送、及びマイクロプロセッサ201とグローバル共有メモリ部21あるいはローカル共有メモリ部22間の制御情報の転送を実行する。
マイクロプロセッサ201及びドライブIF203は内部バス205によって接続され、メモリアクセス制御部206は2つのドライブIF203に直接接続され、また、内部バス205に接続されている。
ディスクIF部16はRAID機能の実行も行う。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良いが、それ自体1つのディスク制御装置として機能を備えているものである。
【0009】
ストレージシステムの具体的な一例を図3に示す。
ストレージシステム1は、複数のディスク制御クラスタ1−1乃至1−nと、グローバル共有メモリ部21と、2つのグローバルスイッチ(GSW)115と、アクセスパス136と、アクセスパス137を有する。
グローバルスイッチ115は、グローバル共有メモリ部21からのパスと複数のディスク制御クラスタからのパスを接続する接続部である。
ディスク制御クラスタ1−1乃至1−nは、ホストコンピュータ3との2つのチャネルIF部11と、ディスク装置2との2つのディスクIF部16と、2つのローカルスイッチ(LSW)110と、2つのローカル共有メモリ部22と、アクセスパス131と、アクセスパス132と、アクセスパス136を有する。
グローバル共有メモリ部21は、メモリコントローラ101とメモリモジュール105とを有し、ディスク制御クラスタ1−1乃至1−nの管理情報(例えば、各ディスク制御クラスタが管理する記憶領域の情報や、ディスク制御クラスタの稼動状況及び構成情報等)を格納する。
ローカルスイッチ110は、チャネルIF部からのパスと、ディスクIF部からのパスと、ローカル共有メモリからのパスを接続する接続部である。
ローカル共有メモリ部22は、メモリコントローラ100とメモリモジュール105とを有し、ディスク制御クラスタの制御情報(例えば、チャネルIF部11及びディスクIF部16とローカル共有メモリ部22との間のデータ転送制御に関する情報、ディスク装置2に記録するデータの管理情報等)とディスク装置2に記録するデータを格納する。
【0010】
チャネルIF部11内のメモリアクセス制御部206には2本のアクセスパス131を接続し、それらを2つの異なるLSW110にそれぞれ接続する。
LSW110には2本のアクセスパス132を接続し、それらを2つの異なるローカル共有メモリ部22内のメモリコントローラ100にそれぞれ接続する。
したがって、メモリコントローラ100には、2つのLSW110から1本ずつ、計2本のアクセスパス132が接続される。
こうすることにより、1つのメモリアクセス制御部206から1つのメモリコントローラ100へのアクセスルートが2つとなる。
これにより、1つのアクセスパスまたはLSW110に障害が発生した場合でも、もう1つのアクセスルートによりローカル共有メモリ部22へアクセスすることが可能となるため、耐障害性を向上させることができる。
【0011】
LSW110には、2つのチャネルIF部11と、2つのディスクIF部16からそれぞれ1本ずつ、計4本のアクセスパス131が接続される。
また、LSW110には、2つのローカル共有メモリ部22へのアクセスパス132が2本とGSW115へのアクセスパス136が1本接続される。
LSW110には上記のようなアクセスパスが接続されるため、LSW110内では、チャネルIF部11及びディスクIF部16からの4本のアクセスパスからの要求を、自ディスク制御クラスタ内のローカル共有メモリ部22への2本のアクセスパスと、GSW115への1本のアクセスパス136に振分ける機能を有する。
【0012】
GSW115には、各ディスク制御クラスタから1本ずつ、ディスク制御クラスタ数分の本数のアクセスパス136が接続される。
また、GSW115には、2つのグローバル共有メモリ部21内のメモリコントローラ101へのアクセスパス137が1本ずつ、計2本接続される。
こうすることにより、1つのメモリアクセス制御部206から1つのメモリコントローラ101へのアクセスルートが2つとなる。
これにより、1つのアクセスパスまたはLSW110またはGSW115に障害が発生した場合でも、もう1つのアクセスルートによりグローバル共有メモリ部21へアクセスすることが可能となるため、耐障害性を向上させることができる。
【0013】
GSW115を使わずに、アクセスパス136をメモリコントローラ101に直接接続しても本発明を実施する上で問題ない。
そうすることにより、GSW115で発生するデータ転送処理のオーバヘッドを削減することが可能となり、性能が向上する。
GSW115を使わない場合、1つのメモリアクセス制御部206から1つのメモリコントローラ101へのアクセスルートを2つ確保し、耐障害性を向上するためには、LSW110にアクセスパス136を2本接続し、それぞれを異なるメモリコントローラ101へ接続する。
【0014】
図3でLSW110はチャネルIF部11及びディスクIF部16とローカル共有メモリ部22との接続部であり、GSW115はディスク制御クラスタ1−1乃至1−nとグローバル共有メモリ部21との接続部である。
図3において、GSW115とグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nといっしょに、1つの筐体の中に実装しても良い。
また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
【0015】
図3において、ディスク制御装置1−1に接続されたホストコンピュータ3からストレージシステム1に記録されたデータを読み出す場合の一例を述べる。
まず、ホストコンピュータ3は、自身が接続されているディスク制御クラスタ1−1内のチャネルIF部11にデータの読出し要求を発行する。
要求を受けたチャネルIF部11内のマイクロプロセッサ201は、自ディスク制御クラスタ1−1内のローカル共有メモリ部22にアクセスし、要求されたデータがどのディスク装置2内に格納されているかを調べる。
ローカル共有メモリ部22には、要求データのアドレスとそのデータが実際に記録されているディスク装置2内のアドレスを対応させる変換テーブルが格納されており、要求されたデータがどのディスク装置2内に格納されているかを調べることができる。
【0016】
要求されたデータが自ディスク制御クラスタ1−1に接続されたディスク装置2に格納されていた場合、要求を受けたチャネルIF部11内のマイクロプロセッサ201は、さらに自ディスク制御クラスタ1−1内のローカル共有メモリ部22にアクセスし、要求されたデータがローカル共有メモリ部22内に格納されているかどうかを確認する。
ローカル共有メモリ部22にはディスク装置2に格納するデータとともにそのデータのディレクトリ情報が格納されており、ローカル共有メモリ部22内に要求データが存在するかどうかを確認できる。
それにより自ディスク制御クラスタ1−1のローカル共有メモリ部22内にデータがあった場合は、ローカル共有メモリ部22にアクセスしてそのデータを自身のLSW110を介してチャネルIF部11まで転送し、さらにホストコンピュータ3に送る。
【0017】
自ディスク制御クラスタ1−1のローカル共有メモリ部22内にデータが存在しなかった場合は、チャネルIF部11のマイクロプロセッサ201は、要求データが格納されているディスク装置2が接続されているディスクIF部16内のマイクロプロセッサ201に対し、要求データを読出しローカル共有メモリ部22に格納するというデータ要求の処理内容を示す制御情報を発行し、この制御情報の発行を受けたディスクIF部16内のマイクロプロセッサ201は、要求データが格納されているディスク装置2からデータを読出し、LSW110を介して、自ディスク制御クラスタ1−1内のローカル共有メモリ部22に要求データを転送し格納する。
すなわち、チャネルIF部11のマイクロプロセッサ201は、上記データ要求の処理内容を示す制御情報を発行し、ローカル共有メモリ部22の制御情報領域(ジョブ制御ブロック)に格納する。
ディスクIF部16のマイクロプロセッサ201は、ローカル共有メモリ部22の制御情報領域をポーリングで監視し、上記発行された制御情報が上記制御情報領域(ジョブ制御ブロック)に存在した場合は、要求データが格納されているディスク装置2からデータを読出し、LSW110を介して、自ディスク制御クラスタ1−1内のローカル共有メモリ部22に要求データを転送し格納する。
【0018】
ディスクIF部16内のマイクロプロセッサ201は、要求データをローカル共有メモリ部22へ格納した後、前記制御情報を発行したチャネルIF部11内のマイクロプロセッサ201にローカル共有メモリ部22内のデータを格納したアドレスを、ローカル共有メモリ部22内の制御情報を介して伝える。それを受けたチャネルIF部11内のマイクロプロセッサ201は、ローカル共有メモリ部22からデータを読出し、ホストコンピュータ3に送る。
すなわち、ディスクIF部16内のマイクロプロセッサ201は、要求データをローカル共有メモリ部22へ格納した後、処理の実行の終了とデータを格納したアドレスを示す制御情報を発行し、ローカル共有メモリ部22の制御情報領域に格納する。
前記制御情報を発行したチャネルIF部11内のマイクロプロセッサ201は、ローカル共有メモリ部22の制御情報領域をポーリングで監視し、ディスクIF部16内のマイクロプロセッサ201から発行された制御情報が存在する場合、ローカル共有メモリ部内のデータを格納したアドレスによりローカル共有メモリ部22からデータを読出し、チャネルIF部11まで転送し、さらにホストコンピュータ3に送る。
【0019】
要求されたデータが自ディスク制御クラスタ1−1に接続されたディスク装置2に格納されていなかった場合、要求を受けたチャネルIF部11内のマイクロプロセッサ201は、グローバル共有メモリ部21にアクセスし、要求されたデータが格納されているディスク装置が接続されているディスク制御クラスタを調べる。
グローバル共有メモリ部22には、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルが格納されており、要求されたデータがどのディスク制御クラスタに格納されているかを調べることができる。
【0020】
要求されたデータがディスク制御クラスタ1−nに接続されたディスク装置2に格納されていた場合、要求を受けたチャネルIF部11内のマイクロプロセッサ201は、グローバル共有メモリ部21を介してディスク制御クラスタ1−nに要求データをディスク制御クラスタ1−n内のローカル共有メモリ部22へ格納するように要求する。
グローバル共有メモリ部21の中には、ディスク制御クラスタ間でデータ要求の受け渡しを行う制御情報を格納する領域があり、その領域は要求先のディスク制御クラスタ毎に分割されており、要求を受けたチャネルIF部11内のマイクロプロセッサ201は、ディスク制御クラスタ1−nの制御情報を格納する領域に要求データをディスク制御クラスタ1−n内のローカル共有メモリ部22へ格納するよう要求する情報を要求データのアドレスとともに格納する。
ディスク制御クラスタ1−n内のチャネルIF部11またはディスクIF部16内のマイクロプロセッサ201は、グローバル共有メモリ21内の自ディスク制御クラスタへの制御情報を格納する領域をポーリングで監視している。
【0021】
データを要求する制御情報の領域にデータ要求があった場合、ディスク制御クラスタ1−n内のチャネルIF部11またはディスクIF部16内のマイクロプロセッサ201は、要求されたデータが自ディスク制御クラスタ1−n内のローカル共有メモリ部22内に格納されているかどうかを確認する。
ローカル共有メモリ部22にはディスク装置2に格納するデータとともにそのデータのディレクトリ情報が格納されており、ローカル共有メモリ部22内に要求データが存在するかどうかを確認できる。
それにより自ディスク制御クラスタ1−nのローカル共有メモリ部22内にデータがあった場合は、上記と同様にして、グローバル共有メモリ21を介してディスク制御クラスタ1−1内のデータ要求を受けたチャネルIF部11内のマイクロプロセッサ201にディスク制御クラスタ1−n内のローカル共有メモリ部22へ格納したことを伝える。
それを受け、ディスク制御クラスタ1−1内のデータ要求を受けたチャネルIF部11内のマイクロプロセッサ201は、GSW115及びLSW110を介してディスク制御クラスタ1−nのローカル共有メモリ部22から要求データを読出し、チャネルIF部11まで転送し、さらにホストコンピュータ3に送る。
【0022】
ディスク制御クラスタ1−nのローカル共有メモリ部22内にデータが存在しなかった場合は、ディスク制御クラスタ1−nのチャネルIF部11またはディスクIF部16内のマイクロプロセッサ201は、要求データが格納されているディスク装置2が接続されているディスクIF部16内のマイクロプロセッサ201に対し、要求データを読出し、ローカル共有メモリ部22に格納するデータ要求の処理内容を示す制御情報を発行し、ローカル共有メモリ部22の制御情報領域(ジョブ制御ブロック)に格納する。
ディスクIF部16のマイクロプロセッサ201は、ローカル共有メモリ部22の制御情報領域をポーリングで監視し、上記発行された制御情報が上記制御情報領域(ジョブ制御ブロック)に存在した場合は、要求データが格納されているディスク装置2からデータを読出し、LSW110を介して、自ディスク制御クラスタ1−n内のローカル共有メモリ部22に要求データを転送し格納する。
その後の処理は、上記ローカル共有メモリ部22内に要求データがあった場合の処理と同様である。
【0023】
本実施例によれば、ホストコンピュータ3は要求データがどのディスク制御クラスタに繋がるディスク装置2に格納されているかを意識することなく、自身が繋がるディスク制御クラスタにアクセス要求を発行するだけで、データの書き込み及び読出しを行うことが可能になり、ホストコンピュータ3に対して、複数台のディスク制御クラスタ1−1乃至1−nを1つのストレージシステムに見せることが可能となる。
そして、ディスク制御クラスタが1個だけの小規模な構成からディスク制御クラスタが数十個接続された超大規模な構成まで、ディスク制御クラスタ単体が持つ高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することが可能となる。
【0024】
《実施例2》
図4、図5、図12、及び図13に、本発明の一実施例を示す。
図4に示すように、ディスク制御ユニット1−1乃至1−nからなるストレージシステム1の構成は、チャネルIF部11及びディスクIF部16とローカル共有メモリ部22及び相互結合網31の間の接続構成を除いて、実施例1の図1に示す構成と同様である。
チャネルIF部11及びディスクIF部16とローカル共有メモリ部22の間は、ディスク制御クラスタ内では直接接続されている。
また、複数のディスク制御クラスタ1−1乃至1−n間では、ローカル共有メモリ部22は相互結合網31を介して接続されており、その相互結合網31にグローバル共有メモリ21が接続されている。
【0025】
上記のように、この実施例ではディスク制御ユニット1−1乃至1−n内においてチャネルIF部11及びディスクIF部16とローカル共有メモリ部22を直接接続することにより、実施例1で示した相互結合網31を介して接続する場合に比べ、ローカル共有メモリ部22へのアクセス時間を短縮することが可能になる。
チャネルIF部11及びディスクIF部16の構成は、それぞれ図12、図13に示す実施例1の構成と同様である。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良いが、それ自体1つのディスク制御装置として機能を備えているものである。
【0026】
ストレージシステム1の具体的な一例を図5に示す。
ディスク制御クラスタ1−1乃至1−n内の構成も、チャネルIF部11及びディスクIF部16とローカル共有メモリ部22の間の接続構成とディスク制御クラスタ1−1乃至1−nとGSW115の接続構成を除いて、実施例1の図3に示す構成と同様である。
ストレージシステム1は、複数のディスク制御クラスタ1−1乃至1−nと、グローバル共有メモリ部21と、2つのグローバルスイッチ(GSW)115と、アクセスパス136と、アクセスパス137を有する。
ディスク制御クラスタ1−1乃至1−nは、ホストコンピュータ3との2つのチャネルIF部11と、ディスク装置2との2つのディスクIF部16と、2つのローカル共有メモリ部22と、アクセスパス133と、アクセスパス136を有する。
【0027】
チャネルIF部11内のメモリアクセス制御部206には2本のアクセスパス133を接続し、それらを2つの異なるメモリコントローラ100にそれぞれ接続する。
したがって、メモリコントローラ100には、2つのチャネルIF部11と2つのディスクIF部16から1本ずつ、計4本のアクセスパス133が接続される。また、GSW115へのアクセスパス136が1本接続される。
メモリコントローラ100には上記のようなアクセスパスが接続されるため、メモリコントローラ100内では、チャネルIF部11及びディスクIF部16からの4本のアクセスパス133からの要求を、メモリモジュール105への1本のアクセスパスと、GSW115への1本のアクセスパス136に振分ける機能を有する。
【0028】
実施例1と同様にGSW115を使わずに、アクセスパス136をメモリコントローラ101に直接接続しても本発明を実施する上で問題ない。そうすることにより、GSW115で発生するデータ転送処理のオーバヘッドを削減することが可能となり、性能が向上する。
GSW115を使わない場合、1つのメモリコントローラ100から1つのメモリコントローラ101へのアクセスルートを2つ確保し、耐障害性を向上するためには、メモリコントローラ100にアクセスパス136を2本接続し、それぞれを異なるメモリコントローラ101へ接続する。
また、実施例1と同様に、図5において、GSW115とグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nといっしょに、1つの筐体の中に実装しても良い。また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
【0029】
本実施例において、ホストコンピュータ3からストレージシステムへのデータの読み出し/書き込みを行う場合の、ストレージシステム1内の各部の動作は、チャネルIF部11及びディスクIF部16からローカル共有メモリ部22へのアクセスが直接になることと、チャネルIF部11及びディスクIF部16からグローバル共有メモリ部21へのアクセスがメモリコントローラ100を介して行われることを除いて、実施例1と同様である。
本実施例によれば、ホストコンピュータ3は要求データがどのディスク制御クラスタに繋がるディスク装置2に格納されているかを意識することなく、自身が繋がるディスク制御クラスタにアクセス要求を発行するだけで、データの書き込み及び読出しを行うことが可能になり、ホストコンピュータ3に対して、複数台のディスク制御クラスタ1−1乃至1−nを1つのストレージシステムに見せることが可能となる。
そして、ディスク制御クラスタが1個だけの小規模な構成からディスク制御クラスタが数十個接続された超大規模な構成まで、ディスク制御クラスタ単体が持つ高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することが可能となる。
【0030】
《実施例3》
図6、図7、図12、及び図13に、本発明の一実施例を示す。
図6に示すように、ディスク制御ユニット1−1乃至1−nからなるストレージシステム1の構成は、チャネルIF部12及びディスクIF部17とローカル共有メモリ部22の間の接続構成を除いて、実施例1の図1に示す構成と同様である。
チャネルIF部12及びディスクIF部17とローカル共有メモリ部22の間は、ディスク制御クラスタ内では直接接続されている。
また、複数のディスク制御クラスタ1−1乃至1−n間では、チャネルIF部12及びディスクIF部17が相互結合網31を介して接続されており、その相互結合網31にグローバル共有メモリ21が接続されている。
上記のように、この実施例ではディスク制御ユニット1−1乃至1−n内においてチャネルIF部12及びディスクIF部17とローカル共有メモリ部22を直接接続することにより、実施例1で示した相互結合網31を介して接続する場合に比べ、ローカル共有メモリ部22へのアクセス時間を短縮することが可能になる。
チャネルIF部12及びディスクIF部17の構成は、それぞれ図12、図13に示すチャネルIF部11及びディスクIF部16の構成において、メモリアクセス制御部206のアクセスパスを4本に増やした構成となる。
ここで、4本のアクセスパスの内、2本はアクセスパス131、もう2本がアクセスパス133(図7参照)となる。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良いが、それ自体1つのディスク制御装置として機能を備えているものである。
【0031】
ストレージシステム1の具体的な一例を図7に示す。
ディスク制御クラスタ1−1乃至1−n内の構成も、チャネルIF部12及びディスクIF部17とローカル共有メモリ部22の間の接続構成を除いて、実施例1の図3に示す構成と同様である。
ストレージシステム1は、複数のディスク制御クラスタ1−1乃至1−nと、グローバル共有メモリ部21と、2つのグローバルスイッチ(GSW)115と、アクセスパス136と、アクセスパス137を有する。
ディスク制御クラスタ1−1乃至1−nは、ホストコンピュータ3との2つのチャネルIF部12と、ディスク装置2との2つのディスクIF部17と、2つのローカルスイッチ(LSW)110と、2つのローカル共有メモリ部22と、アクセスパス131と、アクセスパス133と、アクセスパス136を有する。
ローカルスイッチ110は、チャネルIF部からのパスと、ディスクIF部からのパスを接続する接続部である。
チャネルIF部12及びディスクIF部17内のメモリアクセス制御部206には2本のアクセスパス133を接続し、それらを2つの異なるメモリコントローラ100にそれぞれ接続する。したがって、メモリコントローラ100には、2つのチャネルIF部11と2つのディスクIF部16から1本ずつ、計4本のアクセスパス133が接続される。
さらに、チャネルIF部12及びディスクIF部17内のメモリアクセス制御部206には2本のアクセスパス131を接続し、それらを2つの異なるLSW110にそれぞれ接続する。したがって、LSW110には、2つのチャネルIF部12と2つのディスクIF部17から1本ずつ、計4本のアクセスパス131が接続される。また、GSW115へのアクセスパス136が1本接続される。
【0032】
実施例1と同様にGSW115を使わずに、アクセスパス136をメモリコントローラ101に直接接続しても本発明を実施する上で問題ない。そうすることにより、GSW115で発生するデータ転送処理のオーバヘッドを削減することが可能となり、性能が向上する。GSW115を使わない場合、1つのLSW110から1つのメモリコントローラ101へのアクセスルートを2つ確保し、耐障害性を向上するためには、LSW110にアクセスパス136を2本接続し、それぞれを異なるメモリコントローラ101へ接続する。
また、実施例1と同様に、図7において、GSW115とグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nといっしょに、1つの筐体の中に実装しても良い。また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
【0033】
本実施例において、ホストコンピュータ3からストレージシステムへのデータの読み出し/書き込みを行う場合の、ストレージシステム1内の各部の動作は、チャネルIF部12及びディスクIF部17からローカル共有メモリ部22へのアクセスが直接になることを除いて、実施例1と同様である。
【0034】
本実施例によれば、ホストコンピュータ3は要求データがどのディスク制御クラスタに繋がるディスク装置2に格納されているかを意識することなく、自身が繋がるディスク制御クラスタにアクセス要求を発行するだけで、データの書き込み及び読出しを行うことが可能になり、ホストコンピュータ3に対して、複数台のディスク制御クラスタ1−1乃至1−nを1つのストレージシステム1に見せることが可能となる。そして、ディスク制御クラスタが1個だけの小規模な構成からディスク制御クラスタが数十個接続された超大規模な構成まで、ディスク制御クラスタ単体が持つ高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することが可能となる。
【0035】
《実施例4》
図8、図9、図12、及び図13に、本発明の一実施例を示す。
図8に示すように、ディスク制御ユニット1−1乃至1−nからなるストレージシステム1の構成は、実施例1においてローカル共有メモリ22を除いた構成である。
このため、実施例1の各ディスク制御ユニット1−1乃至1−nのローカル共有メモリ22に格納する情報を全てグローバル共有メモリ21に格納する。
複数のディスク制御クラスタ1−1乃至1−n間では、チャネルIF部11及びディスクIF部16が相互結合網31を介して接続されており、その相互結合網31にグローバル共有メモリ21が接続されている。
チャネルIF部11及びディスクIF部16の構成は、それぞれ図12、図13に示す実施例1の構成と同様である。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良い。
【0036】
ストレージシステム1の具体的な一例を図9に示す。
ディスク制御クラスタ1−1乃至1−n内の構成も、ローカル共有メモリ部22が無いことを除いて、実施例1の図3に示す構成と同様である。
ストレージシステム1は、複数のディスク制御クラスタ1−1乃至1−nと、グローバル共有メモリ部21と、2つのグローバルスイッチ(GSW)115と、アクセスパス136と、アクセスパス137を有する。
ディスク制御クラスタ1−1乃至1−nは、ホストコンピュータ3との2つのチャネルIF部11と、ディスク装置2との2つのディスクIF部16と、2つのローカルスイッチ(LSW)110と、アクセスパス131と、アクセスパス136を有する。
ローカルスイッチ110は、チャネルIF部からのパスと、ディスクIF部からのパスを接続する接続部である。
チャネルIF部11及びディスクIF部16内のメモリアクセス制御部206には2本のアクセスパス131を接続し、それらを2つの異なるLSW110にそれぞれ接続する。
したがって、LSW110には、2つのチャネルIF部11と2つのディスクIF部16から1本ずつ、計4本のアクセスパス131が接続される。また、GSW115へのアクセスパス136が1本接続される。
【0037】
実施例1と同様にGSW115を使わずに、アクセスパス136をメモリコントローラ101に直接接続しても本発明を実施する上で問題ない。そうすることにより、GSW115で発生するデータ転送処理のオーバヘッドを削減することが可能となり、性能が向上する。
GSW115を使わない場合、1つのLSW110から1つのメモリコントローラ101へのアクセスルートを2つ確保し、耐障害性を向上するためには、LSW110にアクセスパス136を2本接続し、それぞれを異なるメモリコントローラ101へ接続する。
また実施例1と同様に、図9において、GSW115とグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nといっしょに、1つの筐体の中に実装しても良い。また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
【0038】
本実施例において、ホストコンピュータ3からストレージシステムへのデータの読み出し/書き込みを行う場合の、ストレージシステム1内の各部の動作は、実施例1の処理においてローカル共有メモリ22における処理を全てグローバル共有メモリ21で行うことを除いて、実施例1と同様である。
【0039】
本実施例によれば、ホストコンピュータ3は要求データがどのディスク制御クラスタに繋がるディスク装置2に格納されているかを意識することなく、自身が繋がるディスク制御クラスタにアクセス要求を発行するだけで、データの書き込み及び読出しを行うことが可能になり、ホストコンピュータ3に対して、複数台のディスク制御クラスタ1−1乃至1−nを1つのストレージシステム1に見せることが可能となる。
そして、ディスク制御クラスタが1個だけの小規模な構成からディスク制御クラスタが数十個接続された超大規模な構成まで、ディスク制御クラスタ単体が持つ高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することが可能となる。
【0040】
《実施例5》
図10に、本発明の一実施例を示す。
以下の実施例において、相互結合網はスイッチを利用したものを例にして説明してあるが、相互に接続され制御情報やデータが転送されれば良いのであり、例えばバスで構成されても良い。
図10に示すように、ストレージシステム1は複数のディスク制御クラスタ1−1乃至1−nから構成される。
ディスク制御クラスタ1−1乃至1−nは、ホストコンピュータ3とのインターフェース部(チャネルIF部)13と、ディスク装置2とのインターフェース部(ディスクIF部)18と、メモリ1:25とメモリ2:26を有するローカル共有メモリ部22を有し、チャネルIF部13及びディスクIF部18とメモリ2の間は、ディスク制御クラスタ内部では直接接続される。
また、チャネルIF部13及びディスクIF部18は複数のディスク制御クラスタ1−1乃至1−nに跨る相互結合網1:32を介して接続され、グローバル共有メモリ部21は相互結合網1:32に接続される。すなわち、相互結合網1:32を介して、全てのチャネルIF部13及びディスクIF部18から、グローバル共有メモリ部21へアクセス可能な構成となっている。
また、チャネルIF部13及びディスクIF部18とメモリ1の間は、複数のディスク制御クラスタ1−1乃至1−nに跨る相互結合網2:33を介して接続される。
【0041】
チャネルIF部13の具体的な一例を図14に示す。
チャネルIF部13は、ホストコンピュータ3との2つのIF(ホストIF)202と、ホストコンピュータ3に対する入出力を制御する2つのマイクロプロセッサ201と、グローバル共有メモリ部21あるいはメモリ2:26へのアクセスを制御するアクセス制御部1(メモリアクセス制御部1)207と、メモリ1:25へのアクセスを制御するアクセス制御部2(メモリアクセス制御部2)208とを有し、ホストコンピュータ3とメモリ1間のデータ転送、及びマイクロプロセッサ201とグローバル共有メモリ部21あるいはメモリ2間の制御情報の転送を実行する。
マイクロプロセッサ201及びホストIF202は内部バス205によって接続され、メモリアクセス制御部207は内部バス205に接続され、メモリアクセス制御部208は2つのホストIF202に直接接続され、また内部バス205に接続されている。
【0042】
ディスクIF部18の具体的な一例を図15に示す。
ディスクIF部18は、ディスク装置2との2つのIF(ドライブIF)203と、ディスク装置2に対する入出力を制御する2つのマイクロプロセッサ201と、グローバル共有メモリ部21あるいはメモリ2へのアクセスを制御するアクセス制御部1(メモリアクセス制御部1)207と、メモリ1へのアクセスを制御するアクセス制御部2(メモリアクセス制御部2)208とを有し、ディスク装置2とメモリ1間のデータ転送、及びマイクロプロセッサ201とグローバル共有メモリ部21あるいはメモリ2間の制御情報の転送を実行する。
マイクロプロセッサ201及びドライブIF203は内部バス205によって接続され、メモリアクセス制御部207は内部バス205に接続され、メモリアクセス制御部208は2つのドライブIF203に直接接続され、また内部バス205に接続されている。ディスクIF部18はRAID機能の実行も行う。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良いが、それ自体1つのディスク制御装置として機能を備えているものである。
【0043】
ストレージシステムの具体的な一例は、チャネルIF部13及びディスクIF部18とメモリ2:26と相互結合網1:32とグローバル共有メモリ21との接続構成は、実施例3の図7に示す構成と同様になる。
また、チャネルIF部13及びディスクIF部18とメモリ1と相互結合網2:33との接続構成は、実施例1の図3に示す構成においてグローバル共有メモリ21を除いた構成と同様になる。
【0044】
グローバル共有メモリ部21は、ディスク制御クラスタ1−1乃至1−nの管理情報(例えば、各ディスク制御クラスタが管理する記憶領域の情報や、ディスク制御クラスタの稼動状況及び構成情報等)を格納する。
メモリ1は、ディスク装置2に記録するデータを一時的に格納する。
また、メモリ2は、ディスク制御クラスタの制御情報(例えば、チャネルIF部13及びディスクIF部18とメモリ1:25との間のデータ転送制御に関する情報、ディスク装置2に記録するデータの管理情報等)を格納する。
図10において、相互結合網1:32を形成するディスク制御クラスタ外のスイッチ及び相互結合網2:33を形成するディスク制御クラスタ外のスイッチとグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nと一緒に、1つの筐体の中に実装しても良い。また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
【0045】
図10において、ディスク制御装置1−1に接続されたホストコンピュータ3からストレージシステム1に記録されたデータを読み出す場合の一例を述べる。
まず、ホストコンピュータ3は、自身が接続されているディスク制御クラスタ1−1内のチャネルIF部13にデータの読出し要求を発行する。
要求を受けたチャネルIF部13内のマイクロプロセッサ201は、自ディスク制御クラスタ1−1内のメモリ2:26にアクセスし、要求されたデータがどのディスク装置2内に格納されているかを調べる。メモリ2:26には、要求データのアドレスとそのデータが実際に記録されているディスク装置2内のアドレスを対応させる変換テーブルが格納されており、要求されたデータがどのディスク装置2内に格納されているかを調べることができる。
要求されたデータが自ディスク制御クラスタ1−1に接続されたディスク装置2に格納されていた場合、要求を受けたチャネルIF部13内のマイクロプロセッサ201は、さらに自ディスク制御クラスタ1−1内のメモリ2:26にアクセスし、要求されたデータがメモリ1:25に格納されているかどうかを確認する。メモリ2:26にはメモリ1:25に格納されているデータのディレクトリ情報が格納されており、メモリ1:25に要求データが存在するかどうかを確認できる。
それにより自ディスク制御クラスタ1−1のメモリ1:25にデータがあった場合は、そのデータをチャネルIF部13まで転送し、ホストコンピュータ3に送る。
【0046】
自ディスク制御クラスタ1−1のメモリ1:25にデータが存在しなかった場合は、チャネルIF部13内のマイクロプロセッサ201は要求データが格納されているディスク装置2が接続されているディスクIF部18内のマイクロプロセッサ201に対し、要求データを読出し、メモリ1:25に格納するように、メモリ2:26の制御情報を発行し、この制御情報の発行を受けたディスクIF部18内のマイクロプロセッサ201は、要求データが格納されているディスク装置2からデータを読出し、自ディスク制御クラスタ1−1内のメモリ1:25に要求データを転送し格納する。
すなわち、チャネルIF部13のマイクロプロセッサ201は、上記データ要求の処理内容を示す制御情報を発行し、メモリ部2:26の制御情報領域(ジョブ制御ブロック)に格納する。
ディスクIF部18のマイクロプロセッサ201は、メモリ部2:26の制御情報領域をポーリングで監視し、上記発行された制御情報が上記制御情報領域(ジョブ制御ブロック)に存在した場合は、要求データが格納されているディスク装置2からデータを読出し、自ディスク制御クラスタ1−1内のメモリ1:25に要求データを転送し格納する。
ディスクIF部18内のマイクロプロセッサ201は、要求データをメモリ1:25へ格納した後、制御情報を発行したチャネルIF部13内のマイクロプロセッサ201に、メモリ1:25内のデータを格納したアドレスを、メモリ2:26内の制御情報を介して伝える。それを受けたチャネルIF部13内のマイクロプロセッサ201は、メモリ1:25からデータを読出し、ホストコンピュータ3へ送る。
すなわち、ディスクIF部18内のマイクロプロセッサ201は、要求データをメモリ1:25へ格納した後、処理の実行の終了とデータを格納したアドレスを示す制御情報を発行し、メモリ2:26の制御情報領域に格納する。
前記制御情報を発行したチャネルIF部13内のマイクロプロセッサ201は、メモリ2:26の制御情報領域をポーリングで監視し、ディスクIF部18内のマイクロプロセッサ201から発行された制御情報が存在する場合、メモリ1:25内のデータを格納したアドレスによりメモリ1:25からデータを読出し、チャネルIF部13まで転送し、さらにホストコンピュータ3に送る。
【0047】
要求されたデータが自ディスク制御クラスタ1−1に接続されたディスク装置2に格納されていなかった場合、要求を受けたチャネルIF部13内のマイクロプロセッサ201は、相互結合網1:32を介してグローバル共有メモリ部21にアクセスし、要求されたデータが格納されているディスク装置2が接続されているディスク制御クラスタを調べる。
グローバル共有メモリ部21には、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルが格納されており、要求されたデータがどのディスク制御クラスタに格納されているかを調べることができる。
【0048】
要求されたデータがディスク制御クラスタ1−nに接続されたディスク装置2に格納されていた場合、要求を受けたチャネルIF部13内のマイクロプロセッサ201は、グローバル共有メモリ部21を介してディスク制御クラスタ1−nに要求データをディスク制御クラスタ1−n内のメモリ1:25へ格納するように要求する。
グローバル共有メモリ部21の中には、ディスク制御クラスタ間でデータ要求の受け渡しを行う制御情報を格納する領域があり、その領域は要求先のディスク制御クラスタ毎に分割されており、要求を受けたチャネルIF部13内のマイクロプロセッサ201は、ディスク制御クラスタ1−nの領域に要求データをディスク制御クラスタ1−n内のメモリ1:25へ格納するよう要求する情報を要求データのアドレスとともに格納する。
ディスク制御クラスタ1−n内のディスクIF部18内のマイクロプロセッサ201は、グローバル共有メモリ21内の自ディスク制御クラスタへの要求領域をポーリングで監視している。
データを要求する制御情報を格納する要求領域にデータ要求があった場合、要求されたデータが自ディスク制御クラスタ1−n内のメモリ1:25内に格納されているかどうかを確認する。
メモリ2:26内にはメモリ1:25に格納されたデータのディレクトリ情報が格納されており、メモリ1:25内に要求データが存在するかどうかを確認できる。
それにより自ディスク制御クラスタ1−nのメモリ1:25内にデータがあった場合は、上記と同様にして、グローバル共有メモリ21を介してディスク制御クラスタ1−1内のデータ要求を受けたチャネルIF部13内のマイクロプロセッサ201にディスク制御クラスタ1−n内のメモリ1:25へ格納したことを伝える。
それを受け、ディスク制御クラスタ1−1内のデータ要求を受けたチャネルIF部13内のマイクロプロセッサ201は、相互結合網2:33を介してディスク制御クラスタ1−n内のメモリ1:25から要求データを転送し、ホストコンピュータ3に送る。
【0049】
ディスク制御クラスタ1−nのメモリ1:25内にデータが存在しなかった場合は、ディスク制御クラスタ1−nのディスクIF部18内のマイクロプロセッサ201は、要求データが格納されているディスク装置2が接続されているディスクIF部18内のマイクロプロセッサ201に対し、要求データを読出し、メモリ1:25に格納するデータ要求の処理内容を示す制御情報を発行し、メモリ2:26の制御情報領域(ジョブ制御ブロック)に格納する。
ディスクIF部18内のマイクロプロセッサ201は、メモリ2:26の制御情報領域をポーリングで監視し、上記発行された制御情報が上記制御情報領域(ジョブ制御ブロック)に存在した場合は、要求データが格納されているディスク装置2からデータを読出し、相互結合網2:33を介して、自ディスク制御クラスタ1−n内のメモリ1:25に要求データを転送し格納する。
その後の処理は、上記メモリ1:25に要求データがあった場合の処理と同様である。
【0050】
制御情報とデータはデータ長が数千倍異なるため、1回のデータ転送時間がかなり異なる。このため、同じ相互結合網及びメモリを用いた場合、両者が互いの転送を妨げる。本実施例によれば、制御情報を転送する相互結合網1:32とデータを転送する相互結合網2:33を分けることができるため、両者が互いの転送を妨げることがなくなるため、性能が向上する。
【0051】
《実施例6》
図11に、本発明の一実施例を示す。
図11に示すように、ディスク制御ユニット1−1乃至1−nからなるストレージシステム1の構成は、チャネルIF部13及びディスクIF部18とメモリ1:25及び相互結合網2:33の間の接続構成を除いて、実施例5の図10に示す構成と同様である。
チャネルIF部13及びディスクIF部18とメモリ1:25の間は、ディスク制御クラスタ内では直接接続されている。また、複数のディスク制御クラスタ1−1乃至1−n間では、メモリ1:25は相互結合網2:33を介して接続される。
【0052】
上記のように、この実施例ではディスク制御ユニット1−1乃至1−n内においてチャネルIF部13及びディスクIF部18とメモリ1:25を直接接続することにより、実施例5で示した相互結合網2:33を介して接続する場合に比べ、メモリ1:25へのアクセス時間を短縮することが可能になる。
チャネルIF部13及びディスクIF部18の構成は、それぞれ図14、図15に示す実施例5の構成と同様である。
1つのディスク制御クラスタは1つの筐体として構成されるか、またはモジュールとして構成されても良いが、それ自体1つのディスク制御装置として機能を備えているものである。
【0053】
ストレージシステム1の具体的な一例は、チャネルIF部13及びディスクIF部18とメモリ2:26と相互結合網1:32とグローバル共有メモリ21との接続構成は、実施例3の図7に示す構成と同様になる。また、チャネルIF部13及びディスクIF部18とメモリ1:25と相互結合網2:33との接続構成は、実施例2の図5に示す構成においてグローバル共有メモリ部21を除いた構成と同様になる。
グローバル共有メモリ部21は、ディスク制御クラスタ1−1乃至1−nの管理情報(例えば、各ディスク制御クラスタが管理する記憶領域の情報や、ディスク制御クラスタの稼動状況及び構成情報等)を格納する。
メモリ1:25は、ディスク装置2に記録するデータを一時的に格納する。
また、メモリ2:26は、ディスク制御クラスタの制御情報(例えば、チャネルIF部13及びディスクIF部18とメモリ1:25との間のデータ転送制御に関する情報、ディスク装置2に記録するデータの管理情報等)を格納する。
【0054】
図11において、相互結合網1:32を形成するディスク制御クラスタ外のスイッチ及び相互結合網2:33を形成するディスク制御クラスタ外のスイッチとグローバル共有メモリ部21をボックスに実装し、モジュール化した各ディスク制御クラスタ1−1乃至1−nといっしょに、1つの筐体の中に実装しても良い。また、各ディスク制御クラスタ1−1乃至1−nを別個の筐体として、距離的に離れた場所に分散しても良い。
本実施例において、ホストコンピュータ3からストレージシステムへのデータの読み出し/書き込みを行う場合の、ストレージシステム1内の各部の動作は、チャネルIF部13及びディスクIF部18からメモリ1:25へのアクセスが直接になることと、チャネルIF部13及びディスクIF部18から他のディスク制御クラスタのメモリ1へのアクセスがメモリ1:25のメモリコントローラ(図示せず)を介して行われることを除いて、実施例5と同様である。
制御情報とデータはデータ長が数千倍異なるため、1回のデータ転送時間がかなり異なる。このため、同じ相互結合網及びメモリを用いた場合、両者が互いの転送を妨げる。本実施例によれば、制御情報を転送する相互結合網1:32とデータを転送する相互結合網2:33を分けることができるため、両者が互いの転送を妨げることがなくなるため、性能が向上する。
【0055】
《実施例7》
図16〜図18に、実施例1のストレージシステム1におけるディスク制御クラスタの増設手順の一例を示す。
図16に示すように、スイッチボックス310は、別筐体として実装されている。
スイッチボックス310内には、GSW115とグローバル共有メモリ21が実装されている。
スイッチボックス310はコネクタ321、コネクタ322をそれぞれ8個有し、ディスク制御クラスタを8クラスタ接続することができる。図ではディスク制御クラスタを3クラスタ接続した場合について示している。
GSW115のアクセスパス136は1本ずつコネクタ321、コネクタ322に接続される。上記個数は一実施例に過ぎず、個数を上記に限定するものではない。
各ディスク制御クラスタ1−1乃至1−3は、それぞれ筐体301乃至303に実装されている。筐体301乃至303はコネクタ321、コネクタ322を有し、2本のアクセスパス136がそれぞれに1本ずつ接続されている。
スイッチボックス310に、ケーブル331、ケーブル332を介してそれぞれのコネクタ321、コネクタ322により筐体301、302、303が接続される。
【0056】
ストレージシステム1において、ディスク制御クラスタを増設する場合は、次の手順による。
スイッチボックス310にディスク制御クラスタを増設するコネクタに余分があれば、そのコネクタにケーブル331、ケーブル332を接続する。
余分がなければ、GSWのみを実装したスイッチボックスを用意し、スイッチボックスを多段に接続した上でそのコネクタにケーブル331、ケーブル332を接続する。
それと共に、図17に示すGSW115のポートに接続されるディスク制御クラスタを示す、言い換えるとストレージシステム1を構成しているディスク制御クラスタを示すGSWポート−クラスタ対応テーブル400と、図18に示すディスク制御クラスタが管理する論理ボリュームを示すGSWポート−クラスタ対応テーブル405とを書き換える。
GSWポート−クラスタ対応テーブル400とGSWポート−クラスタ対応テーブル405はグローバル共有メモリ部21に格納されており、サービスプロセッサ(SVP)により書き換えることが可能である。
SVPは通常ノートパソコンであることが多く、ノートパソコンのディスプレイ上に図17及び図18に示すテーブルが表示され、そこで内容を書き換える。
【0057】
図17及び図18は、それぞれディスク制御クラスタの増設前、増設後のGSWポート−クラスタ対応テーブル400及びGSWポート−クラスタ対応テーブル405を示している。
ここでは、ストレージシステム1が増設前に5台のディスク制御クラスタで構成されており、そこに1台のディスク制御クラスタを増設する例を示している。
図17に示すように、GSWポート番号401の4番ポートが未接続となっており、そのポートにクラスタ5のケーブルを接続した後、SVPのディスプレイ上でポート番号4の行のクラスタ番号402の列の未接続表示を5に書き換える。
その後、図18に示すように、クラスタ番号402のクラスタ5の行の論理ボリューム番号406の列の未接続表示を16640〜20735に書き換える。ここで、論理ボリューム番号406は各クラスタが管理する論理ボリュームの範囲を示している。
増設前の論理ボリューム番号の最大値は16639で、ディスク制御クラスタは4096個の論理ボリュームを持っているため、ディスク制御クラスタ5の管理する論理ボリュームの範囲は16640〜20735となる。論理ボリューム番号は連続せず飛び飛びになっていても問題ない。
上記のようにすることで、ストレージシステムに新たにディスク制御クラスタを増設することができる。
【0058】
【発明の効果】
本発明によれば、複数台のディスク制御クラスタを1つのシステムとして運用するストレージシステムにおいて、ディスク制御クラスタが1個だけの小規模な構成からディスク制御クラスタが数十個接続された超大規模な構成まで、ディスク制御クラスタ単体が持つ高信頼・高性能なアーキテクチャで対応可能な、スケーラビリティのある構成のストレージシステムを提供することが可能となる。
【図面の簡単な説明】
【図1】本発明によるストレージシステムの実施例1の構成を示す図である。
【図2】従来の複数のディスク制御装置の構成を示す図である。
【図3】図1に示す実施例1のストレージシステムの詳細構成を示す図である。
【図4】本発明によるストレージシステムの実施例2の構成を示す図である。
【図5】図4に示す実施例2のストレージシステムの詳細構成を示す図である。
【図6】本発明によるストレージシステムの実施例3の構成を示す図である。
【図7】図6に示す実施例3のストレージシステムの詳細構成を示す図である。
【図8】本発明によるストレージシステムの実施例4の構成を示す図である。
【図9】図8に示す実施例4のストレージシステムの詳細構成を示す図である。
【図10】本発明によるストレージシステムの実施例5の構成を示す図である。
【図11】本発明によるストレージシステムの実施例6の構成を示す図である。
【図12】本発明によるストレージシステムを構成するチャネルインターフェース部の構成を示す図である。
【図13】本発明によるストレージシステムを構成するディスクインターフェース部の構成を示す図である。
【図14】本発明によるストレージシステムを構成するチャネルインターフェース部の他の構成を示す図である。
【図15】本発明によるストレージシステムを構成するディスクインターフェース部の他の構成を示す図である。
【図16】本発明によるディスク制御クラスタの増設方法を説明するための図である。
【図17】グローバル共有メモリ部内に格納されたストレージシステムの構成情報の一例を示す図である。
【図18】グローバル共有メモリ部内に格納されたストレージシステムの構成情報の他の一例を示す図である。
【符号の説明】
1 ストレージシステム
1−1、1−n ディスク制御クラスタ
2 ディスク装置
3 ホストコンピュータ
11、12、13 チャネルIF部
16、17、18 ディスクIF部
21 グローバル共有メモリ部
22 ローカル共有メモリ部
31、32、33 相互結合網

Claims (19)

  1. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報及び前記ディスク装置の管理情報を格納するローカル共有メモリ部とを有し、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部との間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部との間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、
    要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を有するストレージシステムであって、
    該各ディスク制御クラスタと他の各ディスク制御クラスタは相互結合網に接続され、該相互結合網に前記グローバル共有メモリ部が接続されたことを特徴とするストレージシステム。
  2. 請求項1記載のストレージシステムにおいて、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部と前記ローカル共有メモリ部とが接続された接続部と他の各ディスク制御クラスタ内の該接続部が前記相互結合網を介して接続されたことを特徴とするストレージシステム。
  3. 請求項1記載のストレージシステムにおいて、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部に前記ディスク制御クラスタ内で直接接続され、該各ディスク制御クラスタ内の該ローカル共有メモリ部と他の各ディスク制御クラスタ内の該ローカル共有メモリ部が前記相互結合網を介して接続されたことを特徴とするストレージシステム。
  4. 請求項1記載のストレージシステムにおいて、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部に前記ディスク制御クラスタ内で直接接続され、
    該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との接続部と他の各ディスク制御クラスタ内の該接続部が前記相互結合網を介して接続されたことを特徴とするストレージシステム。
  5. 請求項1記載のストレージシステムにおいて、
    前記グローバル共有メモリ部は、前記ディスク制御クラスタの外部に配置されたことを特徴とするストレージシステム。
  6. 請求項1記載のストレージシステムにおいて、
    前記グローバル共有メモリ部は、前記ディスク制御クラスタが実装された筐体とは別の筐体に実装されたことを特徴とするストレージシステム。
  7. 請求項6記載のストレージシステムにおいて、
    前記グローバル共有メモリ部が実装された筐体は、前記ディスク制御クラスタが実装された筐体に搭載されたことを特徴とするストレージシステム。
  8. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、該1または複数のチャネルインターフェース部と該1または複数のディスクインターフェース部を接続する接続部を有する複数のディスク制御クラスタと、
    前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報、前記ディスク装置の管理情報、及び、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を有するストレージシステムであって、
    前記各ディスク制御クラスタ内の接続部と他の各ディスク制御クラスタ内の該接続部が相互結合網を介して接続され、該相互結合網に前記グローバル共有メモリ部が接続されたことを特徴とするストレージシステム。
  9. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、
    前記ディスク装置に対しリード/ライトされるデータを格納する第1のメモリと、前記チャネルインターフェース部及び前記ディスクインターフェース部と前記第1のメモリとの間のデータ転送に関する制御情報及び前記ディスク装置の管理情報を格納する第2のメモリとを有するローカル共有メモリ部とを有し、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部内の前記第1のメモリとの間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部内の前記第1のメモリとの間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、
    要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を有するストレージシステムであって、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第2のメモリに前記ディスク制御クラスタ内で直接接続され、
    該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との第1の接続部と他の各ディスク制御クラスタ内の該第1の接続部が第1の相互結合網を介して接続され、
    前記グローバル共有メモリ部が該第1の相互結合網に接続され、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部と前記ローカル共有メモリ部の第1のメモリとが接続された第2の接続部と他の各ディスク制御クラスタ内の該第2の接続部が第2の相互結合網を介して接続されたことを特徴とするストレージシステム。
  10. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、
    前記ディスク装置に対しリード/ライトされるデータを格納する第1のメモリと、前記チャネルインターフェース部及び前記ディスクインターフェース部と前記第1のメモリとの間のデータ転送に関する制御情報及び前記ディスク装置の管理情報を格納する第2のメモリとを有するローカル共有メモリ部とを有し、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部内の前記第1のメモリとの間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部内の前記第1のメモリとの間のデータ転送を実行することにより、データのリード/ライトを行う複数のディスク制御クラスタと、
    要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を有するストレージシステムであって、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第2のメモリに前記ディスク制御クラスタ内で直接接続され、
    該各ディスク制御クラスタ内の該チャネルインターフェース部と前記ディスクインターフェース部との第1の接続部と他の各ディスク制御クラスタ内の該第1の接続部が第1の相互結合網を介して接続され、
    前記グローバル共有メモリ部が該第1の相互結合網に接続され、
    前記各ディスク制御クラスタ内の前記チャネルインターフェース部と前記ディスクインターフェース部が前記ローカル共有メモリ部の第1のメモリに前記ディスク制御クラスタ内で直接接続され、
    該各ディスク制御クラスタ内の該ローカル共有メモリ部の第1のメモリと他の各ディスク制御クラスタ内の該ローカル共有メモリ部の第1のメモリが第2の相互結合網を介して接続されたことを特徴とするストレージシステム。
  11. 請求項1〜4、9〜10のいずれかの請求項記載のストレージシステムにおいて、
    前記ローカル共有メモリ部は該ローカル共有メモリが属する前記ディスク制御クラスタが管理する記憶領域を示す情報を格納しており、前記グローバル共有メモリ部は、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納しており、
    前記チャネルインターフェース部内のプロセッサは、前記ホストコンピュータから前記ディスク制御クラスタの前記チャネルインターフェース部にデータのリード/ライト要求があった場合、該ディスク制御クラスタ内の前記ローカル共有メモリ部にアクセスし、該ディスク制御クラスタが管理する記憶領域内に前記要求のデータが格納されているか否か判定し、格納されていなかった場合、前記グローバル共有メモリ部へアクセスし、前記要求データが格納されているディスク制御クラスタを調べる手段を有することを特徴とするストレージシステム。
  12. 請求項11記載のストレージシステムにおいて、
    前記グローバル共有メモリ部には、要求されたデータがどのディスク制御クラスタに格納されているかを調べるための、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルが格納されていることを特徴とするストレージシステム。
  13. 請求項12記載のストレージシステムにおいて、
    前記要求されたデータがディスク制御クラスタ1−nに接続されたディスク装置に格納されていた場合、要求を受けたチャネルインターフェース部内のマイクロプロセッサは、前記グローバル共有メモリ部を介してディスク制御クラスタ1−nに対して要求データをディスク制御クラスタ1−n内のローカル共有メモリ部へ格納するように要求することを特徴とするストレージシステム。
  14. 請求項11記載のストレージシステムにおいて、
    前記グローバル共有メモリ部の中にディスク制御クラスタ間でデータ要求の受け渡しを行う制御情報を格納する領域を設け、該領域は要求先のディスク制御クラスタ毎に分割され、要求を受けたチャネルインターフェース部内のマイクロプロセッサは、ディスク制御クラスタ1−nの制御情報を格納する領域に、要求データをディスク制御クラスタ1−n内のローカル共有メモリ部へ格納するよう要求する情報を要求データのアドレスとともに格納することを特徴とするストレージシステム。
  15. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報及び前記ディスク装置の管理情報を格納するローカル共有メモリ部と、該チャネルインターフェース部と該ディスクインターフェース部と該ローカル共有メモリ部とが接続された第1の接続部を有し、
    前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部との間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部との間のデータ転送を実行することによりデータのリード/ライトを行うディスク制御クラスタであって、
    該ディスク制御クラスタの第1の接続部は、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部が接続された第2の接続部への接続パスを有することを特徴とするディスク制御クラスタ。
  16. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報及び前記ディスク装置の管理情報を格納するローカル共有メモリ部とを有し、
    該ローカル共有メモリ部に該チャネルインターフェース部と該ディスクインターフェース部が接続され、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部との間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部との間のデータ転送を実行することにより、データのリード/ライトを行うディスク制御クラスタであって、
    該ディスク制御クラスタのローカル共有メモリ部は、要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部が接続された第2の接続部への接続パスを有することを特徴とするディスク制御クラスタ。
  17. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報及び前記ディスク装置の管理情報を格納するローカル共有メモリ部と、該チャネルインターフェース部と該ディスクインターフェース部とが接続された第1の接続部を有し、
    該ローカル共有メモリ部に該チャネルインターフェース部と該ディスクインターフェース部が接続され、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部との間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部との間のデータ転送を実行することによりデータのリード/ライトを行う複数のディスク制御クラスタと、
    要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を備え、
    該グローバル共有メモリ部は第2の接続部に接続パスで接続され、前記各ディスク制御クラスタの第1の接続部は該第2の接続部に接続パスで接続されたことを特徴とするストレージシステム。
  18. ホストコンピュータとのインターフェースを有する1または複数のチャネルインターフェース部と、ディスク装置とのインターフェースを有する1または複数のディスクインターフェース部と、前記ディスク装置に対しリード/ライトされるデータと前記データの転送に関する制御情報及び前記ディスク装置の管理情報を格納するローカル共有メモリ部と、該チャネルインターフェース部と該ディスクインターフェース部とが接続された第1の接続部を有し、
    該ローカル共有メモリ部に該チャネルインターフェース部と該ディスクインターフェース部が接続され、前記チャネルインターフェース部は前記ホストコンピュータからのデータのリード/ライト要求に対し、前記ホストコンピュータとのインターフェースと前記ローカル共有メモリ部との間のデータ転送を実行し、前記ディスクインターフェース部は、前記ディスク装置と前記ローカル共有メモリ部との間のデータ転送を実行することによりデータのリード/ライトを行う複数のディスク制御クラスタと、
    要求データのアドレスとそのデータが格納されているディスク装置が接続されたディスク制御クラスタを対応させる変換テーブルと、データの受け渡しを要求するための制御情報及び要求データのアドレスとを含む前記各ディスク制御クラスタの管理情報及び前記各ディスク制御クラスタの稼動状況及び前記各ディスク制御クラスタの構成情報を格納するグローバル共有メモリ部を備え、
    該グローバル共有メモリ部は第2の接続部に接続パスで接続され、前記各ディスク制御クラスタの第1の接続部は該第2の接続部に接続パスで接続されたストレージシステムにおいて、
    前記各ディスク制御クラスタを実装した各ディスク制御クラスタの筐体に前記第1の接続部を接続した1以上の第1のコネクタを設け、
    前記グローバル共有メモリ部と該グローバル共有メモリ部を接続した前記第2の接続部を実装した筐体に第2の接続部を接続した複数の第2のコネクタを設け、
    ストレージシステムを構成する前記各ディスク制御クラスタの第1のコネクタと前記第2のコネクタを接続パスにより接続し、
    ストレージシステムにディスク制御クラスタを増設する時、増設したディスク制御クラスタの第1のコネクタを接続パスにより前記第2のコネクタに電気的に接続することを特徴とするディスク制御クラスタの増設方法。
  19. 請求項18記載のディスク制御クラスタの増設方法において、
    前記グローバル共有メモリ部は、前記第2の接続部が有する前記各第2のコネクタに前記ディスク制御クラスタが接続されているか否かを示す第1のテーブルと、該第2のコネクタに接続されている前記ディスク制御クラスタが管理する記憶領域を示す第2のテーブルを格納しており、前記ディスク制御クラスタを増設するのに伴い、前記第1、第2のテーブルに増設された前記ディスク制御クラスタに関する有効な情報を追加することを特徴とするディスク制御クラスタの増設方法。
JP2001294048A 2001-09-26 2001-09-26 ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法 Expired - Fee Related JP4721379B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001294048A JP4721379B2 (ja) 2001-09-26 2001-09-26 ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法
US10/067,332 US6868438B2 (en) 2001-09-26 2002-02-07 Storage system, disk control cluster and a method of increasing of disk control cluster
US11/006,592 US7260613B2 (en) 2001-09-26 2004-12-08 Storage system, disk control cluster including channel interface units, disk interface units, local shared memory units, and connection portions, and a method of increasing of disk control cluster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001294048A JP4721379B2 (ja) 2001-09-26 2001-09-26 ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法

Publications (2)

Publication Number Publication Date
JP2003099206A JP2003099206A (ja) 2003-04-04
JP4721379B2 true JP4721379B2 (ja) 2011-07-13

Family

ID=19115717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001294048A Expired - Fee Related JP4721379B2 (ja) 2001-09-26 2001-09-26 ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法

Country Status (2)

Country Link
US (2) US6868438B2 (ja)
JP (1) JP4721379B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272848B1 (en) 2001-02-13 2007-09-18 Network Appliance, Inc. Method for device security in a heterogeneous storage network environment
US8966081B1 (en) 2002-02-13 2015-02-24 Netapp, Inc. Method for device security in a heterogeneous storage network environment
JP4413518B2 (ja) * 2003-04-16 2010-02-10 株式会社日立製作所 記憶デバイス制御装置、及び記憶デバイス制御装置の制御方法
JP4462852B2 (ja) * 2003-06-23 2010-05-12 株式会社日立製作所 ストレージシステム及びストレージシステムの接続方法
US7340639B1 (en) * 2004-01-08 2008-03-04 Network Appliance, Inc. System and method for proxying data access commands in a clustered storage system
JP4405277B2 (ja) * 2004-02-16 2010-01-27 株式会社日立製作所 ディスク制御装置
US7467238B2 (en) * 2004-02-10 2008-12-16 Hitachi, Ltd. Disk controller and storage system
JP4441286B2 (ja) * 2004-02-10 2010-03-31 株式会社日立製作所 ストレージシステム
JP4684605B2 (ja) * 2004-09-17 2011-05-18 株式会社日立製作所 情報伝達方法及びホスト装置
US8073899B2 (en) * 2005-04-29 2011-12-06 Netapp, Inc. System and method for proxying data access commands in a storage system cluster
JP2006318012A (ja) * 2005-05-10 2006-11-24 Hitachi Ltd ディスク制御システム
KR100864834B1 (ko) * 2007-04-30 2008-10-23 한국전자통신연구원 메모리 재할당을 이용한 다중 프로세서 간의 데이터 전송장치 및 방법
US8448004B2 (en) * 2008-10-27 2013-05-21 Netapp, Inc. Power savings using dynamic storage cluster membership
US8843682B2 (en) * 2010-05-18 2014-09-23 Lsi Corporation Hybrid address mutex mechanism for memory accesses in a network processor
CN102129400B (zh) 2010-12-29 2013-12-04 华为数字技术(成都)有限公司 存储系统连接配置方法、设备及其存储系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5155845A (en) * 1990-06-15 1992-10-13 Storage Technology Corporation Data storage system for providing redundant copies of data on different disk drives
US5428803A (en) * 1992-07-10 1995-06-27 Cray Research, Inc. Method and apparatus for a unified parallel processing architecture
JP3160149B2 (ja) * 1994-05-13 2001-04-23 株式会社日立製作所 ディスク制御装置の無停止プログラム変更方法およびディスク制御装置
JP3732869B2 (ja) * 1995-06-07 2006-01-11 株式会社日立製作所 外部記憶装置
US5682512A (en) * 1995-06-30 1997-10-28 Intel Corporation Use of deferred bus access for address translation in a shared memory clustered computer system
JPH1185659A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd ディスク制御装置及びこれを用いた記憶装置
JP2001515243A (ja) * 1997-09-05 2001-09-18 サン・マイクロシステムズ・インコーポレーテッド クラスタ保護メカニズムを使用する多重処理コンピュータ・システム
US6542961B1 (en) * 1998-12-22 2003-04-01 Hitachi, Ltd. Disk storage system including a switch
JP2000250712A (ja) * 1999-03-02 2000-09-14 Hitachi Ltd ディスクアレイ制御装置
JP2001256003A (ja) * 2000-03-10 2001-09-21 Hitachi Ltd ディスクアレイ制御装置、そのディスクアレイ制御ユニットおよびその増設方法
US6738870B2 (en) * 2000-12-22 2004-05-18 International Business Machines Corporation High speed remote storage controller
JP2001229042A (ja) * 2000-12-28 2001-08-24 Hitachi Ltd ディスク制御装置
JP3704573B2 (ja) * 2001-03-14 2005-10-12 東芝ソリューション株式会社 クラスタシステム
JP4338068B2 (ja) * 2002-03-20 2009-09-30 株式会社日立製作所 ストレージシステム

Also Published As

Publication number Publication date
US6868438B2 (en) 2005-03-15
US20030061297A1 (en) 2003-03-27
JP2003099206A (ja) 2003-04-04
US7260613B2 (en) 2007-08-21
US20050097269A1 (en) 2005-05-05

Similar Documents

Publication Publication Date Title
JP4338068B2 (ja) ストレージシステム
US6647461B2 (en) Disk array controller, its disk array control unit, and increase method of the unit
JP4721379B2 (ja) ストレージシステム、ディスク制御クラスタおよびディスク制御クラスタの増設方法
US7249220B2 (en) Storage system
KR100261378B1 (ko) 어댑터들이상이한호스트컴퓨터에존재하는어레이에대한주콘트롤러및보조콘트롤러로서작용하도록함으로써복수의저장어레이를공유하기위한시스템및방법
JP4508612B2 (ja) クラスタ型ストレージシステム及びその管理方法
US20070079066A1 (en) Storage device control apparatus and control method for the storage device control apparatus
US7577778B2 (en) Expandable storage apparatus for blade server system
JP2003140837A (ja) ディスクアレイ制御装置
JP2008004120A (ja) ダイレクトアクセスストレージシステム
JP2005227807A (ja) ストレージシステム
US7725664B2 (en) Configuration definition setup method for disk array apparatus, and disk array apparatus
US20060242361A1 (en) Cluster-type storage system and managing method of the cluster-type storage system
JP2007018539A (ja) ディスクアレイ制御装置およびディスクアレイ制御ユニット
US20080147933A1 (en) Dual-Channel Network Storage Management Device And Method
US7366797B2 (en) Data storage system with shared cache address space
JP2002182864A (ja) ディスクアレイ制御装置
JP2006293501A (ja) ストレージシステム、構成管理方法、及びプログラム
JP2004164657A (ja) 複合計算機システムおよび複合i/oシステム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040318

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080813

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081017

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110205

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110402

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees