JP4747203B2 - ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 - Google Patents
ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 Download PDFInfo
- Publication number
- JP4747203B2 JP4747203B2 JP2009020005A JP2009020005A JP4747203B2 JP 4747203 B2 JP4747203 B2 JP 4747203B2 JP 2009020005 A JP2009020005 A JP 2009020005A JP 2009020005 A JP2009020005 A JP 2009020005A JP 4747203 B2 JP4747203 B2 JP 4747203B2
- Authority
- JP
- Japan
- Prior art keywords
- adapter
- suspected
- disk array
- array device
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 89
- 230000005856 abnormality Effects 0.000 claims description 143
- 238000001514 detection method Methods 0.000 claims description 102
- 238000004891 communication Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 42
- 230000007717 exclusion Effects 0.000 description 38
- 238000012544 monitoring process Methods 0.000 description 23
- 230000002159 abnormal effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/008—Reliability or availability analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3419—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
- G06F11/3423—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time where the assessed time is active or idle time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/349—Performance evaluation by tracing or monitoring for interfaces, buses
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
まず、以下の実施例で用いる主要な用語を説明する。「ディスクアレイ装置」とは、RAID(Redundant Arrays of Inexpensive Disks)グループを構成する複数のディスクを搭載し、上位装置であるホストからディスク各々に対して行われるアクセスを制御する装置である。また、「RAID」とは、複数のディスクをまとめて1台のディスクとして管理する技術のことであり、「ディスクアレイ装置」がRAIDグループを構成する複数のディスクを制御することで、高速性や耐障害性などが向上される。
次に、図1を用いて、実施例1に係るディスクアレイ装置の概要を説明する。図1は、実施例1に係るディスクアレイ装置の概要を説明するための図である。
次に、図2〜図4を用いて、実施例1に係るディスクアレイ装置の全体構成について説明する。図2〜図4は、ディスクアレイ装置の全体構成の一例を示すブロック図である。
次に、図5を用いて、実施例1に係るディスクアレイ装置10が有するCMの構成について説明する。図5は、実施例1に係るディスクアレイ装置10の構成を示すブロック図である。図5に示したCM100は、図1に示したCM100a〜100dに対応する。図5に示すように、CM100は、DA121a〜121d又は122a〜122dのいずれかを経由して、図示しないDE部300へアクセスする。
次に、図9〜図15を用いて、実施例1に係るディスクアレイ装置10による処理を説明する。図9は、運用判定・全体フローを示すフローチャートである。図10は、性能情報収集開始処理を示すフローチャートである。図11は、性能情報値収集処理を示すフローチャートである。図12は、性能情報値チェック処理を示すフローチャートである。図13は、DA性能異常チェック処理を示すフローチャートである。図14は、異常検出後処理を示すフローチャートである。図15は、同一経路DA異常検出処理を示すフローチャートである。
まず、ディスアレイ装置10は、被疑DAを検出するための処理を行うか否かが予め決められているので、CM100は、DAの異常検出(性能に異常があると疑われる被疑DAの検出)の論理が、運用状態にあるか否かのチェックを行う(ステップS101)。すなわち、CM100は、ステップS101において、被疑DAを検出するための処理を行う運用状態であるか否かをチェックする。
次に、図9のステップS104における性能情報収集開始処理について詳細に説明する。まず、性能情報収集部131が、性能情報収集開始処理を開始し(ステップS201)、性能情報収集の対象となるDAをチェックする(ステップS202)。
次に、図9のステップS105における性能情報値収集処理について詳細に説明する。まず、性能情報収集部131が、性能情報収集処理を開始し(ステップS301)、性能情報収集の対象となるDAをチェックする(ステップS302)。
次に、図9のステップS106における性能情報値チェック処理について詳細に説明する。まず、被疑DA検出部132が、性能情報値チェック処理を開始する(ステップS401)。
次に、図9のステップS107におけるDA性能異常チェック処理について詳細に説明する。まず、異常通知・排除部133が、DA性能異常チェック処理を開始する(ステップS501)。
次に、図9のステップS109における異常検出後処理について詳細に説明する。まず、異常通知・排除部133は、異常検出後処理を開始する(ステップS601)。
次に、図12のステップS402における同一経路DA異常検出処理について詳細に説明する。まず、被疑DA検出部132は、同一のアクセス経路を制御しているDAについて、異常DA検出のチェック処理を開始する(ステップS701)。
上述してきたように、実施例1に係るディスクアレイ装置10は、ディスクへのアクセス経路となるDA各々の性能に関する情報を収集する。そして、ディスクアレイ装置10は、収集した情報を、同一のアクセス経路を制御しているDA間で相対的に比較し、比較の結果に基づいて性能に異常があると疑われる被疑DAを検出する。これにより、実施例1に係るディスクアレイ装置10は、性能異常が発生しているDAを適切に検出することが可能になる。
ところで、本願に開示するディスクアレイ装置は、上述した実施例以外にも、種々の異なる形態にて実施されてよい。そこで、実施例2では、本願に開示するディスクアレイ装置の他の実施例について説明する。
また、上記実施例1においては、同一経路DAの稼働率はほぼ均等になることが望ましいという立場から説明した。具体的には、上記実施例1では、本来、同一経路DAの稼働率は均等であるはずなので、同一経路DAの稼働率にn倍以上の差があった場合に、稼働率が高いDAを被疑DAとして検出する例を説明した。しかし、ディスクアレイ装置によっては、同一経路DAであっても、稼働率が均等にならないように設計される場合もあり得る。例えば、DA121とDA122とが同一経路DAである場合に、DA121とDA122との稼働率が2:1になるように設計される場合もあり得る。このようなディスクアレイ装置では、DA121とDA122との稼働率に差があっても性能異常が発生しているとは言い切れない。
また、上記実施例1において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる(例えば、異常通知・排除部によって利用される閾値は、ディスクアレイ装置の内部処理で自動生成されても、あるいは、ディスクアレイ装置の運用管理者によって入力されてもよい)。この他、上記文書中や図面中で示した処理手順、制御手順(図8〜15)、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、上記実施例1で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図16を用いて、上記の実施例1と同様の機能を有するディスクアレイ装置制御プログラムを実行するコンピュータの一例を説明する。図16は、ディスクアレイ装置制御プログラムを実行するコンピュータを示す図である。
11a、11b ルータ
12 HOST
13 FCスイッチ
21 CE部
100、100a〜100j CM
111 IO制御部
111a、111b CPU
112 System制御部
113 装置監視部
120 性能情報格納領域部
121、121a〜121j DA
122、122a〜122j DA
130 制御部
131 性能情報収集部
132 被疑DA検出部
133 異常通知・排除部
221a アクセス監視部
300 DE部
310〜340 DE
Claims (7)
- ディスクへのアクセス経路を制御しているアダプタ各々の性能に関する情報として、所定の時間内に行われたアクセスから導出される当該アダプタ各々の稼働率を収集する性能情報収集部と、
前記性能情報収集部によって収集されたアダプタ各々の稼働率を用いて、所定アダプタの稼働率と当該所定アダプタと同一の経路を制御している他のアダプタの稼働率とを比較し、当該所定アダプタの稼働率と他のアダプタの稼動率との差が所定閾値を超える場合に、当該所定アダプタを、性能に異常があると疑われる被疑アダプタとして検出する被疑アダプタ検出部と
を備えたことを特徴とするディスクアレイ装置。 - 前記被疑アダプタ検出部によって被疑アダプタが検出されると、被疑アダプタが検出されたことを通知する通知情報を所定の出力部に出力もしくは通信部を経由して所定の宛先に送信する通知部をさらに備えたことを特徴とする請求項1に記載のディスクアレイ装置。
- 前記被疑アダプタ検出部によって被疑アダプタが検出されると、当該被疑アダプタをアクセス経路の対象から排除する排除部をさらに備えたことを特徴とする請求項1または2に記載のディスクアレイ装置。
- 前記被疑アダプタ検出部は、被疑アダプタが検出されると、当該被疑アダプタについて当該検出の情報を加点形式で蓄積し、
前記通知部は、前記被疑アダプタ検出部によって蓄積された情報の点数が所定の閾値を超過したことを条件として、前記通知情報を出力もしくは送信することを特徴とする請求項2に記載のディスクアレイ装置。 - 前記被疑アダプタ検出部は、被疑アダプタが検出されると、当該被疑アダプタについて当該検出の情報を加点形式で蓄積し、
前記排除部は、前記被疑アダプタ検出部によって蓄積された情報の点数が所定の閾値を超過したことを条件として、当該アダプタを排除することを特徴とする請求項3に記載のディスクアレイ装置。 - ディスクへのアクセス経路を制御しているアダプタ各々の性能に関する情報として、所定の時間内に行われたアクセスから導出される当該アダプタ各々の稼働率を収集する性能情報収集手順と、
前記性能情報収集手順によって収集されたアダプタ各々の稼働率を用いて、所定アダプタの稼働率と当該所定アダプタと同一の経路を制御している他のアダプタの稼働率とを比較し、当該所定アダプタの稼働率と他のアダプタの稼動率との差が所定閾値を超える場合に、当該所定アダプタを、性能に異常があると疑われる被疑アダプタとして検出する被疑アダプタ検出手順と
をコンピュータに実行させることを特徴とするディスクアレイ装置制御プログラム。 - ディスクを搭載するディスクアレイ装置によるディスクアレイ装置制御方法であって、
前記ディスクアレイ装置が、
ディスクへのアクセス経路を制御しているアダプタ各々の性能に関する情報として、所定の時間内に行われたアクセスから導出される当該アダプタ各々の稼働率を収集する性能情報収集ステップと、
前記性能情報収集ステップによって収集されたアダプタ各々の稼働率を用いて、所定アダプタの稼働率と当該所定アダプタと同一の経路を制御している他のアダプタの稼働率とを比較し、当該所定アダプタの稼働率と他のアダプタの稼動率との差が所定閾値を超える場合に、当該所定アダプタを、性能に異常があると疑われる被疑アダプタとして検出する被疑アダプタ検出ステップと
を含んだことを特徴とするディスクアレイ装置制御方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020005A JP4747203B2 (ja) | 2009-01-30 | 2009-01-30 | ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 |
US12/691,985 US8145952B2 (en) | 2009-01-30 | 2010-01-22 | Storage system and a control method for a storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020005A JP4747203B2 (ja) | 2009-01-30 | 2009-01-30 | ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176513A JP2010176513A (ja) | 2010-08-12 |
JP4747203B2 true JP4747203B2 (ja) | 2011-08-17 |
Family
ID=42398697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009020005A Expired - Fee Related JP4747203B2 (ja) | 2009-01-30 | 2009-01-30 | ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8145952B2 (ja) |
JP (1) | JP4747203B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4542163B2 (ja) * | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
US8074021B1 (en) * | 2008-03-27 | 2011-12-06 | Netapp, Inc. | Network storage system including non-volatile solid-state memory controlled by external data layout engine |
US7945752B1 (en) | 2008-03-27 | 2011-05-17 | Netapp, Inc. | Method and apparatus for achieving consistent read latency from an array of solid-state storage devices |
CN105359111A (zh) * | 2013-07-05 | 2016-02-24 | 日本电气方案创新株式会社 | 用户界面检查方法、设备及程序 |
WO2015072028A1 (ja) * | 2013-11-18 | 2015-05-21 | 株式会社日立製作所 | ストレージ制御装置 |
US11132173B1 (en) * | 2014-02-20 | 2021-09-28 | Amazon Technologies, Inc. | Network scheduling of stimulus-based actions |
CN106933708B (zh) * | 2015-12-29 | 2020-03-20 | 伊姆西Ip控股有限责任公司 | 有助于进行存储系统恢复的方法、装置以及一种存储系统 |
US11057475B2 (en) * | 2016-12-27 | 2021-07-06 | Cloudminds (Shanghai) Robotics Co., Ltd. | Methods, apparatus and systems for resuming transmission link |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3136036B2 (ja) * | 1993-11-16 | 2001-02-19 | 富士通株式会社 | ディスク制御装置の制御方法 |
JP2000089984A (ja) | 1998-09-10 | 2000-03-31 | Toshiba Corp | マルチファイル管理方式 |
JP4443786B2 (ja) * | 2001-03-19 | 2010-03-31 | 株式会社東芝 | 管理パス切り替え方法及び管理パス切り替えが可能な高可用性ストレージシステム |
JP3964212B2 (ja) * | 2002-01-16 | 2007-08-22 | 株式会社日立製作所 | 記憶装置システム |
US7058953B2 (en) * | 2002-07-23 | 2006-06-06 | Microsoft Corporation | Managing a distributed computing system |
JP3778171B2 (ja) | 2003-02-20 | 2006-05-24 | 日本電気株式会社 | ディスクアレイ装置 |
JP4012498B2 (ja) | 2003-11-18 | 2007-11-21 | 株式会社日立製作所 | 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム |
JP2006134207A (ja) * | 2004-11-09 | 2006-05-25 | Fujitsu Ltd | ストレージ仮想化装置およびそれを用いたコンピュータシステム |
US8028189B2 (en) * | 2004-11-17 | 2011-09-27 | International Business Machines Corporation | Recoverable machine check handling |
US7818630B2 (en) * | 2006-01-18 | 2010-10-19 | International Business Machines Corporation | Framework for automatically analyzing I/O performance problems using multi-level analysis |
JP4837445B2 (ja) * | 2006-06-06 | 2011-12-14 | 株式会社日立製作所 | 記憶システム並びに管理装置及び方法 |
US7519741B2 (en) * | 2006-09-28 | 2009-04-14 | International Business Machines Corporation | Apparatus, system, and method for automating adapter replacement |
JP4990018B2 (ja) * | 2007-04-25 | 2012-08-01 | 株式会社日立製作所 | 装置性能管理方法、装置性能管理システム、および管理プログラム |
-
2009
- 2009-01-30 JP JP2009020005A patent/JP4747203B2/ja not_active Expired - Fee Related
-
2010
- 2010-01-22 US US12/691,985 patent/US8145952B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010176513A (ja) | 2010-08-12 |
US8145952B2 (en) | 2012-03-27 |
US20100199131A1 (en) | 2010-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4747203B2 (ja) | ディスクアレイ装置、ディスクアレイ装置制御プログラム及びディスクアレイ装置制御方法 | |
US7533292B2 (en) | Management method for spare disk drives in a raid system | |
US7913039B2 (en) | Array-type disk apparatus preventing data lost and providing improved failure tolerance | |
US7313717B2 (en) | Error management | |
US8122290B2 (en) | Error log consolidation | |
JP5052193B2 (ja) | 記憶制御装置および記憶制御方法 | |
CN100495355C (zh) | 从磁盘阵列中隔离驱动器以用于诊断操作的系统和方法 | |
US20070234113A1 (en) | Path switching method | |
JP3536829B2 (ja) | Fc−alシステムのリンク診断方法及び装置 | |
US20090089503A1 (en) | Disk array apparatus, computer-readable recording medium having disk array apparatus control program recorded thereon, and disk array apparatus control method | |
CN101504592A (zh) | 存储子系统及其控制方法 | |
US10853191B2 (en) | Method, electronic device and computer program product for maintenance of component in storage system | |
JP7060789B2 (ja) | 電子システム、情報処理装置および制御方法 | |
CN103761180A (zh) | 一种集群存储中磁盘故障的预防及检测方法 | |
WO2011042939A1 (en) | Storage control device building a logical unit based on storage devices coupled with different switches | |
JP4461262B2 (ja) | コンピュータ障害発生時に複数のコンピュータの配列を操作する方法 | |
US11561852B2 (en) | BMC, server system, device stability determination method, and non-transitory computer-readable recording medium | |
US20050015683A1 (en) | Method, system and computer program product for improving system reliability | |
KR101437735B1 (ko) | 정보 처리 장치 및 동작 상태 감시 방법 | |
US9582200B2 (en) | Storage apparatus, method of controlling storage apparatus, and computer-readable recording medium having stored therein storage apparatus control program | |
JP4854522B2 (ja) | アレイディスク群の保守管理システム、アレイディスク群の保守管理装置、アレイディスク群の保守管理方法およびアレイディスク群の保守管理プログラム | |
US9389941B2 (en) | Methods for diagnosing hardware component failure and devices thereof | |
US20220334911A1 (en) | Method, electronic device, and computer product for storage management | |
US8522075B2 (en) | Storage system having storage devices for storing data and control devices for controlling the storage devices | |
US20120239988A1 (en) | Computing unit, method of managing computing unit, and computing unit management program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110516 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4747203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |