[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6455132B2 - 情報処理装置,処理方法及びプログラム - Google Patents

情報処理装置,処理方法及びプログラム Download PDF

Info

Publication number
JP6455132B2
JP6455132B2 JP2014258587A JP2014258587A JP6455132B2 JP 6455132 B2 JP6455132 B2 JP 6455132B2 JP 2014258587 A JP2014258587 A JP 2014258587A JP 2014258587 A JP2014258587 A JP 2014258587A JP 6455132 B2 JP6455132 B2 JP 6455132B2
Authority
JP
Japan
Prior art keywords
processing
power supply
power failure
memory
peripheral device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014258587A
Other languages
English (en)
Other versions
JP2016118954A (ja
Inventor
剛彦 村田
剛彦 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014258587A priority Critical patent/JP6455132B2/ja
Priority to US14/963,345 priority patent/US10210057B2/en
Publication of JP2016118954A publication Critical patent/JP2016118954A/ja
Application granted granted Critical
Publication of JP6455132B2 publication Critical patent/JP6455132B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Description

本発明は、情報処理装置,処理方法及びプログラムに関する。
デジタル回路の回路設計を電気的に変更可能なデバイスとして、FPGA(Field Programmable Gate Array)が知られている。FPGAは、多数の論理ゲートを有するLSI(Large Scale Integration circuit)である。FPGAは、論理ゲート間の論理関係と接続関係とを記述したコンフィギュレーションデータをFPGAが備えるコンフィギュレーションRAMに書き込むことで、所定の論理回路として機能する。
種々の電子機器の回路部品にFPGAを用いることにより、設計に従って回路部品を製造する場合より短期間で回路設計を実装することができる。また、コンフィギュレーションデータを変更することでハードウェアを変更することなく容易に回路設計を変更できる。
FPGAは電子機器を始めとして様々な製品で利用されている。例えば、サーバコンピュータに搭載される停電処理システムにFPGAを搭載し、このFPGAによりDIMM(Dual Inline Memory Module)データのバックアップを実現する手法が知られている。
図9はコンピュータにおける従来の停電処理システムの構成を模式的に示す図である。
この図9に示す従来の停電処理システム500は、CPU(Central Processing Unit)501,周辺デバイス502,メモリコントローラ503,監視FPGA504,DIMM505,記憶装置506及び停電FPGA507を備える。
CPU501は、種々の制御や演算を行なう処理装置であり、OS(Operating System)やプログラムを実行することにより、種々の機能を実現する。
周辺デバイス502は、ディスプレイデバイスや入出力コントローラ,インタフェースデバイス等のハードウェアデバイスであり、CPU501とPCIe(Peripheral Component Interconnect Express)等のインタフェースを介して通信可能に接続されている。
記憶装置506は、ハードディスクドライブ(Hard disk drive:HDD)、SSD(Solid State Drive)等の記憶装置であって、種々のデータを格納するものである。
DIMM505は、種々のデータやプログラムを格納する記憶領域であって、CPU501がプログラムを実行する際に、データやプログラムを格納・展開して用いる。停電時においては、このDIMM505に格納されたデータの複写が、記憶装置506に格納(バックアップ)される。
メモリコントローラ503は、DIMM505のデータの読み出しや書き出し等、DIMM505でのデータアクセスを管理する。
監視FPGA504は、停電検知を行なうとともに、停電検知時にCPU501及び周辺デバイス502への電力供給を停止させる制御を行なう。停電時においては、メモリコントローラ503,監視FPGA504,DIMM505,記憶装置506及び停電FPGA507には、スーパーキャパシタ等の図示しない予備電源から電力供給が行なわれる。
停電FPGA507は、停電時において、メモリコントローラ503を介してDMA(Direct Memory Access)によりDIMM505のデータを記憶装置506にバックアップする制御を行なう。
図9に示す従来の停電処理システム500において、停電時においては、予備電源により、メモリコントローラ503,監視FPGA504,DIMM505,記憶装置506及び停電FPGA507への電力供給は継続して行なう。
そして、停電FPGA507は、メモリコントローラ503を介して、DMAによりDIMM505のデータを記憶装置506にバックアップする。すなわち、停電時には、停電FPGA507が、予備電源により電力供給をされた状態で、CPU501を一切介することなくDIMM505のデータのバックアップを行なう。以下、停電時にDIMM505のデータを記憶装置506にバックアップすることを停電バックアップという場合がある。
また、その一方で、停電時においては、予備電源の電力消費を低減すべく、CPU501及び周辺デバイスキー502への電力供給は停止される。
上述の如き停電処理システム500の製造コストを低減するために、停電処理システム500の構成から比較的高価であるFPGAを省除することが考えられる。
このように停電FPGA507を省除する場合には、予備電源からCPU501に対しても電力供給を行ない、上述した停電バックアップとしての機能を実現するためのファームウェアをこのCPU501によって実行する。
なお、このように停電時においてCPU501への電力供給を行なう場合であっても、予備電源の電力消費を低減すべく、消費電力が比較的大きい周辺デバイス502への電力供給は停止することが望ましい。
特開2011−232986号公報 特開2012−234539号公報 特開2013−33472号公報 特開2009−93295号公報
しかしながら、上述の如き停電FPGA507を省除した従来の停電処理システム500において、例えば、停電発生のタイミングで周辺デバイス502で実行中の処理があった場合には、停電時のメモリバックアップの実行中に周辺デバイス502へのアクセスが発生する場合がある。このような周辺デバイス502へのアクセスは、例えば、CPU501が周辺デバイス502用のデバイスドライバを実行することで発生する。
このように、周辺デバイス502に電源供給がされない状態で、この周辺デバイス502へのアクセスが発生すると、システムに致命的なエラーが発生し、CPU501にはNMI(NonMaskable Interrupt)が通知され、停電バックアップ処理を実施できなくなるおそれがある。
1つの側面では、本発明は、停電時におけるメモリバックアップ処理を確実に実施できるようにすることを目的とする。
このため、この情報処理装置は、処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置であって、電源装置からの電力供給の停止を検知する停電検知部と、前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部と、前記処理装置と前記周辺デバイスとの通信を遮断する遮断部と、前記周辺デバイスにおける異常発生を示すデバイス異常発生通知を受信するデバイス異常発生通知受信部と、前記デバイス異常発生通知受信部が前記デバイス異常発生通知を受信すると、前記電源装置からの電力供給が停止しているかを確認する停電確認部と、前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に前記処理装置によって実行されるデバイス異常処理の実行を抑止する第1抑止部とを備え、前記停電検知部が前記電源装置からの電力供給の停止を検知すると、前記遮断部が前記処理装置と前記周辺デバイスとの通信を遮断し、前記処理装置が、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行する。
一実施形態によれば、停電時におけるメモリバックアップ処理を確実に実施できる。
実施形態の一例としてのストレージシステムのハードウェア構成を示す図である。 実施形態の一例としてのストレージシステムの機能構成図である。 実施形態の一例としてのストレージシステムにおけるAPI無効化処理部の処理を説明するための図である。 実施形態の一例としてのストレージシステムにおけるAPI無効化処理部の処理の具体例を示す図である。 実施形態の一例としてのストレージシステムにおける停電発生時の処理を説明するためのシーケンス図である。 実施形態の一例としてのストレージシステムにおける停電発生時の処理を説明するためのシーケンス図である。 実施形態の変形例としてのストレージシステムにおける停電発生時の処理を説明するためのシーケンス図である。 実施形態の他の変形例としてのストレージシステムにおける停電発生時の処理を説明するためのシーケンス図である。 従来の停電処理システムの構成を模式的に示す図である。
以下、図面を参照して本情報処理装置,処理方法及びプログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態及び各変形例を組み合わせる等)して実施することができる。又、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
(A)構成
図1は実施形態の一例としてのストレージシステム1のハードウェア構成を示す図、図2はその機能構成図である。
本実施形態のストレージシステム1は、図1に示すように、ストレージ装置(情報処理装置)100と1以上(図1に示す例では1つ)のホスト装置2とを備え、このホスト装置2に対して記憶領域を提供する。ホスト装置2は、例えば、サーバ機能をそなえたコンピュータ(ホストコンピュータ)であり、LAN(Local Area Network)等のネットワークを介して、ストレージ装置100と通信可能に接続される。
ストレージ装置100は、図1に示すように、CM(Controller Module)101,BPSU(Backup Power Supply Unit)40及び1以上(図1に示す例では3つ)の記憶装置3を備える。
記憶装置3は、ハードディスクドライブ(Hard Disk Drive:HDD)やSSD(Solid State Drive)等のデータを読み書き可能に格納する記憶装置であり、ホスト装置2から受信したデータを記憶可能な記憶部として機能する。本実施形態においては、記憶装置3としてHDDを用いる例について示す。以下、記憶装置3をHDD3と表す場合もある。
なお、図1中においては、便宜上、ストレージ装置100に3つのHDD3を示しているが、これに限定されるものではなく、2つ以下もしくは4つ以上のHDD3を備えてもよい。そして、ストレージ装置100は、これらの複数のHDD3を組み合わせて、冗長化された1つのストレージとして管理する、RAID(Redundant Arrays of Inexpensive Disks)装置であってもよい。本実施形態においては、ストレージ装置100が、これらの複数のHDD3を用いてRAIDを形成するRAID装置である例について説明する。
BPSU40は、ストレージ装置100において、図示しない電源装置からの電力供給が停止した場合に、CM101の少なくとも一部の部位に電力を供給する電力供給装置である。なお、電源装置からの電力供給が停止した状態を単に停電という場合がある。
BPSU40は、ストレージ装置100の停電時に、例えば、CM101の、CPU10,メモリ20,メモリコントローラ22,監視FPGA70及びバックアップ用記憶装置30に対して電力を供給する。
このBPSU40は、図1に示すように、バッテリ41を備える。バッテリ41は、例えば、鉛蓄電池やニッケル水素電池(Ni-H),リチウムイオン(Li-ION)電池等の二次電池である。なお、バッテリ41に代えて、電気二重層コンデンサ(電気二重層キャパシタ)等のキャパシタを備えてもよい。
CM101は、ストレージ装置100内の動作を制御するコントローラ(制御装置,コンピュータ)であり、例えば、ホスト装置2からのリード/ライト等のコマンドを受け取り、種々の制御を行なう。CM101はフロントエンド51を介してネットワーク(図示省略)に接続される。そして、このCM101は、ホスト装置2から受信するリード/ライト等のディスクアクセスコマンドに従ってHDD3のデータアクセス制御を行なう。
CM101は、図1に示すように、フロントエンド51,バックエンド52,CPU10,メモリ20,メモリコントローラ22,バックアップ用記憶装置30,周辺デバイス60及び監視FPGA70を備える。
これらのフロントエンド51,バックエンド52,CPU10,メモリ20,メモリコントローラ22,バックアップ用記憶装置30,周辺デバイス60及び監視FPGA70は、バス53を介して通信可能に接続されている。
フロントエンド51は、ホスト装置2等と通信可能に接続するインタフェースコントローラ(通信アダプタ)であり、例えば、CA(Channel Adapter)である。フロントエンド51は、ホスト装置2等から送信されたデータを受信し、又、CM101から出力するデータをホスト装置2等に送信する。すなわち、フロントエンド51は、ホスト装置2等の外部装置との間でのデータの入出力(I/O)を制御する。
バックエンド52は、HDD3と通信可能に接続するインタフェースコントローラ(通信アダプタ)であり、例えば、DA(Device Adapter)である。バックエンド52は、HDD3に書き込むデータをHDD3に送信し、又、HDD3から読み出されたデータを受信する。すなわち、バックエンド52は、HDD3との間でのデータの入出力(I/O)を制御する。
メモリ20は、Read Only Memory(ROM)及びRandom Access Memory(RAM)を含む記憶装置である。メモリ20のROMには、本ストレージ装置100における各種制御に係るソフトウェアプログラムやこのプログラム用のデータ類が書き込まれている。すなわち、ROMには、本ストレージ装置100における停電発生時に実行される停電処理制御に係るプログラム等も書き込まれている。
メモリ20上のプログラムは、CPU10に適宜読み込まれて実行される。又、メモリ20のRAMは、一次記憶メモリあるいはワーキングメモリとして利用される。
メモリ20のRAMは、例えば、RAIDキャッシュ(キャッシュメモリ)として機能する。
RAIDキャッシュは、ホスト装置2から受信したデータや、HDD3から読み出したデータを格納する。ホスト装置2から受信し、HDD3に書き込まれるデータ(ライトデータ,ライトキャッシュデータ)は、このRAIDキャッシュにおける所定の領域(ユーザ領域)に格納された後、HDD3に転送される。
本ストレージ装置100においては、例えば、このRAIDキャッシュにおけるライトデータを格納するための所定の領域をバックアップ対象領域とし、このバックアップ対象領域に格納されているデータの複写を、後述するバックアップ用記憶装置30に格納する(メモリバックアップ)。
また、HDD3から読み出されたデータ(リードデータ)は、RAIDキャッシュにおけるリードデータを格納するための領域に格納された後、ホスト装置2に送信される。
バックアップ用記憶装置30は、電力を供給しなくても記憶を保持する不揮発性の記憶装置であり、例えば、HDDやSSDが用いられる。ただし、バックアップ用記憶装置30は、これに限定されるものではなく、例えば、磁気抵抗RAMやPRAM(Phase change RAM),強誘電体メモリを用いてもよく、種々変形して実施することができる。
そして、このバックアップ用記憶装置30には、ストレージ装置100の停電時に、メモリ20のRAIDキャッシュ21等のバックアップ対象領域のデータが格納される。すなわち、バックアップ用記憶部30は、バックアップ対象領域のデータが格納されるバックアップ先の記憶装置として機能する。
周辺デバイス60は、CPU10とバス53を介して通信可能に接続されたハードウェアデバイスであり、例えば、ネットワークインタフェースや入出力コントローラ,インタフェースデバイスである。
監視FPGA70は、本ストレージ装置100において発生する異常の監視を行なう機能を備えるFPGAである。例えば、監視FPGA70は、図2に示すように、停電検知部71及びデバイス監視部72としての機能を備える。
停電検知部71は、本ストレージ装置100における停電検知を行なう。なお、停電検知は、既知の種々の手法を用いて実現することができる。例えば、図示しない電源装置から供給される電力の電圧値を所定の基準値と比較することで停電を検知してもよく、又、電源装置等の他の装置から停電が生じた旨の通知を受け取ることにより停電を検知してもよい。
また、停電検知部71は、停電発生を検知すると、周辺デバイス60への電力供給を停止させる制御を行なう。
さらに停電検知部71は、停電を検知すると、BPSU40に対して電力供給指示を行なう。これにより、図示しない電力供給装置からの電力が遮断された場合においても、CM101の各部にBPSU40からの電力が供給される。
前述の如く、本ストレージ装置100においては、停電時に、CPU10,メモリ20,メモリコントローラ22,バックアップ用記憶装置30,監視FPGA70には、BPSU40のバッテリ41から電力供給が行なわれる。
また、停電検知部71は、停電の発生を検知すると、CPU10に対してNMI(Non-Maskable Interrupt)によって停電発生を通知する(停電発生検知通知)。
さらに、停電検知部71は、後述するCPU10(停電確認部14)から停電が発生しているかを確認する問い合わせを受信すると、停電が発生中である場合には、停電状態である旨を応答する。この応答は、例えば、レジスタ等の所定の領域にフラグ“1”を設定することにより行ない、CPU10がこのフラグの値を確認してもよく、また、停電状態である旨を示す信号を送信してもよく、種々変形して実施することができる。
また、監視FPGA70は、デバイス監視部72としての機能を備える。デバイス監視部72は、周辺デバイス60に関する異常発生を監視する。例えば、電力供給が停止された状態の周辺デバイス60に対してアクセスが発生した場合や、存在しない周辺デバイス60へのアクセスが発生した場合に、監視FPGA70は、デバイス異常が発生したと判断する。なお、このデバイス異常の発生の判断は、既知の種々の手法を用いて実現することができ、その詳細な説明は省略する。
デバイス監視部72は、デバイス異常が発生したと判断すると、CPU10に対してNMIによってデバイス異常の発生を通知する(デバイス異常発生通知)。
CPU10は、種々の制御や演算を行なう処理装置であり、メモリ20に格納されたOSやプログラム(アプリケーション)を実行することにより、種々の機能を実現する。
例えば、CPU10は、RAIDシステムにおけるシステム制御部としての機能を備え、ストレージ装置100における、RAIDの実現や、アラーム監視機能,経路制御機能等の種々の機能を実現する。
また、CPU10は、図2に示すように、第1停電処理部201,第2停電処理部202及び第3停電処理部203としての機能を備える。本ストレージ装置100に停電が発生した場合に、これらの第1停電処理部201,第2停電処理部202及び第3停電処理部203の各機能により、停電処理制御が実現される。
第3電源処理部203は、バックアップ処理部11としての機能を備える。
バックアップ処理部11は、メモリ20のRAMの所定の領域(バックアップ対象領域)のデータ(バックアップデータ)をバックアップ用記憶装置30の所定の領域にコピーする。以下、メモリ20のバックアップデータをバックアップ用記憶装置30にコピーすることをメモリバックアップ処理という場合がある。このメモリバックアップ処理は、本ストレージ装置100に停電が発生した場合に実行される停電処理である。以下、この停電処理であるメモリバックアップ処理を停電処理タスクという場合がある。
バックアップ処理部11は、監視FPGA70(停電検知部71)から停電発生検知通知を受信すると、メモリバックアップ処理を実行する。
第1停電処理部201は、遮断処理部12,通知受信部17,デバイス異常処理部13,停電確認部14,抑止制御部15及びAPI(Application Programming Interface)無効化処理部16としての機能を備える。
遮断処理部12は、CPU10と周辺デバイス60との通信を遮断することで、CPU10から周辺デバイス60へアクセス不可の状態にする制御を行なう。
例えば、周辺デバイス60がPCIeの規格によって構成されるPCIeデバイスである場合には、遮断処理部12は、PCIeのリンク・ディセーブル機能を用いてCPU10と周辺デバイス60とを接続するパスをリンク・ディセーブル状態にする。
具体的には、遮断処理部12は、例えば、Linux(登録商標)のPCIデバイスドライバインタフェースにおいては、「void pci_disable_device()関数」を用いることで、PCIデバイスとしての動作を停止させることができる。
これにより、CPU10と周辺デバイス60との通信が遮断され、周辺デバイス(PCIeデバイス)60が無効化される。
この遮断処理部12は、監視FPGA70から停電発生検知通知を受信すると、CPU10と周辺デバイス60との通信を遮断する。
通知受信部17は、監視FPGA70から通知される各種割り込み通知を受信する。例えば、通知受信部17は、監視FPGA70からNMIとして入力される停電発生検知通知及びデバイス異常発生通知をそれぞれ受信する。
これにより、通知受信部17は、周辺デバイス60における異常発生を示すデバイス異常発生通知を受信するデバイス異常発生通知受信部として機能する。
また、通知受信部17は、監視FPGA70等から入力されるSMI(System Management Interrupt)も受信する。
デバイス異常処理部13は、監視FPGA70(デバイス監視部72)からデバイス異常発生通知(NMI)が入力されると、検知された周辺デバイス60の異常に関する処理を行なう。例えば、デバイス異常処理部13は、検知された異常に関して、異常発生箇所や範囲を特定するための処理を実行する。この周辺デバイス60に関する異常発生箇所や範囲を特定するための処理は、周辺デバイス60において異常が発生した場合に実行されるデバイス異常処理である。以下、周辺デバイス60の異常に関する処理をデバイス異常処理という場合がある。
なお、このデバイス異常処理としては、異常発生箇所や範囲を特定するための処理に限定されるものではなく、種々変形して実施することができる。例えば、デバイス異常処理として、周辺デバイス60における異常の発生をオペレータ等に通知してもよい。
停電確認部14は、監視FPGA70(デバイス監視部72)からデバイス異常発生通知(NMI)が入力されると、停電が発生しているか否かの確認を行なう。
具体的には、停電確認部14は、監視FPGA70に対して、停電が発生しているかを確認する問い合わせを行なう。
これに応じて、監視FPGA70は、停電状態であるか否かを示す情報(停電状態情報)を応答する。停電中である場合には、監視FPGA70(停電検知部71)から停電状態情報として、停電状態である旨を表す信号が応答されたり、レジスタ等の所定の記憶領域に停電状態である旨を表すフラグが設定される。
このように、停電確認部14は、前記デバイス異常発生通知受信部が前記デバイス異常発生通知を受信すると、前記電源供給装置からの電力供給が停止しているかを確認する。
抑止制御部15は、監視FPGA70(デバイス監視部72)によってデバイス異常が検知され、デバイス異常発生通知が出力された場合において、停電確認部14によって停電状態であることが確認された場合に、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なう。
すなわち、抑止制御部15は、停電確認部14が図示しない電源装置からの電力供給が停止していることを確認すると、周辺デバイス60において異常が発生した場合に実行されるデバイス異常処理の実行を抑止する第1抑止部として機能する。
また、以下においては、監視FPGA70からNMIによるデバイス異常発生通知が入力された場合に、停電確認部14が監視FPGA70に対して停電が発生しているかを確認する問い合わせを行ない、抑止制御部15がデバイス異常処理部13によるデバイス異常処理の実行を抑止することを、カーネル200におけるNMIレベルでのカーネルデバイス異常処理という場合がある。
API無効化処理部16は、カーネル200が提供する周辺デバイスアクセスAPI210(API210:図3参照)を無効化させる。
図3は実施形態の一例としてのストレージ装置100におけるAPI無効化処理部16の処理を説明するための図、図4はその具体例を示す図である。
周辺デバイスアクセスAPI210は、デバイスドライバ120とのインタフェースとして機能するプログラムであり、例えばOSのカーネル200の一機能として実装される。
デバイスドライバ120は、周辺デバイス60を制御し、アプリケーションプログラム(図示省略)に対してインタフェースを提供するためのソフトウェアであり、周辺デバイス60毎に備えられる。
カーネル200は、周辺デバイスアクセスAPI210を介して、各デバイスドライバ120と各種通信を行なう。
API無効化処理部16は、例えばCPU10によって実行される所定のアプリケーションのプロセスから、周辺デバイス60(デバイスドライバ120)に対するアクセス要求が発行された場合に、周辺デバイスアクセスAPI210からデバイスドライバ120(周辺デバイス60)に対するアクセスを無効化する。すなわち、API無効化処理部16は、周辺デバイス60に対するアクセス要求を無効化する。
図4に示す例においては、周辺デバイスアクセスAPI210b,210c,デバイスアクセス無効化API210a(devDisable())及び内部処理モジュール204が示されている。
周辺デバイスアクセスAPI210bは、周辺デバイス60に対してリードアクセスを実現するためのAPI“dev Read()”であり、周辺デバイスアクセスAPI210cは、周辺デバイス60に対してライトアクセスを実現するためのAPI“dev Write()”である。これらの周辺デバイスアクセスAPI210b,210cにおいては、アドレス(addr)が入力され、データ(data)が出力される。
内部処理モジュール204は、デバイスドライバ120を介して周辺デバイス60に対するアクセス処理を行なう機能モジュール“devRWCore()”であり、アドレス(addr)やデータ(data),リードもしくはライトの方向(direction)が入力され、データ(data)が出力される。
周辺デバイスアクセスAPI210b,210cは、この内部処理モジュール204を介して周辺デバイス60に対するアクセスを行なう。
また、内部処理モジュール204は、アクセス可否判断部205としての機能を備える。アクセス可否判断部205は、周辺デバイス60に対するアクセスの可否を判断するものであり、アクセス可否情報2051を備える。
アクセス可否情報2051は、各周辺デバイス60が、アクセスが可能な状態(Enabled)であるかアクセス不可な状態(Disabled)であるかを管理する情報である。図4に示す例においては、アクセス可否情報2051は、各周辺デバイス60を特定するための識別情報(#1〜#n)に対して、EnabledもしくはDisabledが関連付けられている。
このアクセス可否情報2051において、Enabledが設定されている周辺デバイス60にはアクセス可能であり、Disabledが設定されている周辺デバイス60にはアクセスすることができないことを示す。
アクセス可否情報2051へのDisabledの設定は、デバイスアクセス無効化API210aが行なう。
デバイスアクセス無効化API210aは、周辺デバイス60に対するアクセスを無効化するためのAPI“dev Disable()”であり、アドレス(addr)が入力される。デバイスアクセス無効化API210aは、アクセスを無効化する周辺デバイス60について、アクセス可否情報2051にDisabledを設定する。なお、このデバイスアクセス無効化API210aがアクセス可否情報2051にDisabledを設定することが、アクセス無効化指示に相当する。
内部処理モジュール204は、周辺デバイスアクセスAPI210b,210cから周辺デバイス60へのアクセス要求(リードアクセス要求/ライトアクセス要求)が行なわれると、アクセス対象の周辺デバイス60について、アクセス可否情報2051を参照する。そして、内部処理モジュール204は、アクセス可否情報2051にEnabledが設定されている周辺デバイス60に対してのみ、リードアクセスやライトアクセスを実行する。
すなわち、内部処理モジュール204は、アクセス可否情報2051にDisabledが設定されている周辺デバイス60に対するリードアクセスやライトアクセスの実行を抑止する。
このように、図4に示す例においては、デバイスアクセス無効化API210a及び内部処理モジュール204がAPI無効化処理部16としての機能を実現する。
例えば、図4に示す例においては、アクセス可否情報2051において、識別情報が#2の周辺デバイス60にDisabledが設定されており、これにより、識別情報が#2の周辺デバイス60へのアクセスが無効化されている。
そして、例えばCPU10によって実行される所定のアプリケーションのプロセスから、周辺デバイス60に対してデータのリード要求が発行されると、周辺デバイスアクセスAPI210bから、内部処理モジュール204に対してリード要求が行なわれる。
内部処理モジュール204(API無効化処理部16)は、アクセス可否情報2051において対象の周辺デバイス60にDisabledが設定されている場合に、このリード要求を破棄する。
これにより、デバイスドライバ120が電源断状態の周辺デバイス60に対するリード要求が実行されることがなく、電源断状態の周辺デバイス60に対するリード要求を原因とするシステムエラーの発生を防止することができる。
また、内部処理モジュール204(API無効化処理部16)は、上述した周辺デバイス60(デバイスドライバ120)に対するデータのリード要求を破棄するとともに、このリード要求の発行元のプロセスに対してデバイスエラーの発生を意味する所定の信号(ダミー信号)を応答する。なお、以下、API無効化処理部16(内部処理モジュール204)がリード要求の発行元に対してダミー信号を応答することをダミー応答という場合がある。
このように、API無効化処理部16がダミー応答を行なうことにより、電源断状態の周辺デバイス60に対してリード要求の発行元のプロセスにおいて、周辺デバイス60からの未応答を原因とするシステムエラーの発生を防止することができる。
なお、ダミー信号としては、例えば“fff・・・f”のように全てが“f”である所定のビット数で構成されるビット列を用いる等、OSやシステムの仕様等に応じて適宜変更して実施することができる。
また、CPU10によって実行される所定のアプリケーションのプロセスから、周辺デバイス60に対してデータのライト要求が発行されると、周辺デバイスアクセスAPI210cから、内部処理モジュール204に対してライト要求が行なわれる。
内部処理モジュール204(API無効化処理部16)は、アクセス可否情報2051において対象の周辺デバイス60にDisabledが設定されている場合に、このライト要求を実行することなく破棄する。
これにより、デバイスドライバ120が電源断状態の周辺デバイス60に対するライト要求を実行することがなく、電源断状態の周辺デバイス60に対するライト要求を原因とするシステムエラーの発生を防止することができる。
第2停電処理部202は、機能制御部18としての機能を備える。
機能制御部18は、本ストレージ装置100においてアプリケーションレベルで実行される各種機能を制御する。例えば、機能制御部18は、OS上で実行される各種のプログラム(スレッド)を起動させたり、また、これらのスレッドの実行を抑止する制御を行なう。
例えば、機能制御部18は、所定の関数(停電処理関数)をコールすることで、第3停電処理部203のバックアップ処理部11を実行させる。
また、機能制御部18は、バックアップ処理部11によるメモリバックアップ処理の実行中には、アプリケーションレベルにおいて、バックアップ処理部11以外の処理(スレッド)の実行を抑止する制御を行なう。
これにより、メモリバックアップ処理中に、周辺デバイス60への無用なアクセスの発生を阻止し、電源断状態の周辺デバイス60に対するアクセスを原因とするシステムエラーの発生を防止することができる。
なお、機能制御部18は、例えば、第1停電処理部201から発行されるトラップにより起動される。この第1停電処理部201から第2停電処理部202に発行されるトラップは、プロセッサ間割り込み(IPI:Inter-processor interrupt)であり、通常レベルのカーネル200へ移行するために発行される。なお、このIPIをカーネル停電処理呼び出しという場合がある。
そして、上述した、第1停電処理部201及び第2停電処理部202としての機能は、例えば、CPU10がOSのカーネル200を実行することにより実現される。特に、第1停電処理部201はカーネル200のNMIレベルで実行され、第2停電処理部202はカーネル200の通常レベルで実行される。
また、第3停電処理部203としての機能は、例えば、CPU10がファームウェアを実行することにより実現される。
なお、これらの第1停電処理部201,第2停電処理部202及び第3停電処理部203としての機能を実現するためのプログラム(ファームウェアやOS(カーネル200))は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
第1停電処理部201,第2停電処理部202及び第3停電処理部203としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ20)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU10)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
(B)動作
上述の如く構成された実施形態の一例としてのストレージ装置100における停電発生時の処理を、図5及び図6に示すシーケンス図に従って説明する。なお、図6は図5に示す処理に後続する処理を示す。
先ず、事前準備として、停電処理用スレッドを作成し待ち受け状態にしておく(図5の符号A0参照)。
本ストレージ装置100において電源装置からの電力供給が停止し停電が発生すると、監視FPGA70の停電検知部71が停電発生を検知する(図5の符号A1参照)。停電が発生すると周辺デバイス60に対する電力供給は即時遮断される(図5の符号A2参照)。
監視FPGA70の停電検知部71は、CPU10に対してNMIにより停電発生検知通知を行なう(図5の符号A3参照)。なお、この時点では、周辺デバイス60への電力供給は停止しているので、CPU10等から周辺デバイス60へのアクセスは不可である。
CPU10にNMIによる停電発生検知通知が入力されると、カーネル200におけるNMIレベルでの停電処理が開始される(図5の符号A4参照)。先ず、遮断処理部12が、CPU10と周辺デバイス60との通信を遮断する(図5の符号A5参照)。具体的には、PCIeのリンク・ディセーブル機能を用いて、CPU10と周辺デバイス60とを接続するパスをリンク・ディセーブル状態にする。
また、API無効化処理部16が、周辺デバイスアクセスAPI210を無効化させる(図5の符号A6参照)。
さらに、第1停電処理部201が第2停電処理部202に対してトラップ(IPI)を発行することで、第2停電処理部202(機能制御部18)にカーネル停電処理の開始を指示する(カーネル停電処理呼び出し:図5の符号A7参照)。カーネル200におけるNMIレベルでの停電処理は終了し(図5の符号A8参照)、カーネル200における通常レベルに戻る(移行する)。
周辺デバイス60のデバイスドライバ120で仕掛かり中の処理がある状態で停電が発生した場合には、このタイミングでデバイスドライバ120が動作を再開する。周辺デバイス60への電力供給が停止された状態で、この周辺デバイス60へのアクセスが生じるとデバイス異常が発生する。
このように周辺デバイス60においてデバイス異常が発生すると、監視FPGA70のデバイス監視部72がこの周辺デバイス60の異常を検知し(図5の符号A9参照)、CPU10に対してNMIによりデバイス異常発生通知を行なう(図5の符号A10参照)。
CPU10にNMIによるデバイス異常発生通知が入力されると、カーネル200におけるNMIレベルでのカーネルデバイス異常処理が開始される(図5の符号A11参照)。
先ず、停電確認部14が、監視FPGA70に対して、停電が発生しているかを確認し(図5の符号A12参照)、監視FPGA70が、この問い合わせに応じて、停電確認部14に対して停電状態情報を応答する(図5の符号A13参照)。
確認の結果、停電中である場合には、第1停電処理部201において、抑止制御部15が、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なう。すなわち、停電発生の場合には、デバイス異常処理部13によるデバイス異常処理のハンドリングは行なわれずに終了する(図5の符号A14参照)。カーネル200におけるNMIレベルでのカーネル停電処理は終了し(図5の符号A15参照)、カーネル200における通常レベルに戻る(移行する)。このように、周辺デバイス60においてデバイス異常が検知された場合であっても、抑止制御部15が、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なうことで、システムエラーの発生を防止することができるのである。
第1停電処理部201からカーネル停電処理呼び出しの割り込み(IPI)が入力された第2停電処理部202においては、カーネル200における通常レベルでのカーネル停電処理が開始される(図5の符号A16参照)。なお、割り込みはマスクされた状態で動作する。
機能制御部18は、停電処理関数をコールする(図6の符号A17参照)。これにより、ファームウェアの停電処理の実行が開始される(図6の符号A18参照)。
また、アプリケーションレベルにおいては、周辺デバイス60のデバイスドライバ120に対して停止指示が発行される(図6の符号A19)。この停止指示においては、論理的な指示と物理的な指示の両方が実施される。
この時点においては、前述の如くAPI無効化処理部16が、周辺デバイスアクセスAPI210を無効化させているので(図5の符号A6参照)、周辺デバイス60へのアクセスが発生した場合であっても、システムエラーが発生することはない。
その後、第3停電処理部203は、実行中のスレッドを停止させる処理を行ない(図6の符号A20参照)、これを受けて、第2停電処理部202の機能制御部18が停電処理スレッド以外のスレッドをサスペンド状態にする(図6の符号A21参照)。これにより、パトロール等のシステム制御やBasicのスレッドが停止され、アクセス不可な状態となっている周辺デバイス60へのアクセスの発生を阻止することができ、停電中のストレージ装置100を安定して運用することができる。
次に、アプリケーションレベルにおいて、停電処理タスクの開始が指示される(図6の符号A22参照)。なお、この時点においても、周辺デバイス60へのアクセスが生じ、デバイス異常が発生するおそれがあるが、前述の如く、抑止制御部15が、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なうことで、システムエラーの発生を防止することができる。
停電処理タスクの開始指示に応じて、バックアップ処理部11による停電処理タスク、すなわち、メモリバックアップ処理が開始される(図6の符号A23参照)。バックアップ処理部11が、メモリ20におけるバックアップ範囲の取得要求を行なうと(図6の符号A24参照)、これに対して、カーネル200(通常レベル)が、メモリ20におけるバックアップ対象領域をバックアップ範囲として応答する(図6の符号A25参照)。バックアップ処理部11は、応答されたバックアップ範囲のデータを、バックアップ用記憶装置30にバックアップさせるよう、バックアップ用記憶装置30のデバイスドライバ120に対して指示を行なう(図6の符号A26参照)。
バックアップ指示を受けたデバイスドライバ120は、バックアップ用記憶装置30へのバックアップを開始する(図6の符号A27参照)。すなわち、メモリコントローラ22を介してメモリ20におけるバックアップ対象領域のデータを読み出し、バックアップ用記憶装置30に格納する。
メモリ20におけるバックアップ対象領域の全てのデータのバックアップが完了すると(図6の符号A28参照)、バックアップ用記憶装置30のデバイスドライバ120は、バックアップ処理部11に完了通知を行なう。
バックアップの完了通知を受信したバックアップ処理部11は、ホルト(halt)関数のコールを行ない(図6の符号A29)、カーネル200は通常レベルにおいてCPUを停止させ、CPU haltの状態に移行する(図6の符号A30)。これにより、CPU10における処理が停止する。
(C)効果
このように、実施形態の一例としてのストレージ装置100によれば、遮断処理部12が、監視FPGA70から停電発生検知通知を受信すると、CPU10と周辺デバイス60との通信を遮断する。
これにより、CPU10と周辺デバイス60との通信が遮断され、周辺デバイス(PCIeデバイス)60が無効化される。これにより、停電発生時において、バックアップ処理部11がメモリバックアップ処理を実行中に、電力供給が遮断された状態の周辺デバイス60へのアクセスが阻止される。従って、電源断状態の周辺デバイス60に対するデータアクセスを原因とするシステムエラーの発生を防止することができる。
抑止制御部15が、監視FPGA70によってデバイス異常が検知され、デバイス異常発生通知が出力された場合において、停電確認部14によって停電状態であることが確認された場合に、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なう。
周辺デバイス60においてデバイス異常が検知された場合であっても、抑止制御部15が、デバイス異常処理部13によるデバイス異常処理の実行を抑止する制御を行なうことで、システムエラーの発生を防止することができる。
API無効化処理部16が、カーネル200が提供する周辺デバイスアクセスAPI210を無効化させる。
これにより、デバイスドライバ120が電源断状態の周辺デバイス60に対するリード要求が実行されることがなく、電源断状態の周辺デバイス60に対するリード要求を原因とするシステムエラーの発生を防止することができる。
停電時において、メモリ20のデータをバックアップ用記憶装置30にバックアップさせるためのFPGA(停電FPGA)が不要となり、システムの製造コストを低減することができる。
(D)変形例
(D−1)第1変形例
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態においては、監視FPGA70(停電検知部71)が、停電の発生を検知すると、CPU10に対してNMIによって停電発生を通知(停電発生検知通知)し、CPU10が第1停電処理部201,第2停電処理部202及び第3停電処理部203により、停電処理制御を実行しているが、これに限定されるものではない。
本第1変形例においては、CPU10はBIOS(Basic Input Output System)のプロセスとして停電処理制御を実行する。すなわち、BIOSが、上述した実施形態のバックアップ処理部11としての機能を実行するためのモジュールを備える。また、BIOSには、バックアップ用記憶装置30のデバイスドライバ120としての機能を実行させるためのモジュールも備える。
さらに、BIOSに備えられた特定のプロセスを選択的に実行させるために、監視FPGA70(停電検知部71)は、停電の発生を検知すると、CPU10に対してSMIによって停電発生を通知する機能を備える。
上述の如く構成された実施形態の変形例としてのストレージ装置100における停電発生時の処理を、図7に示すシーケンス図に従って説明する。
本ストレージ装置100において電源装置からの電力供給が停止し停電が発生すると、監視FPGA70の停電検知部71が停電発生を検知する(符号B1参照)。停電が発生すると周辺デバイス60に対する電力供給は即時遮断される(符号B2参照)。
監視FPGA70の停電検知部71は、CPU10に対してSMIにより停電発生検知通知を行なう(符号B3参照)。なお、この時点では、周辺デバイス60への電力供給は停止しているので、CPU10等から周辺デバイス60へのアクセスは不可である。
CPU10にSMIによる停電発生検知通知が入力されると、BIOSによる停電処理が開始される(符号B4参照)。
先ず、BIOSのバックアップ用記憶装置30のデバイスドライバ120としての機能から、バックアップ処理部11としての機能が起動され、メモリバックアップ処理が起動される(符号B5参照)。
BIOSにおいて、バックアップ処理部11としての機能により、バックアップ用記憶装置30へのバックアップが開始される(符号B6参照)。すなわち、BIOSが、メモリコントローラ22を介してメモリ20におけるバックアップ対象領域のデータを読み出し、バックアップ用記憶装置30に格納する。
メモリ20におけるバックアップ対象領域の全てのデータのバックアップが完了すると(符号B7参照)、BIOSは、ホルトに移行する(符号B8参照)、これにより、CPU10における処理が停止する。
本第1変形例において、停電時においては周辺デバイス60のデバイスドライバ120は無効となっているため、周辺デバイス60へのアクセスは発生しない。従って、停電発生時において、BIOSによるメモリバックアップ処理を実行中に、電源断状態の周辺デバイス60に対するデータアクセスを原因とするシステムエラーの発生を防止することができる。
また、停電時において、メモリ20のデータをバックアップ用記憶装置30にバックアップさせるためのFPGA(停電FPGA)が不要となり、システムの製造コストを低減することができる。
(D−2)第2変形例
上述した第1変形例においては、監視FPGA70(停電検知部71)が、停電の発生を検知すると、CPU10に対してSMIによって停電発生検知通知を行なっているが、これに限定されるものではない。
本第2変形例においては、監視FPGA70(停電検知部71)が、停電の発生を検知すると、CPU10に対してNMIによって停電発生を通知(停電発生検知通知)する。
一方、CPU10においては、カーネル200のNMIレベルにおいて、前述した通知受信部17としての機能を備え、監視FPGA70からNMIとして入力される停電発生検知通知を受信する。
また、CPU10は、監視FPGA70からNMIとして入力される停電発生検知通知を受信すると、カーネル200のNMIレベルにおいて、カーネル停電処理として本ストレージ装置100をスリープ状態に移行させる。すなわち、メモリ20には電力供給を行なって、その記憶領域のデータを保持した状態で、メモリ20以外への給電を停止させる。
スリープ状態は、例えば、ACPI(Advanced Configuration and Power Interface)の規格におけるS3のスリーピングモード(S3 DC-OFF/ON)に移行することによって実現される。なお、ACPIのS3のスリーピングモードへの移行は、既知の種々の手法を用いて実現することができ、その詳細な説明は省略する。また、本ストレージ装置100をスリープ状態に移行させる手法は、これに限定されるものでなく、既知の種々の手法を用いて実現してもよい。
カーネル200のNMIレベルにおいてS3のスリーピングモードに移行した後、BIOSが起動される。
また、本第2変形例においては、BIOSは、起動後に、監視FPGA70に対して、停電が発生しているかを確認する問い合わせを行なう。そして、監視FPGA70(停電検知部71)から停電状態情報として、停電状態である旨を表す信号が応答されると、BIOSは、上述した実施形態のバックアップ処理部11としての機能を実行する。
上述の如く構成された実施形態の他の変形例としてのストレージ装置100における停電発生時の処理を、図8に示すシーケンス図に従って説明する。
本ストレージ装置100において電源装置からの電力供給が停止し停電が発生すると、監視FPGA70の停電検知部71が停電発生を検知する(符号C1参照)。停電が発生すると周辺デバイス60に対する電力供給は即時遮断される(符号C2参照)。
監視FPGA70の停電検知部71は、CPU10に対してNMIにより停電発生検知通知を行なう(符号C3参照)。なお、この時点では、周辺デバイス60への電力供給は停止しているので、CPU10から周辺デバイス60へのアクセスは不可である。
CPU10にNMIによる停電発生検知通知が入力されると、カーネル200におけるNMIレベルでの停電処理が開始される(符号C4参照)。具体的には、メモリ20の記憶領域のデータを保持した状態で、S3 DC−OFF/ONが起動される(符号C5参照)。
カーネル200のMIレベルにおいてS3 DC−OFF/ONが起動されると、BIOSが起動される(符号C6参照)。
BIOSは、先ず、停電の発生を確認する(符号C7参照)。すなわち、BIOSは、監視FPGA70に対して、停電が発生しているかを確認する問い合わせを行ない、監視FPGA70が、この問い合わせに応じて、停電状態情報を応答する(符号C8参照)。
確認の結果、停電中である場合に、BIOSによる停電処理が開始される(符号C9参照)。すなわち、BIOSのバックアップ用記憶装置30のデバイスドライバ120としての機能から、バックアップ処理部11としての機能が起動され、メモリバックアップ処理が起動される。
BIOSにおいて、バックアップ処理部11としての機能により、全メモリ20のバックアップ用記憶装置30へのバックアップを実施する(符号C10参照)。すなわち、バックアップ処理が開始され(符号C11参照)、BIOSが、メモリコントローラ22を介してメモリ20におけるバックアップ対象領域のデータを読み出し、バックアップ用記憶装置30に格納する。
メモリ20におけるバックアップ対象領域の全てのデータのバックアップが完了すると(符号C12参照)、BIOSは、ホルトに移行する(符号C13参照)、これにより、CPU10における処理が停止する。
本第2変形例においても、停電時においては周辺デバイス60のデバイスドライバ120は無効となっているため、周辺デバイス60へのアクセスは発生しない。従って、停電発生時において、BIOSによるメモリバックアップ処理を実行中に、電源断状態の周辺デバイス60に対するデータアクセスを原因とするシステムエラーの発生を防止することができる。
また、停電時において、メモリ20のデータをバックアップ用記憶装置30にバックアップさせるためのFPGA(停電FPGA)が不要となり、システムの製造コストを低減することができる。
(E)その他
上述した実施形態においては、RAIDキャッシュにおけるライトデータを格納するための所定の領域をバックアップ対象領域とし、このバックアップ対象領域に格納されているデータの複写をバックアップ用メモリ30に格納する例について示しているが、これに限定されるものではない。
例えば、メモリ20にメモリログ域として形成された所定の領域をバックアップ対象領域としてもよい。メモリログ域には、CM101において行なわれた各種処理に関するログ(管理情報)が格納される。このログには、障害情報のログも含まれる。ログとしては、例えば、エラーログ,イベントログ,デグレードログ,デグレードファクターログ等の種々の種類のログがあり、例えば、CM101のCPU10がエラー検出機能を実行することにより生成される。
また、上述した実施形態においては、遮断処理部12として機能するCPU10が、PCIeのディセーブル機能を用いて周辺デバイス(PCIeデバイス)60を無効化することでCPU10と周辺デバイス60との通信を遮断する例を示しているが、これに限定されるものではない。例えば、CPU10と周辺デバイス60とを接続するバス上に通信を遮断可能なスイッチ等の回路部品を備え、遮断処理部12がこのスイッチに切断指示を通知することよりCPU10と周辺デバイス60との通信を遮断してもよい。
また、監視FPGA70から出力される停電発生検知通知を切断指示としてスイッチに入力することで、CPU10と周辺デバイス60との通信を遮断してもよい。このように監視FPGA70に遮断処理部12として機能させてもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
(F)付記
(付記1)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置であって、
電源装置からの電力供給の停止を検知する停電検知部と、
前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部と、
前記処理装置と前記周辺デバイスとの通信を遮断する遮断部とを備え、
前記停電検知部が前記電源装置からの電力供給の停止を検知すると、前記遮断部が前記処理装置と前記周辺デバイスとの通信を遮断し、前記処理装置が、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行することを特徴とする、情報処理装置。
(付記2)
前記周辺デバイスにおける異常発生を示すデバイス異常発生通知を受信するデバイス異常発生通知受信部と、
前記デバイス異常発生通知受信部が前記デバイス異常発生通知を受信すると、前記電源装置からの電力供給が停止しているかを確認する停電確認部と、
記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に前記処理装置によって実行されるデバイス異常処理の実
行を抑止する第1抑止部と
を備えることを特徴とする、付記1記載の情報処理装置。
(付記3)
前記停電検知部が前記電源装置からの電力供給の停止を検知すると、周辺デバイスに対するアクセス要求を無効化する、無効化処理部を備えることを特徴とする、付記1又は2記載の情報処理装置。
(付記4)
前記無効化処理部が、前記周辺デバイスに対する前記アクセス要求としてデータリード要求が発行された場合に、当該データリード要求を破棄するとともに、当該データリード要求の発行元プロセスに対してデバイスエラーの発生を意味するダミー信号を応答することで前記アクセス要求を無効化することを特徴とする、付記3記載の情報処理装置。
(付記5)
前記無効化処理部が、前記周辺デバイスに対する前記アクセス要求としてデータライト要求が発行された場合に、当該データライト要求を破棄することで前記アクセス要求を無効化することを特徴とする、付記3又は4記載の情報処理装置。
(付記6)
前記処理装置が前記メモリバックアップ処理を実行している間は、前記処理装置において、当該メモリバックアップ処理以外の処理の実行を抑止する第2抑止部を備えることを特徴とする、付記1〜5のいずれか1項に記載の情報処理装置。
(付記7)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置であって、
電源装置からの電力供給の停止を検知する停電検知部と、
前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部と
を備え、
当該情報処理装置の起動処理を前記処理装置に実行させるための起動処理プログラムが、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させるモジュールを有し、
前記停電検知部が、前記電源装置からの電力供給の停止を検知すると、前記処理装置に第1の割り込み通知を入力し、
前記停電検知部から前記第1の割り込み通知が入力された前記処理装置が、前記起動処理プログラムの前記モジュールを実行することで前記メモリバックアップ処理を実行することを特徴とする、情報処理装置。
(付記8)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置であって、
電源装置からの電力供給の停止を検知する停電検知部と、
前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部と
を備え、
当該情報処理装置の起動処理を前記処理装置に実行させるための起動処理プログラムが、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させるモジュールを有し、
前記停電検知部が、前記電源装置からの電力供給の停止を検知すると、前記処理装置に第2の割り込み通知を入力し、
前記停電検知部から前記第2の割り込み通知が入力された前記処理装置が、前記メモリへの給電を維持した状態で、当該情報処理装置への電力供給を停止させるスリープ状態に移行させた後に、前記起動処理プログラムを起動し、
前記起動処理プログラムが、前記電源装置からの電力供給が停止しているかを確認し、前記電源装置からの電力供給が停止している場合に、前記モジュールを実行することで前記メモリバックアップ処理を実行することを特徴とする、情報処理装置。
(付記9)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置における処理方法であって、
電源装置からの電力供給の停止を検知する処理と、
前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する処理と、
前記処理装置と前記周辺デバイスとの通信を遮断する処理と、
前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行する処理と
を備えることを特徴とする、処理方法。
(付記10)
前記周辺デバイスにおける異常発生を検知する処理と、
前記電源装置からの電力供給が停止しているかを確認する処理と、
前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に前記処理装置によって実行されるデバイス異常処理の実行を抑止する処理と、
を備えることを特徴とする、付記9記載の処理方法。
(付記11)
前記電源装置からの電力供給の停止を検知すると、周辺デバイスに対するアクセス要求を無効化する処理を備えることを特徴とする、付記9又は10記載の処理方法。
(付記12)
前記周辺デバイスに対する前記アクセス要求としてデータリード要求が発行された場合に、当該データリード要求を破棄するとともに、当該データリード要求の発行元プロセスに対してデバイスエラーの発生を意味するダミー信号を応答することで前記アクセス要求を無効化することを特徴とする、付記11記載の処理方法。
(付記13)
前記周辺デバイスに対する前記アクセス要求としてデータライト要求が発行された場合に、当該データライト要求を破棄することで前記アクセス要求を無効化することを特徴とする、付記11又は12記載の処理方法。
(付記14)
前記処理装置が前記メモリバックアップ処理を実行している間は、前記処理装置において、当該メモリバックアップ処理以外の処理の実行を抑止する処理を備えることを特徴とする、付記9〜13のいずれか1項に記載の処理方法。
(付記15)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置における処理方法であって、
電源装置からの電力供給の停止を検知する処理と、
前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する処理と、
前記電源装置からの電力供給の停止を検知すると、前記処理装置に第1の割り込み通知を入力する処理と、
前記第1の割り込み通知が入力された前記処理装置が、当該情報処理装置の起動処理を前記処理装置に実行させるための起動処理プログラムに備えられる、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させるモジュールを実行することで前記メモリバックアップ処理を実行することを特徴とする、処理方法。
(付記16)
処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置における処理方法であって、
電源装置からの電力供給の停止を検知する処理と、
前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する処理と、
前記電源装置からの電力供給の停止を検知すると、前記処理装置に第2の割り込み通知を入力する処理と、
前記第2の割り込み通知が入力された前記処理装置が、前記メモリへの給電を維持した状態で、当該情報処理装置への電力供給を停止させるスリープ状態に移行させた後に、当該情報処理装置の起動処理を前記処理装置に実行させるための起動処理プログラムを起動する処理と、
前記起動処理プログラムが、前記電源装置からの電力供給が停止しているかを確認し、前記電源装置からの電力供給が停止している場合に、前記起動処理プログラムに備えられ、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させるモジュールを実行することで前記メモリバックアップ処理を実行する処理とを備えることを特徴とする、処理方法。
(付記17)
処理装置と、周辺デバイスと、記憶装置と、メモリと、電源装置からの電力供給の停止を検知する停電検知部と、前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部とを備える情報処理装置において、
前記処理装置と前記周辺デバイスとの通信を遮断し、
前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行する
処理を前記処理装置に実行させることを特徴とする、プログラム。
(付記18)
前記周辺デバイスにおける異常発生を示すデバイス異常発生通知を受信し、
前記デバイス異常発生通知を受信すると、前記電源装置からの電力供給が停止しているかを確認し、
前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に実行されるデバイス異常処理の実行を抑止する
処理を、前記処理装置に実行させることを特徴とする、付記17記載のプログラム。
(付記19)
処理装置と、周辺デバイスと、記憶装置と、メモリと、電源装置からの電力供給の停止を検知すると、前記処理装置に第1の割り込み通知を入力する停電検知部と、前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部とを備える情報処理装置において、
前記停電検知部から前記第1の割り込み通知が入力されると、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させることを特徴とする、プログラム。
(付記20)
処理装置と、周辺デバイスと、記憶装置と、メモリと、電源装置からの電力供給の停止を検知すると、前記電源装置からの電力供給の停止を検知すると、前記処理装置に第2の割り込み通知を入力する停電検知部と、前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部とを備える情報処理装置において、
前記停電検知部から前記第2の割り込み通知が入力されると、前記メモリへの給電を維持した状態で、当該情報処理装置への電力供給を停止させるスリープ状態に移行させ、
前記電源装置からの電力供給が停止しているかを確認し、
前記電源装置からの電力供給が停止している場合に、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を前記処理装置に実行させることを特徴とする、プログラム。
1 ストレージシステム
2 ホスト装置
3 記憶装置
10 CPU(処理装置)
11 バックアップ処理部
12 遮断処理部
13 デバイス異常処理部
14 停電確認部
15 抑止制御部
16 API無効化処理部
17 通知受信部
18 機能制御部
20 メモリ
22 メモリコントローラ
30 バックアップ用記憶装置
40 BPSU
41 バッテリ
51 フロントエンド
52 バックエンド
60 周辺デバイス
70 監視FPGA
71 停電検知部
72 デバイス監視部
100 ストレージ装置
101 CM
120 デバイスドライバ
200 カーネル
201 第1停電処理部
202 第2停電処理部
203 第3停電処理部
204 内部処理モジュール
205 アクセス可否判断部
2051 アクセス可否情報
210,210b,210c 周辺デバイスアクセスAPI
210a デバイスアクセス無効化API

Claims (7)

  1. 処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置であって、
    電源装置からの電力供給の停止を検知する停電検知部と、
    前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部と、
    前記処理装置と前記周辺デバイスとの通信を遮断する遮断部と
    前記周辺デバイスにおける異常発生を示すデバイス異常発生通知を受信するデバイス異常発生通知受信部と、
    前記デバイス異常発生通知受信部が前記デバイス異常発生通知を受信すると、前記電源装置からの電力供給が停止しているかを確認する停電確認部と、
    前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に前記処理装置によって実行されるデバイス異常処理の実行を抑止する第1抑止部とを備え、
    前記停電検知部が前記電源装置からの電力供給の停止を検知すると、前記遮断部が前記処理装置と前記周辺デバイスとの通信を遮断し、前記処理装置が、前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行することを特徴とする、情報処理装置。
  2. 前記停電検知部が前記電源装置からの電力供給の停止を検知すると、周辺デバイスに対するアクセス要求を無効化する、無効化処理部を備えることを特徴とする、請求項1記載の情報処理装置。
  3. 前記無効化処理部が、前記周辺デバイスに対する前記アクセス要求としてデータリード要求が発行された場合に、当該データリード要求を破棄するとともに、当該データリード要求の発行元プロセスに対してデバイスエラーの発生を意味するダミー信号を応答することで前記アクセス要求を無効化することを特徴とする、請求項記載の情報処理装置。
  4. 前記無効化処理部が、前記周辺デバイスに対する前記アクセス要求としてデータライト要求が発行された場合に、当該データライト要求を破棄することで前記アクセス要求を無効化することを特徴とする、請求項又は記載の情報処理装置。
  5. 前記処理装置が前記メモリバックアップ処理を実行している間は、前記処理装置において、当該メモリバックアップ処理以外の処理の実行を抑止する第2抑止部を備えることを特徴とする、請求項1〜のいずれか1項に記載の情報処理装置。
  6. 処理装置と、周辺デバイスと、記憶装置と、メモリとを備える情報処理装置における処理方法であって、
    電源装置からの電力供給の停止を検知する処理と、
    前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する処理と、
    前記処理装置と前記周辺デバイスとの通信を遮断する処理と、
    前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行する処理と
    前記周辺デバイスにおける異常発生を検知する処理と、
    前記電源装置からの電力供給が停止しているかを確認する処理と、
    前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に前記処理装置によって実行されるデバイス異常処理の実行を抑止する処理と、
    を備えることを特徴とする、処理方法。
  7. 処理装置と、周辺デバイスと、記憶装置と、メモリと、電源装置からの電力供給の停止を検知する停電検知部と、前記電源装置からの電力供給が停止した場合に、前記処理装置と前記メモリと前記記憶装置とに予備電力を供給する予備電力供給部とを備える情報処理
    装置において、
    前記処理装置と前記周辺デバイスとの通信を遮断し、
    前記メモリのデータを読み出して前記記憶装置に格納するメモリバックアップ処理を実行し、
    前記周辺デバイスにおける異常発生を示すデバイス異常発生通知を受信し、
    前記デバイス異常発生通知を受信すると、前記電源装置からの電力供給が停止しているかを確認し、
    前記電源装置からの電力供給が停止している場合に、前記周辺デバイスにおいて異常が発生した場合に実行されるデバイス異常処理の実行を抑止する
    処理を前記処理装置に実行させることを特徴とする、プログラム。
JP2014258587A 2014-12-22 2014-12-22 情報処理装置,処理方法及びプログラム Active JP6455132B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014258587A JP6455132B2 (ja) 2014-12-22 2014-12-22 情報処理装置,処理方法及びプログラム
US14/963,345 US10210057B2 (en) 2014-12-22 2015-12-09 Information processing apparatus with memory backup function for power failure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014258587A JP6455132B2 (ja) 2014-12-22 2014-12-22 情報処理装置,処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016118954A JP2016118954A (ja) 2016-06-30
JP6455132B2 true JP6455132B2 (ja) 2019-01-23

Family

ID=56129535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014258587A Active JP6455132B2 (ja) 2014-12-22 2014-12-22 情報処理装置,処理方法及びプログラム

Country Status (2)

Country Link
US (1) US10210057B2 (ja)
JP (1) JP6455132B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10788872B2 (en) * 2015-09-21 2020-09-29 Hewlett Packard Enterprise Development Lp Server node shutdown
US9965017B2 (en) * 2016-04-12 2018-05-08 International Business Machines Corporation System and method for conserving energy in non-volatile dual inline memory modules
CN107797642B (zh) * 2016-09-07 2019-12-06 华为技术有限公司 一种备电方法及装置
US10397096B2 (en) 2017-04-28 2019-08-27 International Business Machines Corporation Path resolution in InfiniBand and ROCE networks
US11243899B2 (en) * 2017-04-28 2022-02-08 International Business Machines Corporation Forced detaching of applications from DMA-capable PCI mapped devices
US10778767B2 (en) 2017-04-28 2020-09-15 International Business Machines Corporation Persistent memory replication in RDMA-capable networks
US11044099B2 (en) * 2018-12-28 2021-06-22 Intel Corporation Technologies for providing certified telemetry data indicative of resources utilizations
US11146101B2 (en) 2019-10-31 2021-10-12 Steven Demaree Network power failure alert system
CN113885374A (zh) * 2021-09-23 2022-01-04 国网浙江省电力有限公司杭州供电公司 重要设备停电实时报警装置及其实现方法
JP2024074061A (ja) * 2022-11-18 2024-05-30 株式会社日立製作所 停電対処方法、演算装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7619541B2 (en) * 2004-10-01 2009-11-17 Lockheed Martin Corporation Remote sensor processing system and method
EP1643506B1 (en) * 2004-10-04 2006-12-06 Research In Motion Limited System and method for automatically saving memory contents of a data processing device on power failure
JP4336849B2 (ja) * 2004-12-17 2009-09-30 日本電気株式会社 コンピュータシステム,入出力制御装置,及びコンピュータシステム動作方法
US8316158B1 (en) * 2007-03-12 2012-11-20 Cypress Semiconductor Corporation Configuration of programmable device using a DMA controller
US8200885B2 (en) * 2007-07-25 2012-06-12 Agiga Tech Inc. Hybrid memory system with backup power source and multiple backup an restore methodology
JP4410278B2 (ja) 2007-10-04 2010-02-03 レノボ・シンガポール・プライベート・リミテッド 電子機器、電子機器の電力制御方法、およびコンピュータが実行するためのプログラム
JP5729746B2 (ja) * 2009-09-17 2015-06-03 日本電気株式会社 ストレージシステム及びディスクアレイ装置
JP5609242B2 (ja) 2010-04-28 2014-10-22 富士通株式会社 情報処理装置及びメモリダンプ採取方法
US9003175B2 (en) 2011-04-29 2015-04-07 Lenovo (Singapore) Pte. Ltd. System and method for accelerated boot performance
US8909705B2 (en) 2011-07-14 2014-12-09 Sony Corporation Method and system for use in providing network services interchange
JP2013061799A (ja) * 2011-09-13 2013-04-04 Toshiba Corp 記憶装置、記憶装置の制御方法およびコントローラ

Also Published As

Publication number Publication date
US20160179640A1 (en) 2016-06-23
JP2016118954A (ja) 2016-06-30
US10210057B2 (en) 2019-02-19

Similar Documents

Publication Publication Date Title
JP6455132B2 (ja) 情報処理装置,処理方法及びプログラム
US20150089287A1 (en) Event-triggered storage of data to non-volatile memory
US20160378344A1 (en) Processor and platform assisted nvdimm solution using standard dram and consolidated storage
JP4041473B2 (ja) マルチクラスタ・ストレージ・サブシステムのための自律型パワー・ロス・リカバリ
CN106326061B (zh) 高速缓存数据处理方法及设备
US20170139605A1 (en) Control device and control method
JP2004038290A (ja) 情報処理システムおよび同システムで用いられるディスク制御方法
JP2011134327A (ja) システムにおけるメモリ冗長性の制御
WO2016078202A1 (zh) 一种掉电保护方法及固态硬盘
JP4939180B2 (ja) 接続された装置を構成するための初期設定コードの実行
WO2014132373A1 (ja) ストレージシステム及び記憶デバイス障害回復方法
JP2007058419A (ja) Pld上のメモリ内の情報に従って構築される論理回路を備えたストレージシステム
WO2006082657A1 (ja) マルチcpuコンピュータおよびシステム再起動方法
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
CN104077375A (zh) 一种cc-numa系统中节点的错误目录的处理方法和节点
US20230251931A1 (en) System and device for data recovery for ephemeral storage
JP4641545B2 (ja) マルチプロセッサの操作を管理する方法、システム、およびコンピュータ・プログラム
US10235255B2 (en) Information processing system and control apparatus
US20150324248A1 (en) Information processing device, control method and recording medium for recording control program
US10001826B2 (en) Power management mechanism for data storage environment
JP5924819B2 (ja) データ保全処理装置及びデータ保全処理プログラム
US7260680B2 (en) Storage apparatus having microprocessor redundancy for recovery from soft errors
JP2009104369A (ja) ディスクサブシステム
US10528275B2 (en) Storage system, storage control device, and method of controlling a storage system
JP2008117000A (ja) キャッシュデータ保護装置およびキャッシュデータ保護方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180619

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181203

R150 Certificate of patent or registration of utility model

Ref document number: 6455132

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150