[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2013041438A - ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム - Google Patents

ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム Download PDF

Info

Publication number
JP2013041438A
JP2013041438A JP2011178189A JP2011178189A JP2013041438A JP 2013041438 A JP2013041438 A JP 2013041438A JP 2011178189 A JP2011178189 A JP 2011178189A JP 2011178189 A JP2011178189 A JP 2011178189A JP 2013041438 A JP2013041438 A JP 2013041438A
Authority
JP
Japan
Prior art keywords
path
information
function
route
fan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011178189A
Other languages
English (en)
Other versions
JP5561790B2 (ja
Inventor
Tadashi Shimono
忠 下野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Fielding Ltd
Original Assignee
NEC Fielding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Fielding Ltd filed Critical NEC Fielding Ltd
Priority to JP2011178189A priority Critical patent/JP5561790B2/ja
Publication of JP2013041438A publication Critical patent/JP2013041438A/ja
Application granted granted Critical
Publication of JP5561790B2 publication Critical patent/JP5561790B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】OS起動可否にかかわらず、また、特別な専門知識を必要とすることなく、短時間で、障害箇所、及び被疑部品を特定する。
【解決手段】構成情報取得機能P−10は、サーバ上のハードウェアを制御するデバイスの構成情報を取得する。経路情報テーブル生成機能P−20は、構成情報取得機能P−10によって取得されたハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する。経路情報常駐監視機能P−60は、デバイス間の経路の異常発生を監視する。経路情報常駐監視機能P−60は、異常経路の発生を検出すると、経路情報テーブル生成機能P−20によって生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定する。
【選択図】図3

Description

本発明は、デバイスドライバの制御情報の発信を監視、記録することにより、短時間で障害被疑部品を特定するハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラムに関する。
近年、PCサーバを初めとするコンピュータ機器においては、回路の高集積化に伴い、ドライバ、及びコンポーネント単位でエラーログ情報が生成出力されるため、メッセージが増加・複雑化している。これに対し、ハードウェア障害発生時に交換する被疑部品単位は、マザーボード、電源、FAN、CPU、HDDなど決まった単位での交換であり、ほぼ一定である。
このようなコンピュータ機器において、システム障害発生時には、オペレーティングシステム(以下、OS:Operating System)上に記録されるログ情報を採取し、必要な情報を選別して解析を実施後、障害被疑部品を特定していた。ログ情報に示される被疑部品と交換単位とは一致しており、単純に交換を実施することで障害復旧が可能であった。
例えば、特許文献1には、ベースログ収集機能、エラーログ、エラーログ分析装置などから構成され、エラーログに、装置の装置構成情報、装置のハードウェアエラー情報、フラグコード、被疑部品情報を格納し、被疑部品翻訳機能がフラグコード及び装置構成情報に基づいて、装置の故障個所の被疑部品情報を取得する技術が開示されている。
また、特許文献2には、複数プロセッサに内部障害履歴がある場合、診断プロセッサが、プロセッサ情報の障害発生回数を比較し、障害発生回数順に、被疑部品を表示する技術が開示されている。
また、特許文献3には、エラー表に当該エラーの発生を示す情報が格納されている場合、制御部は、同一種類のエラーは既に発生していると判断し、ディスクアレイ装置における全ての経路について、異常時の加点処理を行い、異常時の加点が閾値を超えると、同一のエラーが既に発生しているとし、これにより、経路異常をより早く検出する技術が開示されている。
特開2004−206166号公報 特開2009−151407号公報 特開2009−205316号公報
しかしながら、上述した特許文献1〜3では、故障装置の被疑部品特定をエラーログや、エラーコードなどの解析で行っているため、OS上に記録されているログ情報にハードウェアエラーコード以外の不要な情報が多く、必要とするログ情報の選別に時間を要し、ログファイルのサイズが上限を超えた場合には、必要とする情報が取得できないなど、情報解析前に時間を要するという問題があった。
また、OSが起動できない障害の場合には、OS上に記録された情報が採取できないという問題があった。さらに、近年の回路の高集積化により、複数機能を1つのボードにまとめるパッケージ化により、ログの意味を確認するための専門知識が必要となり、ログ情報に示される被疑部品と交換対象となる被疑部品とが一致しない場合には、障害被疑部品の特定に、長時間を要するという問題があった。
本発明は、上述の課題を解決することのできるハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラムを提供することにある。
上述した課題を解決するために、本発明は、ハードウェアの障害を特定するハードウェア障害被疑特定装置において、サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得手段と、前記構成情報取得手段によって取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成手段と、前記デバイス間の経路の異常発生を監視する経路情報監視手段とを備え、前記経路情報監視手段は、異常経路の発生を検出すると、前記経路情報テーブル生成手段によって生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定することを特徴とするハードウェア障害被疑特定装置である。
また、上述した課題を解決するために、本発明は、ハードウェアの障害を特定するハードウェア障害被疑特定方法において、サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得ステップと、前記構成情報取得ステップで取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成ステップと、前記デバイス間の経路の異常発生を監視する経路情報監視ステップとを含み、前記経路情報監視ステップは、異常経路の発生を検出すると、前記経路情報テーブル生成ステップで生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定することを特徴とするハードウェア障害被疑特定方法である。
また、上述した課題を解決するために、本発明は、ハードウェアの障害を特定するハードウェア障害被疑特定装置のコンピュータに、サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得機能、前記構成情報取得機能によって取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成機能、前記デバイス間の経路の異常発生を監視する経路情報監視機能を実行させ、前記経路情報監視機能は、異常経路の発生を検出すると、前記経路情報テーブル生成機能によって生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定することを特徴とするプログラムである。
この発明によれば、OS起動可否にかかわらず、また、特別な専門知識を必要とすることなく、短時間で、障害箇所、及び被疑部品を特定することができる。
本発明の実施形態によるサーバの構成を示すブロック図である。 本実施形態による経路情報格納部1000の構成を示すブロック図である。 本実施形態による制御経路常駐監視プログラムP−1の機能を示すブロック図である。 本実施形態による、ソフトウェアの制御情報経路とハードウェアの制御との関係を示す概念図である。 本実施形態による、経路テーブル#1の構成を示す概念図である。 本実施形態による、電源・FANテーブルの構成を示す概念図である。 本実施形態による、電源・FANテーブルの一例を示す概念図である。 本実施形態による、経路テーブル#2の構成を示す概念図である。 本実施形態による、交換被疑部品テーブルの構成を示す概念図である。 本実施形態による、異常経路情報を示す概念図である。 本実施形態による、交換被疑部品を示す概念図である。 本実施形態による、制御経路情報常駐監視プログラムP−1の起動から経路情報常駐監視開始までの動作を説明するためのフローチャートである。 本実施形態による、制御経路情報常駐監視プログラムP−1の障害経路検出時の動作を説明するためのフローチャートである。
以下、本発明の一実施形態を、図面を参照して説明する。
図1は、本発明の実施形態によるサーバの構成を示すブロック図である。図において、サーバ10は、マザーボード100と、CPU200と、メモリ300と、内蔵補助記憶装置600と、拡張増設ハードウェア700とを実装している。また、キーボード400とモニタ500とは、マザーボード100上の外部インタフェイス1G1を介して接続されている。また、外付け補助記憶装置800が、拡張増設ハードウェア700上の外部インタフェイス7G1を介して接続されている。
マザーボード100は、一般的なコンピュータのマザーボードであり、コンピュータ動作時、サーバ10の内部入出力データと外部入出力データとを制御する機能を有する。該マザーボード100は、コントローラ1C1、1C2と、内部インタフェイス1N1、1N2、1N3、1N4と、外部インタフェイス1G1と、電源・FAN情報格納部2000と、経路情報格納部1000とを備えている。
コントローラ1C1は、一般的なノースブリッジであり、データの入出力を制御する半導体回路である。該コントローラ11C1は、内部インタフェイス1N1からの制御情報入力ポート1C1−R1と、内部インタフェイス1N1への制御情報出力ポート1C1−S1と、内部インタフェイス1N2からの制御情報入力ポート1C1−R2と、内部インタフェイス1N2への制御情報出力ポート1C1−S2と、コントローラ1C2からの制御情報入力ポート1C1−R3と、コントローラ1C2への制御情報出力ポート1C1−S3とを備えている。
コントローラ1C2は、一般的なサウスブリッジであり、データの入出力を制御する半導体回路である。該コントローラ1C2は、コントローラ1C1からの制御情報入力ポート1C2−R1と、コントローラ1C1への制御情報出力ポート1C2−S1と、外部インタフェイス1G1からの制御情報入力ポート1C2−R2と、外部インタフェイス1G1への制御情報出力ポート1C2−S2と、内部インタフェイス1N3からの制御情報入力ポート1C2−R3と、内部インタフェイス1N3への制御情報出力ポート1C2−S3、内部インタフェイス1N4からの制御情報入力ポート1C2−R4と、内部インタフェイス1N4への制御情報出力ポート1C2−S4とを備えている。
内部インタフェイス1N1は、一般的なCPUソケットであり、コントローラ1C1とCPU200とを接続するコネクタである。該内部インタフェイス1N1は、コントローラ1C1からの制御情報入力ポート1N1−R1と、コントローラ11C1への制御情報出力ポート1N1−S1、CPU200からの制御情報入力ポート1N1−R2と、CPU200への制御情報出力ポート1N1−S2とを備えている。
内部インタフェイス1N2は、一般的なメモリスロットであり、コントローラ1C1とメモリ300とを接続するコネクタである。該内部インタフェイス1N2は、コントローラ1C1からの制御情報入力ポート1N2−R1と、コントローラ1C1への制御情報出力ポート1N2−S1と、メモリ300からの制御情報入力ポート1N2−R2と、メモリ300への制御情報出力ポート1N2−S2とを備えている。
内部インタフェイス1N3は、一般的なハードディスクドライブ接続コネクタであり、コントローラ1C2と補助記憶装置600とを接続するコネクタである。該内部インタフェイス1N3は、コントローラ1C2からの制御情報入力ポート1N3−R1と、コントローラ1C2への制御情報出力ポート1N3−S1と、内蔵補助記憶装置600からの制御情報入力ポート1N3−R2と、内蔵補助記憶装置600への制御情報出力ポート1N3−S2とを備えている。
内部インタフェイス1N4は、一般的なPCIスロットであり、コントローラ1C2と拡張増設ハードウェア700とを接続するコネクタである。該内部インタフェイス1N4は、コントローラ1C2からの制御情報入力ポート1N4−R1と、コントローラ1C2への制御情報出力ポート1N4−S1と、拡張増設ハードウェア700からの制御情報入力ポート1N4−R2と、拡張増設ハードウェア700への制御情報出力ポート1N4−S2とを備えている。
外部インタフェイス1G1は、コントローラ1C2とキーボード400、及びコントローラ1C2とモニタ500とを接続するコネクタである。該外部インタフェイス1G1は、コントローラ1C2からの制御情報入力ポート1G1−R1と、コントローラ1C2への制御情報出力ポート1G1−S1と、キーボード400からの制御情報入力ポート1G1−R2と、モニタ500への制御情報出力ポートとを備えている。
経路情報格納部1000は、不揮発記憶装置であり、経路情報を記憶する。電源・FAN情報格納部2000は、一般的なBMCチップであり、マザーボード100に接続される電源装置とファンの状態を監視する機能とを有し、電源・FAN情報DENGENを格納する半導体回路である。
CPU200は、一般的なCPUであり、コントローラ1C1からの制御情報を制御情報入力ポートCPU−R1から読み込み、解読処理、演算処理し、結果データを制御情報出力ポートCPU−S1からコントローラ1C1へ出力する高集積回路である。該CPU200は、コントローラ1C1からの制御情報を内部インタフェイス1N1経由で受信する制御情報入力ポートCPU−R1と、コントローラ1C1への制御情報を内部インタフェイス1N1経由で送信する制御情報出力ポートCPU−S1とを備えている。
メモリ300は、コントローラ1C1からのデータを記憶する機能と、コントローラ1C1へ制御情報を送受信する機能とを有する、一般的な揮発性メモリである。該メモリ300は、コントローラ1C1からの制御情報を内部インタフェイス1N2経由で受信する制御情報入力ポートMEM−R1と、コントローラ1C1への制御情報を内部インタフェイス1N2経由で送信する制御情報出力ポートMEM−S1とを備えている。
内蔵補助記憶装置600は、一般的なハードディスクドライブであり、コントローラ1C2からの制御情報を記憶する機能と、コントローラ1C2へ制御情報を送受信する機能とを有する。該内蔵補助記憶装置600は、コントローラ1C2からの制御情報を内部インタフェイス1N3経由で受信する制御情報入力ポートHDD−R1と、コントローラ1C2への制御情報を内部インタフェイス1N3経由で送信する制御情報出力ポートHDD−S1とを備えている。
拡張増設ハードウェア700は、コンピュータ動作時にマザーボード100からの内部入出力制御情報と外付け補助記憶装置800からの外部入出力制御情報とにより、データを制御する機能を有する。該拡張増設ハードウェア700は、コントローラ7C1と、内部インタフェイス7N1と、外部インタフェイス7G1とを備えている。
コントローラ7C1は、一般的なRAIDコントローラであり、データの入出力を制御する半導体回路である。該コントローラ7C1は、内部インタフェイス7N1からの制御情報入力ポート7C1−R1と、内部インタフェイス7N1への制御情報出力ポート7C1−S1と、外部インタフェイス7G1からの制御情報入力ポート7C1−R2と、外部インタフェイス7G1への制御情報出力ポート7C1−S2とを備えている。
内部インタフェイス7N1は、マザーボード100と拡張増設ハードウェア700とを接続するコネクタである。該内部インタフェイス7N1は、内部インタフェイス1N4からの制御情報入力ポート7N1−R1と、内部インタフェイス1N4への制御情報出力ポート7N1−S1と、コントローラ7C1からの制御情報入力ポート7N1−R2と、コントローラ7C1への制御情報出力ポート7N1−R2とを備えている。
外部インタフェイス7G1は、コントローラ7C1と外付け補助記憶装置800とを接続するコネクタである。該外部インタフェイス7G1は、コントローラ7C1からの制御情報入力ポート7G1−R1と、コントローラ7C1への制御情報出力ポート7G1−S1と、外付け補助記憶装置800からの制御情報入力ポート7G1−R2と、外付け補助記憶装置800への制御情報出力ポート7G1−S2とを備えている。
キーボード400は、一般的なコンピュータのキーボードである。該キーボード400は、コントローラ1C2への制御情報出力ポートKB−S1を備え、コンピュータへのデータ入力機能を有する。モニタ500は、一般的なコンピュータのディスプレイ装置である。該モニタ500は、コントローラ1C2からの制御情報入力ポートDSP−R1を備え、コンピュータからのデータ出力機能を有する。
外付け補助記憶装置800は、一般的なハードディスク増設筐体であり、コントローラ7C1からの制御情報により、コントローラ7C1経由で受信されるデータを記憶する機能と、コントローラ7C1へデータを送受信する機能とを有する。該外付け補助記憶装置800は、コントローラ7C1からの制御情報入力ポートARY−R1とコントローラ7C1への制御情報出力ポートARY−S1とを備えている。
図2は、本実施形態による経路情報格納部1000の構成を示すブロック図である。図2において、経路情報格納部1000は、プログラムソース格納テーブル1001、FRUテーブル1002、経路情報監視テーブル1003、電源・FAN状態テーブル1004、被疑部品テーブル1005、及び異常経路テーブル1006を備える不揮発記憶装置である。プログラムソース格納テーブル1001は、制御経路常駐監視プログラムP−1を格納するテーブルである。
図3は、本実施形態による制御経路常駐監視プログラムP−1の機能を示すブロック図である。図3において、制御経路常駐監視プログラムP−1は、構成情報取得機能P−10、経路情報テーブル生成機能P−20、情報保存・読込機能P−30、電源・FAN状況取得機能P−40、電源・FAN状況テーブル生成機能P−50、及び経路情報常駐監視機能P−60を有するプログラム群である。
構成情報取得機能P−10は、情報保存・読込機能P−30の起動完了の信号により自動起動する機能、OS上のデバイスドライバD1の構成情報KOSEIを取得する機能(図4:後述)、情報保存・読込機能P−30へ構成情報KOSEIを引き渡す機能を有する機能プログラムである。
経路情報テーブル生成機能P−20は、電源・FAN状況テーブル生成機能P−50の起動完了の信号により自動起動する機能、情報保存・読込機能P−30から、構成情報KOSEIを取得し(図4を参照)、経路情報OS−1C1、1C1−OS、1C1−CPU、CPU−1C1、1C1−MEM、MEM−1C1、1C1−1C2、1C2−1C1、KB−1C2、1C2−DSP、1C2−HDD、HDD−1C2、1C2−7C1、7C1−1C2、7C1−ARY、ARY−7C1を把握し(図4:後述)、経路テーブル#1(図5)を生成する機能、構成情報KOUSEIとハードウェアの交換単位(マザーボード100、CPU200、メモリ300、キーボード400、モニタ500、内蔵補助記憶装置600、拡張増設ハードウェア700、外付け補助記憶装置800)とハードウェア制御プログラムであるデバイスドライバD1とより、交換被疑部品テーブル(図9:後述)を生成する機能、交換被疑部品テーブル(図9:後述)から、経路テーブル#2(図8:後述)を生成する機能、情報保存・読込機能P−30へ経路テーブル#1(図5:後述)及び経路テーブル#2(図8:後述)を引き渡す機能を有する機能プログラムである。
情報保存・読込機能P−30は、OS起動完了の信号により自動起動する機能、構成情報取得機能P−10、経路情報テーブル生成機能P−20、電源・FAN状況取得機能P−40、電源・FAN状況テーブル生成機能P−50、及び経路情報常駐監視機能P−60からの情報の引渡しと受け取りを制御する機能、経路情報格納部1000への情報保存及び読込を制御する機能、FRUテーブル1002、経路情報監視テーブル1003、電源・FAN状況テーブル1004の情報を外部に出力する機能を有する機能プログラムである。
電源・FAN状況取得機能P−40は、構成情報取得機能P−10の起動完了の信号により自動起動する機能、電源・FAN情報格納部2000から電源・FAN情報DENGENを取得する機能、情報保存・読込機能P−30へ電源・FAN情報DENGENを引き渡す機能を有する機能プログラムである。
電源・FAN状況テーブル生成機能P−50は、電源・FAN状況取得機能P−40の起動完了の信号により自動起動する機能、情報保存・読込機能P−30より、電源・FAN情報DENGENを取得し、電源・FANテーブル(図6:後述)を生成する機能、情報保存・読込機能P−30へ電源・FANテーブル(図6:後述)を引き渡す機能を有する機能プログラムである。
経路情報常駐監視機能P−60は、経路情報テーブル生成機能P−20の起動完了の信号により自動起動する機能、OS内で常駐実行し、経路情報OS−1C1、1C1−OS、1C1−CPU、CPU−1C1、1C1−MEM、MEM−1C1、1C1−1C2、1C2−1C1、KB−1C2、1C2−DSP、1C2−HDD、HDD−1C2、1C2−7C1、7C1−1C2、7C1−ARY、ARY−7C1を監視する機能(図4:後述)、経路障害を検出する機能、検出した経路障害を電源・FANテーブル(図6:後述)と比較する機能、検出した経路障害を経路テーブル#2(図8:後述)と比較する機能、比較結果情報から交換被疑部品を特定する機能、特定した交換被疑部品の情報を、情報保存・読込機能P−30へ引き渡す機能を有する機能プログラムである。
図2に説明を戻すと、FRUテーブル1002は、後述する経路情報テーブル生成機能P−20により生成される交換被疑部品テーブル(図9:後述)を格納するテーブルである。経路情報監視テーブル1003は、後述する経路情報テーブル生成機能P−20により生成される、経路テーブル#1(図5:後述)と経路テーブル#2(図8:後述)とを格納するテーブルである。
電源・FAN状態テーブル1004は、後述する電源・FAN状況テーブル生成機能P−50により生成される電源・FANテーブル(図6:後述)を格納するテーブルである。被疑部品テーブル1005は、経路情報常駐監視機能P−60により生成される交換被疑部品(図11:後述)を格納するテーブルである。異常経路テーブル1006は、経路情報常駐監視機能P−60により生成される異常経路情報(図10:後述)を格納するテーブルである。
図4は、本実施形態による、ソフトウェアの制御情報経路とハードウェアの制御との関係を示す概念図である。図4において、ソフトウェアは、構成要素に、基本ソフトウェアOSを有する。基本ソフトウェアOSは、一般的な基本ソフトウェアであり、デバイスドライバD1、構成情報KOUSEIを有する。構成情報KOSEIは、デバイスドライバD1、経路情報(制御情報入力経路、制御情報出力経路)OS−1C1、1C1−OS、1C1−CPU、CPU−1C1、1C1−MEM、MEM−1C1、1C1−1C2、1C2−1C1、KB−1C2、1C2−DSP、1C2−HDD、HDD−1C2、1C2−7C1、7C1−1C2、7C1−ARY、ARY−7C1を有する。なお、上記経路情報は、制御情報入力経路、及び制御情報出力経路からなる。構成情報KOSEIは、OS上で認識したハードウェア構成(サーバ本体10、キーボード400、モニタ500、外付け補助記憶装置800)の接続情報である。
デバイスドライバD1は、OSとハードウェア間を制御する機能を有する、制御プログラム群である。コントローラ#1デバイスドライバ1C1−Dは、コントローラ1C1の制御プログラムである。該コントローラ#1デバイスドライバ1C1−Dは、OSからの制御情報入力経路OS−1C1とOSへの制御情報出力経路1C1−OS、CPUデバイスドライバCPU−Dへの制御情報出力経路1C1−CPUとCPUデバイスドライバCPU−Dからの制御情報入力経路CPU−1C1、メモリデバイスドライバMEM−Dへの制御情報出力経路1C1−MEMとメモリデバイスドライバMEM−Dからの制御情報入力経路MEM−1C1、及びコントローラ#2デバイスドライバ1C2−Dへの制御情報出力経路1C1−1C2とコントローラ#2デバイスドライバ1C2−Dからの制御情報入力経路1C2−1C1を有する。
該コントローラ#1デバイスドライバ1C1−Dは、OS、CPUデバイスドライバCPU−D、メモリデバイスドライバMEM−D、コントローラ2デバイスドライバ1C2−Dからの制御情報により、CPU200とメモリ300間のデータ入出力を制御する機能、CPU200とコントローラ1C2間のデータ入出力を制御する機能、メモリ300とコントローラ1C2間のデータ入出力を制御する機能、OSとコントローラ1C1間のデータ入出力を制御する機能を有する。
CPUデバイスドライバCPU−Dは、CPU200の制御プログラムである。CPUデバイスドライバCPU−Dは、コントローラ#1デバイスドライバ1C1−Dからの制御情報入力経路1C1−CPUとコントローラ#1デバイスドライバ1C1−Dへの制御情報出力経路CPU−1C1を有する。CPUデバイスドライバCPU−Dは、コントローラ#1デバイスドライバ1C1−Dからの制御情報により、CPU200へのデータ入出力を制御する機能を有する。
メモリデバイスドライバMEM−Dは、メモリ300の制御プログラムである。メモリデバイスドライバMEM−Dは、コントローラ#1デバイスドライバ1C1−Dからの制御情報入力経路1C1−MEMとコントローラ#1デバイスドライバ1C1−Dへの制御情報出力経路MEM−1C1を有する。メモリデバイスドライバMEM−Dは、コントローラ#1デバイスドライバ1C1−Dからの制御情報により、メモリ300へのデータ入出力を制御する機能を有する。
コントローラ#2デバイスドライバ1C2−Dは、コントローラ1C2の制御プログラムである。コントローラ#2デバイスドライバ1C2−Dは、コントローラ#1デバイスドライバ1C1−Dからの制御情報入力経路1C1−1C2とコントローラ#1デバイスドライバ1C1−Dへの制御情報出力経路1C2−1C1、キーボードデバイスドライバKB−Dからの制御情報入力経路KB−1C2とモニタデバイスドライバDSP−Dへの制御情報出力経路1C2−DSP、内蔵補助記憶装置デバイスドライバHDD−Dへの制御情報出力経路1C2−HDDと内蔵補助記憶装置デバイスドライバHDD−Dからの制御情報入力経路HDD−1C2、コントローラ#3デバイスドライバ7C1−Dへの制御情報出力経路1C2−7C1とコントローラ#3デバイスドライバ7C1−Dからの制御情報入力経路7C1−1C2を有する。
コントローラ#2デバイスドライバ1C2−Dは、コントローラ#1デバイスドライバ1C1−D、キーボードデバイスドライバKB−D、内蔵補助記憶装置デバイスドライバHDD−D、コントローラ#3デバイスドライバ7C1−Dからの制御情報により、キーボード400からコントローラ1C1へのデータ入力を制御する機能、コントローラ1C1からモニタ500へのデータ出力を制御する機能、コントローラ1C1と内蔵補助記憶装置600間のデータ入出力を制御する機能、コントローラ1C1と拡張増設ハードウェア700間のデータ入出力を制御する機能を有する。
キーボードデバイスドライバKB−Dは、キーボード400の制御プログラムである。キーボードデバイスドライバKB−Dは、コントローラ#2デバイスドライバ1C2−Dへの制御情報出力経路を有する。キーボードデバイスドライバKB−Dは、キーボード400に入力された情報をコンピュータで理解可能なデータに変換する機能、コントローラ1C2へのデータ入力を制御する機能を有する。
モニタデバイスドライバDSP−Dは、モニタ500の制御プログラムである。モニタデバイスドライバDSP−Dは、コントローラ#2デバイスドライバ1C2−Dからの制御情報入力経路を有する。モニタデバイスドライバDSP−Dは、コントローラ#2デバイスドライバ1C2−Dからの制御情報により、コントローラ1C2からモニタ500へのデータ出力を制御する機能、コンピュータが理解可能なデータを利用者が理解可能な情報に変換し、モニタ画面へ表示する機能を有する。
内蔵補助記憶装置デバイスドライバHDD−Dは、内蔵補助記憶装置600の制御プログラムである。内蔵補助記憶装置デバイスドライバHDD−Dは、コントローラ#2デバイスドライバ1C2−Dからの制御情報入力経路1C2−HDDと、コントローラ#2デバイスドライバ1C2−Dへの制御情報出力経路HDD−1C2とを有する。内蔵補助記憶装置デバイスドライバHDD−Dは、コントローラ#2デバイスドライバ1C2−Dからの制御情報により、コントローラ1C2と内蔵補助記憶装置600間のデータ入出力を制御する機能を有する。
コントローラ#3デバイスドライバ7C1−Dは、拡張増設ハードウェアの制御プログラムである。コントローラ#3デバイスドライバ7C1−Dは、コントローラ#2デバイスドライバ1C2−Dからの制御情報入力経路1C2−7C1とコントローラ#2デバイスドライバ1C2−Dへの制御情報出力経路7C1−1C2、外付け補助記憶装置デバイスドライバARY−Dからの制御情報入力経路ARY−7C1と外付け補助記憶装置デバイスドライバARY−Dへの制御情報出力経路7C1−ARYを有する。コントローラ#3デバイスドライバ7C1−Dは、コントローラ#2デバイスドライバ1C2−D、外付け補助記憶装置デバイスドライバARY−Dからの制御情報により、コントローラ1C2と外付け補助記憶装置800間のデータ入出力を制御する機能を有する。
外付け補助記憶装置デバイスドライバARY−Dは、外付け補助記憶装置の制御プログラムである。外付け補助記憶装置デバイスドライバARY−Dは、コントローラ#3デバイスドライバ7C1−Dからの制御情報入力経路7C1−ARYとコントローラ#3デバイスドライバ7C1−Dへの制御情報出力経路ARY−7C1を有する。外付け補助記憶装置デバイスドライバARY−Dは、コントローラ#3デバイスドライバ7C1−Dからの制御情報により、コントローラ7C1と外付け補助記憶装置800間のデータ入出力を制御する機能を有する。
図5は、本実施形態による、経路テーブル#1の構成を示す概念図である。図5において、経路テーブル#1は、経路と、その経路の状態と、その経路上のデバイスとを対応付けて記憶している。
図6は、本実施形態による、電源・FANテーブルの構成を示す概念図である。図6において、電源・FANテーブルは、交換被疑部品とその状態とを対応付けて記憶している。交換被疑部品には、故障時の交換部品が記載される。状況が「○」の場合、正常を意味する。状況が「×」の場合、異常を意味する。
図7は、本実施形態による、電源・FANテーブルの一例を示す概念図である。図示の例では、電源装置が異常であることを示している。
図8は、本実施形態による、経路テーブル#2の構成を示す概念図である。図8において、経路テーブル#2は、経路と、その経路の状態と、その経路上のデバイスと交換被疑部品とを対応付けて記憶している。
図9は、本実施形態による、交換被疑部品テーブルの構成を示す概念図である。図9において、交換被疑部品テーブルは、交換被疑部品と対応するデバイスとを対応付けて記憶している。
図10は、本実施形態による、異常経路情報を示す概念図である。図10において、異常経路情報は、異常が発生した経路とその状態(「×」で異常)を示す。
図11は、本実施形態による、交換被疑部品を示す概念図である。図11において、交換被疑部品は、交換被疑部品を示す。
次に、本実施形態の動作について説明する。
図12は、本実施形態による、制御経路情報常駐監視プログラムP−1の起動から経路情報常駐監視開始までの動作を説明するためのフローチャートである。まず、情報保存・読込機能P−30がOS起動完了の信号により自動起動する(ステップS1)。サーバ10のDC−ON信号により、情報保存・読込機能P−30が起動待機状態となる。次に、起動待機状態の情報保存・読込機能P−30は、OS起動完了確認を開始し、OS起動完了の信号を受信することで起動する。起動した情報保存・読込機能P−30は、構成情報取得機能P−10の起動命令を発行する。
次に、情報保存・読込機能P−30からの起動命令により、構成情報取得機能P−10を起動する(ステップS2)。起動した構成情報取得機能P−10は、電源・FAN状況取得機能P−40の起動命令を発行する。
次に、構成情報取得機能P−10からの起動命令により、電源・FAN状況取得機能P−40を起動する(ステップS3)。起動した電源・FAN状況取得機能P−40は、電源・FAN状況テーブル生成機能P−50の起動命令を発行する。
次に、電源・FAN状況取得機能P−40からの起動命令により、電源・FAN状況テーブル生成機能P−50を起動する(ステップS4)。起動した電源・FAN状況テーブル生成機能P−50は、経路情報テーブル生成機能P−20の起動命令を発行する。
次に、電源・FAN状況テーブル生成機能P−50からの起動命令により、経路情報テーブル生成機能P−20を起動する(ステップS5)。起動した経路情報テーブル生成機能P−20は、構成情報取得機能P−10へ構成情報KOSEIの取得命令(図4)を発行する。
次に、構成情報取得機能P−10は、構成情報KOSEIを取得する(ステップS6)。構成情報取得機能P−10は、経路情報テーブル生成機能P−20からの構成情報KOSEIの取得命令により、OS上の構成情報KOSEIを取得し、電源・FAN取得機能P−40へ電源・FAN情報DENGENの取得命令を発行する。
次に、電源・FAN状況取得機能P−40は、電源・FAN情報DENGENを取得する(ステップS7)。電源・FAN状況取得機能P−40は、構成情報取得機能P−10からの電源・FAN情報DENGENの取得命令により、電源・FAN情報格納部2000の電源・FAN情報DENGENを取得し、電源・FAN状況テーブル生成機能P−50へ電源・FANテーブル(図6)の生成命令を発行し、電源・FAN情報DENGENを、情報保存・読込機能P−30へ送信する。
次に、電源・FAN状況テーブル生成機能P−50は、電源・FANテーブル(図6)を生成する(ステップS8)。電源・FAN状況テーブル生成機能P−50は、電源・FAN状況取得機能P−40からの電源・FANテーブル(図6)の生成命令により、情報保存・読込機能P−30から電源・FAN情報DENGENを受信する。
次に、電源・FAN状況テーブル生成機能P−50は、電源・FAN情報テーブル(図6)を生成し、情報保存・読込機能P−30へ電源・FAN情報テーブル(図6)を送信後、情報保存・読込機能P−30へ電源・FAN情報テーブル(図6)の保存命令を発行する。
次に、情報保存・読込機能P−30は、電源・FANテーブル(図6)を、電源・FAN状態テーブル1004へ保存する(ステップS9)。情報保存・読込機能P−30は、電源・FAN状況テーブル生成機能P−50からの命令により、電源・FAN情報テーブル(図6)を、電源・FAN状態テーブル1004へ保存する。その後、情報保存・読込機能P−30は、構成情報取得機能P−10から構成情報KOSEI(図4を参照)を取得し、経路テーブル生成機能P−20へ送信し、経路テーブル#1(図5)の生成命令を発行する。
次に、経路テーブル生成機能P−20は、経路テーブル#1(図5)を生成する(ステップS10)。経路テーブル生成機能P−20は、構成情報取得機能P−10からの経路テーブル#1(図5)生成命令により、構成情報取得機能P−10から構成情報KOSEIを受信し、経路情報OS−1C1、1C1−OS、1C1−CPU、CPU−1C1、1C1−MEM、MEM−1C1、1C1−1C2、1C2−1C1、KB−1C2、1C2−DSP、1C2−HDD、HDD−1C2、1C2−7C1、7C1−1C2、7C1−ARY、ARY−7C1を認識し、経路テーブル#1(図5)を生成する。
次に、経路テーブル生成機能P−20は、情報保存・読込機能P−30へ経路テーブル#1(図5)を送信後、情報保存・読込機能P−30へ経路テーブル#1(図5)の保存命令を発行する。
次に、情報保存・読込機能P−30は、経路テーブル生成機能P−20からの命令により、経路テーブル#1(図5)を、経路情報監視テーブル1003へ保存する(ステップS11)。次に、情報保存・読込機能P−30は、情報保存・読込機能P−30から経路テーブル生成機能P−20へ交換被疑部品テーブル(図9)の生成命令を発行する。
次に、経路テーブル生成機能P−20は、情報保存・読込機能P−30からの命令により、デバイスドライバD1から交換被疑部品テーブル(図9)を生成する(ステップS12)。次に、経路テーブル生成機能P−20は、情報保存・読込機能P−30へ交換被疑部品テーブル(図9)を送信し、情報保存・読込機能P−30へ交換被疑部品テーブル(図9)の保存命令を発行する。
次に、情報保存・読込機能P−30は、経路テーブル生成機能(P−20)の命令により、交換被疑部品テーブル(図9)を被疑部品テーブル1005へ保存する(ステップS13)。次に、情報保存・読込機能P−30は、経路テーブル生成機能P−20へ経路テーブル#2(図8)の生成命令を発行する。
次に、経路テーブル生成機能P−20は、経路テーブル#2(図8)を生成する(ステップS14)。より具体的には、経路テーブル生成機能P−20は、情報保存・読込機能P−30の命令により、情報保存・読込機能P−30へ経路テーブル#1(図5)及び交換被疑部品テーブル(図9)の読込み命令を発行する。次に、情報保存・読込機能P−30は、経路テーブル生成機能P−20からの命令により、経路情報監視テーブル1003から経路テーブル#1(図5)を読み込む。次に、情報保存・読込機能P−30は、経路テーブル生成機能P−20からの命令により、被疑部品テーブル1005から交換被疑部品テーブル(図9)を読み込む。
次に、情報保存・読込機能P−30は、経路テーブル#1(図5)及び交換被疑部品テーブル(図9)を、経路テーブル生成機能P−20へ送信する。次に、経路テーブル生成機能P−20は、情報保存・読込機能P−30から、経路テーブル#1(図5)及び交換被疑部品テーブル(図9)を受信し、経路テーブル#1(図5)と交換被疑部品テーブル(図9)とから、経路テーブル#2(図8)を生成する。次に、経路テーブル生成機能P−20は、情報保存・読込機能P−30へ経路テーブル#2(図8)を送信し、情報保存・読込機能P−30へ経路テーブル#2(図8)の保存命令を発行する。
次に、情報保存・読込機能P−30は、経路テーブル生成機能P−20からの命令により、経路テーブル#2(図8)を受信し、経路情報監視テーブル1003へ保存する(ステップS15)。次に、情報保存・読込機能P−30は、経路情報常駐監視機能P−60の起動命令を発行する。次に、情報保存・読込機能P−30からの命令により、経路情報常駐監視機能P−60が起動する。
次に、経路情報常駐監視機能P−60により常駐監視を開始し(ステップS16)、経路情報を常駐監視する(ステップS17)。より具体的には、経路情報常駐監視機能P−60は、経路情報OS−1C1、1C1−OS、1C1−CPU、CPU−1C1、1C1−MEM、MEM−1C1、1C1−1C2、1C2−1C1、KB−1C2、1C2−DSP、1C2−HDD、HDD−1C2、1C2−7C1、7C1−1C2、7C1−ARY、ARY−7C1を、コントローラ#1デバイスドライバ1C1−Dとコントローラ#2デバイスドライバ1C2−Dとコントローラ#3デバイスドライバ7C1−Dとの制御情報から常駐監視する。
図13は、本実施形態による、制御経路情報常駐監視プログラムP−1の障害経路検出時の動作を説明するためのフローチャートである。まず、経路情報常駐監視機能P−60は、コントローラ#1デバイスドライバ1C1−Dと、コントローラ#2デバイスドライバ1C2−Dと、コントローラ#3デバイスドライバ7C1−Dとの制御情報より、異常経路を検出し、図10に示すような異常経路情報を生成する(ステップS20)。図10に示す異常経路情報は、経路情報HDD−1C2が異常経路と検出された例である。次に、経路情報常駐監視機能P−60は、情報保存・読込機能P−30へ異常経路情報(図10)を送信し、異常経路テーブル1006への保存命令を発行する。
次に、情報保存・読込機能P−30は、経路情報常駐監視機能P−60からの命令により、異常経路情報(図10)を受信し、異常経路情報を異常経路テーブル1006へ保存する(ステップS21)。次に、情報保存・読込機能P−30は、電源・FAN状況取得機能P−40へ電源・FAN情報DENGENの取得命令を発行する。
次に、電源・FAN状況取得機能P−40は、情報保存・読込機能P−30からの命令により、電源・FAN情報格納部2000の電源・FAN情報DENGENを取得する(ステップS22)。図7に示す電源・FANテーブルは、電源装置の状態が故障「×」である場合の例である。電源・FAN状況取得機能P−40は、電源・FAN状況テーブル生成機能P−50へ電源・FANテーブル(図7)の生成命令を発行後、電源・FANテーブル(図7)を、情報保存・読込機能P−30へ送信する。
次に、電源・FAN状況テーブル生成機能P−50は、電源・FANテーブル(図7)を生成する(ステップS23)。より具体的には、電源・FAN状況テーブル生成機能P−50は、電源・FAN状況取得機能P−40からの命令により、情報保存・読込機能P−30から電源・FAN情報DENGENを受信する。
次に、電源・FAN状況テーブル生成機能P−50は、電源・FANテーブル(図7)を生成し、情報保存・読込機能P−30へ電源・FANテーブル(図7)を送信後、情報保存・読込機能P−30へ電源・FANテーブル(図6)の取得命令を発行する。次に、電源・FAN状況テーブル生成機能P−50は、情報保存・読込機能P−30に電源・FANテーブル(図7)と電源・FANテーブル(図6)との経路情報常駐監視機能P−60への送信命令を発行する。
次に、情報保存・読込機能P−30は、電源・FANテーブル(図7)と電源・FANテーブル(図6)とを読み込む(ステップS24)。すなわち、電源・FAN状況テーブル生成機能P−50からの命令により、電源・FANテーブル(図7)を受信後、電源・FANテーブル(図6)を電源・FAN状態テーブル1004から取得する。次に、情報保存・読込機能P−30は、電源・FANテーブル(図7)と電源・FANテーブル(図6)とを、経路情報常駐監視機能P−60へ送信し、比較命令を発行する。
次に、経路情報常駐監視機能P−60は、情報保存・読込機能P−30からの命令により、情報保存・読込機能P−30から電源・FANテーブル(図7)及び電源・FANテーブル(図6)を受信し、電源・FANテーブル(図7)と電源・FANテーブル(図6)とを比較する(ステップS25)。
ここで、電源・FANテーブル(図7)と電源・FANテーブル(図6)との状態が「○」で一致している場合には、経路情報常駐監視機能P−60は、情報保存・読込機能P−30へ異常経路情報(図10)及び経路テーブル#2(図8)の取得命令を発行する。
一方、電源・FANテーブル(図7)の状態が「×」の場合、経路情報常駐監視機能P−60は、該当する交換被疑部品(図11)を生成し、情報保存・読込機能P−30へ交換被疑部品(図11)を送信後、保存命令を発行する。図11に示す例では、経路情報HDD−1C2が異常経路と検出された場合に、交換被疑部品がHDDとなる例である。
次に、情報保存・読込機能P−30は、経路情報常駐監視機能P−60からの命令により、異常経路テーブル1006及び経路情報監視テーブル1003から、異常経路情報(図10)と経路テーブル#2(図8)とを読み込む(ステップS26)。次に、情報保存・読込機能P−30は、異常経路情報(図10)と経路テーブル#2(図8)とを、経路情報常駐監視機能P−60へ送信し、比較命令を発行する。
次に、経路情報常駐監視機能P−60は、情報保存・読込機能P−30からの命令により、情報保存・読込機能P−30から異常経路情報(図10)及び経路テーブル#2(図8)を受信し、状態を比較する(ステップS27)。ここで、異常経路情報(図10)の状態が「×」の場合には、経路情報常駐監視機能P−60は、異常と判断し、経路テーブル#2(図8)の該当する交換被疑部品(図11)を生成し、情報保存・読込機能P−30へ交換被疑部品(図11)を送信後、保存命令を発行する。
一方、異常経路情報(図10)の状態が「○」の場合には、経路情報常駐監視機能P−60は、正常と判断し、異常経路情報(図10)をクリアする。
次に、情報保存・読込機能P−30は、経路情報常駐監視機能P−60からの命令により、交換被疑部品(図11)を受信し、被疑部品テーブル1005へ保存する(ステップS28)。
以上の動作により、被疑部品テーブル1005内の交換被疑部品(図11)を確認するだけで、障害発生時の被疑部品を特定することができる。
上述した実施形態によれば、異常な制御経路の取得手段と各制御経路の障害時に交換が必要な部品一覧情報を使用し、障害発生時に検出した制御経路の異常箇所をもとに、交換が必要な部品を特定することができる。
また、本実施形態によれば、ログ解析を不要とすることができる。
また、本実施形態によれば、基本ソフトウェア(OS)起動不可時障害時であっても、ハードウェア障害の有無を確認することができる。
また、本実施形態によれば、基本ソフトウェア(OS)起動不可時障害時であっても、部品交換単位(FRU)で被疑部品特定することができる。
また、本実施形態によれば、ログ解析の専門知識を不要とすることができる。
なお、上述した実施形態において、制御経路常駐監視プログラムP−1、すなわち、構成情報取得機能P−10、経路情報テーブル生成機能P−20、情報保存・読込機能P−30、電源・FAN状況取得機能P−40、電源・FAN状況テーブル生成機能P−50、及び経路情報常駐監視機能P−60などにおける各機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、符号化処理、及び復号化処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
10 サーバ
100 マザーボード
200 CPU
300 メモリ
400 キーボード
500 モニタ
600 内蔵補助記憶装置
700 拡張増設ハードウェア
800 外付け補助記憶装置
1C1、1C2 コントローラ
1N1、1N2、1N3、1N4 内部インタフェイス
1G1 外部インタフェイス
1000 経路情報格納部
1001 プログラムソース格納テーブル
1002 FRUテーブル
1003 経路情報監視テーブル
1004 電源・FAN状態テーブル
1005 被疑部品テーブル
1006 異常経路テーブル
2000 電源・FAN情報格納部
P−1制御経路常駐監視プログラム
P−10 構成情報取得機能
P−20 経路情報テーブル生成機能
P−30 情報保存・読込機能
P−40 電源・FAN状況取得機能
P−50 電源・FAN状況テーブル生成機能
P−60 経路情報常駐監視機能

Claims (7)

  1. ハードウェアの障害を特定するハードウェア障害被疑特定装置において、
    サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得手段と、
    前記構成情報取得手段によって取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成手段と、
    前記デバイス間の経路の異常発生を監視する経路情報監視手段と
    を備え、
    前記経路情報監視手段は、異常経路の発生を検出すると、前記経路情報テーブル生成手段によって生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定する
    ことを特徴とするハードウェア障害被疑特定装置。
  2. 電源とファンとの状態を取得する電源・FAN状況取得手段と、
    前記電源・FAN状況取得手段によって取得された電源とファンとその状態とを対応付けた電源・FANテーブルを生成する電源・FAN状況テーブル生成手段と
    を更に備え、
    前記経路情報監視手段は、異常経路の発生を検出すると、前記電源・FAN状況テーブル生成手段によって生成された電源・FAN状況テーブルを参照し、異常経路に対応する交換被疑部品を特定する請求項1に記載のハードウェア障害被疑特定装置。
  3. 前記経路情報監視手段によって特定された、異常経路に対応する交換被疑部品を保存する保存手段を更に備えることを特徴とする請求項1または2に記載のハードウェア障害被疑特定装置。
  4. ハードウェアの障害を特定するハードウェア障害被疑特定方法において、
    サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得ステップと、
    前記構成情報取得ステップで取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成ステップと、
    前記デバイス間の経路の異常発生を監視する経路情報監視ステップと
    を含み、
    前記経路情報監視ステップは、異常経路の発生を検出すると、前記経路情報テーブル生成ステップで生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定する
    ことを特徴とするハードウェア障害被疑特定方法。
  5. 電源とファンとの状態を取得する電源・FAN状況取得ステップと、
    前記電源・FAN状況取得ステップで取得された電源とファンとその状態とを対応付けた電源・FANテーブルを生成する電源・FAN状況テーブル生成ステップと
    を更に含み、
    前記経路情報監視ステップは、異常経路の発生を検出すると、前記電源・FAN状況テーブル生成ステップで生成された電源・FAN状況テーブルを参照し、異常経路に対応する交換被疑部品を特定する請求項4に記載のハードウェア障害被疑特定方法。
  6. 前記経路情報監視ステップで特定された、異常経路に対応する交換被疑部品を保存する保存手ステップを更に含むことを特徴とする請求項4または5に記載のハードウェア障害被疑特定方法。
  7. ハードウェアの障害を特定するハードウェア障害被疑特定装置のコンピュータに、
    サーバ上のハードウェアを制御するデバイスの構成情報を取得する構成情報取得機能、
    前記構成情報取得機能によって取得された前記ハードウェア構成情報に基づいて、デバイス間の経路と、対応するデバイスと、交換被疑部品とを対応付けた経路テーブルを生成する経路情報テーブル生成機能、
    前記デバイス間の経路の異常発生を監視する経路情報監視機能
    を実行させ、
    前記経路情報監視機能は、異常経路の発生を検出すると、前記経路情報テーブル生成機能によって生成された経路テーブルを参照し、異常経路に対応する交換被疑部品を特定する
    ことを特徴とするプログラム。
JP2011178189A 2011-08-17 2011-08-17 ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム Expired - Fee Related JP5561790B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011178189A JP5561790B2 (ja) 2011-08-17 2011-08-17 ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011178189A JP5561790B2 (ja) 2011-08-17 2011-08-17 ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013041438A true JP2013041438A (ja) 2013-02-28
JP5561790B2 JP5561790B2 (ja) 2014-07-30

Family

ID=47889770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011178189A Expired - Fee Related JP5561790B2 (ja) 2011-08-17 2011-08-17 ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5561790B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918794A (zh) * 2018-04-09 2020-11-10 奥托立夫开发公司 安全气囊装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638836A (ja) * 1986-06-27 1988-01-14 Nec Corp 故障診断辞書作成方式
JPH10143387A (ja) * 1996-10-29 1998-05-29 Compaq Computer Corp 障害診断機能付きのコンピュータ・システム
JP2000347892A (ja) * 1999-06-04 2000-12-15 Nec Fielding Ltd 保守部品交換履歴を反映した障害指摘装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS638836A (ja) * 1986-06-27 1988-01-14 Nec Corp 故障診断辞書作成方式
JPH10143387A (ja) * 1996-10-29 1998-05-29 Compaq Computer Corp 障害診断機能付きのコンピュータ・システム
JP2000347892A (ja) * 1999-06-04 2000-12-15 Nec Fielding Ltd 保守部品交換履歴を反映した障害指摘装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111918794A (zh) * 2018-04-09 2020-11-10 奥托立夫开发公司 安全气囊装置

Also Published As

Publication number Publication date
JP5561790B2 (ja) 2014-07-30

Similar Documents

Publication Publication Date Title
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
TWI446161B (zh) 處理一多處理器資訊處理系統之一故障處理器的裝置及方法
US8990632B2 (en) System for monitoring state information in a multiplex system
US10789141B2 (en) Information processing device and information processing method
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US20140143597A1 (en) Computer system and operating method thereof
US20120159241A1 (en) Information processing system
CN102375775B (zh) 一种具有检测系统不可恢复错误指示信号的计算机系统
JP2008225929A (ja) 情報処理装置
JP5561790B2 (ja) ハードウェア障害被疑特定装置、ハードウェア障害被疑特定方法、及びプログラム
JP4644720B2 (ja) 制御方法、情報処理装置及びストレージシステム
TWI439856B (zh) 具故障備援以管理共享資源之方法與多電腦系統
US8417932B2 (en) Information processing apparatus and control method thereof
EP1703392A2 (en) Method and apparatus for detecting failures in a partitioned large scale computer system
JP5440673B1 (ja) プログラマブルロジックデバイス、情報処理装置、被疑箇所指摘方法およびプログラム
US11169882B2 (en) Identification of a suspect component causing an error in a path configuration from a processor to IO devices
JP6217086B2 (ja) 情報処理装置、エラー検出機能診断方法およびコンピュータプログラム
US20120331334A1 (en) Multi-cluster system and information processing system
CN112084049B (zh) 用于监控基板管理控制器的常驻程序的方法
US11232197B2 (en) Computer system and device management method
CN111045899A (zh) 在计算机系统开机自检的早期显示bios信息的方法
TWI715005B (zh) 用於監控基板管理控制器之常駐程序的方法
JP2017151511A (ja) 情報処理装置、動作ログ取得方法および動作ログ取得プログラム
WO2011061828A1 (ja) 情報処理装置、情報処理装置の制御方法及び制御プログラム
TWI305305B (ja)

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140605

R150 Certificate of patent or registration of utility model

Ref document number: 5561790

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees