[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5263384B2 - 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム - Google Patents

情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム Download PDF

Info

Publication number
JP5263384B2
JP5263384B2 JP2011501435A JP2011501435A JP5263384B2 JP 5263384 B2 JP5263384 B2 JP 5263384B2 JP 2011501435 A JP2011501435 A JP 2011501435A JP 2011501435 A JP2011501435 A JP 2011501435A JP 5263384 B2 JP5263384 B2 JP 5263384B2
Authority
JP
Japan
Prior art keywords
time
failure
execution
information processing
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011501435A
Other languages
English (en)
Other versions
JPWO2010097953A1 (ja
Inventor
義輝 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2010097953A1 publication Critical patent/JPWO2010097953A1/ja
Application granted granted Critical
Publication of JP5263384B2 publication Critical patent/JP5263384B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

この発明は、情報処理装置において発生する障害を再現する障害再現装置及び障害再現方法並びに障害再現プログラムに関する。
図19は、従来の情報処理装置としてのサーバシステム10の構成を示す図である。図19に示すように、このサーバシステムは、OS(Operating System)が稼動する複数のサーバユニット12a〜12dと、サーバユニット12a〜12dを監視・制御する管理ユニット11とを有する。
システム管理装置としてのサービスプロセッサ(SerVice Processor:SVP)等の管理ユニット11は、各サーバユニット12a〜12dの情報をユーザ1からの要求に応じてHTML(Hyper Text Markup Language)形式で表示する。サーバユニット12a(12b〜12dも同様)上にはシステム管理ソフト13があり、システム管理ソフト13は、サーバユニット12a内部の情報を取得したり、ハードウェア(ドライバ)15の電源制御を行う。
システム管理ソフト13は、例えば、OS14から情報を取得した場合に、取得した情報を管理ユニット11からの要求に応じて通知したり、必要に応じて新たに情報を取得し直したりする。なお、ユーザ1がサーバユニット12a〜12d上のハードウェア制御を行う場合には、システム管理ソフト13に直接要求を出し、システム管理ソフト13は、OS14を通してハードウェア15の電源制御を行う。
システム管理ソフト13は、一連の処理をメモリである記憶装置16のログファイルに保存し、異常が発生した際にはこのログファイルを解析することによって、発生した異常の原因を究明することが可能となる。ログファイルは、処理の内容や処理を実行した時間の情報等が含まれる。
ところで、図19に示したサーバシステムでは、ハードウェア制御の処理によって、システム管理ソフト13の情報取得に影響がでる可能性がある。図20は、ハードウェア制御による情報取得の影響を説明するための図である。
図20に示す例では、ユーザ1が電源OFF操作を行うと共に、画面表示操作を行った場合について示す。ユーザ1が電源OFF操作を行うと(ステップS10)、システム管理ソフト13が、電源OFF要求をOS14に対して行う(ステップS11)。
OS14は、各サーバユニットが有するハードウェア資源としてのデバイスの存在チェックを行い、処理対象となるデバイスが存在する場合に、処理を開始する(ステップS12)。ハードウェア15は、電源OFFを開始し(ステップS13)、電源OFFを完了し(ステップS14)、電源OFFの完了通知をOS14に対して行う(ステップS15)。
OS14は、電源OFFの完了通知を取得した場合に、デバイスが削除された旨の情報をログファイルに記録し、電源OFFの完了通知をシステム管理ソフト13に対して行う(ステップS16)。システム管理ソフト13は、電源OFFの完了通知を取得した場合に、電源OFFの完了通知を行い(ステップS17)、ユーザ1が処理完了を受信する(ステップS18)。
一方、ユーザ1が、電源OFF操作を行うほぼ同じタイミングで、画面表示操作を行うと(ステップS20)、管理ユニット11が情報取得要求をシステム管理ソフト13に対して行い(ステップS21)、システム管理ソフト13が情報取得要求をOS14に対して行う(ステップS22)。
OS14が、システム管理ソフト13から情報取得要求を取得した時点において、ハードウェア15は既に電源OFFとなっているが、ハードウェア15からの電源OFF完了通知をOS14が取得していないため、OS14は、情報取得の処理を開始する(ステップS23)。したがって、このような場合には、処理のすれ違いが発生する。
このような場合、ハードウェア15は電源OFFのため、情報取得に失敗し(ステップS24)、OS14は情報取得を失敗した旨の失敗通知をシステム管理装置13に対して行う(ステップS25)。システム管理ソフト13は、エラー応答を管理ユニット11に対して行い(ステップS26)、管理ユニット11は、情報取得を失敗した旨の画面表示を行い(ステップS27)、ユーザ1は表示確認を行う(ステップS28)。
図20において説明したように、処理のタイミングに依存する障害が発生した場合、原因究明のため、障害が発生した処理および処理の実行タイミング等による障害を再現するための試験(以下、障害再現試験)が行われる。再現試験では、図1に示したユーザの操作を障害再現装置に置き換え、かかる障害再現装置が、サーバシステム10に対して処理のタイミングや処理の内容を変更しながら各種処理を繰り返し実行することで、障害が発生した環境を実現するとともに、障害が生じた処理および処理のタイミングを特定する。しかしながら、障害再現装置は、サーバユニット内で実行される処理のタイミングを意図したタイミングに調整することは困難であった。
例えば、障害再現装置が、図1に示した情報取得要求と、ハードウェア制御の処理要求をサーバシステムに行い、障害が発生する処理のタイミングを再現する場合について説明する。障害再現装置が、サーバシステム10に対して出力する情報取得要求は、管理ユニット11を通してシステム管理ソフト13に伝わり、ハードウェア制御は、システム管理ソフト13に伝わる。
このため、システム管理ソフト13の処理開始タイミングは、管理ユニット11による処理遅延の影響を受けるため、障害再現装置が、情報取得要求と、ハードウェア制御とを同時に行ったとしても、情報取得要求およびハードウェア制御に対する処理がシステム管理ソフト13によって、厳密には同時に行われることはない。また、非同期で動作するそれぞれの処理は、割り込み処理やプロセスの優先順位またはOS14の負荷の影響などにより、各処理を一定間隔で実行しても少しずつずれが生じてくる。
従って、障害再現装置は、情報取得要求を行うタイミングと、ハードウェア制御をおこなうタイミングとを手当たり次第変更し、エラーが発生したか否かによって、エラーを引き起こす処理のタイミングを特定していた。図21は、従来の障害再現試験の処理のタイミングを説明するための図である。図21に示すように、障害再現装置は、各処理の処理間隔を一定にして、処理を繰り返すことで、エラーを再現する手法(図21上段)や、各処理の処理間隔をランダムに変更して、処理を繰り返すことで、エラーを再現する方法(図21下段)を用いている。
なお、障害再現試験を実行するその他の従来技術として、電子計算機システム上のユーザの操作履歴を記録しておき、記録した操作履歴と同じ処理を実行して障害再現試験を実行することで障害の原因を解析する技術も知られている。また、かかる従来技術では、被試験装置としての情報処理装置の環境情報の変更、動作アプリケーションの組合せを変えて試験を実施するなど、動作の条件を複数変えて障害の再現を試みている。
また、非試験装置としての情報処理装置に記録されたログ情報を基にして、障害発生時の複数の各処理の実行開始時間の相対関係を求め、開始時刻を変化させながら、再現試験を実行するという技術も知られている。
特開平8−50555号公報 特開平6−139093号公報
しかしながら、上述した従来の技術では、エラーを引き起こす処理のタイミングを特定する場合に、障害再現装置が各処理を様々なタイミングで闇雲に実施しているため、非常に効率が悪いという問題があった。
また、ユーザの操作履歴を記録しておき、記録した操作履歴の通りに処理を実行して再現試験を行うことで障害の原因を解析する技術では、図19に示した管理ユニット11のような操作遅延の要因を想定していない。従って、管理ユニット11のような操作遅延の要因となる経路が存在すると、操作にタイムラグ、すなわち遅延時間が生じてしまうため、操作履歴に記録された処理のタイミングが必ずしもエラーを引き起こす処理のタイミングにならず、結局は、同じ環境で繰り返し処理を実行させなければ、エラーを再現させることができなかった。
また、ログ情報を参照して、障害が発生した処理のタイミングを計算し、計算したタイミングで集中的に障害再現試験を行うことも考えられるが、問題の起きたタイミングパターンをログ情報から解析し、障害再現装置に組み込む必要が生じるため、余分な手間がかかってしまう。
そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、効率よく再現試験を実行することができる情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、この障害再現装置は、情報処理装置に接続されるともに、前記情報処理装置に発生する障害を再現する障害再現装置において、前記情報処理装置に障害が発生した場合に、前記障害を発生した第1及び第2の処理を抽出し、前記第1の処理を前記情報処理装置が実行した第1の実行時と前記第2の処理を前記情報処理装置が実行した第2の実行時との時間差である目標時間を算出する目標時間算出部と、前記第1の処理を実行する第1の実行命令と前記第2の処理を実行する第2の実効命令を、前記情報処理装置に対してそれぞれ出力し、前記情報処理装置が前記第1の処理を実行した第1の実行時と前記情報処理装置が前記第2の処理を実行した第2の実行時を含む履歴情報を取得する履歴情報取得部と、前記第1の実行命令を出力した第1の出力時と前記第2の実行命令を出力した第2の出力時と前記履歴情報に含まれる前記第1及び第2の実行時に基づいて、前記第1の出力時と前記第1の処理時の時間差である第1の遅延時間と前記第2の出力時と前記第2の処理時の時間差である第2の遅延時間を算出する遅延時間算出部と、前記目標時間と前記第1の遅延時間に基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整する調整部を有することを要件とする。
障害再現装置によれば、被試験装置内に発生し得るタイムラグを考慮して再現試験を実行するので、効率よく障害の発生する処理を再現することが出来る。
図1は、本実施例にかかる障害再現装置の概要を説明するための図(1)である。 図2は、本実施例にかかる障害再現装置の概要を説明するための図(2)である。 図3は、本実施例にかかる障害再現装置の構成を示す機能ブロック図である。 図4は、ログテーブルのデータ構造の一例を示す図である。 図5は、再現試験ログテーブルのデータ構造の一例を示す図である。 図6は、検出対象ログテーブルのデータ構造の一例を示す図である。 図7は、処理対応テーブルのデータ構造の一例を示す図である。 図8は、処理組合せテーブルのデータ構造の一例を示す図である。 図9は、目標値テーブルのデータ構造の一例を示す図である。 図10は、実行済み時刻情報のデータ構造の一例を示す図である。 図11は、実行タイミングテーブルのデータ構造の一例を示す図である。 図12は、タイムラグ履歴情報のデータ構造の一例を示す図である。 図13は、目標値算出部の処理を説明するための図である。 図14は、テーブル管理部の処理を説明するための図である。 図15は、障害が発生したログデータを判定する処理手順を示すフローチャートである。 図16は、再現試験の処理手順を示すフローチャートである。 図17は、障害再現判定処理の処理手順を示すフローチャートである。 図18は、実施例にかかる障害再現装置を構成するコンピュータのハードウェア構成を示す図である。 図19は、従来のサーバシステムの構成を示す図である。 図20は、ハードウェア制御による情報取得の影響を説明するための図である。 図21は、従来の再現試験の処理のタイミングを説明するための図である。
符号の説明
10 サーバシステム
11 管理ユニット
12a,12b,12c,12d サーバユニット
13 システム管理ソフト
14 OS
15 ハードウェア
16 記憶装置
16a ログテーブル記憶部
16b 再現試験ログテーブル記憶部
30 コンピュータ
31 入力装置
32 モニタ
33 RAM
33a,38a 各種データ
34 ROM
35 通信制御装置
36 媒体読取装置
37 CPU
37a 再現試験実行プロセス
38 HDD
38b 再現試験実行プログラム
39 バス
100 障害再現装置
101 検出対象ログテーブル記憶部
102 処理対応テーブル記憶部
103 処理組合せテーブル記憶部
104 目標値記憶部
105 実行済み時刻記憶部
106 実行タイミングテーブル記憶部
107 タイムラグ履歴記憶部
108 ログ解析部
109 目標値算出部
110 テーブル管理部
111 タイムラグ算出部
112 実行制御部
以下に添付図面を参照して、実施形態の一例に係る情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラムの実施例を詳細に説明する。
まず、本実施例にかかる障害再現装置の概要について説明する。図1および図2は、本実施例にかかる障害再現装置の概要を説明するための図である。このサーバシステム10は、OS(Operating System)が稼動する複数のサーバユニット12a〜12dと、サーバユニット12a〜12dを監視・制御する管理ユニット11とを有する。
システム管理装置としてのサービスプロセッサ(SerVice Processor:SVP)等の管理ユニット11は、各サーバユニット12a〜12dの情報をユーザ1からの要求に応じてHTML(Hyper Text Markup Language)形式で表示する。サーバユニット12a(12b〜12dも同様)上にはシステム管理ソフト13があり、システム管理ソフト13は、サーバユニット12a内部の情報を取得したり、ハードウェア(ドライバ)15の電源制御を行う。
システム管理ソフト13は、例えば、OS14から情報を取得した場合に、取得した情報を管理ユニット11からの要求に応じて通知したり、必要に応じて新たに情報を取得し直したりする。なお、ユーザ1がサーバユニット12a〜12d上のハードウェア制御を行う場合には、システム管理ソフト13に直接要求を出し、システム管理ソフト13は、OS14を通してハードウェア15の電源制御を行う。
システム管理ソフト13は、一連の処理をメモリである記憶装置16のログファイルに保存し、異常が発生した際にはこのログファイルを解析することによって、発生した異常の原因を究明することが可能となる。ログファイルは、処理の内容や処理を実行した時間の情報等が含まれる。
本実施例にかかる障害再現装置100は、サーバシステム10に障害が発生した場合に、障害を引き起こした第1の処理および第2の処理を抽出する。例えば、図20において説明したような障害が発生した場合には、第1の処理はハードウェアが行う制御となり、第2の処理は情報取得要求となる。
続いて、障害再現装置100は、第1、2の処理の実行命令をサーバシステム10に出力し、サーバシステム10からシステム管理ソフト13が第1の処理および第2の処理を実際に実行した時間(実行を開始した時間)を含む履歴情報を取得する。障害再現装置100は、実行命令を出力した時間および履歴情報を基にして、実行命令が出力されてから第1及び第2の処理が実行されるまでのタイムラグを算出する。
また、障害再現装置100は、サーバシステム10に障害が発生した時点における第1の処理が実際に実行された時間と第2の処理が実際に実行された時間(実行を開始した時間)との差分を目標値として算出する(図2の1段目参照)。障害再現装置100は、算出した目標値とタイムラグとしての遅延時間とを基にして、第1の処理および第2の処理の実行命令をサーバシステム10に出力するタイミングを調整し、サーバシステム10に発生した障害を再現する。
例えば、障害再現装置100が、上記遅延時間を考慮せず、上記算出した目標値に従って、第1の処理および第2の処理の実行要求をサーバシステム10に出力すると、システム管理ソフト13の遅延時間の影響を受け、意図したタイミングで第1の処理および第2の処理をサーバシステム10に実行させることができない(図2の2段目参照)。
一方、本実施例にかかる障害再現装置100のように、目標値とタイムラグとしての遅延時間とを基にして、第1の処理および第2の処理の実行命令をサーバシステム10に出力するタイミングを調整すると、意図したタイミング(第1の処理が実行される時間と第2の処理が実行される時間との差分が目標値と同じになるタイミング)で第1の処理および第2の処理をサーバシステム10に実行させることができ(図2の3段目参照)、再現試験の効率を向上させることが出来る。
また、本実施例にかかる障害再現装置100は、障害再現試験を実行するたびに、各処理の実行履歴を実行タイミングテーブルに順次登録していく。かかる実行タイミングテーブルは、障害再現試験を重ねる程に増えていき、最終的にどの様な処理をどれだけ実施し、どれだけ障害を再現できたかを統計的に処理できる情報となる。
次に、本実施例にかかる障害再現装置100の構成について説明する。図3は、本実施例にかかる障害再現装置100の構成を示す機能ブロック図である。図3に示すように、この障害再現装置100は、検出対象ログテーブル記憶部101、処理対応テーブル記憶部102、処理組合せテーブル記憶部103、目標値記憶部104、実行済み時刻記憶部105、実行タイミングテーブル記憶部106、タイムラグ履歴記憶部107、ログ解析部108、目標値算出部109、テーブル管理部110、タイムラグ算出部111、実行制御部112を有する。
また、障害再現装置100は、サーバシステム10に接続される。サーバシステム10の構成は、図19に示したサーバシステム10の構成と同様である。なお、記憶装置16は、ログテーブル記憶部16aおよび再現試験ログテーブル記憶部16bを有する。
ここで、ログテーブル記憶部16aは、サーバシステム10が実行した処理の履歴(ログテーブル)を記憶する記憶部である。図4は、ログテーブルのデータ構造の一例を示す図である。同図に示すように、このログテーブルは、処理を実行した日時と、処理とを対応付けて記憶する。
再現試験ログテーブル記憶部16bは、サーバシステム10が障害再現試験を実行した際の処理の履歴(再現試験ログテーブル)を記憶する。図5は、再現試験ログテーブルのデータ構造の一例を示す図である。同図に示すように、処理(障害再現試験の処理)を実行した日時等の実行時刻と、処理(障害再現試験の処理)と、処理完了時間とを対応付けて記憶している。ここで、処理完了時間は、処理を開始してから当該処理が完了するまでの時間を示す。
サーバシステム10は、例えば、システム管理ソフト13(図1参照)がシステム管理に関する処理を実行するたびに、ログテーブル記憶部16aのログテーブル、再現試験ログテーブル記憶部16bの再現試験ログテーブルを更新する。図4および図5に示したログテーブル、再現試験ログテーブルは、障害再現装置100によって読み出され、目標値、タイムラグとしての遅延時間等の算出に利用される。
障害再現装置100の構成の説明に戻ると、検出対象ログテーブル記憶部101は、障害と判定するログの一覧(検出対象ログテーブル)を記憶する記憶部である。
図6は、検出対象ログテーブルのデータ構造の一例を示す図である。図6に示すように、この検出対象ログテーブルは、障害と判定するログのフォーマットを記憶している。
処理対応テーブル記憶部102は、障害と判定するログに関連するログの一覧(処理対応テーブル)を記憶する記憶部である。
図7は、処理対応テーブルのデータ構造の一例を示す図である。図7に示すように、この処理対応テーブルは、ユーザ操作とシステム管理ソフトの処理とを対応付けて記憶している。
処理組合せテーブル記憶部103は、障害の発生し得る処理の組合せの一覧(処理組合せテーブル)を記憶する記憶部である。
図8は、処理組合せテーブルのデータ構造の一例を示す図である。図8に示すように、この処理組合せテーブルは、障害の発生し得る処理の組合せ(処理1と処理2との組合せ)を記憶する。
目標値記憶部104は、各処理の開始時間の差分となる目標値の一覧(目標値テーブル)を記憶する記憶部である。
図9は、目標値テーブルのデータ構造の一例を示す図である。図9に示すように、この目標値テーブルは、処理1と、処理2と、目標値とを対応付けて記憶する。
実行済み時刻記憶部105は、実行制御部112がサーバシステム10に対して処理要求を行った場合の処理の内容と処理要求を行った時刻とを対応付けた情報(実行済み時刻情報)を記憶する記憶部である。
図10は、実行済み時刻情報のデータ構造の一例を示す図である。図10に示すように、この実行済み時刻情報は、処理の内容と処理要求を行った日時とを対応付けて記憶する。ここで、実効性魚部112は、例えば演算処理装置としてのCPU(Central Processing Unit)又はMPU(Micro Processing Unit)若しくはコントローラ等であり、ファームウェア等のプログラム等によって制御されても良い。
実行タイミングテーブル記憶部106は、再現試験の実行履歴を記憶する一覧(実行タイミングテーブル)を記憶する記憶部である。
図11は、実行タイミングテーブルのデータ構造の一例を示す図である。ここでは一例として、再現試験により実行される処理1,2をそれぞれ、ハードウェア制御、情報取得要求として実行タイミングテーブルの説明を行う。図11に示すように、この実行タイミングテーブルは、処理1完了時間と、遅延時間と、処理2完了時間と、実施回数と、障害発生回数とを対応付けて記憶する。
ここで、処理1完了時間は、サーバシステム10がハードウェア制御を開始してから完了するまでの時間を示す。遅延時間は、サーバシステム10がハードウェア制御を開始してから、情報取得要求を開始するまでの時間を示す。
処理2完了時間は、サーバシステム10が情報取得要求を開始してから完了するまでの時間を示す。実施回数は、処理1完了時間、遅延時間、処理2完了時間の組合せによる再現試験の実施回数を示し、障害発生回数は、かかる組合せにより障害が実際に発生した回数を示す。
タイムラグ履歴記憶部107は、各処理のタイムラグの履歴(タイムラグ履歴情報)を記憶する記憶部である。
図12は、タイムラグ履歴情報のデータ構造の一例を示す図である。図12に示すように、このタイムラグ履歴情報は、処理1と、処理2と、実行制御部112が行った処理1の実行時刻および処理2の実行時刻と、タイムラグとを対応付けて記憶する。
例えば、図12の1段目では、「2008/09/02 10:52:09」に行った処理1「device A turn off start」、「2008/09/02 10:52:24」に行った処理2「get device info start」の組み合わせで処理を実行した場合のタイムラグが「0.1ms」となっている。すなわち、障害再現装置100が、目標値にあわせて処理1、処理2の順に処理要求をサーバシステム10に出力した場合に、想定よりも処理2の処理が「0.1ms」だけ遅れてサーバシステム10に実行された旨が示されている。
図3の説明に戻ると、ログ解析部108は、サーバシステム10から取得するログデータを解析し、障害の発生する処理の組合せや、再現試験により障害が再現されたか否かを判定する処理部である。ここでは、ログ解析部108が、障害の発生する処理の組合せを抽出する処理について説明した後に、再現試験の試験結果を判定する処理について説明する。
まず、ログ解析部108が、障害の発生する処理の組合せを抽出する処理について説明する。ログ解析部108は、サーバシステム10からログテーブル記憶部16aに記憶されたログデータを取得する。ここで、ログデータには、処理を実行した日時と処理内容とが含まれている。ログ解析部108は、ログデータの処理内容と検出対象ログテーブル(図6参照)とを比較して、ログデータが検出対象のエラーログであるか否かを判定する。
例えば、ログデータの処理内容が「device A off start」の場合には、検出対象ログテーブルの「device * turn off start」にヒットするので、かかるログデータを検出対象のログデータであると判定する。一方、ログデータの処理内容が、検出対象ログテーブルにヒットしない場合には、取得したログデータを検出対象のログデータではないと判定する。
ログ解析部108が、取得したログデータを検出対象のログデータではないと判定した場合には、次のログデータをログテーブル記憶部16aから取得し、取得したログデータが、検出対象のログデータであるか否かを判定する。
ところで、ログ解析部108は、取得したログデータを検出対象のログデータであると判定した場合には、取得したログデータを内部メモリ(図示略)に保持し、当該ログデータよりも以前にログテーブル記憶部16aに記憶されたログデータを順次取得する。
ログ解析部108は、検出対象のログデータよりも以前にログテーブル記憶部16aに記憶されたログデータと、処理対応テーブル(図7参照)とを比較して、ログデータがエラーと判定したログデータと関連するか否かを判定する。
例えば、ログデータの処理内容が「get device info start」の場合には、処理対応テーブルの1段目の「get device info start」にヒットするので、かかるログデータを関連する(障害と判定するログデータに関連する)ログデータであると判定し、判定したログデータを内部メモリ108aに記憶する。
続いて、ログ解析部108は、内部メモリ108aに記憶されたログデータの処理内容を2つのログデータ毎に組合せ、組合せた処理内容と同じ組合せが処理組合せテーブル(図8参照)に存在するか否かを判定する。同じ組合せが処理組合せテーブルに存在する場合には、ログ解析部108は、該当するログデータを目標値算出部109に出力する。
例えば、内部メモリ108aに処理内容「get device info start」を有するログデータと、処理内容「device A turn off start」を有するログデータとが記憶されている場合には、「get device info start」と「device A turn off start」とが組み合わされる。ここで、組み合わされた処理と、処理組合せテーブルとを比較すると、組み合わされた処理は、処理組合せテーブルの1段目にヒットする。この場合には、ログ解析部108は、処理内容「get device info start」を有するログデータと、処理内容「device A turn off start」を有するログデータとを目標値算出部109に出力する。
次に、ログ解析部108が、再現試験の試験結果を判定する処理について説明する。ログ解析部108は、サーバシステム10から再現試験ログテーブル記憶部16b(図5参照)に記憶されたログデータ(以下、再現試験ログデータ)を取得する。ここで、再現試験ログデータには、処理を実行した日時、処理内容、処理完了時間が含まれている。ログ解析部108は、再現試験ログデータの処理内容と検出対象ログテーブルとを比較して、再現試験ログデータが検出対象のエラーログであるか否かを判定する。
ログ解析部108は、再現試験ログデータが検出対象のエラーログであると判定した場合には、再現試験により障害が再現されたと判定する。ログ解析部108は、障害が再現されたと判定した場合には、障害の発生した再現試験ログデータをテーブル管理部110に出力する。
一方、ログ解析部108は、再現試験ログデータが検出対象のエラーログでないと判定した場合には、再現試験ログデータと処理対応テーブルとを比較して、障害の発生したエラーに関連するログデータ(再現試験ログデータ)であるか否かを判定する。
ログ解析部108は、障害の発生したログデータに関連する再現試験ログデータであると判定した場合には、判定した再現試験ログデータをテーブル管理部110、タイムラグ算出部111に出力する。
目標値算出部109は、サーバシステム10に障害が発生した時点における第1の処理(例えば、ハードウェア制御)が実際に実行された時間と第2の処理(情報取得要求)が実際に実行された時間との差分を示す目標値を算出する処理部である。
目標値算出部109は、ログ解析部108からログデータの組を取得し、取得したログデータに含まれる日時に基づいて目標値を算出する。
図13は、目標値算出部109の処理を説明するための図である。ここでは一例として、処理の内容をハードウェア制御、情報取得要求とし、ハードウェア制御が実行された実行時に係る日時を「2008/9/2 10:52:13」、情報取得要求が実行された実行時に係る日時を「2008/9/2 10:52:24」とする。
図13に示すように、先に実行されたハードウェア制御を基準とすると、ハードウェア制御と比較して、情報取得要求は、11秒おくれて実行されているので、目標値算出部109は、目標値を11秒として算出し、各処理と対応付けて算出結果を目標値記録部104に登録する(図9の1段目参照)。
テーブル管理部110は、ログ解析部108から出力される再現試験の試験結果に基づいて、実行タイミングテーブル(図11参照)を更新する処理部である。具体的に、テーブル管理部110は、ログ解析部108から、障害を再現した再現試験ログデータと、障害の発生したログデータに関連した再現試験ログデータとを取得し、取得した処理の組合せを実行タイミングテーブルに登録する。
テーブル管理部110は、処理の組合せが既に実行タイミングテーブルに登録されている場合には、実行回数に1を加算し、未だ登録されていない場合には、かかる処理の組合せを実行タイミングテーブルに登録する。なお、図11に示すように、処理の内容が同一であっても、処理完了時間毎または遅延時間毎に処理の組合せを実行タイミングテーブルに登録しても良い。また、実際に障害が発生したか否かに基づいて、実施回数に加えて障害発生回数も実行タイミングテーブルに登録しても良い。
図14は、テーブル管理部110の処理を説明するための図である。図14の1段目に示すように、未実施のパターン(例えば、各処理の内容、遅延時間からなるパターン)がログ解析部108から出力された場合には、新規のパターンを実行タイミングテーブルに登録する。一方、実施済みのパターンがログ解析部108から出力された場合には、一致するパターンに対応する実施回数に1を加算する。
タイムラグ算出部111は、実行制御部112が処理の実行命令をサーバシステム10に出力した時点から、当該実行命令に対応した処理がサーバシステム10で実際に実行されるまでの時間、すなわち、タイムラグを算出する処理部である。タイムラグ算出部111は、算出結果を各処理内容と対応付けてタイムラグ履歴記憶部107(図12参照)に登録する。
具体的に、タイムラグ算出部111は、ログ解析部108から再現試験ログデータを取得した場合に、取得した再現試験ログデータの処理内容と同一の処理内容となる処理の日時を実行済み時刻記憶部105(図10参照)から検出する。例えば、再現試験ログデータの処理内容が「device A turn off start」の場合には、タイムラグ算出部111は、実行済み時刻記憶部105から時刻「2008/09/02/ 10:52:09」が抽出される。
そして、タイムラグ算出部111は、再現試験ログデータに含まれる日時と、実行済み時刻記憶部105から検出した日時との差分をとることで、タイムラグを算出する。タイムラグ算出部111は、処理の組合せと対応付けて、順次タイムラグをタイムラグ履歴記憶部107に登録していく。
実行制御部112は、目標値記憶部104に記憶された目標値と、タイムラグ履歴記憶部107に記憶されたタイムラグとを基にしてタイミングを調整した後に、再現試験にかかる各処理の実行命令をサーバシステム10に出力する処理部である。
実行制御部112の具体的な処理の一例を以下に説明する。また、ここでは、再現試験の各処理をハードウェア制御(device A turn off start)と情報取得要求(get device info start)とし、ハードウェア制御は情報取得要求よりも先にサーバシステム10に出力されるものとする。
まず、実行制御部112は、ハードウェア制御と情報取得要求との組合せに対応する目標値を目標値記憶部104から取得する。図9を参照すると、ハードウェア制御と情報取得要求との組合せに対応する目標値は、「11(秒)」となる。
続いて、実行制御部112は、ハードウェア制御と情報取得要求との組合せに対応するタイムラグをタイムラグ履歴記憶部107から取得する。図12を参照すると、ハードウェア制御と情報取得要求との組合せに対応するタイムラグは、複数(0.1ms、0.07ms、1.5ms)存在する。複数のタイムラグが存在する場合には、例えば、実行制御部112は、各タイムラグの平均値を算出し、算出した平均値をタイムラグとして利用する。
実行制御部112は、再現試験を実行する際に、ハードウェア制御の実行命令を出力した後に、目標値にタイムラグを加算しただけの時間経過した時点で、情報取得要求の実行命令を出力する。
このように、実行制御部112は、再現試験を実行する場合に、目標値だけでなく、サーバシステム10に発生するタイムラグも考慮して、各処理の実行命令の出力タイミングを調整するので、効率よく再現試験を行うことができる。
なお、ここでは一例として、実行制御部112がタイムラグを算出する場合に、タイムラグの平均値を求めていたが、これに限定されるものではない。例えば、実行制御部112は、タイムラグ算出部111に記憶されたタイムラグの内、最後に登録されたタイムラグを用いてもよい。または、タイムラグが最後に登録された時刻を起点として所定時間内に登録されたタイムラグを取得し、取得したタイムラグの数を重みとして、タイムラグの平均値などを補正しても良い。
次に、障害再現装置100の処理手順について説明する。図15は、障害の発生したログデータを判定する処理手順を示すフローチャートである。図15に示すように、障害再現装置100は、ログ解析部108がログテーブルからログデータを取得し(ステップS101)、取得したログデータが検出対象ログテーブル中に存在するか否かを判定する(ステップS102)。
ログデータが検出対象ログテーブル中に存在しない場合には(ステップS103,No)、ステップS101に移行する。一方、ログデータが検出対象ログテーブル中に存在する場合には(ステップS103,Yes)、ログ解析部108が、ログテーブルから逆時間方向にログデータを取得する(ステップS104)。
ログ解析部108は、取得したログデータが処理対応テーブルに存在するか否かを判定し(ステップS105)、存在しない場合には(ステップS106,No)、ステップS104に移行する。一方、存在する場合には(ステップS106,Yes)、ログデータを一時的に内部メモリに保持する(ステップS107)。
ログ解析部108は、処理組合せテーブルの処理の組合せと等しい組合せを、内部メモリに保持しているログデータで作成可能か否かを判定し(ステップS108)、作成が不可能の場合には(ステップS109,No)、ステップS104に移行する。
一方、処理組合せテーブルの処理の組合せと等しい組合せを、内部メモリに保持するログデータで作成可能である場合には(ステップS109,Yes)、ログ解析部108は、処理の組合せを目標値算出部109に出力する(ステップS110)。
図16は、再現試験の処理手順を示すフローチャートである。同図に示すように、障害再現装置100は、目標値算出部109がログ解析部108から問題のある処理の組合せ(ログデータの組合せ)を取得したか否かを判定し(ステップS201)、取得していない場合には(ステップS202,No)、処理を終了する。
一方、目標値算出部109がログ解析部108から問題のある処理の組合せを取得した場合には(ステップS202,Yes)、目標値を算出し(ステップS203)、テーブル管理部110が実行タイミングテーブルを作成する(ステップS204)。
障害再現装置100は、再現試験の最大実施時間を超過したか否かを判定し(ステップS205)、超過した場合には(ステップS206,Yes)、処理を終了する。一方、再現試験の最大実施時間を超過していない場合には(ステップS206,No)、実行制御部112は、タイムラグ履歴から予想タイムラグを特定する(ステップS207)。
実行制御部112は、目標値および予想タイムラグにあわせて実行する処理をスケジュールし(ステップS208)、スケジュールに従って処理を実行し(ステップS209)、障害再現判定処理を実行する(ステップS210)。
障害再現判定処理の判定結果により、障害が再現されなかった場合には(ステップS211,No)、テーブル管理部110が、再現試験により行った処理は、実行済みの処理の組合せと一致したか否かを判定する(ステップS212)。
実行済みの処理の組合せと一致した場合には(ステップS213,Yes)、テーブル管理部110は、実行タイミングテーブル上の、一致した処理の組み合わせの実施回数に1を加算し(ステップS214)、ステップS216に移行する。
一方、実行済みの処理の組合せと一致していない場合には(ステップS213,No)、テーブル管理部110は、実行タイミングテーブルを拡張して、再現試験の処理を登録し(ステップS215)、タイムラグ算出部111がタイムラグを算出し(ステップS216)、タイムラグ履歴にタイムラグを記録し(ステップS217)、ステップS205に移行する。
ところで、障害再現装置100は、ステップS211において、障害が再現されていると判定した場合には(ステップS211,Yes)、処理を継続するか否かを判定し(ステップS218)、継続する場合には(ステップS219,Yes)、ステップS212に移行し、継続しない場合には(ステップS219,No)、処理を終了する。
次に、図16のステップS210に示した障害再現判定処理の処理手順について説明する。図17は、障害再現判定処理の処理手順を示すフローチャートである。図17に示すように、障害再現装置100は、ログ解析部108が、再現試験ログテーブルから再現試験ログデータを取得し(ステップS301)、取得した再現試験ログデータは、検出対象ログテーブル中のログデータと同じ内容であるか否かを判定する(ステップS302)。
同じ内容の場合には(ステップS303,Yes)、ログ解析部108は、障害が再現されたと判定し、判定結果をテーブル管理部110に出力し(ステップS304)、障害再現判定処理を終了する。
一方、同じ内容が検出対象ログテーブル中に存在しない場合には(ステップS303,No)、ログ解析部108は、再現試験ログデータが処理対応テーブルに存在するか否かを判定する(ステップS305)。存在する場合には(ステップS306,Yes)、再現試験ログデータに対する処理の実行時を判定し(ステップS307)、ステップS308に移行する。
一方、再現試験ログデータが処理対応テーブルに存在しない場合には(ステップS306,No)、ログ解析部108は、再現試験ログテーブルに未取得の再現試験ログデータが存在するか否かを判定する(ステップS308)。
未取得の再現試験ログデータが存在する場合には(ステップS309,Yes)、ステップS301に移行する。一方、未取得の再現試験ログデータが存在しない場合には(ステップS309,No)、再現試験ログデータをタイムラグ算出部111に出力し(ステップS310)、障害再現判定処理を終了する。
上述してきたように、本実施例にかかる障害再現装置100は、サーバシステムに障害が発生した場合に、ログ解析部108が障害を引き起こした処理を抽出し、目標値算出部109が各処理の実行時間に基づいて目標値を算出すると共に、タイムラグ算出部111がタイムラグを算出する。そして、実行制御部112が、目標値とタイムラグとを基にして、各処理の実行命令をサーバシステム10に出力するタイミングを調整し、再現試験を実行するので、サーバシステム内にタイムラグが発生しても、障害発生にかかる処理の再現効率を向上させることが出来る。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
図18は、実施例にかかる障害再現装置を構成するコンピュータ30のハードウェア構成を示す図である。図18に示すように、このコンピュータ(障害再現装置)30は、入力装置31、モニタ32、RAM(Random Access Memory)33、ROM(Read Only Memory)34、被試験装置(例えば、サーバシステム10)との間におけるデータ通信を制御する通信制御装置35、記憶媒体から情報を読み取る媒体読取装置36、CPU(Central Processing Unit)37、HDD(Hard Disk Drive)38をバス39で接続されている。
そして、HDD38には、上述した障害再現装置100の機能と同様の機能を発揮する再現試験実行プログラム38bが記憶されている。CPU37が、再現試験実行プログラム38bを読み出して実行することにより、再現試験実行プロセス37aが起動される。ここで、再現試験実行プロセス37aは、図3に示したログ解析部108、目標値算出部109、テーブル管理部110、タイムラグ算出部111、実行制御部112に対応する。
なお、HDD38には、図3に示した検出対象ログテーブル記憶部101、処理対応テーブル記憶部102、処理組合せテーブル記憶部103、目標値記憶部104、実行済み時刻記憶部105、実行タイミングテーブル記憶部106、タイムラグ履歴記憶部107に記憶されるデータに対応した各種データ38aを記憶する。CPU37は、HDD38に記憶された各種データ38aをRAM33に読み出し、各種データ33aおよび通信制御装置35から入力される被試験装置のログデータを基にして目標値、タイムラグを算出し、再現試験を実行する。
ところで、図18に示した再現試験実行プログラム38bは、必ずしも最初からHDD38に記憶させておく必要はない。たとえば、情報処置装置としてのコンピュータに挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の記憶媒体」、または、コンピュータの内外に備えられるハードディスクドライブ(HDD)などの「固定用の記憶媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータに接続される「他のコンピュータ(またはサーバ)」などに再現試験実行プログラム38bを記憶しておき、コンピュータがこれらから再現試験実行プログラム38bを読み出して実行するようにしてもよい。

Claims (9)

  1. 情報処理装置に接続されるともに、前記情報処理装置に発生する障害を再現する障害再現装置において、
    前記情報処理装置に障害が発生した場合に、前記障害を発生した第1及び第2の処理を抽出し、前記第1の処理を前記情報処理装置が実行した第1の実行時と前記第2の処理を前記情報処理装置が実行した第2の実行時との時間差である目標時間を算出する目標時間算出部と、
    前記第1の処理を実行する第1の実行命令と前記第2の処理を実行する第2の実命令を、前記情報処理装置に対してそれぞれ出力し、前記情報処理装置が前記第1の処理を実行した第1の実行時と前記情報処理装置が前記第2の処理を実行した第2の実行時を含む履歴情報を取得する履歴情報取得部と、
    前記第1の実行命令を出力した第1の出力時と前記第2の実行命令を出力した第2の出力時と前記履歴情報に含まれる前記第1及び第2の実行時に基づいて、前記第1の出力時と前記第1の実行時の時間差である第1の遅延時間と前記第2の出力時と前記第2の実行時の時間差である第2の遅延時間を算出する遅延時間算出部と、
    前記目標時間と前記第1の遅延時間と前記第2の遅延時間とに基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整する調整部を有することを特徴とする障害再現装置。
  2. 前記障害再現装置において、
    前記調整部は、前記目標時間に前記第1の遅延時間を加算した結果に基づいて、前記第1の実行命令を前記情報処理装置に出力するタイミングを調整する請求項1記載の障害再現装置。
  3. 前記障害再現装置は、
    前記調整部により障害が再現されたか否かを判定するとともに、前記判定した結果を記憶する判定結果記憶部を更に有することを特徴とする請求項1又は2記載の障害再現装置。
  4. 情報処理装置に接続されるともに、前記情報処理装置に発生する障害を再現する障害再現装置の障害再現方法において、
    前記障害再現装置が有する目標時間算出部が、前記情報処理装置に障害が発生した場合に、前記障害を発生した第1及び第2の処理を抽出し、前記第1の処理を前記情報処理装置が実行した第1の実行時と前記第2の処理を前記情報処理装置が実行した第2の実行時との時間差である目標時間を算出するステップと、
    前記障害再現装置が有する履歴情報取得部が、前記第1の処理を実行する第1の実行命令と前記第2の処理を実行する第2の実命令を、前記情報処理装置に対してそれぞれ出力し、前記情報処理装置が前記第1の処理を実行した第1の実行時と前記情報処理装置が前記第2の処理を実行した第2の実行時を含む履歴情報を取得するステップと、
    前記障害再現装置が有する遅延時間算出部が、前記第1の実行命令を出力した第1の出力時と前記第2の実行命令を出力した第2の出力時と前記履歴情報に含まれる前記第1及び第2の実行時に基づいて、前記第1の出力時と前記第1の実行時の時間差である第1の遅延時間と前記第2の出力時と前記第2の実行時の時間差である第2の遅延時間を算出するステップと、
    前記障害再現装置が有する調整部が、前記目標時間と前記第1の遅延時間と前記第2の遅延時間とに基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整するステップを有することを特徴とする障害再現方法。
  5. 前記障害再現装置において、
    前記調整部が、前記目標時間と前記第1の遅延時間に基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整するステップは、前記目標時間に前記第1の遅延時間を加算した結果に基づいて、前記第1の実行命令を前記情報処理装置に出力するタイミングを調整するステップであることを特徴とする請求項4記載の障害再現方法。
  6. 前記障害再現方法は、
    前記障害再現装置が有する判定結果記憶部が、前記調整部により障害が再現されたか否かを判定するとともに、前記判定した結果を記憶するステップを更に有することを特徴とする請求項4又は5記載の障害再現方法。
  7. 情報処理装置に接続され、演算処理装置を有するとともに、前記情報処理装置に発生する障害を再現する障害再現装置の障害再現プログラムにおいて、
    前記演算処理装置に、
    前記障害再現装置が有する目標時間算出部が、前記情報処理装置に障害が発生した場合に、前記障害を発生した第1及び第2の処理を抽出し、前記第1の処理を前記情報処理装置が実行した第1の実行時と前記第2の処理を前記情報処理装置が実行した第2の実行時との時間差である目標時間を算出するステップと、
    前記障害再現装置が有する履歴情報取得部が、前記第1の処理を実行する第1の実行命令と前記第2の処理を実行する第2の実命令を、前記情報処理装置に対してそれぞれ出力し、前記情報処理装置が前記第1の処理を実行した第1の実行時と前記情報処理装置が前記第2の処理を実行した第2の実行時を含む履歴情報を取得するステップと、
    前記障害再現装置が有する遅延時間算出部が、前記第1の実行命令を出力した第1の出力時と前記第2の実行命令を出力した第2の出力時と前記履歴情報に含まれる前記第1及び第2の実行時に基づいて、前記第1の出力時と前記第1の実行時の時間差である第1の遅延時間と前記第2の出力時と前記第2の実行時の時間差である第2の遅延時間を算出するステップと、
    前記障害再現装置が有する調整部が、前記目標時間と前記第1の遅延時間と前記第2の遅延時間とに基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整するステップを実行させることを特徴とする障害再現プログラム。
  8. 前記障害再現プログラムにおいて、
    前記調整部が、前記目標時間と前記第1の遅延時間に基づいて、前記第1及び第2の実行命令を前記情報処理装置に出力するタイミングを調整するステップは、前記目標時間に前記第1の遅延時間を加算した結果に基づいて、前記第1の実行命令を前記情報処理装置に出力するタイミングを調整するステップであることを特徴とする請求項7記載の障害再現プログラム。
  9. 前記障害再現プログラムは、
    前記障害再現装置が有する判定結果記憶部が、前記調整部により障害が再現されたか否かを判定するとともに、前記判定した結果を記憶するステップを更に有することを特徴とする請求項7又は8記載の障害再現プログラム。
JP2011501435A 2009-02-27 2009-02-27 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム Expired - Fee Related JP5263384B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/053755 WO2010097953A1 (ja) 2009-02-27 2009-02-27 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム

Publications (2)

Publication Number Publication Date
JPWO2010097953A1 JPWO2010097953A1 (ja) 2012-08-30
JP5263384B2 true JP5263384B2 (ja) 2013-08-14

Family

ID=42665181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011501435A Expired - Fee Related JP5263384B2 (ja) 2009-02-27 2009-02-27 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム

Country Status (3)

Country Link
US (1) US8621280B2 (ja)
JP (1) JP5263384B2 (ja)
WO (1) WO2010097953A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560903B2 (en) * 2010-08-31 2013-10-15 Cisco Technology, Inc. System and method for executing functional scanning in an integrated circuit environment
US8560474B2 (en) 2011-03-07 2013-10-15 Cisco Technology, Inc. System and method for providing adaptive manufacturing diagnoses in a circuit board environment
WO2014118897A1 (ja) * 2013-01-29 2014-08-07 富士通株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US10042688B2 (en) * 2016-03-02 2018-08-07 Western Digital Technologies, Inc. Self-diagnosis of device drive-detected errors and automatic diagnostic data collection
JP6957936B2 (ja) * 2017-03-31 2021-11-02 日本電気株式会社 障害解析装置、障害解析方法および障害解析プログラム
JP6919311B2 (ja) * 2017-05-08 2021-08-18 富士通株式会社 プロセッサの障害再現プログラム実行方法、情報処理装置及び実行時間通知プログラム
JP7134903B2 (ja) * 2019-03-05 2022-09-12 株式会社日立製作所 不具合再現支援システム、不具合再現支援方法
KR102618465B1 (ko) * 2022-11-24 2023-12-28 쿠팡 주식회사 정보를 제공하는 전자 장치의 동작 방법 및 이를 지원하는 전자 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139093A (ja) * 1992-10-29 1994-05-20 Fujitsu Ltd ハードウェア障害の再現試験方式
JPH06265597A (ja) * 1993-03-11 1994-09-22 Hitachi Ltd 半導体集積回路の試験装置
JPH09244913A (ja) * 1996-03-13 1997-09-19 Toshiba Corp マンマシン試験装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0850555A (ja) 1994-08-08 1996-02-20 Matsushita Electric Ind Co Ltd 障害解析装置及び障害検出装置
US6002869A (en) * 1997-02-26 1999-12-14 Novell, Inc. System and method for automatically testing software programs
JP2009121832A (ja) * 2007-11-12 2009-06-04 Sysmex Corp 分析装置、分析システム及びコンピュータプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139093A (ja) * 1992-10-29 1994-05-20 Fujitsu Ltd ハードウェア障害の再現試験方式
JPH06265597A (ja) * 1993-03-11 1994-09-22 Hitachi Ltd 半導体集積回路の試験装置
JPH09244913A (ja) * 1996-03-13 1997-09-19 Toshiba Corp マンマシン試験装置

Also Published As

Publication number Publication date
US20110314335A1 (en) 2011-12-22
JPWO2010097953A1 (ja) 2012-08-30
WO2010097953A1 (ja) 2010-09-02
US8621280B2 (en) 2013-12-31

Similar Documents

Publication Publication Date Title
JP5263384B2 (ja) 情報処理装置における障害再現装置及び障害再現方法並びに障害再現プログラム
JP4071536B2 (ja) ファイル装置の試験装置及び該ファイル装置の試験装置における試験方法
US9563547B2 (en) Testing optimized binary modules
US10802847B1 (en) System and method for reproducing and resolving application errors
JP6602354B2 (ja) バスハング検出
JP5102823B2 (ja) 総テスト時間を最小にするようにテストシナリオを最適化するテスト支援装置、テスト装置、テスト支援方法及びコンピュータプログラム
JP2010086364A (ja) 情報処理装置、動作状態監視装置および方法
JP2016085727A (ja) 回復不能な障害後のデバイスのパワーオン防止方法およびシステム
JP5147216B2 (ja) コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム
KR20160029754A (ko) 소프트웨어 고장의 위치 확정 방법, 장치 및 설비
JP5545761B2 (ja) 障害解析支援システム、障害解析支援方法、および障害解析支援プログラム
JP2008084275A (ja) ソフトウェアの改ざん監視装置および改ざん監視方法
JP2009176146A (ja) マルチプロセッサシステム、障害検出方法および障害検出プログラム
EP2312443A2 (en) Information processing apparatus, method of controlling information processing apparatus and control program
US20130191845A1 (en) Load control device and load control method
JP5909948B2 (ja) 情報処理装置および情報処理装置の試験方法
JP6574146B2 (ja) サービス監視装置及びサービス監視方法
JP2009266031A (ja) 計算機システム及び計算機
JP5342660B2 (ja) 管理システム及びシステム管理方法及びプログラム
JP7074187B2 (ja) 監視装置、監視方法及びプログラム
JP2010003132A (ja) 情報処理装置、その入出力装置の故障検出方法及びプログラム
WO2021038636A1 (ja) 検証装置、検証方法、及び、検証プログラム
JP2020177489A (ja) 制御方法、制御プログラム、および情報処理装置
CN111694587A (zh) 服务器pnor固件升级方法、装置、设备及存储介质
KR102244562B1 (ko) 정보 처리 장치, 정보 처리 방법 및 프로그램

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130415

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees