JP3326546B2 - コンピュータシステムの故障検知方法 - Google Patents
コンピュータシステムの故障検知方法Info
- Publication number
- JP3326546B2 JP3326546B2 JP32105795A JP32105795A JP3326546B2 JP 3326546 B2 JP3326546 B2 JP 3326546B2 JP 32105795 A JP32105795 A JP 32105795A JP 32105795 A JP32105795 A JP 32105795A JP 3326546 B2 JP3326546 B2 JP 3326546B2
- Authority
- JP
- Japan
- Prior art keywords
- subsystems
- computer system
- boundary scan
- subsystem
- scan test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Multi Processors (AREA)
- Debugging And Monitoring (AREA)
Description
テムの故障を検知するコンピュータシステムの故障検知
方法に関する。
めの故障検知方法として、従来、CPUの数に応じた種
々の故障検知方法が開発されている。例えば、CPUを
1つ使用しているコンピュータシステムでは、図3に示
す如くシステム100内に設けられているCPU101
によって、メモリなどが正常に動作するかどうかなどの
診断を行なわせ、この診断結果に基づき、CPU101
以外の故障有無を判定する方法、ウォッチドックタイマ
を使用して前記CPU101の出力変化やメモリなどの
応答時間などをチェックし、このチェック内容に基づ
き、CPU101以外の故障有無を判定する方法、ある
いはCPU101によって誤り訂正符号を付加したデー
タをメモリに書き込んだ後、これを読み出し、誤り訂正
符号を用いて正しいデータが再生できるかどうかをチェ
ックし、このチェック結果に基づき、前記CPU101
以外の故障有無を判定する方法などがある。また、CP
Uを2つ使用しているコンピュータシステムでは、図4
に示す如くシステム102を構成する第1サブシステム
103と、第2サブシステム104とに、同一の処理を
行なわせながら、一致検出回路105によって前記第1
サブシステム103の処理結果と、前記第2サブシステ
ム104の処理結果とが一致しているかどうかをチェッ
クし、これらの各処理結果が不一致となったとき、前記
第1サブシステム103または前記第2サブシステム1
04のいずれか一方が故障したと判定する。また、CP
Uを3つ以上、使用しているコンピュータシステムで
は、図5に示す如くシステム106を構成する第1サブ
システム107と、第2サブシステム108と、第3サ
ブシステム103などの各サブシステムに、同一の処理
を行なわせながら、多数決回路110によって前記各サ
ブシステムの処理結果の多数決をとり、この多数決結果
と異なる処理結果を出したサブシステムがあれば、この
サブシステムが故障していると判定する。
た従来のコンピュータシステムの故障検知方法において
は、次に述べるような問題があった。まず、図3に示す
如く、CPU101を1つ使用したシステム100で
は、CPU101以外の部分について、故障の有無を検
知することができるものの、CPU101自身の故障を
検出することができない。このため、CPU101自身
が故障しても、その影響が重大な事故に結び付かない、
比較的小規模で、簡易なコンピュータシステムでしか、
この故障検知方法を採用することができないという問題
があった。また、図4、図5に示す如く、CPU101
を2つあるいは3つ以上、使用したシステム102、1
06では、一致検出回路105や多数決回路110など
の専用回路によって、各サブシステムの処理結果を常
時、チェックし、このチェック結果に基づき、各サブシ
ステムの故障有無を判定するようにしているので、各サ
ブシステム毎に、同一のハードウェアと、同一のソフト
ウェアとを設けなければならない。このため、コンピュ
ータシステムを構成するサブシステムの数を増やして
も、サブシステムが1つの場合と、同一の処理能力しか
持たせることができず、その分だけ、ハードウェアとソ
フトウェアとが冗長になってしまい、原子力関係や銀行
などのように、コストより信頼性を重視する特別な分野
でしか、この故障検知方法を採用することができないと
いう問題があった。本発明は上記の事情に鑑み、CPU
の数の分だけ、処理能力を向上させることができるとと
もに、各CPUを稼動させながら、これら各サブシステ
ムのいずれかが故障したとき、これを検知することがで
きるコンピュータシステムの故障検知方法を提供するこ
とを目的としている。
めに本発明は、複数のCPUと、プリント基板製造時の
検査工程のテストデータに基づいてバウンダリスキャン
テストをサポートする専用回路と、バウンダリスキャン
テストに用いるバウンダリスキャンテスト信号線とを備
えた複数のサブシステムを使用するコンピュータシステ
ムの故障検知方法であって、前記コンピュータシステム
の製造時における検査工程のバウンダリスキャンテスト
に使用した前記専用回路と前記バウンダリスキャンテス
ト信号線とを用いて、前記複数のサブシステムの稼動時
に、周期的に各サブシステムの1つを選択し、当該サブ
システムで実行していた通常の処理を中断させ、そのサ
ブシステムによりバウンダリスキャンテストを実行して
他のサブシステムの動作状態をチェックする動作状態チ
ェックを周期的に相互に行い、全てのサブシステムの動
作状態をチェックしたチェック結果に基づいて各サブシ
ステムを構成するCPUとその周辺回路の故障の有無を
判定することを特徴としている。上記の方法により、コ
ンピュータシステムの製造時における検査工程のバウン
ダリスキャンテストに使用した専用回路とバウンダリス
キャンテスト信号線とを使って、複数のサブシステムを
稼動させながら、周期的に各サブシステムの1つを選択
して、このサブシステムで実行していた通常の処理を中
断させるとともに、そのサブシステムによりバウンダリ
スキャンテストを実行させ、他のサブシステムの動作状
態をチェックし、その動作状態チェックを周期的に相互
に行って、全てのサブシステムの動作状態をチェックし
たチェック結果に基づいて各サブシステムを構成するC
PUとその周辺回路の故障の有無を判定することによ
り、サブシステムの数の分だけ、処理能力を向上させる
とともに、各サブシステムを稼働させながら、これら各
サブシステムのいずれかが故障したとき、これを察知す
る。
例に基づいて詳細に説明する。図1は本発明によるコン
ピュータシステムの故障検知方法の一形態例を適用した
コンピュータシステムの一例を示すブロック図である。
この図に示すコンピュータシステム1は、各種の処理を
行なう第1〜第3サブシステム2〜4と、これら第1〜
第3サブシステム2〜4を電気的に接続する標準システ
ムバス(例えば、VMEバスやPCIバスなど)5と、
プリント基板製造時の検査工程で実施されたバウンダリ
スキャンテスト時のテストデータを持ち、前記第1〜第
3サブシステム2〜4で実施されるバウンダリスキャン
テストをサポートする専用回路(図示は省略する)とを
備えており、第1〜第3サブシステム2〜4によって各
々、指定された処理を実行させながら、これら第1〜第
3サブシステム2〜4が稼動している最中に、予め設定
された周期で、相互にバウンダリスキャンテスト(IE
EE1149.1で規定されるテスト)を行なわせて、
第1〜第3サブシステム2〜4が正常に動作しているか
どうかをチェックさせる。
〜4は、各々、設定されているソフトウェアに基づき、
各種の処理を行なうCPU6と、このCPU6の動作を
規定するROM(図示は省略する)、前記CPU6の作
業エリアなどとして使用されるRAM(図示は省略す
る)などを備えており、前記ROMなどに格納されてい
るアプリケーションソフトウェアなどに基づいた処理を
行ないながら、予め設定されている周期で、これら第1
〜第3サブシステム2〜4のうちの1つを選択させると
ともに、このサブシステムが行なっていた処理を中断さ
せた後、このサブシステムにより、前記専用回路を動作
させながら、前記標準システムバス5に設けられている
バウンダリスキャンテスト信号線を使用させ、他のサブ
システムのバウンダリスキャンテストを行なわせる。そ
して、このバウンダリスキャンテスト結果に基づき、こ
れら第1〜第3サブシステム2〜4を構成するデバイス
の破損、プリントパターン(デバイス内部のボンディン
グワイヤをも含む)のショート、オープン、CPU6の
故障有無、異常動作などを判定させる。この際、各デバ
イスメーカーがオプションとして、自己診断機能などを
用意しているときには、バウンダリスキャンテストを行
なうとき、このバウンダリスキャンテストとともに、自
己診断機能を行なわせて、さらに効率良くきめ細かな故
障検知を行なわせる。
サブシステム2〜4によって各々、指定された処理を実
行させながら、これら第1〜第3サブシステム2〜4が
稼動している最中に、予め設定された周期で、相互にバ
ウンダリスキャンテスト(IEEE1149.1で規定
されるテスト)を行なわせて、第1〜第3サブシステム
2〜4が正常に動作しているかどうかをチェックさせる
ようにしたので、CPU6の数の分だけ、処理能力を向
上させることができるとともに、各CPU6を稼動させ
ながら、これら第1〜第3サブシステム2〜4のいずれ
かが故障したとき、これを検知させることができる。こ
れによって、図2に示す如く冗長性、応答性、コスト、
検知範囲、システム規模、拡張性の全てにおいて、良好
な結果を得ることができる。
の目的が、プリント基板実装工程でのテストを容易化す
るものであることから、プリント基板製造において今後
急激な採用が見込まれている。つまり、本方式を採用す
るためのハードウェアが、今後、生産されるプリント基
板上に標準装備されるものと思われるとともに、複数の
CPU構成をサポートする標準システムバスとして、採
用が予定されているVMEバスやPCIバスなどでは、
既にバウンダリスキャンテスト信号線用のピン割当が行
われていることから、故障検知プログラムと、テストデ
ータとを用意するだけで、本発明によるコンピュータシ
ステムの故障検知方法を利用することができる。これに
より、これまで、高信頼化に対する経験が少ない中小企
業(システムハウス業などのマイコン関連製品開発企
業)などでも、比較的容易にコンピュータシステムの信
頼性を向上させることができる。
自動運転システムや無人観測機器、医療機器(例えば、
人工呼吸器)など、これまで、大企業が独占していた市
場への中小企業の参入を可能にすることができる。さら
に、PL法の施行により、安全性への取り組みが強く求
められる社会情勢となったが、このような社会情勢への
対処方法としても、有効な手段となり得る。また、本発
明で使用したバウンダリスキャンテストは、国際規格と
して、IEEE1149.1で規定され、広く公開され
ているので、だれでもその資料を入手することができ、
これによってコンピュータシステムの高信頼化の知識に
乏しい中小企業であっても、容易に高信頼化システムを
構築させることができ、付加価値の高い製品開発に取り
組ませることができる。
PUの数の分だけ、処理能力を向上させることができる
とともに、各CPUを稼動させながら、これら各サブシ
ステムのいずれかが故障したとき、これを検知すること
ができる。
方法の一形態例を適用したコンピュータシステムの一例
を示すブロック図である。
来のコンピュータシステムの特性とを比較する表図であ
る。
いるコンピュータシステムの一例を示すブロック図であ
る。
いるコンピュータシステムの一例を示すブロック図であ
る。
ているコンピュータシステムの一例を示すブロック図で
ある。
Claims (1)
- 【請求項1】 複数のCPUと、プリント基板製造時の
検査工程のテストデータに基づいてバウンダリスキャン
テストをサポートする専用回路と、バウンダリスキャン
テストに用いるバウンダリスキャンテスト信号線とを備
えた複数のサブシステムを使用するコンピュータシステ
ムの故障検知方法であって、 前記コンピュータシステムの製造時における検査工程の
バウンダリスキャンテストに使用した前記専用回路と前
記バウンダリスキャンテスト信号線とを用いて、前記複
数のサブシステムの稼動時に、周期的に各サブシステム
の1つを選択し、当該サブシステムで実行していた通常
の処理を中断させ、そのサブシステムによりバウンダリ
スキャンテストを実行して他のサブシステムの動作状態
をチェックする動作状態チェックを周期的に相互に行
い、全てのサブシステムの動作状態をチェックしたチェ
ック結果に基づいて 各サブシステムを構成するCPUと
その周辺回路の故障の有無を判定することを特徴とする
コンピュータシステムの故障検知方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32105795A JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32105795A JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09138757A JPH09138757A (ja) | 1997-05-27 |
JP3326546B2 true JP3326546B2 (ja) | 2002-09-24 |
Family
ID=18128326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32105795A Expired - Lifetime JP3326546B2 (ja) | 1995-11-15 | 1995-11-15 | コンピュータシステムの故障検知方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3326546B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6182329B2 (ja) | 2013-02-28 | 2017-08-16 | ルネサスエレクトロニクス株式会社 | 半導体装置 |
-
1995
- 1995-11-15 JP JP32105795A patent/JP3326546B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH09138757A (ja) | 1997-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414268B (zh) | 故障处理方法、装置及服务器 | |
US20020144193A1 (en) | Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error | |
US6845469B2 (en) | Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex | |
US7539903B2 (en) | Method for monitoring the execution of a program by comparing a request with a response and introducing a falsification in a response | |
US8260974B1 (en) | Techniques for accelerating the processing of enclosures in SAS disk storage arrays | |
JP3326546B2 (ja) | コンピュータシステムの故障検知方法 | |
CN113094221B (zh) | 故障注入方法、装置、计算机设备以及可读存储介质 | |
CN209343321U (zh) | 一种计算机故障检测装置 | |
JP3040186B2 (ja) | 制御用ディジタルコントローラ | |
JP3342039B2 (ja) | ファイルを管理する処理装置 | |
CN111865719A (zh) | 一种交换机故障注入自动化测试方法和装置 | |
JP3334174B2 (ja) | 障害処理検証装置 | |
US5805606A (en) | Cache module fault isolation techniques | |
US6654349B1 (en) | Real time automated checking mechanism for a bus protocol on an integrated bus system | |
US11720506B2 (en) | Device and method for inspecting process, and electronic control device | |
JPS5911452A (ja) | パリテイチエツク回路の試験方式 | |
CN118098332A (zh) | 一种固态硬盘故障定位方法、装置、设备及可读存储介质 | |
JP2878014B2 (ja) | Ram試験方式 | |
CN117519113A (zh) | 车载故障诊断系统的可靠性测试用例设计方法及装置 | |
JPS60195649A (ja) | マイクロプログラム制御型デ−タ処理装置におけるエラ−報告方式 | |
CN119512797A (zh) | 用于芯片故障的安全管理系统、方法、装置及微控制器 | |
CN116489001A (zh) | 交换机故障诊断及恢复方法、装置、交换机及存储介质 | |
KR960020563A (ko) | 전전자 교환기의 이중화 공통 버스 자원 및 프로세서의 자가 진단 및 복구 방법 | |
JPH079636B2 (ja) | バス診断装置 | |
CN113935302A (zh) | 基于表格的pcba测试方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R370 | Written measure of declining of transfer procedure |
Free format text: JAPANESE INTERMEDIATE CODE: R370 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090712 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100712 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110712 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120712 Year of fee payment: 10 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130712 Year of fee payment: 11 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |