JP4218538B2 - コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 - Google Patents
コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 Download PDFInfo
- Publication number
- JP4218538B2 JP4218538B2 JP2004019124A JP2004019124A JP4218538B2 JP 4218538 B2 JP4218538 B2 JP 4218538B2 JP 2004019124 A JP2004019124 A JP 2004019124A JP 2004019124 A JP2004019124 A JP 2004019124A JP 4218538 B2 JP4218538 B2 JP 4218538B2
- Authority
- JP
- Japan
- Prior art keywords
- bus
- input
- transaction
- output
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0745—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1405—Saving, restoring, recovering or retrying at machine instruction level
- G06F11/141—Saving, restoring, recovering or retrying at machine instruction level for bus or memory accesses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/004—Error avoidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Bus Control (AREA)
Description
前記入出力バスの縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバを有し、
前記バスコントローラに、障害が発生した入出力バスを縮退状態として扱う手段と、前記入出力バスの縮退状態において当該障害の伝搬を抑止しかつ当該障害の発生時及び発生後のトランザクションを処理する手段とを備え、
前記ブリッジドライバと前記バスコントローラとを連携させて前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記バスコントローラは、前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを含み、前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記バスコントローラは、前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出す入出力バス制御手段を含んでいる。
障害が発生した入出力バスを縮退状態として扱う手段と、前記入出力バスの縮退状態において当該障害の伝搬を抑止しかつ前記障害の発生時及び発生後のトランザクションを処理する手段とを備え、
前記縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバと連携して前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを含み、前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出す入出力バス制御手段を含んでいる。
前記バスコントローラに、障害が発生した入出力バスを縮退状態として扱わせ、前記入出力バスの縮退状態において当該障害の伝搬を抑止させかつ前記障害の発生時及び発生後のトランザクションを処理させるとともに、
前記入出力バスの縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバと前記バスコントローラとを連携させて前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを前記バスコントローラに設け、
前記バスコントローラが前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記バスコントローラに設けた入出力バス制御手段で、前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出させている。
2,2−1〜2−4 プロセッサ
3 メモリコントローラ
4 主記憶
5,5−1〜5−9 I/Oコントローラ
6 セル
7 クロスバー
11 インプットI/F制御部
12 アウトプットI/F制御部
13 アウトバウンドバッファ制御部
13a,14a,15a バッファ
14 インバウンドバッファ制御部
15 インバウンドリードデータ制御部
16 PCIバス制御部
41 OS
100 プロセッサバス
161 バス信号制御部
162 アウトバウンドコントローラ部
163 インバウンドコントローラ部
164 コンフィグレーション部
164a バス障害インジケータ
165 アービトレーション部
200 PCIバス
411 PCIデバイスドライバ
412 ブリッジドライバ
Claims (13)
- プロセッサと、主記憶と、複数の入出力デバイスとを入出力バスにて接続し、前記入出力バスを制御するバスコントローラを含むコンピュータシステムであって、
前記入出力バスの縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバを有し、
前記バスコントローラに、障害が発生した入出力バスを縮退状態として扱う手段と、前記入出力バスの縮退状態において当該障害の伝搬を抑止しかつ当該障害の発生時及び発生後のトランザクションを処理する手段とを有し、
前記ブリッジドライバと前記バスコントローラとを連携させて前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記バスコントローラは、前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを含み、前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記バスコントローラは、前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出す入出力バス制御手段を含むことを特徴とするコンピュータシステム。 - 前記入出力バス制御手段は、前記入出力バスの縮退後に送られてくる後続のトランザクションに対して、前記入出力デバイスへのトランザクションを実行可能とし、前記入出力デバイスからのトランザクションの受付けを抑止することを特徴とする請求項1記載のコンピュータシステム。
- 前記ブリッジドライバは、前記バスコントローラの縮退状態を監視することによって前記障害を検出し、対応する前記入出力デバイスに障害発生を通知する機能と、前記入出力デバイスからの要求によって前記入出力バスの縮退状態を復旧させるための指示を前記バスコントローラに発行しかつその結果を要求元の前記入出力デバイスへ通知する機能とを含むことを特徴とする請求項1または請求項2記載のコンピュータシステム。
- 前記入出力デバイスは、前記復旧の通知を受取った時に自デバイスに対して初期設定処理を行って再びシステムへの組込みを行うことを特徴とする請求項3記載のコンピュータシステム。
- 前記入出力バスは、PCI(Peripheral Component Interconnect)バスであることを特徴とする請求項1から請求項4のいずれか記載のコンピュータシステム。
- プロセッサと、主記憶と、複数の入出力デバイスとを入出力バスにて接続するシステムにおいて前記入出力バスを制御するバスコントローラであって、
障害が発生した入出力バスを縮退状態として扱う手段と、前記入出力バスの縮退状態において当該障害の伝搬を抑止しかつ前記障害の発生時及び発生後のトランザクションを処理する手段とを有し、
前記縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバと連携して前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを含み、前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出す入出力バス制御手段を含むことを特徴とすることを特徴とするバスコントローラ。 - 前記入出力バス制御手段は、前記入出力バスの縮退後に送られてくる後続のトランザクションに対して、前記入出力デバイスへのトランザクションを実行可能とし、前記入出力デバイスからのトランザクションの受付けを抑止することを特徴とする請求項6記載のバスコントローラ。
- 前記入出力バスは、PCI(Peripheral Component Interconnect)バスであることを特徴とする請求項6または請求項7記載のバスコントローラ。
- プロセッサと、主記憶と、複数の入出力デバイスとを入出力バスにて接続し、前記入出力バスを制御するバスコントローラを含むコンピュータシステムに用いるバス障害処理方法であって、
前記バスコントローラに、障害が発生した入出力バスを縮退状態として扱わせ、前記入出力バスの縮退状態において当該障害の伝搬を抑止させかつ前記障害の発生時及び発生後のトランザクションを処理させるとともに、
前記入出力バスの縮退状態の監視及び前記入出力バスの復旧処理の指示を行うブリッジドライバと前記バスコントローラとを連携させて前記入出力デバイスに前記入出力バスの障害検出から復旧処理までを行わせ、
前記入出力バスでのエラー検出時に点灯させるバス障害インジケータを前記バスコントローラに設け、
前記バスコントローラが前記バス障害インジケータの点灯時に前記入出力バスを縮退状態とするとともに、
前記バスコントローラに設けた入出力バス制御手段で、前記入出力バスの障害を検出したトランザクションに対して、前記入出力デバイスへの書込み系の処理のエラー時に全て正常リプライを返却するとともに、前記入出力デバイスからの読出し系の処理のエラー時に全て正常リプライを返却しかつ前記入出力デバイスからの読出し系の処理を再度行わせるために全ての値が予め設定した所定値のデータを読出させることを特徴とするバス障害処理方法。 - 前記入出力バス制御手段が、前記入出力バスの縮退後に送られてくる後続のトランザクションに対して、前記入出力デバイスへのトランザクションを実行可能とし、前記入出力デバイスからのトランザクションの受付けを抑止することを特徴とする請求項9記載のバス障害処理方法。
- 前記ブリッジドライバが、前記バスコントローラの縮退状態を監視することによって前記障害を検出し、対応する前記入出力デバイスに障害発生を通知し、前記入出力デバイスからの要求によって前記入出力バスの縮退状態を復旧させるための指示を前記バスコントローラに発行しかつその結果を要求元の前記入出力デバイスへ通知することを特徴とする請求項9または請求項10記載のバス障害処理方法。
- 前記入出力デバイスが、前記復旧の通知を受取った時に自デバイスに対して初期設定処理を行って再びシステムへの組込みを行うことを特徴とする請求項11記載のバス障害処理方法。
- 前記入出力バスが、PCI(Peripheral Component Interconnect)バスであることを特徴とする請求項9から請求項12のいずれか記載のバス障害処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004019124A JP4218538B2 (ja) | 2004-01-28 | 2004-01-28 | コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 |
US11/033,901 US7631226B2 (en) | 2004-01-28 | 2005-01-13 | Computer system, bus controller, and bus fault handling method used in the same computer system and bus controller |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004019124A JP4218538B2 (ja) | 2004-01-28 | 2004-01-28 | コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005215809A JP2005215809A (ja) | 2005-08-11 |
JP4218538B2 true JP4218538B2 (ja) | 2009-02-04 |
Family
ID=34823701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004019124A Expired - Fee Related JP4218538B2 (ja) | 2004-01-28 | 2004-01-28 | コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7631226B2 (ja) |
JP (1) | JP4218538B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4667108B2 (ja) * | 2005-04-11 | 2011-04-06 | パナソニック株式会社 | データ処理装置 |
US20070201059A1 (en) * | 2006-02-28 | 2007-08-30 | Radzykewycz Tim O | Method and system for automatically configuring a device driver |
US7673170B2 (en) * | 2006-04-25 | 2010-03-02 | Intel Corporation | Personal computer bus protocol with error correction mode |
JP4728896B2 (ja) | 2006-07-13 | 2011-07-20 | エヌイーシーコンピュータテクノ株式会社 | コンピュータシステム |
JP5151580B2 (ja) * | 2008-03-14 | 2013-02-27 | 日本電気株式会社 | コンピュータシステムおよびバス制御装置 |
CN102486746A (zh) * | 2010-12-03 | 2012-06-06 | 鸿富锦精密工业(深圳)有限公司 | 服务器及其检测pci系统错误的方法 |
JP6032510B2 (ja) * | 2012-06-06 | 2016-11-30 | インテル・コーポレーション | 入出力エラー封じ込めイベント後のリカバリ |
US9164888B2 (en) | 2012-12-10 | 2015-10-20 | Google Inc. | Using a logical to physical map for direct user space communication with a data storage device |
US9792167B1 (en) * | 2016-09-27 | 2017-10-17 | International Business Machines Corporation | Transparent north port recovery |
JP7298950B1 (ja) | 2022-02-08 | 2023-06-27 | Necプラットフォームズ株式会社 | 情報処理装置、リカバリ方法及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58176726A (ja) | 1982-04-09 | 1983-10-17 | Toshiba Corp | バス障害検出装置 |
JPH02294753A (ja) * | 1989-05-09 | 1990-12-05 | Fujitsu Ltd | 入出力処理装置の初期化方式 |
JPH0424839A (ja) | 1990-05-18 | 1992-01-28 | Fujitsu Ltd | 障害処理方式 |
KR960016648B1 (ko) * | 1993-12-29 | 1996-12-19 | 현대전자산업 주식회사 | 커먼 컨트롤 중복 스위치 방법 |
KR100244836B1 (ko) * | 1995-11-02 | 2000-02-15 | 포만 제프리 엘 | 컴퓨터시스템 및 다수의 기능카드 중 한개의 기능카드를 격리하는 방법 |
US6487623B1 (en) * | 1999-04-30 | 2002-11-26 | Compaq Information Technologies Group, L.P. | Replacement, upgrade and/or addition of hot-pluggable components in a computer system |
JP2001109635A (ja) | 1999-10-07 | 2001-04-20 | Mitsubishi Electric Corp | 障害対処方法及びコンピュータシステム読み取り可能な記録媒体 |
JP2001273200A (ja) | 2000-03-24 | 2001-10-05 | Nec Eng Ltd | コンピュータシステム |
US6708283B1 (en) * | 2000-04-13 | 2004-03-16 | Stratus Technologies, Bermuda Ltd. | System and method for operating a system with redundant peripheral bus controllers |
JP2001350674A (ja) | 2000-06-08 | 2001-12-21 | Mitsubishi Electric Corp | 計算機システム |
US6745345B2 (en) * | 2000-12-04 | 2004-06-01 | International Business Machines Corporation | Method for testing a computer bus using a bridge chip having a freeze-on-error option |
JP3644399B2 (ja) | 2001-03-27 | 2005-04-27 | ティーエム・ティーアンドディー株式会社 | Pciバス不良個所切り離し方法およびそのプログラム |
US6996750B2 (en) * | 2001-05-31 | 2006-02-07 | Stratus Technologies Bermuda Ltd. | Methods and apparatus for computer bus error termination |
JP2003022222A (ja) | 2001-07-06 | 2003-01-24 | Toshiba Corp | 情報処理装置及びその保守方法 |
US7480831B2 (en) * | 2003-01-23 | 2009-01-20 | Dell Products L.P. | Method and apparatus for recovering from a failed I/O controller in an information handling system |
-
2004
- 2004-01-28 JP JP2004019124A patent/JP4218538B2/ja not_active Expired - Fee Related
-
2005
- 2005-01-13 US US11/033,901 patent/US7631226B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005215809A (ja) | 2005-08-11 |
US7631226B2 (en) | 2009-12-08 |
US20050177760A1 (en) | 2005-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6643727B1 (en) | Isolation of I/O bus errors to a single partition in an LPAR environment | |
US7526592B2 (en) | Interrupt control system and storage control system using the same | |
US7395362B2 (en) | Method for a slave device to convey an interrupt and interrupt source information to a master device | |
EP1090350B1 (en) | Multi-processor system bridge with controlled access | |
JPH06337820A (ja) | マルチプル・バス・システムにおけるエラー検知及び回復機構とその方法 | |
CZ9701560A3 (cs) | Můstek mezi dvěma sběrnicemi | |
CN1971548A (zh) | 用于对固定等待时间互连进行锁步处理的方法和装置 | |
US7774638B1 (en) | Uncorrectable data error containment systems and methods | |
JP4218538B2 (ja) | コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法 | |
EP0779579A2 (en) | Bus error handler on dual bus system | |
US20040193735A1 (en) | Method and circuit arrangement for synchronization of synchronously or asynchronously clocked processor units | |
JP4658122B2 (ja) | Dmaコントローラ、ノード、データ転送制御方法、及びプログラム | |
US4858234A (en) | Method and apparatus for error recovery in a multibus computer system | |
JP3329986B2 (ja) | マルチプロセッサシステム | |
EP1675006A2 (en) | Fault tolerant computer system and interrupt control method for the same | |
JP5151500B2 (ja) | コンピュータシステム、障害処理方法および障害処理プログラム | |
US4837767A (en) | Bus adapter module with improved error recovery in a multibus computer system | |
JP5151580B2 (ja) | コンピュータシステムおよびバス制御装置 | |
JP4487756B2 (ja) | コンピュータシステム及びシステム監視プログラム | |
US7243257B2 (en) | Computer system for preventing inter-node fault propagation | |
JP6256087B2 (ja) | ダンプシステムおよびダンプ処理方法 | |
EP2019359B1 (en) | Information processing apparatus including transfer device for transferring requests | |
JP5444194B2 (ja) | データ転送装置、データ転送方法、コンピュータシステム | |
JP2004013723A (ja) | 共有メモリを使ったクラスタ構成を採用した情報処理システムの障害処理装置と方法 | |
JP2005208972A (ja) | コンピュータ装置及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081103 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111121 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4218538 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111121 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121121 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121121 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131121 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |