JP2017208736A - ネットワークオンチップ用の欠陥耐性ルータ - Google Patents
ネットワークオンチップ用の欠陥耐性ルータ Download PDFInfo
- Publication number
- JP2017208736A JP2017208736A JP2016100732A JP2016100732A JP2017208736A JP 2017208736 A JP2017208736 A JP 2017208736A JP 2016100732 A JP2016100732 A JP 2016100732A JP 2016100732 A JP2016100732 A JP 2016100732A JP 2017208736 A JP2017208736 A JP 2017208736A
- Authority
- JP
- Japan
- Prior art keywords
- defect
- input
- router
- buffer
- crossbar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007547 defect Effects 0.000 title claims abstract description 117
- 238000012937 correction Methods 0.000 claims abstract description 18
- 230000002950 deficient Effects 0.000 claims description 21
- 238000003745 diagnosis Methods 0.000 claims description 15
- 230000007246 mechanism Effects 0.000 description 27
- 238000001514 detection method Methods 0.000 description 26
- 238000011084 recovery Methods 0.000 description 19
- 238000004364 calculation method Methods 0.000 description 16
- 238000000034 method Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 4
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 235000012431 wafers Nutrition 0.000 description 3
- 238000011960 computer-aided design Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101100440286 Mus musculus Cntrl gene Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明の欠陥耐性ルータにおいて、前記した課題は3つのステップにより解決される。
(1)欠陥検出(一またはそれ以上の欠陥の検出)、(2)欠陥診断(欠陥の型の決定)、(3)欠陥の型に基づく回復(ソフトまたはハード)
図2は、提案の欠陥耐性ルータに対するタイムチャートを示す。図2において、ハードエラーの扱いのため、先読み欠陥耐性ルーティング(LAFT)アルゴリズムが欠陥リンクを扱う。二つの主たる要素がさらに欠陥耐性を支持する:(1)クロスバー2における欠陥に対するバイパスリンク要求(BLoD)と(2)入力ポートバッファ4における欠陥に対するランダムアクセスバッファ(RAB)メカニズム。
図3は、本発明に従う提案の欠陥耐性ルータのブロック図である。図3において、NoCルータは、複数の入力ポートユニット11−17、即ち、ローカル入力ポートユニット11、ノース入力ポートユニット12、イースト入力ノースポート13、サウス入力ポートユニット14、ウエスト入力ポートユニット15、アップ入力ポートユニット16、ダウン入力ポートユニット17を有し、それぞれの入力ポートユニットは、積層ウェハの対応する方向からの入力10を受信する。
図4は、提案するランダムアクセスバッファ(RAB)メカニズムのブロックダイヤグラムである。RABメカニズムは、デッドロックさせないための効率的、低オーバヘッドの解法であり、RABメカニズムは、又、入力バッファ3における瞬時的な,間欠的、及び永久的欠陥を検知し回復する。
バイパスリンクオンデマンド(BLoD)メカニズムが、図5で説明される。BLoDメカニズムは、7x7基準のクロスバー4における欠陥の数が増加するたびに、追加の回避チャネルを与える。この場合、二つのバイパスリンク((Bypass-1 と Bypass-2)が構成例として考えられる。この図に示すクロスバーサブコントローラ(cntrl unit)41は、クロスバーリンクステータスのチェックを管理する。そして、欠陥が一つまたはいくつかのリンクで検出される場合、フラグ(faulty_Cross)を欠陥制御モジュール(FCM)42に送り、欠陥クロスバーリンクを不能にし、バイパスリンク40において、適切な数のバイパスチャネルを可能にする。
図6及び図7は、欠陥検出、診断及び回復方法のフローチャーを示す。図8は、メカニズムの容易な理解のために、上流と下流のルータR1, R2間の接続を示す。
図9は、アルゴリズム2としてソフトエラー回復方法を示す。図2に示したように、ルータはパイプラインステージ:バッファ書き込みステージI,ルーティング計算/スイッチ配置ステージII、及びクロスバー通過ステージIIIを有する。
ルーティング計算(NPC)及びスイッチアロケーション(SA)は、図9のサイクル2に示すように同時に並行して走る。ここでは、ルーティングアルゴリズムにより達成され、2つのステージ間の従属性は無くされる。このステージにおいて使用される欠陥耐性方法は、アルゴリズム2としてソフトエラー回復処理(SER)と呼ばれる。図2におけるこれらパイプラインステージI, II, IIIにおいてソフト(または瞬間的な)エラーを処理するのみである。
1.選択された方向は、最小パスを確実にし、ルーティング選択において、最優先を与える(ステップP6,Yes)。
2.最大の次ノードの多様性を有する望ましいパスを有する方向を選択する。
3.輻輳状態が最小確率となる。
Claims (4)
- ICに有する複数のコアのそれぞれに対応して配置される欠陥耐性ルータであって、
フリットがそれぞれ対応するコアから入力される複数の入力ポート部(11-17)と、
前記入力ポートユニット(11-17)から出力されるフリットをそれぞれの到達先方向に接続するクロスバー(4)と、
前記クロスバー(4)のチャネルパスと異なる追加のチャネルパス(40)と、
欠陥マネジャーユニット(8)を有し、
前記複数の入力ポートユニット(11-17)のそれぞれが、
入力バッファ(3)と、
前記入力バッファ(3)に入力したフリットのエラーを訂正するエラー訂正回路(7)と、
前記入力バッファ(3)に入力したフリットにおける欠陥スロットの記録を制御するランダムアクセスバッファ(RAB)を有し、更に
前記欠陥マネジャーユニット(8)は、前記エラー訂正回路(7)により、前記フリットの欠陥が訂正されないとき、送信元ノードに前記フリットの再送を要求し、前記フリットにおけるエラーが前記再送信により訂正されないとき、ハードウエアを診断する、
ことを特徴とする欠陥耐性ルータ。 - 請求項1において、
前記欠陥マネジャーユニットは入力バッファ(3)、クロスバー(4)、及び隣接ルータ(R2)との接続リンク(RL)の順に欠陥を診断する、
ことを特徴とする欠陥耐性ルータ。 - 請求項2において、
前記入力バッファ(3)が、前記診断において、欠陥と判定される時、欠陥マネジャーユニット(8)が、前記ランダムアクセスバッファに入力バッファ(3)におけるスロットの欠陥状態をチェックさせ、前記スロットにおける欠陥をレジスタに記録させる、
ことを特徴とする欠陥耐性ルータ。 - 請求項2において、
前記欠陥マネジャーユニットは、入力バッファが正常なときは、追加のチャネルパスを選択して代替のパスを選択する、
ことを特徴とする欠陥耐性ルータ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016100732A JP6846027B2 (ja) | 2016-05-19 | 2016-05-19 | ネットワークオンチップ用の欠陥耐性ルータ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016100732A JP6846027B2 (ja) | 2016-05-19 | 2016-05-19 | ネットワークオンチップ用の欠陥耐性ルータ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017208736A true JP2017208736A (ja) | 2017-11-24 |
JP6846027B2 JP6846027B2 (ja) | 2021-03-24 |
Family
ID=60415006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016100732A Active JP6846027B2 (ja) | 2016-05-19 | 2016-05-19 | ネットワークオンチップ用の欠陥耐性ルータ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6846027B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115190069A (zh) * | 2022-04-26 | 2022-10-14 | 中国人民解放军国防科技大学 | 一种高性能片上网络容错路由器装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040103218A1 (en) * | 2001-02-24 | 2004-05-27 | Blumrich Matthias A | Novel massively parallel supercomputer |
WO2010137572A1 (ja) * | 2009-05-25 | 2010-12-02 | 日本電気株式会社 | ネットワークオンチップとネットワークルーティング方法とシステム |
WO2012068171A1 (en) * | 2010-11-15 | 2012-05-24 | Reed Coke S | Parallel information system utilizing flow control and virtual channels |
US20130173970A1 (en) * | 2012-01-01 | 2013-07-04 | Mosys, Inc. | Memory device with background built-in self-testing and background built-in self-repair |
CN104052622A (zh) * | 2014-06-23 | 2014-09-17 | 合肥工业大学 | 片上网络中基于故障通道隔离检测的路由器容错方法 |
JP2015119387A (ja) * | 2013-12-19 | 2015-06-25 | 公立大学法人会津大学 | 誤り耐性ルータ、これを使用するic、及び誤り耐性ルータの制御方法 |
-
2016
- 2016-05-19 JP JP2016100732A patent/JP6846027B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040103218A1 (en) * | 2001-02-24 | 2004-05-27 | Blumrich Matthias A | Novel massively parallel supercomputer |
JP2004538548A (ja) * | 2001-02-24 | 2004-12-24 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 新規の大量並列スーパーコンピュータ |
WO2010137572A1 (ja) * | 2009-05-25 | 2010-12-02 | 日本電気株式会社 | ネットワークオンチップとネットワークルーティング方法とシステム |
WO2012068171A1 (en) * | 2010-11-15 | 2012-05-24 | Reed Coke S | Parallel information system utilizing flow control and virtual channels |
US20130173970A1 (en) * | 2012-01-01 | 2013-07-04 | Mosys, Inc. | Memory device with background built-in self-testing and background built-in self-repair |
JP2015119387A (ja) * | 2013-12-19 | 2015-06-25 | 公立大学法人会津大学 | 誤り耐性ルータ、これを使用するic、及び誤り耐性ルータの制御方法 |
CN104052622A (zh) * | 2014-06-23 | 2014-09-17 | 合肥工业大学 | 片上网络中基于故障通道隔离检测的路由器容错方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115190069A (zh) * | 2022-04-26 | 2022-10-14 | 中国人民解放军国防科技大学 | 一种高性能片上网络容错路由器装置 |
CN115190069B (zh) * | 2022-04-26 | 2023-12-05 | 中国人民解放军国防科技大学 | 一种高性能片上网络容错路由器装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6846027B2 (ja) | 2021-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Feng et al. | Addressing transient and permanent faults in NoC with efficient fault-tolerant deflection router | |
US20190260504A1 (en) | Systems and methods for maintaining network-on-chip (noc) safety and reliability | |
US10681136B2 (en) | Memory network methods, apparatus, and systems | |
US8001280B2 (en) | Collective network for computer structures | |
US7644254B2 (en) | Routing data packets with hint bit for each six orthogonal directions in three dimensional torus computer system set to avoid nodes in problem list | |
US10069599B2 (en) | Collective network for computer structures | |
Murali et al. | A Method for Routing Packets Across Multiple Paths in NoCs with In‐Order Delivery and Fault‐Tolerance Gaurantees | |
Dang et al. | A low-overhead soft–hard fault-tolerant architecture, design and management scheme for reliable high-performance many-core 3D-NoC systems | |
Dang et al. | Soft-error resilient 3d network-on-chip router | |
Neishaburi et al. | ERAVC: Enhanced reliability aware NoC router | |
Yu et al. | Transient and permanent error control for high-end multiprocessor systems-on-chip | |
JP6846027B2 (ja) | ネットワークオンチップ用の欠陥耐性ルータ | |
Alhussien et al. | Design and evaluation of a high throughput robust router for network-on-chip | |
Nunez-Yanez et al. | Adaptive routing strategies for fault-tolerant on-chip networks in dynamically reconfigurable systems | |
KR102339378B1 (ko) | 네트워크 온 칩 라우터 및 그 타이밍 오류 정정 방법 | |
Pasca et al. | Configurable serial fault-tolerant link for communication in 3D integrated systems | |
Yan et al. | A novel fault-tolerant router architecture for network-on-chip reconfiguration | |
Yang et al. | A fault tolerance noc topology and adaptive routing algorithm | |
Dang et al. | Soft-error resilient network-on-chip for safety-critical applications | |
Vinodhini et al. | A fault tolerant NoC architecture with runtime adaptive double layer error control and crosstalk avoidance | |
Xiangming et al. | Configurable redundant routing for network on chip | |
Ghiribaldi et al. | Power efficiency of switch architecture extensions for fault tolerant NoC design | |
Jayan et al. | FPGA implementation of an efficient router architecture based on DMC | |
Jouybari et al. | FT-Z-OE: A fault tolerant and low overhead routing algorithm on TSV-based 3D network on chip links | |
Somraj et al. | A Comparative Analysis of Fault Tolerance Methods in 3D-NoC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190517 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6846027 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |