JPS6230668B2 - - Google Patents
Info
- Publication number
- JPS6230668B2 JPS6230668B2 JP56193691A JP19369181A JPS6230668B2 JP S6230668 B2 JPS6230668 B2 JP S6230668B2 JP 56193691 A JP56193691 A JP 56193691A JP 19369181 A JP19369181 A JP 19369181A JP S6230668 B2 JPS6230668 B2 JP S6230668B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- error log
- processor
- output
- interrupt
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000012545 processing Methods 0.000 claims description 121
- 238000000034 method Methods 0.000 claims description 35
- 238000012546 transfer Methods 0.000 claims description 32
- 230000001052 transient effect Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 description 27
- 230000002159 abnormal effect Effects 0.000 description 9
- 238000007796 conventional method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Retry When Errors Occur (AREA)
- Debugging And Monitoring (AREA)
Description
【発明の詳細な説明】
本発明は、入出力専用プロセツサより主記憶装
置に転送されるエラーログ情報の転送が、入出力
データ転送終結に伴い主プロセツサに対して行な
われる終了割込とは異なつたタイミングで行なわ
れるようにした入出力制御方法に関するものであ
る。DETAILED DESCRIPTION OF THE INVENTION The present invention provides that the transfer of error log information from an input/output dedicated processor to the main memory is different from a termination interrupt issued to the main processor upon completion of input/output data transfer. The present invention relates to an input/output control method that performs input/output control at the same timing.
従来より情報処理システムにおいては入出力装
置と入出力制御装置との間でのデータ転送時、転
送データに誤りが発生した場合にはその誤りを回
復する処理が採られているが、その処理はチヤネ
ルと称される入出力制御装置が行なつているのが
実状である。入出力制御装置と入出力装置との間
でのデータ転送は以下のようにして行なわれる。 Conventionally, in information processing systems, when an error occurs in the transferred data during data transfer between an input/output device and an input/output control device, a process has been adopted to recover the error. In reality, this is done by an input/output control device called a channel. Data transfer between the input/output control device and the input/output device is performed as follows.
即ち、入出力転送の必要が生じ中央の処理装置
よりプログラムによる入出力命令が入出力制御装
置にあつた場合、データ転送制御に必要とされる
転送先主記憶装置番地情報、転送語数、チエイン
動作指定等に係る制御情報がチヤネル制御情報レ
ジスタにセツトされ、この後は一定語数データを
転送する度にデータ転送番地情報および転送語数
の更新を行ないつつ入出力装置は起動されるよう
になつているものである。一方、入出力装置にお
いては転送指示にもとづいてラインプリンタに印
字するなどの入出力処理を行ない、その結果は入
出力制御装置に転送されるようになつている。こ
のようにして入出力動作が行なわれている間に転
送すべきデータがなくなれば、一連の転送処理は
終了することから入出力制御装置は入出力装置に
停止指示を示すと同時に、中央の処理装置に対し
ては終了割込をかけるようになつているものであ
る。 In other words, when input/output transfer is required and an input/output command is sent by a program from the central processing unit to the input/output control unit, the transfer destination main storage address information, number of transferred words, and chain operation required for data transfer control. Control information related to the designation, etc. is set in the channel control information register, and thereafter, the input/output device is activated while updating the data transfer address information and the number of transferred words each time data of a certain number of words is transferred. It is something. On the other hand, the input/output device performs input/output processing such as printing on a line printer based on a transfer instruction, and the results are transferred to the input/output control device. If there is no more data to be transferred while input/output operations are being performed in this way, the series of transfer processes will end. It is designed to issue a termination interrupt to the device.
ここで入出力制御装置と入出力装置との間での
データ転送中にエラーが発生した場合を想定する
と、エラーの種類如何によつてはエラー回復が可
能であるというものである。一般にエラーは永久
的なものと過渡的なものとに大別される。例えば
入出力装置における電源が異常であつたり、印字
紙がセツトされていなかつたり、制御レジスタ類
にソリツドエラーが発生した場合などにはオペレ
ータの介入を必要とし、その介入なしでは自動回
復が困難であることから、それらエラーは永久的
故障に相当するものとして区別される。しかし、
転送ライン上で混入した雑音などによりビツト情
報が逆転することによつて生じるエラー(パリテ
イエラーなど)や、機械精度の微妙なズレに起因
する磁気デイスク装置におけるトラツク位置決め
エラーなどは再試行により回復可能なエラー(過
渡的故障と称す)として区別されている。したが
つて、入出力制御装置において過渡的故障が検出
されると、入出力制御装置は再度入出力動作を実
行することによつてエラー回復を試みるところと
なる。この処理は一般にリトライ処理と称される
が、入出力動作の故障率を小さくしてシステム全
体の信頼性を高めるうえでその果す役割は非常に
大きなものとなつている。一方、これとは別にリ
トライ処理が行なわれる場合リトライ処理の原因
となつたエラー種別やリトライ処理の種別とその
結果、更にはリトライ処理の実行回数などが磁気
デイスク装置などの外部大容量記憶装置に保存記
録せしめておくことが従来より一般に行なわれて
いる。これは、保存記録されたデータよりエラー
の内容が詳細に知られ、後に入出力装置の稼動率
を評価したり、エラー原因を究明することによつ
てエラーの発生を未然に防止するという意味でシ
ステムの保守性や信頼性に資するところ大である
からである。 Assuming that an error occurs during data transfer between the input/output control device and the input/output device, recovery from the error may be possible depending on the type of error. Errors are generally classified into permanent and transient errors. For example, if the power supply to the input/output device is abnormal, the printing paper is not set, or a solid error occurs in the control registers, operator intervention is required, and automatic recovery is difficult without that intervention. Therefore, these errors are classified as equivalent to permanent failures. but,
Errors caused by bit information being reversed due to noise mixed in on the transfer line (parity errors, etc.) and track positioning errors in magnetic disk drives caused by subtle deviations in mechanical accuracy can be recovered by retrying. It is distinguished as a possible error (referred to as a transient failure). Therefore, when a transient failure is detected in the input/output controller, the input/output controller attempts to recover from the error by performing the input/output operation again. This process is generally called retry process, and it plays a very important role in reducing the failure rate of input/output operations and increasing the reliability of the entire system. On the other hand, if retry processing is performed separately, the type of error that caused the retry processing, the type of retry processing, the results, and the number of times the retry processing was executed are stored in an external mass storage device such as a magnetic disk device. Conventionally, it has been common practice to keep records. This means that the details of the error can be known from the saved and recorded data, and later the operation rate of the input/output device can be evaluated and the cause of the error can be investigated to prevent the occurrence of the error. This is because it greatly contributes to the maintainability and reliability of the system.
ところで中央の処理装置におけるユーザプログ
ラムにとつては入出力動作の成否が問題なのであ
つて、リトライ処理の結果エラーを回復し得た場
合と何等リトライ処理を行なうことなしに正常に
入出力動作を終了し得た場合との区別は本来必要
でなく、不要なものである。しかしながら、従来
にあつてはリトライ処理毎のエラー要因やリトラ
イ処理結果を示すエラーログ情報と最終的な入出
力動作の成否に係るエラー情報がともに前記した
終了割込として中央の処理装置に報告されていた
ことから、中央の処理装置ではエラーログ情報を
も処理しなければならないという不具合を生じ
る。即ち、ユーザプログラムより出された入出力
要求に対する終了処理を実行する終了割込プログ
ラムは本来処理すべきエラー情報対応を処理の他
に、ユーザプログラムにとつては不要なエラーロ
グ情報をも処理する必要があり、処理量が徒らに
増大するというものである。 By the way, for the user program in the central processing unit, the success or failure of the input/output operation is the issue, and there are cases where the error can be recovered as a result of retry processing, and cases where the input/output operation is completed normally without any retry processing. The distinction between cases where it could have been done is not originally necessary and unnecessary. However, in the past, both error log information indicating the error cause and retry processing result for each retry process and error information regarding the success or failure of the final input/output operation were reported to the central processing unit as the above-mentioned end interrupt. This creates a problem in that the central processing unit must also process error log information. In other words, the termination interrupt program that executes termination processing for input/output requests issued by the user program not only processes error information that should be processed, but also processes error log information that is unnecessary for the user program. This is necessary, and the amount of processing increases needlessly.
この欠点を第1図から第7図により更に詳しく
説明すれば以下のようである。 This drawback will be explained in more detail with reference to FIGS. 1 to 7 as follows.
即ち、第1図は従来技術に係るマルチプロセツ
サシステムの一例でのシステム構成を示したもの
である。これによると本システムはデータバス4
1、アドレスバス42および割込ライン43,4
4よりなるシステムバス401に中央の処理装置
としてのJOBプロセツサ402、入出力制御装置
としてのIOプロセツサ404がそれぞれ接続さ
れ、更にシステムバス401には主記憶制御装置
500を介して主記憶装置400が収容接続され
るようにしてなる。JOBプロセツサ402は主記
憶装置400上のプログラムエリアに格納されて
いる各種制御プログラム200を実行し、また、
IOプロセツサ404はプロセツサ間通信用のエ
リア100にセツトされているデータを取り込み
入出力動作実行命令と転送データに翻訳したうえ
入出力装置109との間で行なわれる入出力動作
を制御するようになつている。本例では入出力装
置109はIOステーシヨン407、ループバス
406を介してIOプロセツサ404に収容され
ているが、これに限定されるものでないことは勿
論である。なお、主記憶装置400上におけるエ
リア300はIOプロセツサ404からのリトラ
イエラー情報を一時的に保存記録するためのログ
アウトエリアとしてのものである。また、割込ラ
イン43,44はJOBプロセツサ402とIOプ
ロセツサ404間で互いに相手方に割込をかける
ための割込専用信号線である。 That is, FIG. 1 shows the system configuration of an example of a multiprocessor system according to the prior art. According to this, this system has data bus 4.
1, address bus 42 and interrupt lines 43, 4
A JOB processor 402 as a central processing unit and an IO processor 404 as an input/output control device are connected to a system bus 401 consisting of 4. It will be accommodated and connected. The JOB processor 402 executes various control programs 200 stored in the program area on the main storage device 400, and
The IO processor 404 takes in the data set in the inter-processor communication area 100, translates it into input/output operation execution commands and transfer data, and then controls input/output operations performed with the input/output device 109. ing. In this example, the input/output device 109 is accommodated in the IO processor 404 via the IO station 407 and the loop bus 406, but it is needless to say that the invention is not limited to this. Note that area 300 on main storage device 400 serves as a logout area for temporarily storing and recording retry error information from IO processor 404. Further, interrupt lines 43 and 44 are interrupt-only signal lines for interrupting each other between the JOB processor 402 and the IO processor 404.
システム構成は以上のようであるが、JOBプロ
セツサ402、IOプロセツサ404の構成を第
2図、第3図により更に詳細に説明すれば以下の
通りである。 Although the system configuration is as described above, the configurations of the JOB processor 402 and IO processor 404 will be explained in more detail with reference to FIGS. 2 and 3 as follows.
即ち、第2図はIOプロセツサ404の内部構
成を示したものであり、これによるとIOプロセ
ツサ404自体はJOBプロセツサ402からの割
込信号によつて起動される。割込ライン43を介
するJOBプロセツサ402からの割込信号がセツ
ト信号として割込受付フリツプフロツプ70をセ
ツト状態におくことによつて起動されるものであ
る。フリツプフロツプ70がセツト状態におかれ
た旨は優先順位判定回路340を介し演算処理回
路350に報告され、しかして演算処理回路35
0はシステムバス制御回路310を起動するとこ
ろとなるものである。IOプロセツサ404が起
動された時点では既にエリア100にはJOBプロ
セツサ402によつてIOプロセツサ404が入
出力動作を行なううえで必要とされる情報がセツ
トされていることから、システムバス制御回路3
10は内部アドレスバス302、アドレスバス4
2を介し主記憶制御装置500にその情報を読み
出すべく所定のアドレスデータを順次転送するよ
う動作する。主記憶制御装置500はそのアドレ
スデータにもとづきエリア100よりそのアドレ
ス対応のデータを読み出し、読み出されたデータ
はデータバス41、内部データバス301、シス
テムバス制御回路310を介しバツフア370に
格納されるようになつてる。バツフア370にデ
ータが格納されたことはシステムバス制御回路3
10より演算処理回路350に報告されるが、こ
れによつて演算処理回路350はバツフア370
に格納されている入出力動作指示情報をデコード
したうえ入出力制御回路360での入出力動作を
指示する入出力コマンドを作成し、この入出力コ
マンドが入出力装置109に対してデータ出力を
指示している場合には更に入出力動作指示情報と
ともに主記憶装置400より転送された出力デー
タを分割する処理を行なう。入出力コマンドが入
出力装置109にデータ出力を指示している場合
には演算処理回路350は入出力制御回路360
とループバス406との間で一度に転送し得る単
位に出力データを分割するものである。この後演
算処理回路350は入出力制御回路360に入出
力コマンドを送ることによつて入出力制御回路3
60を起動し、起動された入出力制御回路360
はバツフア370より出力データを読み出し、入
出力コマンドに従いバス390を介しループバス
406に入出力コマンドとともに出力データを転
送するところとなるものである。 That is, FIG. 2 shows the internal configuration of the IO processor 404, and according to this, the IO processor 404 itself is activated by an interrupt signal from the JOB processor 402. An interrupt signal from the JOB processor 402 via the interrupt line 43 is activated as a set signal by placing the interrupt reception flip-flop 70 in the set state. The fact that the flip-flop 70 has been placed in the set state is reported to the arithmetic processing circuit 350 via the priority determination circuit 340, and the arithmetic processing circuit 35
0 is where the system bus control circuit 310 is activated. At the time when the IO processor 404 is activated, information necessary for the IO processor 404 to perform input/output operations has already been set in the area 100 by the JOB processor 402, so the system bus control circuit 3
10 is internal address bus 302, address bus 4
2 to the main memory control device 500 in order to read out the information. Main memory control device 500 reads data corresponding to the address from area 100 based on the address data, and the read data is stored in buffer 370 via data bus 41, internal data bus 301, and system bus control circuit 310. It's becoming like that. The system bus control circuit 3 indicates that the data has been stored in the buffer 370.
10 to the arithmetic processing circuit 350, which causes the arithmetic processing circuit 350 to
After decoding the input/output operation instruction information stored in the input/output control circuit 360, an input/output command is created that instructs the input/output operation in the input/output control circuit 360, and this input/output command instructs the input/output device 109 to output data. If so, further processing is performed to divide the output data transferred from the main storage device 400 together with the input/output operation instruction information. When the input/output command instructs the input/output device 109 to output data, the arithmetic processing circuit 350 outputs data to the input/output control circuit 360.
The output data is divided into units that can be transferred at once between the loop bus 406 and the loop bus 406. After that, the arithmetic processing circuit 350 sends an input/output command to the input/output control circuit 360 to control the input/output control circuit 3.
60 and the activated input/output control circuit 360
reads the output data from the buffer 370 and transfers the output data along with the input/output command to the loop bus 406 via the bus 390 in accordance with the input/output command.
以上は入出力コマンドが入出力装置109に対
してデータ出力を指示している場合であるが、入
出力装置109からのデータ入力を指示している
場合には演算処理回路350は入出力コマンドと
入力されるデータが格納されるべき主記憶装置4
00上のアドレスデータを入出力制御回路360
に送出する。出力、入力の何れの場合も入出力コ
マンドがループバス406上に転送されれば、所
定の入出力装置109が起動され、IOプロセツ
サ404と入出力装置109との間でのデータの
入出力転送が行なわれるわけである。なお、入出
力装置109からのデータはIOプロセツサ40
4を介し主記憶装置400に格納されるが、その
際のデータ転送制御はデータ転送方向が逆になる
ことを除けば、主記憶装置400よりIOプロセ
ツサ404にデータ転送を行なう場合と全く同様
にして行なわれる。 The above is a case where the input/output command instructs the input/output device 109 to output data, but if the input/output command instructs the input/output device 109 to input data, the arithmetic processing circuit 350 uses the input/output command. Main storage device 4 where input data is to be stored
Address data on 00 is input/output control circuit 360
Send to. When an input/output command is transferred to the loop bus 406 for either output or input, a predetermined input/output device 109 is activated, and data input/output is transferred between the IO processor 404 and the input/output device 109. is carried out. Note that the data from the input/output device 109 is sent to the IO processor 40.
4, and the data transfer control at that time is exactly the same as when data is transferred from the main memory 400 to the IO processor 404, except that the data transfer direction is reversed. It is done.
さて、入出力装置109での入出力動作が終了
すればループバス406を介しIOプロセツサ4
04にその旨の報告がされるが、これによつて
IOプロセツサは終了報告処理を行なう。ループ
バス406、バス390を介し終了の旨が入出力
制御回路360に報告されると、入出力制御回路
360は終了フリツプフロツプ80をセツト状態
におく。一方、これと同時に入出力制御回路36
0はその終了報告に対する入出力コマンドが出力
を指示するものであつた場合は、入出力動作が正
常に終了したか否か、ループバス406やIOス
テーシヨン407でリトライ処理が行なわれたか
否かなど、異常要因などを示す終了割込状態語を
バツフア380に格納し、また、入出力コマンド
が入力を指示するものであつた場合には終了割込
状態語を入出力装置109からの入力データに付
加してバツフア380に格納するが、この終了割
込状態語より5出力動作が正常に終了したか否か
が知れるものである。演算処理回路350はフリ
ツプフロツプ80のセツト状態より入出力動作が
終了した旨を知ると、バツフア380内に格納さ
れている終了割込状態語より正常に入出力動作が
終了したか否かを判定するわけである。 Now, when the input/output operation in the input/output device 109 is completed, the IO processor 4 is transferred via the loop bus 406.
A report to that effect will be made on 04.
The IO processor processes the completion report. When the termination is reported to the input/output control circuit 360 via the loop bus 406 and the bus 390, the input/output control circuit 360 places the termination flip-flop 80 in the set state. Meanwhile, at the same time, the input/output control circuit 36
0 indicates whether the input/output operation was completed normally if the input/output command for the completion report was an instruction to output, whether retry processing was performed on the loop bus 406 or the IO station 407, etc. , stores the end interrupt status word indicating the cause of the abnormality, etc. in the buffer 380, and also stores the end interrupt status word in the input data from the input/output device 109 if the input/output command is an input instruction. It is additionally stored in the buffer 380, and it can be known from this end interrupt status word whether or not the 5 output operation has ended normally. When the arithmetic processing circuit 350 learns from the set state of the flip-flop 80 that the input/output operation has ended, it determines from the end interrupt status word stored in the buffer 380 whether the input/output operation has ended normally. That's why.
この判定において正常に入出力動作が終了し、
しかもリトライ処理が何等行なわれなかつたと判
定された場合は演算処理回路350はゲート30
3をバツフア380とシステム制御回路310と
を接続すべく制御した後、JOBプロセツサ402
に終了報告を行なうための情報をバツフア380
上に作成する。この後演算処理回路350はシス
テムバス制御回路310を起動し、JOBプロセツ
サ402に終了報告を行なうための情報、更に入
力データが存する場合には入力データをもシステ
ムバス制御回路310よりそれぞれJOBプロセツ
サ402、主記憶装置400に転送するが、この
転送が終了したことをシステムバス制御回路31
0より受けると終了割込フリツプフロツプ60を
セツト状態におくことによつて、割込ライン44
を介しJOBプロセツサ402に終了割込をかける
ところとなるものである。フリツプフロツプ60
はJOBプロセツサ402が終了割込を受け付ける
のに十分な時間経過後にリセツト状態に戻される
が、フリツプフロツプ70,80に対するリセツ
ト制御も前述した割込優先順位判定回路340に
よつて行なわれる。説明が遅れたが、この割込優
先順位判定回路340はフリツプフロツプ70,
80が同時にセツト状態におかれた場合何れを優
先して先に受け付けるかを判定するものであり、
フリツプフロツプ70,80の何れかがセツト状
態におかれたときには演算処理回路350を起動
し、この起動後にフリツプフロツプ70,80を
リセツト状態に戻すべく機能するものである。 In this judgment, the input/output operation is completed normally,
Moreover, if it is determined that no retry processing has been performed, the arithmetic processing circuit 350
3 to connect the buffer 380 and the system control circuit 310, the JOB processor 402
Information for reporting completion to Batsuhua 380
Create above. Thereafter, the arithmetic processing circuit 350 activates the system bus control circuit 310, and sends information for reporting completion to the JOB processor 402, and input data if there is input data from the system bus control circuit 310 to the JOB processor 402, respectively. , to the main storage device 400, but the system bus control circuit 31 indicates that this transfer has been completed.
By leaving interrupt flip-flop 60 set when received from zero, interrupt line 44 is
This is where a termination interrupt is applied to the JOB processor 402 via. flipflop 60
is returned to the reset state after a sufficient time has elapsed for the JOB processor 402 to accept the termination interrupt, and the reset control for the flip-flops 70 and 80 is also performed by the interrupt priority determining circuit 340 described above. Although the explanation is delayed, this interrupt priority determination circuit 340 consists of flip-flops 70,
If 80 are placed in the set state at the same time, it is determined which one should be accepted first with priority.
When either of the flip-flops 70, 80 is placed in the set state, the arithmetic processing circuit 350 is started, and after this start-up, the flip-flops 70, 80 are returned to the reset state.
正常に入出力動作が終了した場合は以上のよう
であるが、正常に入出力動作が行なわれなかつた
場合には以下のような処理が採られる。即ち、演
算処理回路350がバツフア380内に存する終
了割込状態語より入出力動作が異常であつて、し
かもリトライ処理が行なわれていないと判定する
と、同じく終了割込状態語の構成データである異
常要因を分析し、異常が永久故障によるものか、
過渡故障によるものなのかが判断される。具体的
には終了割込状態語における所定の2つのビツト
位置に永久故障のフラツグが立つているか、過渡
的故障のフラツグが立つているかを識別すればよ
いものである。この識別において永久故障である
と判断された場合にはリトライ処理を行なつても
無意味であるから、何等リトライ処理が行なわれ
ることなく入出力動作が正常に終了した場合と同
様な終了報告処理が行なわれる。しかし、過渡的
故障によるものであつて、しかもリトライ処理が
行なわれていないと判断されると、ループバス4
06やIOステーシヨン407、入出力装置10
9に対し必要に応じイニシヤライズ処理が行なわ
れた後入出力コマンドの再送出を行ない、IOプ
ロセツサレベルのリトライ処理を行なうものであ
る。規定回数リトライ処理を行なつても正常終了
が報告されないか、または規定回数以下の何回目
かの再試行で正常終了が報告されるまでリトライ
処理が繰り返されるわけである。リトライ処理が
行なわれる場合、その回数や各リトライ処理反応
の終了割込状態語など、リトライ情報はエラーロ
グバツフイ320に順次格納される。各リトライ
処理における終了報告タイミングでゲート303
をバツフア380とエラーログバツフア320と
を接続すべく演算処理回路350が制御するとと
もに、エラーログ制御回路330を起動するよう
にすればよいものである。エラーログ制御回路3
30はその際エラーログバツフア320のアドレ
スを更新する管理の他、エラーログ情報のフオー
マツテイングを行なうべく機能する。 The above is the case when the input/output operation is completed normally, but when the input/output operation is not performed normally, the following process is taken. That is, if the arithmetic processing circuit 350 determines that the input/output operation is abnormal based on the end interrupt state word existing in the buffer 380, and that retry processing is not being performed, the data forming the end interrupt state word is also found. Analyze the cause of the abnormality and determine whether the abnormality is due to a permanent failure.
It is determined whether this is due to a transient failure. Specifically, it is sufficient to identify whether a permanent failure flag or a transient failure flag is set at two predetermined bit positions in the end interrupt state word. If this identification determines that there is a permanent failure, there is no point in performing retry processing, so the completion report processing is the same as when the input/output operation has completed normally without any retry processing. will be carried out. However, if it is determined that the failure is due to a transient failure and retry processing has not been performed, the loop bus 4
06, IO station 407, input/output device 10
9 is initialized as necessary, and then the input/output command is sent again, thereby performing retry processing at the IO processor level. The retry process is repeated until a normal end is not reported even after performing the retry process a predetermined number of times, or until a normal end is reported after several retries below the predetermined number of times. When retry processing is performed, retry information such as the number of retry processing and the end interrupt status word of each retry processing reaction is sequentially stored in the error log buffer 320. Gate 303 at the completion report timing in each retry process
The arithmetic processing circuit 350 may control the connection between the buffer 380 and the error log buffer 320, and also activate the error log control circuit 330. Error log control circuit 3
30 functions to manage updating the address of the error log buffer 320 as well as formatting the error log information.
ところでIOプロセツサレベルではなくループ
バス406やIOステーシヨン407などでリト
ライ処理が行なわれた場合にはリトライ情報は通
常の終了報告のタイミングでバツフア380に格
納され、以降は演算処理回路350によつてIO
プロセツサレベルの場合と同様にして判断処理さ
れる。したがつて、リトライ処理が如何なるとこ
ろで行なわれてもそれとは無関係にリトライ情報
はエラーログバツフア320に格納されるもので
ある。次に演算処理回路350はリトライ処理を
行なつたのがIOプロセツサであるか、ループバ
ス406あるいはIOステーシヨン407などで
あるかの区別をバツフア380内に存する終了割
込状態語に付加し、ゲート303をバツフア38
0とシステムバス制御回路310とを接続すべく
制御した後、バツフア380の内容をリトライ処
理が行なわれなかつた場合と同様にして主記憶装
置400に送出する。最後に演算処理回路350
はゲート303をエラーログバツフア320とシ
ステムバス制御回路310を接続すべく制御した
後、システムバス制御回路310を起動し、エラ
ーログバツフア320の内容を主記憶装置400
に転送するところとなる。この転送の終了がシス
テムバス制御回路310より報告されると、演算
処理回路350は終了割込フリツプフロツプ60
をセツト状態におくわけである。IOプロセツサ
404で行なわれる処理の概要については第7図
に示すところである。 By the way, if retry processing is performed at the loop bus 406 or IO station 407 instead of at the IO processor level, the retry information is stored in the buffer 380 at the timing of the normal completion report, and thereafter is processed by the arithmetic processing circuit 350. I.O.
Judgment processing is performed in the same manner as at the processor level. Therefore, regardless of where retry processing is performed, retry information is stored in error log buffer 320. Next, the arithmetic processing circuit 350 adds a distinction as to whether the retry processing was performed by the IO processor, the loop bus 406, the IO station 407, etc. to the end interrupt status word existing in the buffer 380, and 303 to 38
0 and the system bus control circuit 310, the contents of the buffer 380 are sent to the main storage device 400 in the same manner as if the retry process had not been performed. Finally, the arithmetic processing circuit 350
controls the gate 303 to connect the error log buffer 320 and the system bus control circuit 310, starts the system bus control circuit 310, and transfers the contents of the error log buffer 320 to the main memory 400.
It will be transferred to. When the system bus control circuit 310 reports the end of this transfer, the arithmetic processing circuit 350 interrupts the end interrupt flip-flop 60.
In other words, it is left in the set state. An overview of the processing performed by the IO processor 404 is shown in FIG.
次に第3図によりJOBプロセツサ402につい
て説明する。 Next, the JOB processor 402 will be explained with reference to FIG.
図示の如くJOBプロセツサ402はシステムバ
ス制御回路210、IO要求フリツプフロツプ1
0、ハードエラーフリツプフロツプ20、タイマ
ー割込フリツプフロツプ30、終了割込受付フリ
ツプフロツプ40、割込優先順位判定回路24
0、演算処理回路250、プログラムカウンタ2
20、汎用レジスタ230などよりなる。このう
ち、システムバス制御回路210および割込優先
順位判定回路240は第2図におけるものと同様
な機能を有するが、演算処理回路250は第2図
におけるものとはやや異なり主記憶装置400上
のプログラムエリアに格納された各種制御プログ
ラム200をプログラムカウンタ220における
アドレスデータにもとづき実行し得るようになつ
ている。演算処理回路250が実行する命令とし
ては主記憶装置400上の任意アドレスとの間お
よび汎用レジスタ230との間でのデータ転送命
令、計算、論理、シフト、比較などに関した命
令、条件が満足されたか否かによつて任意アドレ
スにプログラムカウンタ220の内容を書き替え
る命令、入出力動作を行なうための命令などがあ
る。入出力動作を行なうための命令の1つにIO
プロセツサ404に入出力処理を行なわしめる命
令があるわけである。主記憶装置400上に作成
格納された入出力動作を指示する情報のアドレス
とIOプロセツサ404の識別番号が指定される
と、割込ライン43に接続されたIO要求フリツ
プフロツプ10をセツト状態におく命令が実行さ
れ、しかして既述した如くにIOプロセツサ40
4で入出力動作が行なわれるものである。一方、
IOプロセツサ404からは割込ライン44を介
し終了報告がJOBプロセツサ402に対してなさ
れるが、その報告は終了割込受付フリツプフロツ
プ40によつて受け付けられる。終了割込受付に
よつてフリツプフロツプ40がセツト状態におか
れ、その割込が最も優先順依が高いと判定される
と、その割込種別を示す情報が割込優先順位判定
回路240より演算処理回路250に送出され、
以降制御は割込受付フアームウエアプログラム2
60に移行されるようになつている。 As shown in the figure, the JOB processor 402 includes a system bus control circuit 210 and an IO request flip-flop 1.
0, hard error flip-flop 20, timer interrupt flip-flop 30, termination interrupt acceptance flip-flop 40, interrupt priority determination circuit 24
0, arithmetic processing circuit 250, program counter 2
20, a general-purpose register 230, etc. Of these, the system bus control circuit 210 and the interrupt priority determination circuit 240 have the same functions as those shown in FIG. 2, but the arithmetic processing circuit 250 is slightly different from that shown in FIG. Various control programs 200 stored in the program area can be executed based on address data in the program counter 220. The instructions executed by the arithmetic processing circuit 250 include data transfer instructions between arbitrary addresses on the main storage device 400 and between the general-purpose registers 230, instructions related to calculations, logic, shifts, comparisons, etc., and instructions that satisfy conditions. There are instructions for rewriting the contents of the program counter 220 to an arbitrary address depending on whether or not the program has been accessed, and instructions for performing input/output operations. IO is one of the instructions for performing input/output operations.
There are instructions that cause the processor 404 to perform input/output processing. When the address and identification number of the IO processor 404 of the information created and stored in the main memory 400 instructing input/output operations are specified, a command is issued to place the IO request flip-flop 10 connected to the interrupt line 43 in the set state. is executed, and as described above, the IO processor 40
4, input/output operations are performed. on the other hand,
The IO processor 404 sends a completion report to the JOB processor 402 via the interrupt line 44, and the report is received by the completion interrupt reception flip-flop 40. When the flip-flop 40 is placed in a set state by accepting the end interrupt, and it is determined that the interrupt has the highest priority, information indicating the interrupt type is processed by the interrupt priority determination circuit 240. sent to circuit 250;
From then on, control is performed by interrupt reception firmware program 2.
60.
第4図a,bは主記憶装置400上のエリア1
00に格納配置されるプロセツサ間通信用テーブ
ルの構成を示したものである。プロセツサ間通信
用データとしてのテーブルとしては入出力動作指
示情報が格納される割込メツセージ制御テーブル
103と、割込受付時のプログラム状態および割
込が連続して発生した場合の処理待行列を管理す
る割込レベル状態テーブル102とがある。割込
レベル状態テーブル102のテーブル構成は第4
図bに示すところであるが、割込レベル状態テー
ブル102は各IOプロセツサからの各割込要因
毎に主記憶装置400上の固定アドレスに配置さ
れるようになつている。終了割込により割込受付
フアームウエアプログラムが起動されると、その
割込要因に対応した主記憶装置400上の割込レ
ベル状態テーブルがアクセスされ、次に実行すべ
き制御プログラムのアドレスを割込詳細要因2の
内容とポインタ3の内容との和で示されるアドレ
スに格納されている値として得るようになつてい
る。この割込処理終了後は割り込まれたプログラ
ムを再開するために必要な現在のプログラム状態
語とプログラムカウンタ220の値を5,6で示
されるエリアに退避する処理を行なつてから新し
いプログラム状態語を4で示されるエリアより
得、先に求めた割込処理プログラムアドレスにジ
ヤンプすることによつて割込処理プログラムが実
行されるものである。なお、第4図bにおいて符
号7,8は割込受付待行列を管理するためのポイ
ンタであり、また符号9はLOCKフラグを、更に
符号11は待行列に接続されている割込メツセー
ジ制御テーブル103の個数を示す情報である。
なお、テーブルを用いるプロセツサ間通信方式に
ついては、本出願に係る発明者の一部を含む者等
によつて既に特許出願として提唱済のものであ
る。 FIG. 4 a and b are area 1 on the main storage device 400.
This figure shows the structure of the interprocessor communication table stored and arranged in 00. As a table for inter-processor communication data, there is an interrupt message control table 103 that stores input/output operation instruction information, and manages the program state at the time of interrupt acceptance and the processing queue when interrupts occur consecutively. There is an interrupt level status table 102. The table configuration of the interrupt level status table 102 is as follows.
As shown in FIG. b, the interrupt level status table 102 is arranged at a fixed address on the main storage device 400 for each interrupt factor from each IO processor. When the interrupt reception firmware program is activated by a termination interrupt, the interrupt level status table on the main storage device 400 corresponding to the interrupt cause is accessed, and the address of the control program to be executed next is accessed. The value is obtained as the value stored at the address indicated by the sum of the contents of detailed factor 2 and the contents of pointer 3. After this interrupt processing is completed, the current program status word and the value of the program counter 220 necessary to restart the interrupted program are saved to the areas indicated by 5 and 6, and then a new program status word is saved. is obtained from the area indicated by 4, and the interrupt processing program is executed by jumping to the previously obtained interrupt processing program address. In FIG. 4b, reference numerals 7 and 8 are pointers for managing the interrupt acceptance queue, reference numeral 9 indicates the LOCK flag, and reference numeral 11 indicates the interrupt message control table connected to the queue. This is information indicating the number of 103 pieces.
The inter-processor communication system using tables has already been proposed as a patent application by some of the inventors of the present application.
第5図は前記した割込処理プログラムの処理の
流れを示したものであるが、これによるとエラー
ログ情報の有無判定処理およびエラーの有無判定
処理は割込メツセージ制御テーブル103に格納
されている終了割込状態語によつて行なわれる。
エラーログ情報が存しない場合はエラーの有無判
定処理が行なわれ、この判定でエラーでない場合
は正常終了報告処理が、また、そうでない場合に
はエラー処理、異常終了報告処理が行なわれるよ
うになつている。一方、エラーログ情報が存する
場合にはエラーログ情報のログアウトフアイルへ
の転送プログラム起動処理、エラーログ情報出力
プログラムの起動処理が行なわれた後エラーの有
無判定処理が行なわれる。エラーが存しない場合
正常終了報告処理が、またそうでない場合にはエ
ラー処理、異常終了報告処理が行なわれるように
なつている。 FIG. 5 shows the processing flow of the above-mentioned interrupt processing program, and according to this, the processing for determining the presence or absence of error log information and the processing for determining the presence or absence of an error are stored in the interrupt message control table 103. This is done by the end interrupt status word.
If there is no error log information, a process is performed to determine the presence or absence of an error, and if it is determined that there is no error, a normal termination report process is performed, and if not, an error process or abnormal termination report process is performed. ing. On the other hand, if error log information exists, processing for starting a program for transferring error log information to a logout file and processing for starting an error log information output program are performed, and then processing for determining the presence or absence of an error is performed. If there is no error, normal termination reporting processing is performed; otherwise, error processing and abnormal termination reporting processing are performed.
第5図より判るように処理は大別して破線部で
囲まれたエラーログ情報をログアウトフアイルに
転送するためのプログラムを起動するなど、プロ
グラム起動処理部分と、最終的に入出力処理が正
常に終了したか否かその結果をユーザプログラム
に報告する部分とからなる。第1図には図示され
ていないが、システムバス401にはフアイルコ
ントロールプロセツサ(FCP)を介しログアウ
トフアイルが収容接続されており、JOBプロセツ
サ402はフアイルコントロールプロセツサを起
動制御するようになつている。JOBプロセツサ4
02によつて起動された場合、先ずフアイルコン
トロールプロセツサはエラーログ情報転送プログ
ラムを実行し、これによりログアウトエリア30
0よりエラーログ情報は読み出され、ログアウト
フアイルに一旦転送記憶される。この後再び起動
されることによつてフアイルコントロールプロセ
ツサはログアウトフアイルよりエラーログ情報を
読み出し適当な記録表示装置によつてエラーログ
情報は記録表示されるようになつている。しかし
ながら、ユーザプログラム側よりすれば、リトラ
イ処理の結果入出力処理が正常に行なわれた場合
と最初より正常に入出力処理が行なわれた場合と
では以降行なわれる処理には何等変更はなく、し
たがつてこれよりすればエラーログ情報のログア
ウトフアイルへの転送記憶処理などを割込処理プ
ログラムによつて行なうことはプログラム起動ま
でに待時間や前処理のための時間を要し、これが
ためにオーバヘツド時間の大幅な増加となり、処
理性能上大きな問題になることは明らかである。 As can be seen from Figure 5, the processing is broadly divided into the program startup processing part, which includes starting a program to transfer the error log information to the logout file, which is surrounded by a broken line, and finally the input/output processing ends normally. and a part that reports the results to the user program. Although not shown in FIG. 1, a logout file is connected to the system bus 401 via a file control processor (FCP), and the JOB processor 402 starts and controls the file control processor. There is. JOB processor 4
02, the file control processor first executes the error log information transfer program, which causes the file control processor to move to the logout area 30.
The error log information is read from 0 and is temporarily transferred and stored in the logout file. When the file control processor is then activated again, the file control processor reads out the error log information from the logout file, and the error log information is recorded and displayed by a suitable recording/displaying device. However, from the user program side, there is no change in the subsequent processing between the case where the input/output processing was performed normally as a result of retry processing and the case where the input/output processing was performed normally from the beginning. Therefore, if the interrupt handling program performs the process of transferring and storing error log information to the logout file, it will require waiting time and preprocessing time before the program starts, and this will result in overhead. It is clear that this results in a significant increase in time and poses a major problem in terms of processing performance.
一方、ハードウエア上よりすればエラーログバ
ツフア320のメモリ容量が制限される場合に
は、リトライ回数や情報もまた制限されるという
不具合を生じる。即ち、第6図に2回目のリトラ
イ処理で初めて入出力動作が正常に行なわれた場
合でのJOBプロセツサ(JOBPとして表示)、IO
プロセツサ(IOPとして表示)、入出力装置
(I/Oとして表示)(場合によつてはIOステー
シヨン(I/OSTとして表示)三者の関係をエ
ラーログ情報などとともに示すが、IOプロセツ
サが過渡故障を検出する度にエラーログバツフア
320にリトライ情報を格納する必要があるが、
エラーログ情報がJOBプロセツサに報告されるの
が終了割込タイミングであり、したがつてエラー
ログバツフア320の最小必要容量は知れている
ことから、エラーログバツフア320の容量はい
きおい必要最小限にならざるを得ないというもの
である。エラーログバツフア320の容量を必要
最小限とする場合は逆にリトライ処理回数や情報
量が制限され、トラブルシユーテイング上問題で
あるというわけである。 On the other hand, if the memory capacity of the error log buffer 320 is limited from a hardware perspective, a problem arises in that the number of retries and information are also limited. In other words, Figure 6 shows the JOB processor (displayed as JOBP), IO
The relationship between the processor (displayed as IOP), input/output device (displayed as I/O) (and in some cases IO station (displayed as I/OST)) is shown along with error log information, etc., but if the IO processor has a transient failure It is necessary to store retry information in the error log buffer 320 every time it is detected.
Since the error log information is reported to the JOB processor at the end interrupt timing, and therefore the minimum required capacity of the error log buffer 320 is known, the capacity of the error log buffer 320 is kept at the minimum required. It has no choice but to become. If the capacity of the error log buffer 320 is set to the minimum required level, the number of retry processes and the amount of information will be limited, which poses a problem in terms of troubleshooting.
即ち、従来の入出力制御方法にあつては、JOB
プロセツサ側においては終了割込プログラムの処
理が複雑であり、ユーザプログラムからみた正常
時でのオーバヘツド時間がリトライ処理を行なつ
た場合に大幅に増加するという欠点がある。ま
た、IOプロセツサ側においてはエラーログバツ
フアの容量が制限されており、これがためにリト
ライ処理回数が制限されるなどの欠点があつたも
のである。 In other words, in the conventional input/output control method, JOB
On the processor side, processing of the termination interrupt program is complicated, and there is a drawback that the overhead time in normal operation from the user program's perspective increases significantly when retry processing is performed. Additionally, the capacity of the error log buffer on the IO processor side is limited, which has the disadvantage of limiting the number of retries.
よつて本発明の目的は、JOBプロセツサ側にお
いて、終了割込プログラムの簡単化と処理オーバ
ヘツド時間の減少化が図れ、また、IOプロセツ
サ側においてはリトライ処理回数が制限されるこ
とのない入出力制御方法を供するにある。 Therefore, an object of the present invention is to simplify the termination interrupt program and reduce processing overhead time on the JOB processor side, and to provide input/output control that does not limit the number of retry processing on the IO processor side. Here's how to do it.
この目的のため本発明は、従来方法における欠
点が終了割込時にエラーログ情報をも併せて報告
していたことに起因していると考え、エラーログ
バツフアの容量を大にしてエラーログ情報を終了
割込とは別の割込で、しかも終了割込タイミング
とは異なる独立のタイミングで報告させるように
したものである。 For this purpose, the present invention considers that the drawback of the conventional method is that error log information is also reported at the time of a termination interrupt, and the present invention increases the capacity of the error log buffer to provide error log information. This is an interrupt that is different from the end interrupt, and is reported at an independent timing that is different from the end interrupt timing.
以下、本発明を第8図から第13図により説明
する。 The present invention will be explained below with reference to FIGS. 8 to 13.
先ず第8図に示す本発明に係るマルチプロセツ
サシステムおよび第9図に示すタイムチヤートの
例により本発明の概要を説明する。なお、第8図
中におけるフアイル制御装置としてのフアイルコ
ントロールプロセツサ(FCP)403とログア
ウトフアイル405とについては既に述べたとこ
ろのものである。 First, an overview of the present invention will be explained with reference to an example of a multiprocessor system according to the present invention shown in FIG. 8 and a time chart shown in FIG. The file control processor (FCP) 403 and logout file 405 as file control devices in FIG. 8 have already been described.
既述した如くJOBプロセツサ402からの入出
力要求によりIOプロセツサ404は起動され、
起動されたIOプロセツサ404はまた起動情報
に従い入出力装置109を起動し入出力装置10
9との間でデータ入出力転送が行なわれるが、こ
のような状態下で何等かのエラーが発生した場合
を想定する。エラー発生時には入出力装置109
は入出力動作を打ち切つてIOプロセツサ404
に異常の発生を報告するが、これによりIOプロ
セツサ404は異常に関する情報であるところの
入出力装置109の状態やエラー要因などを既述
のエラーログバツフアに取り込むようになる。こ
こまでは従来の場合と同様であるが、異なる点は
エラーログバツフア内のエラーログ情報は第9図
に示す如く終了割込のタイミングではなく、バツ
フア320内が全てエラーログ情報によつて占め
られたときに初めてエラーログバツフア320よ
りログアウトエリア300に転送され、この後
JOBプロセツサ402に対してエラーログ割込が
かけられるようになつていることである。本発明
に係るエラーログバツフア320の容量は少なく
とも規定リトライ処理回数対応の必要最少限の容
量よりも大とされることから、これにより終了割
込タイミングとは異なるタイミングでエラーログ
割込がかけられることになるものである。即ち、
入出力動作が全く正常に、あるいは規定リトライ
処理回数以内でのリトライ処理によつて入出力動
作が正常に終了した場合にはその旨の終了割込
が、また、規定リトライ処理回数リトライ処理が
行なわれても、入出力動作が正常に終了しなかつ
た場合はその旨の終了割込がJOBプロセツサ40
2に対しかけられるが、これら終了割込にはエラ
ーログ情報の転送が伴われないものである。リト
ライ処理に伴い発生するエラーログ情報はエラー
ログバツフア320内部が全てそれによつて占め
られるまでは、エラーログバツフア320内に取
り込まれるものである。さて、JOBプロセツサ4
02は終了割込より入出力動作が異常として終了
したことを知つた場合には、その入出力装置10
9に再度入出力動作を試行したり、あるいは同一
ループバス406に接続されている他の入出力装
置との間で入出力動作を行なうなど、必要な措置
を採るところとなるが、この後の入出力処理にお
いてもなおリトライ処理が行なわれる場合は、や
がてあるリトライ処理でエラーログバツフア32
0の内部は全てエラーログ情報によつて占められ
ることになることは明らかである。本発明ではエ
ラーログバツフア320内部が全てエラーログ情
報によつて占められた時点でエラーログ情報をロ
グアウトエリア300に転送したうえ、エラーロ
グ割込をかけようというものである。したがつ
て、従来方法における終了割込と本発明に係るそ
れとではタイミングは同一であるもエラーログ情
報を伴うか否かによつてその内容が異なつたもの
となつている。本発明に係るそれではエラーログ
情報を伴わなく、エラーログ情報はエラーログ割
込に伴われているものである。このエラーログ割
込は本発明特有のものであり、このためにシステ
ムバス401には新たにそのための割込ラインが
設けられているが、これについては後述するとこ
ろである。 As mentioned above, the IO processor 404 is activated by an input/output request from the JOB processor 402.
The activated IO processor 404 also activates the input/output device 109 according to the activation information.
Data input/output transfer is performed between the PC 9 and the PC 9, but let us assume that some kind of error occurs under such conditions. When an error occurs, the input/output device 109
terminates the input/output operation and executes the IO processor 404.
The occurrence of an abnormality is reported to the IO processor 404, which causes the IO processor 404 to import information related to the abnormality, such as the status of the input/output device 109 and the cause of the error, into the previously described error log buffer. The process up to this point is the same as the conventional case, but the difference is that the error log information in the error log buffer is not based on the timing of the end interrupt as shown in FIG. 9, but everything in the buffer 320 is based on the error log information. When the area is occupied, it is transferred from the error log buffer 320 to the logout area 300, and after that,
An error log interrupt can now be sent to the JOB processor 402. Since the capacity of the error log buffer 320 according to the present invention is at least larger than the minimum capacity required to support the specified number of retries, this allows error log interrupts to occur at a timing different from the end interrupt timing. It is something that will be done. That is,
If the input/output operation completes normally, or if the input/output operation is completed normally by retry processing within the specified number of retry processing, an end interrupt is generated to that effect, and retry processing is performed for the specified number of retry processing. Even if the input/output operation is not completed normally, a termination interrupt to that effect is sent to the JOB processor 40.
2, but these termination interrupts are not accompanied by the transfer of error log information. Error log information generated due to retry processing is captured into the error log buffer 320 until the inside of the error log buffer 320 is completely occupied by the error log information. Now, JOB processor 4
02, when it is learned from the end interrupt that the input/output operation has ended as abnormal, the input/output device 10
Necessary measures will be taken, such as trying the input/output operation again in 9, or performing input/output operation with other input/output devices connected to the same loop bus 406. If retry processing is still performed during input/output processing, the error log buffer 32 will be
It is clear that the interior of 0 will be entirely occupied by error log information. In the present invention, when the inside of the error log buffer 320 is completely occupied by error log information, the error log information is transferred to the logout area 300 and an error log interrupt is generated. Therefore, although the timing of the termination interrupt in the conventional method and that according to the present invention is the same, the contents differ depending on whether or not error log information is included. According to the present invention, the error log information is not accompanied by the error log information, and the error log information is accompanied by the error log interrupt. This error log interrupt is unique to the present invention, and for this purpose, a new interrupt line for this purpose is provided on the system bus 401, which will be described later.
以上のようにしてエラーログ情報をログアウト
トエリア300に転送し、また、JOBプロセツサ
402に対してエラーログ割込がかける場合は、
エラーログ割込のタイミングは一般は終了割込の
それとは異なつたものとなり、しかもエラーログ
情報の1回当りの転送情報量は従来方法に比し大
となるも、転送回転とその転送に伴なうエラーロ
グ割込の回数は従来方法での終了割込に比し低減
されるところとなるものである。従来方法では
IOプロセツサ404からのエラーログ報告は終
了報告時に限られていたため、JOBプロセツサ4
02から見た1回の入出力動作の応答時間に対す
る制限により転送できるエラーログ情報の容量に
は上限があることは既に述べたところである。こ
のため、JOBプロセツサ402およびIOプロセ
ツサ404を含めたエラーログに要する時間は、
次式で与えられる。 When error log information is transferred to the logout area 300 as described above and an error log interrupt is issued to the JOB processor 402,
The timing of the error log interrupt is generally different from that of the end interrupt, and the amount of error log information transferred per time is larger than that of the conventional method, but due to the transfer rotation and its transfer. The number of error log interruptions is thus reduced compared to the termination interruption in the conventional method. In the conventional method
Since the error log report from the IO processor 404 was limited to the time of completion report, the JOB processor 4
As already mentioned, there is an upper limit to the amount of error log information that can be transferred due to the limit on the response time of one input/output operation from the point of view of 02. Therefore, the time required for error logging including JOB processor 402 and IO processor 404 is
It is given by the following formula.
エラーログ所要時間(T1)=(IOプロセツサ404のエラーログ処理時間(TIOP)
+IOプロセツサ404からログアウトエリア300へのエラーログ情報の転送時間(Ttraos)
+JOBプロセツサ402のエラーログ処理時間(TJOBP))×n ……(1)
ここで、TIOPとTJOBPは、エラーログ処理1
回につき一定時間がかかるものであり、Ttraosは
エラーログ情報の容量に比例して増加する処理時
間である。またnは、エラーログ報告を行なつた
回数である。Time required for error log (T1) = (Error log processing time of IO processor 404 (T IOP ) + Time for transferring error log information from IO processor 404 to logout area 300 (T traos ) + Error log processing time of JOB processor 402 (T JOBP ))×n ...(1) Here, T IOP and T JOBP are error log processing 1
It takes a certain amount of time for each time, and T traos is a processing time that increases in proportion to the capacity of error log information. Further, n is the number of times error log reporting has been performed.
これに対して、本発明に係るところのエラーロ
グ割込方式を用いれば、何回かのエラーログ情報
をエラーログバツフア320に蓄積しておいても
1回の入出力動作の応答時間は減少こそすれ増加
することはない。これはエラーログ要求割込を終
了割込と別タイミングに、しかもエラーログバツ
フア320が満杯になつたタイミングとしている
からである。ここで、従来方法での終了割込m回
分のエラーログ情報をエラーログバツフア320
に蓄積することとすれば、JOBプロセツサ402
に対しては従来方式に比して1/mにエラーログ
報告回数を減少させることができるわけである。
従来方式のn回分のエラーログ処理を本発明の方
式で行なうとその所要時間は次式で与えられる。 On the other hand, if the error log interrupt method according to the present invention is used, even if the error log information of several times is accumulated in the error log buffer 320, the response time for one input/output operation is reduced. There will be no increase, only a decrease. This is because the error log request interrupt is set at a different timing from the end interrupt, and moreover, at a timing when the error log buffer 320 becomes full. Here, error log information for m termination interrupts using the conventional method is stored in the error log buffer 320.
JOB processor 402
This means that the number of error log reports can be reduced by 1/m compared to the conventional method.
When the conventional method performs error log processing n times using the method of the present invention, the required time is given by the following equation.
エラーログ所要時間(T2)=(TIOP+Ttraos)×n+TJOBP×n/m ……(2)
T1とT2を比べると、JOBプロセツサ402に
おけるエラーログ処理時間は従来方式と本発明に
よる方式では1/mに減少できることがわかる。
一方、JOBプロセツサ402側においてはIOプ
ロセツサ404がリトライ処理を行なつている間
にログアウトフアイル405へのエアーログ情報
の転送処理を行ない得、JOBプロセツサ402に
おける処理オーバヘツド時間が短縮され全体とし
ての処理時間も短縮されるようになるものであ
る。 Error log processing time (T2) = (T IOP + T traos ) × n + T JOBP × n/m ... (2) Comparing T1 and T2, the error log processing time in the JOB processor 402 is different between the conventional method and the method according to the present invention. It can be seen that it can be reduced to 1/m.
On the other hand, on the JOB processor 402 side, air log information can be transferred to the logout file 405 while the IO processor 404 is performing retry processing, reducing the processing overhead time in the JOB processor 402 and improving overall processing. The time will also be shortened.
第10図a,bはそれぞれJOBプロセツサ40
2によつて実行される終了割込、エラーログ割込
に対するソフトウエアプログラムの処理の流れを
示したものである。終了割込、エラーログ割込は
独立の別のタイミングで、しかも区別された状態
でJOBプロセツサ402に報告されることから、
両割込に対するプログラムは別個とし得るわけで
ある。ここで第10図bにより改めてJOBプロセ
ツサでの処理時間が式(2)に関連して1/mに全体
的に減少され得る理由を説明すれば、図示のよう
にJOBプロセツサではエラーログ情報転送プログ
ラムおよびエラーログ情報出力プログラムの起動
処理が行なわれるが、これらはいずれもエラーロ
グ割込の回数に比例して増加し、エラーログ情報
量には依存しないことは明らかである。また、エ
ラーログ情報転送プログラムならびにエラーログ
情報出力プログラムが行なうところの、IOプロ
セツサとJOBプロセツサ間の転送処理についても
データ転送処理そのものは、JOBプロセツサが関
与しないDMA(Direct Memory Access)方式
で行なわれるのが通例であり、このためJOBプロ
セツサの処理時間は転送データ量には依存せず、
転送処理そのものの回数のみに比例する。以上か
ら、JOBプロセツサでの負荷は基本的に、エラー
ログ情報量にはよらずに、エラーログ要求割込の
回数に比例することがわかる。このJOBプロセツ
サにて行なうエラーログ処理の基本性質から、本
発明に係るところのエラーログ割込方式によりエ
ラーログ要求割込回数を1/mにすることが、と
りもなおさず直接JOBプロセツサでの処理時間低
減をもたらすことになるものである。別個とする
場合には割込処理においてエラーログ情報の有無
判定処理が不要となり、プログラムは図示の如く
に簡単化され得るものである。終了割込処理、エ
ラーログ処理を独立に行なうようにすれば、処理
性能の向上も期待し得るわけである。 Figures 10a and 10b are the JOB processor 40, respectively.
2 shows the flow of processing of the software program for the end interrupt and error log interrupt executed by No. 2. Since the end interrupt and the error log interrupt are reported to the JOB processor 402 at separate timings and in a differentiated state,
The programs for both interrupts can be separate. Now, to explain again the reason why the processing time in the JOB processor can be reduced to 1/m as a whole in relation to equation (2) with reference to FIG. The program and error log information output program are activated, but it is clear that both of these increase in proportion to the number of error log interruptions and do not depend on the amount of error log information. Furthermore, the data transfer process itself between the IO processor and the JOB processor, which is performed by the error log information transfer program and the error log information output program, is performed using the DMA (Direct Memory Access) method, which does not involve the JOB processor. Therefore, the processing time of the JOB processor does not depend on the amount of data transferred,
It is proportional only to the number of transfer processes themselves. From the above, it can be seen that the load on the JOB processor is basically proportional to the number of error log request interruptions, regardless of the amount of error log information. From the basic nature of error log processing performed by this JOB processor, it is recommended that the number of error log request interrupts be reduced to 1/m by the error log interrupt method according to the present invention. This will result in a reduction in processing time. In the case of separate processing, the processing for determining the presence or absence of error log information is not necessary in the interrupt processing, and the program can be simplified as shown in the figure. If the end interrupt processing and error log processing are performed independently, it is possible to expect improved processing performance.
本発明の概要は以上のようであるが、次に第1
1図、第12図により本発明に係るIOプロセツ
サおよびJOBプロセツサの構成について説明す
る。 The outline of the present invention is as above.
The configurations of the IO processor and JOB processor according to the present invention will be explained with reference to FIG. 1 and FIG. 12.
第11図はそのIOプロセツサの構成を示した
ものであり、構成上第2図に示すものと異なると
ころはエラーログ要求フリツプフロツプ90が新
たに設けられたことである。このフリツプフロツ
プ90のためにシステムバス401には新たにエ
ラーログ割込ライン45が設けられるようになつ
ている。 FIG. 11 shows the configuration of the IO processor, and the difference in configuration from that shown in FIG. 2 is that an error log request flip-flop 90 is newly provided. For this flip-flop 90, a new error log interrupt line 45 is provided on the system bus 401.
本図での演算処理回路350は入出力制御回路
360から終了フリツプフロツプ80を介して起
動された場合は、入出力動作が正常に終了し、し
かもループバス406やIOステーシヨン407
でリトライ処理が行なわれなかつた場合と入出力
動作が異常であつて、しかもその異常が永久故障
による場合には従来の場合と全く同様な処理を行
なう。しかしながら、それ以外の場合、JOBプロ
セツサ402にエラーログ情報が報告されるタイ
ミングは終了割込フリツプフロツプ60による終
了報告タイミングではなく、エラーログ要求フリ
ツプフロツプ90による別タイミングで行なわれ
る。具体的にはエラーログバツフア320がリト
ライ情報によつて全て占められたときである。 When the arithmetic processing circuit 350 in this figure is activated from the input/output control circuit 360 via the termination flip-flop 80, the input/output operation is completed normally, and the loop bus 406 and IO station 407
If retry processing is not performed, or if the input/output operation is abnormal and the abnormality is due to a permanent failure, the same processing as in the conventional case is performed. However, in other cases, the error log information is reported to the JOB processor 402 not at the end report timing by the end interrupt flip-flop 60, but at a different timing by the error log request flip-flop 90. Specifically, this occurs when the error log buffer 320 is completely occupied by retry information.
即ち、第13図によつてIOプロセツサ404
での処理内容を説明すれば、IOステーシヨン1
09より終了割込がIOプロセツサ404にある
と、先ず入出力動作の結果が正常か否かが判断さ
れる。正常である場合には終了割込状態語を正常
終了したうえJOBプロセツサ402に対し終了割
込をかけるものである。異常終了であつて、IO
プロセツサ404でのリトライ処理回数が規定値
をオーバする場合または永久故障にリトライ処理
不可の場合には、終了割込状態語を異常終了とし
たうえ正常終了の場合と同様にしてJOBプロセツ
サ402に対し終了割込がかけられるものであ
る。一方、リトライ処理回数が規定値に達しな
く、しかも過渡的故障によつて終了した場合には
リトライ処理が行なわれる。入出力装置でリトラ
イ処理有の場合には入出力装置でのリトライ情報
をエラーログバツフア320に転送した後、入出
力装置が再起動される。正常終了、異常終了の何
れの場合にもJOBプロセツサ402に対して終了
割込がかけられるわけであるが、以降はIOステ
ーシヨン407やIOプロセツサ404自体のリ
トライ処理の有無によつてはリトライ情報がエラ
ーログバツフア320に転送され、1つの入出力
動作は終了するものである。 That is, according to FIG.
If you explain the processing contents at IO station 1,
When the end interrupt is received by the IO processor 404 from 09 onwards, it is first determined whether the result of the input/output operation is normal. If it is normal, the termination interrupt status word is terminated normally and a termination interrupt is issued to the JOB processor 402. Abnormal termination and IO
If the number of retry processes in the processor 404 exceeds the specified value or if retry processing is not possible due to a permanent failure, the end interrupt status word is set to abnormal termination, and the process is sent to the JOB processor 402 in the same manner as in the case of normal termination. A termination interrupt is applied. On the other hand, if the number of times of retry processing does not reach the specified value and the process ends due to a transient failure, retry processing is performed. If retry processing is enabled in the input/output device, the retry information in the input/output device is transferred to the error log buffer 320, and then the input/output device is restarted. A termination interrupt is issued to the JOB processor 402 in both cases of normal termination and abnormal termination, but from then on, depending on whether or not the IO station 407 or IO processor 404 itself performs retry processing, retry information may be sent to the JOB processor 402. The data is transferred to the error log buffer 320, and one input/output operation is completed.
ここで注意すべきは、エラーログ情報のJOBプ
ロセツサ402への報告タイミングは、エラーロ
グバツフア320がリトライ情報によつて全て占
められたことを検出して行なわれるということで
ある。エラーログ制御回路330によつてその旨
が検出された場合にはエラーログ要求フリツプフ
ロツプ90がセツト状態におかれたものである。
フリツプフロツプ90がセツト情態におかれた旨
は優先順位判定回路340を介して演算処理回路
350が知るところとなるが、これによつて演算
処理回路350は直ちにゲート303を制御しエ
ラーログバツフア320をシステムバス制御回路
310に接続するわけである。この接続によつて
エラーログ情報はログアウトエリア300に転送
されるところとなる。 It should be noted here that the timing of reporting the error log information to the JOB processor 402 is done when it is detected that the error log buffer 320 is completely occupied by retry information. If this is detected by the error log control circuit 330, the error log request flip-flop 90 is placed in the set state.
The arithmetic processing circuit 350 is informed via the priority determination circuit 340 that the flip-flop 90 is in the set state. is connected to the system bus control circuit 310. This connection causes error log information to be transferred to the logout area 300.
即ち、エラーログ情報のログアウトエリア30
0への転送は終了割込とは独立して行なわれるも
のである。従来にあつてはエラーログ情報のログ
アウトエリア300への伝送処理後終了割込をか
ける必要があつたことは第7図より明らかであ
り、これがためにJOBプロセツサ402での処理
の複雑さやオーバヘツド時間の増大を回避し得
ず、しかも終了割込のタイミングは遅くなつてい
たが、これらの欠点は本発明によつて低減され得
るわけである。 That is, the logout area 30 for error log information.
The transfer to 0 is done independently of the end interrupt. It is clear from FIG. 7 that in the past, it was necessary to issue a termination interrupt after transmitting the error log information to the logout area 300, and this increased the complexity and overhead time of the processing in the JOB processor 402. However, these drawbacks can be reduced by the present invention.
最後に本発明に係るJOBプロセツサを第12図
により説明する。第12図はその構成を示すが、
システムバス401に新たにエラーログ割込ライ
ン45が付加されたことに伴いエラーログ要求受
付フリツプフロツプ50が新たに設けられるよう
になつている。フリツプフロツプ50の果す機能
は終了割込受付フリツプフロツプ40に同様であ
る。しかし、異なる優先順位をもつ割込として優
先順位判定回路240で判定されることから、割
込受付フアームウエア260を経た後に制御が移
行される割込処理プログラムは終了割込プログラ
ムとエラーログ割込プログラムとに分離し得るも
のである。 Finally, the JOB processor according to the present invention will be explained with reference to FIG. Figure 12 shows its configuration,
With the addition of a new error log interrupt line 45 to the system bus 401, an error log request receiving flip-flop 50 is newly provided. The function performed by flip-flop 50 is similar to that of flip-flop 40 for accepting termination interrupts. However, since the priority determination circuit 240 determines that the interrupts have different priorities, the interrupt processing program to which control is transferred after passing through the interrupt reception firmware 260 is the termination interrupt program and the error log interrupt. It can be separated into a program.
以上説明したように本発明は、容量大とされた
エラーログバツフアがリトライ情報によつて全て
占められたときJOBプロセツサにはエラーログ割
込をかけ、また主記憶装置上のログアウトエリア
にはエラーログ情報をエラーログバツフアより転
送するようにしたものである。したがつて本発明
による場合は、エラーログ割込のタイミングは終
了割込のそれとは異なるようにされるから、割込
処理プログラムが簡単化され、JOBプロセツサで
の処理オーバーヘツド時間が減少されるなど、
種々の効果が得られる。 As explained above, the present invention applies an error log interrupt to the JOB processor when the large-capacity error log buffer is completely occupied by retry information, and also sends an error log interrupt to the logout area on the main memory. Error log information is transferred from an error log buffer. Therefore, according to the present invention, the timing of the error log interrupt is made different from that of the end interrupt, which simplifies the interrupt processing program and reduces processing overhead time in the JOB processor. Such,
Various effects can be obtained.
第1図は、従来技術に係るマルチプロセツサシ
ステムの一例でのシステム構成を示す図、第2
図、第3図は、その構成におけるJOBプロセツ
サ、IOプロセツサの一例での構成をそれぞれ示
す図、第4図a,bは、同じくその構成における
主記憶装置上のプロセツサ間通信用エリアに格納
される通信用テーブルの構成を示す図、第5図
は、JOBプロセツサで実行される割込処理プログ
ラムの処理の流れを示す図、第6図は、JOBプロ
セツサ、IOプロセツサ、入出力装置三者の間で
行なわれる処理の流れを示す図、第7図は、IO
プロセツサで行なわれる処理の概要を示す図、第
8図は、本発明に係るマルチプロセツサシステム
の一例でのシステム構成を示す図、第9図は、
JOBプロセツサ、IOプロセツサ、入出力装置三
者の間で行なわれる本発明に係る処理の流れを示
す図、第10図a,bは、JOBプロセツサで実行
される終了割込、エラーログ割込に対するプログ
ラム処理の流れを示す図、第11図、第12図
は、第8図におけるIOプロセツサ、JOBプロセ
ツサの一例での構成を示す図、第13図は、本発
明に係るIOプロセツサで行なわれる処理の概要
を示す図である。
400……主記憶装置、300……ログアウト
エリア、402……JOBプロセツサ、403……
フアイルコントロールプロセツサ、404……
IOプロセツサ、405……ログアウトフアイ
ル、109……入出力装置、45……エラーログ
割込ライン、90……エラーログ要求フリツプフ
ロツプ、50……エラーログ要求受付フリツプフ
ロツプ、320……エラーログバツフア。
FIG. 1 is a diagram showing the system configuration of an example of a multiprocessor system according to the prior art, and FIG.
Figure 3 shows an example of the configuration of the JOB processor and IO processor in this configuration, and Figures 4a and 4b respectively show the configuration of the JOB processor and IO processor stored in the inter-processor communication area on the main memory in the same configuration. 5 is a diagram showing the processing flow of the interrupt processing program executed by the JOB processor, and FIG. 6 is a diagram showing the structure of the communication table for the JOB processor, IO processor, and Figure 7 shows the flow of processing performed between IO
FIG. 8 is a diagram showing an overview of the processing performed by the processor, and FIG. 9 is a diagram showing the system configuration of an example of the multiprocessor system according to the present invention.
Figures 10a and 10b, which are diagrams showing the flow of processing according to the present invention performed between the JOB processor, IO processor, and input/output device, show responses to termination interrupts and error log interrupts executed by the JOB processor. Figures 11 and 12 are diagrams showing the flow of program processing, and Figures 11 and 12 are diagrams showing the configuration of an example of the IO processor and JOB processor in Figure 8. Figure 13 is the process performed by the IO processor according to the present invention. FIG. 400...Main storage device, 300...Logout area, 402...JOB processor, 403...
File control processor, 404...
IO processor, 405...Logout file, 109...I/O device, 45...Error log interrupt line, 90...Error log request flip-flop, 50...Error log request reception flip-flop, 320...Error log buffer.
Claims (1)
る入出力データの転送制御が入出力制御用プロセ
ツサによつて主として行なわれ、入出力制御用プ
ロセツサと入出力装置との間での入出力データ転
送の際に過渡的なエラーあるいは故障が生じた場
合、該エラーあるいは故障を回復すべく入出力制
御用プロセツサが入出力データの転送を規定回数
内で再試行するようにしてなるマルチプロセツサ
システムにおいて、入出力データ転送の再試行が
行なわれる度に入出力制御用プロセツサ内に順次
蓄積される再試行情報としてのエラーログ情報
は、該情報の量が規定再試行回数対応のエラーロ
グ情報の量よりも大とされる一定値に達する度に
主プロセツサに対するエラーログ割込と同時に主
記憶装置上の特定エリアに一時的に転送記憶さ
れ、上記エラーログ割込は入出力データの転送終
結によつて入出力制御用プロセツサより主プロセ
ツサに対して行なわれる終了割込とを異なつたタ
イミングで行なわれるようにしたことを特徴とす
る入出力制御方法。1 The input/output data transfer control between the main processor and the input/output device is mainly performed by the input/output control processor, and the input/output data transfer between the input/output control processor and the input/output device is In a multiprocessor system, when a transient error or failure occurs during processing, an input/output control processor retries input/output data transfer within a specified number of times in order to recover from the error or failure. , error log information as retry information that is sequentially accumulated in the input/output control processor each time an input/output data transfer is retried, the amount of error log information corresponds to the specified number of retries. Each time a certain value, which is larger than An input/output control method characterized in that an input/output control processor issues a termination interrupt to a main processor at a different timing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56193691A JPS5896326A (en) | 1981-12-03 | 1981-12-03 | Input and output control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56193691A JPS5896326A (en) | 1981-12-03 | 1981-12-03 | Input and output control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5896326A JPS5896326A (en) | 1983-06-08 |
JPS6230668B2 true JPS6230668B2 (en) | 1987-07-03 |
Family
ID=16312171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56193691A Granted JPS5896326A (en) | 1981-12-03 | 1981-12-03 | Input and output control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5896326A (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6003350B2 (en) | 2012-07-30 | 2016-10-05 | 富士通株式会社 | Monitoring device, information processing device, and monitoring method |
-
1981
- 1981-12-03 JP JP56193691A patent/JPS5896326A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS5896326A (en) | 1983-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4888691A (en) | Method for disk I/O transfer | |
US3688274A (en) | Command retry control by peripheral devices | |
JP2637788B2 (en) | Disk cache control method and information processing system | |
JPH07117903B2 (en) | Disaster recovery method | |
JPS6230668B2 (en) | ||
JPS6146543A (en) | Fault processing system of transfer device | |
JPS5917653A (en) | Method for transferring data of magnetic disc controlling device | |
JP3262130B2 (en) | Information processing device | |
JPS6259816B2 (en) | ||
JPS6226053B2 (en) | ||
JPS6215897B2 (en) | ||
JPS6217877Y2 (en) | ||
JPS6153744B2 (en) | ||
JP4499909B2 (en) | Multiplexed storage controller | |
JPS58223860A (en) | Magnetic disk controller | |
JPH0375939A (en) | Information processing system | |
JPH0820934B2 (en) | Disk cache control method | |
JPS6143739B2 (en) | ||
JPS6130296B2 (en) | ||
JPH0464092B2 (en) | ||
JPS6156537B2 (en) | ||
JPH06266630A (en) | Input/output controller with trace function | |
JPS648379B2 (en) | ||
JPS58114152A (en) | Back up device for magnetic disc | |
JPH0411890B2 (en) |