JP2003140925A - Task monitoring system and its method - Google Patents
Task monitoring system and its methodInfo
- Publication number
- JP2003140925A JP2003140925A JP2001339400A JP2001339400A JP2003140925A JP 2003140925 A JP2003140925 A JP 2003140925A JP 2001339400 A JP2001339400 A JP 2001339400A JP 2001339400 A JP2001339400 A JP 2001339400A JP 2003140925 A JP2003140925 A JP 2003140925A
- Authority
- JP
- Japan
- Prior art keywords
- task
- monitoring
- information
- tasks
- operated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、1又は複数のサー
バー上で複数のタスクが運用されるコンピュータシステ
ムにおいて、タスクの異常終了、ネットワークトラブル
等の監視や異常通知を自動的に行う際に用いて好適なタ
スク監視システム及び方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is used in a computer system in which a plurality of tasks are operated on one or a plurality of servers when monitoring abnormalities such as abnormal termination of tasks and network troubles and automatically performing abnormality notification. And a preferred task monitoring system and method.
【0002】[0002]
【従来の技術】複数のタスクが運用されるコンピュータ
システムにおけるタスクの異常終了等を監視するための
従来の技術の一例が特開2000−222248号公報
「ジョブ異常終了通知システムとジョブ異常終了情報通
知方法とその方法を記録した記録媒体」に記載されてい
る。この公報に記載されているシステムは、複数のタス
ク(あるいはジョブ)が運用されるコンピュータシステ
ムにおいて、タスク毎の運用中の障害発生に対処する一
連の処理情報をデータベース化しておくことによって、
各ジョブが異常終了した際の担当者への連絡や、対策の
検索を自動化するものである。2. Description of the Related Art One example of a conventional technique for monitoring abnormal termination of a task in a computer system in which a plurality of tasks are operated is Japanese Patent Laid-Open No. 2000-222248 "Job Abnormal Termination Notification System and Job Abnormal Termination Information Notification". Method and recording medium recording the method ”. In the system described in this publication, in a computer system in which a plurality of tasks (or jobs) are operated, a series of processing information for coping with failure occurrence during operation of each task is stored in a database,
It automates the contact to the person in charge when each job ends abnormally and the search for countermeasures.
【0003】[0003]
【発明が解決しようとする課題】上記公報に記載された
従来の技術では、次のような課題が存在する。タスク
の異常終了を表示する端末を増やすには、通知指示に関
する処理を行う通知指示処理手段の処理内容すなわちプ
ログラムを変更しなければならず、一般の作業者が容易
に表示端末を増設することができない。ネットワーク
で接続された複数台のサーバー上でタスクが動作してい
る場合、各タスクの異常終了は通知できるが、ネットワ
ークケーブルの断線等の通信異常を通知する事が出来な
い。異常通知処理部自体の異常終了を検知する手段を
持たない。異常終了処理部をタスク(ジョブ)毎に組
み込まなければ、そのタスクに異常終了が発生しても、
通知されない。The conventional techniques described in the above publications have the following problems. In order to increase the number of terminals displaying the abnormal termination of the task, the processing content of the notification instruction processing means, that is, the program, which performs the processing related to the notification instruction, must be changed, and a general worker can easily add the number of display terminals. Can not. When a task is running on multiple servers connected by a network, abnormal termination of each task can be notified, but communication abnormality such as disconnection of network cable cannot be notified. It has no means for detecting abnormal termination of the abnormality notification processing unit itself. If the abnormal termination processing unit is not incorporated for each task (job), even if the abnormal termination occurs for that task,
Not notified.
【0004】また、異常終了が発生した場合には、その
復旧を行う場合や、対策をとる場合において、過去に発
生した同様の事例に関しての情報が有用となることが考
えられる。しかしながら、従来の技術においては、この
ようなタスクの異常終了等の履歴情報を利用するための
構成が設けられていなかったため、例えば、異常終了発
生の時刻や回数といった情報を効率良く統計的に管理す
ることができなかった。In addition, when an abnormal termination occurs, it is conceivable that information about similar cases that occurred in the past will be useful when recovering the abnormality or taking measures. However, in the conventional technology, since the configuration for utilizing the history information such as the abnormal end of the task is not provided, for example, the information such as the time and the number of the abnormal end occurrence can be efficiently and statistically managed. I couldn't.
【0005】そこで、本発明は、上記従来の技術におけ
る課題の解決を図ることを目的とするものであって、よ
り具体的には、タスクの異常に加え、ネットワークの通
信異常についても検知することができるタスク監視シス
テム及び方法を提供することを目的とする。本発明はま
た、異常検知のための手段自体に異常が発生した場合に
も、それを検知して通知できるようにするタスク監視シ
ステム及び方法を提供することを目的とする。本発明
は、また、タスクの監視情報の履歴をデータベース化す
ることによって、過去の情報を容易に利用することがで
きるようにするタスク監視システム及び方法を提供する
ことを目的とする。本発明はまた、異常終了を通知する
ための手段をタスク毎に組み込むことを不要とすること
で容易に異常終了の検知内容や表示端末の変更あるいは
増設をすることを可能とするタスク監視システム及び方
法を提供することを目的とする。Therefore, the present invention is intended to solve the above-mentioned problems in the prior art, and more specifically, to detect not only a task abnormality but also a network communication abnormality. It is an object of the present invention to provide a task monitoring system and method capable of performing the task. It is another object of the present invention to provide a task monitoring system and method that can detect and notify when an abnormality occurs in a means for detecting an abnormality. Another object of the present invention is to provide a task monitoring system and method that makes it possible to easily use past information by making a history of task monitoring information into a database. The present invention also provides a task monitoring system that makes it possible to easily change or add the abnormal termination detection content or display terminal by eliminating the need for incorporating a task for notifying abnormal termination for each task. The purpose is to provide a method.
【0006】[0006]
【課題を解決するための手段】上記課題を解決するた
め、請求項1記載の発明は、1若しくは複数のクライア
ントに又は相互に、ネットワークを介して接続された1
又は複数のサーバーによって複数のタスクが運用される
コンピュータシステムにおいて、1のサーバー上で運用
されるタスクであって、当該サーバーで運用される他の
タスクの運用状態を所定の時間間隔で検知し、その検知
結果に基づいて所定の信号を出力するタスク監視手段
と、前記タスク監視手段から出力された信号に基づい
て、当該タスク監視手段の動作状態を示す情報と、当該
タスク監視手段によって検知された前記他のタスクの状
態を示す情報とを、前記クライアントが取得可能な形態
で、時刻に係る情報とともに複数記憶する記憶手段とを
備えることを特徴とする。In order to solve the above-mentioned problems, the invention according to claim 1 is connected to one or a plurality of clients or to each other via a network.
Or, in a computer system in which a plurality of tasks are operated by a plurality of servers, it is a task that is operated on one server, and the operation status of other tasks operated on the server is detected at predetermined time intervals, Based on the detection result, a task monitoring unit that outputs a predetermined signal, and based on the signal output from the task monitoring unit, information indicating the operating state of the task monitoring unit and the task monitoring unit And a storage unit that stores a plurality of pieces of information indicating the states of the other tasks together with the information about the time in a form that can be acquired by the client.
【0007】請求項2記載の発明は、前記タスク監視手
段が1又は複数のサーバー上で複数運用されていて、複
数の前記タスク監視手段から出力された信号を受信し
て、所定の時間間隔で前記記憶手段に記憶させるシステ
ム監視手段をさらに備えることを特徴とする。According to a second aspect of the present invention, a plurality of the task monitoring means are operated on one or a plurality of servers, the signals output from the plurality of task monitoring means are received, and the task monitoring means are received at predetermined time intervals. It is characterized by further comprising system monitoring means for storing in the storage means.
【0008】請求項3記載の発明は、前記タスク監視手
段が検知対象とするタスクが、所定の定義ファイルに記
述された情報に基づいて決定されることを特徴とする。
請求項4記載の発明は、前記記憶手段から前記クライア
ントに対して供給される情報が、前記所定の定義ファイ
ルの記述情報に対応して記述された第2の定義ファイル
に記述された情報に基づいて決定されることを特徴とす
る。請求項5記載の発明は、前記システム監視手段が受
信対象とするタスク監視手段が、所定の第3の定義ファ
イルに記述された情報に基づいて決定されることを特徴
とする。請求項6記載の発明は、前記タスク監視手段の
出力信号が、タスクの動作状態が正常である旨、タスク
の動作状態が異常である旨、及びタスクの動作状態が異
常から正常に復旧した状態である旨を選択的に示すもの
であることを特徴とする。The invention according to claim 3 is characterized in that the task to be detected by the task monitoring means is determined based on information described in a predetermined definition file.
According to a fourth aspect of the present invention, the information supplied from the storage means to the client is based on the information described in the second definition file described in correspondence with the description information of the predetermined definition file. It is characterized by being determined by. The invention according to claim 5 is characterized in that the task monitoring means to be received by the system monitoring means is determined based on information described in a predetermined third definition file. According to a sixth aspect of the present invention, the output signal of the task monitoring means indicates that the task operating state is normal, that the task operating state is abnormal, and that the task operating state is normally restored from the abnormal state. Is selectively shown.
【0009】請求項7記載の発明は、1若しくは複数の
クライアントに又は相互に、ネットワークを介して接続
された1又は複数のサーバーによって複数のタスクが運
用されるコンピュータシステムにおいて、タスクの運用
状態を監視するための方法であって、1のサーバー上で
運用されるタスクによって、当該サーバーで運用される
他のタスクの運用状態を所定の時間間隔で検知し、その
検知結果に基づいて所定の信号を出力し、前記出力され
た信号に基づいて、当該タスクの監視状態を示す情報
と、当該検知された前記他のタスクの運用状態を示す情
報とを、前記クライアントが取得可能な形態で、時刻に
係る情報とともに複数記憶することを特徴とする。According to a seventh aspect of the present invention, in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network, the operation status of the tasks is A method for monitoring, in which a task operated on one server detects the operation status of another task operated on that server at a predetermined time interval, and a predetermined signal based on the detection result. Based on the output signal, the information indicating the monitoring status of the task and the information indicating the operating status of the detected other task, in a form in which the client can obtain the time. A plurality of pieces of information are stored together with the information related to.
【0010】請求項8記載の発明は、1若しくは複数の
クライアントに又は相互に、ネットワークを介して接続
された1又は複数のサーバーによって複数のタスクが運
用されるコンピュータシステムにおいて、1又は複数の
サーバーにおいて実行されるプログラムであって、1の
サーバー上で運用されるタスクによって、当該サーバー
で運用される他のタスクの運用状態を所定の時間間隔で
検知し、その検知結果に基づいて所定の信号を出力する
過程と、前記出力された信号に基づいて、当該タスクの
監視状態を示す情報と、当該検知された前記他のタスク
の運用状態を示す情報とを、前記クライアントが取得可
能な形態で、時刻に係る情報とともに複数記憶する過程
とを記述したことを特徴とするタスク監視プログラムで
ある。請求項9記載の発明は、請求項8記載のプログラ
ムを記録したコンピュータ読み取り可能な記録媒体であ
る。According to an eighth aspect of the present invention, in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network, one or a plurality of servers are provided. Is a program that is executed on a server, the task operating on one server detects the operating status of other tasks operating on that server at a predetermined time interval, and a predetermined signal is generated based on the detection result. Based on the output signal, the information indicating the monitoring status of the task, and the information indicating the operating status of the detected other task in a form that can be acquired by the client. , A process of storing a plurality of pieces of information related to time, and a task monitoring program. The invention according to claim 9 is a computer-readable recording medium in which the program according to claim 8 is recorded.
【0011】請求項10記載の発明は、1若しくは複数
のクライアントに又は相互に、ネットワークを介して接
続された1又は複数のサーバーによって複数のタスクが
運用されるコンピュータシステムにおける1のサーバー
であって、当該1のサーバー上で運用されるタスクであ
って、当該サーバーで運用される他のタスクの運用状態
を所定の時間間隔で検知し、その検知結果に基づいて所
定の信号を出力するタスク監視手段と、前記タスク監視
手段から出力された信号に基づいて、当該タスク監視手
段の動作状態を示す情報と、当該タスク監視手段によっ
て検知された前記他のタスクの状態を示す情報とを、前
記クライアントが取得可能な形態で、時刻に係る情報と
ともに複数記憶させる記憶手段とを備えることを特徴と
する。According to a tenth aspect of the present invention, there is provided one server in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network. , Task monitoring that is a task that is operated on the server of 1 and detects the operating status of other tasks that are operated on the server at a predetermined time interval, and outputs a predetermined signal based on the detection result. Means, and information indicating the operating state of the task monitoring means and information indicating the state of the other task detected by the task monitoring means based on the signal output from the task monitoring means. And a storage unit for storing a plurality of pieces of information together with time-related information.
【0012】請求項11記載の発明は、1又は複数のク
ライアントにネットワークを介して接続された1又は複
数のサーバーによって複数のタスクが運用されるコンピ
ュータシステムにおいて、その1又は複数のクライアン
トにおいて実行されるプログラムであって、1又は複数
のサーバーで運用される1又は複数のタスクの運用状態
を所定の監視用タスクによって所定の時間間隔で検知し
た結果をその監視用タスクの動作状態を示す時刻情報と
ともに記憶した記憶手段にアクセスし、その監視用タス
クの動作状態を示す時刻情報を取得する過程と、取得し
た監視用タスクの動作状態を示す時刻情報と、現在の時
刻情報とに基づいて、監視用タスクの動作状態の異常の
有無を判断する過程とを記述したことを特徴とするタス
ク監視プログラムである。請求項12記載の発明は、請
求項11記載のプログラムを記録したコンピュータ読み
取り可能な記録媒体である。The invention according to claim 11 is executed in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients via a network. Is a program that is a program that operates on one or more servers, and the result of detecting the operating status of one or more tasks by a predetermined monitoring task at a predetermined time interval indicates the operating status of the monitoring task. A process of accessing the storage means stored together with the monitoring task and acquiring time information indicating the operating state of the monitoring task, and monitoring based on the acquired time information indicating the operating state of the monitoring task and the current time information Task monitoring program characterized by describing the process of determining whether there is an abnormality in the operating state of a task for business A. The invention described in claim 12 is a computer-readable recording medium in which the program according to claim 11 is recorded.
【0013】[0013]
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は、本発明の一実施形
態のシステム構成を説明するためのブロック図である。
図1に示すコンピュータシステムは、ネットワーク2を
介して相互に接続された2台のサーバー1(1)、サー
バー2(4)と、クライアントパーソナルコンピュータ
(クライアントPC、以下、クライアント)3とを備え
て構成されている。なお、本発明においては、図1に例
示する構成のほか、サーバーを1台あるいは3台以上と
することができ、また、クライアントを2台以上とする
ことができる。また、ネットワーク2は、有線、無線を
問わず構成することができ、さらにローカルエリアネッ
トワークや、専用網、公衆網、あるいはインターネット
を、単独あるいは組み合わせて用いることができる。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram for explaining the system configuration of an embodiment of the present invention.
The computer system shown in FIG. 1 includes two servers 1 (1) and 2 (4), which are connected to each other via a network 2, and a client personal computer (client PC, hereinafter, client) 3. It is configured. In the present invention, in addition to the configuration illustrated in FIG. 1, the number of servers may be one or three or more, and the number of clients may be two or more. Further, the network 2 can be configured as wired or wireless, and a local area network, a dedicated network, a public network, or the Internet can be used alone or in combination.
【0014】図1に示す実施の形態は、例えば、工場等
における設備の稼働管理システムを構成するものであ
る。この場合、サーバー1(1)は、通信回線6、マス
タシーケンサ7、および通信回線8を介して、複数の設
備A(9A)、設備B(9B)、設備C(9C)を制御
するためのシーケンサ91A、91B、91Cに接続さ
れている。そして、マスタシーケンサ7を介して各種制
御信号を送受信することで、各設備の状態や、加工数量
等の情報が収集、管理される。The embodiment shown in FIG. 1 constitutes, for example, an equipment operation management system in a factory or the like. In this case, the server 1 (1) controls the plurality of equipments A (9A), equipment B (9B), equipment C (9C) via the communication line 6, the master sequencer 7, and the communication line 8. It is connected to the sequencers 91A, 91B, 91C. Then, by transmitting and receiving various control signals via the master sequencer 7, information such as the state of each facility and the processing quantity is collected and managed.
【0015】サーバー1(1)は、コンピュータとその
周辺装置から構成されるものであって、所定のOS(オ
ペレーティングシステム)の管理下で、各設備A〜Cの
管理を行うためのタスクA(11A)、タスクB(11
B)、タスクC(11C)を実行する。タスクA(11
A)、タスクB(11B)、タスクC(11C)には、
マスタシーケンサ7を介してシーケンサ91A、91
B、91Cと制御信号を送受信するための所定の手順等
が含まれている。The server 1 (1) is composed of a computer and its peripheral devices, and under the control of a predetermined OS (operating system), a task A (for managing each of the facilities A to C). 11A), task B (11
B), task C (11C) is executed. Task A (11
A), task B (11B), task C (11C),
Via the master sequencer 7, sequencers 91A, 91
A predetermined procedure for transmitting / receiving the control signal to / from B and 91C is included.
【0016】タスク監視タスク1(12)は、タスクA
(11A)、タスクB(11B)、タスクC(11C)
の動作状態を所定の時間間隔で監視するタスクであり、
タスクA〜Cと同様にサーバー1(1)において実行さ
れるプログラムの実行単位である。タスク監視タスク1
(12)は、サーバー1で実行されているOSに問い合
わせることで、各タスクの動作状態を検知する。タスク
監視タスク1(12)は、検知した各タスクの状態に基
づいて、正常信号、異常信号、および復旧信号の3種類
の信号を選択的に生成し、図示していないタスク監視タ
スク(12)自身の動作信号とともに、システム監視タ
スク1(13)に対して送信する。The task monitoring task 1 (12) is task A
(11A), task B (11B), task C (11C)
Is a task to monitor the operating state of at a predetermined time interval,
Similar to the tasks A to C, it is an execution unit of a program executed in the server 1 (1). Task monitoring task 1
In (12), the operating state of each task is detected by making an inquiry to the OS running on the server 1. The task monitoring task 1 (12) selectively generates three types of signals of a normal signal, an abnormal signal, and a recovery signal based on the detected state of each task, and the task monitoring task (12) not shown. It is transmitted to the system monitoring task 1 (13) together with its own operation signal.
【0017】正常および異常信号は、それぞれ、タスク
が正常に動作していること、および、タスクの動作が異
常(異常終了した状態)であること(例えばOSからの
呼び出しに応答せず、OSが正常に管理できない状態に
あること)を示すものである。そして、復旧信号は、異
常状態にあったタスクの動作が、正常状態に復帰したこ
とを初めて検知したときに、生成される信号である。例
えば、タスク監視タスク1(12)で検知された異常状
態が、後述する所定の手順によってクライアント3上で
実行されているタスク監視アプリケーション31によっ
て取得され、クライアント3の操作者(ユーザー5)が
画面表示32によってそれを確認し、対応するタスクを
再起動すること等によって復旧がなされる。The normal and abnormal signals indicate that the task is operating normally and that the operation of the task is abnormal (abnormally terminated) (for example, the OS does not respond to a call from the OS and the OS does not respond). It means that it cannot be managed normally). The recovery signal is a signal generated when it is first detected that the operation of the task in the abnormal state has returned to the normal state. For example, the abnormal state detected by the task monitoring task 1 (12) is acquired by the task monitoring application 31 executed on the client 3 by a predetermined procedure described later, and the operator (user 5) of the client 3 displays a screen. Recovery is performed by confirming it by the display 32 and restarting the corresponding task.
【0018】システム監視タスク1(13)は、サーバ
ー1(1)内で実行されるタスク監視タスク1(12)
や、サーバー2(4)内で実行されるタスク監視タスク
2(42)から送信された信号を受信し、その信号に基
づいてアラームデータを作成し、データベース(DB)
14に記録するためのタスクである。この場合、システ
ム監視タスク1(13)は、タスク監視タスク1(1
2)と同様にサーバー1(1)において実行されるプロ
グラムの実行単位である。ここで、データベース14に
記録されるアラームデータは、タスク監視タスク1(1
2)によって監視されるタスクA(11A)〜C(11
C)と、タスク監視タスク2(42)によって監視され
るタスクD(41D)〜E(41E)とに関する正常、
異常、復旧の動作状態を示す情報と、タスク監視タスク
1(12)およびタスク監視タスク2(42)の正常、
異常、復旧の動作状態に関する情報と、システム監視タ
スク1(13)の動作/復旧の情報とから構成されてい
る。The system monitoring task 1 (13) is a task monitoring task 1 (12) executed in the server 1 (1).
Alternatively, a signal sent from the task monitoring task 2 (42) executed in the server 2 (4) is received, alarm data is created based on the signal, and a database (DB) is created.
14 is a task for recording. In this case, the system monitoring task 1 (13) is the task monitoring task 1 (1
Similar to 2), it is an execution unit of a program executed in the server 1 (1). Here, the alarm data recorded in the database 14 is the task monitoring task 1 (1
2) tasks A (11A) to C (11
C) and the tasks D (41D) to E (41E) monitored by the task monitoring task 2 (42) are normal,
Information indicating the operating status of abnormality and recovery, normality of task monitoring task 1 (12) and task monitoring task 2 (42),
It is composed of information on the operating state of abnormality and recovery and information on the operation / recovery of the system monitoring task 1 (13).
【0019】なお、タスク監視タスク2(42)ならび
にタスクD(41D)〜E(41E)は、タスク監視タ
スク1(12)ならびにタスクA(11A)〜C(11
C)と同様に構成されている。Task monitoring task 2 (42) and tasks D (41D) to E (41E) are task monitoring task 1 (12) and tasks A (11A) to C (11).
It is constructed similarly to C).
【0020】次に、図2〜図7を参照して、図1のタス
ク監視タスク1(12)(あるいはタスク監視タスク2
(42))、システム監視タスク1(13)、およびタ
スク監視アプリケーション31の構成および機能につい
て詳細に説明する。Next, referring to FIGS. 2 to 7, the task monitoring task 1 (12) (or the task monitoring task 2 in FIG. 1) will be described.
(42)), the system monitoring task 1 (13), and the configuration and function of the task monitoring application 31 will be described in detail.
【0021】図2は、図1のタスク監視タスク1(1
2)またはタスク監視タスク2(42)の機能を説明す
るためのフローチャートである。また、図3は、図2に
示す処理において用いられるファイルおよびテーブルの
構成例を示す図である。タスク監視タスク1または2は
(以下、この説明において単にタスク監視タスクとす
る)、OSによって起動されると、図3(a)に示すよ
うなタスク監視タスク用定義ファイルを読み込む(図2
のステップ121)。次に、読み込んだタスク監視タス
ク用定義ファイルに記述されている情報に基づいて図3
(b)に示すようなタスク状態テーブルを作成する(図
2のステップ122)。FIG. 2 shows the task monitoring task 1 (1
2) is a flowchart for explaining the function of task monitoring task 2 (42). Further, FIG. 3 is a diagram showing a configuration example of files and tables used in the processing shown in FIG. When the task monitoring task 1 or 2 (hereinafter, simply referred to as a task monitoring task in this description) is started by the OS, a task monitoring task definition file as shown in FIG. 3A is read (see FIG. 2).
Step 121). Next, based on the information described in the read task monitoring task definition file, FIG.
A task status table as shown in (b) is created (step 122 in FIG. 2).
【0022】図3(a)に示すように、タスク監視タス
ク用定義ファイル1201は、監視対象タスクを列挙し
たものであって、この例では、“kanshi_settime”と
“analog_calc” の2つのタスク名が記載されている。
このタスク監視タスク用定義ファイル1201にタスク
名を追加したり、削除したりすることで、検知対象のタ
スクを変更することができる。一方、図3(b)に示す
ようにタスク状態テーブル1202は、タスク名に対応
付けて現在のタスクの状態を記憶するテーブルであり、
状態は動作中・停止中・不定の三種類であり、不定は起
動直後で状態未収集の場合のみ使用するようになってい
る。As shown in FIG. 3A, the task monitoring task definition file 1201 is a list of tasks to be monitored. In this example, two task names "kanshi_settime" and "analog_calc" are used. Have been described.
The task to be detected can be changed by adding or deleting the task name in the task monitoring task definition file 1201. On the other hand, as shown in FIG. 3B, the task status table 1202 is a table that stores the current task status in association with the task name.
There are three types of status: operating, stopped, and undefined. Undefined is used only when the status has not been collected immediately after startup.
【0023】図2のステップ122においてタスク状態
テーブルが作成されると、次に、60秒間の待機状態と
なる(ステップ123)。ここでの待機は、タスクの状
態を検知する周期を設定するものであり、検知処理によ
るOS処理の負荷増加の大きさと、必要な応答性を比
較、考慮して設定する。次に、タスク監視タスクは、タ
スク監視タスク用定義ファイル(図3(a))に記述さ
れているタスク名に対応するタスクの状態をOSに対し
て問い合わせる処理を行う(ステップ124)。そし
て、OSからの応答に基づいてタスク状態テーブル(図
3(b))の状態値を更新する(ステップ125)。When the task state table is created in step 122 of FIG. 2, next, a standby state for 60 seconds is set (step 123). The standby here is to set a cycle for detecting the state of the task, and is set by comparing and considering the magnitude of the increase in the load of the OS processing by the detection processing and the necessary responsiveness. Next, the task monitoring task inquires of the OS about the status of the task corresponding to the task name described in the task monitoring task definition file (FIG. 3A) (step 124). Then, the status value of the task status table (FIG. 3B) is updated based on the response from the OS (step 125).
【0024】次に、動作報告ファイルおよびレポートフ
ァイルを作成し、システム監視タスク1(13)に送信
する(ステップ126)。動作報告ファイルは、図3
(c)に一具体例を示すように、タスク監視タスクが正
常動作していることをシステム監視タスクに通知するフ
ァイルであり、内容は監視を実行した時刻を示す情報で
ある。図3(c)に示す動作報告ファイル1203は、
2001年7月18日10時30分50秒を示す“20
010718103050”と記載されている。また、
レポートファイルは、図3(d)に示すように、タスク
の監視結果をシステム監視タスクに通知するファイルで
あって、各タスクの正常、異常、復旧の状態を示すもの
である。図3(d)に示すレポートファイル1204
は、タスク名、状態として、“kanshi_settime”、“
復旧”と、“analog_calc”、“正常”が記載されてい
る。なお、復旧とは停止中から動作中に戻ったことを示
し、次回も動作中であったならば、正常としてレポート
ファイルを送信する。また、動作報告ファイルとレポー
トファイルの内容は一つのファイルにまとめる形で一括
して送信するようにしてもよい。Next, an operation report file and a report file are created and sent to the system monitoring task 1 (13) (step 126). The operation report file is shown in Figure 3.
As shown in a specific example in (c), it is a file that notifies the system monitoring task that the task monitoring task is operating normally, and the content is information indicating the time at which the monitoring was executed. The operation report file 1203 shown in FIG.
"20, which indicates 10:30:50 on July 18, 2001
It is described as 010718103050 ".
As shown in FIG. 3D, the report file is a file that notifies the system monitoring task of the task monitoring result, and indicates the normal, abnormal, and recovery status of each task. Report file 1204 shown in FIG.
Indicates the task name and status as "kanshi_settime", "
"Recovery", "analog_calc", and "Normal" are described. Note that "Recovery" means that the machine returned from being stopped to working, and if it was running again, the report file is sent as normal. Further, the contents of the operation report file and the report file may be collectively transmitted in the form of one file.
【0025】次に、図4を参照して、図1のシステム監
視タスク1(13)の構成および機能について説明す
る。なお、図4の各処理において使用されるファイルお
よびテーブルの構成例を図5に示す。システム監視タス
ク1(13)は、OSによって起動されると、まず、シ
ステム監視タスク用定義ファイルを読み込む処理を行う
(図4のステップ131)。システム監視タスク用定義
ファイルは、図5(a)に示すように、監視対象タスク
と、それに対応するコード(タスク名を数字等で置き換
えたもの)を列挙したものであり、監視対象のタスク監
視タスクが使用するタスク監視タスク用定義ファイルの
情報に対応するように構成されている。この場合、図5
(a)に示すシステム監視タスク用定義ファイル130
1には、タスク名“kanshi_settime”、“analog_cal
c”に対応させて、コード“10”、“11”が記載されて
いる。Next, the configuration and function of the system monitoring task 1 (13) shown in FIG. 1 will be described with reference to FIG. Note that FIG. 5 shows a configuration example of files and tables used in each processing of FIG. When activated by the OS, the system monitoring task 1 (13) first performs a process of reading the system monitoring task definition file (step 131 in FIG. 4). As shown in FIG. 5A, the system monitoring task definition file enumerates monitored tasks and their corresponding codes (task names replaced by numbers), and the monitored task monitoring It is configured to correspond to the information in the task monitoring task definition file used by the task. In this case,
System monitoring task definition file 130 shown in (a)
1 includes task names “kanshi_settime” and “analog_cal
Codes "10" and "11" are described in correspondence with "c".
【0026】次に、システム監視タスク1(13)は、
データベース14にシステム監視タスクの復旧信号を登
録する(ステップ132)。次に、60秒間待機する
(ステップ133)。この時間によって監視時間間隔が
設定される。Next, the system monitoring task 1 (13)
The recovery signal of the system monitoring task is registered in the database 14 (step 132). Next, it waits for 60 seconds (step 133). This time sets the monitoring time interval.
【0027】次に、一定時間(監視時間間隔以上の所定
時間;この例では10分とする。)以上、動作報告ファ
イル(図3(c)参照)が送信されてこなかったかどう
かについて判定する(ステップ134)。動作報告ファ
イルが送信されてこないということは、タスク監視タス
クとの通信異常(断線等を含む)が発生したことが考え
られる。動作報告ファイルが送信されてきている場合に
は、前回のステータスが異常だった場合は復旧として、
または、前回のステータスが復旧および正常だった場合
は正常としてデータベース14に登録する(ステップ1
35)。そして、受信されたレポートファイル(図3
(d)参照)が存在する場合にはその内容をデータベー
ス14に登録する(ステップ136)。Next, it is determined whether or not the operation report file (see FIG. 3C) has not been transmitted for a certain time (a predetermined time longer than the monitoring time interval; 10 minutes in this example) ( Step 134). If the operation report file is not sent, it is considered that communication abnormality with the task monitoring task (including disconnection) occurred. When the operation report file is sent, if the previous status was abnormal, it will be recovered,
Alternatively, if the previous status was restored and normal, it is registered as normal in the database 14 (step 1
35). Then, the received report file (Fig. 3
(See (d)), the contents are registered in the database 14 (step 136).
【0028】データベース14の登録時には、その一例
を図5(b)にタスクエラーテーブル1302として示
すように、監視対象タスクが、いつ障害が発生したかを
記録し、かつ、過去の履歴も保持する形態でアラームデ
ータ(図1参照)が登録される。この場合、コード(タ
スク名に対応)、時刻、状態の3つの項目が登録され
る。When the database 14 is registered, as shown as an example of the task error table 1302 in FIG. 5B, when a failure occurs in the monitored task, the past history is retained. Alarm data (see FIG. 1) is registered in the form. In this case, three items of code (corresponding to task name), time, and status are registered.
【0029】一方、ステップ134の処理において、一
定時間(監視時間間隔以上の所定時間)、動作報告ファ
イルが送信されてこなかったと判定された場合には、前
回のステータスが異常でなければ通信異常としてその旨
をデータベース14に登録する(ステップ137)。そ
して、監視対象サーバー分チェックしたどうかを判定し
て(ステップ138)、監視対象サーバー分チェックす
るまで上記の処理(ステップ134〜ステップ137)
を繰り返し行う。監視対象サーバー分チェックした後
は、システム監視タスク自身の動作信号をデータベース
に登録した後(ステップ139)、ステップ133に戻
り60秒待機した後、ステップS134以降の処理を繰
り返し実行する。On the other hand, in the processing of step 134, if it is determined that the operation report file has not been transmitted for a certain period of time (a predetermined period of time equal to or longer than the monitoring time interval), it means that the communication status is abnormal unless the previous status is abnormal. The fact is registered in the database 14 (step 137). Then, it is determined whether or not the number of monitoring target servers has been checked (step 138), and the above processing is performed until the number of monitoring target servers is checked (steps 134 to 137).
Repeat. After checking the number of servers to be monitored, the operation signal of the system monitoring task itself is registered in the database (step 139), the process returns to step 133, waits for 60 seconds, and then the processes from step S134 are repeatedly executed.
【0030】次に、図6を参照して、図1のタスク監視
アプリケーション31の構成および機能について説明す
る。タスク監視アプリケーション31が起動されると、
まず、タスク監視アプリケーション用定義ファイルを読
み込む処理が実行される(ステップ311)。タスク監
視アプリケーション用定義ファイルは、図7にその構成
例を示すように、コードに対応するメッセージを列挙し
たファイルとして構成される。図7に示す例では、コー
ド“10”、“11”、“12”に対応して、それぞれ、“ka
nshi_settimeが終了しました”、“analog_calcが終了
しました”、“通信エラーです”というメッセージが記
載されている。ここで、これらの情報は、図3(a)に
示すタスク監視タスク用定義ファイル1201および図
5(a)に示すシステム監視タスク用定義ファイルに1
301に記述されている複数のタスク名のそれぞれに、
もしくは複数のタスク名に共通に対応するように記載さ
れる。Next, the configuration and function of the task monitoring application 31 shown in FIG. 1 will be described with reference to FIG. When the task monitoring application 31 is started,
First, a process of reading a task monitoring application definition file is executed (step 311). The task monitoring application definition file is configured as a file in which messages corresponding to codes are listed, as shown in the configuration example of FIG. 7. In the example shown in FIG. 7, the codes "10", "11", and "12" correspond to "ka" respectively.
The message "nshi_settime has ended", "analog_calc ended", and "communication error" are described. Here, this information is the task monitoring task definition file 1201 shown in FIG. And 1 in the system monitoring task definition file shown in FIG.
For each of the multiple task names described in 301,
Alternatively, it is described so as to commonly correspond to a plurality of task names.
【0031】次に、一定時間(監視時間間隔以上の所定
時間;この例では監視時間と同じ60秒間とする。)の
待機処理が行われた後(ステップ312)、データベー
ス14にアクセスすることでデータベース14に対象タ
スクの最新データが異常として記録されているか否かま
たはシステム監視タスクの最新動作信号が現在時刻より
一定期間(監視時間間隔以上)離れているか否かが判定
される(ステップ313)。データベース14に各タス
クの最新ステータスが異常と記録されていた場合または
システム監視タスクの最新動作信号が現在時刻より一定
期間離れていた場合には、異常メッセージを画面表示す
るとともに(ステップ314)(図1の画面表示3
2)、ユーザーの確認操作待ちとなる(ステップ31
5)。そして、図示していない所定の操作子を用いて、
ユーザーの確認操作がなされた場合には、必要に応じて
メッセージを消去したり、表示状態(色や点滅の状態)
を変更する処理が行われる(ステップ316)。Next, after waiting processing for a fixed time (a predetermined time longer than the monitoring time interval; 60 seconds which is the same as the monitoring time in this example) is performed (step 312), the database 14 is accessed. It is determined whether the latest data of the target task is recorded as an abnormality in the database 14 or whether the latest operation signal of the system monitoring task is apart from the current time by a certain period (more than the monitoring time interval) (step 313). . When the latest status of each task is recorded as abnormal in the database 14 or when the latest operation signal of the system monitoring task is apart from the current time by a certain period, an abnormal message is displayed on the screen (step 314) (Fig. 1 screen display 3
2) Waiting for user confirmation operation (step 31)
5). Then, using a predetermined operator not shown,
When the user's confirmation operation is performed, the message may be deleted and the display status (color or blinking status) may be changed as necessary.
Is changed (step 316).
【0032】次に、図8〜図11を参照して、図1に示
すシステムの動作例を具体的に説明する。図8〜図11
は、時刻9時25分から時刻9時52分までのタスク監
視アプリケーション31(タスク監視AP31)、デー
タベース14(DB14)、システム監視タスク1(1
3)、タスク監視タスク1(12)、タスクA(11
A)、タスクB(11B)、および、タスクC(11
C)による各処理を示すタイムチャートである。なお、
図1のサーバー2(4)に関する構成については、説明
をわかりやすくするため図示を省略した。Next, an operation example of the system shown in FIG. 1 will be specifically described with reference to FIGS. 8 to 11
Is a task monitoring application 31 (task monitoring AP 31) from time 9:25 to time 9:52, a database 14 (DB14), a system monitoring task 1 (1
3), task monitoring task 1 (12), task A (11
A), task B (11B), and task C (11
It is a time chart which shows each processing by C). In addition,
The configuration of the server 2 (4) in FIG. 1 is omitted for clarity of explanation.
【0033】図8〜図11は、横軸を時間経過として、
各図をつなぎ合わせることで一連の処理を時系列に示す
タイムチャートである。ただし、状態の変化のながれを
わかりやすくするため、各図の最も右に位置する時刻に
対応する処理に対応する部分についてはその次に続く図
の最も左側の部分に重複して記載している。例えば、図
8で最も右側に位置する時刻9時27分の処理について
は、図9の最も左側にも同一の内容を記載している。8 to 11, the horizontal axis represents the passage of time,
It is a time chart which shows a series of processings in time series by connecting each figure. However, in order to make it easier to understand the flow of changes in state, the parts corresponding to the processing corresponding to the time located on the far right in each figure are duplicated in the leftmost part in the subsequent figures. . For example, regarding the processing at time 9:27 located on the rightmost side in FIG. 8, the same content is described on the leftmost side in FIG. 9.
【0034】また、矢印の付いた垂直線は、信号(デー
タ)の流れを示すものであり、矢印の方向が信号の送信
方向あるいはアクセスの方向を示している。例えば、図
8の時刻9時25分に対応する処理においては、タスク
監視タスク1(12)が信号送信処理(S02)によっ
てシステム監視タスク1(13)に信号を送信したこと
が上向きの矢印で示されていて、タスク監視アプリケー
ション31がデータベース14に対してアクセスしたこ
と(S04)が、下向きの矢印で示されている。ただ
し、タスク監視タスク1(12)による各タスクA(1
1A)〜C(11C)のタスク監視処理(S01)は、
正確にはOSに対するアクセスとなるが、ここでは図示
を簡潔にするため、直接各タスクA(11A)〜C(1
1C)に対するアクセスに相当する下向きの矢印で示し
ている。The vertical line with an arrow indicates the flow of signals (data), and the direction of the arrow indicates the signal transmission direction or access direction. For example, in the processing corresponding to time 9:25 in FIG. 8, it is indicated by the upward arrow that the task monitoring task 1 (12) has transmitted a signal to the system monitoring task 1 (13) by the signal transmission processing (S02). That is, the fact that the task monitoring application 31 has accessed the database 14 (S04) is indicated by a downward arrow. However, each task A (1
1A) to C (11C) task monitoring processing (S01)
To be precise, the access is to the OS, but here, in order to simplify the illustration, each of the tasks A (11A) to C (1
1C) is indicated by a downward arrow corresponding to access.
【0035】また、図8〜図11においては、特に、図
1の画面表示32の内容の変化と、データベース14に
登録された情報の変化と、図3(d)に例示したレポー
トファイル1204(ただし、この例では、レポートフ
ァイル1204に図3(c)の動作報告ファイル120
3の内容を含ませる形態をとっている。)の変化につい
ては具体的に内容を示している。すなわち、画面表示3
2については、時刻9時26分における状態を符号32
b(図8)、時刻9時27分における状態を符号32c
(図8、図9)、時刻9時29分における状態を符号3
2e(図9、図10)、時刻9時39分における状態を
符号32f(図10)、時刻9時41分における状態を
符号32g(図10、図11)、時刻9時42分におけ
る状態を符号32h(図11)、時刻9時52分におけ
る状態を符号32i(図11)を用いて表している。同
様に、データベース14の登録情報の内容については、
時刻9時25分から時刻9時52分の状態を、符号14
1a〜141iを用いて示している。そして、レポート
ファイル1204の変化については、時刻9時25分か
ら時刻9時29分までと、時刻9時41分から時刻9時
52分までの状態を、それぞれ、符号1204a〜12
04eと、符号1204g〜1204iを用いて示して
いる。8 to 11, in particular, changes in the contents of the screen display 32 in FIG. 1, changes in the information registered in the database 14, and the report file 1204 (illustrated in FIG. 3D). However, in this example, the operation report file 120 of FIG.
It has a form that includes the contents of item 3. ) Indicates the details of the change. That is, screen display 3
For 2, the state at time 9:26 is code 32.
b (FIG. 8), the state at 9:27 is code 32c
(FIGS. 8 and 9), the state at time 9:29 is code 3
2e (FIG. 9, FIG. 10), the state at time 9:39 is 32f (FIG. 10), the state at time 9:41 is 32g (FIG. 10, FIG. 11), the state at 9:42 is The state at 32h (FIG. 11) and 9:52 is represented by reference numeral 32i (FIG. 11). Similarly, regarding the contents of the registration information of the database 14,
The state from time 9:25 to time 9:52 is indicated by reference numeral 14
1a to 141i. Regarding changes in the report file 1204, the states from time 9:25 to time 9:29 and time 9:41 to time 9:52 are denoted by reference numerals 1204a to 1220, respectively.
04e and reference numerals 1204g to 1204i.
【0036】なお、データベース14の登録情報の内容
141a〜141iは、この例においては、タスク毎に
対応する識別符号(ID)に対応付けて、タスク名、時
刻、および状態(ステータス)を示すものとしている。
ただし、“S監視T1”はシステム監視タスク1(1
3)に、“T監視T1”はタスク監視タスク1(12)
に、それぞれ対応するものである。また、データベース
14の登録情報の内容の変化については、状態に変化が
あった部分について、横または横ななめ方向の矢印を用
いて変化前と変化後の情報のつながりを示している。例
えば、図8の時刻9時26分においては、時刻9時25
分の時点で“正常”状態にあったタスクBの状態が、
“異常”状態に変化しているので、これを横向きの矢印
(A1)で示している。さらに、内容141a〜141
iについては、各タスク(各ID)について更新中の情
報には左右に矩形(R1)を付けることでそれを表し、
履歴として保存状態ある情報についてはその矩形を取り
除くことでそれを表している。例えば、図8の時刻9時
27分の登録内容141cにおいては、ID=4のタス
クBについて、9時26分の“異常”状態に関する情報
が保存状態で登録されていて、9時27分の“復旧”状
態に関する情報が更新中の情報として登録されている。In this example, the contents 141a to 141i of the registration information in the database 14 indicate the task name, time, and status (status) in association with the identification code (ID) corresponding to each task. I am trying.
However, "S monitoring T1" is the system monitoring task 1 (1
In 3), "T monitor T1" is the task monitor task 1 (12).
, Respectively. Regarding the change in the content of the registered information in the database 14, for the portion where the state has changed, a horizontal or horizontal licking direction arrow is used to indicate the connection between the information before and after the change. For example, at time 9:26 in FIG. 8, time 9:25
The state of task B that was in the “normal” state at the time of
Since the state has changed to the "abnormal" state, this is indicated by a horizontal arrow (A1). Further, contents 141a to 141
For i, the information being updated for each task (each ID) is indicated by adding a rectangle (R1) to the left and right,
For information that is stored as history, that rectangle is represented by removing it. For example, in the registration content 141c at time 9:27 in FIG. 8, information on the “abnormal” state at 9:26 is registered in the saved state for task B with ID = 4, and at 9:27. Information about the "recovery" status is registered as the information being updated.
【0037】では、図8〜図11を参照して具体的動作
について説明する。図8の時刻9時25分においては、
まず、タスク監視タスク1(12)によってタスク監視
処理が実行される(S01)。このとき、各タスクA
(11A)〜C(11C)が正常に動作していたとする
と、タスク監視タスク1(12)からシステム監視タス
ク1(13)へは、各タスクが正常状態にあることを示
すレポートファイル1204aを示す信号が送信される
(S02)。システム監視タスク1(13)は、レポー
トファイル1204aを受信すると、これに基づいてデ
ータベース14に対するデータ記録処理を行う(S0
3)。この結果、登録内容141aとしては、ID=3
〜5のタスクA〜Cのほか、ID=2のタスク監視タス
ク1も“正常”状態にあるものとして登録され、またI
D=1のシステム監視タスク1についてはそれが“動
作”状態にあるものとして登録される。ここで、タスク
監視アプリケーション31がデータベース14にアクセ
スし、データ取得処理を行っても(S04)、表示すべ
き情報が記録されていないので、画面表示は行われない
(S05)。Now, a specific operation will be described with reference to FIGS. At time 9:25 in FIG. 8,
First, task monitoring processing is executed by the task monitoring task 1 (12) (S01). At this time, each task A
If (11A) to C (11C) are operating normally, the task monitoring task 1 (12) to the system monitoring task 1 (13) show a report file 1204a indicating that each task is in a normal state. A signal is transmitted (S02). Upon receiving the report file 1204a, the system monitoring task 1 (13) performs a data recording process on the database 14 based on the report file 1204a (S0).
3). As a result, the registered content 141a has ID = 3.
In addition to tasks A to C of tasks # 5 to # 5, task monitoring task 1 of ID = 2 is also registered as being in the “normal” state, and I
The system monitoring task 1 with D = 1 is registered as being in the "operating" state. Here, even if the task monitoring application 31 accesses the database 14 and performs the data acquisition process (S04), since the information to be displayed is not recorded, the screen display is not performed (S05).
【0038】ここで、タスク監視処理(S01)の後
に、タスクBが異常終了したとする(S06)。この場
合、時刻9時26分におけるタスク監視処理でタスクB
の異常状態が検知されるので(S07)、タスクBの状
態を異常としたレポートファイル1204bが送信され
る(S08)。システム監視タスク1(13)は、レポ
ートファイル1204bに基づいてデータ記録処理を行
うので(S09)、データベース14の登録内容141
bとしてはID=4のタスクBの状態が異常に更新され
る。ここで、タスク監視アプリケーション31がデータ
取得処理を行うと、タスクBが異常であると検知するの
で(S10)、それに応じた画面表示処理がなされて
(S11)、表示画面32bにタスクBが9時26分に
異常状態となった旨の表示がなされる。Here, it is assumed that task B ends abnormally after the task monitoring processing (S01) (S06). In this case, in the task monitoring process at time 9:26, task B
Is detected (S07), the report file 1204b indicating that the status of task B is abnormal is transmitted (S08). Since the system monitoring task 1 (13) performs data recording processing based on the report file 1204b (S09), the registration contents 141 of the database 14
As for b, the state of task B with ID = 4 is abnormally updated. Here, when the task monitoring application 31 performs the data acquisition process, it detects that the task B is abnormal (S10), and accordingly the screen display process is performed (S11), and the task B is displayed on the display screen 32b. At the time of 26th minute, a display indicating that the abnormal state has occurred is displayed.
【0039】次に、タスクBが復旧し(S12)、タス
クCが新たに異常終了したとする(S13)。この場
合、タスク監視処理によってそれらの変化が検知される
ので(S14)、その旨を示すレポートファイル120
4cが送信される(S15)。ここで、タスクBは前回
の監視処理で異常終了、今回の監視処理で正常状態が検
知されたので、タスクBの状態は復旧に設定される。シ
ステム監視タスク1(13)は、それに基づいてデータ
記録処理を行い(S16)、データベース14の登録内
容141cはID=4のタスクBの状態が“復旧”と記
録されるとともに、ID=5のタスクCの状態が“異
常”に更新される。このとき、ID=4のタスクBにつ
いての異常状態の記録情報は保持される。このため、I
D=4のタスクBについては、2個の情報が登録されて
いる。ここで、タスク監視アプリケーション31がデー
タ取得処理を行うと、タスクCが異常であると検知され
るので(S17)、それに応じた画面表示処理がなされ
て(S18)、表示画面32bにタスクCが9時27分
に異常状態となった旨の表示がなされる。その後、タス
クCが復旧されたとする(S19)。Next, it is assumed that the task B is restored (S12) and the task C is newly terminated abnormally (S13). In this case, these changes are detected by the task monitoring process (S14), and the report file 120 indicating that is detected.
4c is transmitted (S15). Here, since the task B is abnormally terminated in the previous monitoring process and the normal state is detected in the current monitoring process, the state of the task B is set to recovery. The system monitoring task 1 (13) performs a data recording process based on it (S16), and the registered content 141c of the database 14 records the state of the task B with ID = 4 as “recovery” and also with ID = 5. The status of task C is updated to "abnormal". At this time, the record information of the abnormal state for the task B of ID = 4 is held. Therefore, I
For task B with D = 4, two pieces of information are registered. Here, when the task monitoring application 31 performs the data acquisition process, it is detected that the task C is abnormal (S17), and accordingly the screen display process is performed (S18), and the task C is displayed on the display screen 32b. At 9:27, an indication that an abnormal condition has occurred is displayed. After that, it is assumed that the task C is restored (S19).
【0040】次に、図9に示すように、時刻9時28分
において、タスク監視処理が実行されると(S20)、
そのタスク監視処理によってタスクCが復旧したことが
検知されるので、その旨を示すレポートファイル120
4dが送信される(S21)。ここで、タスクCは前回
の監視処理で異常終了、今回の監視処理で正常状態と検
知されたので、タスクCの状態は復旧に設定される。シ
ステム監視タスク1(13)は、それに基づいてデータ
記録処理を行い(S22)、データベース14の登録内
容141dはID=5のタスクCの状態が“復旧”と記
録されるとともに、ID=4のタスクBの状態が“正
常”と記録される。これは、タスクBの状態が前回復旧
で、今回正常動作しているからである。Next, as shown in FIG. 9, when task monitoring processing is executed at time 9:28 (S20),
Since the task monitoring process detects that the task C has been restored, the report file 120 indicating that is detected.
4d is transmitted (S21). Here, the task C is abnormally terminated in the previous monitoring process, and the normal state is detected in the current monitoring process, so the state of the task C is set to recovery. The system monitoring task 1 (13) performs a data recording process based on it (S22), and the registered content 141d of the database 14 records the state of the task C with ID = 5 as “recovery” and also with ID = 4. The status of task B is recorded as "normal". This is because the state of task B was previously restored and is now operating normally.
【0041】上記の場合、ID=4のタスクBについて
の復旧状態の記録情報は保持される。また、ID=5の
タスクCについての異常状態の記録情報は保持される。
このため、ID=4のタスクBについては、3個の情報
が登録され、ID=5のタスクCについては、2個の情
報が登録される。ここで、タスク監視アプリケーション
31がデータ取得処理を行うと(S23)、各タスクの
最新状態に異常がなく、表示すべき情報が記録されてい
ないので、画面表示は行われない(S24)。In the above case, the record information of the recovery state for the task B of ID = 4 is retained. Further, the record information of the abnormal state of the task C of ID = 5 is held.
Therefore, three pieces of information are registered for the task B of ID = 4, and two pieces of information are registered for the task C of ID = 5. Here, when the task monitoring application 31 performs the data acquisition process (S23), since there is no abnormality in the latest state of each task and the information to be displayed is not recorded, the screen display is not performed (S24).
【0042】次に、タスクCが再び異常終了したとする
(S25)。この場合、次の時刻9時29分の各処理に
おいて、タスク監視処理が実行されると(S26)、タ
スクCが異常終了したことが検知されるので、その旨を
示すレポートファイル1204eが送信される(S2
7)。システム監視タスク1(13)は、それに基づい
てデータ記録処理を行い(S28)、データベース14
の登録内容141eはID=5のタスクCの状態が“異
常”と記録される。そして、前回記録されたタスクCの
復旧状態の記録情報は保持される。このため、ID=5
のタスクCについては、3個の情報が登録される。ここ
で、タスク監視アプリケーション31がデータ取得処理
を行うと、タスクCの異常状態が検知されるので(S2
9)、時刻9時29分にタスクCが異常状態となった旨
の画面表示32eがなされる(S30)。Next, it is assumed that task C ends abnormally again (S25). In this case, when the task monitoring process is executed in each process at 9:29 at the next time (S26), it is detected that the task C is abnormally terminated, and the report file 1204e indicating that is transmitted. (S2
7). The system monitoring task 1 (13) performs a data recording process based on it (S28), and the database 14
In the registration content 141e of, the state of the task C with ID = 5 is recorded as “abnormal”. Then, the record information of the recovery state of the task C recorded last time is held. Therefore, ID = 5
For task C of, three pieces of information are registered. Here, when the task monitoring application 31 performs the data acquisition process, the abnormal state of the task C is detected (S2
9), the screen display 32e indicating that the task C is in the abnormal state is made at time 9:29 (S30).
【0043】次に、図10に示すように、タスク監視タ
スク1(12)自体が異常終了したとする(S31)。
そして、この例では、タスク監視タスク1(12)から
システム監視タスク1(13)へは、9時29分にレポ
ートファイル1204eが送信された後、それから10
分以上が経過した時点である9時39分までの間に、レ
ポートファイル1204が送信されないものとする。こ
の場合、システム監視タスク1(13)は、タスク監視
タスク1(12)の通信異常とみなし、データ記録処理
によってデータベース14に、タスク監視タスク1(1
2)の通信異常が発生したことを登録する(S32)。
この結果、登録内容141fには、ID=2のタスク監
視タスク1の情報が時刻9時39分に異常になったと記
録される。このときID=1のシステム監視タスク1に
ついての情報は時刻9時39分時点のもの(“動作”)
に更新されるが、タスク監視タスク1によって監視され
ているタスクA〜タスクCの情報は更新されず、直前の
状態で保持される。ここで、タスク監視アプリケーショ
ン31がデータ取得処理を行うと、タスク監視タスク1
の異常状態と、タスクCの異常状態が検知されるので
(S33)、時刻9時39分にタスク監視タスク1が異
常状態となり、時刻9時29分にタスクCが異常状態と
なった旨の画面表示32fがなされる(S34)。Next, as shown in FIG. 10, it is assumed that the task monitoring task 1 (12) itself has terminated abnormally (S31).
Then, in this example, after the report file 1204e is transmitted from the task monitoring task 1 (12) to the system monitoring task 1 (13) at 9:29, 10
It is assumed that the report file 1204 is not transmitted by 9:39, which is the time when more than a minute has passed. In this case, the system monitoring task 1 (13) regards the task monitoring task 1 (12) as a communication error, and the data recording process causes the database 14 to store the task monitoring task 1 (1).
The fact that the communication abnormality of 2) has occurred is registered (S32).
As a result, it is recorded in the registered content 141f that the information of the task monitoring task 1 with ID = 2 becomes abnormal at time 9:39. At this time, the information about the system monitoring task 1 with ID = 1 is as of time 9:39 (“operation”).
However, the information of the tasks A to C monitored by the task monitoring task 1 is not updated and is held in the immediately preceding state. Here, when the task monitoring application 31 performs data acquisition processing, the task monitoring task 1
And the abnormal state of the task C are detected (S33), the task monitoring task 1 is in the abnormal state at 9:39 and the task C is in the abnormal state at 9:29. The screen display 32f is performed (S34).
【0044】次に時刻9時41分において、タスク監視
タスク1(12)が復旧し(S35)、タスク監視処理
と信号送信処理が行われたとする(S36、S37)。
この場合、タスク監視タスク1が復旧し、タスクCが依
然として異常状態であることを記述したレポートファイ
ル1204gが送信される。システム監視タスク1(1
3)は、それに基づいてデータ記録処理を行い(S3
8)、データベース14の登録内容141gはID=2
のタスク監視タスク1の状態が“復旧”と記録される。
そして、前回記録されたタスク監視タスク1の異常状態
の記録情報は保持される。このため、ID=2のタスク
監視タスク1については、2個の情報が登録される。こ
こで、タスク監視アプリケーション31がデータ取得処
理を行うと、タスクCの異常状態のみが検知されるので
(S39)、時刻9時29分にタスクCが異常状態とな
った旨の画面表示32gがなされる(S40)。Next, at time 9:41, the task monitoring task 1 (12) is restored (S35), and the task monitoring processing and the signal transmission processing are performed (S36, S37).
In this case, the task monitoring task 1 is restored, and the report file 1204g describing that the task C is still in the abnormal state is transmitted. System monitoring task 1 (1
3) performs a data recording process based on it (S3
8), the registered content 141g of the database 14 has ID = 2
The status of task monitoring task 1 is recorded as “recovered”.
Then, the record information of the abnormal state of the task monitoring task 1 recorded last time is held. Therefore, two pieces of information are registered for the task monitoring task 1 with ID = 2. Here, when the task monitoring application 31 performs the data acquisition process, only the abnormal state of the task C is detected (S39). Therefore, a screen display 32g indicating that the task C is in the abnormal state is displayed at 9:29. (S40).
【0045】次に、図11に示すように、時刻9時42
分の処理において、タスク監視タスク1(12)がタス
ク監視処理および信号送信処理を行うと(S41、S4
2)、タスクCが依然として異常状態であることを記述
したレポートファイル1204hが送信される。システ
ム監視タスク1(13)は、それに基づいてデータ記録
処理を行い(S43)、データベース14の登録内容1
41hはID=2のタスク監視タスク1の状態が“正
常”と記録される。そして、前回記録されたタスク監視
タスク1の復旧状態の記録情報は保持される。このた
め、ID=2のタスク監視タスク1については、3個の
情報が登録される。ここで、タスク監視アプリケーショ
ン31がデータ取得処理を行うと、タスクCの異常状態
のみが検知されるので(S44)、時刻9時29分にタ
スクCが異常状態となった旨の画面表示32hがなされ
る(S45)。そして、ここでは、システム監視タスク
1(13)が、データ記録処理(S43)を行った後、
異常終了したとする(S46)。Next, as shown in FIG. 11, time 9:42
In the minute processing, when the task monitoring task 1 (12) performs the task monitoring processing and the signal transmission processing (S41, S4
2) A report file 1204h describing that task C is still in an abnormal state is transmitted. The system monitoring task 1 (13) performs data recording processing based on it (S43), and the registered content 1 of the database 14
In 41h, the status of the task monitoring task 1 with ID = 2 is recorded as "normal". Then, the record information of the recovery state of the task monitoring task 1 recorded last time is retained. Therefore, for the task monitoring task 1 with ID = 2, three pieces of information are registered. Here, when the task monitoring application 31 performs the data acquisition process, only the abnormal state of the task C is detected (S44). Therefore, the screen display 32h indicating that the task C is in the abnormal state is displayed at time 9:29. Done (S45). Then, here, after the system monitoring task 1 (13) performs the data recording process (S43),
It is assumed that the processing has ended abnormally (S46).
【0046】次に、時刻9時52分における各処理の内
容について説明する。タスク監視タスク1(12)がタ
スク監視処理および信号送信処理を行うと(S47、S
48)、タスクCが依然として異常状態であることを記
述したレポートファイル1204iが送信される。この
場合、システム監視タスク1(13)は、S46で異常
終了しているので、通信異常となって(S49)、シス
テム監視タスク1(13)によるデータベース14への
データの書き込み処理は行われない。次に、タスク監視
アプリケーション31がデータ取得処理を行う(S5
0)。システム監視タスク1(13)の最新ステータス
時刻が現在時刻より一定期間(監視時間間隔以上の所定
時間=今回は10分(図6のステップ313参照))離
れていた場合は、タスク監視アプリケーション31はシ
ステム監視タスクの異常終了とみなす。その際、画面表
示32iとして、時刻9時29分にタスクCが異常状態
となり、時刻9時52分にシステム監視タスク1が異常
状態になった旨の表示がなされる(S51)。Next, the contents of each processing at 9:52 will be described. When the task monitoring task 1 (12) performs task monitoring processing and signal transmission processing (S47, S
48), the report file 1204i describing that the task C is still in the abnormal state is transmitted. In this case, since the system monitoring task 1 (13) has abnormally ended in S46, a communication error occurs (S49), and the process of writing data to the database 14 by the system monitoring task 1 (13) is not performed. . Next, the task monitoring application 31 performs a data acquisition process (S5
0). If the latest status time of the system monitoring task 1 (13) is apart from the current time by a certain period (predetermined time longer than the monitoring time interval = 10 minutes this time (see step 313 in FIG. 6)), the task monitoring application 31 It is considered as an abnormal end of the system monitoring task. At this time, as the screen display 32i, a message indicating that the task C is in the abnormal state at 9:29 and the system monitoring task 1 is in the abnormal state at 9:52 is displayed (S51).
【0047】次に、図12を参照して、図1に示す実施
形態における情報の流れと、図1に示す実施形態の構成
の変形例について説明する。図12は、図1の構成にお
ける各機能と情報(信号)の流れを示すシステム図であ
る。図12において、図1に示すものと同一の構成には
同一の符号を付けている。Next, the flow of information in the embodiment shown in FIG. 1 and a modification of the configuration of the embodiment shown in FIG. 1 will be described with reference to FIG. FIG. 12 is a system diagram showing each function and information (signal) flow in the configuration of FIG. 12, the same components as those shown in FIG. 1 are designated by the same reference numerals.
【0048】図12に示すように、システム監視タスク
1(13)は、タスク監視タスク1(12)から送信さ
れた信号と、タスク監視タスク2(42)から送信され
た信号とを受信して、それらに基づいてデータベース1
4へ所定の情報を記録する。ここで、タスク監視タスク
1(12)からシステム監視タスク1(13)へ送信さ
れる信号は、タスク監視タスク1(12)が動作してい
ることを示すタスク監視タスク1動作信号、タスクA
(11A)〜タスクC(11C)の正常/異常/復旧を
示す信号である。タスク監視タスク2(42)からシス
テム監視タスク1(13)へ送信される信号は、タスク
監視タスク2(42)が動作していることを示すタスク
監視タスク2動作信号、タスクD(41D)〜タスクE
(41E)の正常/異常/復旧を示す信号である。シス
テム監視タスク1(13)がデータベース14へ記録す
る信号は、システム監視タスク1(13)の動作/復旧
を示す信号、タスク監視タスク1(12)およびタスク
監視タスク2(42)の正常、異常、復旧を示す各信
号、タスクA(11A)〜タスクC(11C)およびタ
スクD(41D)〜タスクE(41E)の正常、異常、
復旧の各状態を示す各信号である。As shown in FIG. 12, the system monitoring task 1 (13) receives the signal transmitted from the task monitoring task 1 (12) and the signal transmitted from the task monitoring task 2 (42). , A database based on them 1
Record predetermined information in 4. Here, the signal transmitted from the task monitoring task 1 (12) to the system monitoring task 1 (13) is a task monitoring task 1 operation signal indicating that the task monitoring task 1 (12) is operating, task A
This is a signal indicating normality / abnormality / recovery of (11A) to task C (11C). The signal transmitted from the task monitoring task 2 (42) to the system monitoring task 1 (13) is a task monitoring task 2 operation signal indicating that the task monitoring task 2 (42) is operating, task D (41D) to Task E
It is a signal indicating normal / abnormal / recovery of (41E). The signal recorded in the database 14 by the system monitoring task 1 (13) is a signal indicating the operation / recovery of the system monitoring task 1 (13), and the normality and abnormality of the task monitoring task 1 (12) and the task monitoring task 2 (42). , Each signal indicating recovery, normality / abnormality of task A (11A) to task C (11C) and task D (41D) to task E (41E),
It is each signal showing each state of restoration.
【0049】図1(および図12)に示す実施形態で
は、タスク監視タスク1(12)とシステム監視タスク
1(13)とが同一のサーバー1(1)において運用さ
れている。ただし、データベース14への情報の記録を
行うタスクが、各タスクの監視を行うタスクと同一のサ
ーバー上では実行しないように設定することも可能であ
る。すなわち、図12のサーバー1(1)において、波
線を境界線として、システム監視タスク1(13)とデ
ータベース14を運用するサーバーと、タスク監視タス
ク1(12)と各タスクA(11A)〜タスクC(11
C)を運用するサーバーとを、異なる2つのサーバーと
して分離して構成するようにしてもよい。In the embodiment shown in FIG. 1 (and FIG. 12), the task monitoring task 1 (12) and the system monitoring task 1 (13) are operated in the same server 1 (1). However, it is possible to set such that the task of recording information in the database 14 is not executed on the same server as the task of monitoring each task. That is, in the server 1 (1) of FIG. 12, the server operating the system monitoring task 1 (13) and the database 14, the task monitoring task 1 (12), and each of the tasks A (11A) to tasks with the broken line as a boundary line. C (11
The server that operates C) may be configured separately as two different servers.
【0050】次に、図13を参照して、図1に示す実施
形態の変形例について説明する。図13は本発明の他の
実施形態の構成における各機能と情報(信号)の流れを
示すシステム図である。図13は、サーバー1a内で実
行されるタスクA(11A)およびタスクB(11B)
を監視するタスク監視タスク1(12a)が、直接デー
タベース14aに情報を記録できるようにした構成であ
る。この場合、図1および図12に示すシステム監視タ
スク1(13)を省略することが可能となる。ただし、
タスク監視タスク1(12a)は、タスク監視タスク1
動作/復旧信号と、タスクAおよびBの正常/異常/復
旧の各状態を示す信号を、データベース14aに記録す
る機能を有している。Next, a modification of the embodiment shown in FIG. 1 will be described with reference to FIG. FIG. 13 is a system diagram showing each function and information (signal) flow in the configuration of another embodiment of the present invention. FIG. 13 shows task A (11A) and task B (11B) executed in the server 1a.
The task monitoring task 1 (12a) for monitoring the is configured so that information can be directly recorded in the database 14a. In this case, the system monitoring task 1 (13) shown in FIGS. 1 and 12 can be omitted. However,
The task monitoring task 1 (12a) is the task monitoring task 1
It has a function of recording the operation / recovery signal and the signals indicating the normal / abnormal / recovery states of the tasks A and B in the database 14a.
【0051】本発明の実施形態は、図12のサーバー1
(1)あるいは図13のサーバー1(1a)で稼働する
OSの方式には特に限定はない。しかしながら、既存の
OSによっては、例えば、図13に示すように、各タス
クの監視を行うタスクが、データベース14aを構成す
る記憶装置あるいは記憶媒体に直接情報を送信すること
ができないという制約がある場合がある。このような場
合には、図12に示すように、各タスクの監視を行うタ
スク監視タスク1、2と、データベース14への情報送
信を行うシステム監視タスク1とを分離して設ける構成
を用いるようにすればよい。The embodiment of the present invention is the server 1 of FIG.
(1) or the method of the OS running on the server 1 (1a) of FIG. 13 is not particularly limited. However, depending on the existing OS, for example, as shown in FIG. 13, there is a constraint that a task that monitors each task cannot directly transmit information to a storage device or a storage medium that configures the database 14a. There is. In such a case, as shown in FIG. 12, use a configuration in which the task monitoring tasks 1 and 2 that monitor each task and the system monitoring task 1 that transmits information to the database 14 are provided separately. You can do this.
【0052】以上説明した本発明の実施の形態によれ
ば、従来、異常終了を通知する処理手段をタスク毎に埋
め込む必要があり多くのコストがかかっていたのに対
し、本発明では、タスク監視タスクが検知した異常終了
の情報をデータベースが保持し、表示のための手段は、
各サーバーの処理部分に依存せず、各クライアントにイ
ンストールしたアプリケーションを用い、データベース
から情報を取得しているので、一般作業者による表示端
末の増設が容易となり、コスト削減が期待できる。According to the embodiment of the present invention described above, it has conventionally been necessary to embed a processing means for notifying an abnormal end for each task, but at a high cost, in the present invention, task monitoring is performed. The database holds information on abnormal termination detected by the task, and the means for displaying is
Since the information is acquired from the database by using the application installed in each client without depending on the processing part of each server, it is easy for a general worker to add a display terminal, and cost reduction can be expected.
【0053】また、従来はネットワークの異常を検知す
る手段を持たないが、本発明のものはタスクの通常動作
時に動作信号を送信しているので、タスクの異常終了だ
けでなく、ネットワークのトラブルを通知することがで
き、より大規模なシステムでも効果的な運用が可能とな
る。Further, conventionally, although there is no means for detecting an abnormality in the network, the one according to the present invention transmits an operation signal at the time of normal operation of the task, so that not only the abnormal termination of the task but also the trouble of the network may occur. Notification can be made, and effective operation is possible even in a larger system.
【0054】また、従来は異常検知手段自体に異常が発
生した場合に検知する手段を持たないが、本発明ではタ
スクの通常動作時に動作信号を送信しているので、異常
検知手段に異常が発生した場合も通知する事が可能とな
り、より正確な運用が可能となる。Further, conventionally, the abnormality detecting means itself has no means for detecting an abnormality, but in the present invention, since the operation signal is transmitted during the normal operation of the task, the abnormality detecting means has an abnormality. Even if it does, it is possible to notify, and more accurate operation becomes possible.
【0055】また、従来はタスク毎にコードを埋め込む
必要があったのに対し、本発明の実施形態において対象
タスクを増やすには、タスク監視タスク用定義ファイル
を変更するだけなので、容易に対象タスクを増設する事
が出来、拡張性のあるシステムを安価に構築する事が可
能となる。In the past, it was necessary to embed a code for each task, but in order to increase the number of target tasks in the embodiment of the present invention, only the task monitoring task definition file is changed. Can be added, and a system with expandability can be constructed at low cost.
【0056】さらに、従来はタスク異常終了の履歴を保
持していないため、タスクの異常終了に対して限定的な
情報しか得られないが、本実施形態ではタスクの履歴を
データベースが保持しているので、過去のタスクの異常
終了の原因究明に役立てることが可能である。Further, conventionally, since the history of abnormal task termination is not held, only limited information can be obtained for abnormal task termination, but in the present embodiment, the task history is held in the database. Therefore, it is possible to use it for investigating the cause of the abnormal end of the past task.
【0057】また、本発明の実施形態では、各タスク、
タスク監視タスク、およびシステム監視タスクの間に、
親子関係(例えばタスク監視タスクがシステム監視タス
クを起動したり、各タスク間で直接異常終了を検知して
強制割り込みを発生させたりできる関係)が存在してい
る必要はない。すなわち、各タスク、タスク監視タス
ク、およびシステム監視タスクの関係は、所定のOSに
よって並列に動作および管理されるものである。そし
て、データベース14あるいは14aを構成する記録媒
体に他のタスクを介して、あるいは直接、情報を送信す
ることによって、タスク監視タスクの動作を管理できる
ようにしている。したがって、特にOSの種類を限定せ
ず、様々なOSで動作するタスク(あるいはプロセス)
を対象に監視処理を行うことが可能となり、幅広い運用
を行う事が出来るIn the embodiment of the present invention, each task,
Between the task monitoring task and the system monitoring task,
There is no need to have a parent-child relationship (for example, a task monitoring task can activate a system monitoring task, or a task can directly detect an abnormal end and generate a forced interrupt). That is, the relationship between each task, the task monitoring task, and the system monitoring task is operated and managed in parallel by a predetermined OS. Then, the operation of the task monitoring task can be managed by transmitting the information to the recording medium constituting the database 14 or 14a via another task or directly. Therefore, the task (or process) running on various OSs is not limited to any particular type of OS.
It becomes possible to perform monitoring processing for the target, and it is possible to perform a wide range of operations.
【0058】なお、本発明の実施の形態は、上記のもの
に限定されず、例えば、クライアントで実行されるタス
ク監視アプリケーションにおける画面表示の方法を、図
形によって表示すようにしたり、さらに統計的に過去の
履歴に関する情報を同時に表示するようにしたり、音や
光による警報動作を同時に行うようにしたりする変更を
適宜行うことができる。また、各タスク、タスク監視タ
スク、システム監視タスクは、通信網を介して接続され
た複数のサーバー上で、あるいは単一のサーバー上でさ
らに分割して、より多重の階層構造を有するようにして
もよい。The embodiment of the present invention is not limited to the above-described one. For example, the method of screen display in the task monitoring application executed by the client may be displayed graphically or statistically. It is possible to appropriately change the information about the past history to be displayed at the same time, or to perform the alarm operation by sound or light at the same time. In addition, each task, task monitoring task, and system monitoring task should be divided into multiple servers connected via a communication network or a single server to have a more hierarchical structure. Good.
【0059】また、本発明の実施の形態は、1または複
数のサーバーによって、そのハードウェア資源を利用し
て実行されるプログラムを用いて構成されるが、そのプ
ログラムは、コンピュータ読み取り可能な記録媒体を介
して、または、通信回線を介して頒布することが可能で
ある。Further, the embodiment of the present invention is configured by using a program executed by one or a plurality of servers by utilizing its hardware resources. The program is a computer-readable recording medium. , Or via a communication line.
【0060】[0060]
【発明の効果】以上説明したように、本発明によれば、
1若しくは複数のクライアントに又は相互に、ネットワ
ークを介して接続された1又は複数のサーバーによって
複数のタスクが運用されるコンピュータシステムにおい
て、1のサーバー上で運用されるタスクであって、当該
サーバーで運用される他のタスクの運用状態を所定の時
間間隔で検知し、その検知結果に基づいて所定の信号を
出力するタスク監視手段と、タスク監視手段から出力さ
れた信号に基づいて、当該タスク監視手段の動作状態を
示す情報と、当該タスク監視手段によって検知された他
のタスクの状態を示す情報とを、クライアントが取得可
能な形態で、時刻に係る情報とともに複数記憶する記憶
手段とを備えるようにしたので、記憶手段に記憶された
情報を参照することで、タスクの異常に加え、ネットワ
ークの通信異常についても検知することができ、また、
異常検知のためのタスク監視手段自体に異常が発生した
場合にも、それを検知して通知することができ、さら
に、それらの履歴情報を利用する構成を容易に構築する
ことができる。As described above, according to the present invention,
In a computer system in which a plurality of tasks are operated by one or a plurality of servers that are connected to one or a plurality of clients or mutually via a network, a task that is operated on one server A task monitoring unit that detects the operating status of another task that is operated at a predetermined time interval and outputs a predetermined signal based on the detection result, and the task monitoring unit that monitors the signal output from the task monitoring unit. A storage means for storing a plurality of pieces of information indicating the operation state of the means and information indicating the states of other tasks detected by the task monitoring means in a form that can be acquired by the client together with information related to time Therefore, by referring to the information stored in the storage means, in addition to the task error, the network communication error may occur. Some can be detected, also,
Even when an abnormality occurs in the task monitoring unit itself for detecting an abnormality, the abnormality can be detected and notified, and a configuration using the history information can be easily constructed.
【0061】また、タスク監視手段が1又は複数のサー
バー上で複数運用されていて、複数のタスク監視手段か
ら出力された信号を受信して、所定の時間間隔で前記記
憶手段に記憶させるシステム監視手段をさらに備えるこ
とによって、コンピュータシステムのシステム上の制約
によってタスク監視手段が記憶手段に直接情報を送信で
きない場合でも、対応することが可能となる。また、タ
スク監視手段の出力信号が、タスクの動作状態が正常で
ある旨、タスクの動作状態が異常である旨、及びタスク
の動作状態が異常から正常に復旧した状態である旨を選
択的に示すものであるようにすることで、タスクの監視
情報の履歴をデータベース化することによって、過去の
情報を詳細に、かつ容易に利用することができる。Further, a system monitor in which a plurality of task monitoring means are operated on one or a plurality of servers and the signals output from the plurality of task monitoring means are received and stored in the storage means at predetermined time intervals. By further providing the means, it is possible to deal with the case where the task monitoring means cannot directly transmit the information to the storage means due to the system restrictions of the computer system. In addition, the output signal of the task monitoring means selectively indicates that the task operating state is normal, that the task operating state is abnormal, and that the task operating state is a state in which the task is normally recovered from the abnormality. By making it as shown, the history of the task monitoring information can be made into a database, and the past information can be used in detail and easily.
【0062】また、タスク監視手段が検知対象とするタ
スクが、所定の定義ファイルに記述された情報に基づい
て決定されたり、記憶手段からクライアントに対して供
給される情報が、その所定の定義ファイルの記述情報に
対応して記述された第2の定義ファイルに記述された情
報に基づいて決定されたり、システム監視手段が受信対
象とするタスク監視手段が、所定の第3の定義ファイル
に記述された情報に基づいて決定されるようにすること
で、異常終了を通知するための手段をタスク毎に組み込
むことを不要とするとともに、容易に異常終了の検知内
容や表示端末の変更あるいは増設をすることができる。The task to be detected by the task monitoring means is determined based on the information described in a predetermined definition file, or the information supplied from the storage means to the client is the predetermined definition file. Of the task monitoring means to be received by the system monitoring means is described in a predetermined third definition file. By making a decision based on the information obtained, it is not necessary to incorporate means for notifying an abnormal end for each task, and it is possible to easily change or add the detected contents of abnormal end and display terminals. be able to.
【0063】また、クライアントが、タスクの運用状態
を検知した結果をその監視用タスクの動作状態を示す時
刻情報とともに記憶した記憶手段にアクセスし、それを
取得し、そして、取得した監視用タスクの動作状態を示
す時刻情報と、現在の時刻情報とに基づいて、監視用タ
スクの動作状態の異常の有無を判断するようにすること
で、監視用タスクに通信異常等が発生した場合でも、ク
ライアント側で異常状態を判断することが可能となる。Further, the client accesses the storage means which stores the result of detecting the operational status of the task together with the time information indicating the operational status of the monitoring task, acquires it, and acquires the acquired monitoring task. Even if a communication abnormality occurs in the monitoring task by determining whether there is an abnormality in the operating status of the monitoring task based on the time information indicating the operating state and the current time information, the client can detect It becomes possible for the side to judge the abnormal state.
【図1】 本発明の一実施形態のシステム構成を説明す
るためのブロック図である。FIG. 1 is a block diagram for explaining a system configuration of an embodiment of the present invention.
【図2】 図1のタスク監視タスク1(12)またはタ
スク監視タスク2(42)の機能を説明するためのフロ
ーチャートである。2 is a flowchart for explaining the function of a task monitoring task 1 (12) or a task monitoring task 2 (42) in FIG.
【図3】 図1のタスク監視タスク1(12)またはタ
スク監視タスク2(42)によって使用されるファイル
およびテーブルの構成例を示す図である。FIG. 3 is a diagram showing a configuration example of files and tables used by a task monitoring task 1 (12) or a task monitoring task 2 (42) of FIG.
【図4】 図1のシステム監視タスク1(13)の機能
を説明するためのフローチャートである。4 is a flowchart for explaining the function of a system monitoring task 1 (13) in FIG.
【図5】 図1のシステム監視タスク1(13)によっ
て使用されるファイルおよびテーブルの構成例を示す図
である。5 is a diagram showing a configuration example of files and tables used by the system monitoring task 1 (13) of FIG.
【図6】 図1のタスク監視アプリケーション31の機
能を説明するためのフローチャートである。FIG. 6 is a flowchart for explaining the function of the task monitoring application 31 of FIG.
【図7】 図1のタスク監視アプリケーション31によ
って使用されるタスク監視アプリケーション用定義ファ
イルの構成例を示す図である。7 is a diagram showing a configuration example of a task monitoring application definition file used by the task monitoring application 31 of FIG.
【図8】 図1に示すシステムの動作例を説明するため
のタイムチャートである。ここで図8〜図11は一連の
動作を示している。8 is a time chart for explaining an operation example of the system shown in FIG. Here, FIGS. 8 to 11 show a series of operations.
【図9】 図1に示すシステムの動作例を説明するため
のタイムチャートである。ここで図8〜図11は一連の
動作を示している。9 is a time chart for explaining an operation example of the system shown in FIG. Here, FIGS. 8 to 11 show a series of operations.
【図10】 図1に示すシステムの動作例を説明するた
めのタイムチャートである。ここで図8〜図11は一連
の動作を示している。FIG. 10 is a time chart for explaining an operation example of the system shown in FIG. Here, FIGS. 8 to 11 show a series of operations.
【図11】 図1に示すシステムの動作例を説明するた
めのタイムチャートである。ここで図8〜図11は一連
の動作を示している。11 is a time chart for explaining an operation example of the system shown in FIG. Here, FIGS. 8 to 11 show a series of operations.
【図12】 図1の構成における各機能と情報(信号)
の流れをまとめて示すシステム図である。12] Functions and information (signals) in the configuration of FIG.
It is a system diagram which shows the flow of FIG.
【図13】 本発明の他の実施形態の構成における各機
能と情報(信号)の流れを示すシステム図である。FIG. 13 is a system diagram showing each function and a flow of information (signal) in the configuration of another embodiment of the present invention.
1,1a…サーバー1 2…ネットワーク 3…クライアント(クライアントPC) 4…サーバー2 11A〜11C…タスクA〜タスクC 12,12a…タスク監視タスク1 13…システム監視タスク1 14,14a…データベース(DB) 31…タスク監視アプリケーション 32…画面表示(出力) 41D,41E…タスクD,E 42…タスク監視タスク2 1201…タスク監視タスク用定義ファイル 1301…システム監視タスク用定義ファイル 3101…タスク監視アプリケーション用定義ファイル 1, 1a ... Server 1 2 ... Network 3 ... Client (Client PC) 4 ... server 2 11A to 11C ... Task A to Task C 12, 12a ... Task monitoring task 1 13 ... System monitoring task 1 14, 14a ... Database (DB) 31 ... Task monitoring application 32 ... Screen display (output) 41D, 41E ... Tasks D, E 42 ... Task monitoring task 2 1201 ... Definition file for task monitoring task 1301 ... System monitoring task definition file 3101 ... Definition file for task monitoring application
───────────────────────────────────────────────────── フロントページの続き (72)発明者 郷古 博之 埼玉県さいたま市北袋町1丁目297番地 三菱マテリアル株式会社総合研究所大宮研 究センター機器システム研究部内 Fターム(参考) 5B042 GA12 GA23 GC10 GC16 GC18 JJ04 JJ08 JJ15 KK10 MB03 MC21 5B045 BB28 BB42 GG01 JJ02 JJ13 5B085 AC03 AC14 BA06 BG07 ─────────────────────────────────────────────────── ─── Continued front page (72) Inventor Hiroyuki Goko 1-297 Kitabukuro-cho, Saitama City, Saitama Prefecture Mitsubishi Materials Corporation Research Institute Omiya Lab Research Center Equipment Systems Research Department F-term (reference) 5B042 GA12 GA23 GC10 GC16 GC18 JJ04 JJ08 JJ15 KK10 MB03 MC21 5B045 BB28 BB42 GG01 JJ02 JJ13 5B085 AC03 AC14 BA06 BG07
Claims (12)
互に、ネットワークを介して接続された1又は複数のサ
ーバーによって複数のタスクが運用されるコンピュータ
システムにおいて、 1のサーバー上で運用されるタスクであって、当該サー
バーで運用される他のタスクの運用状態を所定の時間間
隔で検知し、その検知結果に基づいて所定の信号を出力
するタスク監視手段と、 前記タスク監視手段から出力された信号に基づいて、当
該タスク監視手段の動作状態を示す情報と、当該タスク
監視手段によって検知された前記他のタスクの状態を示
す情報とを、前記クライアントが取得可能な形態で、時
刻に係る情報とともに複数記憶する記憶手段とを備える
ことを特徴とするタスク監視システム。1. A computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network, the tasks being operated on the one server. The task monitoring means for detecting the operation status of other tasks operated on the server at a predetermined time interval and outputting a predetermined signal based on the detection result, and the signal output from the task monitoring means. On the basis of the information indicating the operation state of the task monitoring unit and the information indicating the state of the other task detected by the task monitoring unit, a plurality of pieces of information are provided together with information about the time in a form that the client can obtain. A task monitoring system comprising: a storage unit that stores the task.
バー上で複数運用されていて、 複数の前記タスク監視手段から出力された信号を受信し
て、所定の時間間隔で前記記憶手段に記憶させるシステ
ム監視手段をさらに備えることを特徴とする請求項1記
載のタスク監視システム。2. A plurality of the task monitoring means are operated on one or a plurality of servers, receive signals output from the plurality of task monitoring means, and store the signals in the storage means at predetermined time intervals. The task monitoring system according to claim 1, further comprising system monitoring means.
スクが、所定の定義ファイルに記述された情報に基づい
て決定されることを特徴とする請求項1又は2記載のタ
スク監視システム。3. The task monitoring system according to claim 1, wherein the task to be detected by the task monitoring unit is determined based on information described in a predetermined definition file.
して供給される情報が、前記所定の定義ファイルの記述
情報に対応して記述された第2の定義ファイルに記述さ
れた情報に基づいて決定されることを特徴とする請求項
3記載のタスク監視システム。4. The information supplied from the storage means to the client is determined based on information described in a second definition file described in correspondence with the description information of the predetermined definition file. The task monitoring system according to claim 3, wherein:
タスク監視手段が、所定の第3の定義ファイルに記述さ
れた情報に基づいて決定されることを特徴とする請求項
1〜4のいずれか1項に記載のタスク監視システム。5. The task monitoring means to be received by the system monitoring means is determined based on information described in a predetermined third definition file. The task monitoring system according to item 1.
クの動作状態が正常である旨、タスクの動作状態が異常
である旨、及びタスクの動作状態が異常から正常に復旧
した状態である旨を選択的に示すものであることを特徴
とする請求項1〜5のいずれか1項に記載のタスク監視
システム。6. The output signal of the task monitoring means indicates that the task operating state is normal, that the task operating state is abnormal, and that the task operating state is normally restored from the abnormality. 6. The task monitoring system according to claim 1, wherein the task monitoring system selectively shows
互に、ネットワークを介して接続された1又は複数のサ
ーバーによって複数のタスクが運用されるコンピュータ
システムにおいて、タスクの運用状態を監視するための
方法であって、 1のサーバー上で運用されるタスクによって、当該サー
バーで運用される他のタスクの運用状態を所定の時間間
隔で検知し、その検知結果に基づいて所定の信号を出力
し、 前記出力された信号に基づいて、当該タスクの監視状態
を示す情報と、当該検知された前記他のタスクの運用状
態を示す情報とを、前記クライアントが取得可能な形態
で、時刻に係る情報とともに複数記憶することを特徴と
するタスク監視方法。7. A method for monitoring the operational status of a task in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network. Then, the task operated on the server 1 detects the operation status of other tasks operated on the server at a predetermined time interval, and outputs a predetermined signal based on the detection result. A plurality of pieces of information indicating the monitoring status of the task and information indicating the operating status of the detected other task based on the signal that has been acquired, together with information related to the time in a form that the client can obtain. A task monitoring method characterized by:
互に、ネットワークを介して接続された1又は複数のサ
ーバーによって複数のタスクが運用されるコンピュータ
システムにおいて、1又は複数のサーバーにおいて実行
されるプログラムであって、 1のサーバー上で運用されるタスクによって、当該サー
バーで運用される他のタスクの運用状態を所定の時間間
隔で検知し、その検知結果に基づいて所定の信号を出力
する過程と、 前記出力された信号に基づいて、当該タスクの監視状態
を示す情報と、当該検知された前記他のタスクの運用状
態を示す情報とを、前記クライアントが取得可能な形態
で、時刻に係る情報とともに複数記憶する過程とを記述
したことを特徴とするタスク監視プログラム。8. A computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network, by a program executed by the one or a plurality of servers. Then, the process of detecting the operating status of other tasks operated by the server at a predetermined time interval by a task operated on one server, and outputting a predetermined signal based on the detection result, Based on the output signal, information indicating the monitoring status of the task, and information indicating the operating status of the detected other task, together with information related to the time in a form that the client can obtain. A task monitoring program characterized in that a plurality of storing processes are described.
ンピュータ読み取り可能な記録媒体。9. A computer-readable recording medium in which the program according to claim 8 is recorded.
相互に、ネットワークを介して接続された1又は複数の
サーバーによって複数のタスクが運用されるコンピュー
タシステムにおける1のサーバーであって、 当該1のサーバー上で運用されるタスクであって、当該
サーバーで運用される他のタスクの運用状態を所定の時
間間隔で検知し、その検知結果に基づいて所定の信号を
出力するタスク監視手段と、 前記タスク監視手段から出力された信号に基づいて、当
該タスク監視手段の動作状態を示す情報と、当該タスク
監視手段によって検知された前記他のタスクの状態を示
す情報とを、前記クライアントが取得可能な形態で、時
刻に係る情報とともに複数記憶させる記憶手段とを備え
ることを特徴とするタスク監視サーバー。10. A server in a computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients or mutually via a network, on the one server. Task monitoring means for detecting the operating states of other tasks operated by the server at a predetermined time interval and outputting a predetermined signal based on the detection result, and the task monitoring Based on the signal output from the means, the information indicating the operation state of the task monitoring means and the information indicating the state of the other task detected by the task monitoring means can be acquired by the client. And a storage unit for storing a plurality of pieces of information together with time information.
ークを介して接続された1又は複数のサーバーによって
複数のタスクが運用されるコンピュータシステムにおい
て、その1又は複数のクライアントにおいて実行される
プログラムであって、 1又は複数のサーバーで運用される1又は複数のタスク
の運用状態を所定の監視用タスクによって所定の時間間
隔で検知した結果をその監視用タスクの動作状態を示す
時刻情報とともに記憶した記憶手段にアクセスし、その
監視用タスクの動作状態を示す時刻情報を取得する過程
と、 取得した監視用タスクの動作状態を示す時刻情報と、現
在の時刻情報とに基づいて、監視用タスクの動作状態の
異常の有無を判断する過程とを記述したことを特徴とす
るタスク監視プログラム。11. A computer system in which a plurality of tasks are operated by one or a plurality of servers connected to one or a plurality of clients via a network, the program being executed by the one or more clients. A storage unit that stores the operation state of one or more tasks operated by one or more servers at predetermined time intervals by a predetermined monitoring task, together with time information indicating the operating state of the monitoring task. Based on the process of accessing and acquiring the time information indicating the operating status of the monitoring task, the time information indicating the operating status of the acquired monitoring task, and the current time information, the operation status of the monitoring task A task monitoring program, characterized in that a process for judging the presence or absence of an abnormality is described.
たコンピュータ読み取り可能な記録媒体。12. A computer-readable recording medium in which the program according to claim 11 is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001339400A JP2003140925A (en) | 2001-11-05 | 2001-11-05 | Task monitoring system and its method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001339400A JP2003140925A (en) | 2001-11-05 | 2001-11-05 | Task monitoring system and its method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003140925A true JP2003140925A (en) | 2003-05-16 |
Family
ID=19153752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001339400A Withdrawn JP2003140925A (en) | 2001-11-05 | 2001-11-05 | Task monitoring system and its method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003140925A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146397A (en) * | 2006-12-11 | 2008-06-26 | Hitachi Ltd | Device and method for monitoring process |
CN109298962A (en) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | Monitoring method, computer readable storage medium and the terminal device of timed task |
JP2020115330A (en) * | 2018-12-20 | 2020-07-30 | ザ・ボーイング・カンパニーThe Boeing Company | System and method of monitoring software application process |
JP7584217B2 (en) | 2018-12-20 | 2024-11-15 | ザ・ボーイング・カンパニー | System and method for monitoring software application processes - Patents.com |
-
2001
- 2001-11-05 JP JP2001339400A patent/JP2003140925A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008146397A (en) * | 2006-12-11 | 2008-06-26 | Hitachi Ltd | Device and method for monitoring process |
CN109298962A (en) * | 2018-09-03 | 2019-02-01 | 中国平安人寿保险股份有限公司 | Monitoring method, computer readable storage medium and the terminal device of timed task |
CN109298962B (en) * | 2018-09-03 | 2024-06-07 | 中国平安人寿保险股份有限公司 | Timing task monitoring method, computer readable storage medium and terminal device |
JP2020115330A (en) * | 2018-12-20 | 2020-07-30 | ザ・ボーイング・カンパニーThe Boeing Company | System and method of monitoring software application process |
JP7584217B2 (en) | 2018-12-20 | 2024-11-15 | ザ・ボーイング・カンパニー | System and method for monitoring software application processes - Patents.com |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9369521B2 (en) | Naming of distributed business transactions | |
US7100085B2 (en) | System for automated problem detection, diagnosis, and resolution in a software driven system | |
US9893963B2 (en) | Dynamic baseline determination for distributed transaction | |
CN105357038B (en) | Monitor the method and system of cluster virtual machine | |
US7051244B2 (en) | Method and apparatus for managing incident reports | |
JP6396887B2 (en) | System, method, apparatus, and non-transitory computer readable storage medium for providing mobile device support services | |
US20040059808A1 (en) | Extensible computer management rule engine | |
US10230611B2 (en) | Dynamic baseline determination for distributed business transaction | |
JP2010009552A (en) | Computer system for backing up software constituent elements, method therefor, and computer program | |
WO2000068793A1 (en) | System for automated problem detection, diagnosis, and resolution in a software driven system | |
CN114490272A (en) | Data processing method and device, electronic equipment and computer readable storage medium | |
JP2010009411A (en) | Virtual environment operation support system and virtual environment operation support program | |
JP2003233512A (en) | Client monitoring system with maintenance function, monitoring server, program, and client monitoring/ maintaining method | |
JP2004178296A (en) | Knowledge based operation management system, method and program | |
JP2005071191A (en) | User support system, method and server, and computer-executable program | |
CN113067722A (en) | Data management platform and working method thereof | |
JP2001005692A (en) | Computer system, its maintenance and management system, and method for informing of fault | |
JP2003140925A (en) | Task monitoring system and its method | |
JP2011203801A (en) | Problem information sharing system | |
JP3867868B2 (en) | Fault integrated management device | |
JP2000056823A (en) | Data monitoring system | |
CN113778800A (en) | Error reporting information processing method, device, system, equipment and storage medium | |
JPH11212826A (en) | Output system and device for fault information | |
JP2000112847A (en) | Client-server system and method for monitoring operation of client | |
JP2001005795A (en) | Method for detecting abnormality in distributed system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050201 |