JP2014186416A - System, method and device for managing job operation - Google Patents
System, method and device for managing job operation Download PDFInfo
- Publication number
- JP2014186416A JP2014186416A JP2013059376A JP2013059376A JP2014186416A JP 2014186416 A JP2014186416 A JP 2014186416A JP 2013059376 A JP2013059376 A JP 2013059376A JP 2013059376 A JP2013059376 A JP 2013059376A JP 2014186416 A JP2014186416 A JP 2014186416A
- Authority
- JP
- Japan
- Prior art keywords
- job
- instance
- time
- execution agent
- stop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000007726 management method Methods 0.000 claims description 140
- 230000004913 activation Effects 0.000 description 12
- 230000010365 information processing Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】インスタンスの総稼働時間を削減し、ジョブ運用管理システムの運用コストを低減する。
【解決手段】コンピュータ上でジョブ実行エージェントの動作するインスタンスが動作する。ジョブ管理マネージャー106は、ジョブ定義データベース305と、インスタンス管理制御部304とを備える。ジョブ定義データベース305には、複数のジョブについてジョブ実行エージェントが各ジョブの実行を開始するジョブ開始時刻が格納されている。インスタンス管理制御部304は、インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、インスタンス管理制御部304に格納されているジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合にインスタンスを停止させ、次のジョブのジョブ開始時刻の前に停止させたインスタンスを再起動する。
【選択図】図3An object of the present invention is to reduce the total operation time of an instance and reduce the operation cost of a job operation management system.
An instance in which a job execution agent operates on a computer. The job management manager 106 includes a job definition database 305 and an instance management control unit 304. The job definition database 305 stores job start times when the job execution agent starts executing each job for a plurality of jobs. The instance management control unit 304 starts the job of the next job in the job execution agent stored in the instance management control unit 304 after the number of jobs executed by the job execution agent running on the instance becomes zero. When the time until the time is longer than the start control time obtained by a predetermined method, the instance is stopped, and the instance stopped before the job start time of the next job is restarted.
[Selection] Figure 3
Description
本発明は、コンピュータで動作しているインスタンス上で動作するジョブ実行エージェントによって実行されるジョブを管理するジョブ運用管理システム、ジョブ運用管理方法およびジョブ管理装置に関する。 The present invention relates to a job operation management system, a job operation management method, and a job management apparatus that manage jobs executed by a job execution agent that operates on an instance running on a computer.
近年、ジョブ運用管理システムによる業務自動化の適用範囲は大規模・複雑化している。大規模・複雑化したジョブ運用管理システムでは、大量のジョブを処理するため、ジョブを各種システムが稼働するサーバ上のジョブ実行エージェントに配信して実行する方法が一般的である(例えば、特許文献1参照)。
このジョブ実行エージェントを動作させるためにクラウドコンピューティングが利用され始めている。クラウドコンピューティングでは、多くのコンピューティング・リソースを利用し、データ処理を分散実行することで、多くのジョブを同時に処理することが可能である。以下、コンピューティング・リソースを利用し機能を提供する、一つの処理の実態を「インスタンス」と総称する。インスタンスの一例は、例えば仮想コンピュータである。
In recent years, the scope of application of job automation by job operation management systems has become large and complex. In a large-scale / complex job operation management system, in order to process a large number of jobs, a method of distributing and executing a job to a job execution agent on a server on which various systems are operating is generally used (for example, Patent Documents). 1).
Cloud computing has begun to be used to operate this job execution agent. In cloud computing, it is possible to process many jobs simultaneously by using many computing resources and performing distributed data processing. Hereinafter, the actual state of one process that uses a computing resource to provide a function is collectively referred to as an “instance”. An example of an instance is a virtual computer, for example.
ジョブ運用管理システムで、大量のジョブを実行する場合には、ジョブ実行エージェントをインスタンス上で動作させ、ジョブ実行エージェントの数を増やすことで、多くのリソースを自由に利用できる。
しかしながら、クラウドコンピューティングでは稼働時間に応じて課金される。クラウドコンピューティングを利用する場合、インスタンス数を増やせば増やすほど、ジョブ運用管理システムの運用コストが増加してしまう。
When a large number of jobs are executed in the job operation management system, many resources can be freely used by operating the job execution agent on the instance and increasing the number of job execution agents.
However, in cloud computing, you are charged according to the operating time. When using cloud computing, as the number of instances increases, the operation cost of the job operation management system increases.
本発明の目的は、インスタンスの総稼働時間を削減し、運用コストを低減することができるジョブ運用管理システム、ジョブ運用管理方法およびジョブ管理装置を提供することである。 An object of the present invention is to provide a job operation management system, a job operation management method, and a job management apparatus that can reduce the total operation time of an instance and reduce the operation cost.
上記目的を達成するために、本発明のジョブ運用管理システムは、
ジョブ実行エージェントの動作するインスタンスが動作するコンピュータと、ジョブ管理装置とを有するジョブ運用管理システムであって、
前記ジョブ管理装置が、
複数のジョブについて前記ジョブ実行エージェントが各ジョブの実行を開始するジョブ開始時刻を記憶しているジョブ開始時刻記憶手段と、
前記インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止手段と、
前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動手段と、
を備える、
ことを特徴とする。
In order to achieve the above object, the job operation management system of the present invention provides:
A job operation management system having a computer on which an instance on which a job execution agent operates, and a job management device,
The job management device is
Job start time storage means for storing a job start time at which the job execution agent starts execution of each job for a plurality of jobs;
The time from when the number of jobs executed by the job execution agent running on the instance becomes 0 to the job start time of the next job in the job execution agent stored in the job start time storage unit Is an instance stop means for stopping the instance when it is longer than the start control time obtained by a predetermined method;
Instance restarting means for restarting the stopped instance before the job start time of the next job;
Comprising
It is characterized by that.
好ましくは、本発明のジョブ運用管理システムは、
前記ジョブ管理装置が、インスタンスについて予め設定された最低停止時間を記憶している最低停止時間記憶手段を備え、
前記インスタンス停止手段が、インスタンスを起動するために要する予測時間である起動予測時間と、インスタンスを停止するために要する予測時間である停止予測時間と、前記最低停止時間記憶手段に記憶されている最低停止時間とを加算することにより前記開始制御時間を求め、
前記インスタンス再起動手段が、前記次のジョブのジョブ開始時刻よりも前記起動予測時間だけ早い時刻に前記停止させたインスタンスを再起動する、
ことを特徴とする。
Preferably, the job operation management system according to the present invention includes:
The job management device comprises a minimum stop time storage means for storing a preset minimum stop time for an instance;
The instance stop means is an estimated start time that is an estimated time required to start an instance, an estimated stop time that is an estimated time required to stop an instance, and a minimum stored in the minimum stop time storage means The start control time is obtained by adding the stop time,
The instance restarting unit restarts the stopped instance at a time earlier than the job start time of the next job by the predicted startup time;
It is characterized by that.
好ましくは、本発明のジョブ運用管理システムは、
前記インスタンス停止手段が、前記開始制御時間を求める際に、前記インスタンスの起動にかかる平均時間を前記起動予測時間として用い、前記インスタンスの停止にかかる平均時間を前記停止予測時間として用い、
前記インスタンス再起動手段が、前記インスタンスの起動にかかる平均時間を前記起動予測時間として用いる、
ることを特徴とする。
Preferably, the job operation management system according to the present invention includes:
When the instance stop means obtains the start control time, the average time taken to start the instance is used as the predicted start time, and the average time taken to stop the instance is used as the predicted stop time.
The instance restarting means uses an average time taken to start the instance as the predicted start time.
It is characterized by that.
また、本発明のジョブ運用管理方法は、
ジョブ実行エージェントの動作するインスタンスが動作するコンピュータと、複数のジョブについて前記ジョブ実行エージェントが各ジョブの実行を開始するジョブ開始時刻を記憶しているジョブ開始時刻記憶手段を備えるジョブ管理装置とを有するジョブ運用管理システムにおけるジョブ運用管理方法であって、
前記ジョブ管理装置が、前記インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止ステップと、
前記ジョブ管理装置が、前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動ステップと、
を備えることを特徴とする。
In addition, the job operation management method of the present invention includes:
A computer on which an instance on which the job execution agent operates operates; and a job management apparatus including a job start time storage unit that stores job start times at which the job execution agent starts executing each job for a plurality of jobs. A job operation management method in a job operation management system,
After the number of jobs executed by the job execution agent operating on the instance becomes 0, the job management apparatus stores the next job in the job execution agent stored in the job start time storage unit. An instance stop step for stopping the instance when the time until the job start time is longer than the start control time obtained by a predetermined method;
An instance restarting step in which the job management device restarts the stopped instance before the job start time of the next job;
It is characterized by providing.
また、本発明のジョブ管理装置は、
複数のジョブについてジョブ実行エージェントが各ジョブの実行を開始するジョブ開始時刻を記憶しているジョブ開始時刻記憶手段と、
コンピュータで動いているインスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止手段と、
前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動手段と、
を備えることを特徴とする。
In addition, the job management apparatus according to the present invention includes:
Job start time storage means for storing a job start time at which the job execution agent starts executing each job for a plurality of jobs;
After the number of jobs executed by the job execution agent running on the instance running on the computer becomes zero, the job start of the next job in the job execution agent stored in the job start time storage means Instance stopping means for stopping the instance when the time until the time is longer than the start control time obtained by a predetermined method;
Instance restarting means for restarting the stopped instance before the job start time of the next job;
It is characterized by providing.
本発明によれば、インスタンスの総稼働時間を削減し、ジョブ運用管理システムの運用コストを低減することができる。 According to the present invention, it is possible to reduce the total operation time of the instance and reduce the operation cost of the job operation management system.
以下、本発明の実施形態に係るジョブ運用管理システム、ジョブ運用管理方法およびジョブ管理装置について図面を参照しながら説明する。なお、実施形態を説明する全図において、共通の構成要素には同一の符号を付し、繰り返しの説明を省略する。 Hereinafter, a job operation management system, a job operation management method, and a job management apparatus according to an embodiment of the present invention will be described with reference to the drawings. In all the drawings for explaining the embodiments, common constituent elements are denoted by the same reference numerals, and repeated explanation is omitted.
図1は、本発明の実施形態に係るジョブ運用管理システムの構成の一例を示す。
本発明の実施形態に係るジョブ運用管理システムを構成する各装置は、情報をやり取りするための通信回線であるネットワーク100およびインターネット101を介して、相互に通信可能に接続されている。
ジョブ運用管理システムを構成する各装置とは、1台以上のサーバコンピュータで構成されているサーバコンピュータ群102、ジョブの実行を管理するコンピュータであるジョブ管理マネージャーサーバ103、ジョブを実行するコンピュータであるジョブ実行エージェントサーバ104、およびジョブの実行を管理するユーザが使用する端末105である。
ジョブ管理マネージャーサーバ103では、ジョブ管理マネージャー106が動作する。ジョブ管理マネージャー106は複数のジョブ実行エージェントにおけるジョブの実行を管理する。サーバコンピュータ群102では、インスタンス107とインスタンス108が仮想コンピュータとして実現される。インスタンス107とインスタンス108では、それぞれジョブ実行エージェントA109とジョブ実行エージェントB110が動作する。また、ジョブ実行エージェントサーバ104ではジョブ実行エージェントC111が動作する。ジョブ実行エージェントA109、ジョブ実行エージェントB110、およびジョブ実行エージェントC111はジョブを実行する
なお、図1には、ジョブ実行エージェントサーバ1台とインスタンス2個を備えるジョブ運用管理システムを例示しているが、ジョブ実行エージェントサーバとインスタンスの数は、それぞれ任意であってよい。
FIG. 1 shows an example of the configuration of a job operation management system according to an embodiment of the present invention.
Each apparatus constituting the job operation management system according to the embodiment of the present invention is connected to be communicable with each other via a
The devices constituting the job operation management system are a
In the job
図2は、サーバコンピュータ群102を構成する各サーバコンピュータ、ジョブ管理マネージャーサーバ103、およびジョブ実行エージェントサーバ104を構成する情報処理装置200の内部構成の一例を示す。
情報処理装置200はコンピュータである。情報処理装置200は、CPU(Central Processing Unit)201、RAM(Random Access Memory)等で構成される主メモリ202、ハードディスク203、ネットワークインターフェースカード204により構成される。
ネットワークインターフェースカード204は、ネットワーク100を介して、他のノード(コンピュータ等)と双方向にデータをやり取りする。
FIG. 2 shows an example of the internal configuration of the information processing apparatus 200 constituting each server computer, job
The information processing apparatus 200 is a computer. The information processing apparatus 200 includes a main memory 202 including a CPU (Central Processing Unit) 201, a RAM (Random Access Memory), a
The
図3は、ジョブ管理マネージャー103の構成の一例を示す。
ジョブ管理マネージャーサーバ103のハードディスク203は、ジョブ管理プログラムと、ジョブ定義データベース305と、エージェント定義データベース306と、インスタンス統計データベース307とを記憶している。
ジョブ管理マネージャーサーバ103のCPU201が、ハードディスク203からジョブ管理プログラムを主メモリ202に読み込んで実行することにより、ジョブ定義データベース参照更新部301と、エージェント定義データベース参照更新部302と、ジョブ実行管理部303と、インスタンス管理制御部304との各部の機能が実現される。
FIG. 3 shows an example of the configuration of the
The
When the
ジョブ定義データベース305は、後述するように、ジョブ名とジョブ実行エージェント名とジョブ開始時刻とを含むジョブ定義データを格納している。ジョブ定義データベース参照更新部301は、端末105からの指示によりジョブ定義データベース305を更新し、ジョブ定義データを端末105のディスプレイ等に可視化して表示する。
エージェント定義データベース306は、後述するように、ジョブ実行エージェント名とインスタンス識別フラグとインスタンスの最低停止時間とを含むエージェント定義データを格納している。エージェント定義データベース参照更新部302は、端末105からの指示によりエージェント定義データベース306を更新し、エージェント定義データを端末105のディスプレイ等に可視化して表示する。
ジョブ実行管理部303は、ジョブ実行エージェントA109、ジョブ実行エージェントB110、およびジョブ実行エージェントC111のジョブ実行を管理する。
インスタンス統計データベース307は、後述するように、ジョブ実行エージェント名601と起動所要時間の合計602と起動回数603と停止所要時間の合計604と停止回数605とを含むインスタンス統計データを格納している。インスタンス管理制御部304は、インスタンスの起動および停止を管理し、インスタンス統計データベース307を更新する。
なお、ジョブ管理マネージャー103は本発明のジョブ管理装置の一例であり、インスタンス管理制御部304は本発明のインスタンス停止手段とインスタンス再起動手段の一例である。
As will be described later, the
As will be described later, the
The job
The instance
The
図4は、ジョブ定義データベース305に格納されるジョブ定義データの構成の一例を示す。
ジョブ定義データベース305のジョブ定義データは、ジョブ名401と、ジョブ実行エージェント名402と、ジョブ開始時刻403とを含んで構成されている。
ジョブ名401は、ジョブを一意に識別するための情報である。
ジョブ実行エージェント名402は、ジョブがどのジョブ実行エージェントで実行されるかを識別するための情報である。
ジョブ開始時刻403は、ジョブ実行管理部303がジョブの実行を開始する時刻である。
なお、ジョブ定義データベース305は、本発明のジョブ開始時刻記憶手段の一例である。
FIG. 4 shows an example of the configuration of job definition data stored in the
The job definition data in the
The
The job
The job start
The
図5は、エージェント定義データベース306に格納されるエージェント定義データの構成の一例を示す。
エージェント定義データベース306のエージェント定義データは、ジョブ実行エージェント名501と、インスタンス識別フラグ502と、インスタンスの最低停止時間503とを含んで構成されている。
ジョブ実行エージェント名501は、ジョブ実行エージェントを一意に識別するための情報である。
インスタンス識別フラグ502は、ジョブ実行エージェントが、ジョブ管理エージェントサーバ104のようにインスタンスとして管理できないコンピュータ上で動作しているか、インスタンス107とインスタンス108のようにサーバコンピュータ群102のインスタンス上で動作しているか識別するためのフラグ情報である。
例えば、インスタンス管理制御部304が、インスタンス上で動作するジョブだけを抽出する場合は、まず、エージェント定義データベース306のインスタンス識別フラグ502に基づいてジョブ実行エージェントAとジョブ実行エージェントBとがインスタンス上で動作することを識別する。そして、インスタンス管理制御部304は、ジョブ定義データベース305を検索し、ジョブ実行エージェントAとジョブ実行エージェントBとで動作するジョブを選択する。図4と図5に示す場合には、JobA、JobB、JobC、JobD、JobFがインスタンス上で動作するジョブとして抽出される(JobEは除外される)。
FIG. 5 shows an example of the configuration of agent definition data stored in the
The agent definition data in the
The job
The
For example, when the instance
インスタンスの最低停止時間503は、インスタンスを停止させる最小の時間であり、予め設定される。インスタンス管理制御部304は、最低停止時間503以上インスタンスを停止させることができる場合にのみインスタンスを停止させる。仮にインスタンスを停止させても最低停止時間503が経過するまえにインスタンスを再起動しなければならない場合、インスタンス管理制御部304はインスタンスを停止させない。
ここで、インスタンスの起動と停止にはある程度の時間が必要であり、インスタンスの起動に要する起動時間、およびその停止に要する停止時間は他のジョブの実行状況等により変動する。
そこで、インスタンス管理制御部304は、インスタンスを起動するために要する予測時間である起動予測時間と、インスタンスを停止するために要する予測時間である停止予測時間と、インスタンスの最低停止時間503とを加算することにより、開始制御時間を求める。そして、インスタンス管理制御部304は、インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、そのジョブ実行エージェントが次のジョブの実行を開始するまでの時間が開始制御時間よりも長い場合にはインスタンスを停止させる。一方、インスタンス管理制御部304は、そのジョブ実行エージェントが実行しているジョブの数が0になっても開始制御時間が経過する前にそのジョブ実行エージェントが次のジョブの実行を開始する場合にはインスタンスを停止させない。開始制御時間にインスタンスの最低停止時間503を含めることにより、ジョブの開始時刻になったとき、ジョブが実行可能となっていることが保証される。
なお、エージェント定義データベース306は、本発明の最低停止時間記憶手段の一例である。
The
Here, a certain amount of time is required to start and stop the instance, and the start time required to start the instance and the stop time required to stop the instance vary depending on the execution status of other jobs.
Therefore, the instance
The
図6は、インスタンス統計データベース307に格納されるインスタンス統計データの構成の一例を示す。
インスタンス統計データベース307のインスタンス統計データは、ジョブ実行エージェント名601と、起動所要時間の合計602と、起動回数603と、停止所要時間の合計604と、停止回数605とを含んで構成されている。
ジョブ実行エージェント名601は、ジョブ実行エージェントを一意に識別するための情報である。
起動所要時間の合計602と、起動回数603と、停止所要時間の合計604と、停止回数605とはジョブ実行エージェント名601のジョブ実行エージェントが動作するインスタンスの統計情報である。
起動所要時間の合計602は、インスタンスの起動にかかった所要時間の和である。起動回数603は、インスタンスが起動された回数である。起動所要時間の合計602を起動回数603で除算することで、インスタンスの起動にかかる平均時間を算出できる。インスタンスの起動にかかる平均時間は、上述した開始制御時間を求める際に起動予測時間として用いられる。
停止所要時間の合計604は、インスタンスの停止にかかった所要時間の和である。停止回数605は、インスタンスが停止された回数である。停止所要時間の合計604を停止回数605で除算することで、インスタンスの停止にかかる平均時間を算出できる。インスタンスの停止にかかる平均時間は、上述した開始制御時間を求める際に停止予測時間として用いられる。
FIG. 6 shows an example of the configuration of instance statistical data stored in the instance
The instance statistical data in the instance
The job
The total required
The
The
例えば、インスタンス管理制御部304が、ジョブ実行エージェントAが動作するインスタンスの起動および停止にかかる平均時間を算出しようとした場合は、ジョブ実行エージェントAの起動所要時間の合計60分を起動回数6で除算することで、ジョブ実行エージェントAが動作しているインスタンスの起動にかかる平均時間は10分と算出できる。同様に、ジョブ実行エージェントAの停止所要時間の合計30分を停止回数6で除算することで、ジョブ実行エージェントAが動作しているインスタンスの停止にかかる平均時間は5分と算出できる。
For example, when the instance
図7は、インスタンス制御管理部304が求めて、ジョブ管理マネージャーサーバ103の主メモリ202に記憶させるインスタンス制御開始時刻データの一例を示す。
インスタンス制御開始時刻データは、ジョブ名701と、ジョブ実行エージェント名702と、インスタンス制御開始時刻703とを含んで構成されている。
ジョブ名701は、どのジョブの実行に伴うインスタンス制御開始時刻なのかを識別するための情報である。
ジョブ実行エージェント名702は、ジョブ名701について、どの実行エージェントが動作するインスタンスの制御開始時刻なのかを識別するための情報である。
インスタンス制御開始時刻703は、インスタンス管理制御部304がジョブ名701についてインスタンス制御を開始する時刻である。インスタンス制御開始時刻703のデータはインスタンス管理制御部304が作成する。インスタンス管理制御部304は、まず、インスタンスの起動および停止にかかる平均時間とインスタンスの最低停止時間503を加算して開始制御時間を求める。次に、インスタンス管理制御部304は、ジョブ開始時刻403から、開始制御時間だけ早めた時刻をインスタンス制御開始時刻703として求める。インスタンス管理制御部304は、ジョブ名701およびジョブ実行エージェント名702と共にインスタンス制御開始時刻703をインスタンス制御開始時刻データとして主メモリ202に保存する。
FIG. 7 shows an example of instance control start time data obtained by the instance
The instance control start time data includes a
The
The job
The instance control start
例えば、インスタンス管理制御部304が、JobAのインスタンス制御開始時刻を求めようとした場合は、ジョブ実行エージェントAのインスタンスの起動および停止にかかる平均時間を、インスタンス統計データベース307から10分および5分と求める。さらに、ジョブ実行エージェントAのインスタンスの最低停止時間503である60分を、エージェント定義データベース306から取得する。このインスタンスの起動および停止にかかる平均時間の合計15分とインスタンスの最低停止時間60分の総和である開始制御時間(計1時間15分)を、JobAの開始時刻7:00から早めた5:45がJobAのインスタンス制御開始時刻として求まる。
For example, when the instance
図8は、インスタンス制御管理部304が求めて、ジョブ管理マネージャーサーバ103の主メモリ202に記憶させるインスタンス起動時刻データを示す。
インスタンス起動時刻データは、ジョブ実行エージェント名801と、インスタンス起動時刻802とを含んで構成されている。
ジョブ実行エージェント名801は、インスタンスを一意に特定するために、インスタンス上で動作しているジョブ実行エージェントを識別するための情報である。
インスタンス起動時刻802は、インスタンスの起動を開始する時刻である。インスタンス管理制御部304は、インスタンス制御開始時刻703に到達した時、インスタンスが起動していなければ、まず、ジョブ名701に基づいてジョブ定義データベース305からジョブ開始時刻403を取得する。次に、インスタンス管理制御部304は、ジョブ開始時刻403からインスタンスの起動に要する予測時間だけ早めた時刻をインスタンス起動時刻802として求め、主メモリ202に保存する。ここで、インスタンス起動時刻802はジョブ開始時刻403に到達したときインスタンスが起動されてジョブ実行エージェントがジョブを実行可能になっている時刻である。従って、インスタンス管理制御部304は、例えば、インスタンスの起動に要する平均時間をインスタンスの起動にかかる予測時間としもよいし、インスタンスの起動に要する平均時間より少し長い時間をインスタンスの起動にかかる予測時間としてもよい。
FIG. 8 shows the instance activation time data obtained by the instance
The instance activation time data includes a job execution agent name 801 and an
The job execution agent name 801 is information for identifying the job execution agent operating on the instance in order to uniquely identify the instance.
The
図9は、インスタンス管理制御部304が求めて、ジョブ管理マネージャーサーバ103の主メモリ202に記憶させるインスタンス制御中のジョブ数データの一例を示す。
インスタンス制御中のジョブ数データは、ジョブ実行エージェント名901と、インスタンス制御中のジョブ数902とを含んで構成されている。
ジョブ実行エージェント名901は、インスタンスを一意に特定するために、インスタンス上で動作しているジョブ実行エージェントを識別するための情報である。
インスタンス制御中のジョブ数902は、ジョブ実行エージェント名901に示すジョブ実行エージェントが動作するインスタンスごとに、何個のジョブがインスタンス制御の対象になっているかを示す値であり、インスタンスの起動および停止を行うタイミングの判定に使用する。インスタンス管理制御部304は、インスタンス制御中のジョブ数902が、0から1になった場合にインスタンスを起動し、1から0になった場合にインスタンスを停止する。
例えば、インスタンス管理制御部304は、JobAのインスタンス制御開始時刻703に到達した時、主メモリ202上に存在するジョブ実行エージェントAのインスタンス制御中のジョブ数902をカウントアップする。また、カウントアップ前のインスタンス制御中のジョブ数902が0だった場合は、インスタンス制御を開始する。
ジョブ実行管理部303がJobAの実行を正常に終了した場合、インスタンス管理制御部304は、ジョブ実行管理部303からJobAが正常終了した通知を受け、ジョブ実行エージェントAのインスタンス制御中のジョブ数902をカウントダウンする。また、ンスタンス管理制御部304は、カウントダウン後のインスタンス制御中のジョブ数902が0となる場合は、インスタンスを停止する。
FIG. 9 shows an example of job count data during instance control that is obtained by the instance
The job count data during instance control includes a job
The job
The number of jobs under
For example, when the instance
When the job
図10は、インスタンス管理制御部304がインスタンス制御開始時刻703を求める処理の流れの一例を示すフローチャートである。
インスタンス管理制御部304は、立ち上げと同時に、エージェント定義データベース306からインスタンス上で動作するジョブ実行エージェント名501の一覧を取得する(S11)。
インスタンス管理制御部304は、ステップS11で取得したジョブ実行エージェント名501の一覧に基づいて、ジョブ定義データベース305から、インスタンス上で動作するジョブ実行エージェントで実行されるジョブのジョブ定義データとして、ジョブ名401、ジョブ実行エージェント名402、およびジョブ開始時刻403を取得する(S12)。
インスタンス管理制御部304は、ステップS11で取得したジョブ実行エージェント名501の一覧に基づいてインスタンス統計データベース307を参照し、各ジョブ実行エージェントのインスタンスの起動および停止にかかる平均時間を、所要時間の合計を回数で除算することで求める(S13)。
インスタンス管理制御部304は、インスタンスの起動および停止にかかる平均時間とインスタンスの最低停止時間503とを加算して開始制御時間を求める。そして、インスタンス管理制御部304は、ジョブ開始時刻403から開始制御時間だけ早めた時刻をインスタンス制御開始時刻703として求め、ジョブ名701やジョブ実行エージェント名702と共に各ジョブのインスタンス制御開始時刻703を、インスタンス制御開始時刻データに保存する(ステップ1004)。
FIG. 10 is a flowchart illustrating an example of a flow of processing in which the instance
The instance
Based on the list of job
The instance
The instance
図11は、インスタンス管理制御部304がインスタンス開始時刻802を求める処理の流れの一例を示すフローチャートである。
インスタンス管理制御部304は、インスタンス制御開始時刻703に到達したことを検知する(S21)と、インスタンス制御中のジョブ数902が0かどうかを判定する(S22)。
インスタンス制御中のジョブ数902が0の場合(S22:YES)、インスタンス管理制御部304は、インスタンス統計データベース307からインスタンスの起動にかかる平均時間を求め、ジョブ開始時刻403からインスタンスの起動にかかる平均時間だけ早めた時刻を、インスタンス起動時刻802として求める(S23)。一方、インスタンス制御中のジョブ数902が0でなかった場合(S22:NO)、インスタンス管理制御部304は、インスタンス起動時刻802を求めない。
次に、インスタンス管理制御部304は、インスタンス制御中のジョブ数902をカウントアップする(S24)。
FIG. 11 is a flowchart illustrating an example of a flow of processing in which the instance
When the instance
When the number of
Next, the instance
図12は、インスタンス管理制御部304がインスタンスを起動する処理の流れの一例を示すフローチャートである。
インスタンス管理制御部304は、インスタンス起動時刻802に到達したことを検知する(S31)と、インスタンスの起動命令を実行する(S32)。
次に、インスタンス管理制御部304は、インスタンスの起動完了を確認した後、インスタンス統計データベース307の起動所要時間の合計602に、起動にかかった時間を加算して更新し、起動回数603をカウントアップする(S33)。
FIG. 12 is a flowchart illustrating an example of a process flow in which the instance
When the instance
Next, after confirming that the instance has been started, the instance
図13は、インスタンス管理制御部304がインスタンスを停止する処理の流れの一例を示すフローチャートである。
インスタンス管理制御部304は、ジョブ実行管理部303からジョブが正常終了した通知を受け取る(S41)と、インスタンス制御中のジョブ数902をカウントダウンする(S42)。
次に、インスタンス管理制御部304は、インスタンス制御中のジョブ数902が0かどうかを判定し(S43)、0でなかった場合(S43:NO)は、インスタンスの停止命令は実行せずに、処理を終了する。
インスタンス管理制御部304は、インスタンス制御中のジョブ数902が0だった場合(S43:YES)は、インスタンスの停止命令を実行する(S44)。
インスタンス管理制御部304は、インスタンスの停止完了を確認した後、インスタンス統計データベース307の停止所要時間の合計604に、停止にかかった時間を加算して更新し、停止回数605をカウントアップする(S45)。
FIG. 13 is a flowchart illustrating an example of a process flow in which the instance
When the instance
Next, the instance
When the number of
After confirming that the instance has been stopped, the instance
図14は、ジョブ実行エージェントA109が動作するインスタンス107の制御の一例を示す。
ここではJobA 1401およびJobC 1402、JobF 1403の各実行時間を1時間とし、それぞれの終了時刻を8:00および10:00、13:00と仮定する。
JobA 1401のインスタンス制御開始時刻5:45の時点では、カウントアップ前のインスタンス制御中のジョブ数902が0である。このため、インスタンス管理制御部304は、JobA 1401のジョブ開始時刻7:00からジョブ実行エージェントAの起動にかかる平均時間10分だけ早めた6:50をインスタンス起動時刻として求め、インスタンスを起動する。
JobC 1402のインスタンス制御開始時刻7:45の時点では、カウントアップ前のインスタンス制御中のジョブ数902が1のため、インスタンス管理制御部304はインスタンス起動時刻を求めない。JobA 1401が終了時刻8:00に終了するが、カウントダウン後のインスタンス制御中のジョブ数902が1のため、インスタンス管理制御部304はインスタンスを停止しない。JobC 1402が終了時刻10:00に終了すると、カウントダウン後のインスタンス制御中のジョブ数902は0となるため、インスタンス管理制御部304はインスタンスの停止を実行し、インスタンスは10:05に停止する。
また、JobF 1403のインスタンス制御開始時刻10:45に到達した時、カウントアップ前のインスタンス制御中のジョブ数902は0である。このため、インスタンス管理制御部304は、JobF 1403のジョブ開始時刻12:00からジョブ実行エージェントAの起動にかかる平均時間10分だけ早めた11:50をインスタンス起動時刻として求め、インスタンスを再び起動する。JobF 1403が終了時刻13:00に終了すると、カウントダウン後のインスタンス制御中のジョブ数902は0となるため、インスタンス管理制御部304はインスタンスの停止を再び実行し、インスタンスは13:05に停止する。
FIG. 14 shows an example of control of the
Here, it is assumed that each execution time of
At the instance control start time 5:45 of
At the instance control start time 7:45 of
Further, when the instance control start time 10:45 of
以上説明したように、本発明によれば、ジョブが実行されていないときインスタンスは停止する。このため、インスタンスの総稼働時間を削減し、ジョブ運用管理システムの運用コストを低減することができる。 As described above, according to the present invention, the instance is stopped when the job is not executed. For this reason, the total operation time of the instance can be reduced, and the operation cost of the job operation management system can be reduced.
100 ネットワーク
101 インターネット
102 サーバコンピュータ群
103 ジョブ管理マネージャーサーバ
104 ジョブ実行エージェントサーバ
105 端末
106 ジョブ管理マネージャー
107、108 インスタンス
109 ジョブ実行エージェントA
110 ジョブ実行エージェントB
111 ジョブ実行エージェントC
301 ジョブ定義データベース参照更新部
302 エージェント定義データベース参照更新部
303 ジョブ実行管理部
304 インスタンス管理制御部
305 ジョブ定義データベース
306 エージェント定義データベース
307 インスタンス統計データベース
503 インスタンスの最低停止時間
602 起動所要時間の合計
603 起動回数
604 停止所要時間の合計
605 停止回数
703 インスタンス制御開始時刻
802 インスタンス起動時刻
902 インスタンス制御中のジョブ数
110 Job execution agent B
111 Job execution agent C
301 Job definition database
Claims (5)
前記ジョブ管理装置が、
複数のジョブについて前記ジョブ実行エージェントが各ジョブの実行を開始するジョブ開始時刻を記憶しているジョブ開始時刻記憶手段と、
前記インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止手段と、
前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動手段と、
を備える、
ことを特徴とするジョブ運用管理システム。 A job operation management system having a computer on which an instance on which a job execution agent operates, and a job management device,
The job management device is
Job start time storage means for storing a job start time at which the job execution agent starts execution of each job for a plurality of jobs;
The time from when the number of jobs executed by the job execution agent running on the instance becomes 0 to the job start time of the next job in the job execution agent stored in the job start time storage unit Is an instance stop means for stopping the instance when it is longer than the start control time obtained by a predetermined method;
Instance restarting means for restarting the stopped instance before the job start time of the next job;
Comprising
A job operation management system characterized by that.
前記インスタンス停止手段が、インスタンスを起動するために要する予測時間である起動予測時間と、インスタンスを停止するために要する予測時間である停止予測時間と、前記最低停止時間記憶手段に記憶されている最低停止時間とを加算することにより前記開始制御時間を求め、
前記インスタンス再起動手段が、前記次のジョブのジョブ開始時刻よりも前記起動予測時間だけ早い時刻に前記停止させたインスタンスを再起動する、
ことを特徴とする請求項1に記載のジョブ運用管理システム。 The job management device comprises a minimum stop time storage means for storing a preset minimum stop time for an instance;
The instance stop means is an estimated start time that is an estimated time required to start an instance, an estimated stop time that is an estimated time required to stop an instance, and a minimum stored in the minimum stop time storage means The start control time is obtained by adding the stop time,
The instance restarting unit restarts the stopped instance at a time earlier than the job start time of the next job by the predicted startup time;
The job operation management system according to claim 1.
前記インスタンス再起動手段が、前記インスタンスの起動にかかる平均時間を前記起動予測時間として用いる、
ることを特徴とする請求項2に記載のジョブ運用管理システム。 When the instance stop means obtains the start control time, the average time taken to start the instance is used as the predicted start time, and the average time taken to stop the instance is used as the predicted stop time.
The instance restarting means uses an average time taken to start the instance as the predicted start time.
The job operation management system according to claim 2.
前記ジョブ管理装置が、前記インスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止ステップと、
前記ジョブ管理装置が、前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動ステップと、
を備えることを特徴とするジョブ運用管理方法。 A computer on which an instance on which the job execution agent operates operates; and a job management apparatus including a job start time storage unit that stores job start times at which the job execution agent starts executing each job for a plurality of jobs. A job operation management method in a job operation management system,
After the number of jobs executed by the job execution agent operating on the instance becomes 0, the job management apparatus stores the next job in the job execution agent stored in the job start time storage unit. An instance stop step for stopping the instance when the time until the job start time is longer than the start control time obtained by a predetermined method;
An instance restarting step in which the job management device restarts the stopped instance before the job start time of the next job;
A job operation management method comprising:
コンピュータで動いているインスタンス上で動作するジョブ実行エージェントが実行しているジョブの数が0になってから、前記ジョブ開始時刻記憶手段に記憶されている当該ジョブ実行エージェントにおける次のジョブのジョブ開始時刻までの時間が、所定の方法で求めた開始制御時間よりも長い場合に前記インスタンスを停止させるインスタンス停止手段と、
前記次のジョブのジョブ開始時刻の前に前記停止させたインスタンスを再起動するインスタンス再起動手段と、
を備えることを特徴とするジョブ管理装置。 Job start time storage means for storing a job start time at which the job execution agent starts executing each job for a plurality of jobs;
After the number of jobs executed by the job execution agent running on the instance running on the computer becomes zero, the job start of the next job in the job execution agent stored in the job start time storage means Instance stopping means for stopping the instance when the time until the time is longer than the start control time obtained by a predetermined method;
Instance restarting means for restarting the stopped instance before the job start time of the next job;
A job management apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013059376A JP2014186416A (en) | 2013-03-22 | 2013-03-22 | System, method and device for managing job operation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013059376A JP2014186416A (en) | 2013-03-22 | 2013-03-22 | System, method and device for managing job operation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014186416A true JP2014186416A (en) | 2014-10-02 |
Family
ID=51833962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013059376A Pending JP2014186416A (en) | 2013-03-22 | 2013-03-22 | System, method and device for managing job operation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014186416A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112021007903T5 (en) | 2021-06-30 | 2024-04-18 | Mitsubishi Electric Corporation | INFORMATION PROCESSING DEVICE, ORDER EXECUTION SYSTEM AND CONTROL METHOD |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225639A (en) * | 2007-03-09 | 2008-09-25 | Hitachi Ltd | Low power consumption job management method and computer system |
JP2012179908A (en) * | 2012-04-10 | 2012-09-20 | Canon Inc | Device and method for controlling device such as printing device or the like |
JP2012198843A (en) * | 2011-03-23 | 2012-10-18 | Fuji Xerox Co Ltd | Virtual server regulating system, virtual server control device and program |
-
2013
- 2013-03-22 JP JP2013059376A patent/JP2014186416A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225639A (en) * | 2007-03-09 | 2008-09-25 | Hitachi Ltd | Low power consumption job management method and computer system |
JP2012198843A (en) * | 2011-03-23 | 2012-10-18 | Fuji Xerox Co Ltd | Virtual server regulating system, virtual server control device and program |
JP2012179908A (en) * | 2012-04-10 | 2012-09-20 | Canon Inc | Device and method for controlling device such as printing device or the like |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112021007903T5 (en) | 2021-06-30 | 2024-04-18 | Mitsubishi Electric Corporation | INFORMATION PROCESSING DEVICE, ORDER EXECUTION SYSTEM AND CONTROL METHOD |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9740522B2 (en) | Controlled interruption and resumption of batch job processing | |
US10609159B2 (en) | Providing higher workload resiliency in clustered systems based on health heuristics | |
US10491704B2 (en) | Automatic provisioning of cloud services | |
WO2020024405A1 (en) | Test method, device, server and storage medium based on distributed coordination | |
WO2019237586A1 (en) | Method and apparatus for managing scheduled tasks, computer device and storage medium | |
CN103744734B (en) | A kind of Mission Operations processing method, apparatus and system | |
JP5416156B2 (en) | Integrated monitoring system and integrated monitoring program | |
CN111352797B (en) | System and method for monitoring software application processes | |
JP2008158628A (en) | Performance evaluation apparatus, performance evaluation method and program | |
CN109582486B (en) | Watchdog monitoring method, system and device and storage medium | |
JP7003874B2 (en) | Resource reservation management device, resource reservation management method and resource reservation management program | |
CN110651256A (en) | System and method for preventing service interruption during software update | |
JP6686371B2 (en) | Data staging management system | |
CN112866314B (en) | Method for switching slave nodes in distributed master-slave system, master node device and storage medium | |
TWI671640B (en) | Task processing method and device in distributed system | |
CN110196749B (en) | Virtual machine recovery method and device, storage medium and electronic device | |
CN106357757B (en) | Monitored device and monitoring method in a kind of monitoring system | |
CN107241370A (en) | The rollback method and system of resource operation under IaaS cloud environment | |
JP2017091330A (en) | Computer system and task executing method of computer system | |
JP2019008454A (en) | Information processing system and resource allocation method | |
JP2014186416A (en) | System, method and device for managing job operation | |
CN111506388B (en) | Container performance detection method, container management platform and computer storage medium | |
JP2015095151A (en) | Startup control program, apparatus, and method | |
CN115309457A (en) | Application instance restarting method and device, electronic equipment and readable storage medium | |
US9197519B2 (en) | Tracking objects within dynamic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150401 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150413 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150617 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160517 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20170207 |