JP6686371B2 - データステージング管理システム - Google Patents
データステージング管理システム Download PDFInfo
- Publication number
- JP6686371B2 JP6686371B2 JP2015213421A JP2015213421A JP6686371B2 JP 6686371 B2 JP6686371 B2 JP 6686371B2 JP 2015213421 A JP2015213421 A JP 2015213421A JP 2015213421 A JP2015213421 A JP 2015213421A JP 6686371 B2 JP6686371 B2 JP 6686371B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- staging
- stage
- data staging
- job
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5016—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(d)変更された目標ファイル及びディレクトリを転送するために、「notstarted」が設定される。
(g)DSMSは、バッチジョブスクリプトを検索し、データステージングの開始時間の後に変更されるファイル又はディレクトリを設定する。
(h)(g)に基づき、DSMSは(g)の合計サイズを計算する。
(i)変更されたファイル又はディレクトリはこの段階で未だ転送されていないので、「0」が設定される。
(j)変更されたファイル又はディレクトリはこの段階で未だ転送されていないので、(h)と同じ値が設定される。
[ステップ4−2]データステージング管理テーブル44から、DSMS42は、各「Predicted time」の和を計算し、それを「Total predicted time」属性の値に設定する。
ここで、小数は切り上げられる(したがって、例えば1.333は2になる)。上式は、データステージインとデータステージアウトの両方に適用される。
(Multiplicity for asynchronous short−term data staging processing)=19200[秒]/14400[秒]=1.33...=2
[ステップ4−7]「Multiplicity for asynchronous short−term data staging processing」に従って、DSMS42は、「Asynchronous short−term staging processing」リストの各エントリを、データステージングリスト46の中に、非同期短期ステージング処理として1列に並べる。
[ステップ9]バッチジョブを開始するための処理である。
(b)「stage−out」が設定される。
(c)初期値「000」が初期値として設定される。
(d)データステージングはこの段階で未だ開始されていないので、「notstarted」が設定される。
(g)DSMSはバッチジョブスクリプトを調べ、もしあれば目標データステージングファイル又はディレクトリを入れる。
(h)(g)に基づき、DSMSはデ―タステージング目標の合計サイズを計算し、値を設定する。
(i)この段階でデータステージング目標が転送されていないので、「0」が設定される。
(j)この段階でデータステージング目標が転送されていないので、(h)と同じ値が設定される。
データステージングジョブが完了すると(残り0バイト)、ジョブは、データステージングリスト46から削除できる。
10 HPCシステム
11 ヘッドノード
110 ジョブスケジューラ
110a プリプロセッサ
110b ポストプロセッサ
12 コンピューティングノード
20 一時記憶
22 入力
23 出力
30 永久記憶
32 入力
33 出力
40 データステージング管理サーバ
42 データステージング管理システム(DSMS)
44 データステージング管理テーブル
46 データステージングリスト
5 ネットワーク
Claims (13)
- コンピューティングシステムにおいてバッチジョブを実行するときデータステージングを管理する方法であって、各々のバッチジョブについて、
データステージインのための少なくとも1つのソースファイル及びデータステージアウトのための少なくとも1つの目標ファイルを識別するステップと、
データステージイン及びデータステージアウトで転送されるべきデータの量を決定し、前記のデータ転送を完了するための所要時間を推定するステップと、
前記バッチジョブの第1のデータステージング処理として、前記の推定した所要時間を閾値と比較することにより非同期又は同期データステージインを設定し、前記バッチジョブの第2のデータステージング処理として、非同期データステージアウトを設定するステップと、
前記ソースファイルからのデータステージインを実行し、前記データステージインを完了するための残り時間が前記閾値の範囲内になると、前記バッチジョブを実行するためにリソースを割り当てるステップと、
前記バッチジョブを実行して結果を生成するステップと、
前記目標ファイルへの前記結果のデータステージアウトを実行するステップと、
を有する方法。 - 前記方法は、前記設定するステップの後に、
データステージインの前記推定した所要時間を第2の閾値と更に比較することにより、前記第1のデータステージング処理を非同期短期又は非同期長期データステージインとして分類するステップと、
前記非同期短期データステージインとして分類されたデータステージング処理をデータステージングリストの中で非同期短期データステージングとして1列に並べるステップと、
前記非同期長期データステージインとして分類されたデータステージング処理を前記データステージングリストの中で非同期長期データステージングとして1列に並べるステップと、
を更に有し、
前記生成するステップは、
前記データステージングリストに基づき、前記バッチジョブを実行して結果を生成する、請求項1に記載の方法。 - 前記データステージングリストの中のデータステージング処理の予測時間の和、又は前記コンピューティングシステムの最大許容値のうちの大きい方を、データステージイン及び/又はデータステージアウトの最大時間として設定するステップと、
前記データステージングリストの中のデータステージング処理の予測時間の和を前記最大時間で除算することによりデータステージイン又はデータステージアウトの多重度を計算するステップと、
前記多重度に等しい数のデータステージング処理を有し、複数のバッチジョブのデータステージイン又はデータステージアウトを同時に実行するステップと、
を更に有する請求項2に記載の方法。 - 前記設定するステップは、各データステージング処理及び各々の状態を記録するデータステージング管理テーブルを形成するステップを有する、請求項1乃至3のいずれか一項に記載の方法。
- データステージインを実行している間、前記ソースファイルがデータステージインの開始から変更されたか否かを調べ、変更された場合、追加データステージング処理として前記テーブルにインクリメンタルデータステージインを設定するステップ、
を更に有する請求項4に記載の方法。 - 前記データステージング管理テーブルは、データステージング処理の各々について、
前記データステージング処理が設定される前記バッチジョブの識別子と、
前記データステージング処理がデータステージインかデータステージアウトかの指示と、
場合によっては各々のソースファイル又は目標ファイルの位置と、
転送されるべきデータの量と、
を含む初期情報を有する、請求項4又は5に記載の方法。 - 前記初期情報は、前記識別するステップ及び推定するステップを実行するためにバッチジョブスクリプトを分析することにより得られる、請求項6に記載の方法。
- 前記データステージング管理テーブルは、データステージング処理の各々について、
前記データステージング処理がインクリメンタルデータステージインか否かの指示と、
前記データステージング処理が開始していない、実行中である、又は完了したかと、
データステージング処理の開始時間と、
データステージング処理の終了時間と、
今までに転送されたデータ量及び/又は転送されるべき残りデータ量と、
前記データステージング処理のための前記推定した所要時間と、
を含む更なる情報を有する、請求項6に記載の方法。 - 前記データステージング管理テーブルに基づき、複数のバッチジョブのデータステージイン又はデータステージアウトをスケジューリングするためにデータステージングリストを構築するステップと、
を更に有する請求項4乃至8のいずれか一項に記載の方法。 - バッチジョブを実行するコンピュータシステムにおいてデータステージングを管理するデータステージングマネジャであって、前記データステージングマネジャは、各々のバッチジョブについて、
データステージインのための少なくとも1つのソースファイル及びデータステージアウトのための少なくとも1つの目標ファイルを識別し、
データステージイン及びデータステージアウトで転送されるべきデータの量を決定し、前記のデータ転送を完了するための所要時間を推定し、
前記バッチジョブの第1のデータステージング処理として、前記の推定した所要時間を閾値と比較することにより非同期又は同期データステージインを設定し、前記バッチジョブの第2のデータステージング処理として、非同期データステージアウトを設定し、
前記ソースファイルからのデータステージインを実行し、前記データステージインを完了するための残り時間が前記閾値の範囲内になると、
前記バッチジョブへのリソースを割り当て及び前記バッチジョブの実行を開始するために、前記コンピュータシステムのジョブスケジューラと通信し、
前記バッチジョブを実行して結果を生成し、
前記目標ファイルへの前記結果のデータステージアウトを実行する、
よう構成されるデータステージングマネジャ。 - 前記コンピュータシステムの前記ジョブスケジューラにインストールされたプリプロセッサ及びポストプロセッサに結合されるデータステージング管理サーバを有し、前記プリプロセッサは前記ジョブスケジューラにより受信されたバッチジョブスクリプトを分析するよう構成される、請求項10に記載のデータステージングマネジャ。
- 前記データステージング管理サーバは、データステージング管理テーブルを有し、該データステージング管理テーブルは、データステージング処理の各々について、
前記データステージング処理が設定される前記バッチジョブの識別子と、
前記データステージング処理がデータステージインか又はデータステージアウトかの指示と、
場合によっては、各々のソースファイル又は目標ファイルの位置と、
転送すべきデータ量と、
前記データステージング処理がインクリメンタルデータステージインか否かの指示と、
前記データステージング処理が開始していない、実行中である、又は完了したかと、
データステージング処理の開始時間と、
データステージング処理の終了時間と、
今までに転送されたデータの量及び/又は転送されるべき残りデータ量と、
前記推定した所要時間と、
を記録する、請求項11に記載のデータステージングマネジャ。 - コンピュータシステムの中のサーバにより実行されると、請求項1乃至9のいずれか一項に記載の方法を実行するコンピュータ可読命令を含むコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14192070.2 | 2014-11-06 | ||
EP14192070.2A EP3018581B1 (en) | 2014-11-06 | 2014-11-06 | Data staging management system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016091555A JP2016091555A (ja) | 2016-05-23 |
JP6686371B2 true JP6686371B2 (ja) | 2020-04-22 |
Family
ID=51897121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015213421A Active JP6686371B2 (ja) | 2014-11-06 | 2015-10-29 | データステージング管理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10013288B2 (ja) |
EP (1) | EP3018581B1 (ja) |
JP (1) | JP6686371B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107450970B (zh) * | 2016-05-30 | 2020-07-03 | 京瓷办公信息系统株式会社 | 能够根据处理器的利用优先级来利用硬件的电子设备 |
US10503718B2 (en) * | 2016-07-06 | 2019-12-10 | Micro Focus Llc | Parallel transfers of electronic data |
CN107784016B (zh) * | 2016-08-30 | 2019-02-15 | 北京京东尚科信息技术有限公司 | 数据同步控制装置和数据同步系统及方法 |
JP6799501B2 (ja) | 2017-06-06 | 2020-12-16 | 株式会社日立製作所 | 計算機システム及びデータの分析方法 |
CN112685167A (zh) * | 2019-10-17 | 2021-04-20 | 伊姆西Ip控股有限责任公司 | 资源使用方法、电子设备和计算机程序产品 |
CN112906368B (zh) * | 2021-02-19 | 2022-09-02 | 北京百度网讯科技有限公司 | 行业文本增量方法、相关装置及计算机程序产品 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2849487B2 (ja) * | 1991-03-19 | 1999-01-20 | 株式会社日立製作所 | ステージング方法 |
JPH0612360A (ja) * | 1992-06-26 | 1994-01-21 | Nec Corp | 拡張記憶装置の入出力制御方式 |
JPH0675785A (ja) * | 1992-06-29 | 1994-03-18 | Fujitsu Ltd | プレステージング処理方法、バッファ管理方法及びファイルシステム |
JP3618552B2 (ja) * | 1998-06-30 | 2005-02-09 | 富士通株式会社 | 記憶装置 |
JP2003091424A (ja) * | 2001-09-18 | 2003-03-28 | Matsushita Electric Ind Co Ltd | 分散処理システムおよびジョブ分散処理方法 |
US7448022B1 (en) * | 2004-02-10 | 2008-11-04 | Prasad Ram | Dynamic software composition in a component-based software system |
US7673305B2 (en) * | 2006-10-23 | 2010-03-02 | Hewlett-Packard Development Company, L.P. | System and method of expediting certain jobs in a computer processing system |
JP4935595B2 (ja) * | 2007-09-21 | 2012-05-23 | 富士通株式会社 | ジョブ管理方法、ジョブ管理装置およびジョブ管理プログラム |
US20100299447A1 (en) * | 2009-05-25 | 2010-11-25 | Nilesh Anant Salvi | Data Replication |
US8578289B2 (en) * | 2010-01-28 | 2013-11-05 | Ebay Inc. | Application module for managing jobs asynchronously |
JP5648449B2 (ja) * | 2010-11-30 | 2015-01-07 | 富士ゼロックス株式会社 | 印刷文書処理システム、キャッシュ装置及びプログラム |
EP2672390B1 (en) * | 2011-01-31 | 2015-11-25 | Mitsubishi Electric Corporation | Memory controller |
JP5900088B2 (ja) * | 2012-03-27 | 2016-04-06 | 富士通株式会社 | 並列計算機、並列計算機の制御方法及び制御プログラム |
US8984125B2 (en) * | 2012-08-16 | 2015-03-17 | Fujitsu Limited | Computer program, method, and information processing apparatus for analyzing performance of computer system |
US9411657B2 (en) * | 2012-11-09 | 2016-08-09 | Hewlett Packard Enterprise Development Lp | Load-balanced sparse array processing |
US9323588B2 (en) * | 2013-03-14 | 2016-04-26 | Comcast Cable Communications, Llc | Service platform architecture |
-
2014
- 2014-11-06 EP EP14192070.2A patent/EP3018581B1/en active Active
-
2015
- 2015-10-29 JP JP2015213421A patent/JP6686371B2/ja active Active
- 2015-10-30 US US14/927,630 patent/US10013288B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016091555A (ja) | 2016-05-23 |
EP3018581B1 (en) | 2017-03-08 |
US10013288B2 (en) | 2018-07-03 |
US20160132357A1 (en) | 2016-05-12 |
EP3018581A1 (en) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6686371B2 (ja) | データステージング管理システム | |
US20190324819A1 (en) | Distributed-system task assignment method and apparatus | |
CN108304260B (zh) | 一种基于高性能云计算的虚拟化作业调度系统及其实现方法 | |
EP2742426B1 (en) | Network-aware coordination of virtual machine migrations in enterprise data centers and clouds | |
US8701108B2 (en) | Apparatus and method for controlling live-migrations of a plurality of virtual machines | |
US8893133B2 (en) | Dynamic test scheduling by ordering tasks for performance based on similarities between the tasks | |
US9112750B2 (en) | Job management server and job management method | |
US20170277556A1 (en) | Distribution system, computer, and arrangement method for virtual machine | |
Pastorelli et al. | HFSP: size-based scheduling for Hadoop | |
CN111399970B (zh) | 一种预留资源管理方法、装置和存储介质 | |
EP2700008A1 (en) | Scheduling map and reduce tasks of jobs for execution according to performance goals | |
JP2014241020A (ja) | 運用計画立案支援システム及び方法 | |
US10310900B2 (en) | Operating programs on a computer cluster | |
WO2016061935A1 (zh) | 一种资源调度方法、装置及计算机存储介质 | |
CN111190691A (zh) | 适用于虚拟机的自动迁移方法、系统、装置及存储介质 | |
JP2009176097A (ja) | サービス管理装置及びプログラム | |
CN110661842A (zh) | 一种资源的调度管理方法、电子设备和存储介质 | |
US10970143B1 (en) | Event action management mechanism | |
JPWO2007072544A1 (ja) | 情報処理装置、計算機、リソース割り当て方法及びリソース割り当てプログラム | |
JP2017162209A (ja) | 分散処理実行管理プログラム、分散処理実行管理方法および分散処理実行管理装置 | |
JP2020024636A (ja) | スケジューリング装置、スケジューリングシステム、スケジューリング方法及びプログラム | |
US20220229689A1 (en) | Virtualization platform control device, virtualization platform control method, and virtualization platform control program | |
WO2013114830A1 (ja) | プロセス予測実行装置及びプロセス予測実行方法 | |
US10592813B1 (en) | Methods and apparatus for data operation pre-processing with probabilistic estimation of operation value | |
CN112162964B (zh) | 一种自适应数据同步方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190320 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6686371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |