JP5939740B2 - 動的にリソースを割り当てる方法、システム及びプログラム - Google Patents
動的にリソースを割り当てる方法、システム及びプログラム Download PDFInfo
- Publication number
- JP5939740B2 JP5939740B2 JP2011086958A JP2011086958A JP5939740B2 JP 5939740 B2 JP5939740 B2 JP 5939740B2 JP 2011086958 A JP2011086958 A JP 2011086958A JP 2011086958 A JP2011086958 A JP 2011086958A JP 5939740 B2 JP5939740 B2 JP 5939740B2
- Authority
- JP
- Japan
- Prior art keywords
- request
- certainty
- compute node
- server system
- reservation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5014—Reservation
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・SaaS(Software as a service):これは、ソフトウェアをサービスとして提供するものである。例えば、給与計算プログラムの使用を、クライアントに提供する。
・PaaS(Platform as a service):これは、プラットフォームをサービスとして提供するものである。一般的に、スケーリングを考慮せずアプリケーションを動かせるという特徴がある。すなわち、クラウド・コンピューティングのベンダは、クライアントからのサービス要求が増大するにつれて、自動的にリソースを追加するので、性能低下をクライアントに体感させない。プラットフォームには、データベース、アプリケーション実行環境、管理ツールなどのミドルウェアが含まれる。
・IaaS(Infrastructure as a service):これは、仮想マシンやストレージなどのインフラストラクチャを提供するものである。そのインフラストラクチャ上で、所望のオペレーティング・システムやミドルウェアを導入できる。この場合、クライアントがスケーリングを考慮する必要がある。
まず、特開平11−282695号公報は、多重システム・クラスタ内のサーバの数を制御する方法及び装置に関し、入来作業要求がサービス・クラスに編成され、それらの各々がクラスタに渡って、サーバによりサービスされるキューを有するようになされる。各サービス・クラスは予め、所定の性能指標を割当てられる。各システムはサービス・クラスがそれらの目標にどれ程良く合致するかにもとづき、あるサービス・クラスを、システム資源を提供するドナー・クラスとして選択し、別のサービス・クラスを、システム資源を受け取るレシーバ・クラスとして選択する。各システムは次に、レシーバ・クラスがその目標を逸する原因となる資源ボトルネックがサーバの数の場合、各システムは、サーバの追加がレシーバ・クラスの性能指標に及ぼすプラスの効果が、ドナー・クラスの性能指標に及ぼすマイナスの効果を上回るか否かにもとづき、幾つのサーバがレシーバ・クラスに追加されるべきかを決定する。
Pcertainty(rk) < Prequirement(rk)
ここで、Pcertainty(cid,rid)は下記の式で与えられる。
ここで、Reservationsは、予約の集合であり、Pscaleup(cid,rid)は、CPUのcidで、予約ridのインスタンスが1個作られる確率は、下記の式で与えられる:
但し、Reservation(cid,rid) ∈ {0,1}はCPUのcidの予約をあわらし、
は、多重化数をあわらしている。また、Pscaleup(rid)は、予約ridのUpイベントの平均発生数であり、好適には、過去のUpイベントの履歴データがポアソン分布に従うと想定して、計算される。
|{c∈CPUs|Reservation(c,rk)=1}| > 0
この式の意味は、ステップ702で説明したとおりである。
すなわち、図1のシステムは、クライアントに対して、このようにして決定された(ti,λi) i = 1,2,...,nでVMインスタンスを立ち上げる。
ここで、Pr()は、括弧の中の条件が成立する確率である。
104 インターネット
110 システム
112 スケジューラ
114 予約スケジュール
116 キュー
118 リソース・アロケータ
120 予約テーブル
122 ユーザ・モニタ
130 ハードウェア・リソース・プール
132、・・・152 コンピュータ(計算ノード)
154、156、158 ディスク装置
202 バス
204 CPU
206 メインメモリ
206 主記憶
208 コントローラ
210 ハードディスク・ドライブ
212 ドライブ
214 ディスプレイ・コントローラ
216 ディスプレイ装置
218 通信インターフェース
222 オーディオ・インターフェース
230 キーボード
232 マウス
302 通信インターフェース
304 バス
306 CPU
402 ハイパーバイザ
404 特権的仮想マシン
502 キュー処理モジュール
504 Upイベント処理モジュール
506 Downイベント処理モジュール
508 リソース割当調整モジュール
510 テーブル更新モジュール
Claims (6)
- 複数の計算ノードを含むリソースを有するサーバ・システムにおいて、該サーバ・システムの処理により、クライアント・コンピュータからのリクエストに応じて、動的にリソースを割り当てる方法であって、
前記サーバ・システムが、異なる準備状態にある複数のインスタンスを用意するステップと、
前記サーバ・システムが、クライアント・コンピュータから、プラットフォームの許容量拡大の上限及び拡大スピードへの要求である動的スケーリング条件のリクエストを受け取るステップと、
前記サーバ・システムが、前記動的スケーリング条件を満たすように前記異なる準備状態にある複数のインスタンスを組み合わせて起動するステップと、
前記サーバ・システムが、前記リクエストのIDと、前記計算ノードのCPUのIDと、準備状態の段階のフィールドを含む予約テーブルを維持するステップと、
前記サーバ・システムが、前記クライアント・コンピュータからの、計算ノードの使用を要求するリクエストを受領することに応答して、前記予約テーブルに基づき、計算ノードを割当可能かどうか判断し、もし割当可能なら、その割当を反映するように前記予約テーブルを更新して、該計算ノードを前記リクエストに割当てるステップとを有し、
前記動的スケーリング条件のリクエストが、前記動的スケーリング条件がどの程度満たされるかを示す確実性を含み、前記計算ノードを前記リクエストに割当てるステップが、前記確実性が予約の現在の確実性より大きいかどうかを判断するステップを有し、前記確実性が前記現在の確実性より大きい場合にのみ前記計算ノードを前記リクエストに割当てる、
動的にリソースを割り当てる方法。 - 前記確実性が前記現在の確実性より大きいかどうかを判断するステップが、計算ノードの使用を要求するリクエストを受け取る頻度の統計値に基づき実行される、請求項1に記載の動的にリソースを割り当てる方法。
- 前記サーバ・システムが、前記計算ノードを前記リクエストに割当てることに応答して、前記予約テーブルの該当する準備状態の段階のフィールドを、準備完了状態にするステップをさらに有する、請求項1に記載の動的にリソースを割り当てる方法。
- 複数の計算ノードを含むリソースを有するサーバ・システムにおいて、該サーバ・システムの処理により、クライアント・コンピュータからのリクエストに応じて、動的にリソースを割り当てるシステムであって、
異なる準備状態にある複数のインスタンスを用意する手段と、
クライアント・コンピュータから、プラットフォームの許容量拡大の上限及び拡大スピードへの要求である動的スケーリング条件のリクエストを受け取る手段と、
前記動的スケーリング条件を満たすように前記異なる準備状態にある複数のインスタンスを組み合わせて起動する手段と、
前記サーバ・システムの記憶手段に記憶された、前記リクエストのIDと、前記計算ノードのCPUのIDと、準備状態の段階のフィールドを含む予約テーブルと、
前記クライアント・コンピュータからの、計算ノードの使用を要求するリクエストを受領することに応答して、前記予約テーブルに基づき、計算ノードを割当可能かどうか判断し、もし割り当て可能なら、その割当を反映するように前記予約テーブルを更新して、該計算ノードを前記リクエストに割当てる手段を有し、
前記動的スケーリング条件のリクエストが、前記動的スケーリング条件が満たされるかどうかの確実性を含み、前記計算ノードを前記リクエストに割当てる手段が、前記確実性が予約の現在の確実性より大きいかどうかを判断する手段を有し、前記確実性が前記現在の確実性より大きい場合にのみ前記計算ノードを前記リクエストに割当てる、
動的にリソースを割り当てるシステム。 - 前記確実性が前記現在の確実性より大きいかどうかを判断する手段が、計算ノードの使用を要求するリクエストを受け取る頻度の統計値に基づく、請求項4に記載の動的にリソースを割り当てるシステム。
- 前記計算ノードを前記リクエストに割当てることに応答して、前記予約テーブルの該当する準備状態の段階のフィールドを、準備完了状態にする、請求項4に記載の動的にリソースを割り当てるシステム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011086958A JP5939740B2 (ja) | 2011-04-11 | 2011-04-11 | 動的にリソースを割り当てる方法、システム及びプログラム |
US13/443,945 US9495214B2 (en) | 2011-04-11 | 2012-04-11 | Dynamic resource allocations method, systems, and program |
US13/602,932 US20120331152A1 (en) | 2011-04-11 | 2012-09-04 | Dynamic resource allocation method, system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011086958A JP5939740B2 (ja) | 2011-04-11 | 2011-04-11 | 動的にリソースを割り当てる方法、システム及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012221273A JP2012221273A (ja) | 2012-11-12 |
JP5939740B2 true JP5939740B2 (ja) | 2016-06-22 |
Family
ID=46966980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011086958A Expired - Fee Related JP5939740B2 (ja) | 2011-04-11 | 2011-04-11 | 動的にリソースを割り当てる方法、システム及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US9495214B2 (ja) |
JP (1) | JP5939740B2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10963420B2 (en) * | 2012-08-10 | 2021-03-30 | Adobe Inc. | Systems and methods for providing hot spare nodes |
US9292352B2 (en) | 2012-08-10 | 2016-03-22 | Adobe Systems Incorporated | Systems and methods for cloud management |
US9417919B2 (en) * | 2012-09-06 | 2016-08-16 | Hewlett Packard Enterprise Development Lp | Computer cluster with objective-based resource sharing |
US10142406B2 (en) | 2013-03-11 | 2018-11-27 | Amazon Technologies, Inc. | Automated data center selection |
US10313345B2 (en) | 2013-03-11 | 2019-06-04 | Amazon Technologies, Inc. | Application marketplace for virtual desktops |
US9002982B2 (en) | 2013-03-11 | 2015-04-07 | Amazon Technologies, Inc. | Automated desktop placement |
US9158553B2 (en) | 2013-04-09 | 2015-10-13 | International Business Machines Corporation | System and method for expediting virtual I/O server (VIOS) boot time in a virtual computing environment |
US20150019705A1 (en) * | 2013-06-26 | 2015-01-15 | Amazon Technologies, Inc. | Management of computing sessions |
US10623243B2 (en) | 2013-06-26 | 2020-04-14 | Amazon Technologies, Inc. | Management of computing sessions |
CN103369041B (zh) * | 2013-07-09 | 2017-10-03 | 北京奇虎科技有限公司 | 基于云计算的资源分配方法及装置 |
US9836330B2 (en) * | 2013-07-16 | 2017-12-05 | Hitachi, Ltd. | Virtual resource management tool for cloud computing service |
US9665633B2 (en) * | 2014-02-19 | 2017-05-30 | Snowflake Computing, Inc. | Data management systems and methods |
US9565129B2 (en) | 2014-09-30 | 2017-02-07 | International Business Machines Corporation | Resource provisioning planning for enterprise migration and automated application discovery |
US10334070B2 (en) | 2014-11-11 | 2019-06-25 | Unify Gmbh & Co. Kg | Method and system for real-time resource consumption control in a distributed computing environment |
CN104468755B (zh) * | 2014-11-27 | 2018-11-02 | 中国联合网络通信集团有限公司 | 实现应用性能保障的方法和装置 |
US10394731B2 (en) * | 2014-12-19 | 2019-08-27 | Amazon Technologies, Inc. | System on a chip comprising reconfigurable resources for multiple compute sub-systems |
US10523585B2 (en) * | 2014-12-19 | 2019-12-31 | Amazon Technologies, Inc. | System on a chip comprising multiple compute sub-systems |
US11200192B2 (en) | 2015-02-13 | 2021-12-14 | Amazon Technologies. lac. | Multi-mode system on a chip |
US20160261599A1 (en) * | 2015-03-06 | 2016-09-08 | Sony Computer Entertainment America Llc | Digital management of content assets in the cloud |
US9697045B2 (en) | 2015-03-24 | 2017-07-04 | International Business Machines Corporation | Selecting resource allocation policies and resolving resource conflicts |
WO2017027649A1 (en) * | 2015-08-13 | 2017-02-16 | Alibaba Group Holding Limited | Method and system for resource scheduling |
CN106452818B (zh) | 2015-08-13 | 2020-01-21 | 阿里巴巴集团控股有限公司 | 一种资源调度的方法和系统 |
US10387204B2 (en) * | 2017-05-12 | 2019-08-20 | International Business Machines Corporation | Resource pooling in a virtualized cloud container environment |
WO2018216139A1 (ja) * | 2017-05-24 | 2018-11-29 | 三菱電機株式会社 | データ処理システム、データ処理装置およびデータ処理プログラム |
US9934287B1 (en) * | 2017-07-25 | 2018-04-03 | Capital One Services, Llc | Systems and methods for expedited large file processing |
US20190146847A1 (en) * | 2017-11-10 | 2019-05-16 | Mentor Graphics Corporation | Dynamic distributed resource management |
US10771982B2 (en) | 2018-10-24 | 2020-09-08 | Mentor Graphics Corporation | Resource utilization of heterogeneous compute units in electronic design automation |
CN111435943B (zh) * | 2019-01-14 | 2022-07-19 | 阿里巴巴集团控股有限公司 | 数据处理方法、设备、系统及存储介质 |
US11755372B2 (en) | 2019-08-30 | 2023-09-12 | Microstrategy Incorporated | Environment monitoring and management |
US11714658B2 (en) | 2019-08-30 | 2023-08-01 | Microstrategy Incorporated | Automated idle environment shutdown |
CN110995856B (zh) * | 2019-12-16 | 2022-09-13 | 上海米哈游天命科技有限公司 | 一种服务器扩展的方法、装置、设备及存储介质 |
CN113315700B (zh) * | 2020-02-26 | 2022-06-28 | 中国电信股份有限公司 | 算力资源调度方法、装置和存储介质 |
CN111831436B (zh) * | 2020-07-01 | 2024-07-30 | Oppo广东移动通信有限公司 | Io请求的调度方法、装置、存储介质及电子设备 |
CN112156453B (zh) * | 2020-10-21 | 2022-06-03 | 腾讯科技(深圳)有限公司 | 实例自适应调整方法、装置、计算机可读存储介质及设备 |
CN113268344A (zh) * | 2021-05-18 | 2021-08-17 | 中国联合网络通信集团有限公司 | 资源均衡方法和系统、第一Pod节点、资源代理服务器 |
US11687442B2 (en) | 2021-08-06 | 2023-06-27 | International Business Machines Corporation | Dynamic resource provisioning for use cases |
CN113645412B (zh) * | 2021-10-15 | 2021-12-24 | 北京创米智汇物联科技有限公司 | 启动方法、装置、摄像机及计算机可读存储介质 |
CN117076133B (zh) * | 2023-10-13 | 2024-01-26 | 深圳云天畅想信息科技有限公司 | 云游戏平台异构资源分配方法、计算机装置及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6230183B1 (en) | 1998-03-11 | 2001-05-08 | International Business Machines Corporation | Method and apparatus for controlling the number of servers in a multisystem cluster |
JP2002163241A (ja) | 2000-11-29 | 2002-06-07 | Ntt Data Corp | クライアントサーバシステム |
JP2003162516A (ja) | 2001-11-22 | 2003-06-06 | Motoaki Saito | ネットワーク環境におけるマルチプロセッサシステム |
JP4066932B2 (ja) * | 2003-11-10 | 2008-03-26 | 株式会社日立製作所 | 予測に基づいた計算機リソース配分方法 |
US20080229415A1 (en) * | 2005-07-01 | 2008-09-18 | Harsh Kapoor | Systems and methods for processing data flows |
US20080201414A1 (en) * | 2007-02-15 | 2008-08-21 | Amir Husain Syed M | Transferring a Virtual Machine from a Remote Server Computer for Local Execution by a Client Computer |
JP2009037369A (ja) | 2007-08-01 | 2009-02-19 | Hitachi Ltd | データベースサーバへのリソース割当て方法 |
US9600332B2 (en) * | 2009-04-28 | 2017-03-21 | Cisco Technology, Inc. | Server load balancing based on virtual utilization, physical utilization, and feedback |
US8504689B2 (en) * | 2010-05-28 | 2013-08-06 | Red Hat, Inc. | Methods and systems for cloud deployment analysis featuring relative cloud resource importance |
-
2011
- 2011-04-11 JP JP2011086958A patent/JP5939740B2/ja not_active Expired - Fee Related
-
2012
- 2012-04-11 US US13/443,945 patent/US9495214B2/en not_active Expired - Fee Related
- 2012-09-04 US US13/602,932 patent/US20120331152A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2012221273A (ja) | 2012-11-12 |
US20120259982A1 (en) | 2012-10-11 |
US9495214B2 (en) | 2016-11-15 |
US20120331152A1 (en) | 2012-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5939740B2 (ja) | 動的にリソースを割り当てる方法、システム及びプログラム | |
US11425194B1 (en) | Dynamically modifying a cluster of computing nodes used for distributed execution of a program | |
Praveenchandar et al. | Retracted article: dynamic resource allocation with optimized task scheduling and improved power management in cloud computing | |
US11102287B2 (en) | Minimizing service restart by optimally resizing service pools | |
US9280390B2 (en) | Dynamic scaling of a cluster of computing nodes | |
US8321558B1 (en) | Dynamically monitoring and modifying distributed execution of programs | |
US8260840B1 (en) | Dynamic scaling of a cluster of computing nodes used for distributed execution of a program | |
US9304803B2 (en) | Cooperative application workload scheduling for a consolidated virtual environment | |
US9229764B2 (en) | Estimating migration costs for migrating logical partitions within a virtualized computing environment based on a migration cost history | |
US9929931B2 (en) | Efficient provisioning and deployment of virtual machines | |
JP6254949B2 (ja) | 仮想マシンプールにおけるリソースの価格設定 | |
US9021490B2 (en) | Optimizing allocation of computer resources by tracking job status and resource availability profiles | |
US8694996B2 (en) | Application initiated negotiations for resources meeting a performance parameter in a virtualized computing environment | |
US8756599B2 (en) | Task prioritization management in a virtualized environment | |
US20140245298A1 (en) | Adaptive Task Scheduling of Hadoop in a Virtualized Environment | |
US11150951B2 (en) | Releasable resource based preemptive scheduling | |
US20190377596A1 (en) | Flexible batch job scheduling in virtualization environments | |
CN114546587A (zh) | 一种在线图像识别服务的扩缩容方法及相关装置 | |
Li et al. | PageRankVM: A pagerank based algorithm with anti-collocation constraints for virtual machine placement in cloud datacenters | |
Gadhavi et al. | Efficient resource provisioning through workload prediction in the cloud system | |
Yu et al. | Towards dynamic resource provisioning for traffic mining service cloud | |
Rao et al. | Scheduling data intensive workloads through virtualization on MapReduce based clouds | |
Pandey et al. | MQFURP: An Overprovision Strategy Supporting Performance Interference Management in Cloud | |
Suzuki et al. | Optimizing ICT Equipment via Resource Allocation in Cloud Systems | |
Roy et al. | Minimization of SLA violations in SaaS platform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150310 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150602 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20151124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160304 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5939740 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |