JP6969261B2 - Node management device, node management method and program - Google Patents
Node management device, node management method and program Download PDFInfo
- Publication number
- JP6969261B2 JP6969261B2 JP2017191164A JP2017191164A JP6969261B2 JP 6969261 B2 JP6969261 B2 JP 6969261B2 JP 2017191164 A JP2017191164 A JP 2017191164A JP 2017191164 A JP2017191164 A JP 2017191164A JP 6969261 B2 JP6969261 B2 JP 6969261B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- transition
- processing load
- request
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、互いに連携して要求を処理する複数のノードを管理する、ノード管理装置、ノード管理方法及びプログラムに関する。 The present invention relates to a node management device, a node management method, and a program for managing a plurality of nodes that process requests in cooperation with each other.
互いに連携して要求を処理する複数のノードからなるシステムの一例として、分散処理システムが知られている。この分散処理システムでは、各ノードの負荷の偏りを防ぎ、全体的な処理の効率性を保つため、負荷分散が行われる。負荷分散には、静的負荷分散と動的負荷分散がある。前者は、事前に定めた割り振りで処理をノードに割り当てる方法である。また、後者は、ノードの負荷を監視して、負荷の軽いノードに処理を割り当てる方法である。一般に、動的負荷分散の方が、静的負荷分散よりも実状に応じた負荷分散が期待される。 A distributed processing system is known as an example of a system consisting of a plurality of nodes that process requests in cooperation with each other. In this distributed processing system, load balancing is performed in order to prevent the load bias of each node and maintain the overall processing efficiency. Load balancing includes static load balancing and dynamic load balancing. The former is a method of allocating a process to a node by a predetermined allocation. The latter is a method of monitoring the load of a node and allocating processing to a node having a light load. In general, dynamic load balancing is expected to be more load-balanced according to the actual situation than static load balancing.
分散処理システムの一例として、特許文献1に、生産ラインの全行程を管理する生産管理システムが記載されている。この生産管理システムでは、所要に対し、在庫又は仕掛完成予定を製品在庫から順次、源流工程に向けて工程毎に引当て、各工程の在庫又は引当分、余剰分、不足分を確定する。不足分について仕込換算を行って、要仕込分の要仕込日及び要仕込数を求める。そして、引当分と要仕込分とを源流工程から下流工程に向けて負荷山積し、各工程の仕込予定日と完成予定日を求める。
As an example of a distributed processing system,
上述した分散処理システムでは、予め定めた割り振りで処理をノードに割り当てるが、実際に要求を処理した場合の各ノードの処理負荷を予測することはできない。このため、ノードに対する対処が間に合わず、過負荷を生じる場合がある。また、必要以上に負荷を軽減してしまう場合もある。
特許文献1に記載の生産管理システムにおいても、処理負荷の予測はできないため、上記の分散処理システムと同様の問題を生じる。
In the distributed processing system described above, processing is assigned to nodes by a predetermined allocation, but it is not possible to predict the processing load of each node when actually processing a request. For this reason, it may not be possible to deal with the node in time, resulting in an overload. In addition, the load may be reduced more than necessary.
Even in the production control system described in
本発明の目的は、上記問題を解決することができる、ノード管理装置、ノード管理方法及びプログラムを提供することである。 An object of the present invention is to provide a node management device, a node management method and a program capable of solving the above problems.
上記目的を達成するため、本発明の第1のノード管理装置は、互いに連携して要求を処理する複数のノードについて、各ノードが前記要求を処理した際の処理負荷と前記要求のノード間の遷移を分析する分析部と、前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する予測部と、を有する。 In order to achieve the above object, the first node management device of the present invention has a plurality of nodes that process requests in cooperation with each other, between the processing load when each node processes the request and the node of the request. It has an analysis unit that analyzes the transition, and a prediction unit that predicts the processing load of each node for a desired number of requests based on the processing load and the analysis result of the transition.
本発明の第1のノード管理方法は、互いに連携して要求を処理する複数のノードについて、各ノードが前記要求を処理した際の処理負荷と前記要求のノード間の遷移を分析し、
前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測することを含む。
The first node management method of the present invention analyzes the processing load when each node processes the request and the transition between the nodes of the request for a plurality of nodes that process the request in cooperation with each other.
It includes predicting the processing load of each node for a desired number of requests based on the processing load and transition analysis results.
本発明の第1のプログラムは、互いに連携して要求を処理する複数のノードについて、各ノードが前記要求を処理した際の処理負荷と前記要求のノード間の遷移を分析する処理と、前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する処理と、をコンピュータに実行させる。 The first program of the present invention is a process of analyzing the processing load when each node processes the request and the transition between the nodes of the request for a plurality of nodes that process the request in cooperation with each other, and the process. A computer is made to perform a process of predicting the processing load of each node for a desired number of requests based on the load and transition analysis results.
過負荷や低負荷のノードを推定し、負荷分散や輻輳制御などの適切な対策を早期に行うことができる。 It is possible to estimate overloaded and underloaded nodes and take appropriate measures such as load balancing and congestion control at an early stage.
次に、本発明の実施形態について図面を参照して説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態によるノード管理装置の構成を示すブロック図である。なお、図1において、一方向性の矢印は、ある信号(データ又は情報)の流れの方向を端的に示したもので、双方向性を排除するものではない。
図1を参照すると、ノード管理装置11は、分析部12及び予測部13を有する。分析部12は、互いに連携して要求を処理する複数のノード151〜15nについて、各ノードが要求を処理した際の処理負荷と要求のノード間の遷移を分析する。予測部13は、分析部12からの処理負荷及び遷移の分析結果に基づいて、所望の要求数wに対する各ノードの処理負荷を予測する。
Next, an embodiment of the present invention will be described with reference to the drawings.
(First Embodiment)
FIG. 1 is a block diagram showing a configuration of a node management device according to the first embodiment of the present invention. In addition, in FIG. 1, the unidirectional arrow simply indicates the direction of the flow of a certain signal (data or information), and does not exclude bidirectionality.
Referring to FIG. 1, the
上述したノード管理装置11によれば、所望の要求数wに対する各ノードの処理負荷を定量的に予測することができるので、過負荷のノードや低負荷のノードを推定し、負荷分散や輻輳制御などの適切な対策を早期に行うことができる。
According to the
なお、ノード管理装置11において、分析部12及び予測部13のそれぞれの機能を有する1つの制御部が設けられても良い。また、その制御部は、CPU(Central Processing Unit)等を具備したコンピュータで実現されても良い。この場合、コンピュータがプログラムを実行することで、分析部12及び予測部13のそれぞれの機能を実現しても良い。
The
プログラムは、分析部12及び予測部13のそれぞれの機能に対応する処理をコンピュータが実行するためのものであっても良い。例えば、プログラムは、互いに連携して要求を処理する複数のノード151〜15nについて、ノードが要求を処理した際の処理負荷と、要求のノード間の遷移とを分析する処理と、処理負荷及び遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する処理とを、コンピュータが実行するためのものであっても良い。プログラムは、コンピュータ使用可能媒体またはコンピュータ可読媒体で提供されてもよく、また、インターネット等のネットワークを介して提供されてもよい。
The program may be for the computer to execute the processing corresponding to each function of the
コンピュータ使用可能媒体またはコンピュータ可読媒体は、磁気、光、電子、電磁気、赤外線などを用いて情報の記録または読み取りが可能な媒体を含む。そのような媒体として、例えば、半導体メモリ、半導体または固体の記憶装置、磁気テープ、取外し可能なコンピュータディスケット、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、磁気ディスク、光ディスク、光磁気ディスクなどがある。 Computer-enabled or computer-readable media include media on which information can be recorded or read using magnetism, light, electrons, electromagnetics, infrared rays, and the like. Such media include, for example, semiconductor memories, semiconductor or solid storage devices, magnetic tapes, removable computer diskettes, random access memory (RAM), read-only memory (ROM), magnetic disks, optical disks, optomagnetic disks, etc. There is.
また、ノード管理装置11において、分析部12は、ノード151〜15nについて、ノードが要求を処理した際の処理負荷と、該ノードにて処理された要求の遷移先を示す遷移先ノード情報とを集計し、その集計結果に基づいて、処理負荷および遷移先の傾向を分析しても良い。
さらに、分析部12が、ノード間の前記要求の遷移確率を算出し、予測部13が、要求の遷移確率に基づいて、各ノードの処理負荷を予測しても良い。
さらに、分析部12が、ノード151〜15nについて、各ノード間を遷移した要求数を単位処理負荷毎にカウントし、該カウント値に基づいて遷移確率行列を算出し、予測部13が、遷移確率行列に基づいて、各ノードの処理負荷を予測しても良い。
Further, in the
Further, the
Further, the
また、ノード管理装置11において、ノード毎に、予測部13で予測した処理負荷の予測値と許容値とを比較し、予測値が許容値を超えている場合に、所定のメッセージを出力する対策部を、さらに有しても良い。所定のメッセージは、例えば警告を示すメッセージであっても良い。
さらに、対策部が、予測値が許容値を超えたノードの処理負荷を低減するための対策メッセージを出力しても良い。この場合、対策は、処理負荷の改善、許容値の緩和、要求数の緩和および遷移確率の低減のいずれか一つ、または、2つ以上の組み合わせであっても良い。
Further, in the
Further, the countermeasure unit may output a countermeasure message for reducing the processing load of the node whose predicted value exceeds the allowable value. In this case, the countermeasure may be any one of improvement of the processing load, relaxation of the allowable value, relaxation of the number of requests, and reduction of the transition probability, or a combination of two or more.
(第2の実施形態)
図2は、本発明の第2の実施形態によるノード管理装置の構成を示すブロック図である。なお、図2において、一方向性の矢印は、ある信号(データ又は情報)の流れの方向を端的に示したもので、双方向性を排除するものではない。
図2を参照すると、ノード管理装置21は、分散処理システム10の処理負荷の予測及び監視を行う装置であって、遷移検出部22、遷移集計分析部23、処理負荷予測部24、要求数取得部25、対策算出部26及び許容負荷取得部27を有する。遷移集計分析部23、または、遷移検出部22と遷移集計分析部23とからなる部分を、分析部と呼ぶことができる。処理負荷予測部24及び要求数取得部25を、予測部と呼ぶことができる。対策算出部26及び許容負荷取得部27を、対策部と呼ぶことができる。
(Second embodiment)
FIG. 2 is a block diagram showing a configuration of a node management device according to a second embodiment of the present invention. In FIG. 2, the unidirectional arrow simply indicates the direction of the flow of a certain signal (data or information), and does not exclude bidirectionality.
Referring to FIG. 2, the
分散処理システム10は、互いに連携して要求(要求数=w)を処理する複数のノード1〜5を有する。ここでは、ノード1〜5のそれぞれに対して、特定の処理が割り当てられている。要求は、一連の処理から成り、処理に応じたノードで処理される。要求は、あるノードでの処理が終わると、次に行う処理が確定し、対応する次のノードに遷移する。要求は、処理と遷移を繰り返して、有限時間内に全ての処理が完了する。要求を処理する際のノードの処理負荷は、計測または推定できるものとする。
The distributed
遷移検出部22は、要求のノード間における遷移を検出する。遷移検出結果は、遷移検出部22から遷移集計分析部23に供給される。
遷移集計分析部23は、ノード1〜5について、ノードが要求を処理した際の処理負荷と、該ノードにて処理された要求の遷移先を示す遷移先ノード情報とを集計する。例えば、遷移集計分析部23は、処理負荷の単位量ごとに離散的に、各要求がどのノードで処理されていたかを示す情報を集計しても良い。遷移集計分析部23は、処理負荷と遷移先ノード情報の集計結果に基づいて、処理負荷および遷移先の傾向を分析する。遷移集計分析部23は、分析結果を処理負荷予測部24に供給する。
The
The transition
なお、遷移検出部22は、各ノードに対して、それぞれの処理負荷と遷移先ノード情報を問合せても良い。あるいは、各ノードが自発的に、自ノードの処理負荷と遷移先ノード情報とを遷移検出部22に報告しても良い。あるいは、遷移検出部22が、各ノードの通信を監視して、要求の処理開始のタイミングや、要求の受け渡しを検出することで、処理負荷及び遷移先ノード情報の集計を行っても良い。
The
要求数取得部25は、ノード1〜5で処理させる要求数を取得する。例えば、要求数取得部25は、各ノードに想定される要求数の入力を受け付けても良い。要求数取得部25は、取得した要求数を処理負荷予測部24に供給する。
処理負荷予測部24は、遷移集計分析部23からの分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する。所望の要求数は、要求数取得部25から供給される。処理負荷予測部24は、各ノードの処理負荷の予測値を対策算出部26に供給する。
The request
The processing
許容負荷取得部27は、ノード1〜5の処理負荷の許容値を取得する。例えば、許容負荷取得部27は、処理負荷の許容値の入力を受け付けても良い。許容負荷取得部27は、取得した許容値を対策算出部26に供給する。
対策算出部26は、ノード毎に、処理負荷の予測値と許容値とを比較する。予測値が許容値を超えた場合、対策算出部26は、警告メッセージを出力するとともに、ノードに対する対策を算出し、その対策を示すメッセージを出力する。対策算出部26は、通知部と呼ぶことができる。
The allowable
The
次に、本実施形態のノード管理装置21の動作について具体的に説明する。
図3は、ノード管理装置21にて行われるノード管理処理の一手順を示すフローチャートである。
Next, the operation of the
FIG. 3 is a flowchart showing one procedure of the node management process performed by the
まず、遷移検出部22が要求のノード間の遷移を検出する。そして、遷移集計分析部23が、各ノードの処理負荷と遷移先ノード情報を集計する(ステップS10)。
次に、遷移集計分析部23が、ステップS10で得られた集計結果に基づいて、各ノードの処理負荷及び遷移先の傾向を分析する(ステップS11)。次に、処理負荷予測部24が、ステップS11で得られた処理負荷及び遷移先の傾向分析結果に基づいて、要求数取得部25が取得した要求数に対する各ノードの処理負荷を予測する(ステップS12)。
First, the
Next, the transition
次に、対策算出部26が、各ノードについて、ステップS12で得られた処理負荷の予測値が、許容負荷取得部27が取得した許容値より大きいか否かを判定する(ステップS13)。予測値が許容値より大きい場合に、対策算出部26が、警告メッセージを出力するとともに、ノードに対する対策を算出し、その対策を示すメッセージを出力する。
Next, the
以下に、処理負荷と遷移先ノード情報の集計処理(ステップS10)、処理負荷及び遷移先の傾向分析処理(ステップS11)、処理負荷の予測処理(ステップS12)及び警告/対策算出処理(ステップS14)を詳細に説明する。
以下では、ノードの処理負荷の尺度として、処理時間を用いる。すなわち、ノード間を遷移する要求を分析する際に、単位処理負荷として単位処理時間を用いる。これとは異なるケースとして、処理負荷を例えば通信量で評価する場合は、単位処理負荷として単位通信量を用いれば良い。
Below, the processing load and transition destination node information aggregation processing (step S10), processing load and transition destination trend analysis processing (step S11), processing load prediction processing (step S12), and warning / countermeasure calculation processing (step S14). ) Will be explained in detail.
In the following, the processing time is used as a measure of the processing load of the node. That is, the unit processing time is used as the unit processing load when analyzing the request transitioning between the nodes. As a case different from this, when the processing load is evaluated by, for example, the communication amount, the unit communication amount may be used as the unit processing load.
処理負荷と遷移先ノード情報の集計処理(ステップS10)
図4に、処理負荷と遷移先ノード情報の集計結果の一例を示す。図4において、「a」、「b」、「c」はそれぞれ要求を示す。図4の集計結果は、要求a〜cが、ノード1〜5のいずれで処理されていたかを示す情報を処理順に単位処理時間毎に集計したものである。この例では、処理負荷を処理時間で評価するものとして、遷移集計分析部23は、要求の遷移についての情報を各ノードにおける単位処理時間毎に集計する。
Aggregation processing of processing load and transition destination node information (step S10)
FIG. 4 shows an example of the aggregation result of the processing load and the transition destination node information. In FIG. 4, "a", "b", and "c" indicate requirements, respectively. The aggregation result of FIG. 4 is the aggregation of the information indicating which of the
ノード1は、累計処理時間(以下、時刻)0から要求aを処理し、時刻3で要求bを処理し、時刻4及び5で要求cを処理する。ノード2は、時刻1で要求aを処理し、時刻6で要求cを処理する。ノード3は、時刻2で要求aを処理し、時刻4で要求bを処理し、時刻7及び9で要求cを処理する。ノード4は、時刻3で要求aを処理し、時刻8及び10で要求cを処理する。ノード5は、時刻4で要求aを処理し、時刻5で要求bを処理し、時刻11で要求cを処理する。
時刻がtからt+1になった時、あるノードから別のノードに移った要求は、あるノードでの処理がその単位処理時間内で終わり、次のノードへ遷移したことを示す。例えば、時刻0でノード1が要求aを処理し、時刻1でノード2が要求aを処理している。この場合、要求aは、単位処理時間を跨いでノードを移った要求である。
また、時刻がtからt+1になっても、あるノードに留まった要求は、あるノードでの処理が単位処理時間内に終わらず、ノードを遷移しなかったことを示す。例えば、ノード1は、時刻4及び5で要求cを処理している。この場合、要求cは、単位処理時間を跨いで同じノードに留まった要求である。
When the time changes from t to t + 1, a request that moves from one node to another indicates that the processing at one node has finished within that unit processing time and has transitioned to the next node. For example, at
Also, even if the time changes from t to t + 1, a request that stays at a certain node indicates that the processing at a certain node did not end within the unit processing time and the node did not transition. For example,
上記の処理負荷と遷移先ノード情報の集計処理(ステップS10)は、以下で説明する処理負荷と遷移先の傾向を分析する処理(ステップS11)までにすれば良い。つまり、単位処理時間毎に定期的に行なっても良く、遷移の度に逐次的に行なっても良く、あるいは、ステップ11の直前に一括して行なっても良い。
The above processing load and transition destination node information aggregation processing (step S10) may be performed up to the processing for analyzing the processing load and transition destination tendency described below (step S11). That is, it may be performed periodically for each unit processing time, sequentially for each transition, or collectively immediately before
処理負荷及び遷移先の傾向分析処理(ステップS11)
遷移集計分析部23は、分析結果として遷移確率行列を算出する。すなわち、遷移集計分析部23は、あるノードで要求が単位処理負荷の処理を受けた後、次のノードへ遷移する遷移確率行列を算出する。
例えば、遷移集計分析部23は、各ノード間を遷移した要求数を、単位処理負荷ごとにカウントし、該カウント値に基づいて遷移確率行列を算出する。以下の例で、この遷移確率行列の算出処理を具体的に説明する。
以下の例では、前述の例で示した、処理負荷(処理時間)と遷移先ノード情報の集計結果を用いる。したがって、処理負荷を処理時間で評価するものとする。
Processing load and transition destination tendency analysis processing (step S11)
The transition
For example, the transition
In the following example, the aggregated result of the processing load (processing time) and the transition destination node information shown in the above example is used. Therefore, the processing load shall be evaluated by the processing time.
[要求がノードiからノードjへ遷移した回数の算出]
図5に、各ノード間を遷移した要求数のカウント値の一例を示す。単位処理時間毎に要求がノードiからノードjへ遷移した回数を累積する遷移カウンタCijを用いて、図4に示した集計結果に基づく要求数をカウントした結果が示されている。ここで、i及びjは、分散処理システム10を構成するノードの数の範囲内で与えられる。
[Calculation of the number of times a request has transitioned from node i to node j]
FIG. 5 shows an example of the count value of the number of requests transitioned between each node. The result of counting the number of requests based on the aggregation result shown in FIG. 4 is shown by using the transition counter Cij which accumulates the number of times the request has transitioned from the node i to the node j for each unit processing time. Here, i and j are given within the range of the number of nodes constituting the distributed
図5において、遷移カウンタCiiは、要求がノードiからノードiに遷移した回数、すなわち、要求がノードiに留まった回数をカウントする。図4の集計結果では、要求cが累計処理時間(以下、時刻)4及び5でノード1に留まっているため、時刻4で、遷移カウンタC11のカウント値が「1」になる。これ以降、時刻11まで、遷移カウンタC11はカウント値「1」を維持する。
In FIG. 5, the transition counter Cii counts the number of times the request has transitioned from node i to node i, that is, the number of times the request has stayed at node i. In the aggregation result of FIG. 4, since the request c stays at the
遷移カウンタCijは、要求がノードiからノードjに遷移した回数をカウントする。図4の集計結果では、時刻0から1にかけて、要求aがノード1からノード2に遷移しているため、時刻0での遷移カウンタC12のカウント値を「1」としている。これ以降、時刻4まで、遷移カウンタC12はカウント値「1」を維持する。また、時刻5から6にかけて、要求cがノード1からノード2に遷移しているため、時刻5での遷移カウンタC12のカウント値を「2」にする。これ以降、時刻11まで、遷移カウンタC12はカウント値「2」を維持する。
The transition counter Cij counts the number of times a request has transitioned from node i to node j. In the aggregation result of FIG. 4, since the request a transitions from the
図5のその他の遷移カウンタC13〜C15、C21〜C25、C31〜C35、C41〜C45、C51〜C55も、遷移カウンタC11又は遷移カウンタC12と同様の原理で、図4の集計結果に基づいて要求のノード間の遷移をカウントする。 The other transition counters C13 to C15, C21 to C25, C31 to C35, C41 to C45, and C51 to C55 of FIG. 5 are also requested based on the aggregation result of FIG. 4 by the same principle as the transition counter C11 or the transition counter C12. Count the transitions between the nodes of.
[要求がノードiからノードjへ遷移する遷移確率の算出]
図6に、要求がノード間を遷移する遷移確率の算出処理の一例を示す。この例では、図5に示したカウント結果に基づいて、要求がノードiからノードjへ遷移する遷移確率Pijを算出した結果が示されている。
[Calculation of transition probability that a request transitions from node i to node j]
FIG. 6 shows an example of a transition probability calculation process in which a request transitions between nodes. In this example, the result of calculating the transition probability Pij in which the request transitions from the node i to the node j is shown based on the count result shown in FIG.
要求が遷移元ノードから遷移先ノードへ遷移する遷移確率Pijは、遷移元ノードiから遷移先ノードjへ遷移した要求数を、その遷移元ノードiから遷移した全要求数で割った値(確率値)として求められる。
図6において、P11は、要求がノード1からノード1へ遷移する確率、すなわち、要求がノード1に留まる確率を示す。遷移確率P11は、ノード1に留まった要求数を、ノード1からから遷移した全要求数で割った値で与えられる。すなわち、遷移確率P11は、遷移カウンタC11のカウント結果「1」を遷移カウンタC11〜C15のカウント結果の合計値「4」(=C11+C12+C13+C14+C15=1+2+1+0+0)で割った値(=1/4)である。
The transition probability Pij in which a request transitions from the transition source node to the transition destination node is the value obtained by dividing the number of requests transitioned from the transition source node i to the transition destination node j by the total number of requests transitioned from the transition source node i (probability). Value).
In FIG. 6, P11 indicates the probability that the request transitions from
P12は、要求がノード1からノード2へ遷移する確率を示す。遷移確率P12は、ノード1からノード2へ遷移した要求数を、ノード1からから遷移した全要求数で割った値で与えられる。すなわち、遷移確率P12は、遷移カウンタC12のカウント結果「2」を遷移カウンタC11〜C15のカウント結果の合計値(=C11+C12+C13+C14+C15=1+2+1+0+0)で割った値(=1/2)である。
図6のその他の遷移確率P13〜P15、P21〜P25、P31〜P35、P41〜P45、P51〜P55についても、遷移確率P11又は遷移確率P12と同様の原理で、図5のカウント結果に基づいて算出される。
P12 indicates the probability that the request will transition from
The other transition probabilities P13 to P15, P21 to P25, P31 to P35, P41 to P45, and P51 to P55 in FIG. 6 are also based on the same principle as the transition probabilities P11 or the transition probabilities P12, based on the count results in FIG. It is calculated.
[遷移確率行列]
上述の遷移確率P11〜P15、P21〜P25、P31〜P35、P41〜P45、P51〜P55に基づき、以下の遷移確率行列
Based on the above-mentioned transition probabilities P11 to P15, P21 to P25, P31 to P35, P41 to P45, and P51 to P55, the following transition probability matrix
処理負荷の予測処理(ステップS12)
処理負荷予測部24は、遷移集計分析部23が算出した遷移確率行列
The processing
図7に、遷移確率行列
行列積
Matrix product
同様に、次の単位処理時間後(2回目)に、各ノードに遷移した要求数は、行列積
[処理時間の予測(解1)]
処理時間の累計値Tは、要求数(要求の処理に要する単位処理時間)の総和を
The cumulative value T of the processing time is the sum of the number of requests (unit processing time required to process the request).
[処理時間の予測(解2)]
また、要求は有限時間内に全ての処理が完了する、という前提条件があることから、
Also, since there is a precondition that all processing of the request is completed within a finite time,
具体的に説明すると、
図7の例では、
警告/対策算出処理(ステップS14)
ここでは、処理時間の許容値をTlimit=1.0と仮定する。上述したように、処理時間
Here, it is assumed that the allowable value of the processing time is T limit = 1.0. As mentioned above, processing time
対策算出部26は、処理時間の予測値と許容値とを比較する。ノード1とノード3の処理時間の予測値はともに「1.3」であり、許容値の「1.0」よりも大きい。この場合、対策算出部26は、対策算出部26は、警告メッセージ(例えば、「予測される処理時間が、許容される処理時間を超過しています」といったメッセージ)を出力するとともに、以下のような対策案を提示することができる。
The
[処理負荷の改善]
対策算出部26は、予測値が許容値を超えたノード1とノード3について、「1.0に高速化するか、並列化でますか?」といった処理負荷の改善を促すメッセージを出力する。
[Improvement of processing load]
The
[許容値の緩和]
対策算出部26は、「Tlimitを1.0から1.3に緩和できますか?」といった許容値の緩和を促すメッセージを出力する。
[Relaxation of tolerance]
The
[要求の緩和]
対策算出部26は、「
といった要求の緩和を促すメッセージを出力する。
[Relaxation of demand]
The
A message prompting the relaxation of such a request is output.
[遷移確率の調整]
図8に、遷移確率調整用テーブルを示す。遷移確率調整用テーブルの列方向に遷移先ノードが示され、行方向に遷移元モードが示されている。テーブル中、太字で示したノード及び数値は、処理時間が超過しているノードへ要求を遷移させている遷移元のノードとその遷移確率を示す。
対策算出部26は、図8に示した遷移確率調整用テーブルを出力するとともに、処理時間が超過しているノードへ要求を遷移させている遷移元のノードについて、遷移確率を下げることを促すメッセージを出力する。例えば、対策算出部26は、ノード3に遷移する確率、すなわち、「P13=1/4」と「P23=1/1」と「P43=1/3」の遷移確率を下げることを促すメッセージを出力する。
[Adjustment of transition probability]
FIG. 8 shows a transition probability adjustment table. The transition destination node is shown in the column direction of the transition probability adjustment table, and the transition source mode is shown in the row direction. In the table, the nodes and numerical values shown in bold indicate the transition source node that is transitioning the request to the node whose processing time has been exceeded and the transition probability thereof.
The
以上説明した本実施形態のノード管理装置21によれば、要求を有限時間内に処理する任意の分散処理システムについて、実際の処理結果に基づいて、任意の要求数に対する各ノードの処理負荷を定量的に予測できる。この予測では、過負荷のノードやその負荷だけでなく、過負荷の要因や低負荷のノードを推定できるため、負荷分散や輻輳制御などの対策をより早く、より詳細に立てることができる。
According to the
ノード管理装置21において、遷移検出部22、遷移集計分析部23、処理負荷予測部24、要求数取得部25、対策算出部26及び許容負荷取得部27のそれぞれの機能を有する1つの制御部が設けられても良い。また、その制御部は、CPU等を具備したコンピュータで実現されても良い。この場合、コンピュータがプログラムを実行することで、遷移検出部22、遷移集計分析部23、処理負荷予測部24、要求数取得部25、対策算出部26及び許容負荷取得部27のそれぞれの機能を実現しても良い。
In the
プログラムは、遷移検出部22、遷移集計分析部23、処理負荷予測部24、要求数取得部25、対策算出部26及び許容負荷取得部27のそれぞれの機能に対応する処理をコンピュータが実行するためのものであって良い。プログラムは、上述したコンピュータ使用可能媒体またはコンピュータ可読媒体で提供されてもよく、また、インターネット等のネットワークを介して提供されてもよい。
In the program, the computer executes the processes corresponding to the functions of the
また、ノード管理装置21において、以下のような変形を適用することができる。
遷移検出部22は、ノードが要求を処理した際に発生した処理負荷と、要求の遷移先ノードの情報を集計する。ここで、各ノードが、処理負荷と遷移先ノードの情報を自発的に報告しても良いが、遷移検出部22が、処理状態や遷移結果をノードに問い合わせても良い。また、遷移検出部22が、ノードの通信を監視して、要求の処理開始のタイミングや、要求の受け渡しを検出しても良い。
Further, in the
The
また、ノード内に要求が処理されるまでの待ち行列がある場合は、ノード自身、処理の開始・終了タイミングなどから処理負荷を求めても良い。一方、ノード内に待ち行列が無い場合、すなわち、ノード内では各要求が一定負荷の処理を受けるような場合には、遷移時刻などを知り得た、ノード以外の第3者が処理負荷を類推しても良い。
例えば、分散処理システムが生産ラインシステムである場合、各ノードに待ち行列がある場合がある。この場合、ノード(検査工程)で要求(仕掛品)を処理(検査)した際の負荷(検査を開始・終了した時刻)と、遷移先ノード(検査の結果、判定された次の工程)を、ノード自身が求めても良い。遷移集計分析部23は、ノードからの報告に基づいて情報を集計する。
Further, if there is a queue in the node until the request is processed, the processing load may be obtained from the node itself, the start / end timing of processing, and the like. On the other hand, when there is no queue in the node, that is, when each request receives a constant load of processing in the node, a third party other than the node who can know the transition time etc. infers the processing load. You may.
For example, if the distributed processing system is a production line system, each node may have a queue. In this case, the load (time when the inspection was started / ended) when the request (work in process) was processed (inspected) by the node (inspection process) and the transition destination node (next process determined as a result of the inspection) are determined. , The node itself may ask for it. The transition
また、ノードは、移動体通信の基地局であっても良い。この場合、遷移集計分析部23は、ノードが送信するハンドオーバーの制御情報の通信を監視し、要求(ユーザ)がノード(基地局)間を遷移(ハンドオーバー)した時刻と遷移先のノード(ターゲットの基地局)を検出しても良い。また、各ユーザは一定の処理負荷をノードに与えると仮定して、遷移集計分析部23は、遷移(ハンドオーバー)した時刻から処理負荷を推定しても良い。
処理負荷と遷移先ノードの情報の集計の網羅性は、全ての遷移に関するものでも良く、あるいは、無作為に抽出されたサンプルでも良い。ここで、サンプルは、無作為に抽出された要求の全ての遷移、または、無作為に抽出された要求の無作為に抽出された遷移であっても良い。
Further, the node may be a base station for mobile communication. In this case, the transition
The completeness of the aggregation of the processing load and the information of the transition destination node may be related to all transitions, or may be a sample randomly selected. Here, the sample may be all transitions of randomly sampled requests, or randomly sampled transitions of randomly sampled requests.
処理負荷予測部24は、予測の前提となる要求数として、分散処理システム10に入力される実際の要求数を用いても良い。ここで、要求数は、過去の要求数だけでなく、現在入力されている要求数でも良い。後者の場合でも、実際の処理をする直前に処理負荷を予測できる。あるいは、処理負荷予測部24は、何らかのシミュレーションに基づいて、将来発生する要求数を予測しても良い。または、実際の要求数と部分的なシミュレーションの要求数を加算したものを、分散処理システム10に入力される要求数としても良い。
The processing
処理負荷の許容値は、例えば、ユーザインターフェースから対話的に入力されても良い(例えば、要求数wが、単発的に発生する場合)。あるいは、上記の予測の前提とした要求数の発生頻度を、処理負荷の許容値としても良い(例えば、要求数
処理負荷が許容値を超えた場合の通知先は、例えば、分散処理システムの管理者または状態監視装置、ノードの負荷分散の担当者または負荷分散装置、要求の受付システム、または輻輳制御装置である。ここで、負荷分散装置は、処理負荷の予測値が許容値を超えていないノードの処理能力の一部を、処理負荷が許容値を超えているノードの処理に割り当てても良い。
The allowable value of the processing load may be input interactively from the user interface, for example (for example, when the number of requests w occurs sporadically). Alternatively, the frequency of occurrence of the number of requests based on the above prediction may be used as the allowable value of the processing load (for example, the number of requests).
When the processing load exceeds the allowable value, the notification destination is, for example, the administrator or status monitoring device of the distributed processing system, the person in charge of load balancing or the load balancing device of the node, the request receiving system, or the congestion control device. .. Here, the load balancer may allocate a part of the processing capacity of the node whose predicted processing load does not exceed the allowable value to the processing of the node whose processing load exceeds the allowable value.
予測値が許容値を超えているノードと処理負荷を通報する際に、処理負荷予測部24は、処理負荷の予測値が許容値以下のノードとその処理負荷についても併せて通知しても良い。この通知により、分散処理(例えば、予測値が許容値未満のノードから、予測値が許容値以上のノードに処理のリソースを配置換えする処理)、あるいは、輻輳制御(例えば、負荷の高いノードではなく負荷の低いノードに、要求の一部を遷移させる処理)ができる。
When reporting a node whose predicted value exceeds the allowable value and a processing load, the processing
以上説明した各実施形態のノード管理装置は、本発明の一例であり、その構成や動作については、発明の趣旨を逸脱しない範囲で、当業者が理解し得る変更を適用することができる。 The node management device of each embodiment described above is an example of the present invention, and changes that can be understood by those skilled in the art can be applied to the configuration and operation thereof without departing from the spirit of the invention.
本発明は、互いに連携して要求を処理する複数のノードからなるシステムに適用することができる。例えば、本発明は、分散処理システムの負荷分散、移動体通信のトラフィック制御・輻輳制御、生産ラインの生産管理や進捗管理に適用することができる。 The present invention can be applied to a system consisting of a plurality of nodes that process requests in cooperation with each other. For example, the present invention can be applied to load balancing of a distributed processing system, traffic control / congestion control of mobile communication, production management and progress management of a production line.
11 ノード管理装置
12 分析部
13 予測部
151〜15n ノード
11
Claims (8)
前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する予測部と、を有する、ノード管理装置。 For a plurality of nodes that process requests in cooperation with each other, an analysis unit that analyzes the processing load when each node processes the request and the transition between the nodes of the request,
A node management device including a prediction unit that predicts the processing load of each node for a desired number of requests based on the analysis result of the processing load and the transition.
前記予測部は、前記要求の遷移確率に基づいて、各ノードの処理負荷を予測する、請求項1または2に記載のノード管理装置。 The analysis unit calculates the transition probability for each unit processing load of the request between the nodes.
The node management device according to claim 1 or 2, wherein the prediction unit predicts the processing load of each node based on the transition probability of the request.
前記予測部は、前記遷移確率行列に基づいて、各ノードの処理負荷を予測する、請求項3に記載のノード管理装置。 The analyzing unit, for said plurality of nodes, the number of requests that transitions between the nodes counted for each unit processing load to calculate the transition probability matrix based on the value obtained by counting,
The node management device according to claim 3, wherein the prediction unit predicts the processing load of each node based on the transition probability matrix.
前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測することを含む、ノード管理方法。 For a plurality of nodes that process requests in cooperation with each other, the processing load when each node processes the request and the transition between the nodes of the request are analyzed.
A node management method comprising predicting the processing load of each node for a desired number of requests based on the processing load and transition analysis results.
前記処理負荷および遷移の分析結果に基づいて、所望の要求数に対する各ノードの処理負荷を予測する処理と、をコンピュータに実行させるためのプログラム。 For a plurality of nodes that process requests in cooperation with each other, a process of analyzing the processing load when each node processes the request and a transition between the nodes of the request, and a process of analyzing the transition between the nodes of the request.
A program for causing a computer to execute a process of predicting the processing load of each node for a desired number of requests based on the analysis result of the processing load and the transition.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017191164A JP6969261B2 (en) | 2017-09-29 | 2017-09-29 | Node management device, node management method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017191164A JP6969261B2 (en) | 2017-09-29 | 2017-09-29 | Node management device, node management method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019067087A JP2019067087A (en) | 2019-04-25 |
JP6969261B2 true JP6969261B2 (en) | 2021-11-24 |
Family
ID=66339791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017191164A Active JP6969261B2 (en) | 2017-09-29 | 2017-09-29 | Node management device, node management method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6969261B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4560107B2 (en) * | 2008-07-28 | 2010-10-13 | 株式会社東芝 | Mobile communication system, control device therefor, handover control method, and mobile terminal |
JP5565181B2 (en) * | 2010-08-05 | 2014-08-06 | 富士通株式会社 | Prediction device, prediction method, and prediction program |
WO2015142376A1 (en) * | 2014-03-19 | 2015-09-24 | Eden Rock Communications Llc | Method and system for path predictive congestion avoidance |
-
2017
- 2017-09-29 JP JP2017191164A patent/JP6969261B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019067087A (en) | 2019-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20060277295A1 (en) | Monitoring system and monitoring method | |
KR101867487B1 (en) | System and method of migration based fuzzy in cloud environment | |
US20180144251A1 (en) | Server and cloud computing resource optimization method thereof for cloud big data computing architecture | |
CN106959894B (en) | Resource allocation method and device | |
CN108733509A (en) | Method and system for data to be backed up and restored in group system | |
CN112988398A (en) | Micro-service dynamic scaling and migration method and device | |
JP7006607B2 (en) | Distributed processing system, distributed processing method, and recording medium | |
KR101471749B1 (en) | Virtual machine allcoation of cloud service for fuzzy logic driven virtual machine resource evaluation apparatus and method | |
Kuchuk et al. | Resource-oriented approaches to implementation of traffic control technologies in safety-critical I&C systems | |
US20140006324A1 (en) | Automatic event analysis | |
JP2019503152A (en) | Centralized control server, local terminal, distributed monitoring system, monitoring method, and program | |
US20190280945A1 (en) | Method and apparatus for determining primary scheduler from cloud computing system | |
Upadhyay et al. | Scaled conjugate gradient backpropagation based sla violation prediction in cloud computing | |
KR20200122589A (en) | Apparatus and method for allocating cloud resources | |
CN111752706A (en) | Resource allocation method, device and storage medium | |
Cao et al. | A deep reinforcement learning approach to multi-component job scheduling in edge computing | |
Ebrahim et al. | Resilience and load balancing in fog networks: A multi-criteria decision analysis approach | |
CN117194019A (en) | Method, device, equipment and medium for controlling system resources | |
JP6969261B2 (en) | Node management device, node management method and program | |
CN113419852B (en) | Method, device, equipment and storage medium for responding request of micro service | |
CN115168042A (en) | Management method and device of monitoring cluster, computer storage medium and electronic equipment | |
US9674093B2 (en) | Method and apparatus for ripple rate sensitive and bottleneck aware resource adaptation for real-time streaming workflows | |
Omoregbee et al. | Performability requirements in making a rescaling decision for streaming applications | |
CN118170538A (en) | Task processing method, internet of things system and computer program product | |
KR20160044623A (en) | Load Balancing Method for a Linux Virtual Server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210803 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211011 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6969261 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |