JP3737713B2 - トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム - Google Patents
トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム Download PDFInfo
- Publication number
- JP3737713B2 JP3737713B2 JP2001147570A JP2001147570A JP3737713B2 JP 3737713 B2 JP3737713 B2 JP 3737713B2 JP 2001147570 A JP2001147570 A JP 2001147570A JP 2001147570 A JP2001147570 A JP 2001147570A JP 3737713 B2 JP3737713 B2 JP 3737713B2
- Authority
- JP
- Japan
- Prior art keywords
- traffic
- analysis
- fluctuation
- analysis target
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Monitoring And Testing Of Exchanges (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
【発明の属する技術分野】
本発明は,インターネット接続事業者(ISP)や電気通信事業者等のネットワークを流れるトラフィックのトラフィック変動要因分析装置に関するものである。
【0002】
ISPのネットワークや企業ネットワークで,ネットワーク運用計画を立てるとき,トラフィックの増加または減少の発生周期や発生時期はどうなっているか,その増加または減少の大きさはどの程度かといったトラフィック変動要因を調べることによって,運用管理者は適切な周期と時期に適切な対応を取ることができる。したがって,過去のトラフィック・データからその変動要因を分析することは,運用ポリシーを決定するうえで重要である。
【0003】
【従来の技術】
従来のトラフィック分析手法として,計測されたトラフィック変動波形のうち,特定のサンプルを選び,そのサンプルの変動波形を時系列と見なし,その時系列に対して時系列解析や非線形予測計算などの手法を適用することにより,そのサンプルの表す変動波形の性質を明らかにしようとするもの(以下,従来技術1という)や,単一のトラフィック変動周期を想定し,各周期におけるトラフィックの最大値を見積もることにより,ネットワークに対するトラフィックの全体的な増加/減少傾向を分析するもの(以下,従来技術2という)がある。
【0004】
【発明が解決しようとする課題】
上記従来技術1として説明した特定のサンプルを選択して時系列解析等を行う手法では,変動波形のサンプルの選び方により,時系列として分析された波形の分析結果にばらつきが出たり,サンプルの選び方が悪いと誤差の大きい分析結果となったりするという問題がある。つまり,上記従来技術1では分析結果に普遍性がないという問題がある。
【0005】
また,上記従来技術2として説明した単一のトラフィック変動周期を想定する手法では,周期的変動要因によって引き起こされる変動の具体的な波形(以後,この波形のことを変動要因のインパクト・パターンと呼ぶことにする)を求めることができないので,特定の時刻や瞬間に周期的変動要因がトラフィック変動に及ぼす作用の大きさを評価することができないという問題がある。
【0006】
さらに,上記従来技術1と従来技術2に共通して言える問題は,トラフィック変動を構成する変動要因の中に2つ以上の周期の異なる周期的変動要因が含まれていたとき,それらの周期的変動要因の影響を,変動要因毎に個別に分離できないということである。
【0007】
したがって,従来技術では,例えば「年間を通して,各々どのような周期の周期的トラフィック増加が何種類観察されるのか(1週間周期,1月周期,四半期周期など)?」とか,「週末のトラフィック増加に月末のトラフィック増加の影響が重なることがあるか,あるとすればどのくらいの影響か?」とか,「いくつかのトラフィック変動要因が重なっているとき,週次のトラフィック変動単独の時間変化のみを取り出し,どのようになっているのか定量的に調べたい。」とかいった質問や要求に明確に応えることができない。
【0008】
本発明は上記問題点の解決を図り,トラフィックの時間変動を,その変動を構成する複数の変動要因に分解して分析する手段を提供することにより,ネットワークの運用計画に有用な情報を獲得できるようにすることを目的とする。
【0009】
【課題を解決するための手段】
本発明は,上記課題を解決するため,数カ月から1年以上というような,少なくとも1カ月以上の非常に長い期間にわたって計測されたトラフィック・データの蓄積全体に対して分散分析を適用することにより,単一または少数の特定のトラフィック変動サンプルからではなく,多数のサンプルから,それらのサンプル全てに共通したトラフィック変動の性質を抽出する仕組みを設ける。
【0010】
また,分散分析が,データの変動やばらつきの大きさを,その変動やばらつきの原因となっている複数の因子毎に各因子の寄与量に分解できる性質を利用して,トラフィック流量の変動を,その変動を構成する複数の変動要因毎に各変動要因の寄与に分解する。その具体的手順は以下のとおりである。
【0011】
分散分析に先立って,トラフィック変動に寄与する可能性がある全ての周期的変動要因の周期を列挙する。列挙した各周期をタイムスケールの長さとして持ち,トラフィック・データの分類基準となるものを,以後「メトリクス」と呼ぶことにする。メトリクスには複数の種類があり,「計測日」,「計測週」,「計測月」などはメトリクスの代表例である。例えば「計測日」は,周期的変動要因の一つである日次変動に対応したメトリクスで,日次変動の周期である1日(=24時間)をタイムスケールの長さとして持つ。
【0012】
計測された生のトラフィック・データに対して分散分析を適用できるようにするためには,トラフィック・データを分析用の多次元配列データ(以後,この配列を「分析対象配列」と呼ぶ)に変換しなくてはならない。分析対象配列は多次元配列であり,その次元数は定義されたメトリクスの数に等しい。また,各配列要素の配列内での位置は,座標によって特定され,配列には座標を表すための座標軸があるが,各座標軸は,各メトリクスに対応している。各トラフィック・データは,メトリクスによって分類されてから分析対象配列の対応する配列要素に代入される。
【0013】
トラフィック・データの分析対象配列への変換は,分析対象配列構成部によって行う。分析対象配列構成部は,トラフィック・データの分類に使用するメトリクスの集合とトラフィック・データ自体を入力として受け取り,トラフィック・データを分析対象配列に変換したものを出力する。
【0014】
分析対象配列構成部の処理に基づいてできあがった分析対象配列に分散分析を適用し,分析対象配列内のデータを分析対象配列の各座標軸に対応した因子(各因子にはメトリクスが一つずつ対応している)の寄与に分解する。この際,トラフィック全体の長期にわたる増加傾向のような非周期的変動要因も共に分離される。例えばメトリクスとして「計測時刻」,「計測日」,「計測月」の三つが定義されていた場合,分析対象配列の次元は3次元であり,「計測時刻」,「計測日」,「計測月」の各メトリクスに対応した3本の座標軸を持ち,配列内の各要素データは,これら三つのメトリクスに対応した三つの因子の寄与に分解される。
【0015】
要素データの各因子への分解の結果を利用して,トラフィック変動を構成する各周期的変動要因のインパクト・パターンと非周期的変動要因のインパクト・パターンを求める。分析対象配列を作成してから,配列に分散分析を適用し,各変動要因のインパクト・パターンを求めるまでの処理は,分散分析処理部および差分配列計算部が行う。これらの処理では,分析対象配列構成部で生成された分析対象配列を入力として受け取り,トラフィック変動を構成する各変動要因のインパクト・パターンを出力する。
【0016】
分散分析処理部および差分配列計算部の処理により,各変動要因のインパクト・パターンの他に,各計測時点におけるトラフィック変動に含まれるノイズ成分の大きさが分離される。これらの処理によれば,異常トラフィック変動のトラフィック変動への寄与はノイズ成分の一部として取り出される。ノイズ成分の中で,特にノイズ平均との差の大きなものが異常トラフィック変動の寄与であると推定されるから,ここで分離されたノイズ成分の全計測時間にわたる平均μと標準偏差σを求め,μ±σの範囲外の値を取るノイズ成分を突発的な異常トラフィック変動の波形の一部であると見なし,そのようなノイズ成分が検出された計測時刻を異常トラフィック変動の発生時刻と見なす。
【0017】
なお,分析対象配列構成部,分散分析処理部および差分配列計算部のアルゴリズムは,後に詳しく説明する。
【0018】
本発明の作用は以下のとおりである。この発明によれば,非常に長い期間にわたって計測された大量のトラフィック・データを,分散分析により一括して処理することにより,特定のトラフィック変動サンプルに依存しない普遍的なトラフィックの性質を分析することができるようになる。また分散分析が,データの変動をその変動の原因となる複数の因子毎に各因子の寄与に分解できる性質を利用して,トラフィック・データの変動波形を,その変動を構成する複数の周期的変動要因および非周期的変動要因のインパクト・パターンとノイズ成分に分解できるようになる。
【0019】
以上のように,本発明のトラフィック変動要因分析装置は,ネットワーク上で計測されたトラフィック・データを蓄積する仕組みと,ネットワーク上で少なくとも1カ月以上の極めて長期間にわたって計測されたトラフィック・データの蓄積を一括して分析処理することにより,トラフィック波形の普遍的な性質を検出する仕組みとを備えることを特徴とする。
【0020】
本発明は,ネットワーク上で計測されたトラフィックの時間変動波形を,分散分析の原理に基づいて,その変動を構成する複数の変動要因に分解し,個々の変動要因毎に,その変動要因が引き起こす変動波形を求める方式を用いる。また,計測された生のトラフィック・データに分散分析を適用できるようにするため,生のトラフィック・データを多次元配列構造へ変換する手段を備える。
【0021】
さらに,トラフィックの時間変動波形から,分散分析の原理に基づいてノイズ成分として分離された波形成分の中から,突発的な異常トラフィック変動に対応する部分を特定する仕組みを備える。
【0022】
以上の手段は,コンピュータと,そのコンピュータにインストールされ実行されるソフトウェアプログラムとによって実現することができ,そのプログラムは,コンピュータが読み取り可能な可搬媒体メモリ,半導体メモリ,ハードディスク等の適当な記録媒体に格納することができる。
【0023】
【発明の実施の形態】
図1は,本発明の構成例を示すブロック図である。
【0024】
トラフィック変動要因分析装置1は,CPUおよびメモリなどからなるコンピュータシステムであって,分析対象となるトラフィック・データを記憶するトラフィック・データ記憶部11,メトリクス集合を定義するメトリクス集合定義部12,トラフィック・データをメトリクスに応じた多次元配列構造の分析対象配列に変換する分析対象配列構成部13,分散分析の処理を行う分散分析処理部14,計算されたメトリクスに対応する因子の寄与を分析対象配列から差し引く処理を行う差分配列計算部15,分析結果のインパクト・パターンを出力する変動要因情報出力部16を備える。
【0025】
トラフィック変動要因分析装置1の入力としては,トラフィック・データ入力装置2から入力されるトラフィック・データと,メトリクス選択装置3から入力されるメトリクス選択情報がある。トラフィック・データ入力装置2は,長期間にわたって収集されたトラフィック・データが格納された外部記憶装置である。メトリクス選択装置3は,キーボードやマウス等のユーザインタフェース装置によって実現される。
【0026】
図2は,トラフィック・データ入力装置2から入力されるトラフィック・データの例を示す。この例では,トラフィック・データは,計測日時と各10分間のトラフィック流量(単位はバイト)のデータからなる。このトラフィック・データは,少なくとも1カ月以上にわたるログデータであり,好ましくは,数カ月から1年以上に及ぶような長期間にわたって収集されたログデータであることが望ましい。入力されたトラフィック・データは,トラフィック・データ記憶部11に格納される。
【0027】
ユーザがメトリクス選択装置3によって選択する代表的なメトリクスには,例えば次のような5つのメトリクスm1 〜m5 があり,メトリクス集合定義部12は,メトリクス選択装置3からの入力によって,これらを分析用メトリクスとして定義する。
【0028】
【0029】
図3は,「計測時刻」と「計測日」と「計測週」とをメトリクスとして,トラフィック・データをこれらのメトリクスで分類した場合の分析対象配列の例を示している。分析対象配列構成部13は,トラフィック・データ記憶部11に記憶されているトラフィック・データを入力し,そのトラフィック・データの分類に使用するメトリクス集合定義部12で定義されたメトリクスの集合をもとに,トラフィック・データを図3に示すような分析対象配列に変換する。以下,分析対象配列構成部13の処理アルゴリズムについて説明する。
【0030】
<分析対象配列構成アルゴリズム>
1.入力として与えられたメトリクスの数をNとし,各メトリクスをタイムスケールの小さい順に並べ,m1 ,m2 ,…,mN と書く。またメトリクスmの表すタイムスケールの長さをL(m)と書く(例えばmが計測日であった場合,L(m)は1日,即ち24時間となる)。よって,j>kとなる全てのjとkの組について,L(mj )>L(mk )となる。このとき,以下の条件αが成り立つかをテストする。
【0031】
〔条件α〕
1≦j≦N,1≦k≦Nで,j>kとなる全てのjとkの組について,
L(mj )はL(mk )の整数倍で割り切れなくてはならない。
【0032】
上記の条件αが満たされる場合にはステップ2へ,そうでなければ,分析対象配列の作成は不可能である旨を出力して処理を終える。
【0033】
2.過去の全てのトラフィック・データをメトリクスm1 ,m2 ,…,mN に基づいて分類し,N次元の分析対象配列(この配列をFと記す)に組み上げる。具体的には,以下のようにする。全データを計測時刻の古い順に並べてL(m1 )間隔で時間区間に区切り,各区間毎に区間内のトラフィック量を求めてその区間の値とする。トラフィック・データの中で,計測開始時点からτ時間後の時刻に対応する区間の値d(τ)を,以下のような書式のN次元配列データ構造の要素に代入することを,全てのτの値について行う。
【0034】
代入先となる要素の各添字は,τの値から以下の手順で求める。
(1) i=N とする。
(2) q=τ/L(mi )を求め,小数点以下を切り捨てる。
(3) τ=τ mod L(mi )とする(ただし,modは剰余演算子)。
(4) 「mi 座標の添字」の値をq+1とする。
(5) i=i−1とする。
(6) iが0なら処理を終える。そうでなければステップ(2) へ行く。
【0035】
3.できあがった分析対象配列を出力する。
【0036】
以上の分析対象配列構成アルゴリズムに基づく処理により,図3に示すような分析対象配列が生成されることになる。
【0037】
分散分析処理部14は,分析対象配列構成部13の出力である分析対象配列に分散分析を適用し,分析対象配列内のデータを各メトリクスに対応した各因子の寄与に分解する。
【0038】
なお,分散分析の原理については,例えば下記の参考文献に詳しく説明されているので参照されたい。
[参考文献]大村平著「統計解析のはなし」,日科技連出版社,1997年8月28日(第27刷)発行,P.161-192 。
【0039】
分散分析処理部14の各分析結果をもとに,差分配列計算部15は,各メトリクスに対応した因子の寄与を分析対象配列から差し引く処理を行う。分散分析処理部14および差分配列計算部15によるトラフィック分析の処理アルゴリズムは以下のとおりである。
【0040】
<トラフィック分析アルゴリズム>
1.入力された分析対象配列をFとし,入力されたメトリクスの数をNとし,各メトリクスをタイムスケールの小さい順に並べ,m1 ,m2 ,…,mN と書く。メトリクスmの表すタイムスケールの長さをL(m)と書く(例えばmが計測日であった場合,L(m)は1日,即ち24時間となる)。j=Nとする。
【0041】
2.Fを分散分析の手法を用いて,各座標軸(m1 座標軸,m2 座標軸,…,mN 座標軸)に対応した因子毎に寄与ベクトル(N個の1次元配列)に分解する。メトリクスmk に対応した因子による寄与ベクトルをφk と記し,この寄与ベクトルの1番目の要素データをφi [1]と書くことにする。ここで,n(i)=L(mi+1 )/L(mi )とすると,各k(1≦k≦N)について寄与ベクトルφk の要素の数はn(k)となる。次に,N個の全ての因子による寄与をF内の各要素データから差し引くことによってN次元のノイズ・データ配列ν(トラフィック変動へのノイズの寄与を表す配列)を作る。φk 内のデータの大きさがノイズの大きさに比べて統計的有意性を持つかどうかを検証する(mk に対応した因子による寄与の不偏分散とν内のデータの不偏分散の比をF分布曲線を使って危険率5%で検定する)。φk 内のデータがノイズと比べて統計的有意性を持つ場合にはステップ3へ,そうでない場合にはステップ5へ行く。
【0042】
3.j<Nならば,周期L(mj+1 )を持つ変動要因fj+1 が検出されたと見なし,φj 内の各データを(添字の若い順に並べて)この変動要因のインパクト・パターンとして登録する。jがNと等しければ,非周期性変動要因,またはmN より大きなタイムスケールを持つメトリクスの長さを周期とする周期性変動要因が検出されたと見なす(どちらであるかを検証するには,mN より大きなタイムスケールのメトリクスmN+1 をメトリクス集合に追加して,ステップ2からの処理をやり直す)。
【0043】
4.周期をL(mj+1 )とし,インパクト・パターンをφj 内の各データを添字の若い順に並べたものとすることによって,fj+1 の記述情報を生成する。
【0044】
5.各t(1≦t≦n(j))について「mj 座標の添字」の値がtであるF内の全てのデータからφj [t]の値を差し引く。
【0045】
6.jが1ならばステップ7へ行く。そうでなければj=j−1として,ステップ2へ行く。
【0046】
7.ν内の全データの標準偏差σを求める(平均は必ず0になる)。ν内のデータのうち0±σの範囲に入らないデータを異常トラフィック変動のインパクト・パターンとして登録する。異常トラフィック変動の発生日時と発生場所は,このデータのν内での座標を調べれば解る。
【0047】
8.各j(2≦j≦N+1)についてfj を出力し,全ての処理を終える。
【0048】
変動要因情報出力部16は,以上の分析結果を出力する。図4に分析結果の出力例を示す。図4(A)は,日次変動のインパクト・パターンを示している。この例を見ると,日中,8時から19時頃までがトラフィック流量が多く,16時頃にピークがあることがわかる。図4(B)は,週次変動のインパクト・パターンを示している。月曜日から金曜日までの平日は,ほぼ100Mbyte/時のトラフィック流量で曜日に関係なく一定値を示し,土・日は,少ないことがわかる。図4(C)は,月次変動のインパクト・パターンを示している。月末の一週間前から徐々にトラフィック流量が増加し,月末にピークがくることがわかる。図4(D)は,四半期次変動のインパクト・パターンを示している。3月目のトラフィック流量が1月目,2月目より多いことがわかる。
【0049】
図5は,図1に示すトラフィック変動要因分析装置1の処理フローを示す。トラフィック変動要因分析装置1は,トラフィック・データ入力装置2からトラフィック・データを入力し,トラフィック・データ記憶部11に記憶する(ステップS1)。また,メトリクス選択装置3からの入力により,メトリクス集合定義部12によって,分類の基準となるメトリクス集合を定義する(ステップS2)以下の説明では,定義されたメトリクスの中でタイムスケールがj番目に小さいものをmj と表す。
【0050】
次に,分析対象配列構成部13は,全トラフィック・データをメトリクスに応じて図3に示すような分析対象配列に変換する(ステップS3)。メトリクス集合において定義されているメトリクスの数をNとしたとき,まずループ変数jにNを代入し(ステップS4),以下のステップS5〜S10を,jが1になるまで繰り返す。
【0051】
分散分析により,配列内データを各メトリクスに対応した因子の寄与に分解すると共に,ノイズ・データ配列を生成する(ステップS6)。定義されたメトリクスmj に対応した因子の寄与がノイズ・データの大きさと比較して充分大きいかを調べる(ステップS7)。充分大きくない場合には,次のステップS9へ進む。充分大きい場合には,メトリクスmj に対応した因子の寄与を変動要因fj+1 のインパクト・パターンとして出力する(ステップS8)。
【0052】
次に,差分配列計算部15によりメトリクスmj に対応した因子の寄与を分析対象配列から差し引く(ステップS9)。その後,jから1を引き,ステップS5へ戻って同様に処理を繰り返す。
【0053】
ループ変数のjが1になったら,ノイズ・データ配列内のデータの中でμ±σの範囲外にあるデータを探し,これを異常トラフィック変動データとする(ステップS11)。なお,μはノイズ・データ配列内の全データの平均,σはノイズ・データ配列内の全データの標準偏差である。最後に,異常トラフィック変動データを発生日時と共に出力し(ステップS12),処理を終了する。
【0054】
なお,メトリクスの定義によっては,本発明の適用において実用上,次のような問題が生じる。メトリクス集合の中に「計測週」と「計測月」が同時に含まれている場合,1カ月の長さが現実には,30日または31日に設定しなくてはならないが,それでは1カ月の長さが1週間の長さの整数倍で割り切れなくなってしまい,分析対象行列を構成する際に支障が生じる。つまり,行列の列の数が整数でなくなってしまう。これは,前述した分析対象配列構成アルゴリズムにおける条件αを満たす必要があることを意味している。
【0055】
この対策として,まず,トラフィック・データを前述の手法で日次,週次,週次以上の周期の変動パターンに分解し,元のトラフィック・データから週次変動パターンの影響だけを差し引く(他の変動パターンの影響は残す)。このトラフィック・データに対して,さらに前述の手法を適用し,日次,月次,四半期次の変動パターンに分解する。要するに,週次変動の分析と月次変動の分析とをそれぞれ別個の分散分析により行う。こうすることで,週次と月次の分析対象行列におけるずれが生じる問題を解決することができる。
【0056】
この対策について,さらに詳しく具体例に従って説明する。メトリクス定義例Aに記したm1 〜m5 のメトリクスの集合と年度始めから1年間にわたって計測されたトラフィック・データに対して,上述した分析対象配列構成アルゴリズムと,トラフィック分析を適用するものとする。一般的にはこのケースの分析が一番多く行われると考えられる。
【0057】
説明を簡単にするため,年度の始めは月曜日であったと仮定する。しかし,「計測週」と「計測月」の2つのメトリクスの組み合わせは,分析対象配列構成アルゴリズムの条件αを満たさない。
【0058】
上記メトリクスm1 〜m5 の中に,分析対象配列構成アルゴリズムの条件αを満たさないメトリクスの組み合わせがあるということは,定義されたメトリクスの集合に対して分析対象配列を構成できないということであり,トラフィック分析アルゴリズムも適用できないことになる。
【0059】
そこで,上記5つのメトリクスm1 〜m5 を,以下に示す二つのメトリクス集合(集合Aと集合B)に分類する。
(a) 集合A:「計測時刻」,「計測日」,「計測週」
(b) 集合B:「計測時刻」,「計測日」,「計測月」,「計測四半期」
ただし,集合Bに含まれる「計測日」は,計測時点が計測月の始まりから数えて何日目かを表す。
【0060】
以上のように上述したメトリクスの集合を二つの集合Aと集合Bに分け,「計測週」と「計測月」をそれぞれ異なる集合に振り分け,集合Aと集合Bに対して個別に分析対象配列構成アルゴリズムとトラフィック分析アルゴリズムを適用することにより,上記の分析対象配列構成アルゴリズムの条件αを満たさないという問題が解決できる。その具体的手順は以下のようになる。
【0061】
まず,集合Aに含まれる3つのメトリクスとトラフィック・データを入力として分析対象配列構成アルゴリズムを実行し,図3に示すような分析対象配列を構成する。この分析対象配列は3つのメトリクスに基づいて構成されているので3次元であり,各配列要素は,「行」の座標と「列」の座標と「層」の座標の組み合わせで識別できる。「行」の座標軸は「計測時刻」に対応し,「列」の座標軸は「計測日」に対応し,「層」の座標軸は「計測週」に対応する。
【0062】
例えば,年度始めから73日目の20時の間に計測されたトラフィック・データは「第11週の層」の「水曜日の列」の「20時の行」の要素データとして分析対象配列内に格納される。この分析対象配列を入力としてトラフィック分析アルゴリズムを実行すると,トラフィック・データは「各行の因子」の寄与と「各列の因子」の寄与と「各層の因子」の寄与に分解され,以下の4つのインパクト・パターンが得られる。
1)日次変動要因のインパクト・パターン
2)週次変動要因のインパクト・パターン
3)月次,四半期次,年次変動要因の各インパクト・パターンの和と非周期的変動要因のインパクト・パターンの合わさったもの
4)ノイズ成分の寄与
ここで,日次変動要因のインパクト・パターンは,0時から23時までの各時刻に対応する各行の因子の寄与を数列として並べたもので表され,週次変動要因のインパクト・パターンは,月曜日から日曜日までの各曜日に対応する各列の因子の寄与を数列として並べたもので表される。日次,週次以外の周期的変動要因および非周期的変動要因のインパクト・パターンの和は,第1週から第52週までの各週に対応する各層の因子の寄与を数列として並べたもので表される。
【0063】
週次変動要因のインパクト・パターンを出力した後,週次変動の影響を図3の分析対象配列内の全要素データから差し引く(列の座標が月曜日に相当する全ての要素データから月曜日の列の因子の寄与を差し引き,以下他の曜日に関しても同様の処理を行う)。この処理を行った後,分析対象行列内のデータを1次元データに戻し,新たなトラフィック・データとする。
【0064】
さらに,この新たなトラフィック・データを計測月毎に分類し,月の長さが31日に満たない月の計測データについては,31日に足りない分の日のデータをその月の最終日のデータからコピーしてくることにより作り出す(例えば,4月には31日がないから,4月の31日目のデータは4月30日のデータをコピーして作る)。
【0065】
次に,上記のように週次変動の影響だけを取り除き,計測月の長さを31日に揃えたトラフィック・データと集合Bに含まれる4つのメトリクスを入力として,分析対象配列構成アルゴリズムを実行し,図6に示すような分析対象配列を構成する。この分析対象配列は,4つのメトリクスに基づいて構成されているので4次元であり,各配列要素は,「行」の座標と「列」の座標と「層」の座標と「データ群」の座標の組み合わせて識別できる。「行」の座標軸は「計測時刻」に対応し,「列」の座標軸は「計測日」に対応し,「層」の座標軸は計測月に対応し,「データ群」の座標軸は「計測四半期」に対応する。
【0066】
例えば,計測時点が年度始めから134日目の3時のデータは,「第2四半期のデータ群」の「第2月の層」の「第10日目の列」の「3時の行」の要素データとして分析対象配列内に格納される。この分析対象配列を入力として,トラフィック分析アルゴリズムを実行すると,トラフィック・データは,「各行の因子」の寄与と「各列の因子」の寄与と「各層の因子」の寄与と「各データ群の因子」の寄与に分解され,以下の5つのインパクト・パターンが得られる。
1)日次変動要因のインパクト・パターン
2)月次変動要因のインパクト・パターン
3)四半期次変動要因のインパクト・パターン
4)年次変動要因と非周期的変動要因の各インパクト・パターンの和
5)ノイズ成分の寄与
ここで,月次変動要因のインパクト・パターンは,第1日から第31日までの各日に対応する各列の因子の寄与を数列として並べたもので表され,四半期次変動要因のインパクト・パターンは,第1月から第3月までの各月に対応する各層の因子の寄与を数列として並べたもので表される。年次変動要因と非周期的変動要因との両者のインパクト・パターンの和は,第1四半期から第4四半期までの各四半期に対応する各データ群の因子の寄与を数列として並べたもので表される。
【0067】
この結果,(日次,週次,月次などの)複数の周期的変動要因と非周期的変動要因の重なり合った年間トラフィック・データの変動波形を,各変動要因毎に分解し,各変動要因のインパクト・パターンを個別に取り出すことができるようになる。分解され,個別に取り出された各変動要因のインパクト・パターンは,年間を通じた全ての変動波形サンプルに共通する特徴を持っているという意味で普遍性があると言える。
【0068】
例えば,上記の手順で取り出された週次変動のインパクト・パターンは,年間の週次変動の全サンプルから他の変動要因(日次,月次など)の影響を取り除いた後,それら全てのサンプルを同じ曜日のデータ同士平均化して求めたものとなっている。よって先に述べた従来技術の三つの課題は本発明により解決されたと言える。トラフィック分析の最後のステップとして,ノイズ成分の寄与のうち,平均値からの差の大きなものを前述の手法に基づいて取り出し,異常トラフィック変動のインパクト・パターンを構成するデータとする。
【0069】
【発明の効果】
本発明によれば,分散分析が,データの変動をその変動の原因となる複数の因子毎に各因子の寄与に分解できる性質を利用して,トラフィック・データの変動波形を,その変動を構成する複数の周期的変動要因および非周期的変動要因のインパクト・パターンとノイズ成分に分解できる。そのため,本トラフィック変動要因分析装置をISPや電気通信事業者等のネットワーク上で利用すれば,ネットワーク運用管理者は,トラフィックの増減がどのような周期でどのような時期にどの程度の量で起こっているかを過去のトラフィック・データの蓄積から分析することが可能になる。
【図面の簡単な説明】
【図1】本発明の構成例を示すブロック図である。
【図2】トラフィック・データの例を示す図である。
【図3】トラフィック・データを計測時刻,計測日,計測週によって分類した結果できる分析対象配列の例を示す図である。
【図4】分析結果の出力例を示す図である。
【図5】トラフィック変動要因分析装置の処理フローを示す図である。
【図6】トラフィック・データを計測時刻,計測日,計測月,計測四半期によって分類した結果できる分析対象配列の例を示す図である。
【符号の説明】
1 トラフィック変動要因分析装置
11 トラフィック・データ記憶部
12 メトリクス集合定義部
13 分析対象配列構成部
14 分散分析処理部
15 差分配列計算部
16 変動要因情報出力部
2 トラフィック・データ入力装置
3 メトリクス選択装置
Claims (5)
- ネットワーク上で計測された長期間にわたるトラフィック・データの時間変動を分析するトラフィック変動要因分析装置であって,
計測されたトラフィック・データを多次元配列構造の分析対象配列に変換する手段と,
前記分析対象配列について,分散分析を適用し,個々の時間変動要因毎にその変動要因が引き起こす変動パターン波形を求める分散分析処理手段と,
求めた変動パターン波形を出力する手段とを備える
ことを特徴とするトラフィック変動要因分析装置。 - 前記計測されたトラフィック・データを分析対象配列に変換するにあたって,トラフィック・データの分類基準となるメトリクスの集合を定義する手段を備え,
前記分析対象配列に変換する手段は,各トラフィック・データを定義されたメトリクスによって分類し,分析対象配列の前記各分類に対応する配列要素に代入する
ことを特徴とする請求項1記載のトラフィック変動要因分析装置。 - 前記分析対象配列に変換する手段は,前記定義されたメトリクスの集合に,計測週と計測月のメトリクス要素を含むとき,計測週のメトリクスを含み計測月のメトリクスを含まない第1の分析対象配列と,計測月のメトリクスを含み計測週のメトリクスを含まない第2の分析対象配列とを生成し,
前記分散分析処理手段は,前記第1の分析対象配列に対して行った分散分析によって得られた週次変動パターンの影響を前記第2の分析対象配列のトラフィック・データから差し引いた結果について分散分析を行い,月次変動パターンを算出する
ことを特徴とする請求項2記載のトラフィック変動要因分析装置。 - 前記分散分析処理手段は,分散分析の原理に基づいてノイズ成分として分離された時間変動波形成分の中から,突発的な異常トラフィック変動に対応する部分を特定する手段を有する
ことを特徴とする請求項1,請求項2または請求項3記載のトラフィック変動要因分析装置。 - ネットワーク上で計測された長期間にわたるトラフィック・データの時間変動を分析するためのトラフィック変動要因分析用プログラムであって,
計測されたトラフィック・データを多次元配列構造の分析対象配列に変換する処理と,
前記分析対象配列について,分散分析を適用し,個々の時間変動要因毎にその変動要因が引き起こす変動パターン波形を求める分散分析処理と,
求めた変動パターン波形を出力する処理とを,
コンピュータに実行させるためのトラフィック変動要因分析用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001147570A JP3737713B2 (ja) | 2001-05-17 | 2001-05-17 | トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001147570A JP3737713B2 (ja) | 2001-05-17 | 2001-05-17 | トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002344447A JP2002344447A (ja) | 2002-11-29 |
JP3737713B2 true JP3737713B2 (ja) | 2006-01-25 |
Family
ID=18993036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001147570A Expired - Fee Related JP3737713B2 (ja) | 2001-05-17 | 2001-05-17 | トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3737713B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4745881B2 (ja) * | 2006-04-21 | 2011-08-10 | 三菱電機株式会社 | ネットワーク状態判定装置及びネットワーク状態判定方法及びネットワーク状態判定プログラム |
JP2008146157A (ja) * | 2006-12-06 | 2008-06-26 | Mitsubishi Electric Corp | ネットワーク異常判定装置 |
JP4721362B2 (ja) * | 2007-06-12 | 2011-07-13 | 日本電信電話株式会社 | 閾値設定方法とシステムおよびプログラム |
JP4956380B2 (ja) * | 2007-11-07 | 2012-06-20 | 日本電信電話株式会社 | 通信帯域算出装置、方法、およびプログラム |
JP4956381B2 (ja) * | 2007-11-07 | 2012-06-20 | 日本電信電話株式会社 | トラヒック分析装置、方法、およびプログラム |
JP4823258B2 (ja) * | 2008-03-10 | 2011-11-24 | 日本電信電話株式会社 | 通信帯域算出方法、装置、およびトラヒック管理方法 |
JP4934660B2 (ja) * | 2008-11-28 | 2012-05-16 | 日本電信電話株式会社 | 通信帯域算出方法、装置、およびトラヒック管理方法 |
US20210225050A1 (en) * | 2018-03-17 | 2021-07-22 | Dataspark Pte Ltd. | Human Daily Activity Represented by and Processed as Images |
SG11202009110QA (en) * | 2018-04-17 | 2020-11-27 | Dataspark Pte Ltd | Image analysis of human daily activity represented by layered images |
-
2001
- 2001-05-17 JP JP2001147570A patent/JP3737713B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002344447A (ja) | 2002-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674604B (zh) | 基于多维时序帧卷积lstm的变压器dga数据预测方法 | |
Bauldry | Structural equation modeling | |
US8583568B2 (en) | Systems and methods for detection of satisficing in surveys | |
US8495060B1 (en) | Prioritization of reports using content data change from baseline | |
US20080270088A1 (en) | Method and system for causal modeling and outlier detection | |
Hu et al. | Knowledge discovery of weighted RFM sequential patterns from customer sequence databases | |
US20180196837A1 (en) | Root cause analysis of performance problems | |
JP3737713B2 (ja) | トラフィック変動要因分析装置およびトラフィック変動要因分析用プログラム | |
US6470229B1 (en) | Semiconductor yield management system and method | |
CN113609445A (zh) | 多源异构监测数据处理方法、终端设备及可读存储介质 | |
CN111858245A (zh) | 一种异常数据的分析方法、装置、电子设备及存储介质 | |
EP3072296A1 (en) | Methods and systems for wavelet based representation | |
EP4231276A1 (en) | Hidden decision tree test device, hidden decision tree test system, hidden decision tree test method, and program | |
US20090112917A1 (en) | Method and computer program product for using data mining tools to automatically compare an investigated unit and a benchmark unit | |
Grivel et al. | DFA-based abacuses providing the Hurst exponent estimate for short-memory processes | |
Sharma et al. | Simulating noisy, nonparametric, and multivariate discrete patterns | |
US20090055200A1 (en) | Identifying and validating factors that have particular effects on user behavior | |
US12052134B2 (en) | Identification of clusters of elements causing network performance degradation or outage | |
Rajulton | Analysis of life histories: A state space approach | |
Seaholm et al. | Order of response surfaces for representation of a Monte Carlo epidemic model | |
JP7302439B2 (ja) | システム分析方法、およびシステム分析プログラム | |
CN118193964B (zh) | 一种企业采购数据自动纠错方法及系统 | |
Maeng et al. | Regularised forecasting via smooth-rough partitioning of the regression coefficients | |
Mohammed et al. | Bayesian inference in a multiple contaminated autoregressive model with trend | |
JP2021182313A (ja) | 検出方法、および検出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051027 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081104 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091104 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101104 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101104 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111104 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111104 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121104 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121104 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131104 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |