[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2010224829A - 運用管理システム - Google Patents

運用管理システム Download PDF

Info

Publication number
JP2010224829A
JP2010224829A JP2009070857A JP2009070857A JP2010224829A JP 2010224829 A JP2010224829 A JP 2010224829A JP 2009070857 A JP2009070857 A JP 2009070857A JP 2009070857 A JP2009070857 A JP 2009070857A JP 2010224829 A JP2010224829 A JP 2010224829A
Authority
JP
Japan
Prior art keywords
incident
information
management system
knowledge
remote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009070857A
Other languages
English (en)
Inventor
Masayuki Koga
昌之 古賀
Toshiyuki Moribe
俊幸 森部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba IT Services Corp
Original Assignee
Toshiba IT Services Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba IT Services Corp filed Critical Toshiba IT Services Corp
Priority to JP2009070857A priority Critical patent/JP2010224829A/ja
Publication of JP2010224829A publication Critical patent/JP2010224829A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】数百台規模の多数のコンピュータを監視し障害が発生したコンピュータに対して遠隔操作にて自動的に保守作業を行うとともに、その保守作業の結果まで管理することが可能な運用管理システムを提供する。
【解決手段】受付管理システムがインシデント毎にインシデント状態を管理するとともに、ナレッジシステムがエラーコード毎に対応手順を管理し、統合支援システムがインシデント状態と対応手順に基づいてリモート操作システムに監視対象サーバに対して遠隔保守操作させる。
【選択図】図1

Description

本発明は多数のコンピュータを同時に遠隔管理、及び遠隔保守可能なコンピュータシステムの運用管理システムに関する。
全産業分野の大小企業においては、各種コンピュータが不可欠となっている。そして、各種コンピュータとしても、その用途、機能、規模、異常発生時の対応レベルの高低など、その広がりは広範囲になっている。特に昨今のコンピュータ機能の高度化は、その異常・障害検知、保守作業の困難性を伴うこととなり、コンピュータ所有企業自身がこれらを正しく実施することには限界となっている。
そこで、コンピュータ所有企業としては、コンピュータの状態監視並びに運用を含め、専門のサービス会社へ委託することが広がっている。いわゆる運用のアウトソーシングである。このような状況下で、コンピュータを所有する企業としては、夜間・休日を含むフルアウトソーシングやサーバメーカ、機種、OSを問わないマルチベンダ対応の管理提供を希望する傾向にある。更に、障害検知時に一次診断の実施、通常運用に加えてセキュリティ監視・診断などの付加価値サービスの提供、運用管理要員の確保などの要望も多い。
そこで、ユーザコンピュータシステムと監視コンピュータ間をネットワークで接続し、ユーザコンピュータシステムの稼動状況、障害発生の有無などを常時監視するリモート監視システムが知られている(例えば、特許文献1、特許文献2を参照)。また、ユーザコンピュータシステム所有企業として専門のコンピュータ要員を自社が保有することが困難な場合には、専門のサービス会社から要員を派遣し常駐させたり、必要時に派遣を受けたりすることが行われている。また、遠隔にある機器の停止、起動をセンターにて行うことも広く認められるところである。
さらに、入力作業の効率化のためにユーザコンピュータシステムの運転情報を、電子メールを用いて監視コンピュータに収集する技術が提案されている(例えば、特許文献3)。
特開2001−325162号公報 特開2004−246759号公報 特開2000−278773号公報
従来の技術によっては、障害に対して自動復旧をする場合、自動復旧の指示を出力するのみであり、監視対象のサーバが意図したとおり復旧したかの監視は人手に頼らざるを得なかった。このため、大幅な工数削減は困難であるという問題点があった。
また、自動修復を行うシステムは自動修復の結果が判明するまで待ち状態を維持しなければならず、運用管理できる監視対象サーバの数が限られていた。
本発明は数百台規模の多数のコンピュータを監視し障害が発生したコンピュータに対して遠隔操作にて自動的に保守作業を行うとともに、その保守作業の結果まで管理することが可能な運用管理システムを提供することを目的とする。
本発明は、監視対象サーバから監視対象サーバに生じたインシデントに関する情報であるインシデント情報を受信するリモート監視システムと、顧客情報を管理する構成管理システムと、障害に対する対応手順を含むナレッジ情報を管理するナレッジシステムと、 監視対象サーバの状態をインシデント毎に格納するインシデントデータベースを備え、インシデントの状態を管理する受付管理システムと、監視対象サーバに対して遠隔にて自動操作を実施するリモート操作システムと、リモート監視システムから受信したインシデント情報に従い、構成管理システムとナレッジシステムから受信した監視対象サーバの障害の修復に必要な情報を用いてリモート操作システムに監視対象サーバの自動修復操作をさせるとともに、自動修復操作後にリモート監視システムから受信したインシデント情報に従い、構成管理システムとナレッジシステムから受信したインシデント情報に対する対応方法に関する情報によって監視対象サーバが復旧したかを判定する統合支援システムと、を備える運用管理システムを提供する。
本発明においては、監視対象サーバを自動的に修復するとともに修復が完了したかどうかも自動的に管理することが可能となる。従って、監視対象サーバの数が数百台規模に上っても的確かつタイムリーな運用管理が可能となるという効果がある。
本発明の一実施形態のシステム構成の概要を示した図。 本発明の一実施形態の詳細な構成並びにデータフローを示した図。 本発明の一実施形態におけるシステム集中監視コンソールの画面例を示した図。 本発明の一実施形態におけるシステム集中監視コンソールの画面例を示した図。 本発明の一実施形態における顧客システム監視コンソールの画面例を示した図。 本発明の一実施形態における顧客システム構成情報の画面例を示した図。 本発明の一実施形態におけるナレッジ情報の画面例を示した図。 本発明の一実施形態におけるリモート操作コンソールの画面例を示した図。 本発明の一実施形態における進捗状況監視コンソールの画面例を示した図。 運用管理システムの具体的構成例を示すブロック図である。 インシデントDBのデータ構造を示した図である。 顧客情報DBのデータ構造を表す図である。 ナレッジDBのデータ構造を示す図である。 運用管理システムのインシデント受付時の動作を示すフローチャートである。 運用管理システムのインシデント受付時の動作を示すフローチャートの続きである。 運用管理システムのインシデント受付時の動作を示すフローチャートの続きである。 運用管理システムの修復受付時の動作を示すフローチャートである。 運用管理システムの修復受付時の動作を示すフローチャートの続きである。
(運用管理システムの概要)
以下、本発明の運用管理システムの一実施形態を、図面を参照して詳細に説明する。図1は本発明に係るリモート操作のシステム構成並びに動作概要を示す図である。図1において、点線で示したリモート運用センタ11には統合支援システム12が設置されており、この統合支援システム12にはリモート監視システム13、受付管理システム14、構成管理システム15、ナレッジシステム16並びにリモート操作システム17が接続されている。なお、これらのシステムは、単一あるいは複数のコンピュータにて構成することが可能である。
リモート監視システム13には、被監視サーバであるユーザコンピュータシステムA、B、C、…が接続されている。ユーザコンピュータシステムA、B、C、…とリモート監視システム13は、ネットワークによって接続される。また、ユーザコンピュータシステムA、B、C、…は、それぞれのコンピュータの所有者内に設置されている場合もあるが、所有者外のリモート運用センタ11が管理する場所に設置されているケースもある。
リモート監視システム13では、ユーザコンピュータシステムA、B、C、…の死活監視やリソース監視、ログ監視、サービス監視、プロセス監視などを24時間、365日連続して行う。また、ユーザのネットワーク内に情報収集サーバを設置して、ユーザのシステム状態を監視することも行われる。
リモート監視中に、あるユーザコンピュータシステムの障害発生を検知すると、この障害発生情報は統合支援システム12を介して先ず受付管理システム14に入力される。受付管理システム14からは、検知した障害に対応した受付IDが出力されて統合支援システム12に入力される。受付IDが発行されると、統合支援システム12は、この受付IDに対応するユーザコンピュータシステムの契約情報、システム構成情報を構成管理システム15から抽出する。
あわせて、統合支援システム12は、発生した障害に対応する既知障害情報、手順情報などをナレッジシステム16から抽出する。
このようにして、障害が検知されたユーザコンピュータシステム、機器構成、障害情報などの情報に基づいて、統合支援システム12は、リモート操作システム17へ、対象となっている障害に対する最適な対処手段を手順を含めて、必要な情報の伝送とともにシステム復旧などの処理実行を自動的に指示し、リモート操作システム17は、指示された処理を対象であるユーザコンピュータシステムに実行する。なお、リモート操作システム17は、障害に対する対処運用を完了後、操作(作業)結果情報を統合支援システム12へ伝送する。
図2は、図1に示した各システムで扱う具体的なデータ並びにこれらデータの入出力状況を示した図であり、図3〜図9は、システム処理における代表的な表示画面例を示したものである。以下にこれら図2〜図9を参照して本発明の構成並びに動作を詳細に説明する。
リモート監視システム13にてユーザコンピュータシステムの障害を検知すると、リモート監視システム13は障害発生日時、契約ユーザID、監視対象であるコンピュータシステムを特定する監視機器ID、障害が発生した障害箇所を特定する障害部位、具体的な障害内容のそれぞれの情報を統合支援システム12へ転送する。
図3には、システム集中監視コンソール18の表示画面例を示してある。この画面では、監視状況を示す表示並びにユーザコンピュータシステムごとに顧客A〜nの状態が表示される構成になっている。図3では、太枠で示してある部分が監視中であることを表示している。画面下部には日時を秒単位まで表示してある。監視中であって、各顧客システムが正常に動作している場合には、いずれの顧客表示も変化はない。
いま、顧客Fのシステムに障害が発生した場合には、図4に示したように顧客Fが太枠19で示すように表示が変化する。図では表示の変化を太枠表記で示したが、これは実機においては正常動作の際の色と異なる色に変化させたり、点滅表示にしたり、あるいは音響による発報などを組み合わせて行う。
リモート監視システム13からの上述した情報は、受付管理システム14へ入力され、受付管理システム14からは検知された障害ごとに受付IDを統合支援システム12へ出力する。
構成管理システム15には、すべてのユーザの契約情報、システム構成情報、システムを構成する機器構成情報が格納されている。構成管理システム15では、受付IDが発行された障害発生事案の契約ユーザID並びに監視機器IDが入力されると、これらのIDに対応する契約情報、システム構成情報、機器構成情報が出力される。
図5に示した顧客システム監視コンソール20には、契約ユーザIDごとに障害発生日時、監視機器ID、障害部位、障害内容が表示される。また、構成管理システム15からの出力情報は、図6に示す顧客システム構成情報21として、契約ユーザID並びに監視機器IDに対応した契約情報、システム構成情報、機器構成情報などが表示される。
ナレッジシステム16には、障害が発生したシステムを復旧させるためのリモート操作システム17が対象システムへ実行する処理内容、処理手順などが格納されている。具体的には、契約ユーザID、監視機器ID、障害部位、障害内容の各々の情報が入力されると、これらに対応した既知障害情報、障害履歴(事例)情報、復旧などのリモート操作システム17で実行する手順情報が出力される。
これらの情報は、図7に示したナレッジ情報画面22に契約ユーザID、監視機器ID、障害部位、手順書アイコンとともに、障害内容、既知障害情報、障害履歴(事例)情報が表示される。
このようにして、リモート監視システム13にて障害を検知してから、障害発生の機器構成情報などとともに、復旧などのための手順情報などが自動的に出力される。そして、これらの情報が抽出されると、リモート操作システム17に契約ユーザID、監視機器ID、受付ID並びに手順情報が伝送される。リモート操作システム17においては、指示された手順に従って必要な作業を障害が発生したシステムに対して自動的に実行する。リモート操作システム17は、必要な処理が完了すると、統合支援システム12へ実行した操作(作業)結果を通知する。
リモート操作システム17の処理状況は、図8に示したリモート操作コンソール画面23に表示される。すなわち、契約ユーザID、監視機器ID、受付ID表示とともに、手順情報並びに操作(作業)結果情報が表示される。また、リモート操作の進捗状況表示は、図9に示した進捗状況監視コンソール画面24に表示される。すなわち、受付ID、障害発生日時、契約ユーザID、監視機器ID、障害部位、ステータス、障害内容、障害履歴、完了日時が表示される。
そして、上述したそれぞれのシステムからの出力情報は、出力先の各システムに必要な情報として取り込まれ、ある情報は更新され、ある情報は新規に登録される。このようにして各システムの格納情報は、予め登録されている初期情報とともに更新あるいは追加されることによって更に充実し、以降の障害発生時に的確な復旧処理を可能としている。
また、本発明によって、リモート監視とリモート操作とを連続した一体処理として履行することを可能にし、障害発生から復旧までの期間を短縮するとともに、障害の拡大を防止することを可能とした。
(運用管理システムの詳細)
(運用管理システムの構成)
図10は、運用管理システムの具体的構成例を示すブロック図である。図10に示すように、運用管理システム101はリモート運用センタに設置される。顧客のもとに設置される顧客所有のシステムである顧客システム108は、運用の監視対象となる監視対象サーバ108Aと、監視対象サーバ108Aの運用状況に関する情報を収集する情報収集サーバ108Bとを有する。
運用管理システム101は、監視対象サーバ108Aの動作を遠隔監視するリモート監視システム102と、障害の発生と回復の情報を管理する受付管理システム104と、顧客に関する情報を管理する構成管理システム105と、障害に対する修復方法を蓄積して管理するナレッジシステム106と、監視対象サーバ108Aに対して遠隔保守操作を行うリモート操作システム107と、これらの運用管理システム101に含まれる各システムを統合して監視対象サーバ108Aの管理、保守を行う統合支援システム103と、を含む。
リモート監視システム102は、情報収集サーバが108Bから受信した障害や復旧などに関する情報を取捨選択して処理するサーバであるリモート監視サーバ102Aを備える。
受付管理システム104は、障害の発生と回復の情報を操作して管理するサーバである受付管理システムサーバ104Aと、インシデント情報を格納するインシデントデータベース104B(以下、データベースをDBと略す。)と、を備える。
ここで、インシデントとは、監視対象サーバ108Aに発生した障害、障害からの復旧、ソフトウエアやハードウエアの動作など、管理運用の対象となる事象を言う。また、この管理運用の対象となる事象に関する情報をインシデント情報という。インシデント情報には例えばエラーコードが含まれる。
構成管理システム105は、顧客に関する情報を操作して管理するサーバである構成管理システムサーバ105Aと、顧客に関する情報を格納する顧客情報DB105Bと、を備える。
ナレッジシステム106は、障害に対する対処方法に関する情報を操作して管理するナレッジシステムサーバ106Aと、障害に対する対処方法に関する情報を格納するナレッジDB106Bと、を備える。
リモート操作システム107は、監視対象サーバ108Aを遠隔操作するサーバであるリモート操作システムサーバ107Aを備える。
情報収集サーバ108Bはインターネットなどの通信回線網109を介してリモート監視システム102に接続される。
図11は、インシデントDB104Bのデータ構造を示した図である。図11に示すように、インシデントDB104Bは例えば、インシデント毎に固有に割り当てられる「インシデント番号」と、監視対象サーバ108Aの名称である「サーバ名」と、顧客の名称である「顧客名」と、監視対象サーバ108Aが生成したエラーコードである「エラーコード」と、インシデントの処理状態を示す「インシデント状態」と、遠隔操作の結果である「対応結果」と、を格納する。
「インシデント状態」に格納されるデータの例には、処理中を表す「オープン」と、処理済みを表す「クローズ」とが含まれる。
図12は、顧客情報DB105Bのデータ構造を表す図である。図12に示すように、顧客情報DB105Bは、顧客に固有に割り当てられる「顧客コード」と、顧客の名称である「顧客名」と、顧客における担当者の名前である「担当者名」と、顧客の連絡先である「連絡先」と、を格納する。
図13は、ナレッジDB106Bのデータ構造を示す図である。図13に示すように、ナレッジDB106Bは、顧客に固有に割り当てられた「顧客コード」と、監視対象サーバ108Aが生成したエラーコードである「エラーコード」と、監視対象サーバ108Aの名称である「サーバ名」と、障害の内容または障害の修復を示すコードである「対応コード」と、各障害の内容または障害の修復に対する対応手順を示す「対応手順」と、タイムアウト時間を示す「作業タイマー」と、を格納する。
「対応コード」に格納されるデータの例には、障害発生を示すNULL値と、障害毎に固有に割り当てられ、その障害からの修復を示す対応コード、例えば「ERR001」などが含まれる。
(運用管理システムの動作)
図14は、運用管理システム101のインシデント受付時の動作を示すフローチャートである。
統合支援システム103は、リモート監視システム102からインシデント情報を受信したとき、構成管理システム105から受信した顧客情報とインシデント情報に基づいてナレッジシステム106にナレッジ情報を問い合わせるナレッジ情報問い合わせ手段と、 インシデントの状態を示すインシデント状態をインシデント毎に受付管理システム104に格納させるインシデント発行手段と、ナレッジ情報に基づいてリモート操作システム107に自動操作を行わせるリモート操作指示手段と、自動修復操作後にリモート監視システム102から受信したインシデント情報に従い、構成管理システム105とナレッジシステム106から受信したインシデント情報に対する対応方法に関する情報によって監視対象サーバ108Aが復旧したと判定したとき、インシデント状態を、修復済みを表す値に変更するインシデント閉鎖手段と、備える。
図14に示すように、ステップ201において、リモート監視システム102は情報収集サーバ108Bから障害または修復に関するイベントである障害イベントを検知し、この障害イベントをインシデント情報として統合支援システム103に通知する。
ステップ202において、統合支援システム103はリモート監視システム102から障害イベントの通知を受理する。受理した障害イベントに関する情報には、例えば顧客コード、サーバ名、エラーコードなどが含まれる。
ステップ203において、統合支援システム103は顧客コードに基づいて構成管理システム105に顧客に関する情報である顧客情報の問い合わせを行う。ステップ204において、構成管理システム105は顧客情報DB105Bから顧客情報を読みだし、統合支援システム103に返信する。顧客情報には、例えば顧客名、担当者名、連絡先などが含まれる。
ステップ205において、統合支援システム103は、例えば顧客コード、サーバ名、エラーコードに基づいてナレッジシステム106に障害に対する対応に関する情報であるナレッジ情報を問い合わせる。ここで、顧客毎、サーバ毎のエラーコードに基づいて問い合わせる理由は、顧客毎、サーバ毎によってシステム構成が異なるため対応方法が異なるからである。
ステップ206において、ナレッジシステム106はナレッジ情報を統合支援システム103に返信する。返信されるナレッジ情報には、例えば対応コード、対応手順の有無、対応手順、作業タイマー、などが含まれる。
ステップ207において、統合支援システム103は対応コードがあるかどうか、すなわちNULL値でないかどうかを判定する。対応コードがあった場合、統合支援システム103は後述する図17のステップ508に進む。対応コードがなかった場合、すなわちNULL値であった場合、統合支援システム103はステップ208に進む。上述したように、対応コードがNULL値である場合は障害発生を表す。
ステップ208において、統合支援システム103は受付管理システム104に対してインシデントの登録を指示する。この指示には、例えば顧客名、エラーコード、サーバ名などが含まれる。
ステップ209において、受付管理システム104はインシデントDB104Bに、インシデント番号を固有に割り当て、このインシデント番号と、サーバ名と、顧客名と、エラーコードと、「オープン」としたインシデント状態と、対応結果とを格納する。受付管理システム104は、この格納されたインシデント番号を統合支援システム103に送信する。この格納と送信とをインシデントの発行と呼ぶ。
図15は、運用管理システム101のインシデント受付時の動作を示すフローチャートの続きである。図15に示すように、ステップ301において、統合支援システム103は受信したナレッジ情報に対応手順があるか判定する。対応手順がない場合、すなわちNULL値の場合統合支援システム103は手動による処理をオペレータに指示する処理である手動対応処理を開始する。対応手順がある場合、統合支援システム103はステップ303に進む。
ステップ303において、統合支援システム103は受信したナレッジ情報の作業タイマーに従ってタイマーをセットする。ステップ304において、統合支援システム103は受信した対応手順に従って監視対象サーバ108Aに対して遠隔にて自動操作を行うようにリモート操作システム107に指示を行う。ステップ305において、リモート操作システム107は、受信した指示に従って監視対象サーバ108Aに対して自動操作を実施する。
ステップ306において、統合支援システム103は受付管理システム104にインシデント状態を問い合わせる。問い合わせはインシデント番号に基づいて行われる。
ステップ307において、受付管理システム104はインシデントDB104Bから受信したインシデント番号のインシデント状態を読みだし、統合支援システム103に回答する。
ここで、インシデント状態は、後述するように、先に行われた自動操作によって修復が完了している場合には「クローズ」に書き換えられており、修復が未完了の場合は「オープン」のままである。
図16は、運用管理システム101のインシデント受付時の動作を示すフローチャートの続きである。図16に示すように、ステップ401において、統合支援システム103は受信したインシデント状態が「オープン」であるかを判定する。統合支援システム103は、インシデント状態が「オープン」の場合ステップ402に進み、「クローズ」の場合処理を終了する。
ステップ402において、統合支援システム103は、タイマーがタイムアウトか判定する。統合支援システム103は、タイムアウトの場合異常時処理を開始し、タイムアウトでない場合ステップ306に進む。
図17は、運用管理システム101の修復受付時の動作を示すフローチャートである。図17に示すように、ステップ501において、リモート監視システム102は情報収集サーバ108Bから障害または修復に関するイベントである障害イベントを検知し、この障害イベントをインシデント情報として統合支援システム103に通知する。
ステップ502において、統合支援システム103はリモート監視システム102から障害イベントの通知を受理する。受理した障害イベントに関する情報には、例えば顧客コード、サーバ名、エラーコードなどが含まれる。修復の場合、エラーコードには修復を示すコードが示される。
ステップ503において、統合支援システム103は顧客コードに基づいて構成管理システム105に顧客に関する情報である顧客情報の問い合わせを行う。ステップ504において、構成管理システム105は顧客情報DB105Bから顧客情報を読みだし、統合支援システム103に返信する。顧客情報には、例えば顧客名、担当者名、連絡先などが含まれる。
ステップ505において、統合支援システム103は、例えば顧客コード、サーバ名、エラーコードに基づいてナレッジシステム106に障害に対する対応に関する情報であるナレッジ情報を問い合わせる。
ステップ506において、ナレッジシステム106はナレッジ情報を統合支援システム103に返信する。返信されるナレッジ情報には、例えば対応コード、対応手順の有無、対応手順、作業タイマー、などが含まれる。
ステップ507において、統合支援システム103は対応コードがあるかどうか、すなわちNULL値でないかどうかを判定する。対応コードがなかった場合、すなわちNULL値であった場合、統合支援システム103は上述した図14のステップ208に進む。上述したように、対応コードがNULL値である場合は障害発生を表す。対応コードがあった場合、統合支援システム103はステップ508に進む。
ステップ508において、統合支援システム103は受付管理システム104に、インシデントの問い合わせを行う。この問い合わせは、サーバ名、顧客名、エラーコードに基づいて行われる。ここで、エラーコードには、受信したナレッジ情報のエラーコードが入力されている。
ステップ509において、受付管理システム104はインシデントDB104Bをサーバ名、顧客名、エラーコードに基づいてインシデント番号を検索し、検索結果を統合支援システム103に返信する。
図18は、運用管理システム101の修復受付時の動作を示すフローチャートの続きである。図18に示すように、ステップ601において、統合支援システム103は問い合わせたサーバ名、顧客名、エラーコードに対応するインシデントが返信されてきたか判定する。統合支援システム103は、対応するインシデントが存在する場合、ステップ602に進み、存在しない場合、処理を終了する。
ステップ602において、統合支援システム103はインシデントをクローズする。すなわち、インシデント番号と、値を「クローズ」にしたインシデント状態と、値を「自動対応」にした対応結果、とを受付管理システム104に送信する。
ステップ603において、受付管理システム104はインシデントDB104Bの該当するインシデント番号について、インシデント状態を「クローズ」に、対応結果を「自動対応」に書き換えて処理を終了する。
以上述べたように、本実施形態の運用管理システムは、受付管理システム104がインシデント毎にインシデント状態を管理するとともに、ナレッジシステム106がエラーコード毎に対応手順を管理し、統合支援システム103がインシデント状態と対応手順に基づいてリモート操作システム107に監視対象サーバ108Aに対して遠隔保守操作をさせる。
このため、監視対象サーバ108Aが数百台規模に上っても、的確かつタイムリーな運用管理が可能となるという効果がある。
11…リモート運用センタ、12…統合支援システム、13…リモート監視システム、14…受付管理システム、15…構成管理システム、16…ナレッジシステム、17…リモート操作システム、18…システム集中監視コンソール画面、20…顧客システム監視コンソール画面、21…顧客システム構成情報画面、22…ナレッジ情報画面、23…リモート操作コンソール画面、24…進捗状況監視コンソール画面、101…運用管理システム、102…リモート監視システム、103…統合支援システム、104…受付管理システム、105…構成管理システム、106…ナレッジシステム、107…リモート操作システム、108…顧客システム、109…通信回線網。

Claims (4)

  1. 監視対象サーバから前記監視対象サーバに生じたインシデントに関する情報であるインシデント情報を受信するリモート監視システムと、
    顧客情報を管理する構成管理システムと、
    障害に対する対応手順を含むナレッジ情報を管理するナレッジシステムと、
    監視対象サーバの状態を前記インシデント毎に格納するインシデントデータベースを備え、前記インシデントの状態を管理する受付管理システムと、
    前記監視対象サーバに対して遠隔にて自動操作を実施するリモート操作システムと、
    前記リモート監視システムから受信した前記インシデント情報に従い、前記構成管理システムと前記ナレッジシステムから受信した前記監視対象サーバの障害の修復に必要な情報を用いて前記リモート操作システムに前記監視対象サーバの自動修復操作をさせるとともに、前記自動修復操作後に前記リモート監視システムから受信した前記インシデント情報に従い、前記構成管理システムと前記ナレッジシステムから受信した前記インシデント情報に対する対応方法に関する情報によって前記監視対象サーバが復旧したかを判定する統合支援システムと、
    を備える運用管理システム。
  2. 前記統合支援システムは、
    前記受付管理システムに前記インシデント情報をインシデント毎に前記インシデントデータベースに格納することにより管理させる請求項1記載の運用管理システム。
  3. 前記統合支援システムは、
    前記リモート監視システムからインシデント情報を受信したとき、前記構成管理システムから受信した顧客情報と前記インシデント情報に基づいてナレッジシステムにナレッジ情報を問い合わせるナレッジ情報問い合わせ手段と、
    インシデントの状態を示すインシデント状態をインシデント毎に前記受付管理システムに格納させるインシデント発行手段と、
    前記ナレッジ情報に基づいて前記リモート操作システムに自動操作を行わせるリモート操作指示手段と、
    前記自動修復操作後に前記リモート監視システムから受信した前記インシデント情報に従い、前記構成管理システムと前記ナレッジシステムから受信した前記インシデント情報に対する対応方法に関する情報によって前記監視対象サーバが復旧したと判定したとき、前記インシデント状態を、修復済みを表す値に変更するインシデント閉鎖手段と、
    を備える請求項1記載の運用管理システム。
  4. 前記統合支援システムは、
    前記リモート監視システムからインシデント情報を受信したとき、前記受付管理システムにインシデント状態を問い合わせるインシデント問い合わせ手段をさらに備える請求項3記載の運用管理システム。
JP2009070857A 2009-03-23 2009-03-23 運用管理システム Pending JP2010224829A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009070857A JP2010224829A (ja) 2009-03-23 2009-03-23 運用管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009070857A JP2010224829A (ja) 2009-03-23 2009-03-23 運用管理システム

Publications (1)

Publication Number Publication Date
JP2010224829A true JP2010224829A (ja) 2010-10-07

Family

ID=43041956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009070857A Pending JP2010224829A (ja) 2009-03-23 2009-03-23 運用管理システム

Country Status (1)

Country Link
JP (1) JP2010224829A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411673B2 (en) 2011-12-26 2016-08-09 Hitachi, Ltd. Management server, management system, and management method
JP2018112876A (ja) * 2017-01-11 2018-07-19 株式会社野村総合研究所 情報処理装置、情報処理方法、およびコンピュータプログラム
JP2022022077A (ja) * 2020-09-23 2022-02-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド アプリケーションをデプロイするための方法及び装置、電子機器、読み取り可能な記憶媒体並びにコンピュータプログラム
US11244266B2 (en) 2017-12-26 2022-02-08 Mitsubishi Electric Corporation Incident response assisting device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353113A (ja) * 1999-04-06 2000-12-19 Nippon Steel Corp 障害管理システムおよび方法、障害管理装置、記録媒体
JP2001142727A (ja) * 1999-11-15 2001-05-25 Matsushita Electronics Industry Corp コンピュータのメンテナンス方法
JP2009059204A (ja) * 2007-08-31 2009-03-19 Toshiba It Service Kk コンピュータリモート制御システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000353113A (ja) * 1999-04-06 2000-12-19 Nippon Steel Corp 障害管理システムおよび方法、障害管理装置、記録媒体
JP2001142727A (ja) * 1999-11-15 2001-05-25 Matsushita Electronics Industry Corp コンピュータのメンテナンス方法
JP2009059204A (ja) * 2007-08-31 2009-03-19 Toshiba It Service Kk コンピュータリモート制御システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9411673B2 (en) 2011-12-26 2016-08-09 Hitachi, Ltd. Management server, management system, and management method
JP2018112876A (ja) * 2017-01-11 2018-07-19 株式会社野村総合研究所 情報処理装置、情報処理方法、およびコンピュータプログラム
US11244266B2 (en) 2017-12-26 2022-02-08 Mitsubishi Electric Corporation Incident response assisting device
JP2022022077A (ja) * 2020-09-23 2022-02-03 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド アプリケーションをデプロイするための方法及び装置、電子機器、読み取り可能な記憶媒体並びにコンピュータプログラム
KR20220040352A (ko) * 2020-09-23 2022-03-30 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 애플리케이션 배포 방법, 장치, 전자 기기 및 판독 가능 저장 매체
JP7421511B2 (ja) 2020-09-23 2024-01-24 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド アプリケーションをデプロイするための方法及び装置、電子機器、読み取り可能な記憶媒体並びにコンピュータプログラム
KR102648742B1 (ko) * 2020-09-23 2024-03-19 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 애플리케이션 배포 방법, 장치, 전자 기기 및 판독 가능 저장 매체

Similar Documents

Publication Publication Date Title
JP5627477B2 (ja) プラント安全設計支援装置及びプラント監視保守支援装置
US20090265587A1 (en) Knowledge-based failure recovery support system
CN104142660B (zh) 用于工业自动化的经由云平台的远程协助
JP2000267726A (ja) 機械設備における遠隔故障診断システム
WO2003023539A1 (fr) Systeme de maintenance de machine de travail
CN104836699A (zh) 设备状态处理方法与设备状态处理系统
JP2006106861A (ja) 保守管理方法及び保守管理プログラム
JP3916232B2 (ja) ナレッジ型運用管理システム,方法およびプログラム
JP2010224829A (ja) 運用管理システム
JP4648961B2 (ja) 装置メンテナンスシステム、方法および情報処理装置
JP4842738B2 (ja) 障害管理支援システム及びその情報管理方法
JP4143335B2 (ja) 顧客システムの保守方式、保守装置、保守方法、及びプログラム
JP2008077286A (ja) 産業プロセス評価装置、産業プロセス評価方法及び産業プロセス評価プログラム
JP2017054288A (ja) 遠隔保守サービスシステム
JP2005071191A (ja) ユーザサポートシステム、方法、サーバ、コンピュータで実行するプログラム
JP2018180801A (ja) 監視システム及び監視システムにおける情報端末装置
JP2014021586A (ja) プログラムのアップグレードを実施するサーバ、サーバと複数の機器からなるプログラムのアップグレードシステム及びプログラムのアップグレード方法
CN111951944A (zh) 一种辅助管理工程师的方法和平台
JP2009059204A (ja) コンピュータリモート制御システム
JP4539094B2 (ja) 修理結果管理装置および遠隔管理システム
JP2003271238A (ja) リモートメンテナンス方法及びシステム
JP4447809B2 (ja) 故障診断システム、故障診断方法、故障診断サーバ装置、及び故障診断プログラム
JP2011076512A (ja) ジョブ管理サーバーの統合管理システム
JP2005071200A (ja) 製造情報管理プログラム
JP2009093522A (ja) 保守・管理サービス支援システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120131