死活監視・サービス監視
24時間365日の死活監視・サービス監視を行います。問題発生時にはアラートメールでお知らせ。
- AWSの監視サービス「CloudWatch」と監視ツール「Nagios」との二重監視。
「Nagios」はAWSとは別の拠点からインターネット経由で該当インスタンスを監視しているため、利用者視点での監視ができます。 - 問題発生時にはナレコムクラウドSEとご担当者様にアラートメールで通知されます。
監視項目
AWSプロダクト | 監視内容 | 対応内容 |
---|---|---|
EC2 | インスタンスのSystem Status・Instance Statusを監視 | 2つのステイタスを1分間隔で監視し、1つ以上のステイタスが5分間以上Failedの場合、アラートを発行 |
ELB | ELB配下にあるEC2の特定URLに対して30秒おきにhealthチェック | 各EC2に対して30秒間隔で監視し、5秒以上反応無し且つ2回連続発生すると、該当のEC2に対してELBからトラフィックの振り分けを停止。 また、ELBの配下が1台も無い状態が5分間続くとアラート発行。 |
AWSプロダクト | 監視内容 | 対応内容 |
---|---|---|
EC2 | HTTP | 通常3分、問題発生時1分間隔で監視し、1秒接続できないとWARNING、5秒で接続できないとCRITICAL通知。 3回warningでアラート発行。 |
SSH | 通常3分、問題発生時1分間隔で監視し、接続できない・応答なしなどwarningが3回続くとアラート発行。 | |
ELB | HTTP/HTTPS | 通常3分、問題発生時1分間隔で監視し、1秒接続できないとWARNING、5秒で接続できないとCRITICAL通知。 3回warningでアラート発行。 |
RDS | 3分おきにDB接続監視 | 通常3分、問題発生時1分間隔で監視し、接続できない・応答なしなどwarningが3回続くとアラート発行。 |
AWSプロダクト | 監視内容 | 対応内容 |
---|---|---|
EC2 | CPUUtilizationなど、EC2・EBSの標準メトリック、その他カスタムメトリック:CloudWatchより値を取得して監視します。 | 予め設定した閾値を超えたらアラート発行。 |
RDS | CloudWatchより以下の値を取得して監視します。 ・CPU ・Memory ・Disk使用率 |
ご指定の閾値を超えた場合にアラート発行。 例)CPU使用率が80%以上で10分以上継続した場合にアラート発行。 |
アラート通知先
お客様のご希望のメールアドレスを2つまでアラート通知先として設定できます。
マネージドプランに含まれているもの
- ▶ 設計・構築
- ▶ バックアップ
- ▶ ELB(負荷分散装置)
- ▶ セキュリティグループ(FW)
- ▶ 障害対応
- ▶ スケール対応
- ▶ SSL証明書
- ▶ VPC接続