RubyのPaaS(Platform as a Service)として有名な「Heroku」による障害報告ページの要約を翻訳したものです。2011年4月21日にAmazon EC2をはじめとするAWS(Amazon Web Services)の各サービスにて大規模な障害が発生しました。AWSを利用したサービスは多く、Q&Aサービスの「Quora」や位置情報連動ソーシャルサービスの「Foursquare」など、有名どころが次々に利用不可能になるなどの問題が発生しました。そしてHerokuも例外に漏れず、最大3日間以上に渡って提供機能に影響を及ぼしてしまいました。この障害の詳しい経緯について、「Amazon側を責めるつもりはなく、Herokuに100%の責任がある」ことを前提に説明しています。 最初に監視システムからのアラートにてAWSにエラーが起きていることに気づきました。EC2の復旧を試