まーぽんって誰がつけたの?

iOS→Scala→インフラなおじさん技術メモ

AWSのEC2でRetire Notificationというのがきた

まとめ

突然EC2インスタンスが故障して、1時間後ぐらいにAWSからそのインスタンス修復不可能だからretireさせるよという通知がメールで来ました。 stopさせようにもstoppingでなかなか進捗しなかったので、開発環境だったからterminateしたけど、terminateも30分弱かかった。

基本、Datadog監視で気づくけど、こういうことがあるんだなぁということと、AWSはちゃんとしてるなーと思ったという話です。

詳細

AWSからメール(超意訳)

[Retirement Notification] Amazon EC2 Instance scheduled for retirement.

あなたが使ってるインスタンスがハードウェア的な修復不可能な感じで壊れました。多分、もう既につながらなくなってるかもしれないし、つながるかもしれない。指定日時に完全にterminateするからそれまでにAMI作って起動し直してね。

インスタンスのリタイア

見てみたらこのメールよりも前に該当のEC2インスタンスが死亡していた

  • Datadogからalertがあがっていた
  • dashbordのstatus checkが 0/2 に(初めて見た)
  • AWS Consoleを見るとこういう表示が

f:id:masato47744:20171109013637p:plain

rebootしろと書いてあったが・・・

GUIからrebootしても、何も起きない。。

とりあえずstopもstopping...のまま10分ぐらい終わらない。 もしかしたら、これはもっと待てばstoppingしたかもしれない。 開発環境だったので、さくっとterraformとかで作り直しできるようになってたのでterminateした。でも、これも30分弱かかった。