まーぽんって誰がつけたの?

iOS→Scala→インフラなおじさん技術メモ

Datadog

DatadogでECSのagentが切れてないかを監視するやり方

ecs agentとは ECSの場合、ecs agentがコンテナのスケジューリングやもろもろの仕事をしてくれています。なので、こいつが接続状態になってないと管理外になって死亡ということになります。 github.com なので、これは結構見ておかないといけないんだけど、…

顧客が本当に欲しかったJenkinsのdatadog監視のやり方

今までのjenkinsジョブ監視の問題点 JenkinsにDatadog plugin入れると自動的にjobのeventが流れてくるので、そのeventのタグを見て監視してました。10分間の間にresult:failureのタグがついたジョブの数が合計1より大きかったらslackに通知するという感じで…

Datadogのアラートtrigger設定項目のon averageの使い方に実は条件があった

on averageはある期間の平均だと思っていた Datadogはこんな風にあるメトリクスの値が閾値を超えたらslackに通知するみたいな感じのことをこうやって設定します 指定したメトリクスの値が、5分間(during the last 5 minutes)の平均(on average)が300を上回っ…

datadogでrecoverdされない問題をサポートに聞いたら色々教えてくれた

alert出た後にrecoverされない alertが通知されたけど、その後、recoverdが来ないという現象 次の日になってrecoverされた これはなんかやり方があるだろうとdatadogのサポートに連絡 原因 サポートの回答 > AWS Cloudwatch doesn't generate a metric value…

Datadogの効果的なモニタリングとAlertについてシリーズを読んだ

狼少年 少年が繰り返し同じ嘘をついたので、本当に狼が現れた時には大人たちは信用せず、誰も助けに来なかった。そして村の羊は全て狼に食べられてしまい、死亡した。 Wikipedia サーバーの監視でalertやwarningが増えすぎると、 だんだん暗黙の了解みたいの…

Datadogでいい感じにAlertの通知を出し分けるやり方

出しわけたいユースケース 例えば、GCPの2つのprojectからCloud SQLの複数のDatabaseのmetricsが送られてくる場合。 project Aの場合は、こっちのチャンネルに通知、project Bの場合は、そっちのチャンネルに通知したいみたいなときに有効です。 metricsの設…

Google Container Engine+Deis環境にDatadog監視をいれる

概要 Google Container Engine(kubernetes)の監視環境の動向 - まーぽんって誰がつけたの?を受けてDatadogでやる Google Cloud Platform Integrationをいれる GCPのメトリクスをAPI経由でとってきてくれる kubernetes Integrationをいれる kubernetesのリソ…