インシデント管理の自動化、記録、そして改善を、すべてGrafana Cloudで
Grafana Cloud IRMアプリに含まれるGrafana Incidentは、定型タスクを自動化するインシデント管理ツールです。これにより、チームはインシデントの迅速な解決と、その後の改善活動に集中できます。
必要な全情報を、自動で記録
包括的なインシデントタイムラインから学び、将来の問題を軽減します。いつ、どこでインシデントを起票しても、開始から終了までのすべての重要な情報が記録されます。
信頼できる情報を、一元的に集約
プラットフォーム中に散在する適切な情報を探し回る必要はもうありません。インシデント発生中のコミュニケーションを一元化し、混乱を回避します。
最も重要なことに集中
手作業の管理業務を自動化することで、エンジニアは本来のタスクに集中し、より迅速に問題を修正できます。
インシデントを迅速かつ簡単に起票
問題を発見したその瞬間に、どのGrafanaビジュアライゼーションからでもインシデントを起票できます。
- 関連するダッシュボードやメトリクスなど、対応に必要なコンテキストを埋め込みます。 - インシデントの起票時に適切な深刻度レベルを割り当て、対応の優先順位を決定し、関係者を招待して共同作業を行います。 - Grafanaのエコシステム内で、監視からアクティブなインシデント対応へと移行し、ビジュアライゼーションから直接インシデントチャネルやコラボレーションスペースを作成します。
重要なすべてを記録
各インシデントについて信頼できる単一の情報源(Single Source of Truth)を自動的に生成し、進行中のイベントの追跡を改善し、将来の対応を向上させます。
- 各インシデントの一元化された記録を維持し、すべてのチームメンバーが一貫性のある正確な情報にアクセスできるようにします。 - 関連するGrafanaパネルや重要なSlack通知など、インシデントのライフサイクル全体を通じて、主要な決定事項や更新情報をキャプチャします。 - イベント、コミュニケーション、アクションを、明確で時系列に沿ったタイムラインに自動で整理し、インシデントの進捗と対応状況を追跡します。 - インシデントのタイムラインを、構造化されたインシデント後のレビュー(PIR)ドキュメントに変換し、事前に取り込まれたインシデントデータと主要なイベントでレビュープロセスを効率化します。
インシデント管理オペレーションの分析と改善
インシデント対応オペレーションのパフォーマンスを包括的に把握し、データに基づいた洞察でプロセスを継続的に改善します。
- インシデント管理ワークフローの全体像を把握し、インシデントの発生頻度と解決における傾向やパターンから、価値ある洞察を得られます。 - MTTR(平均解決時間)やMTTD(平均検知時間)といった主要メトリクスを追跡し、ボトルネックを特定。ラベル、深刻度、ステータスといった様々な側面からパフォーマンスを分析します。 - インシデントの発生頻度と種類に関するデータを収集し、オブザーバビリティと対応戦略を最適化します。
機械学習でMTTR(平均解決時間)を削減
Grafana Cloudの強力な診断アシスタント、Siftで問題を顕在化させ、MTTR(平均解決時間)とMTTD(平均検知時間)を削減します。
- メトリクスとログを自動的にスキャンしてシステムの健全性を包括的に把握し、複数ソースからのデータを関連付けて、複雑に絡み合った問題を特定します。 - Sift Checkでインシデントを開始し、関連するコンテキストとデータを自動収集することで、インシデント対応プロセスを迅速に始動させます。 - Siftはフィードバックと結果に基づいて検出能力を継続的に向上させ、変化し続けるシステムの挙動や新しい種類の問題に時間とともに適応します。
外出先でのインシデント対応と管理
IRMモバイルアプリを使えば、どこにいても危機的な状況に対応できます。 パーソナライズされた通知:
- 個人の設定に合わせたプッシュ通知を受信します。 - 緊急時には「おやすみモード」を上書きします。
指先一つでオンコールスケジュールを管理:
- いつでもどこでもオンコールのローテーション詳細を確認します。 - 今後のシフトやチームの空き状況を素早くチェックします。 - チームメンバーに簡単にシフト交代をリクエストします。
オンデマンドのインシデント詳細:
- モバイルデバイスから直接インシデントの承認、対応、エスカレーションを実行します。 - 包括的なインシデント情報にアクセスし、情報に基づいた意思決定をします。
Grafana Cloudでインシデント対応と管理を始めましょう
2
ツールの連携(推奨)
Slackなどのお気に入りのアプリとの連携を設定します。関連するチャネルにGrafana Incidentチャットボットを追加できます。
3
通知を設定
各ユーザーがどのように通知を受け取るかを決定し、エスカレーションを作成します。
4
オンコールスケジュールを設定し、インシデントの起票を開始
UI内でオンコールスケジュールを設定し、最初の訓練インシデントを起票します。






