Incident

インシデント管理の自動化、記録、そして改善を、すべてGrafana Cloudで

Grafana IncidentのタイムラインUI

Grafana Cloud IRMアプリに含まれるGrafana Incidentは、定型タスクを自動化するインシデント管理ツールです。これにより、チームはインシデントの迅速な解決と、その後の改善活動に集中できます。

必要な全情報を、自動で記録

包括的なインシデントタイムラインから学び、将来の問題を軽減します。いつ、どこでインシデントを起票しても、開始から終了までのすべての重要な情報が記録されます。

信頼できる情報を、一元的に集約

プラットフォーム中に散在する適切な情報を探し回る必要はもうありません。インシデント発生中のコミュニケーションを一元化し、混乱を回避します。

最も重要なことに集中

手作業の管理業務を自動化することで、エンジニアは本来のタスクに集中し、より迅速に問題を修正できます。

インシデントを迅速かつ簡単に起票

問題を発見したその瞬間に、どのGrafanaビジュアライゼーションからでもインシデントを起票できます。

  • 関連するダッシュボードやメトリクスなど、対応に必要なコンテキストを埋め込みます。 - インシデントの起票時に適切な深刻度レベルを割り当て、対応の優先順位を決定し、関係者を招待して共同作業を行います。 - Grafanaのエコシステム内で、監視からアクティブなインシデント対応へと移行し、ビジュアライゼーションから直接インシデントチャネルやコラボレーションスペースを作成します。
Grafana Incidentでのインシデント起票UI

重要なすべてを記録

各インシデントについて信頼できる単一の情報源(Single Source of Truth)を自動的に生成し、進行中のイベントの追跡を改善し、将来の対応を向上させます。

  • 各インシデントの一元化された記録を維持し、すべてのチームメンバーが一貫性のある正確な情報にアクセスできるようにします。 - 関連するGrafanaパネルや重要なSlack通知など、インシデントのライフサイクル全体を通じて、主要な決定事項や更新情報をキャプチャします。 - イベント、コミュニケーション、アクションを、明確で時系列に沿ったタイムラインに自動で整理し、インシデントの進捗と対応状況を追跡します。 - インシデントのタイムラインを、構造化されたインシデント後のレビュー(PIR)ドキュメントに変換し、事前に取り込まれたインシデントデータと主要なイベントでレビュープロセスを効率化します。
Grafana Incidentのインシデント対応管理タイムラインUI

インシデント管理オペレーションの分析と改善

インシデント対応オペレーションのパフォーマンスを包括的に把握し、データに基づいた洞察でプロセスを継続的に改善します。

  • インシデント管理ワークフローの全体像を把握し、インシデントの発生頻度と解決における傾向やパターンから、価値ある洞察を得られます。 - MTTR(平均解決時間)やMTTD(平均検知時間)といった主要メトリクスを追跡し、ボトルネックを特定。ラベル、深刻度、ステータスといった様々な側面からパフォーマンスを分析します。 - インシデントの発生頻度と種類に関するデータを収集し、オブザーバビリティと対応戦略を最適化します。
Grafana Incidentのインシデントインサイト画面

機械学習でMTTR(平均解決時間)を削減

Grafana Cloudの強力な診断アシスタント、Siftで問題を顕在化させ、MTTR(平均解決時間)とMTTD(平均検知時間)を削減します。

  • メトリクスとログを自動的にスキャンしてシステムの健全性を包括的に把握し、複数ソースからのデータを関連付けて、複雑に絡み合った問題を特定します。 - Sift Checkでインシデントを開始し、関連するコンテキストとデータを自動収集することで、インシデント対応プロセスを迅速に始動させます。 - Siftはフィードバックと結果に基づいて検出能力を継続的に向上させ、変化し続けるシステムの挙動や新しい種類の問題に時間とともに適応します。
Grafana IncidentのエラーパターンログUI

外出先でのインシデント対応と管理

IRMモバイルアプリを使えば、どこにいても危機的な状況に対応できます。 パーソナライズされた通知:

  • 個人の設定に合わせたプッシュ通知を受信します。 - 緊急時には「おやすみモード」を上書きします。

指先一つでオンコールスケジュールを管理:

  • いつでもどこでもオンコールのローテーション詳細を確認します。 - 今後のシフトやチームの空き状況を素早くチェックします。 - チームメンバーに簡単にシフト交代をリクエストします。

オンデマンドのインシデント詳細:

  • モバイルデバイスから直接インシデントの承認、対応、エスカレーションを実行します。 - 包括的なインシデント情報にアクセスし、情報に基づいた意思決定をします。
Grafana OnCallアプリのアラートグループ

Grafana Cloudでインシデント対応と管理を始めましょう

2

ツールの連携(推奨)

Slackなどのお気に入りのアプリとの連携を設定します。関連するチャネルにGrafana Incidentチャットボットを追加できます。

3

通知を設定

各ユーザーがどのように通知を受け取るかを決定し、エスカレーションを作成します。

4

オンコールスケジュールを設定し、インシデントの起票を開始

UI内でオンコールスケジュールを設定し、最初の訓練インシデントを起票します。

詳しい実装方法とベストプラクティスについては、

Grafana CloudでIRMを利用する

検知、対応、そして改善。Grafana Cloud IRMはインシデントワークフローを簡素化し、ツールではなく、インシデントの管理そのものに集中できるよう支援します。
Free
常に無料
$0

クレジットカード不要

実用的な Free ティアで Grafana Cloud のすべてにアクセス可能。

  • 月間 3 アクティブ IRM ユーザーまで
  • コミュニティサポート
Pro
オンデマンド
$20 / active IRM user

Free ティア超過分は従量課金

月額 $19 のプラットフォーム料金に含まれる内容:

  • 月間 3 アクティブ IRM ユーザー、超過分は従量課金
  • 平日営業時間 (8×5) メールサポート
Enterprise
年間
Custom

年間コミットに基づくスケーラブルな単価

年間最低コミット $25,000。

  • プレミアムサポート
  • Observability Architect
  • 柔軟なデプロイ(Public Cloud、Federal Cloud、Bring Your Own Cloud)

Grafana Cloudの他のツールへ簡単に接続

Grafana Alerting

強力で柔軟なルールと通知により、スタック全体のアラート管理を統合します。

Grafana SLO

サービスレベル目標を定義し、誤差予算アラートを作成して顧客が気づく前に問題を捕捉します。

今すぐ始めませんか?