Grafana Cloudスタックに組み込まれたインシデント対応と管理
実用的なGrafana Cloud無料プラン
- トレース: 50GB
- メトリクス: 10,000
- データ保持期間: 14日間
- 月間アクティブユーザー: 3人
- テレメトリログ: 50GB
問題に迅速かつ確実に対応
ワークフローを調整することで、問題に対処し、24時間年中無休の対応を保証するために必要なすべての情報と適切な関係者を確保します。
インシデント発生前、発生中、発生後の混乱を解消
IRMのホームページから、コミュニケーションを一元化し、手動タスクを自動化し、インシデント対応の完全なタイムラインを取得します。
アクティブユーザーのみに課金
料金が発生するのは、エンジニアがGrafana Cloud IRMを実際に使用した場合のみです。
適切な人物に、適切なタイミングで通知
コミュニケーションを改善し、アラート通知を調整することで、重要な情報が適切なチームメンバーに確実に届くようにします。
- Slack、Microsoft Teams、Telegram、SMS、電話、メールなどを介してカスタマイズされた通知を配信します。
- あなたの役割と責任に合わせてパーソナライズされたプッシュ通知を受け取ります。
- テンプレートと多段階のエスカレーションチェーンを使用して、自動化によりブロッカーを排除し、対応時間を改善します。
- 希望するコミュニケーションチャネルからインシデントを承認、解決、またはエスカレートします。
オンコールを、あなたの条件で
分散チーム向けに構築されたツールと、オンコールシフトのプレッシャーを理解するエンジニアによって、24時間体制のインシデント対応を保証します。
- IRMでオンコールスケジュールを直接管理し、TerraformやiCalインポートなどの柔軟なオプションを利用できます。
- エンジニアがオンコールスケジュールをコントロールできるように、スケジュールされたオーバーライドを提供し、Googleカレンダー連携でオフィス外イベントのシフト交換リクエストを自動化し、タイムゾーン、スケジュールローテーションなどを簡単に考慮に入れます。
- ブラウザまたはモバイルアプリで外出先から、ローテーションの詳細、今後のシフト、交換リクエストを簡単に確認できます。
現在および将来にわたってデータ駆動型の意思決定を行う
各イベントについて、完全なインシデントサマリーを提供し、情報に基づいた選択を行うのに役立つ単一の信頼できる情報源を使用します。
- インシデントライフサイクル全体にわたる主要なアクション、決定、更新を追跡するための包括的なタイムラインを取得します。
- タイムラインを構造化されたインシデント後レビュー文書に自動的に変換し、各インシデントの一元化された信頼できる記録を維持します。
- 過去のインシデントから学び、ボトルネックと改善領域を特定し分析します。
機械学習を使用した異常検出
診断アシスタントであるSiftを使用すると、問題を迅速かつ効率的に表面化する自動システムチェックを実行できるため、問題をより迅速に解決できます。
- システムの健全性を全体的に把握し、主要なインシデントになる前に異常や複雑な問題を自動的に特定できます。
- 自動化されたSiftチェックにより、インシデント対応をより迅速に開始できます。
- フィードバックと結果に基づいて、時間の経過とともにパーソナライズされた対応を開発します。
オブザーバビリティスタック内からインシデント対応を実行
懸念される問題が発生した瞬間に、Grafana Cloudオブザーバビリティスタックで受動的なインシデント対応から能動的なインシデント対応へと移行します。
- 異常や懸念される傾向を特定したときに、任意のGrafanaビジュアライゼーションから直接インシデントを開始します。
- インシデントの頻度と種類に関するデータを収集し、オブザーバビリティと対応戦略を最適化します。
- Jira、ServiceNow、Githubなど、お気に入りのITSMツールと統合して、インシデント対応と管理のワークフローをカスタマイズします。
外出先でのインシデント対応と管理
IRMモバイルアプリを使用すると、どこからでも重要な状況を処理できます。
パーソナライズされた通知:
- 個人の好みに合わせたプッシュ通知を受け取ります。
- 緊急の事態には、「おやすみモード」設定をオーバーライドします。
指先でオンコールスケジュールを管理:
- オンコールローテーションの詳細をいつでもどこでも確認できます。
- 今後のシフトやチームの可用性を迅速に確認できます。
- チームとのシフト交換リクエストを簡単に行うことができます。
オンデマンドのインシデント詳細:
- モバイルデバイスから直接インシデントを承認、対応、またはエスカレートします。
- 包括的なインシデント情報にアクセスして、情報に基づいた意思決定を行います。
Grafana Cloudでのインシデント対応と管理を始めましょう
2
ツールの接続(推奨)
Slackなど、お気に入りのアプリとのインテグレーションを設定し、関連するチャネルにGrafana Incidentチャットボットを追加できます。
3
通知の設定
各ユーザーが通知をどのように受け取るかを決定し、エスカレーションを作成します。
4
オンコールスケジュールを設定し、インシデントを宣言する
IRMのホームページからオンコールスケジュールを設定し、アラートグループとインシデントを管理します。








