チームのニーズに合わせてカスタマイズ可能な、Grafana Cloudによる柔軟なオンコール管理
Grafana Cloud IRMアプリの一部であるOnCallは、分散型チームに最適な、設定・カスタマイズが可能なオンコールツールです。お使いのオブザーバビリティスタックとシームレスに連携し、カバレッジの拡大、運用負担の軽減、そして完全な接続性を実現します。
必要な情報を、必要なタイミングで。
コンテキスト豊富な通知により、メトリクス、ログ、関連情報など、的確な意思決定と対応の調整に必要なすべての情報が届けられます。
明確なインシデント対応ワークフロー
適切なエンジニアへの通知、チームの優先チャネルでの明確なコミュニケーション、さらにWebhookやインテグレーションによる自動修復ワークフローをサポートします。
万全なカバレッジで、安心を。
スケジュールを簡単にローテーションし、シフトを切り替えることで、24時間体制のインシデント対応カバレッジを維持し、チームのワークライフバランスをサポートします。もう重要なアラートを見逃すことはありません。
通知のカスタマイズと自動化
事前に設定された入力やエンジニアの対応可能状況に基づき、通知の配信とエスカレーションチェーンをカスタマイズします。
- 事前に用意されたテンプレートから選択するか、独自のテンプレートを作成して、さまざまな種類の通知を特定のチームやチャネルにルーティングできます。
- インテリジェントな通知ワークフローとエスカレーションチェーンにより、適切なエンジニアが問題に対応できるようにします。
- プライマリ担当者が対応できない場合でも、重要なアラートが常に最適な人物に届くように、多段階のエスカレーションプロセスを設計します。
- 未確認のアラートを自動的に次の担当者にエスカレートするか、チームのエスカレーションポリシーに従ってエスカレートします。
全員に状況を共有
チームに最適な方法でコミュニケーションを改善し、重要な情報を共有します。
- Slack、Microsoft Teams、Telegram、SMS、電話、Eメールなど、幅広いプラットフォームを通じて通知を配信します。
- 各チャネルに合わせて通知の内容とフォーマットをカスタマイズし、可読性と緊急性を最適化します。
- 担当者が通知インターフェースから直接、インシデントの承認、解決、またはエスカレーションを行えるようにします。
- サポートされているプラットフォームに統合されたチャット機能により、チームのコラボレーションを促進します。
適切なオンコールスケジューリングを設定
オンコール対応の抜け漏れは避けたい一方で、同僚も仕事以外の生活を計画する必要があります。OnCallのスケジューリング機能で、全員が満足できる体制を実現しましょう。
- Web UI、Terraform、iCalを通じてスケジュールを管理します。
- シフト交換や不在時の対応を自動更新するために、Googleカレンダーとシームレスに統合します。
- スケジュールローテーション、レイヤー、タイムゾーン、勤務時間に対応しているため、より簡単に事前に計画を立てられます。
- 強力な上書き機能を利用して、突発的なスケジュール調整に対応します。
すべてのインシデント対応ツールとテレメトリを簡単に接続
多様なオブザーバビリティ、ITSM、コミュニケーションツールでインシデントワークフローを拡張できます。
- メッセージングとコラボレーション: Slack、Microsoft Teams、Telegramなど。
- オブザーバビリティとアラート: Prometheus、Grafana、Zabbix、AWSなど。
- ITSMおよびプロジェクト管理: Jira、ServiceNow、Zendesk、さらにカスタマイズ可能なWebhook。
外出先でのインシデント対応と管理
Grafana IRMモバイルアプリがあれば、どこからでも重要な状況に対応できます。
パーソナライズされた通知:
- 個人の設定に合わせてカスタマイズされたプッシュ通知を受信します。
- 重要な緊急事態のために「おやすみモード」設定をオーバーライドします。
手元でオンコールスケジュールを確認:
- オンコールローテーションの詳細をいつでもどこでも確認できます。
- 今後のシフトとチームの可用性をすばやく確認できます。
- チームと簡単にシフト交換をリクエストできます。
オンデマンドでインシデントの詳細を確認:
- モバイルデバイスから直接、インシデントの承認、対応、またはエスカレーションを行います。
- 網羅的なインシデント情報にアクセスして、情報に基づいた意思決定を行います。
Grafana Cloudでインシデント対応と管理をはじめる
2
ツールを接続(推奨)
Slackなど、お気に入りのアプリとの統合を設定します。Slackでは、関連するチャネルにGrafana Incidentチャットボットを追加できます。
3
通知を設定
各ユーザーが通知をどのように受け取るかを決定し、エスカレーションを作成します。
4
オンコールスケジュールを設定し、インシデントの宣言を開始
UI内でオンコールスケジュールを確立し、最初のテストインシデントを宣言します。





