学習内容
- メトリクス、ログ、トレースといった異なる種類のデータをGrafana LGTM Stack を用いて相関させることが、いかに迅速な根本原因分析と障害対応に役立つかを学びます 。
- Grafana OnCall を適切に設定・統合することで、平均解決時間(MTTR)を改善する方法を理解します 。
- 適切なダッシュボードを作成することで、コンテキストの切り替え(ツールの行き来)をなくし、運用効率を最大化するメリットを把握します 。
- Grafana IRMの基本的な設定方法や、主要な監視ツール・アラートソースとの統合手順について、ライブデモを交えて解説します 。
長年にわたり、多くの組織はさまざまな監視ツールを必要に応じて導入してきました。この戦略は柔軟性と、その分野で最適な技術の利用を可能にします。しかし残念ながら、これは監視と根本原因分析を遅らせ、困難にする原因ともなります。複数のツールを行き来し、タイムフレームを合わせ、コンテキストや言語を切り替える作業は、平均特定時間(MTTI)と平均解決時間(MTTR)の増加につながります。
Grafana LGTM Stack を利用することで異なる種類のデータを簡単に相関し、それらを一つのダッシュボード上でまとめて可視化できます。これにより簡単かつ効果的な方法で最大限に活用できます。
さらに Grafana IRM を使用することで、オンコール管理をアラートソースや監視ツールと統合し、すべてを Grafana 内で完結できます。この「シングルペインオブグラス(一元管理画面)」アプローチは、MTTI/MTTR を削減し、システムの信頼性を確保するために必要な一元化されたオブザーバビリティプラットフォームを提供します。
ガイド


