
現場の視点:お客様が Grafana Cloud と Enterprise を選ぶ4つの主要理由
顧客事例1:Grafanaで開発者の時間を節約
ニューヨークにある大手銀行のCIO(最高情報責任者)を務める長年のお客様に、「Grafana から得られる核心的な価値(原点)は何ですか?」と尋ねました。
彼の答えはこうです。「当行にはDynatraceがあり、素晴らしい成果を上げています。Splunkもあり、みんなに愛用されています。さらにAppDynamicsもあります。これらのプラットフォームにはそれぞれ社内にファンがいて、独自の価値を提供しています。Grafana が私たちにもたらしてくれるのは、「データを解放(liberate the data)」し、既存のさまざまなデータソースにネイティブに接続する手段です。
これがなぜ有用かというと、当行には 55,000 人の開発者がいるからです。データを簡単に収集・表示し、単一のページに重ね合わせる方法がなければ、開発者は自分でアクセス権を探し、許可を申請し、場合によっては自分専用のダッシュボードを自作しなければなりません。組織が分散しているため、この作業はタイムゾーンやチーム・部門間の壁によってさらに複雑になります。
Grafana を使えば、ユーザーのロール(役割)に基づいてダッシュボードが即座に利用可能になります。システムは LDAP と照らし合わせて、適切な人物に適切なレベルのアクセス権が自動的に付与されるよう制御(ガードレール)します。これは些細なことに思えるかもしれませんが、55,000 人の開発者がそれぞれ 1 分ずつ節約できれば、丸 1 ヶ月分のコーディング時間を買い戻したことになります。スケールメリットを考えれば、これは絶大な価値です」
顧客事例2:Grafana 導入で「MTTI(平均識別時間)」を短縮
別のお客様のエグゼクティブにも同じ質問をしたところ、彼女は「MTTI(Mean Time to Innocence:平均識別時間)」という新しい略語について話してくれました。
MTTIとは、システム遅延や障害が発生した際に、自チームの担当領域に問題がないことを「識別(特定)」し、本当の根本原因の切り分けと解決に集中できるようになるまでにかかる時間のことです。この企業では、ログとAPM(アプリケーションパフォーマンス監視)の両方のデータソースの上にGrafanaを重ねることでこれを実現しています。Grafanaはエージェントレスで既存のアプリケーションにネイティブ接続するため、データをリアルタイムで可視化できます。
当初、彼らはすべてのデータを既存のログシステムに集約しようと考えていました。しかし、そこにはリスクがありました。APMツールからログツールにデータをエクスポートするには時間がかかります。APMソリューションの良さは、データが発生した瞬間に確認できることです。
さらに、APMのリアルタイムデータをすべてログプラットフォームに「丸ごと移し替える」と、重要なデータが古く、鮮度の低いものになってしまいます。これはMTTIを遅らせるだけでなく、ログシステムのデータ取り込み量が増え、コストの増大も招きます。
Grafana を導入したことで、データは元の場所に置いたまま、単にそれらを美しく並べて表示できるようになりました。大がかりな移設作業は不要です。今ではパフォーマンスメトリクスのすぐ隣でログを確認し、リアルタイムで展開される状況を把握しています。
顧客事例3:コストを抑えつつ、より多くのデータを迅速に理解
この事例は、APM、ログ、メトリクスなどのために複数の「独自の商用ツール(独自仕様のベンダー製ツール)」に多額の投資をしていた大手ゲーム会社です。彼らはパブリッククラウドとオンプレミス環境の両方に大規模な資産を持っていました。
ゲームの成長に伴い、インフラのパフォーマンスをリアルタイムで把握する必要性も高まりました。しかし、システムの規模拡大に合わせてコストも増大し、ついには節約のためにメトリクスやログの収集を停止するまでになってしまいました。これは苦渋の決断でした。売上の 30% 以上がライブゲームから得られているため、ダウンタイムが発生した際の収益インパクトは甚大です。結局、彼らは「望む可視性を得るためのコストを払う」よりも「情報の欠落」を受け入れるしかない状況にありました。
そこで彼らは、KubernetesとPrometheusへの移行を決定しました。これはコスト削減のためでもあり、インフラを近代化して、「運用の苦労」を減らしながら開発チームのアウトプットを増やすためでもありました。
Grafana Labsと協力してGrafana EnterpriseとGrafana Cloudを導入することで、Splunk、New Relic、Prometheus、Graphiteなどのデータを統合した「単一のビュー」を実現しただけでなく、Prometheus メトリクスのホスティングも完全に任せることができました。その結果、長期保存が可能になり、自前運用(セルフホスト)時代よりもクエリパフォーマンスが向上。さらにフルタイムエンジニア 2 人分に相当する生産性を開発スプリントに取り戻すことができました。
顧客事例4:Grafana Cloudのホスト型 Prometheus/Cortexで暗闇に光を
コンサルティングを専門とする「ビッグ4」の一角である企業は、MTTR(平均修復時間)やMTTIの特定、さらには問題が発生しているかどうかの検知にさえ苦労していました。数千のアプリと膨大な数の開発・運用担当者を抱えながら、クラウドインフラで何が起きているかを把握する能力がほとんどなかったのです。
言うまでもなく、Azureクラウド上でのKubernetes運用体制に対する信頼は損なわれていました。Azureが提供する標準のツールセットを超えた、より優れた監視方法が必要なのは明らかでした。
この企業は、貴重な開発時間を問題解決のための技術構築・テスト・維持(自前運用)に費やしたくなかったため、Grafana Labsにその役割を託しました。彼らが選んだのは、ホスト型のPrometheus/Cortexソリューションです。この組み合わせにより、(Cortexのおかげで)大規模な環境でも運用が可能になり、欠けていたインサイトを得ることで、極めて迅速な意思決定と問題対応ができるようになりました。
この導入はチームにとって「オブザーバビリティの常識を覆す」画期的な体験となり、現在では社内の多くのチームがPrometheusとCortexの採用を始めています。
私たちは毎日、お客様の課題や目標についてお話ししています。Grafana Labs がどのようにお役に立てるかご質問があれば、いつでもメール(dave.kranowitz@grafana.com)でお知らせください。