1 Node Exporter Dashboard 22/04/13 ConsulManager自动同步版

Dashboard

基于ConsulManager采集的ECS,可匹配自动同步方式采集ECS信息字段的展示,优化重要指标展示。使用Grafana8新表格重建,新增健康评分概念,并新增了整体资源消耗信息的一些图表。包含整体资源展示与资源明细图表:CPU 内存 磁盘 IO 网络等监控指标。https://github.com/starsliao/ConsulManager
Last updated: 14 days ago

Start with Grafana Cloud and the new FREE tier. Includes 10K series Prometheus or Graphite Metrics and 50gb Loki Logs

Downloads: 73618

Reviews: 64

  • ecs1.PNG
    ecs1.PNG
  • ecs2.PNG
    ecs2.PNG
  • ecs3.PNG
    ecs3.PNG
  • ecs4.PNG
    ecs4.PNG
  • node1.png
    node1.png
  • node2.png
    node2.png

grafana 8.3.6、8.3.7、8.4.7 版本测试正常,如果导入出现异常,请先更新到以上版本grafana。

  • 该版本为ECS自动同步版:通过ConsulManager来管理云厂商的ECS监控:支持自动同步采集云厂商的ECS信息(包括到期日)与分组信息,并且针对自动采集的这些字段来做更加友好的展示。
  • 原基于Job分组的通用版本,请参考:https://grafana.com/grafana/dashboards/16098

2022.04.13更新说明:

  1. 使用Grafana8新表格重建。
  2. 总览表新增ECS健康评分概念。
  3. 新增了整体资源消耗信息的一些图表,用于资源成本优化参考。
  4. 使用了从云厂商获取的主机名字段和新的分组字段,并且能展示资源到期日。
  5. 优化重要指标展示,包含整体资源展示与资源明细图表:CPU 内存 磁盘 IO 网络等监控指标。
注意:【最近7天P99资源使用率】图表需要在Prometheus增加记录规则(采集1小时后出数据):
groups:   #新rule文件需要加这行开头,追加旧的rule文件则不需要。
- name: node_usage_record_rules
  interval: 1m
  rules:
  - record: cpu:usage:rate1m
    expr: (1 - avg(rate(node_cpu_seconds_total{mode="idle"}[1m])) by (instance,vendor,account,group,name)) * 100
  - record: mem:usage:rate1m
    expr: (1 - node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes) * 100

请配合Consul Manager使用:

【ConsulManager介绍】


ECS管理功能描述

  • 支持同步阿里云,腾讯云,华为云的ECS主机信息到Consul。
  • 基于Consul实现Prometheus监控目标的自动发现。
  • 支持同步各云厂商的分组信息到Consul,用于关联ECS分组。
  • 提供了可查询分组与ECS信息的页面,指标中加入了ECS到期日等信息,可直接监控。
  • 可调整同步的时间间隔。
  • 提供了按需的Prometheus配置生成功能。
  • 提供了一个匹配ECS Manager各字段的node_exporter Grafana展示看板。

截图:

赞赏与关注公众号【云原生DevOps】加入运维群交流,获取更多...

GitHub:https://github.com/starsliao/ConsulManager

Get this dashboard:
8919