1 Kubernetes All-in-one Cluster Monitoring KR

Dashboard

This dashboard is one of major topic for Kubernetes Book and best optimized for virtual machine environment provided with https://github.com/sysnet4admin/_Book_k8sInfra Notice: It may be running on the other environment but cannot be guaranteed.
Last updated: a month ago

Start with Grafana Cloud and the new FREE tier. Includes 10K series Prometheus or Graphite Metrics and 50gb Loki Logs

Downloads: 153

Reviews: 2

  • 1 k8s all-in-one cluster monitoring 1-1.png
    1 k8s all-in-one cluster monitoring 1-1.png
  • 1 k8s all-in-one cluster monitoring 1-2.png
    1 k8s all-in-one cluster monitoring 1-2.png

쿠버네티스 올인원 모니터링 대시보드

제작자

중요한 알림

이 대시보드는 컨테이너 기반 인프라(가제)에서 제공되는 대시보드입니다. https://github.com/sysnet4admin/_Book_k8sInfra 에서 제공하는 가상머신 환경에 최적화 되어 있습니다. 책의 실습 환경인 쿠버네티스 1.18.4, 그라파나 7.0.3, 프로메테우스 2.19.0, 노드 익스포터 1.0.1에서 정상 동작을 확인하였으며 이외의 환경에서는 동작을 보증하지는 않습니다. 이 대시보드는 쿠버네티스 클러스터의 운영과 문제 해결에 필요한 정보를 보여줍니다. 4개의 영역으로 구성되어 있으며 각 영역에서는 아래와 같은 정보를 확인할 수 있습니다.

  1. 클러스터 요약
  • 마스터 정상 가동률
  • 네임스페이스, Pod, PVC의 숫자
  • 노드별 현황 정보를 보여주는 테이블
  1. 클러스터 전체 정보
  • 노드별 CPU 점유율
  • 노드별 메모리 사용량
  • 클러스터 수준의 초당 평균 네트워크 트래픽
  • API 서버 호출 통계
  1. 노드별 정보
  • CPU 점유율
  • 메모리 점유율
  • 디스크 사용률
  • CPU 코어 개수
  • 전체 메모리 용량
  • 파일 디스크립터와 컨텍스트 스위칭
  • 완료된 디스크 IOPS
  1. Pod별 정보
  • 가동 시간
  • 가동 상태
  • 10분 이내 재시작 시도 횟수
  • 리소스 사용량(메모리, CPU, FS)
  • 리소스 할당 제한
  • 초당 네트워크 트래픽
  • 메모리 상태(Swap/Failure)
  • 스레드 개수 [Release Note] 2021/01/24
  • 최초 릴리즈

Kubernetes All-in-one Monitoring Dashboard

Important notes

This dashboard is one of major topic for Kubernetes Book and best optimized for virtual machine environment provided with https://github.com/sysnet4admin/_Book_k8sInfra Tested Env like below

  • Kubernetes 1.18.4
  • Grafana 7.0.3
  • Prometheus 2.19.0
  • Node-exporter 1.0.1

It may be running on the other environment but cannot be guaranteed. This dashboard shows information of Kubernetes cluster which is involved in necessary to operate and troubleshoot problems It contains information of 4 sections. In each section, you can find information as below.

  1. cluster summary In this section, you will get
  • Control plane availability
  • Number of Namespaces, Pods, PVC
  • Cluster information table
  1. cluster overall information
  • CPU usage of each node
  • Memory consumption of each node
  • Network traffic per second of whole cluster
  • stats of API server requests
  1. node specific information
  • CPU usage
  • Memory usage
  • Disk usage
  • File descriptor and context switches
  • Completed Disk IOPS
  1. pod specific information
  • Uptime
  • Health status
  • Restart attempts within 10 minutes
  • Resource usage(Memory , CPU, File system)
  • Resource quota
  • Network traffic per second
  • Memory status (swap / failure)
  • Thread count [Release Note] 2021/01/24
  • Initial release

Dependencies: