ModelArts-Cluster-View
华为云ModelArts服务提供的集群视图模板,主要分为4个部分:
- Overview:展示集群的统计信息(节点数,运行的任务数)和GPU/NPU卡的简略使用信息(如卡的分配率和利用率等信息);
- 节点信息:以表格形式展示了每个节点的卡分类和使用情况,以及CPU和MEMORY的利用率信息;
- 关键任务分析:主要展示用户的大任务和低效任务的信息;
- 用户信息:展示每个用户对GPU/NPU卡的使用情况。
Data source config
Collector config:
Upload an updated version of an exported dashboard.json file from Grafana
Revision | Description | Created | |
---|---|---|---|
Download |