0

有没有办法使用 slurm 监控集群中 cpu 使用率的百分比。例如,假设我有 200 个节点,并且我发送了一个使用所有这 200 个节点的 mpi 工作,可能只有一个节点被使用(真正计算的东西)而另一个没有。是否有一个选项可以告诉我 - 200 个节点中的平均 cpu 负载,或每个 cpu 上的当前 cpu 负载?

编辑:在 BlueGene 机器上

谢谢。

4

1 回答 1

0

slurm 命令:

sstat "jobid"

用你的整数jobid替换“jobid”。

它将返回几列,包括“AveCPU”和“AveDiskRead”

于 2015-10-15T23:11:44.127 回答