有没有办法使用 slurm 监控集群中 cpu 使用率的百分比。例如,假设我有 200 个节点,并且我发送了一个使用所有这 200 个节点的 mpi 工作,可能只有一个节点被使用(真正计算的东西)而另一个没有。是否有一个选项可以告诉我 - 200 个节点中的平均 cpu 负载,或每个 cpu 上的当前 cpu 负载?
编辑:在 BlueGene 机器上
谢谢。
有没有办法使用 slurm 监控集群中 cpu 使用率的百分比。例如,假设我有 200 个节点,并且我发送了一个使用所有这 200 个节点的 mpi 工作,可能只有一个节点被使用(真正计算的东西)而另一个没有。是否有一个选项可以告诉我 - 200 个节点中的平均 cpu 负载,或每个 cpu 上的当前 cpu 负载?
编辑:在 BlueGene 机器上
谢谢。