42

当我使用时,sinfo我看到以下内容:

$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
[...]
RG3          up 28-00:00:0      1  drain rg3hpc4
[...]

国家“流失”是什么意思?

4

1 回答 1

55

这意味着不会在该节点上安排更多作业,但当前正在运行的作业将继续运行(与设置节点相反,该节点down会杀死该节点上运行的所有作业)。

节点通常设置为该状态,以便在所有正在运行的作业完成后进行一些维护操作。

scontrol命令的联机帮助页:

如果要从服务中删除节点,通常需要将其状态设置为“DRAIN”

请注意,系统管理员很可能给出了节点耗尽的原因,您可以使用

sinfo -R
于 2014-05-05T21:31:48.810 回答