1

当我在 slurm 中使用“sinfo”时,我在其中一个分区附近看到一个星号(例如:RUNNING-CLUSTER*)。

分区看起来不错,其下的所有节点都处于空闲状态。

例如,当我使用“sleep 300”运行一个简单的脚本时,我可以看到队列中的作业(使用“squeue”),但它们运行了几秒钟并结束。没有错误消息(我可以在日志中看到他们失败了。那里没有更多信息)。

知道星号是干什么用的吗?说明书上没找到。

谢谢。

4

1 回答 1

2

分区名称后面的“*”表示这是提交作业的默认分区。LLNL提供的文档直接支持我的发现:

LLNL 文档

于 2015-11-15T09:44:43.447 回答