0

当我们通过 提交作业时sbatch,pid 到按增量顺序给出的作业。根据我的观察,这个顺序又从 1 开始。

sbatch  -N1 run.sh
Submitted batch job 20

//如果可能,目标是更改提交的批处理作业的 ID。

[Q1]比如slurm下有个正在运行的job。当我们重新启动节点时,作业是否继续运行?它的 pid 是否会更新或保持原样?

[Q2]是否可以使用集群所有者想要提供的唯一 id 提供或更改已提交作业的 pid?

感谢您宝贵的时间和帮助。

4

1 回答 1

2

如果节点失败,则重新排队作业 - 如果 . 中的JobRequeue参数允许这样做slurm.conf。它将获得与先前开始运行相同的作业 ID,因为这是数据库中用于管理作业的唯一标识符。(用户可以使用--no-requeuesbatch 参数覆盖重新排队。)

不可能更改作业 ID,不。

于 2017-04-12T10:10:06.653 回答