Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
当我们通过 提交作业时sbatch,pid 到按增量顺序给出的作业。根据我的观察,这个顺序又从 1 开始。
sbatch
sbatch -N1 run.sh Submitted batch job 20
//如果可能,目标是更改提交的批处理作业的 ID。
[Q1]比如slurm下有个正在运行的job。当我们重新启动节点时,作业是否继续运行?它的 pid 是否会更新或保持原样?
[Q2]是否可以使用集群所有者想要提供的唯一 id 提供或更改已提交作业的 pid?
感谢您宝贵的时间和帮助。
如果节点失败,则重新排队作业 - 如果 . 中的JobRequeue参数允许这样做slurm.conf。它将获得与先前开始运行相同的作业 ID,因为这是数据库中用于管理作业的唯一标识符。(用户可以使用--no-requeuesbatch 参数覆盖重新排队。)
JobRequeue
slurm.conf
--no-requeue
不可能更改作业 ID,不。