Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我将许多作业的数组提交到 LSF 集群。大多数运行并在 DONE 状态下完成,但有些可能会退出。我需要一种方法来重新运行阵列的任何 EXITing 成员作业。
谢谢。
我一直在玩同样的问题和命令:
brequeue -e <jobarrayid>
应该做你所追求的。您不需要指定应该重新运行哪些元素,-e 开关应该只选择 EXIT 的索引。