2

我有一个脚本,它提交多个作业以在 SGE 队列上并行运行,另一个收集脚本在此作业列表完成时执行。我-hold_jid wc_job_list用来在并行作业运行时保持收集脚本的执行。

我只是注意到有时某些并行作业会失败,而收集脚本仍在运行。该文件指出:

如果任何引用的作业以退出代码 100 退出,则提交的作业将仍然没有资格执行。

如何捕获并行失败的作业退出状态,以便如果其中任何一个因任何原因失败,则不会执行收集脚本或给出错误消息?

4

1 回答 1

2

如果是BASH,您可以解析程序的退出状态(可以引用为$?),如果不是0(这是正常终止的退出状态),请exit 100在作业脚本的末尾调用。

这样做的问题是,您的作业将保留在队列中,Eqw并且必须手动删除。

更新:对于您设置给Eqw管理员的每项工作,都会收到一封电子邮件...

于 2013-10-08T06:38:30.983 回答