我有一个脚本,它提交多个作业以在 SGE 队列上并行运行,另一个收集脚本在此作业列表完成时执行。我-hold_jid wc_job_list
用来在并行作业运行时保持收集脚本的执行。
我只是注意到有时某些并行作业会失败,而收集脚本仍在运行。该文件指出:
如果任何引用的作业以退出代码 100 退出,则提交的作业将仍然没有资格执行。
如何捕获并行失败的作业退出状态,以便如果其中任何一个因任何原因失败,则不会执行收集脚本或给出错误消息?
我有一个脚本,它提交多个作业以在 SGE 队列上并行运行,另一个收集脚本在此作业列表完成时执行。我-hold_jid wc_job_list
用来在并行作业运行时保持收集脚本的执行。
我只是注意到有时某些并行作业会失败,而收集脚本仍在运行。该文件指出:
如果任何引用的作业以退出代码 100 退出,则提交的作业将仍然没有资格执行。
如何捕获并行失败的作业退出状态,以便如果其中任何一个因任何原因失败,则不会执行收集脚本或给出错误消息?