我必须处理存储在工作队列中的任务,并且我正在启动这种工作来完成它:
apiVersion: batch/v1
kind: Job
metadata:
name: pi
spec:
template:
spec:
parallelism: 10
containers:
- name: pi
image: perl
command: ["some", "long", "command"]
restartPolicy: Never
backoffLimit: 0
问题是,如果 Job 管理的 Pod 中的一个失败,Job 会在所有其他 Pod 完成之前将其终止。就我而言,我希望将作业标记为失败,但我不希望其 Pod 被终止。我希望他们继续运行并完成处理他们在队列中挑选的项目。
请问有办法吗?