我在 Kubernetes 上运行 Argo 工作流程。在我按照这个博客设置 Jupyterhub 之后,我开始在 Argo 上的 pod 上收到此错误(在使用 Jupyterhub 之前从未遇到过问题)
failed to save outputs: timed out waiting for the condition
:.
如果我添加,工作总是失败
resources:
limits:
nvidia.com/gpu: 1
但是如果不使用 gpu,它有时会成功(在偶尔失败后使用 retryStrategy)。
有人可以帮我吗?