我正在使用 KEDA 自动扩展我的 ML Workload pod。当队列缩小时,即使 Pod 仍在处理队列工作负载,Pod 也会根据队列项目的数量自动扩展。我已经设置了 terminateGracePeriodSeconds 但对于我们的工作量来说太高或太低了。
阅读有关 SIGTERM 信号和 prestop 的信息,但找不到任何可以使用 KEDA queue helm chart 解决此问题的示例
我正在使用 KEDA 自动扩展我的 ML Workload pod。当队列缩小时,即使 Pod 仍在处理队列工作负载,Pod 也会根据队列项目的数量自动扩展。我已经设置了 terminateGracePeriodSeconds 但对于我们的工作量来说太高或太低了。
阅读有关 SIGTERM 信号和 prestop 的信息,但找不到任何可以使用 KEDA queue helm chart 解决此问题的示例
我们通过增加 indeployment.YAML 解决了这个问题terminationGracePeriodSeconds
。这可能不是正确的解决方法,但它对我们有用。希望它可以帮助有同样问题的人。
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
name: test
spec:
replicas: 1
template:
spec:
containers:
- name: test
image: ...
terminationGracePeriodSeconds: 300
如果您正在使用函数应用程序,请同时减小批处理大小,以便 pod 不会在更长的时间内赶上处理。