1

我正在使用 KEDA 自动扩展我的 ML Workload pod。当队列缩小时,即使 Pod 仍在处理队列工作负载,Pod 也会根据队列项目的数量自动扩展。我已经设置了 terminateGracePeriodSeconds 但对于我们的工作量来说太高或太低了。

阅读有关 SIGTERM 信号和 prestop 的信息,但找不到任何可以使用 KEDA queue helm chart 解决此问题的示例

4

1 回答 1

1

我们通过增加 indeployment.YAML 解决了这个问题terminationGracePeriodSeconds。这可能不是正确的解决方法,但它对我们有用。希望它可以帮助有同样问题的人。

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
    name: test
spec:
    replicas: 1
    template:
        spec:
            containers:
              - name: test
                image: ...
            terminationGracePeriodSeconds: 300

如果您正在使用函数应用程序,请同时减小批处理大小,以便 pod 不会在更长的时间内赶上处理。

于 2021-06-02T08:35:00.920 回答