0

发生了什么:我已经用这些细节配置了一个 hpa:

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: api-horizontalautoscaler
  namespace: develop
spec:
  scaleTargetRef:
    apiVersion: extensions/v1beta1
    kind: Deployment
    name: api-deployment
  minReplicas: 1
  maxReplicas: 4
  metrics:
  - type: Resource
    resource:

      name: memory
      targetAverageValue: 400Mib

我预期会发生什么:当我们加载一些负载时,Pod 扩展到 3 个,并且平均内存超过了预期的 400。现在平均内存已经回落到大约 300 并且 Pod 仍然没有缩小,即使它们已经低于目标几个小时了。 图片

一天后: 图片

我预计当内存低于 400 时 Pod 会缩小

环境

  • Kubernetes 版本(使用kubectl version):
Client Version: version.Info{Major:"1", Minor:"13", GitVersion:"v1.13.9", GitCommit:"3e4f6a92de5f259ef313ad876bb008897f6a98f0", GitTreeState:"clean", BuildDate:"2019-08-05T09:22:00Z", GoVersion:"go1.11.5", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"13", GitVersion:"v1.13.10", GitCommit:"37d169313237cb4ceb2cc4bef300f2ae3053c1a2", GitTreeState:"clean", BuildDate:"2019-08-19T10:44:49Z", GoVersion:"go1.11.13", Compiler:"gc", Platform:"linux/amd64"}re configuration:
  • 操作系统(例如:)cat /etc/os-release
> cat /etc/os-release
NAME="Ubuntu"
VERSION="18.04.3 LTS (Bionic Beaver)"
  • 内核(例如uname -a):x86_64 x86_64 x86_64 GNU/Linux

我真的很想知道这是为什么。我很乐意提供任何需要的信息。

谢谢!

4

2 回答 2

1

HPA 如何决定运行多少个 pod 的公式在Horizo​​ntal Pod Autoscaler 文档中:

desiredReplicas = ceil[currentReplicas * ( currentMetricValue / desiredMetricValue )]

用你给出的数字,currentReplicas是 3,currentMetricValue是 300 MiB,desiredMetricValue是 400 MiB,所以这减少到

desiredReplicas = ceil[3 * (300 / 400)]
desiredReplicas = ceil[3 * 0.75]
desiredReplicas = ceil[2.25]
desiredReplicas = 3

您需要进一步降低负载(低于 266 MiB 的平均内存利用率)或增加目标内存利用率以进一步缩减。

(简单地低于目标不会自行触发缩减,您必须低于目标足以让此公式产生较低的数字。如果负载正好在触发缩减的阈值附近,这有助于避免颠簸一个方向或另一个方向。)

于 2020-10-26T11:08:04.027 回答
0

有两件事要看:

包含对内存扩展和自定义指标的支持的 beta 版本可以在autoscaling/v2beta2. 中引入的新字段在autoscaling/v2beta2使用autoscaling/v1.

是在 K8s 1.12 中引入的autoscaling/v2beta2,因此尽管您使用的是 1.13(现在是 6 个主要版本),但它应该可以正常工作(但是,建议升级到新版本)。尝试将您的更改apiVersion:autoscaling/v2beta2.

--horizontal-pod-autoscaler-downscale-stabilization:此选项的值是一个持续时间,它指定自动缩放器必须等待多长时间才能在当前操作完成后执行另一个缩减操作。默认值为 5 分钟 ( 5m0s)。

在更改上面建议的 API 后检查此特定标志的值。

于 2020-10-26T09:36:49.770 回答