背景:
我有一个带有 2 个节点(t3.small)的 EKS 集群。集群有几个 pod,包括:
- 1 个用于 Web 前端的 pod
- 1 个用于后端的 pod
- AWS ALB 控制器
- 外部 DNS
当前行为:
- 所有后端和 Web 前端 pod + 其他 AWS ALB pod(cert-manager、cert-manager-cainjector、cert-manager-webhook、app-backend-deployment、app-frontend-deployment、external-dns、aws-load-balancer-控制器等 - 总共 11 个 pod)都分配到 1 个单节点中。
- 另一个节点仅运行 2 个 pod(aws-node 和 kube-proxy),这意味着没有分配应用程序节点。
- 后果:一个节点由于CPU/内存不足而频繁宕机或进入非就绪状态,而另一个节点完全空闲且未被使用。
期望的行为(或我自以为是的预期行为):应该更平等地分配 pod。
我在配置中遗漏了什么吗?