0

我们在 EKS 上有一个集群,从 2 天前开始,我们注意到集群中存在一些网络问题。想象一个场景,我们有 2 个工作节点(w1 和 w2)和 3 个具有自己的服务(A、B 和 C)的 Pod。Pod A 和 B 位于 w1 上,Pod C 位于 w2 上。

问题是A无法到达C,但B可以。当我进入 pod A 并尝试curl -vvv http://C/DNS 解析为 C 的服务的 IP 但之后它挂起并且一段时间后我得到了超时。奇怪的是重新启动/删除 pod A 并没有解决问题,但是当我删除 C 时,它解决了问题。

我从未见过这样的事情,我检查了工作节点的 kube-proxy 的日志,但没有看到错误或任何奇怪的东西。有人知道这里发生了什么吗?

4

0 回答 0