我有以下带有 StatefulSet 的 Kubernetes YAML,我用它来部署带有 Patroni 的 PostgreSQL 集群。但是,这个问题与 Kubernetes 如何在 CoreDNS 中注册 Pod 名称有关。
根据稳定网络 ID 部分中的此文档,如果我为我的 Pod 创建了一个名为 Headless 的服务spilodemo-svc
,我可以使用短主机名 (podname.servicename) 访问它们:
spilodemo-0.spilodemo-svc
基本上,我的代码在 VirtualBox 和 Vagrant 上使用 kubeadm 部署的 K8s 集群上正常运行了很长时间。今天我想在 IBM Cloud 上部署它,但上面的主机名不起作用,奇怪的是,当我再次在 Vagrant/VirtualBox 上重复测试时,我无法再让它工作了,我不知道为什么。
现在 YAML 部署了 Spilo,它是 Zalando 开发的一个开源项目,它是一个带有 Patroni 和 PostgreSQL 的 Docker 镜像。我的代码来自他们的示例here。
基本上,他们创建了一个没有选择器的 ClusterIP 服务(而不是无头服务)。在这些情况下,Kubernetes 不会在其中创建 Endpoint。出于这个原因,我们在 YAML 中有一个与服务名称相同的 Endpoint(这似乎是 Kubernetes 期望的绑定)。
Spilo 的 Python 代码始终使用主节点的 IP 更新此端点。
StatefulSet 的字段 serviceName 等于服务的名称:
serviceName: spilodemo-svc
而且,根据文档,这保证了 Kubernetes 在 CoreDNS 中为这个短主机名(podname.servicename)创建一个条目:
spilodemo-0.spilodemo-svc
它工作了很长时间,直到今天,同时没有发生任何事情。老实说spilodemo-0.spilodemo-svc
,到目前为止,我还没有完全理解 DNS 名称是如何工作的,因为它使用 ClusterIP 服务而不是 Headless 服务。
另一个奇怪的事情是,Zalando 团队使用了我调用的另一个 Headless 服务,spilodemo-config
根据他们代码中的注释,它应该避免 Kubernetes 删除端点,但这对我来说没有多大意义。
但是,今天我也尝试将服务转换为无头服务,spilodemo-config
但没有成功。Kubernetes 仅在 CoreDNS 中为服务创建条目:
spilodemo.spilons.svc.cluster.local
但不是每个 Pod 的一个:
spilodemo-0.spilodemo-svc
spilodemo-1.spilodemo-svc
spilodemo-2.spilodemo-svc
谁能帮我弄清楚我的 YAML 文件发生了什么,以及如何让上面的三个短主机名在 CoreDNS 中工作?
PS 在 Stackoverflow 上,我发现了这些讨论:
- 无法解析同一 StatefulSet 中的 pod 的主机名
- 有状态 Pod 主机名无法解决 ,但它们无法解决我的问题。