1

有时一周左右一次,我们会遇到一个奇怪的状态,我们的 Kubernetes 集群无法连接到内存存储 Redis 服务。

K8S母版:1.10.7云测试版redis实例列表--region europe-west1  1 ↵  10122  12:26:38

INSTANCE_NAME   REGION        TIER         SIZE_GB  HOST       PORT  NETWORK  RESERVED_IP   STATUS  CREATE_TIME
chefclub-redis  europe-west1  STANDARD_HA  1        10.0.10.4  6379  default  10.0.10.0/29  READY   2018-05-29T14:12:46

获得一个没有路由到主机。

kubectl run -i --tty busybox --image=busybox -- sh                                    ✓  10125  12:28:36
If you don't see a command prompt, try pressing enter.
/ # telnet 10.0.10.4 6379
telnet: can't connect to remote host (10.0.10.4): No route to host

过去发生过几次,现在我刚刚升级了我的节点1.10.7,一切都恢复了原位,我可以再次连接。

我想知道接下来我可以采取哪些其他步骤?

4

1 回答 1

0

确保您已按照有关如何从集群连接到 Redis 实例和故障排除文档的说明进行操作。请注意,如果您的集群配置启用了 IP 别名,则在连接到 redis 服务器时,步骤可能会有所不同。

您可以研究 Kubernetes pod 的 Stackdriver 日志记录,并在受影响的时间范围内检查完整的错误消息。这将帮助您检查 Github 或其他 Stackoverflow 线程中的已知问题。用于查看 pod 日志的高级 Stackdriver 日志过滤器:

resource.type="container" resource.labels.cluster_name="cluster_name" resource.labels.namespace_id="k8s_namespace" 标签。"container.googleapis.com/k8s_pod_name"="k8s_pod_name"

如果您没有发现任何已知问题并怀疑该问题可能出在 Google 端。您可以使用Public Issue Tracker创建问题。

于 2018-09-11T19:07:56.407 回答