0

我们一直在 k8s 上运行 tidb 集群。从那以后它工作正常。但是突然之间,tidb-tidb-1在扩展 tidb-tidb statsfulset 后,我​​只在新的 statsfull pod 中遇到了以下问题。有趣的是 tidb-tidb-2 正在运行。所有其他 pd 和 tikv pod 也运行良好。我检查了 pd url,它无法从有问题的 pod 访问,但对其他 pod 很好。你能帮我解决这个问题吗?

tidb-tidb-1 logs:

[2021/04/11 16:15:44.526 +00:00] [WARN] [base_client.go:180] ["[pd] failed to get cluster id"] 
[2021/04/11 16:15:48.527 +00:00] [WARN] [base_client.go:180] ["[pd] failed to get cluster id"]  [error="[PD:client:ErrClientGetMember]error:rpc error: code = DeadlineExceeded desc = latest connection error: connection error: desc = \"transport: Error while dialing dial tcp: i/o timeout\" target:test-tidb-pd:2379 status:CONNECTING

4

1 回答 1

1
  1. 你能显示命名空间信息吗?kubectl get all -n -o wide
  2. 请检查节点信息。 https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#node-isolation-restriction
  3. 请检查网络。如果两个节点都能ping通?传输:拨号时出错 TCP:i/o 超时
于 2021-04-17T06:44:54.607 回答