2

我正在尝试kind为我的 kubernetes 集群设置一个集群。不幸的是,它在写入节点时准备好节点后失败。我会附上你的输出和一些信息。预先感谢您的任何帮助!

干杯

错误

$ kind create cluster --config kind-config.yaml 

Creating cluster "kind" ...
 ✓ Ensuring node image (kindest/node:v1.20.2)  
 ✓ Preparing nodes      
 ✗ Writing configuration  
ERROR: failed to create cluster: failed to generate kubeadm config content: failed to get kubernetes version from node: failed to get file: command "docker exec --privileged kind-worker3 cat /kind/version" failed with error: exit status 1
Command Output: Error response from daemon: Container c41566958be2239a9470ef2ea636c4b21958ee7620086f526954a02e4a605106 is not running

种类配置yaml

apiVersion: kind.x-k8s.io/v1alpha4
kind: Cluster
nodes:
  - role: control-plane
  - role: worker
  - role: worker
  - role: worker

我的节点

$ kubectl get nodes -o wide

NAME      STATUS   ROLES                  AGE     VERSION   INTERNAL-IP     EXTERNAL-IP   OS-IMAGE       KERNEL-VERSION     CONTAINER-RUNTIME
gemini    Ready    control-plane,master   3d18h   v1.20.2   192.168.2.203   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
phoenix   Ready    <none>                 3d17h   v1.20.2   192.168.2.129   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
taurus    Ready    <none>                 3d17h   v1.20.2   192.168.2.201   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13
virgo     Ready    <none>                 3d17h   v1.20.2   192.168.2.202   <none>        Ubuntu 20.10   5.8.0-1015-raspi   docker://19.3.13

我的集群上正在运行什么

$ kubectl get all --all-namespaces

NAMESPACE              NAME                                             READY   STATUS    RESTARTS   AGE
default                pod/nginx-6799fc88d8-62cjd                       1/1     Running   1          18h
kube-system            pod/calico-kube-controllers-86bddfcff-ccrhg      1/1     Running   7          3d18h
kube-system            pod/calico-node-jddnl                            1/1     Running   4          3d17h
kube-system            pod/calico-node-nxwlw                            0/1     Running   7          3d18h
kube-system            pod/calico-node-stnzs                            0/1     Running   0          52s
kube-system            pod/calico-node-zrxzl                            1/1     Running   4          3d17h
kube-system            pod/coredns-74ff55c5b-kb2nm                      1/1     Running   7          3d18h
kube-system            pod/coredns-74ff55c5b-wsgs5                      1/1     Running   7          3d18h
kube-system            pod/etcd-gemini                                  1/1     Running   8          3d18h
kube-system            pod/kube-apiserver-gemini                        1/1     Running   8          3d18h
kube-system            pod/kube-controller-manager-gemini               1/1     Running   11         3d18h
kube-system            pod/kube-proxy-7fcjz                             1/1     Running   8          3d18h
kube-system            pod/kube-proxy-84rr7                             1/1     Running   4          3d17h
kube-system            pod/kube-proxy-lc88w                             1/1     Running   4          3d17h
kube-system            pod/kube-proxy-v4qd9                             1/1     Running   4          3d17h
kube-system            pod/kube-scheduler-gemini                        1/1     Running   9          3d18h
kubernetes-dashboard   pod/dashboard-metrics-scraper-79c5968bdc-mlb4s   1/1     Running   7          3d18h
kubernetes-dashboard   pod/kubernetes-dashboard-7448ffc97b-nq5c9        1/1     Running   7          3d18h

NAMESPACE              NAME                                TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                  AGE
default                service/kubernetes                  ClusterIP   10.96.0.1        <none>        443/TCP                  41h
kube-system            service/calico-etcd                 ClusterIP   10.96.232.136    <none>        6666/TCP                 3d18h
kube-system            service/calico-typha                ClusterIP   10.109.108.233   <none>        5473/TCP                 3d18h
kube-system            service/kube-dns                    ClusterIP   10.96.0.10       <none>        53/UDP,53/TCP,9153/TCP   3d18h
kubernetes-dashboard   service/dashboard-metrics-scraper   ClusterIP   10.110.70.52     <none>        8000/TCP                 3d18h
kubernetes-dashboard   service/kubernetes-dashboard        NodePort    10.106.194.127   <none>        443:31741/TCP            3d18h

NAMESPACE     NAME                         DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR            AGE
kube-system   daemonset.apps/calico-node   4         4         2       4            2           kubernetes.io/os=linux   3d18h
kube-system   daemonset.apps/kube-proxy    4         4         4       4            4           kubernetes.io/os=linux   3d18h

NAMESPACE              NAME                                        READY   UP-TO-DATE   AVAILABLE   AGE
default                deployment.apps/nginx                       1/1     1            1           18h
kube-system            deployment.apps/calico-kube-controllers     1/1     1            1           3d18h
kube-system            deployment.apps/coredns                     2/2     2            2           3d18h
kubernetes-dashboard   deployment.apps/dashboard-metrics-scraper   1/1     1            1           3d18h
kubernetes-dashboard   deployment.apps/kubernetes-dashboard        1/1     1            1           3d18h

NAMESPACE              NAME                                                   DESIRED   CURRENT   READY   AGE
default                replicaset.apps/nginx-6799fc88d8                       1         1         1       18h
kube-system            replicaset.apps/calico-kube-controllers-56b44cd6d5     0         0         0       3d18h
kube-system            replicaset.apps/calico-kube-controllers-86bddfcff      1         1         1       3d18h
kube-system            replicaset.apps/coredns-74ff55c5b                      2         2         2       3d18h
kubernetes-dashboard   replicaset.apps/dashboard-metrics-scraper-79c5968bdc   1         1         1       3d18h
kubernetes-dashboard   replicaset.apps/kubernetes-dashboard-7448ffc97b        1         1         1       3d18h
4

2 回答 2

0

答案并不具体,从一开始就做好准备。由于 docker exec cat /kind/version 无法解决 github 问题,存在一个巨大的封闭无法创建集群,但是..

您遇到的问题非常广泛,可能有完全不同的根本原因。

BenTheElder - 善良的创造者/维护者

这部分:命令输出:来自守护程序的错误响应:容器 f2a2d9c8f9c2eca9aeec7f10249eb205b02c8a5f41e5bf1145b5a8e4b63da123 未运行

这告诉我们节点容器没有运行。这要么意味着入口点失败,要么您的主机将其杀死,要么是由于我们尚未发现一些模糊的错误,要么更可能是您的主机环境存在问题。

请提交您自己的问题并提供更多详细信息。这个问题是非特定的,并且已经讨论了许多不同的问题,如上所述。

所以请在 Github 上创建新问题,很可能现在那个地方最适合此类问题。

我还发现您的问题可能来自Docker Installed with Snap。请参阅https://github.com/kubernetes-sigs/kind/issues/1288#issuecomment-631673479。来自 SNAP 的 Docker 知道与 Kind 一起工作的问题,而且它实际上并没有得到 KIND 团队的支持

snap 在已知问题文档中,snap docker 包有许多问题,例如无法访问临时目录。我不推荐 docker 使用 snap,我们并不真正支持这一点。


一个小提示:如果您只是管理集群,我们现在已经解决了大多数 snap 问题,但我仍然不推荐 docker 使用 snap。

如果您看到与此类似的问题,则表示节点容器由于某种原因提前退出。这通常意味着主机环境已损坏,但有时也意味着我们需要解决例如不太常见的文件系统与设备映射器问题。

请尝试使用 kind create cluster --retain 捕获节点日志、kind export logs,并在上传的日志中提出问题。我们将尝试根据这些确定原因。

编辑:要特别清楚:“由于 docker exec cat /kind/version 失败而无法创建集群”是一种症状,请提交有关您的特定故障的详细信息的问题,以便我们在遇到这种情况时确定实际的根本原因。

此问题已被锁定,因为它与最初的根本原因无关,并且一直被用于恰好具有相同症状的新问题。这种症状对于节点很早就突然终止的边缘情况很常见,因为这是我们对正在运行的节点采取的第一个动作之一。

于 2021-02-10T17:44:41.467 回答
0

修剪 Docker 容器后,我能够创建 Kind 集群。我认为这可能与之前安装的 Kind 集群/容器有冲突。

docker container rm <id-of-container>

这样做之后, Kind create cluster 命令对我有用。

编辑
经过进一步检查,似乎我在用于创建集群的配置文件中的 YAML 格式不正确。我拼错了属性名称。

    defaults:
      enfoce: "baseline"

本来应该

    defaults:
      enforce: "baseline"

当我遇到这个问题时,我正在关注这个 Kubernetes pod 安全教程。 https://kubernetes.io/docs/tutorials/security/cluster-level-pss/

于 2022-01-13T22:33:21.790 回答