0

我使用带有 kubenet 网络和 2 个节点的 az aks create 命令创建了一个 aks 集群。由于 AD 帐户中的权限问题,在运行 aks create 命令之前必须关闭 NSG。AKS 群集创建成功后,重新应用了 NSG。

为了检查新创建的集群的健康状况,当我运行时:

kubectl get nodes --all-namespaces; 

没有返回节点。但是,当我查看 azure 门户和相应的 vNet 时,使用子网范围内的 ips 创建了 2vmss。当我运行时:

kubectl get pods --all-namespaces;

所有 pod 都处于待处理状态:

NAMESPACE     NAME                                   READY   STATUS    RESTARTS   AGE
kube-system   coredns-xxxxdxxxxx-xxxxx               0/1     Pending   0          5h
kube-system   coredns-autoscaler-xxdxxxxxxxx-xxxx    0/1     Pending   0          5h
kube-system   kubernetes-dashboard-xxdxxxxxx-xxxxx   0/1     Pending   0          5h
kube-system   metrics-server-xxxxxxxdxx-xxxx         0/1     Pending   0          5h
kube-system   omsagent-rs-xxxxxxxxdx-xxxxx           0/1     Pending   0          5h
kube-system   tiller-deploy-xxxxxxxdxxx-xxxx         0/1     Pending   0          34m
kube-system   tunnelfront-xxxxxxxdx-xxxxx            0/1     Pending   0          5h

然后我对 coredns pod 做了一个描述:

kubectl describe pod coredns-xxxxxxxxxx-xxxx -n kube-system

警告 FailedScheduling 2m40s (x2242 over 2d5h) default-scheduler no nodes available to schedule pods

我需要使用 helm/tiller 部署一些容器,当我运行安装命令时出现错误

错误:找不到准备好的分蘖吊舱

我知道这与 helm/tiller 安装没有直接关系,问题可能更深一些。

我是 Kubernetes 的新手,任何关于如何诊断问题的想法都将不胜感激。

4

2 回答 2

2

如果没有返回节点,kubectl get nodes我建议重新创建集群,因为如果没有节点 - 任何 pod 都不能在这个集群上运行。您可以尝试将集群升级到更新版本的 kubernetes(这将有效地重新部署节点),这可能会有所帮助。

于 2019-11-10T17:41:08.467 回答
0

您需要手动部署

kubectl logs --namespace kube-system tiller-deploy-xxxxxxxdxxx-xxxx

如以下评论所述,根据您的日志,没有节点并且所有 pod 都处于挂起状态,建议here您需要删除集群并重新创建集群。

于 2019-11-10T17:27:05.187 回答