1

我想将 Kubeflow 安装到 Azure 中,所以我开始使用单个节点(B4MS 虚拟机)创建一个 Azure Kubernetes 集群(AKS)。在安装过程中,我没有启用虚拟节点池选项。创建 AKS 集群后,我运行命令“ $ kubectl describe node aks-agentpool-3376354-00000”来检查规格。可分配的 Pod数量110我能够毫无问题地安装 Kubeflow。但是,后来我想要一个启用了虚拟节点池的 AKS 集群,这样我就可以使用 GPU 进行训练。因此,我删除了旧集群并使用相同的 B4MS 虚拟机创建了一个新的 AKS 集群,并启用了虚拟节点池选项。这一次,当我运行与上面相同的命令来描述节点规格时,可分配的 Pod 数量为30,并且由于缺少要配置的 pod,kubeflow 安装失败。

有人可以解释一下为什么启用或禁用虚拟节点选项时可分配的 Pod 数量会发生变化吗?如何在启用虚拟节点池选项的同时将可分配 Pod 的数量保持为 110?先感谢您!

4

1 回答 1

1

Virtual Node Pool requires the usage of the Advance Networking configuration of AKS which brings in AZURE CNI network plugin.

The Default POD count per node on AKS when using AZURE CNI is 30 pods.

https://docs.microsoft.com/en-us/azure/aks/configure-azure-cni#maximum-pods-per-node

This is the main reason why you are now getting 30 MAX pods per node.

This can be updated to a bigger number when using the AZ CLI to provision your cluster.

https://docs.microsoft.com/en-us/cli/azure/ext/aks-preview/aks?view=azure-cli-latest#ext-aks-preview-az-aks-create

--max-pods -m
The maximum number of pods deployable to a node.
于 2020-05-05T19:01:35.293 回答