0

假设我的集群中有 3 个节点,我想运行 300 个作业。

如果我运行1 job per PODand 100 pods per NODE,如果 Azure Kubernetes 服务中的某个节点发生故障,会发生什么情况?

4

2 回答 2

1

这些作业将进入挂起状态,因为 Kubernetes 支持每个节点 110 个 pod,因此没有资源来支持故障转移作业。您可以考虑使用 Cluster Autoscaler (Beta),它会提供更多主机来满足运行那些处于挂起状态的作业。

于 2018-08-30T00:11:49.967 回答
0

如果一个节点失败

Cluster Autoscaler (CA) 可用于使用自动缩放组处理 Azure 中的节点故障:

https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/cloudprovider/azure/README.md

https://docs.microsoft.com/en-us/azure/aks/autoscaler

https://docs.microsoft.com/en-us/azure/aks/scale-cluster

于 2018-08-30T01:05:26.747 回答