1

在我们的 Kubernetes 1.6 集群中没有任何已知的变化,所有新的或重新启动的 pod 都不再被调度。我得到的错误是:

No nodes are available that match all of the following predicates:: MatchInterPodAffinity (10), PodToleratesNodeTaints (2).

我们的集群之前运行良好,我真的看不到在此之前所做的任何配置更改。

我已经尝试过的事情:

  • 重启主节点
  • 重启 kube-scheduler
  • 删除受影响的 pod、部署、有状态集

一些 pod 确实具有以前有效的反关联设置,但大多数 pod 没有任何关联设置。

集群信息:

  • Kubernetes 1.6.2
  • AWS 上的 Kops
  • 1个主节点,8个主节点,1个污染数据处理节点

这有什么已知的原因吗?

我可以检查哪些设置和日志可以提供更多洞察力?

有没有可能调试调度程序?

4

1 回答 1

1

问题是 Pod 被卡在删除中。这导致 kube-controller-manager 停止工作。

删除不起作用,因为有问题的 Pod/RS/Deployment 的限制与我们在创建后设置的 maxLimitRequestRatio 冲突。正在提交错误报告。

解决方案是增加 maxLimitRequestRatio 并最终重新启动 kube-controller-manager。

于 2017-07-16T22:23:07.170 回答