我有一堆我负责的 Rancher 集群,开发人员使用其中一些集群PriorityClasses
来确保安排一些更重要的工作负载。3PriorityClasses
在 3 位数范围内,因此它们不会干扰默认值。但是,目前没有PriorityClasses
设置为默认值,也没有设置为默认preemptionPolicy
值PreemptLowerPriority
。
rancher、longhorn、prometheus、grafana 等工作负载均未priorityClassName
设置。
长话短说,我相信当资源短缺时,这会对集群造成严重破坏。
在向开发人员发表意见之前,我想收集一些数据来支持我的故事。
问题:如何检测 pod 是否因抢占而终止?
我试图用谷歌搜索该主题,但找不到任何东西。我希望kube state metrics
会有一些东西,但我什么也没找到。
任何帮助将不胜感激。