Kubernetes 是否支持硬件节点的 STONITH 操作?我们有智能电源插座,它允许 API 用于“关闭服务器”,它们与起搏器配合得很好。
Kubernetes 是否支持 STONITH?
Kubernetes 是否支持硬件节点的 STONITH 操作?我们有智能电源插座,它允许 API 用于“关闭服务器”,它们与起搏器配合得很好。
Kubernetes 是否支持 STONITH?
还没。
STONITH 在kubernetes 问题 39828中提到
STONITH(“射头中的另一个节点”或“射头中的违规节点”),有时称为 STOMITH(“射头中的其他成员/机器”),是一种用于计算机集群中的围栏技术。1
隔离是对故障节点的隔离,使其不会对计算机集群造成破坏。顾名思义,STONITH 通过重置或关闭故障节点来隔离故障节点。
它实际上在kubernetes/kops issue 2002中讨论过
我认为我们应该看一下自动缩放器,我认为我们可以默认为 Reboot,也许可以在清单中配置为 AllowTermination。
但目前这已经过时了。
这也在kubernetes/community/contributors/design-proposals/storage/pod-safety.md 中进行了描述
为了协调分区,参与者(人工或自动化)必须决定分区何时不可恢复。参与者可以以明确的方式(例如,节点被流星破坏)通知失败,从而确定该节点上的进程已终止,因此可以通过删除节点和节点上的 pod 来解决分区.
或者,参与者可以采取措施确保分区节点不能返回集群或访问共享资源——这被称为隔离,是一个很好理解的域。