Docker Swarm 和 Kubernetes 是管理多个节点上的应用程序的两个系统。如果一个节点正在耗尽或它的负载非常高,它们会启动一些程序来维持需求中描述的所需状态。
当然,当他们通过基础设施管理应用程序时,他们必须做出一些选择来修改状态。如何做出决策以确保决策不会损害系统?
我的意思是,不是在触发动作时(系统分析),而是我们如何证明做出的决定是解决问题的最佳决定? 有这方面的一些文件吗?我没有找到任何提到这个话题。
例如:我有一个资源几乎免费的节点。然后,在某个时刻,他们的资源变得不足,并保持不足一秒钟,然后免费返回。如果管理器因为资源不足的那一秒触发了迁移功能而将应用程序从该节点迁移到另一个节点,则可能会产生比解决的问题更多的问题,因为资源不足的问题已经过去,实际上不需要迁移。