我要解决的问题是 Web 应用程序的水平扩展,其中某些会话会导致 CPU 使用率过高。这个想法是使用 Readiness probe 来通知 K8s pod 已加载当前任务,并且必须将新流量发送到另一个(HPA 将完成这项工作并准备一个新 pod)。
但我希望在初始 pod 上进行处理的会话将处于活动状态,一旦工作完成,结果将交付给用户。
问题是这是否意味着如果就绪探测失败,K8s 将:
- 停止将所有流量路由到 pod,删除通过入口打开的当前会话。
- 停止将新流量路由到 pod,但当前会话将在指定的超时期间处于活动状态。
先感谢您。