我阅读了有关 Knative 私人和公共服务的信息。私有服务始终指向实际部署的端点,而公共服务可以指向 - 私有服务指向的位置,也可以指向激活器。
但在我的情况下,公共服务总是指向激活器(无论我们处于服务模式还是代理模式)。但一切正常。请查看下图,10.24.3.16:8012 是激活器端点:
在缩小模式下(pod 计数为零),请检查 helloworld-go-00001
当 pod 数量大于 0 时,处于放大模式(服务模式)。
请让我明白我错过了什么。
您注意到去年添加的优化 - 在少量流量(基本上少于 10-15 个 pod)的情况下,激活器通常可以在排队和典型入口方面执行更好的请求加权列表平衡和管理concurrencyCount
现有的 pod 并将延迟的请求路由到新的 pod 或现有的可用 pod。
如果您的服务扩展到 20 或 30 个 pod,您应该会看到激活器停止在流量路径中;我相信切换点是trafficBurstCapacity / ( (1.0-targetCapacity) * concurrencyCount)
豆荚,但我可能弄错了。如果我没记错的话,这个结果类似于200 / (0.3 * 80) > 8
,但我有一段时间没看过了。
在 apiserver 中实现的方式是 Knative 自动缩放器helloworld-go-00001
直接管理服务的端点,使用来自 activator 和 queue-proxy 的指标获取详细信息。