我在下面提供了更多详细信息,但我试图回答的问题在标题中。我目前正在尝试解决这个问题,但我想我会先在这里问一下,以防有人知道答案。
关于我的设置
我有一个在 Google Compute Engine 集群上运行的 Kubernetes 服务(通过 Google Container Engine 启动)。它由一个服务(用于前端稳定 IP)、一个复制控制器和运行 Python 服务器的 pod 组成。服务器是一个 Python gRPC 服务器,在端口上进行睡眠侦听。
有 2 个 pod(在复制控制器中指定了 2 个副本)、1 个 rc、1 个服务和 4 个 GCE 实例(设置为根据 CPU 自动扩展至 5 个)。
我希望该服务能够处理任意数量的想要流式传输信息的客户端。但是,我目前看到该服务只与 16 个客户对话。
我假设连接的数量要么受到我拥有的 GCE 实例数量的限制,要么受到 pod 数量的限制。我将做实验,看看改变这些数字是如何影响事物的。