我想知道我们的服务器设置必须采取的一种方法。我们有短命的豆荚。它们至少以 3 个 pod 启动,每个服务器都在等待它处理的单个请求 - 然后 pod 被销毁。我不确定这个 pod 被破坏的机制,但无论如何我的问题不在于这部分。
我正在设想一个“活动会话计数”指标。这些 pod 资源中的每一个都可以对我们将为集群创建的一些“指标”pod 进行休息调用。指标 pod 将公开一个sessionStarted
和sessionEnded
端点 - 这将增加/减少 kubernetesactiveSessions
指标。该指标将用于水平自动缩放所需的 pod 数量。
由于将 pod 设为“up”算作零活动会话,因此增加会话计数的自定义事件将使用 rest 调用更新度量服务器会话计数,然后在会话结束时再次减少(pod 启动并不表示是否或不是它有一个活动的会话)。
认为我需要这个度量服务器(并自己编写)是否正确?或者,Prometheus 是否在已经支持此类指标的地方公开了一些东西 - 其余客户端和所有(对于各种语言),可以修改这个指标?
寻找指导和确认我在正确的轨道上。谢谢!