我正在尝试通过设置automatic_scaling
参数来减少我的 Google App Engine 账单。平均而言,我的应用程序有 7-10 个实例正在运行,其中 2 或 3 个是空闲的。但有时,就像所附图表中的凌晨 3 点到 6 点之间,活动实例和空闲实例之间的差异大得离谱。另外,我想减少活动实例的数量,从而增加最终用户的响应时间(设置min_pending_latency
和max_pending_latency
)。但是,直到现在,这些设置都没有任何效果。
这是我的 app.yaml 配置:
automatic_scaling:
min_pending_latency: 250ms
max_pending_latency: 750ms
max_idle_instances: 2