我有一个实例计数为 3 的 VMSS。假设我指定如果 CPU 利用率 <20%,则将实例减少 3 到 1。假设这 3 个实例正在处理某个请求,假设每个请求需要 60 秒才能完成.
假设此时 CPU 利用率达到 15%,因此实例数应该减少 2。那么此时由其他两个实例服务的现有请求会发生什么。这些实例是否将其正在进行的进程转移到其他实例,或者在完成正在进行的请求之前不会减少计数?
我已经使用应用程序网关附加了规模集并启用了连接耗尽,这样正在进行的过程就不会中断。但它正在下降。由于它失败了,我正在尝试使用 API 管理版本和版本来做一些事情。
期望:一旦发生缩减/缩减,正在进行的请求不应该下降。