情况
- App Engine Flex 上的自定义运行时 (Docker/Node)
- 在我们自己管理资源时手动扩展为 1 个单实例(2 cpu / 6 gb ram)
- 配置了活动性和就绪性检查
- 正如预期的那样,虚拟机实例每周自动重启以应用操作系统/系统更新
- 这是在 Google Cloud Console的“活动”窗格中可见
- Stackdriver 日志确认了此活动(例如
shutdown-script: INFO Starting shutdown scripts.,startup-script: INFO Starting startup scripts.) - 在这些重启期间没有可用的实例,导致访问在实例上运行的应用程序时出现 503 错误
目标
- 对实例数量进行一些控制以防止停机
- 例如,在 1 个实例重新启动时临时扩展到 2 个实例
- 控制可用资源(cpu / ram)
问题
我们考虑过始终只有 2 个实例可用,但担心这两个实例会同时重新启动,因为它们属于同一实例组。
什么可以让我们保持一切正常运行,同时仍然控制使用的实例/资源的数量?