我们有 route53 故障转移类型的应用程序。目前我有两个 api 和负载均衡器。
- 基本的
- 中学
两个 API 都有健康检查 URL HTTP:80/health。
超时为10 秒。
单个实例的健康检查之间的时间间隔为15 秒。
将实例指定为健康所需的连续成功的健康检查次数为2 个请求
最后,route53 的健康检查失败阈值为 10,请求间隔为 30 秒。
一切正常,但有时当我的一个 api 出现故障时,我们不得不面对大约 5 到 10 分钟的平均停机时间,这是无法忍受的。任何建议,将不胜感激。