这是一个有点复杂的情况。我们通过 haproxy 后面的 16 台负载平衡服务器为我们的应用程序提供服务。我们从另一个运行 nginx 的服务器提供与应用程序相关的图像,该服务器也位于 haproxy 负载均衡器后面。我们有一个全局 CDN,可以从该图像服务器中提取图像并缓存它们以供将来使用,因此即使我们处理 3 亿张左右的图像,该服务器上的负载也非常低。
现在,昨天我们不得不将 RAID 阵列中的一个驱动器换成图像服务器。当我们删除它时,我们当然希望我们的一些图像不再加载,但我们遇到了一个更严重的问题。与应用服务器的连接猛增,我们集群中的任何内容都无法提供服务。我的想法是应用程序请求进入负载均衡器,访问应用程序服务器并挂在那里等待提供图像。由于服务器宕机,请求不断涌入,整个系统被锁定。
我显然希望将来避免这种情况。关于我们可能需要在哪里设置合理的 timout 或如何在负载均衡器上处理它的任何建议?如果发生这种情况,我希望我们的应用程序像往常一样加载,只是没有图像。