我们是在都柏林由亚马逊托管的 PHP 网络应用程序。最近我们遇到了一个非常奇怪的问题。
问题:
突然之间,我们的网站变得异常缓慢,有时甚至无法使用。这通常会持续几分钟,然后一切都恢复正常。这似乎是随机发生的。有时一天会发生好几次,然后我们在几天内不会出现这个问题。我们使用New Relic跟踪我们的网站速度。在监控中我发现“在网络上花费的时间”似乎突然爆炸了(定义在这里:https ://newrelic.com/docs/features/how-does-real-user-monitoring-work#what-是否包含网络时间)。每个请求通常约为 0.5 秒。这个值会爆发到 9-15 秒之间的任何地方。大约 10-15 分钟后,它又回到 0.5 秒。
我可以排除的原因:
- 没有导致这种情况的流量峰值(它也发生在正常负载期间)+我们有足够的 CPU 和数据库能力,因此小峰值不应该造成问题。
- 没有运行任何导致问题的昂贵的内部脚本。
- 它似乎与外部软件无响应无关(即使是没有实现第三方组件的单个页面也非常慢(它们甚至没有谷歌分析)。
我认为它可能是:
- 老实说,我有点迷路了。
- 我唯一能想象的是,应用程序和数据库之间花费的时间非常高,原因不明,例如因为它们在不同的亚马逊可用区有一段时间或类似的东西,但这种问题应该然后偶尔影响每个人,我真的不知道如何解决或检测到这个。
- 我已联系亚马逊,但仍在等待答复。
您是否有类似的问题或任何想法可能是导致此问题的原因?
非常感谢任何提示。