-1

我的团队负责一个高流量网站,该网站非常活跃,拥有大约 350 万个唯一网址。我们每周部署大约 1 个应用程序,我们有一个每周更新大约 100 个更新的 CMS,我们的内部数据源也每周发布大约 1 个,并且我们使用大约 10 个其他公共 Web 服务。我们的团队始终负责确保一切正常运行。

我们使用 pingdom 来确保其中一些已启动,但它仅限于一些检查,并且它不能处理我们需要的尽可能多的 url。

我们也使用 Nagios,但它有点像黑盒子,我们的开发团队还没有完全采用。我们的大多数开发人员都专注于 Windows,一想到所有配置就会畏缩。

我们需要的大部分只是监控几个 url,当事情发生故障或变化时可以通知我的东西。

4

1 回答 1

0

我认为你应该像单元测试一样,对每个网站发布前后进行内部测试。您的应用程序也应该具有出色的异常处理能力,并且应该记录和监视异常。

如果您通过 pingdom 或www.downnotifier.com之类的工具使用外部监控,您可以在每个页面时间检查一个 url。例如:一篇新闻文章、一个文本页面和一个产品页面。

于 2012-09-17T20:28:27.170 回答