有时,生产中会出现持续数天或数周的严重错误(新的或重新引入的),而客户并不总是通知我们。我现在拥有的唯一工具是 grep、awk 和 perl,但一旦有人抱怨,我就会被动反应。
我想主动并在给定时间段内发生一定次数的特定错误时得到通知。但我不想收到关于每个错误的通知的垃圾邮件。
是否有适用于服务器集群的轻量级开源解决方案?电子邮件、SMS 或 RSS 都可以。此外,也可以在图表中查看报告和趋势,但不是必需的。
目前我使用 Apache Log4J,我知道我可以使用它发送电子邮件警报。但正如我所说,我不想为每一个错误都发送电子邮件。我想在系统何时通知我时获得一些情报。我希望我的应用程序代码之外的智能。