我们正在使用 Nagios 来监控我们的网络,并取得了很好的效果。现在有一个我们正在努力解决的新要求:
我们想通知 Nagios 一个非致命但严重的应用程序错误。该应用程序不会停止运行,但存在某种需要调查的问题。
调查完问题后,我们需要一些方法在 Nagios 中“取消标记”该问题。
我们尝试使用 syslog,但最大的问题是一旦记录了错误,服务就会进入错误状态,无法恢复。此外,虽然应用程序会向 syslog 报告严重错误,但大多数时候它们不会报告“全部清除”错误。
我们正在使用 Nagios 来监控我们的网络,并取得了很好的效果。现在有一个我们正在努力解决的新要求:
我们想通知 Nagios 一个非致命但严重的应用程序错误。该应用程序不会停止运行,但存在某种需要调查的问题。
调查完问题后,我们需要一些方法在 Nagios 中“取消标记”该问题。
我们尝试使用 syslog,但最大的问题是一旦记录了错误,服务就会进入错误状态,无法恢复。此外,虽然应用程序会向 syslog 报告严重错误,但大多数时候它们不会报告“全部清除”错误。
我已经使用被动检查完成了这项工作:http ://nagios.sourceforge.net/docs/3_0/passivechecks.html
基本上,您的应用程序只是要将一些数据提供给 nagios 核心到其外部命令文件中。Nagios 最终将读取数据并更新警报、执行事件处理程序等。
您的具体设置方式将因您的情况而异,但如果您需要任何其他帮助,请告诉我。:)