我目前正在使用 Hobbit 监控一个大型网络,并负责降低错误(或至少不相关)警报的数量。在我的列表顶部是由 bbtest-net 发起的测试“http”和“conn”。此命令检查 ping、ssh 等,如果例如 ping 超时,它会立即将状态设置为红色。一分钟后,bbretest 命令启动,检查所有新变红的主机,发现它又变绿了。这种情况一直在发生,它弄乱了我的日志。
第一次运行 bbretest 后,我有什么方法可以让 Hobbit 报告红色状态?
我目前正在使用 Hobbit 监控一个大型网络,并负责降低错误(或至少不相关)警报的数量。在我的列表顶部是由 bbtest-net 发起的测试“http”和“conn”。此命令检查 ping、ssh 等,如果例如 ping 超时,它会立即将状态设置为红色。一分钟后,bbretest 命令启动,检查所有新变红的主机,发现它又变绿了。这种情况一直在发生,它弄乱了我的日志。
第一次运行 bbretest 后,我有什么方法可以让 Hobbit 报告红色状态?
首先,这是一个编程网站,所以你不会得到很多答案。
但是……但是……
如果您的服务器超时,这不是问题吗?
在我看来,霍比特人完成了它所设计的工作:告诉你有一些事情需要你注意。
修复超时问题,你的日志应该没问题。
我认为你最好的选择是避开现有的 Hobbit 服务测试并编写自己的测试。这并不难。
除非连续几次尝试失败,否则您的测试脚本不会变红是个好主意。
您可以禁用标准的霍比特人并使用您自己的。话虽如此,“conn”测试的默认行为似乎相当合理(如果服务器不 ping,则立即变红)。
不幸的是,霍比特人警报系统没有选项仅在问题持续 X 分钟时发出警报,这将非常有用 - 但我相信您也可以使用自定义警报脚本来做到这一点。
您可以使用:
<ip> <hostname> # noconn
在不响应 ping 的服务器的 bb-hosts 中。然后通过服务测试它的活力。