我们使用 Riemann 和 Riemann-health 来监控我们的服务器。但是现在我收到了很多 CPU 严重警告,因为 CPU 在很短的时间内达到峰值 - 我认为这甚至不需要知道。据我了解,持续的高 CPU 使用率会增加平均负载,这也会被报告并且听起来更有用。
我不想禁用报告 CPU,只是每个级别都应该被认为是好的。如果可能,我想更改 Riemann 服务器上的事件,因此我不必更改所有服务器。
这里是我们的黎曼配置:https ://gist.github.com/iGEL/e352764a8c559440c851