我正在使用最新的 sensu 核心版本 0.26.1,在一台 CentOS 机器上设置 sensu 服务器,在另一台机器上设置一个 sensu 客户端。
在一个 sensu 客户端中大约有 500 次检查,我一直"previous check command execution in progress"
在 sensu-client.log 中看到,但每次检查实际上完成得非常快(其中大多数不到 0.1 秒,间隔为 60 秒),我可以通过在下面运行它来确认这一点sensu
用户sudo su sensu -c "{run my check}"
.
然而,实际情况是,在 uchiwa 仪表板中,它显示我的许多检查都运行了超过 1 分钟,似乎 sensu 客户端严重卡住/缓慢,我尝试了以下方法:
- 删除几个长时间运行的检查并重新启动 sensu 服务器/客户端
- 在我的检查中添加超时定义,将超时限制为 10,然后导致许多检查"Execution timed out"。
- 我尝试只运行 1、10、50 次检查,似乎一切正常,但是,一旦检查次数达到一定数量(可能是 200-300),问题就出现了。
以上都不起作用,有没有办法调试哪些检查实际上是阻塞的?或者我可以将 sensu 配置为在超出timeout
定义时简单地终止检查?这样我就不会在日志“previous check command execution in progress”中看到这条消息
我被这个阻止了,需要帮助:)