0

其实我想做的,

我创建了仪表板来监控 grafana 中的警报状态。我在我的系统中创建了假数据来模拟我在这些板上的警报情况。该数据的时间涵盖了现在 - 现在 + 12 小时的范围。事实上,分析真实数据中的警报状态需要很长时间。出于这个原因,我的警报规则不能非常灵活。我必须等到这段时间结束才能看到系统中的警报状态。(实际上我有很多这样的状态。) Grafana 根据我数据库中的记录创建待处理、警报和 ok 状态。有没有一种方法可以快速验证我的测试而无需等待这个时间?

4

1 回答 1

0

主要问题是,以与数据源无关的方式进行操作相当昂贵。Bosun 的工作方式是选择一个时间范围,然后选择一个间隔或运行多个查询。

同时设置 From 和 To 可以随着时间的推移测试所选警报的多次迭代。迭代次数取决于对两个链接字段 Intervals 和 Step Duration 的设置,在 3 更改一个会更改另一个。Intervals 将是在 From 到 To 的持续时间内要执行的运行次数,而 Step Duration 是间隔之间应该有多少分钟的时间。随着时间的推移进行测试将填充时间轴选项卡 5,该选项卡为集合中的每个项目绘制一个可点击的严重性状态图形:

Bosun 插件

然后它将使用限制同时查询的池运行所有这些查询。对于 5 分钟的间隔,它将运行相邻的 5 分钟查询。

因此,这将显着加快警报创作和测试工作流程。但它最好作为一个工作系统来实施。这是因为对于更昂贵的查询,或者运行相当多的范围/间隔组合,它可能需要一分钟左右 - 所以必须等待开放的网络连接不太理想。

所以我发现我一般用两种模式:

调整在某个时间触发的特定警报 大致了解警报规则将触发多少历史数据 对于一般结束,通常需要更大的时间范围,这意味着如果保持间隔,则需要更多查询相同。使用 FOR (Pending) 之类的功能,您必须使用与实际运行相同的时间间隔。

所以可能,有一些限制,需要注意做对。但在我的经验中非常有用。

于 2022-02-04T10:58:46.160 回答