问题标签 [bosun]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
graph - 在 Bosun 图中限制主机
我需要在主机上创建一个 TOP10 内存使用表,包括一个图表。我可以通过使用limit($query, 10)在表达式中做到这一点,所以它对警报和表格很有用,但是我在限制这个图表上的主机时遇到了问题。Limit 返回一个数字,我需要一个系列才能绘制它。Bosun 是否可以限制图中的主机数量?
awk - Bosun 中已用内存的百分比
我在 Bosun 中制作特定图表时遇到问题。该图应该包含内存使用率最高的主机,但我找不到任何可用的指标来做到这一点。当然,我有os.mem.used就像os.mem.percent_free一样,但对我来说它不是很有帮助。我想从查询中获取两个系列,就像警报一样:moemry 的总数和使用的一个,除以使用的总数并乘以 100。
问题似乎是我不能划分系列,所以最后的机会是通过grep和awk在 Linux 中的 free 命令编写我自己的指标。
bosun - 在 Bosun 中重复电子邮件通知
在 Bosun 配置通知中,我将超时设置为 5m,即 5 分钟。我收到的电子邮件间隔为 5 分钟或 10 分钟。我无法调试为什么会这样。请帮忙。
logstash - Bosun Logstash 集成 - 如何获取完整的消息字段
我想在 bosun 中发出警报,它将检查 logstash 中是否出现“级别:致命”消息,并在每次出现唯一消息 x 主机组合时发出警报。为了使它有用,它应该按“消息”和“主机”标签对警报进行分组,并在模板中报告这些标签的值。我的 lscount 查询如下所示:
我的问题是,当在 bosun 中运行此警报时,而不是像我想要的那样按整个消息字段进行分组,而是将单个消息的消息字段分解为多个组。看起来它在空格、冒号、换行符、方括号和等号上进行拆分。例如,如果我的消息是:
从上面的 lscount 得到的 bosun 输出会给我 12 个组,其中包含消息“there”、“was”、“an”、“error”、“at”、“org.abc.Class”、“42”、“abc” 、“组件”、“失败”、“原因”、“300”。
按主机进行的分组也不如预期,尽管这是在第一个时期分裂。例如,我们的主机名可能是core2.abc.xyz.net
,但上面 lscount 的结果被拆分为host=core2
和host=abc.xyz.net
。
有没有办法通过消息字段的全部或部分分组警报,然后获取完整的消息字段以在模板中报告?
http-post - Bosun 警报将带有二进制的帖子发送到 influx
我知道可以在警报通知中发送带有 json body 的帖子(就像这里Bosun 通过 json post body 发送警报特定数据)
但是由于现在 Influx 不推荐使用带有 json 的帖子,我想知道是否可以发送带有 --data-binary 的帖子,以便在发生警报时将状态写入特定的涌入系列。写作涌入帖子:
更多关于写入涌入:https ://influxdb.com/docs/v0.9/guides/writing_data.html
提前致谢
bosun - 如何在 Bosun 中处理 NaN?
我有 2 个指标,并试图找出它们之间平均值的百分比差异,100*(m1+m2)/m1
但这显然会产生NaN
如果m1
变为零。
如果我不想在指标变为零时发出警报,我应该如何处理这种情况?
http - http post 通知未发送到服务器
当我使用 bosun 的 UI 在客户端 vm 上的 cpu 使用率很高时,我正在尝试从 bosun(使用 docker 映像)获取警报通知,它显示了危急情况但不发送通知,还找到了调试配置文件的方法。我的配置文件包含 -
我的日志文件“./var/log/supervisor/bosun-stderr---supervisor-nhXZKo.log”包含 -
和我在本地运行的服务器文件包含-
bosun - 未收到警报但确认仪表板工作上的警报
我一直试图让 Bosun 工作,但收效甚微。这是我的问题:
1) 我可以看到我的仪表板中出现的警报,但警报永远不会通过我选择的通知模式,无论是电子邮件、slack 还是 json。
2)当我在仪表板上确认警报时,只会收到来自通知链(第一个)的一个通知。即如果我设置{email -> slack -> json},只会收到电子邮件通知,没有slack和json。
任何帮助将不胜感激。下面是我的 dev.config
bosun - 如何为 Bosun 的世界时钟指定时区?
我应该如何在 Bosun 配置中为字时钟指定时区?
我认为有一些参数,但我在文档中找不到参考。
bosun - Bosun:如何使用 ungroup 处理空数集?
我正在尝试设置 Bosun 和 Graphite 以警告错误率,这些错误率是从两个不同的来源编译的:API 流量和 Web 应用程序流量。这是我现在拥有的:
我们的计数器在非零之前不存在于石墨中,因此对于我们的预生产环境,上述失败并出现以下情况:
当我在表达式浏览器中查看时,graphite(...)
调用按预期返回一个空集,但结果不avg(graphite(...))
显示任何内容。
有谁知道如何处理这个?