0

我的所有主机上都运行着 dnsmasq,并且想监控它何时出现故障并分别通知每个主机。到目前为止,我没有任何运气能够做到这一点。任何帮助表示赞赏。

var db = 'telegraf'

var rp = 'autogen'

var measurement = 'procstat'

var groupBy = []

var whereFilter = lambda: ("process_name" == 'dnsmasq')

var period = 1m

var name = 'Dnsmasq Deadman'

var idVar = name + ':{{.Group}}'

var message = 'Dnsmasq not responding. {{.Time}} Restarting dnsmasq. {{ index .Tags "host"}}'

var idTag = 'alertID'

var levelTag = 'level'

var messageField = 'message'

var durationField = 'duration'
4

1 回答 1

1

将您的 group by 变量更改为 var groupBy = ['host']

AFAIK,您需要按要在警报中使用的标签或字段进行分组。

于 2017-11-27T12:01:56.533 回答