我正在创建几个指标的监控警报。
我在下面放了 2 个示例:1)数据流作业失败 2)防火墙规则更改或插入了新规则
从中创建基于日志的指标和警报很好。但它非常通用。如何确定特定细节,例如此数据流作业(作业名称)失败或此用户创建的数据流作业失败?防火墙规则也一样,我怎么知道哪条规则被更新了?
如何在警报消息本身中包含有问题的作业名称或精确定位资源?
对于我提供的示例,配置如下 -
防火墙更新指标是使用以下过滤器创建的:
resource.type="gce_firewall_rule" AND jsonPayload.event_subtype="compute.firewalls.patch" OR jsonPayload.event_subtype="compute.firewalls.insert"
对于数据流失败的作业,度量资源管理器中有可用的度量 - is_failed