我正在尝试为以下情况构建警报:如果 FailedRequest 的数量大于收到的请求的 99%,我想在 15 分钟内发出警报。我写了一个 KQL 查询,但不幸的是,即使没有发生真正的问题,它也会触发,即没有真正得到大于 99% 的条件。以下是查询,我确定我在其中犯了一些愚蠢的错误,有什么帮助吗?
修复上述查询的任何帮助,因此它仅在关键时才真正给出结果,即当收到的所有请求都失败时。
requests
| where cloud_RoleName == 'ABCDEF_cloudRName' and resultCode != '404'
| summarize FailedPercent=((countif(success == false))/count() by timestamp, cloud_RoleName, appName)*100
| where FailedPercent > 99
| project RelatedCI='XYZZZ',AlarmTime=timestamp,Category="Cloud-Azure-Monitor",SubCategory="Application",Object=appName ,"Value of Metric","Percentage Failed Requests"," is ", FailedPercent