每次出现问题时,我都会查看 Loki 和/或 Kibana 中的错误日志集群,为了找出问题所在,我必须查看请求。所以我复制了traceId
(携带给定请求的所有日志的id),删除kibana/loki中的“仅搜索错误”条件,并找到导致错误的请求。
现在,请求可能没有任何问题,在这种情况下,我要么断定这是一个瞬态/网络/硬件问题,要么只是为了确保我必须重复这个过程traceIds
。
我的问题是,有没有办法查询所有具有traceId
标记错误日志的请求?(换句话说,查询所有以错误结束的请求)。这对于诊断中断或找出哪个请求特别破坏了我们的系统非常有帮助。