2

我有一个应用程序向 DataDog 发布具有多个标签的指标,我的 DataDog 代理有一条看起来像

histogram_percentiles: 90, 95, 99

因此,我的指标(我们称之为ResponseTime)在 DataDog 查看器中针对每个指标(即)都有一个指标ResponseTime.90perentile

但是,如果您仔细查看此指标,它似乎是在短范围内(不确定是什么)和存在的每个标签元组计算这些百分位数。

理想情况下,我希望得到的是ResponseTime所有标签中指标的 95%(也许我将其过滤为 1 或 2 并有几个不同的图表),但在过去一周左右。是否有捷径可寻?

4

2 回答 2

3

但是,如果您仔细查看此指标,它似乎是在短范围内(不确定是什么)和存在的每个标签元组计算这些百分位数。

您注意到的短范围实际上是默认为 10 秒的刷新间隔。根据datadog关于直方图度量的这篇文章,

它聚合在刷新间隔期间发送的值(通常默认为 10 秒)。因此,如果您在刷新间隔期间为某个指标发送 20 个值,它将为您提供刷新间隔的这些值的聚合

对于您的查询 -

理想情况下,我想要得到的是 ResponseTime 指标在所有标签上的第 95 个百分位(也许我将其过滤 1 或 2 并有几个不同的图表),但在过去一周左右。是否有捷径可寻?

根据我对 datadog 文档的阅读,目前没有办法完成这项工作。与 datadog 支持检查这可能是一个好主意。

更多细节在这里

于 2018-04-13T13:34:59.417 回答
0

Datadog 现在支持在Datadog 服务器端而不是在代理端(如直方图)的闪存间隔聚合数据的分布度量类型。这允许在任何时间段内计算真正的 p95 等。

开始发出分布指标后,您需要在“指标摘要”页面上启用指标的百分位数:

指标汇总百分位选择

然后您应该能够在图形编辑器上看到百分位数:

带百分位数的图形编辑器

如果您将指标从直方图更改为分布指标,您还需要为指标使用新名称。

于 2021-11-16T19:32:50.020 回答