2

所以我们有一个应用程序,其中 http 端点触发异步作业完成。作业的开始会创建一个作业 id,所有的方法和东西都使用它来进行关联。我们正在尝试使用计时器来计时在作业运行序列中将 http 下载到第三方。因此,在我们的方法中,我们使用注册表创建了一个新计时器,并将作业 ID 作为标记。其余内容与文档中提到的相同,我们使用可调用对象的包装并完成我们的工作。数据被导出到新的遗物。

一旦工作完成,数据就会在新的遗物和普罗米修斯及其权利中可见。但我发现一段时间后计时器值重置为零。所以像 95% 和 avg 和 99% 这样的百分位值在 prometheus 和 new relic 中都变为零。我意识到千分尺会清除这些值,因为它希望仪表对应用程序更具全局性,并且每个 http 请求或作业都会运行以更新相同的仪表。但在我们的情况下,它不是那样的。我们想在单个作业运行中进行统计,以便我们可以看到新遗迹和所有的统计和事件。

这是不可能的微米还是我做错了什么?

4

1 回答 1

0

我认为您正在寻找像Zipkin这样的分布式跟踪系统,而不是指标收集系统。Zipkin 等围绕理解特定请求中子系统的延迟贡献进行了优化。

在此处查看有关指标和跟踪之间区别的更多信息。

请注意,Prometheus 规范本身需要衰减的分位数值。

于 2018-05-16T19:22:21.593 回答