1

我们有实例集群,而每个实例都有 DropWizard 指标收集器。

我们还尝试利用 AppDynamics 自定义指标,这样自定义脚本会命中 DropWizard 公开的端点 (/metrics) 并将感兴趣的指标发送到 AppDynamics Controller。

AppDynamics 有 2 种集群部署策略,用于衡量指标在整个应用程序视图(层)中的显示方式 - SUM 和 AVG。

虽然这适用于计数(使用 sum)和平均处理时间(使用 avg)之类的东西 - 我们现在不知道如何聚合 DropWizard 公开的每个实例百分位数 - sum 和 avg 看起来都不正确。

例子:

instance1: p75=400
instance2: p75=600
instance3: p75=800

sum将给出 1700 当然根本没有用的东西。

avg将给出 600 - 这也不正确 - 我们正在失去对上限的跟踪。

如果 AppDynamics 有 MAX Cluster 推出——这或多或少是公平的——但仍然不正确。但 AppDynamics 没有。

我们也明白,收集集群百分位数的唯一完全正确的方法是在一个地方(例如 logstash 等)而不是在每个实例上执行来自所有节点的聚合。但现在这就是我们所拥有的 - 只是定期发送自定义指标。

如果有人对此提出建议,那就太好了。

提前致谢,

4

0 回答 0