0

考虑以下形式的原始事件(德鲁伊用语中的 alpha 集)timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2

通常在 Druid 中,数据可以根据一些规则加载到实时节点和历史节点中。这些规则似乎与时间范围有关。例如:

  • 在框 A 上加载最后一天的数据
  • 将上周(最后一天除外)加载到框 B
  • 将其余部分保存在深度存储中,但不要加载段。

相反,我想支持以下用例:

  • 加载框 A 上每个给定的最后一个事件compoundId。无论最后一个事件是今天还是昨天加载。

这可能吗?

或者,如果上述方法不可行,我认为可能可以作为一种解决方法来创建一个 betaset(最佳粒度级别如下):

给定一个具有上述模式的 alphaset,创建一个 betaset,以便:

  • 给定的所有事件都会compoundId汇总。
  • metric1metric2设置为上次发生(最大时间戳)事件的指标。

非常感谢任何建议。

4

1 回答 1

0

我相信第一个和最后一个聚合器是您正在寻找的。

于 2017-02-09T17:59:29.247 回答