考虑以下形式的原始事件(德鲁伊用语中的 alpha 集)timestamp | compoundId | dimension 1 | dimension 2 | metric 1 | metric 2
通常在 Druid 中,数据可以根据一些规则加载到实时节点和历史节点中。这些规则似乎与时间范围有关。例如:
- 在框 A 上加载最后一天的数据
- 将上周(最后一天除外)加载到框 B
- 将其余部分保存在深度存储中,但不要加载段。
相反,我想支持以下用例:
- 加载框 A 上每个给定的最后一个事件
compoundId
。无论最后一个事件是今天还是昨天加载。
这可能吗?
或者,如果上述方法不可行,我认为可能可以作为一种解决方法来创建一个 betaset(最佳粒度级别如下):
给定一个具有上述模式的 alphaset,创建一个 betaset,以便:
- 给定的所有事件都会
compoundId
汇总。 metric1
并metric2
设置为上次发生(最大时间戳)事件的指标。
非常感谢任何建议。