2

在我当前的项目中,我们编写了一些 map reduce 作业,在某些情况下,这些作业可以在相关数据更改时计算出来。

我很好奇在执行聚合计算的最便宜时间方面是否有一些公认的经验法则。

我可能会这样开始:

  1. 如果您别无选择,只能传递所有记录,并且数据经常更改,则将其推迟到批处理。
  2. 对于整体计算成本高但易于增加的东西,您应该在写入时增加。
4

0 回答 0