我有一个类似于:
{
id: 1,
pid: 1,
batch: 1,
count: 2,
}
{
id: 2,
pid: 1,
batch: 2,
count: 4,
}
{
id: 3,
pid: 1,
batch: 3,
count: 6,
}
我想编写一个 map-reduce 函数来返回最近批次和最早批次的计数之间的增量差异。
使用上面的数据,这将返回如下内容:
pid: 1, diff: 4
关于如何解决这个问题的任何想法?我正在使用 Mongo,但如果有一个有效的 Java/Hadoop 示例,我会很乐意接受它。