Hadoop MapReduce 中是否可以使用以下架构?
使用分布式键值存储(HBase)。因此,除了值之外,还会有一个与值相关联的时间戳。Map & Reduce 任务是迭代执行的。Map,在每次迭代中都应该接受在上一次迭代中添加到存储中的值(也许是具有最新时间戳的那些?)。Reduce 应该接收 Map 的输出以及来自 store 中其键与 reduce 必须在当前迭代中处理的键匹配的对。reduce 的输出到 store。
如果可能,哪些类(例如:InputFormat、Reduce 的 run())应该被扩展,以便代替常规操作发生上述操作。如果这是不可能的,是否有任何替代方法可以实现相同的目标?