Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想在 Hadoop 中做一个 mapreduce 工作,在 MongoDB 中获取并保存结果,这要归功于 mongo-hadoop 连接器。有一种方法可以像在 MongoDB 中那样在 hadoop 中执行增量 mapreduce?
如果结果集中和旧集合中的给定键存在文档,则将对这两个值执行归约操作(使用指定的归约函数),并将结果写入输出集合。
不要告诉我使用 MongoDB 的 MapReduce,因为它的性能很尴尬。
我们目前在 Mongo-Hadoop 中不支持这种增量作业。它可能会在未来的版本中得到支持。