hadoop - 如何在 Map/Reduce 函数中提取数据？

Question

新的 API 支持“推”和“拉”两种迭代方式。在这两个 API 中，键值记录对被推送到映射器，但此外，新的 API 允许映射器从 map() 方法中提取记录。减速机也是如此。“拉”式如何有用的一个例子是批量处理记录，而不是一个一个地处理记录。

有人在 Map/Reduce 函数中提取数据吗？我对相同的 API 或示例感兴趣。

score 5 · Accepted Answer

我发布了一个查询@mapreduce-user@hadoop.apache.org 并得到了答案。

可以通过调用nextKeyValue()从传递给映射的上下文对象中检索下一个键值对。因此，您将能够在新 API 中从中提取下一个数据。

在这种情况下，pull 的性能是否比 push 更好？另外，在哪些场景下拉取有用？

1 回答 1