7

根据Hadoop:权威指南

新的 API 支持“推”和“拉”两种迭代方式。在这两个 API 中,键值记录对被推送到映射器,但此外,新的 API 允许映射器从 map() 方法中提取记录。减速机也是如此。“拉”式如何有用的一个例子是批量处理记录,而不是一个一个地处理记录。

有人在 Map/Reduce 函数中提取数据吗?我对相同的 API 或示例感兴趣。

4

1 回答 1

5

我发布了一个查询@mapreduce-user@hadoop.apache.org 并得到了答案。

可以通过调用nextKeyValue()从传递给映射的上下文对象中检索下一个键值对。因此,您将能够在新 API 中从中提取下一个数据。

在这种情况下,pull 的性能是否比 push 更好?另外,在哪些场景下拉取有用?

于 2011-09-26T13:10:37.267 回答