根据Hadoop:权威指南。
新的 API 支持“推”和“拉”两种迭代方式。在这两个 API 中,键值记录对被推送到映射器,但此外,新的 API 允许映射器从 map() 方法中提取记录。减速机也是如此。“拉”式如何有用的一个例子是批量处理记录,而不是一个一个地处理记录。
有人在 Map/Reduce 函数中提取数据吗?我对相同的 API 或示例感兴趣。
根据Hadoop:权威指南。
新的 API 支持“推”和“拉”两种迭代方式。在这两个 API 中,键值记录对被推送到映射器,但此外,新的 API 允许映射器从 map() 方法中提取记录。减速机也是如此。“拉”式如何有用的一个例子是批量处理记录,而不是一个一个地处理记录。
有人在 Map/Reduce 函数中提取数据吗?我对相同的 API 或示例感兴趣。
我发布了一个查询@mapreduce-user@hadoop.apache.org 并得到了答案。
可以通过调用nextKeyValue()从传递给映射的上下文对象中检索下一个键值对。因此,您将能够在新 API 中从中提取下一个数据。
在这种情况下,pull 的性能是否比 push 更好?另外,在哪些场景下拉取有用?