1

我看到 org.apache.hadoop.mapred 和 org.apache.hadoop.mapreduce 都存在 map/reduce 类。我们应该使用什么,哪个更好?我看到 org.apache.hadoop.mapred 已被删除一次,但已被添加回来/

4

1 回答 1

1

org.apache.hadoop.mapred是来自遗留 hadoop 代码的包。org.apache.hadoop.mapreduce是 Hadoop 0.20.x 的新增功能。

在功能方面,旧的新 API 之间没有太大区别。唯一显着的区别是记录被推送到旧 API 中的映射器/归约器。而新的 API 同时支持拉/推机制。您可以在此处获得有关拉取机制的更多信息。

此外,旧的 API 已被弃用。您可以在此处找到有关新 API 的更多信息。请注意,并非所有内容都从迁移mapredmapreduce. 尽可能尝试使用新的 API。

于 2013-06-01T08:51:03.357 回答