hadoop - Mahout 基于 Hadoop 构建是什么意思？

Question

我读过 Mahout 是在 Hadoop 上开发的，我们可以在有或没有 Hadoop 的情况下使用 Mahout。说 Mahout 算法可以在 Hadoop 上运行是什么意思？Mahout 算法不是以 Map-Reduce 形式编写的，对吗？你能举个例子给我解释一下吗？

谢谢！

score 3 · Accepted Answer

Did you look at the source code? The algorithms are implemented as Map/Reduce jobs (not all, but much of it), which is exactly why this statement is made.

score 0 · Accepted Answer

Mahout 有非分布式和分布式两个版本。有一些基本的分布式（Hadoop）实现可用，例如基于项目的协作过滤。默认分发的限制是，如果您的评分数据具有用户 ID 和项目 ID 作为字母数字，那么您将需要对其进行自定义。

如果你想实现一些自定义算法，那么你将不得不编写 Mapper 和 Reducers，甚至是调用它们的代码。

我已经覆盖了 org.apache.mahout.cf.taste.hadoop.item.RecommenderJob 以使用我的自定义 Map 和 Reduce 任务。

如果我错了，请大家纠正我。

hadoop - Mahout 基于 Hadoop 构建是什么意思？

2 回答 2

Related

Reference