-1

我读过 Mahout 是在 Hadoop 上开发的,我们可以在有或没有 Hadoop 的情况下使用 Mahout。说 Mahout 算法可以在 Hadoop 上运行是什么意思?Mahout 算法不是以 Map-Reduce 形式编写的,对吗?你能举个例子给我解释一下吗?

谢谢!

4

2 回答 2

3

Did you look at the source code? The algorithms are implemented as Map/Reduce jobs (not all, but much of it), which is exactly why this statement is made.

于 2013-05-29T08:34:18.597 回答
0

Mahout 有非分布式和分布式两个版本。有一些基本的分布式(Hadoop)实现可用,例如基于项目的协作过滤。默认分发的限制是,如果您的评分数据具有用户 ID 和项目 ID 作为字母数字,那么您将需要对其进行自定义。

如果你想实现一些自定义算法,那么你将不得不编写 Mapper 和 Reducers,甚至是调用它们的代码。

我已经覆盖了 org.apache.mahout.cf.taste.hadoop.item.RecommenderJob 以使用我的自定义 Map 和 Reduce 任务。

如果我错了,请大家纠正我。

于 2013-05-30T05:48:17.090 回答