1

我正在尝试实现一个推荐系统 uisng Mahout 框架。由于我没有 Linux 机器,我无法使用 Hadoop 处理大型矩阵。(在 Windows 上安装 Hadoop 的教程对我不起作用。)

我的用户具有三种类型的功能,每种类型包含 5 到 9 个功能。我想知道我是否可以将这些功能构建到一个 FileDataModel 中,或者我是否可以单独处理每组功能并将结果组合起来。

如果后一个有效,那么我需要从之前的处理结果中获取 UserId,以便为下一组功能创建一个新的 FileDataModel。可行吗?

在这里我仍然有一些我没有找到答案的问题,希望任何人都可以帮助:在没有Hadoop的Windows环境下,Mahout实际上可以处理多少功能?在一种算法投入生产后,我们需要多久重新优化一次系统?它会自动工作吗?谢谢。

4

1 回答 1

0

好吧..mahout 可以在没有 hadoop 的情况下运行,如果它没有找到 HADOOP_HOME env 变量集..另一方面..我不确定 mahout 是否可以立即在 Window 上运行,因为我没有找到任何 .bat 文件或 Windows conf ...如果你想在 Windows 上运行它们,你需要为 hadoop 和 mahout 安装 cygwin。

这与未设置 HADOOP_HOME 时 Pig 的工作方式非常相似。

于 2013-01-04T16:03:24.607 回答