我正在尝试使用 mahout、hadoop 和 java 构建推荐引擎。这是我第一次使用 hadoop,我从已经安装了 hadoop 的服务器获取我的数据集,这是一个 linux 环境。我的开发环境是windows,现在需要在我的开发环境还是服务器上安装mahout?如果我的开发环境需要 mahout,是否还需要在其中安装 hadoop?
问问题
295 次
如果您的机器上没有 Hadoop,Mahout 将在当前机器上以伪分布式模式运行。
尽管如此,Windows 和 Hadoop 并不真正相互喜欢,并且根据您的 Mahout 版本(更具体地说,它具有的 Hadoop 依赖项),您很可能会遇到这个问题(链接)。该问题从 Hadoop 0.20.204 开始出现(尽管我必须承认我不知道它是否已在最新版本的 Hadoop 上修复)