0

我是 Hadoop 和 Mahout 的新手。首先,我运行了 Mahout 提供的贝叶斯分类器的简单示例。我想获得贝叶斯训练输入数据集,所以我运行了以下命令:

mahout org.apache.mahout.classifier.bayes.PrepareTwentyNewsgroups

-p /Examples/20news-bydate-train

-o /示例/贝叶斯训练输入

-a org.apache.mahout.vectorizer.DefaultAnalyzer

-c UTF-8

但结果是

在此处输入图像描述

我怎么解决这个问题?

4

3 回答 3

1

从 Mahout 0.6 版开始,PrepareTwentyNewsgroups、trainclassifier、testclassifier 等 CLI API 已弃用,您可以从 examples/bin 目录运行一些 shell 脚本示例,例如运行 examples/bin/classify-20newsgroups.sh。

此问题的一种可能解决方案是退回到版本 0.6。

于 2014-02-02T13:10:41.020 回答
0

如其所写:

 MAHOUT_LOCAL is not set

因此无法找到PrepareTwentyNewsGroups课程。根据您的系统,设置环境变量 MAHOUT_LOCAL,例如:

  MAHOUT_LOCAL=/usr/local/lib/mahout
  export MAHOUT_LOCAL

(将这些行放入您的 .bash_profile 文件中,或者只是放入您的 shell 中以尝试它是否正常工作)

于 2013-01-23T09:33:18.577 回答
0

实际上,根据http://svn.apache.org/repos/asf/mahout/trunk/bin/mahout

MAHOUT_LOCAL :设置为空字符串以外的任何内容以强制 mahout 在本地运行,即使设置了 HADOOP_CONF_DIR 和 HADOOP_HOME

如果你想在本地运行 mahout,你只需要设置 MAHOUT_LOCAL。如果要在 hadoop 集群上运行它,只需设置 HADOOP_HOME 和 HADOOP_CONF_DIR。

于 2013-12-23T13:23:01.420 回答