我正在训练 mahout 分类器。我是否需要对我的训练数据进行词干提取、小写和停止词删除,否则 mahout 会在训练过程中处理这些问题。下面的命令我用于培训。
$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs
我正在训练 mahout 分类器。我是否需要对我的训练数据进行词干提取、小写和停止词删除,否则 mahout 会在训练过程中处理这些问题。下面的命令我用于培训。
$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs