0

我正在尝试将文本文件转换为可以在其上运行 mahout kmeans 的序列文件。当我运行 seqdirectory 实用程序时,我没有收到任何错误,它表示程序已完成。但是,当我查看输出目录时,它是空的。我环顾四周,找不到任何解决方案。想法?

这是我在终端中运行的内容: hduser@ubuntu:~$ $MAHOUT_HOME/bin/mahout seqdirectory --input Downloads/google/ --output Downloads/sparsefiles/ -c UTF-8

这是我得到的输出:12/07/06 06:24:19 INFO driver.MahoutDriver:程序花费了 1091 毫秒(分钟:0.018183333333333333)

4

1 回答 1

1

我认为它可能会在 hdfs 上产生输出。尝试检查:

hadoop dfs -ls Downloads/sparsefiles/

此外,为了确保它在您的本地文件系统中生成,您可以修改以下命令:

$MAHOUT_HOME/bin/mahout seqdirectory --input file://<home path>/Downloads/google/ --output file://<home path>/Downloads/sparsefiles/ -c UTF-8
于 2012-09-05T18:29:15.707 回答