我已经安装并启动了 hadoop 并运行以下命令
mahout seqdirectory -c UTF-8 -i Input_files -o seqfiles
mahout seq2sparse -i seqfiles/ -o vectorfiles/ -ow
mahout kmeans -i vectorfiles/tf-vectors/ -c initial-clusters -o kmeans-clusters -dm org.apache.mahout.common.distance.SquaredEuclideanDistanceMeasure -cd 1.0 -k 20 -x 20 -cl
mahout clusterdump -dt sequencefile -d vectorfiles/dictionary.file-0 -i kmeans-clusters/clusters-1-final -o result.txt -b 10 -n 10
当我打开我的 result.txt 它给了我
VL-1{n=2 c= all:1.00
Top Terms:
下面是我的文本示例文本文件
John is working in London
请建议我如何为我的示例文本文件获取集群