2

这是一个错误还是 NewsKMeansClustering.java 中的设置,这是 Mahout-in-Action 第 9 章中给出的示例代码?我正在针对序列文件的目录运行该程序。输出错误信息如下:

线程“main”java.io.FileNotFoundException 中的异常:文件 newsClusters/clustersclusteredPoints/part-m-00000 不存在。在 org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:361) 在 org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:245) 在 org.apache.hadoop.fs.FileSystem.getLength (FileSystem.java:676) 在 org.apache.hadoop.io.SequenceFile$Reader.(SequenceFile.java:1417) 在 org.apache.hadoop.io.SequenceFile$Reader.(SequenceFile.java:1412) 在 mia。 clustering.ch09.NewsKMeansClustering.main(NewsKMeansClustering.java:76)

我的开发环境的目录结构也如下所示:

~/workspaceMahout1/recommender/newsClusters% ls canopy-centroids clusters df-count dictionary.file-0 frequency.file-0 tfidf-vectors tf-vectors tokenized-documents wordcount ~/workspaceMahout1/recommender/newsClusters/clusters/clusteredPoints% ls part -m-00000

之后,我将原始代码更改为

new Path(clusterOutput+Cluster.CLUSTERED_POINTS_DIR +”/part-m-00000”), conf);

new Path(clusterOutput+”/clusteredPoints”+”/part-m-00000”), conf);

该程序可以通过而不给出上述错误消息。我想知道是原始代码中的错误还是还有其他隐藏的问题?

4

0 回答 0