我正在使用 Mahout 的 ItemSimilarityJob 来计算项目与输入 .csv 文件的相似性,如下所示:
user_id(numbers only), song_id(numbers only), listens(numbers only)
当我使用这些参数运行 ItemSimilarityJob
$MAHOUT_HOME/bin/mahout org.apache.mahout.cf.taste.hadoop.similarity.item.ItemSimilarityJob --input inputcsv/ --output outputcsv --similarityClassname SIMILARITY_PEARSON_CORRELATION --tempDir tempcsv --booleanData true
我在 music/csvoutput 目录中得到一个空白的 part-r-00000 文件。然而,music/csvtemp 中有很多文件。可能是什么原因?