我使用了 mahout (v 0.9) 的推荐项和参数
--input /usr_pref.csv --numRecommendations 10 --output /out/ --tempDir /temp1/ --similarityClassname SIMILARITY_PEARSON_CORRELATION
在检查结果时,我发现它向用户推荐了他已经评价过的项目。为什么会发生这样的事情?
感谢您的时间。
根据要求,这里是建议的片段:
34175 [89005462:1.7624004,89017464:0.11477072,89011967:0.11375865,89007606:0.113421306,14103126:0.11096669,89002502:0.10888276,14103124:0.106607914,89011035:0.10636083,40111014:0.104254685,89016109:0.104254685]
以及用户偏好中的相应行:
34175,89005462,0.07596562
我已经在 Dropbox 中上传了这两个文件。建议:https ://www.dropbox.com/s/uapzq0926y7427p/outusrpref_final 用户偏好:https ://www.dropbox.com/s/6nru9799udgrzl8/usr_pref_final.csv
更新考虑到我的问题与我的评级范围有关,我将它们乘以 100,然后将它们截断为两位小数。运行推荐器后,我发现没有重复项。我仍然不明白为什么会这样。