我已经使用 10M movielens 数据集尝试了基于项目的分布式推荐作业。一切正常。我的问题是,在查看针对用户的推荐时,我发现在推荐项目列表中,有些项目已经被用户评分。更加具体:
假设用户 ID:4 的用户观看了以下 ID 的电影:[123,543,234,567,324],然后在推荐列表中再次出现 543 和 234。我只是查看 Mahout in Action 以了解该算法,我找不到在生成 TopK 列表之前消除已评级项目的代码段。我错过了什么,还是它推荐已经评分的项目是正常的?
如果正常,是否可以从候选项目中消除这些项目?
PS:在产生推荐后过滤掉推荐对我的情况来说效率不高,因为我想要的推荐数量是 100,在过滤某些用户后,这个数字会减少到 30 等等。
提前致谢。