是否有一种智能方法可以找出您需要从用户那里获得的最低评分数才能开始推荐项目(准确)。
比如,在我开始向你推荐任何东西之前,先给“x”个项目打分。您如何根据数据集找出“x”?
是否有一种智能方法可以找出您需要从用户那里获得的最低评分数才能开始推荐项目(准确)。
比如,在我开始向你推荐任何东西之前,先给“x”个项目打分。您如何根据数据集找出“x”?
一般的想法是保留来自 N 个用户的所有数据,每个用户至少有一些中等数量的评分 M。然后为每个用户添加 1 个评分,并为每个用户进行推荐。评估建议的质量;您可以手动完成,或评估一些指标,如平均精度/nDCG/AUC。
然后从每个用户添加另一个评分并重复。您应该会发现质量会随着时间的推移而提高,但每次评分都会降低。然后你就选择你的权衡——你什么时候判断等待另一个评级值得预期的质量提升?
没有一个正确的答案。但是,如果您的用例和算法使得答案超过 4,我会感到惊讶。
在了解用户配置文件中实际应该有多少项目以获得“令人满意的”推荐性能方面已经完成了一些工作。发现一般10是个好数字
http://wanlab.poly.edu/recsys12/recsys/p27.pdf
您可以查看该论文以回答您将遇到的任何具体问题,但水平较高。用户个人资料中有 8 - 20 个(首选 10 个)项目来推荐电影风格的推荐。他们进行了典型的离线(模拟)和在线(基于用户)研究以确定该数字。