我已经建立了一个推荐系统,它根据一组加权指标推荐与一个项目相似的前 10 个项目。现在可以做的就是选择一个项目,系统会显示与所选项目相似的前 10 个项目。我对可用于评估此类系统的评估技术感到困惑。在没有用户参与的情况下,Precision/recall 估计是否有意义?任何有关此类系统评估技术的指针将不胜感激。
问问题
608 次
1 回答
0
为了评估精度和召回率,您需要以某种方式获得某些输入的正确答案。在这种情况下,正确答案可能意味着最相似的项目,或 10 个相似项目的确切排序列表。然后,您可以将算法的输出与正确答案进行比较。鉴于这些信息,您还需要一种学习方法,即调整您的算法以更接近正确答案。当您使用真实用户运行系统时,也可以使用算法的此更新部分:如果您向真实用户显示 10 个相关项目并且用户选择其中之一,那么您应该更新权重,以便由用户下次排名更高。如果您对用户进行概要分析并对其进行聚类,这可能会更深入,因此来自不同类别的用户将不得不看到与给定项目相关的不同相关项目。
于 2013-02-19T16:21:34.223 回答