5

我正在使用 FIFA 2020 数据集为足球运动员构建基于内容的 RecSys。在这种情况下,球员是“项目”,他们的得分(头球能力、运球技巧、位置得分等)是“评分”。我已经创建了余弦相似度矩阵来对每个玩家的相似度得分进行排名。我的模型只是为了做到这一点:对于任何给定的玩家,我的模型将显示前 5 个最相似的其他玩家。

我现在正处于评估模型的阶段,并且面临一些问题。在网上做了一些阅读后,我收集到我可能无法使用 RMSE 或 MAE 等统计测量。更合适的一种是 Precision and Recall(或更具体地说,Mean Average Precision MAP)。

问题是,所有这些评估指标都需要实际用户来验证(例如,实际上选择克里斯蒂亚诺·罗纳尔多作为与莱昂内尔·梅西相似的“正确”球员)。回到原始数据集,它不像电影评分/亚马逊商品的情况,其中商品实际上是由不同用户评分的——FIFA 2020 只是每个玩家的分数和属性的集合。因此,我无法“预测”另一个用户对另一个玩家的评分并以此为基础进行推荐。

因此,我想问一下是否有其他建议来评估我的模型,就推荐的类似玩家的“正确”程度而言?再一次,我的模型只是旨在显示任何给定玩家的前 5 个最相似的玩家。

4

0 回答 0