我创建了一个以这种方式工作的推荐系统:
- 每个用户选择一些过滤器,并根据这些过滤器生成一个分数
- 每个用户都使用基于这些分数的 k-means 进行聚类
- 每当用户收到建议时,我都会使用 pearson 的相关性来查看哪个用户与同一集群中的其他用户具有最佳相关性
我的问题是我不确定评估这个系统的最佳方法是什么?我已经看到一种方法是隐藏数据集的一些值,但对我来说并非如此,因为我没有预测分数。
有什么指标或我可以使用的东西吗?
我创建了一个以这种方式工作的推荐系统:
- 每个用户选择一些过滤器,并根据这些过滤器生成一个分数
- 每个用户都使用基于这些分数的 k-means 进行聚类
- 每当用户收到建议时,我都会使用 pearson 的相关性来查看哪个用户与同一集群中的其他用户具有最佳相关性
我的问题是我不确定评估这个系统的最佳方法是什么?我已经看到一种方法是隐藏数据集的一些值,但对我来说并非如此,因为我没有预测分数。
有什么指标或我可以使用的东西吗?