问题是 :
一组 5 位独立用户被要求对提供给他们的 50 种产品进行评分。所有 50 种产品都会在某个时间点被用户使用。一些用户对某些产品有更多的偏见。一位用户没有真正完成调查并给出了随机值。用户不必对所有产品进行评分。现在给定一个 4 个样本数据集,根据评级对产品进行排名
datset :
product #user1 #user2 #user3 #user4 #user5
0 29 - 10 90 12
1 - - - - 7
2 - - 95 6 1
3 - - - - 2
4 - - - - 50
5 - 35 21 13 -
6 - - - - 5
7 4 - - 30 -
8 11 - - - 14
.
.
.
如何对产品进行排名。
这是一个非常接近原始问题的重构问题。
解决方案:我尝试使用 PCA 清理数据并填充缺失值并应用 NMF,但我不确定解决方案。
任何帮助将不胜感激