我在这里看到了一些机器学习问题,所以我想我会发布一个相关问题:
假设我有一个数据集,其中运动员参加 10 公里和 20 公里的丘陵路线跑步比赛,即每场比赛都有自己的难度。
对于每场比赛,用户的完成时间几乎呈逆正态分布。
可以将这个问题写成矩阵:
Comp1 Comp2 Comp3
User1 20min ?? 10min
User2 25min 20min 12min
User3 30min 25min ??
User4 30min ?? ??
我想完成上面的矩阵,其大小为 1000x20,稀疏度为 8%(!)。
应该有一个非常简单的方法来完成这个矩阵,因为我可以计算每个用户的参数(能力)和每个比赛的参数(mu,分布的 lambda)。而且比赛之间的相关性非常高。
我可以利用排名 User1 < User2 < User3 和 Item3 << Item2 < Item1
您能否给我一个提示,我可以使用哪些方法?