假设用户以 1 到 5 的比例为某些电影投票。这些电影具有流派信息,而一部电影可以有多个流派。像这样:
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
我们想了解我们的用户喜欢哪种类型。这里我们有我们的结果集:
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
显然,我们无法用这么小的结果集预测任何东西,但让我们假设我们有一个更大的数据集。
使用这些数据,我们如何对该用户最喜欢的类型进行排序?简单地计算加权平均值或更复杂的东西?