规范化评论的最佳方法是什么?IE 假设我们有用户可以从 1-5 星投票的产品。
简单地取平均值并不是一个好方法,因为它没有考虑到评论的数量。
例如,如果一个产品只有一个 5 星的评论,它不应该领先于一个有 10000 条评论的产品,因为只有一个评论给了它 5 星。
本质上,我如何根据评论数量标准化分数?
规范化评论的最佳方法是什么?IE 假设我们有用户可以从 1-5 星投票的产品。
简单地取平均值并不是一个好方法,因为它没有考虑到评论的数量。
例如,如果一个产品只有一个 5 星的评论,它不应该领先于一个有 10000 条评论的产品,因为只有一个评论给了它 5 星。
本质上,我如何根据评论数量标准化分数?
如果我的回答看起来很疯狂,我很抱歉。但是当我第一次看到你的问题时,我想到了以下答案。
计算 Top Rated 250 Titles 的公式给出了真正的贝叶斯估计:
weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
在哪里:
R =电影的平均值(平均值)=(评分)
v =电影的票数=(票数)
m = 进入前 250 名所需的最低票数(目前为 3000)
C = 整个报告的平均投票数(目前为 6.9)
(这就是 IMDB 根据用户评论和投票对他们的顶级电影进行排名的方式。下面是我获得上述段落的页面的链接:http ://www.imdb.com/chart/top 。)