1

所以这是我的挑战。我有一个如下所示的电子表格:

prod_id | pack  | value | durable | feat | ease | grade  | # of ratings
1         75      85      99        90     90     88       1
2         90      95      81        86     87     88       9
3         87      86      80        85     82     84       37
4         92      80      68        67     45     70       5
5         93      81      94        93     90     90       4
6         93      70      60        60     70     70       1

每个产品都有单独的等级标准(包装 - 易用性)、总体平均等级和产品收到的评级数量。

我拥有的整个数据集将 68% 的产品置于 80-89 级范围内。我需要重新计算评分以考虑产品的评分数量,因此远低于平均评分总数的产品排名较低(并获得较低的评分)。基本上,等级为 84 和 100 的产品的排名应该高于等级为 95 且只有 5 个等级的产品。

我希望这是有道理的,提前感谢您的帮助!

4

2 回答 2

1

没有计算器我无法准确判断,但它看起来像

Grade = AVG(pack, value, durable, feat, ease)

如果是这种情况,那么您只需定义“远低于总平均评分数”。我将权衡与平均值的标准差 - 这可能是也可能不是一个体面的算法(我不是统计学家)。但是,这意味着任何评分恰好是平均值 = 1,并且您从那里得到 +/-。

WeightedGrade = Grade * ABS((Rating - AVG(H:H)) / STDEV(H:H))
于 2009-05-01T22:54:12.150 回答
1

您需要的是一种有意义的加权算法。您可以选择任何对您有意义的东西,但首先要根据您的要求尝试将原始等级乘以权重因子。计算作为评分数除以总评分数的比率给出的答案:

prod id raw grade   # ratings   weight          weighted grade
1         88          1           0.01754386      1.543859649 
2         88          9           0.157894737     13.89473684
3         84          37          0.649122807     54.52631579
4         70          5           0.087719298     6.140350877
5         90          4           0.070175439     6.315789474
6         70          1           0.01754386      1.228070175
                       57       

不确定这是否对您的问题有意义,但它确实满足您的要求。也许您可以将加权成绩标准化,因此 prod id # 3 为 100,然后再按比例缩放其余部分。

查看“集体智能”以了解其他一些想法。

于 2009-05-01T22:55:20.900 回答