这是一个关于考虑不同参数的数据标准化的问题。
我在一个网站上有一组文章。用户使用评分系统对文章进行评分,从 1 星到 5 星。1 星表示不好的文章,并将文章标记为“不好”。2 星给出“平均”评级。3,4 和 5 星评价“好”、“非常好”和“优秀”。
我想在 [0 - 2] 范围内标准化这些评级。标准化值将代表一个分数,并将用作在文章列表中向上或向下提升文章的因素。具有 2 星或更少星的文章应获得 [0-1] 范围内的分数,因此此提升因子将产生负面影响。评分为 2 星或更多星的文章应获得 [1-2] 范围内的分数,因此该提升因子将具有正提升。
例如,一篇拥有 3.6 星的文章将获得 1.4 的提升因子。这将在文章列表中提升文章。一篇 1.9 星的文章将获得 0.8 分。这个分数将使文章在列表中进一步下降。一篇有 2 星的文章将获得 1 的提升因子 - 没有提升。
此外,我想考虑每篇文章的投票数。一篇单票 3 星的文章排名必须低于 4 票和 2.8 星的平均排名。(升压因子可以分别为 1.2 和 1.3)