我希望有人纠正我对 VADER 如何对文本进行评分的理解。我在这里阅读了这个过程的解释,但是在重新创建它描述的过程时,我无法将测试句子的复合分数与 Vader 的输出相匹配。假设我们有这句话:
"I like using VADER, its a fun tool to use"
VADER 选择的词是“喜欢”(+1.5 分)和“有趣”(+2.3)。根据文档,将这些值相加(因此 +3.8),然后使用以下函数将其归一化为 0 到 1 之间的范围:
(alpha = 15)
x / x2 + alpha
根据我们的数字,这应该变成:
3.8 / 14.44 + 15 = 0.1290
然而,VADER 会输出返回的复合分数,如下所示:
Scores: {'neg': 0.0, 'neu': 0.508, 'pos': 0.492, 'compound': 0.7003}
我的推理哪里出错了?类似的问题已被多次提出,但尚未提供 VADER 分类的实际示例。任何帮助,将不胜感激。