0

我正在使用带有 SentimentAnalysis 包的 General Inquirer 字典,但我无法弄清楚他们如何分配情绪分数......

例如,如果我运行以下代码:

sentiment <- analyzeSentiment(sampledf)

summary(sentiment$SentimentGI)

我会得到这样的输出:

Min.      1st Qu.   Median     Mean      3rd Qu.     Max. 

-0.80000  -0.16667  -0.07692   -0.07313  0.00000     0.66667

这里使用的秤是什么?-1比1?我不知道如何解释这些结果。

谢谢!

4

1 回答 1

1

所有与情绪相关的分数都是根据公式计算的

(#positive - #negative) / #all

其中#positive指的是正面词#negative的数量,负面词的数量和#all总字数。因此,情绪得分来自区间 [-1, +1]。的值0表示文档中的肯定词与否定词一样多。

注意:在实践中,经验均值/中值不一定正好位于零,因为正/负中的任何一个都被认为更强,甚至看起来更频繁。因此,人们宁愿选择不同的截止点来区分正面和负面。

其他分数如下:

  • 消极或积极只分别计算消极或积极词的比率。因此,该值由 eg 给出#negative / #all并且在 [0, 1] 中。
  • 极性使用公式(#positive - #negative) / (#positive + #negative)
  • 比率是字典表达式的份额,即(#positive + #negative) / #all
于 2018-08-21T19:15:21.560 回答