1

文档级和句子级分析的最佳词典是什么?我目前正在使用 Vader 进行句子级别的分析,但是我担心当我转到文档级别时,Vader 的性能可能不如其他人。

与此处的帖子类似的问题,但更具体。

4

1 回答 1

1

除了链接帖子中列出的情感词典外,我还可以推荐一个芬兰情感词典。

对于情感分析,仅依赖词汇可能不是最好的解决方案,尤其是在文档级别。语言是如此灵活,以至于除了充满情感的词汇之外,它的属性和概念对语义有很大的影响。

一些核心概念是对比语篇标记(尤其是文档级别)、否定和情态。

  • 对比话语标记

文档中的意见既有优点也有缺点,我们通过“但是”、“尽管如此”等标记将它们联系起来,以传达意义或想法。对于词袋方法,下面的句子被视为相同,但是如果人们用一个标签来注释他们的情绪,他们可能不会用相同的标签来注释它们:

The laptop has amazing features, but its screen is killing me.
The laptop's screen is killing me, but it has amazing features.

一般来说,我们用“但是”之后的子句的情感来评估这类句子或段落。其他的话语标记也有自己的语义。这是在一个称为话语分析的区域中进行检查的。

  • 否定与情态

这些概念也改变了语义。因此,这两个级别都不能忽视它们。有研究和论文使用带有情感词汇的否定和情态触发。你可以用谷歌搜索“情绪分析的否定和模态”,看看你能做什么。

最后我可以建议的是,如果你有一个特定领域的数据集,你可以使用远程监督来构建自己的词典。

希望这可以帮助,

干杯

于 2018-07-26T05:52:36.413 回答