文档级和句子级分析的最佳词典是什么?我目前正在使用 Vader 进行句子级别的分析,但是我担心当我转到文档级别时,Vader 的性能可能不如其他人。
与此处的帖子类似的问题,但更具体。
文档级和句子级分析的最佳词典是什么?我目前正在使用 Vader 进行句子级别的分析,但是我担心当我转到文档级别时,Vader 的性能可能不如其他人。
与此处的帖子类似的问题,但更具体。
除了链接帖子中列出的情感词典外,我还可以推荐一个芬兰情感词典。
对于情感分析,仅依赖词汇可能不是最好的解决方案,尤其是在文档级别。语言是如此灵活,以至于除了充满情感的词汇之外,它的属性和概念对语义有很大的影响。
一些核心概念是对比语篇标记(尤其是文档级别)、否定和情态。
文档中的意见既有优点也有缺点,我们通过“但是”、“尽管如此”等标记将它们联系起来,以传达意义或想法。对于词袋方法,下面的句子被视为相同,但是如果人们用一个标签来注释他们的情绪,他们可能不会用相同的标签来注释它们:
The laptop has amazing features, but its screen is killing me.
The laptop's screen is killing me, but it has amazing features.
一般来说,我们用“但是”之后的子句的情感来评估这类句子或段落。其他的话语标记也有自己的语义。这是在一个称为话语分析的区域中进行检查的。
这些概念也改变了语义。因此,这两个级别都不能忽视它们。有研究和论文使用带有情感词汇的否定和情态触发。你可以用谷歌搜索“情绪分析的否定和模态”,看看你能做什么。
最后我可以建议的是,如果你有一个特定领域的数据集,你可以使用远程监督来构建自己的词典。
希望这可以帮助,
干杯