7

我需要一个积极和消极的单词列表,并根据它们的强度和周数分配给单词的权重。我有 :

1.) WordNet - 它为每个单词提供 + 或 - 分数。

2.) SentiWordNet - 在 [0,1] 范围内给出正值和负值。

我用几句话检查了这些,

爱 - wordNet 对名词和动词都给出 0.0,我不知道为什么我认为它至少在某些因素上应该是积极的。

repress - wordNet 给出 -9.93
- SentiWordNet 给出 - pos 和 neg 的 0.0。(应该是负数)

休息 - wordNet - 2.488
- SentiWordNet - { pos - 0.125, neg - 0.5 } (应该是积极的)

我需要一些帮助来决定使用哪一个。

谢谢。

4

3 回答 3

3

通常程度和/或极性可能取决于领域和/或上下文,因此仅凭这个词并不足以做出决定。

如果您有一些带注释的数据,我建议使用这两种资源提供的分数作为特征来训练分类器。如果您不这样做,一种选择是使用与相关域匹配的可用情感注释语料库之一。在没有任何数据的情况下,整个任务变得有些棘手,尽管有大量关于情绪分类的无监督方法的工作,我相信,请参阅,例如无监督情绪分析

于 2012-10-15T10:05:03.567 回答
1

SentiWordNet有一个界面可以给出不同的意见,如果你认为他们是错误的: http ://sentiwordnet.isti.cnr.it/search.php?q=repose

我下载了最新的 Wordnet 3.1,并检查了文件格式文档,并没有看到您提到的情绪数字的任何提及。它也没有显示在在线搜索中。

因此,出于这两个原因,我建议使用 SentiWordNet!

(我看到你的问题已经有一年了,所以也许你可以告诉我们你做了什么,为什么?)

于 2013-11-06T03:37:07.110 回答
0

极性的程度不仅取决于单词本身,还取决于句子或短语的上下文。所以,如果对同一个词有不同的结果,那是因为上下文的不同。

于 2014-08-30T23:55:36.180 回答