7

似乎进行基本情感分析的最简单、最天真的方法是使用贝叶斯分类器(由我在 SO 上找到的内容证实)。有任何反驳或其他建议吗?

4

3 回答 3

11

具有词袋表示的贝叶斯分类器是最简单的统计方法。通过迁移到更高级的分类器和特征表示,您可以获得明显更好的结果,但代价是更复杂。

统计方法并不是镇上唯一的游戏。对文本结构有更多理解的基于规则的方法是另一个主要选择。据我所见,这些方法实际上不如统计方法好。

我推荐 Manning 和 Schütze 的《统计自然语言处理基础》第 16 章,文本分类。

于 2009-07-04T19:26:10.440 回答
5

我想不出一种更简单、更天真的方法来进行情感分析,但您可以考虑使用支持向量机而不是朴素贝叶斯(在某些机器学习工具包中,这可以作为替代品)。看看Bo Pang、Lillian Lee 和 Shivakumar Vaithyanathan 的“Thumbs up? Sentiment Classification using Machine Learning Techniques”,这是有关这些技术的最早论文之一,并提供了一系列相关技术的准确度结果表,其中没有一个比其他任何一个都更复杂(从客户的角度来看)。

于 2009-11-12T21:10:56.293 回答
1

基于上面肯提供的答案,还有另一篇论文

托尼和尼日尔的“使用具有多种信息源的支持向量机的情感分析”,

它着眼于分配更多的特征,而不仅仅是 Pang 和 Lee 使用的一袋词。在这里,他们利用 wordnet 来确定形容词的语义差异,以及情感与文本中主题的接近程度,作为 SVM 的附加功能。它们显示出比以前根据情绪对文本进行分类的尝试更好的结果。

于 2011-09-22T04:56:15.487 回答