4

意见挖掘/情感分析是自然语言处理的一个近期子任务。有些人将其与文本分类进行比较,有些人对此持更深入的立场。您如何看待情感分析(意见挖掘)中最具挑战性的问题?你能说出几个吗?

4

4 回答 4

19

情绪分析的主要挑战是:-

1) 命名实体识别——这个人实际上在谈论什么,例如 300 Spartans 是一群希腊人还是一部电影?

2) 照应解析 - 解析代词或名词短语所指的问题。“我们看了电影然后去吃晚饭;太糟糕了。” “它”指的是什么?

3) Parsing - 句子的主语和宾语是什么,动词和/或形容词实际上指的是哪一个?

4) 讽刺——如果你不认识作者,你就不知道“坏”是指坏的还是好的。

5) Twitter - 缩写、缺少大写字母、拼写差、标点符号差、语法差……

于 2011-01-26T16:08:56.150 回答
2

我同意 Hightechrider 的观点,即情绪分析的准确性可以在这些领域有所提高。我还要补充一点,大多数情况下,情绪分析往往是在封闭域文本上进行的。尝试在开放域文本上执行此操作通常会导致非常差的准确性/F1 度量/你有什么,否则它是伪开放域,因为它只查看某些语法结构。所以我想说,可以识别上下文并据此做出决策的主题敏感情绪分析是一个令人兴奋的研究领域(和行业产品)。

我还将他的第 5 点从 Twitter 扩展到其他社交媒体网站(例如 Facebook、Youtube),在这些网站上,简短、不合语法的话语司空见惯。

于 2011-01-26T19:04:30.627 回答
1

我认为答案是语言复杂性、语法错误和拼写错误。人们表达观点的方式有很多种,例如,讽刺可能被错误地解释为非常积极的情绪。

于 2011-01-26T15:57:12.227 回答
0

这个问题可能过于笼统,因为情感分析有几种类型(文档级别、句子级别、比较情感分析等),每种类型都有一些特定的问题。

一般来说,我同意@Ian Mercer 的回答,我会添加其他 3 个问题:

  • 如何检测更深入的情绪/情绪。正面和负面是一个非常简单的分析,其中一个挑战是如何提取情绪,例如意见中有多少仇恨,有多少快乐,有多少悲伤等。
  • 如何检测意见正面的对象和意见负面的对象。例如,如果您说“她赢了他!”,这同时意味着对她的积极情绪和对他的消极情绪。
  • 如何分析非常主观的句子或段落。有时即使对于人类来说,也很难就这种高度主观的文本的情绪达成一致。想象一下电脑...
于 2014-12-12T02:24:08.980 回答