自过去 1 年以来,我一直在从事文档级别的情绪分析。文档级情感分析提供完整文档的情感。例如 - 文本“诺基亚很好,但沃达丰很糟糕”将具有与之相关的负面极性,因为它与诺基亚和沃达丰实体无关。怎么可能获得实体层面的情绪,比如对诺基亚有利但对沃达丰不利?有没有研究论文可以解决这些问题?
4 回答
您可以尝试方面级别或实体级别的情感分析。已经做出了很好的努力来找到一个句子中关于各个方面的意见。你可以在这里找到一些作品。你还可以更深入更深入地复习那些与特征(方面)提取相关的论文。这是什么意思?让我给你举个例子:
“屏幕质量很好,但是电池寿命很短。”
文档级别的情感分析在这里可能无法给我们这个文档的真正意义,因为我们在文档中有一个肯定句和一个否定句。但是,通过基于方面(aspect-level)的意见挖掘,我们可以分别找出文档中不同实体的感觉/极性。通过进行特征提取,在第一步中,您尝试在不同的句子中找到特征(方面) (这里是“屏幕质量”或简称为“质量”和“电池寿命”)。之后,当您有这些方面时,您尝试提取与这些方面相关的意见(“质量”为“好”,“电池寿命”为“短”)。目标词(用户评论的那些词或实体),以及作为意见词的意见,关于目标词的评论。
通过搜索我刚才提到的关键字,您可以更加熟悉这些概念。
您可以查找实体及其相关对象,并具有简单的启发式方法,例如从最接近的情感项中给出每个实体的情感,可能在依赖分析树中按距离最近,而不是线性地。这些步骤中的每一个似乎都是一个开放的研究课题。
http://scholar.google.com/scholar?q=entity+identification
http://scholar.google.com/scholar?q=coreference+resolution
我也尝试获取有关这方面的研究文章,但没有找到任何内容。我建议您尝试使用基于方面的情感分析算法。我发现的相似之处在于我们识别句子中单个实体的方面,然后找到每个方面的情感。类似地,我们可以使用相同的算法来训练我们的模型,该算法可以像检测方面一样检测实体并找到情感此类实体。我没有尝试过,但我会尝试。让我知道这是否有效。还有多种方法可以做到这一点。以下是几篇文章的链接。
http://arxiv.org/pdf/1605.08900v1.pdf https://cs224d.stanford.edu/reports/MarxElliot.pdf