我正在做一个项目,其中一部分需要检测我们处理的文本的情绪。
例如,
他很高兴回家。
我将从上面的句子中取两个词,即快乐和回家。
我将有一张包含 6 种基本情绪的表格。(快乐、悲伤、恐惧、愤怒、厌恶、惊讶)
这些情绪中的每一种都会有一些与之相关的同义词。
我需要找到这些同义词集和happy 词之间的相似性,然后找到这些同义词集和home 词之间的相似性。
我尝试为此目的使用 WORDNET,但由于我是新手,所以无法理解 wordnet 是如何工作的。
我正在做一个项目,其中一部分需要检测我们处理的文本的情绪。
例如,
他很高兴回家。
我将从上面的句子中取两个词,即快乐和回家。
我将有一张包含 6 种基本情绪的表格。(快乐、悲伤、恐惧、愤怒、厌恶、惊讶)
这些情绪中的每一种都会有一些与之相关的同义词。
我需要找到这些同义词集和happy 词之间的相似性,然后找到这些同义词集和home 词之间的相似性。
我尝试为此目的使用 WORDNET,但由于我是新手,所以无法理解 wordnet 是如何工作的。
我认为您想在句子中找到与代表 6 种基本给定情绪中任何一种的任何单词相似的单词。如果我是正确的,我认为您可以使用以下解决方案。
首先提取代表 6 种基本情绪的每个词义的同义词集。现在形成这些同义词集(同义词的集合)中的每一个的向量化表示。您可以使用https://code.google.com/archive/p/word2vec/上提供的 word2Vec 工具执行此操作。例如
假设“happy”将单词感觉 a1、a2、a3 作为其同义词,然后 1. 首先在任何大型英语语料库(例如 Bojar 语料库 2)上训练 Word2Vec 工具。然后使用经过训练的 word2Vec 获得每个同义词 a1 的词嵌入(向量化表示) , a2, a3。3. 那么“happy”的同义词集的向量化表示将是 a1、a2、a3 的向量化表示的平均值。4. 通过这种方式,您可以对 6 种基本情绪中的每一种进行矢量化表示同义词集。
现在对于给定的句子,使用经过训练的 word2vec 生成的词汇表找到每个单词的向量化表示。现在您可以使用余弦相似度(https://en.wikipedia.org/wiki/Cosine_similarity)从 6 种基本情绪的同义词集中找出每个单词的距离(相似度)。通过这种方式,您可以确定句子的情感(基本水平)。
技术来源:Sudha 等人的研究论文“使用词嵌入的无监督最常见意义检测”。人(http://www.aclweb.org/anthology/N15-1132)