nltk - 使用 wordnet 查找具有 6 种基本情绪的句子的相似度

Question

我正在做一个项目，其中一部分需要检测我们处理的文本的情绪。

例如，

他很高兴回家。

我将从上面的句子中取两个词，即快乐和回家。

我将有一张包含 6 种基本情绪的表格。（快乐、悲伤、恐惧、愤怒、厌恶、惊讶）

这些情绪中的每一种都会有一些与之相关的同义词。

我需要找到这些同义词集和happy 词之间的相似性，然后找到这些同义词集和home 词之间的相似性。

我尝试为此目的使用 WORDNET，但由于我是新手，所以无法理解 wordnet 是如何工作的。

score 0 · Accepted Answer

我认为您想在句子中找到与代表 6 种基本给定情绪中任何一种的任何单词相似的单词。如果我是正确的，我认为您可以使用以下解决方案。

首先提取代表 6 种基本情绪的每个词义的同义词集。现在形成这些同义词集（同义词的集合）中的每一个的向量化表示。您可以使用https://code.google.com/archive/p/word2vec/上提供的 word2Vec 工具执行此操作。例如

假设“happy”将单词感觉 a1、a2、a3 作为其同义词，然后 1. 首先在任何大型英语语料库（例如 Bojar 语料库 2）上训练 Word2Vec 工具。然后使用经过训练的 word2Vec 获得每个同义词 a1 的词嵌入（向量化表示） , a2, a3。3. 那么“happy”的同义词集的向量化表示将是 a1、a2、a3 的向量化表示的平均值。4. 通过这种方式，您可以对 6 种基本情绪中的每一种进行矢量化表示同义词集。

现在对于给定的句子，使用经过训练的 word2vec 生成的词汇表找到每个单词的向量化表示。现在您可以使用余弦相似度（https://en.wikipedia.org/wiki/Cosine_similarity）从 6 种基本情绪的同义词集中找出每个单词的距离（相似度）。通过这种方式，您可以确定句子的情感（基本水平）。

技术来源：Sudha 等人的研究论文“使用词嵌入的无监督最常见意义检测”。人（http://www.aclweb.org/anthology/N15-1132）

nltk - 使用 wordnet 查找具有 6 种基本情绪的句子的相似度

1 回答 1

Related

Reference