1

使用 gensim 工具包加载了预训练的 word2vec 模型后,我想找到一个给定上下文的单词的同义词,例如“她是一个聪明的人”。

4

1 回答 1

5

有一种方法[most_similar()][1]可以通过模型坐标中的余弦相似度将最接近向量的单词报告给给定单词。例如:

similars = loaded_w2v_model.most_similar('bright')

然而,Word2vec 不会找到严格的同义词——只是在其训练语料库中与上下文相关的词。这些通常是同义词,但在其他方面也可能相似——例如用于相同的主题领域,或者能够在功能上相互替换。(在最后一个方面,有时高度相似的词向量是反义词,因为像“热”和“冷”这样的词出现在同一个地方,指的是事物的同一方面。)

简单的 word2vec 也不能很好地处理多义词(像“明亮”这样的标记既是“光线充足”的词,又是“智能”的词)。因此,与“明亮”最相似的单词列表将包括其替代意义的混合。

于 2018-05-05T16:55:13.380 回答