0

我应该用 python glove 做一些练习,大部分都没有给我任何问题,但现在我应该从“glove-wiki-gigaword-”中找到与“norway - war + Peace”最相似的 5 个词100 英寸包装。但是当我运行我的代码时,它只是说“单词”不在词汇表中。现在我猜这是某种格式,但我不知道如何使用它。

import gensim.downloader as api
model = api.load("glove-wiki-gigaword-100")  # download the model and return as object ready for use

bests = model.most_similar("norway - war + peace", topn= 5)

print("5 most similar words to 'norway - war + peace':")

for best in bests:
    print(best)
4

1 回答 1

1

Gensim 的模型 word2vec 只处理以前见过的单词。在这里你给出一个完整的句子......你想要做的是:

  1. 分别获取向量 v1、v2 和 v3。词“挪威”、“战争”和“和平”。
  2. 计算数学:v = v1 -v2 + v3。
  3. 得到与 v 最相似的词。

为此,您将需要以下函数:model.wv.most_similar()model.wv.similar_by_vector(). 请注意,model.wv.most_similar()它执行类似于这三个步骤的操作,但使用一组积极词和一组消极词以更复杂的方式。有关详细信息,请参阅文档

于 2018-11-13T13:25:11.467 回答