我想知道 gensim word2vec 的两个相似性度量之间的区别:most_similar() 和 most_similar_cosmul()。我知道第一个使用词向量的余弦相似度,而另一个使用 Omer Levy 和 Yoav Goldberg 提出的乘法组合目标。我想知道它如何影响结果?哪一个给出语义相似性?等等例如:
model = Word2Vec(sentences, size=100, window=5, min_count=5, workers=4)
model.most_similar(positive=['woman', 'king'], negative=['man'])
结果:[('女王',0.50882536),...]
model.most_similar_cosmul(positive=['baghdad', 'england'], negative=['london'])
结果:[(u'iraq', 0.8488819003105164), ...]