Word2vec 是谷歌提供的用于计算单词距离的开源工具。它可以通过输入一个单词并根据相似度输出排序的单词列表来使用。例如
输入:
france
输出:
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
但是,我需要做的是通过给出 2 个单词来计算相似度距离。如果我给出“法国”和“西班牙”,我怎么能在不阅读整个单词列表的情况下只给出“法国”来获得 0.678515 的分数。