我使用 Google 的 word2vec 训练了一个词嵌入模型。输出是一个包含单词及其向量的文件。
我在 deeplearning4j 中加载了这个训练有素的模型。
WordVectors vec = WordVectorSerializer.loadTxtVectors(new File("vector.txt"));
Collection<String> lst = vec.wordsNearest("someWord", 10);
但是从 deeplearning4j 的包和 word2vec 的距离函数得到的两个相似词列表是完全不同的,尽管我使用了相同的向量文件。
有人对 deeplaring4j 中的工作方式以及这些差异的来源有很好的了解吗?