我正在使用 Doc2Vec 和 Word2Vec 深度学习算法(来自 Gensim 的 Doc2Vec API 描述)。更多描述在这里
目前我对使用model.n_similarity(wordSet1, wordSet2)
基本上计算两组单词之间的余弦相似度的方法感兴趣。
我对验证模型性能的任何方式都感兴趣,不仅在n_similiarity()
功能上,而且在总体上模型可以提供多么准确或真实的结果。由于它执行深度学习,我不知道是否有任何方法可以知道它的性能如何。
是否有任何我应该查找然后使用的技术,或者是否有一个有结果的数据集我应该比较?
任何建议都非常感谢。谢谢你。