1

我已经在我的文本语料库上使用了这个实现https://github.com/stanfordnlp/GloVe/tree/master/src的 c 应用程序构建了 Glove 模型。我想以这样的方式找到词嵌入

如果 A 与 B 相关,C 与 D 相关,那么 A-C+B 应该等于 D。例如,“澳大利亚”-“堪培拉”+“印度”的嵌入向量算术应该等于“新德里”。

我想在 python 中评估这些嵌入。

4

1 回答 1

1

任何评估步骤A B C D

  1. 计算D'with的向量表示D' = A-C+B
  2. 对于训练好的 GloV 中的所有词向量v,计算 和 的余弦v相似度D'
  3. 检查与 to 最相似的向量D'是否实际上是预期的 word D

这样的结果可以被视为@top1 类信息检索的评估。可以改第三步搞定@top k

于 2017-08-16T10:23:26.830 回答