-1

我读了一篇论文“在信息检索中集成和评估神经词嵌入”。

我试图理解源代码,并在打开名为:vectors_ap8889_skipgram_s200_w20_neg20_hs0_sam1e-4_iter5 的文件时

我找到了一个这样的词向量表示: Downtown "-0.465147 -0.049099 -0.023432 0.058986 -0.085395 -0.027324 -0.050315 ................... …………”

请; 我需要你解释一下这些值是什么意思,在语料库中指的是什么术语以及我如何获得它。

4

1 回答 1

0

这些数字没有内在含义。它只是给定单词的 n 维嵌入。

如果嵌入正确完成,您应该会看到相似的词嵌入在一起。例如,“good”应该更接近“awesome”而不是“island”。

使用它的常用方法是将单词转换为它们的嵌入空间,并将其用作某些机器学习问题的输入。优点是嵌入的训练数据比您解决问题的数据多得多,因此嵌入提供了训练模型的捷径。

于 2017-07-11T13:35:56.223 回答