1

我正在尝试使用 R 中的 GLOVE 将文本数据转换为向量。我的计划是平均一个句子的词向量,但我似乎无法进入词向量化阶段。我已经下载了 glove.6b.50.txt 文件,它的父 zip 文件来自:https ://nlp.stanford.edu/projects/glove/我访问了 text2vec 的网站并尝试运行他们加载维基百科数据的示例。但我不认为它是我正在寻找的(或者我不理解它)。我正在尝试将预训练的嵌入加载到模型中,这样如果我有一个句子(比如“我爱灯”),我可以遍历那个句子并将每个单词变成一个向量,然后我可以平均(将未知单词变成zeros) 具有矢量化(word) 之类的函数。如何将预训练的嵌入加载到手套模型中作为我的语料库(这甚至是我实现目标所需要做的吗?)

4

1 回答 1

1

我最终想通了。我只需要嵌入矩阵。它已经将词汇中的单词作为行名,因此我使用它们来确定每个单词的向量。

现在我需要弄清楚如何更新这些向量!

于 2019-02-05T23:46:58.103 回答