我想在 Keras NN 模型中使用一些预训练的词嵌入,这些模型已由 Google 在一篇非常著名的文章中发表。他们提供了训练新模型的代码,以及此处的嵌入。
但是,从文档中不清楚如何从简单的 python 函数调用中从给定的字符串(单词)中检索嵌入向量。许多文档似乎都集中在将向量转储到文件中以获取整个句子,大概是为了进行情感分析。
到目前为止,我已经看到您可以使用以下语法输入预训练的嵌入:
embedding_layer = Embedding(number_of_words??,
out_dim=128??,
weights=[pre_trained_matrix_here],
input_length=60??,
trainable=False)
但是,将不同的文件及其结构转换pre_trained_matrix_here
为我不太清楚。
他们有几个 softmax 输出,所以我不确定哪个属于 - 以及如何将我输入中的单词与他们拥有的单词字典对齐。
是否有一种简单的方法可以在 keras 中使用这些词/字符嵌入和/或在 keras 中构建模型的字符/词嵌入部分,以便可以为其他 NLP 任务添加更多层?