1

我最近阅读了这篇论文End-To-End Memory Networks,它使用三个不同的嵌入层进行句子嵌入。现在我正在尝试在 keras 中重现这种架构。

但我不确定如何创建三个不同的嵌入。这些是基于相同语料库的完全相同的维度,但嵌入应该具有不同的值。所以要实现这些层,我应该只使用嵌入层kernel_initializer =random_uniform

我知道像 Word2Vec 这样的预训练嵌入,但目前预训练模型并不重要,是吗?

4

0 回答 0