构建一个 doc2Vec 算法,需要有多个嵌入。词向量有嵌入,同时文档本身也有嵌入。该算法的工作方式类似于 CBOW 模型,但文档嵌入也用于每个使用给定窗口训练的文档。因此,如果我们有一个包含 5 个单词的窗口,我们会继续遍历这 5 个单词,但是对于每个窗口,我们将始终包含文档嵌入向量本身,以便我们可以对其进行更新。
问问题
663 次
构建一个 doc2Vec 算法,需要有多个嵌入。词向量有嵌入,同时文档本身也有嵌入。该算法的工作方式类似于 CBOW 模型,但文档嵌入也用于每个使用给定窗口训练的文档。因此,如果我们有一个包含 5 个单词的窗口,我们会继续遍历这 5 个单词,但是对于每个窗口,我们将始终包含文档嵌入向量本身,以便我们可以对其进行更新。