我正在阅读这篇论文http://cs.stanford.edu/~quocle/paragraph_vector.pdf
它指出
“段落向量和词向量被平均或连接以预测上下文中的下一个词。在实验中,我们使用连接作为组合向量的方法。”
串联或平均如何工作?
示例(如果第 1 段包含 word1 和 word2):
word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]
concat method
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?
Average method
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?
同样来自这张图片:
据称:
段落标记可以被认为是另一个词。它充当记忆,记住当前上下文或段落主题中缺少的内容。出于这个原因,我们经常将此模型称为段落向量的分布式内存模型(PV-DM)。
段落标记是否等于等于 的段落向量on
?