1

doc2vec函数中,有一个参数叫做size.

我知道,size是输出向量的维度,如果size=400它比 if 更好地捕获内容size=100

但是,我不明白,size代表什么?这是否意味着 Doc2Vec 将从一个单词中查找多远,以预测下一个单词?或者是什么意思?

非常感谢,

4

1 回答 1

1

size是创建的向量中的维数。所以size=100意味着每个文档(实际上是文档标签)从训练中接收一个 100 维向量。

更多维度并不总是更好:它们意味着更慢的训练和更大的模型。如果你正在处理一个小数据集,太多的维度可能会导致过度拟合——阻止模型表示数据中的可概括模式。

于 2016-07-29T02:42:25.913 回答