Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
在doc2vec函数中,有一个参数叫做size.
doc2vec
size
我知道,size是输出向量的维度,如果size=400它比 if 更好地捕获内容size=100。
size=400
size=100
但是,我不明白,size代表什么?这是否意味着 Doc2Vec 将从一个单词中查找多远,以预测下一个单词?或者是什么意思?
非常感谢,
size是创建的向量中的维数。所以size=100意味着每个文档(实际上是文档标签)从训练中接收一个 100 维向量。
更多维度并不总是更好:它们意味着更慢的训练和更大的模型。如果你正在处理一个小数据集,太多的维度可能会导致过度拟合——阻止模型表示数据中的可概括模式。