在 Gensim word2vec 中是否sample= 0
意味着在我的训练期间没有使用下采样?文档就是这么说的
“有用的范围是 (0, 1e-5)”
但是将阈值设置为 0 会导致 P(wi) 等于 1,这意味着不会丢弃任何单词,我是否理解正确?
我正在处理一个包含 7597 个 Facebook 帖子(18945 个单词)的相对较小的数据集,并且我的嵌入sample= 0
在推荐范围内的使用效果要好得多。有什么特别的原因吗?字体大小?
在 Gensim word2vec 中是否sample= 0
意味着在我的训练期间没有使用下采样?文档就是这么说的
“有用的范围是 (0, 1e-5)”
但是将阈值设置为 0 会导致 P(wi) 等于 1,这意味着不会丢弃任何单词,我是否理解正确?
我正在处理一个包含 7597 个 Facebook 帖子(18945 个单词)的相对较小的数据集,并且我的嵌入sample= 0
在推荐范围内的使用效果要好得多。有什么特别的原因吗?字体大小?