0

最好它应该是 txt 文件而不是二进制文件。我在 300 多个维度中找到的所有预训练词嵌入。

谢谢

4

2 回答 2

0

一个 300 维模型的任何 50 维仍然有用的情况似乎是合理的。因此,您可以想象得到一个 300 维的文本集,并修补文件以指定 50 维并丢弃每行的最后 250 维。

于 2017-03-01T20:45:49.390 回答
0

http://nlp.stanford.edu/data/glove.6B.zip 下载 GloVe 格式的文件,并使用此脚本将其转换为 word2vec 格式:https ://github.com/jroakes/glove-to-word2vec

于 2017-02-28T11:21:04.347 回答