最好它应该是 txt 文件而不是二进制文件。我在 300 多个维度中找到的所有预训练词嵌入。
谢谢
一个 300 维模型的任何 50 维仍然有用的情况似乎是合理的。因此,您可以想象得到一个 300 维的文本集,并修补文件以指定 50 维并丢弃每行的最后 250 维。
http://nlp.stanford.edu/data/glove.6B.zip 下载 GloVe 格式的文件,并使用此脚本将其转换为 word2vec 格式:https ://github.com/jroakes/glove-to-word2vec