你可能不会在 gensim 中找到这样的功能,因为这意味着依赖于内部结构和代码,就像你在 fasttext-python 中看到的那样(它使用pybind直接调用内部 fasttext api)。对外部库有如此巨大的依赖是 gensim 的创建者想要避免的,这就是为什么他们可能不赞成调用 fasttext wrapper 的功能。现在 gensim 只寻求通过自己的内部实现来提供 fasttext 算法。我建议您将python 绑定用于 fasttext。
$ git clone https://github.com/facebookresearch/fastText.git
$ cd fastText
$ pip install .
现在使用 fasttext 模型在您的 python 应用程序中运行训练集。
from fastText import train_unsupervised
model = train_unsupervised(input="pathtotextfile", model='skipgram')
model.save_model('model.bin')
这将以 fastText 命令行格式保存模型。所以你现在应该可以运行以下命令了。
$ ./fasttext print-word-vectors model.bin < queries.txt