4

我正在使用快速文本在特定文本语料库上训练词向量。Fasttext 为训练词向量提供了所有必要的机制和选项,当使用 tsne 查看时,向量是惊人的。我注意到 gensim 有一个用于快速文本的包装器,这对于访问向量很有用。

对于我的任务,我有很多文本语料库。我需要在新的语料库中再次使用上述经过训练的向量,并在新发现的语料库中再次使用经过训练的向量。fasttext 不提供此功能。我没有看到任何可以实现这一目标的软件包,或者我可能迷路了。我在谷歌论坛gensim 中看到提供 intersect_word2vec_format,但无法理解或找到此使用教程。还有一个与此类似的问题悬而未决,没有答案。

所以除了gensim,还有没有其他方法可以像上面那样训练模型。

4

0 回答 0