0

我想根据这个比较教程比较 word2vec 和 fasttext 模型。 https://github.com/jayantj/gensim/blob/fast_text_notebook/docs/notebooks/Word2Vec_FastText_Comparison.ipynb

据此,当我们将 char n-gram 的最大长度设置为零时,fastText 模型的语义准确性会提高,因此 fastText 开始表现得几乎类似于 word2vec。它忽略了 ngram。

但是,在加载 fastText 模型时,我找不到任何有关如何设置此参数的信息。关于如何做到这一点的任何想法?

4

1 回答 1

2

该参数是在训练时设置的——然后使用该参数构建模型,并依赖该参数进行解释。因此,您通常不会在加载已训练模​​型时更改它,并且 gensim(或原始 FastText)中没有 API 可以更改已训练模型的设置。

(通过查看源代码并直接篡改加载的模型状态,您可能能够近似忽略已训练的字符图的效果——但那将是一种新颖的模式,与非字符图完全不同-在您链接的笔记本中评估的训练模式。它可能会产生有趣或糟糕的结果——不尝试就无法判断。)

于 2017-08-08T17:59:02.950 回答