0

我正在尝试加载 fasttext 文件以第一次将其用作单词嵌入。我有这个:

KeyedVectors.load_word2vec_format(binary_file_path,
binary=True, encoding='utf-8', unicode_errors='ignore')

我还尝试了这里描述的内容:https : //datascience.stackexchange.com/questions/20071/how-do-i-load-fasttext-pretrained-model-with-gensim 我下载了.bin文件的结果仍然相同kaggle(https://www.kaggle.com/kambarakun/fasttext-pretrained-word-vectors-english)但我仍然遇到问题: 'utf8' codec can't decode byte 0xba in position 0: invalid start byte 我只想使用 .bin 文件而不是 .vec 文件,因为它需要的更少时间。

4

0 回答 0