我正在尝试加载 fasttext 文件以第一次将其用作单词嵌入。我有这个:
KeyedVectors.load_word2vec_format(binary_file_path,
binary=True, encoding='utf-8', unicode_errors='ignore')
我还尝试了这里描述的内容:https :
//datascience.stackexchange.com/questions/20071/how-do-i-load-fasttext-pretrained-model-with-gensim 我下载了.bin文件的结果仍然相同kaggle(https://www.kaggle.com/kambarakun/fasttext-pretrained-word-vectors-english)但我仍然遇到问题:
'utf8' codec can't decode byte 0xba in position 0: invalid start byte
我只想使用 .bin 文件而不是 .vec 文件,因为它需要的更少时间。