我正在尝试使用 fasttext python 包在 Windows 中训练一个 fasttext 分类器。我有一个 utf8 文件,其中包含如下行
__label__type1 sample sentence 1
__label__type2 sample sentence 2
__label__type1 sample sentence 3
当我跑
fasttext.supervised('data.train.txt','model', label_prefix='__label__', dim=300, epoch=50, min_count=1, ws=3, minn=4, pretrained_vectors='wiki.simple.vec')
我收到以下错误
File "fasttext\fasttext.pyx", line 256, in fasttext.fasttext.supervised (fasttext/fasttext.cpp:7265)
File "fasttext\fasttext.pyx", line 182, in fasttext.fasttext.train_wrapper (fasttext/fasttext.cpp:5279)
ValueError: fastText: cannot load data.train.txt
当我检查目录中的文件类型时,我得到了
__pycache__: directory
data.train.txt: UTF-8 Unicode text, with very long lines, with CRLF line terminators
train.py: Python script, ASCII text executable, with CRLF line terminators
wiki.simple.vec: UTF-8 Unicode text, with very long lines, with CRLF line terminators
此外,当我尝试在 MacOs 中使用相同的训练文件训练相同的分类器时,它工作正常。我试图了解为什么无法读取该 txt 文件。
谢谢!