我不是一个经验丰富的程序员,我只是想用它来用 NLTK 进行一些数据分析。我正在关注在线书籍,但以下代码无法打开读取文件。
#download nltk
import nltk
nltk.download()
#import everything from nltk
from nltk.book import *
import io
open('ALL FEMALES1.txt', encoding="ISO-8859-1")
输出:<_io.TextIOWrapper name='ALL FEMALES1.txt' mode='r' encoding='ISO-8859-1'>
我试过用
f = open('ALL FEMALES1.txt')
>>> raw = f.read()
但这给了我以下错误:'utf-8' codec can't decode byte 0xd5 in position 18929: invalid continuation byte
有什么建议吗?如果这很重要,我正在使用 Jupyter Notebook。