简短信息:我正在运行 python 3.0 并安装了 NLTK(从 3.3 切换回来,因为 NLTK 不支持 3.3,这很糟糕,因为我拥有的所有其他扩展都适用于 3.3)
尝试提取命名实体时出现此错误:
File "D:\UM\Programming\Thesis\Thesis\test.py", line 10, in <module>
sentences = nltk.sent_tokenize(file)
File "C:\Python30\Lib\site-packages\nltk\tokenize\__init__.py", line 75, in sent_tokenize
tokenizer = load('tokenizers/punkt/english.pickle')
File "C:\Python30\Lib\site-packages\nltk\data.py", line 630, in load
resource_val = pickle.load(opened_resource)
File "C:\Python30\lib\pickle.py", line 1323, in load
return Unpickler(file, encoding=encoding, errors=errors).load()
ImportError: No module named copy_reg
我在其他地方读到ImportError
转储到非二进制文件时会出现这种情况,但在这种情况下,我试图读取已经转储的泡菜文件。有谁知道如何解决错误?
上述行中的变量file
只是一个string
包含少量文本的变量。