我选择了 Jacqueline Kazil 和 Katherine Karmul 撰写的 O'Reiley 的 Data Wrangling with Python。在第 5 章第 94 页中,我正在运行以下代码。
import slate
pdf = 'EN-FINAL Table 9.pdf'
with open(pdf) as f:
doc = slate.PDF(f)
for page in doc[:2]:
print page
我正在使用 Windows 10,Python 2.7.12,运行 slate 0.5.2,pdfminer 20140328 并成功安装了 pip。我得到以下结果:
File "C:\Python27\lib\site-packages\pdfminer\psparser.py", line 215, in fillbuf
raise PSEOF('Unexpected EOF')
pdfminer.psparser.PSEOF: Unexpected EOF
我只知道 EOF 表示“文件结尾”,并且无法从数据源读取更多数据。有人知道发生了什么吗?
如果有人想查看我要解析的文件,就在这里: https ://github.com/jackiekazil/data-wrangling/tree/master/data/chp5