1

我选择了 Jacqueline Kazil 和 Katherine Karmul 撰写的 O'Reiley 的 Data Wrangling with Python。在第 5 章第 94 页中,我正在运行以下代码。

import slate

pdf = 'EN-FINAL Table 9.pdf'

with open(pdf) as f:
    doc = slate.PDF(f)

for page in doc[:2]:
    print page

我正在使用 Windows 10,Python 2.7.12,运行 slate 0.5.2,pdfminer 20140328 并成功安装了 pip。我得到以下结果:

File "C:\Python27\lib\site-packages\pdfminer\psparser.py", line 215, in fillbuf
    raise PSEOF('Unexpected EOF')
 pdfminer.psparser.PSEOF: Unexpected EOF

我只知道 EOF 表示“文件结尾”,并且无法从数据源读取更多数据。有人知道发生了什么吗?

如果有人想查看我要解析的文件,就在这里: https ://github.com/jackiekazil/data-wrangling/tree/master/data/chp5

4

1 回答 1

1

这为我解决了这个问题:https ://stackoverflow.com/a/18262661/6843645

您的代码将是:

import slate

pdf = 'EN-FINAL Table 9.pdf'
with open(pdf, 'rb') as f:
    doc = slate.PDF(f)

for page in doc[:2]:
    print page
于 2016-09-17T19:27:47.733 回答