3
pdfile=open("tutorial.pdf","r")
xyz= pdfile.readlines()
pqr=pdfile.readline()
for a in xyz:
    print a

此代码不显示实际内容。相反,它会显示一些问号和框。

4

3 回答 3

3

PDF文件包含格式化数据,不能直接阅读,

所以使用 pyPdf 模块!单击此处http://pybrary.net/pyPdf/ 安装,无需转换即可阅读。

于 2013-09-02T10:14:06.490 回答
2

PDF 文件不是纯文本 - 您不能只将其字节打印到终端。您需要使用 PDF 阅读库(有关一些建议,请参阅Python PDF 库)来阅读它。

于 2013-08-07T08:04:46.240 回答
1

如果您正在处理文本 PDF 文件,我建议您使用PDFMiner。(一个完整的例子可以在这里找到:https ://github.com/syllabs/pdf2text )

于 2013-08-07T09:05:10.737 回答