我有一个破坏 pyPdf 的 pdf 文件:http: //tovotu.de/tests/test.pdf
这是示例脚本:
from pyPdf import PdfFileWriter, PdfFileReader
outputPdf = PdfFileWriter()
inpdf = open("test.pdf","rb")
inputPdf = PdfFileReader(inpdf)
[outputPdf.addPage(x) for x in inputPdf.pages]
with open("output.pdf","wb") as outpdf:
outputPdf.write(outpdf)
错误输出在这里: http: //pastebin.com/0m38zhjQ
使用来自 GitHub 的 PyPDF2 时,错误是相同的。pdftk 可以像处理任何其他 pdf 一样处理此 pdf。请注意,写作失败,但阅读似乎工作得很好!
您至少可以指出导致该错误的 pdf 的确切部分吗?解决方法会更好:)