3

我不太确定最好的表达方式,但我想做的是阅读 pdf 文件,进行各种修改,然后将修改后的 pdf 保存在原始文件上。截至目前,我可以将修改后的 pdf 保存到单独的文件中,但我希望替换原始文件,而不是创建新文件。

这是我当前的代码:

from pyPdf import PdfFileWriter, PdfFileReader

output = PdfFileWriter()
input = PdfFileReader(file('input.pdf', 'rb'))
blank = PdfFileReader(file('C:\\BLANK.pdf', 'rb'))

# Copy the input pdf to the output.
for page in range(int(input.getNumPages())):
    output.addPage(input.getPage(page))

# Add a blank page if needed.
if (input.getNumPages() % 2 != 0):
    output.addPage(blank.getPage(0))

# Write the output to pdf.
outputStream = file('input.pdf', 'wb')
output.write(outputStream)
outputStream.close()

如果我将其更改outputStream为不同的文件名,它可以正常工作,我只是无法保存输入文件,因为它仍在使用中。我已经尝试过.close()流,但它也给了我错误。

我觉得这有一个相当简单的解决方案,我只是没有找到它。

谢谢!

4

3 回答 3

8

您始终可以将临时输出文件重命名为旧文件:

import os
f = open('input.pdf', 'rb')
# do stuff to temp.pdf
f.close()
os.rename('temp.pdf', 'input.pdf')
于 2010-04-30T18:30:10.817 回答
3

你说你试图 close() 流但有错误?您可以删除 PdfFileReader 对象以确保没有人仍然可以访问流。然后关闭流。

from pyPdf import PdfFileWriter, PdfFileReader

inputStream = file('input.pdf', 'rb')
blankStream = file('C:\\BLANK.pdf', 'rb')
output = PdfFileWriter()
input = PdfFileReader(inputStream)
blank = PdfFileReader(blankStream)

...

del input # PdfFileReader won't mess with the stream anymore
inputStream.close()
del blank
blankStream.close()

# Write the output to pdf.
outputStream = file('input.pdf', 'wb')
output.write(outputStream)
outputStream.close()
于 2010-04-30T18:48:28.777 回答
1

如果 PDF 足够小(这取决于您的平台),您可以将整个内容读入,关闭文件,修改数据,然后将整个内容写回同一个文件。

于 2010-04-30T18:55:07.483 回答