我试图只删除多个 PDF 文件的第一页并合并为一个文件。(我每天收到150个PDF文件,第一页是我需要的发票,后面3到12页是我不需要的备份)所以输入是150个不同大小的PDF文件,我想要的输出是1 个 PDF 文件,仅包含 150 个文件中每个文件的第一页。
我似乎所做的是合并所有页面,除了第一页(这是我唯一需要的)。
import PyPDF2, os
pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
pdfFiles.sort(key=str.lower)
pdfWriter = PyPDF2.PdfFileWriter()
for filename in pdfFiles:
pdfFileObj = open(filename, 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
for pageNum in range(1 , pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open('CombinedFirstPages.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()