我是一名学习 python 的新手开发人员,我试图递归地解析包含多个 pdf 的文件夹和子文件夹,并根据子文件夹名称将它们合并到一个 pdf 中。我有以下文件夹和子文件夹结构
合并前的文件夹
dummy
ball
ball_baseball.pdf
ball_basketball.pdf
ball_volleyball.pdf
ice
ice_skating.pdf
ice_curling.pdf
ice_hockey.pdf
id 喜欢看到的理想结果是
dummy
ball
ball.pdf(containing 3 sheets)
ice
ice.pdf (containing 3 sheets)
之前使用 pandas 为 csv 文件回答了问题字符串。但我使用 PyPDf 合并 pdf'f 这是我迄今为止尝试过的代码。它似乎可以工作,但我可能已经搞砸了 for 循环,所以递归地在子文件夹中附加和合并 pdf
import sys, os,PyPDf2
from PyPDF2 import PdfFileMerger, PdfFileReader
dirs=r"path to the folder directory"
for root,dirs,files in os.walk(dirs):
merger = PdfFileMerger()
for filename in files:
if filename.endswith(".pdf"):
filepath = os.path.join(root, filename)
merger.append(PdfFileReader(open(filepath, 'rb')))
merger.write(str(filename))`
任何建议将不胜感激提前谢谢