我有一个包含多页的 pdf 文件,但我只对其中的一个子组感兴趣。例如,我的原始 PDF 有 30 页,我只想要第 10 到 16 页。
我尝试使用 tabulizer 包中的 split_pdf 函数,它只将 pdf 页面拆分为页面(产生 200 个文件,每页一个),然后是 merge_pdfs(合并 pdf 文件)。它工作正常,但需要很长时间(我必须拆分大约 2000 个 pdf 文件)。
这是我正在使用的代码:
split = split_pdf('file_path')
start = 10
end = 16
merge_pdfs(split[start:end], 'saving_path')
我找不到更好的选择来做到这一点。任何帮助将不胜感激。