2

我有一个 PDF 集合,有时我想要删除的文档的第一页有一个信息页面。

如果有一种快速的方法可以从我的所有 pdf 中删除此信息页面,或者至少有一种方法可以显示所有超过一页的 pdf,以便我可以更好地找到需要修复的页面?

你知道任何可以做到这一点的程序吗?或者用python做到这一点的方法?

注意:信息页面上的文字始终保持相同的“土地所有权办公室”

使用 Windows 7 操作系统

谢谢

一些研究发现了以下内容:

http://www.python.org/workshops/2002-02/papers/17/index.htm

http://www.unixuser.org/~euske/python/pdfminer/index.html

http://pybrary.net/pyPdf/pythondoc-pyPdf.pdf.html#pyPdf.pdf.PdfFileWriter-class

4

2 回答 2

5

你可以试试这两种方法:

  • PdfTK是一个操作 PDF 的实用程序。检查此链接,他们正在做类似于您需要的事情(在评论中,有人还发布了 Windows 脚本)

  • PDFsam是一个强大的图形化工具,可以批量处理 PDF。拆分+合并部分应该可以解决问题。

两者都是免费的,如果你想写一个你可以经常使用的“食谱”,我建议你先学习,但如果你必须这样做一次,我建议你先学习。

于 2012-10-22T21:20:58.483 回答
5

您可以使用开源 PDFBox 作为命令行实用程序来拆分 PDF。

PDFBox 的链接在这里:link

使用 PDFBox 拆分 PDF 的文档在这里:链接

您可以使用 PDFBox 从批处理脚本中提取文本功能并结合 grep 来识别包含您要查找的文本的页面。提取文本文档在这里:链接

于 2012-10-22T21:08:16.480 回答