0

我想以编程方式查找 PDF 中包含某个子字符串的所有页面,如果有,那么我想用另一个 PDF 替换该页面。替换该页面不是问题——我可以使用 PHP 的 pdflib 绑定​​或 pdftk 来做到这一点。我不知道该怎么做是如何测试页面是否包含特定文本。

有任何想法吗?

4

1 回答 1

1

我认为您最好的选择是使用 pdftk 将 PDF 拆分为单页,然后使用xpdf的 pdftotext 命令将内容转换为文本,并使用 PHP 或 grep 搜索生成的文本。

于 2013-04-26T17:33:35.060 回答