0

我有一个 pdf 文档,为简单起见,我想制作同一个 pdf 的两个(许多)不同的编辑版本。

例如,在其中一个 pdf 中,我希望突出显示 pdf 中的所有“and”,而在第二个中,我希望突出显示所有“the”。

我尝试使用 PyMuPDF 这样做:

import fitz
pdf = "mypdf.pdf"
doc = fitz.open(pdf)

text = ["and"]
for j in text:
    i = page.searchFor(j)
     for inst in i:
        highlight = page.addHighlightAnnot(inst)
doc.save("output_and.pdf", garbage=4, deflate=True, clean=True)

text = ["the"]
for j in text:
    i = page.searchFor(j)
    for inst in i:
        highlight = page.addHighlightAnnot(inst)
doc.save("output_the.pdf", garbage=4, deflate=True, clean=True)

这里第一个文件 (output_and.pdf) 具有预期的内容,但在第二个文件 (output_the.pdf) 中突出显示了“and”和“the”。有没有办法取消突出显示“和”,然后以这样的方式保存或保存文件,这样下次我保存 pdf 时它不会影响。

4

0 回答 0