我有一个 pdf 文档,为简单起见,我想制作同一个 pdf 的两个(许多)不同的编辑版本。
例如,在其中一个 pdf 中,我希望突出显示 pdf 中的所有“and”,而在第二个中,我希望突出显示所有“the”。
我尝试使用 PyMuPDF 这样做:
import fitz
pdf = "mypdf.pdf"
doc = fitz.open(pdf)
text = ["and"]
for j in text:
i = page.searchFor(j)
for inst in i:
highlight = page.addHighlightAnnot(inst)
doc.save("output_and.pdf", garbage=4, deflate=True, clean=True)
text = ["the"]
for j in text:
i = page.searchFor(j)
for inst in i:
highlight = page.addHighlightAnnot(inst)
doc.save("output_the.pdf", garbage=4, deflate=True, clean=True)
这里第一个文件 (output_and.pdf) 具有预期的内容,但在第二个文件 (output_the.pdf) 中突出显示了“and”和“the”。有没有办法取消突出显示“和”,然后以这样的方式保存或保存文件,这样下次我保存 pdf 时它不会影响。