我正在尝试编写一个 python 脚本,该脚本将自动在 pdf 中查找文本并根据
我正在使用 python 的 pymupdf 模块。它适用于一些pdf。但是,对于目标 pdf(组件和属性表的绘图),它会将输出保存为没有数据和一些空白突出显示的空白 pdf。
import fitz
doc=fitz.open("c5.pdf")
page = doc[0]
text = "a"
text_instances = page.searchFor(text)
for inst in text_instances:
highlight = page.addHighlightAnnot(inst)
doc.save("out.pdf", garbage=4, deflate=True, clean=True)