6

我之前得到了一些关键字,我想通过 python 搜索 pdf 文档并突出显示它们。像pdfMiner这样的库是否可行?

4

1 回答 1

3

是的,您可以使用“PyMuPDF”库。点安装 PyMuPDF。

然后使用下面的代码,

import fitz

### READ IN PDF

doc = fitz.open(r"D:\XXXX\XXX.pdf")
page = doc[0]

text = "Amey"
text_instances = page.searchFor(text)

### HIGHLIGHT

for inst in text_instances:
    print(inst, type(inst))
    highlight = page.addHighlightAnnot(inst)


### OUTPUT

doc.save(r"D:\XXXX\XXX.pdf", garbage=4, deflate=True, clean=True)
于 2019-04-10T07:03:18.043 回答