下面是我的一段代码,我在其中搜索特定单词并提取它们的坐标。
根据文档page.searchFor(),page.searchFor(needle, hit_max=16, quads=False, flags=None).
在页面上搜索 needle。忽略大写/小写。字符串可能包含空格。
首先,我想要精确匹配的坐标。其次,如果所选单词是“inter”,它还会从与我的任务冲突的文档中存在的单词 internalization 中提取“inter”的坐标。
有什么办法可以达到同样的效果吗?
doc = fitz.open(document_name)
words = ["Midpoint", "CORPORATE", "internalization"]
for page in doc:
page._wrapContents()
for word in words:
text_instances = page.searchFor(word)
for rect_coordinates in text_instances:
page.addRedactAnnot(rect_coordinates, text_color = (0,0,0), fill = (0,0,0))
page.apply_redactions()