我正在开发一个自动化项目,该项目需要我识别扫描的 pdf(图像)中的文本。我需要在 python 中编写代码,使用 Acrobat Pro DC 中的识别文本功能将整个 PDF(扫描)转换为可读的 PDF。
到目前为止,我已经在 python 中编写了以下代码:
avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")
这会打开 pdf 文件并将我带到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出?