python - 优化 PDF 中的扫描页面

翻译自：https://stackoverflow.com/questions/44416765 2017-06-07T15:21:21.130

236 次

我正在开发一个自动化项目，该项目需要我识别扫描的 pdf（图像）中的文本。我需要在 python 中编写代码，使用 Acrobat Pro DC 中的识别文本功能将整个 PDF（扫描）转换为可读的 PDF。

到目前为止，我已经在 python 中编写了以下代码：

avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")

这会打开 pdf 文件并将我带到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出？

0 回答 0