0

给定一个标准化的可填写表格,如W2:如何将扫描的 pdf/jpg (示例 W2)中的信息添加到第一个超链接中各自的可填写表格字段?

从概念上讲,我的想法是文档相互重叠,并且扫描的可填充部分将被“抓取”/OCR 到输出文档,该输出文档是可填充的模板,添加了扫描的相应文本。

到目前为止,当 PDF 正确填写在 Adob​​e 中时,PyPDF2 的 getFormTextFields() 非常棒,但我想在没有底层可填充层的文档上使用 getFormTextFields()。

有什么建议么?

4

0 回答 0