Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
给定一个标准化的可填写表格,如W2:如何将扫描的 pdf/jpg (示例 W2)中的信息添加到第一个超链接中各自的可填写表格字段?
从概念上讲,我的想法是文档相互重叠,并且扫描的可填充部分将被“抓取”/OCR 到输出文档,该输出文档是可填充的模板,添加了扫描的相应文本。
到目前为止,当 PDF 正确填写在 Adobe 中时,PyPDF2 的 getFormTextFields() 非常棒,但我想在没有底层可填充层的文档上使用 getFormTextFields()。
有什么建议么?