python - 使用 Python 将扫描的 PDF 填充字段与可填充 PDF 模板合并

翻译自：https://stackoverflow.com/questions/69899653 2021-11-09T14:11:28.250

17 次

给定一个标准化的可填写表格，如W2：如何将扫描的 pdf/jpg （示例 W2）中的信息添加到第一个超链接中各自的可填写表格字段？

从概念上讲，我的想法是文档相互重叠，并且扫描的可填充部分将被“抓取”/OCR 到输出文档，该输出文档是可填充的模板，添加了扫描的相应文本。

到目前为止，当 PDF 正确填写在 Adobe 中时，PyPDF2 的 getFormTextFields() 非常棒，但我想在没有底层可填充层的文档上使用 getFormTextFields()。

有什么建议么？

0 回答 0