有没有办法通过突出显示所需的字段来获取扫描的 PDF 图像并从图像中提取数据?我们每天扫描数以千计的房地产契约 PDF 图像,并希望能够自动化数据输入过程。我们面临的问题是没有两件事是相同的。
问问题
251 次
1 回答
0
评论中已经说过,Stackoverflow 主要是关于编程问题。
然而,根据实际文件和要处理的数量,还是有可能的。
在高端,有一款名为 Teleform 的产品,最初由 Cardiff 开发,现在归 HP 所有,用于处理纸质表格;您还可以查看业务流程应用程序 Cardiff LiquidOffice,即现在的 HP LiquidOffice。
在低端,我开发了一个 PDF 格式的应用程序,在 Acrobat 下运行,它可以采用扫描和 OCRd 表格,并将数据传输到专门准备的可填写表格,从那里可以将数据导出到数据库,例如. 如需更多信息、演示和报价,请随时私下与我联系。
如果你想使用 Acrobat 开发一些东西,你也可以从一个 OCRd 文档开始,然后使用 Redaction 功能的能力(或使用 Appligent 的工业实力 Redaction 工具 Redax)找到关键字,然后使用位置信息这些关键字以提取更多数据。
于 2015-11-24T09:38:48.630 回答