我目前拥有:一份 XFA PDF 表格和一个 .dat 文件(里面都是 txt 格式)
我需要做的:将 .dat 数据导入 XFA PDF 表单
目前的思考过程:
- 将 .dat 数据转换为 XML 格式
- 从 XFA PDF 文件中提取字段
- 使用提取的字段将转换后的 XML 数据导入 XFA PDF 文件
问题:
字段提取;无法使用 pdftk,因为 PDF 表单是 XFA 而不是 AcroForm;有什么方法可以在不订阅 Acrobat/Livecycle 的情况下做到这一点?此外,pdfminer 在这里没有给出好的结果,它似乎不适用于 XFA 格式。
XML 导入 PDF;关于如何实际执行此操作没有好主意,是否存在任何 python 模块?