0

因此,我可以选择从数据库发送文档以 PDF 或 XPS 格式打印。我需要能够从其中一种格式中提取特定数据,例如姓名、日期等,并将该数据插入到 word 模板中。单词模板不可编辑。您只能在字段内输入...每个字段前面都有一个标题,例如姓名、出生日期等。

基本上我需要能够自动将该信息从 PDF 或 XPS 文件传输到 word 模板。

我对 C++、Python 和 Java 已经足够熟悉了。所以我没有语言偏好——只要能完成这项工作。

你能建议我能做到这一点的方法吗?我在弄清楚如何从其中一种文件类型中解析/提取数据以及哪种文件类型是更好的候选者时遇到了一些困难。而且我绝对不知道如何自动化 Word 模板中的字段填充。

哦,忘了提,这是在 Windows 7(也许是 8,但主要是 7)机器上。

非常感谢您提前提供的帮助!

4

1 回答 1

0

这适用于任何有相同问题的人,所以我是这样做的:

我使用 PDFBox ( http://pdfbox.apache.org/ ) 来解析文档并提取所需的数据,然后我使用 docx4j ( http://www.docx4java.org/trac/docx4j ) 将数据插入到 word 模板中. 两者都是令人难以置信的工具,并且拥有几乎可以立即提供帮助的优秀社区。

于 2013-08-13T01:42:13.113 回答