我必须阅读带有一些静态字段(如标题、标题)的 .doc 或 .docx 文档以及用 Java 编写的程序。使用相同的程序,用户填写表单 (GUI),所有这些信息都应添加到先前阅读的文档中的正确位置。
哪个框架最适合我的工作?
请参阅apache-poi-or-docx4j-for-dealing-with-docx-documents
有关将文本添加到文档中的技术,请参阅文档生成
docx4j 主要适用于 docx(和 pptx、xlsx)文件。就遗留二进制文档而言,您有几个选择:
使用 POI 的 HWPF 支持。这作为依赖项包含在 docx4j 中。但这不是一个好方法,因为它不会将文档转换为 docx4j 的内部表示:- 你有点卡在 HWPF 领域
使用 JODConverter 将 doc 转换为 docx,如有必要,再返回。这是最好的方法。