我想在java中获取ODT文件的数据。为此,我有两种方法。
1)。我从 ODT 文件中提取数据并创建一个新文档
2)。获取 odt 文档的打印预览并将其作为图像添加到 PDF 文档中
您能否建议哪种方法更好,我该怎么做?
我想在java中获取ODT文件的数据。为此,我有两种方法。
1)。我从 ODT 文件中提取数据并创建一个新文档
2)。获取 odt 文档的打印预览并将其作为图像添加到 PDF 文档中
您能否建议哪种方法更好,我该怎么做?
最后我使用了第三种方法。在寻找我的答案时,我偶然发现了一个用于我的目的的 JAVA 库XdocReport
。我在那里使用 ODT 和 DOCX 转换器将 ODT/DOCX 转换为 PDF 格式。
对于提取: 1)您可以使用纯 Java,解压缩文件并处理(大部分)content.xml 文件。2) 您可以使用 LibreOffice Java SDK 创建到 LibreOffice 的桥梁并以编程方式提取文本。SDK 中有执行此操作的示例代码。
对于转换:1)您可以从命令行(再次使用 Libre Office)进行转换:soffice --convert-to pdf 2)您可以使用 SDK 以编程方式驱动它,如上面的 #2。有一个博客将文档转换为 PDF我写了一段时间,其中显示了一个示例,重点是 Doc 输入(但 ODT 是相同的)。
这取决于您想要执行此操作的频率、性能限制等。