1

是否可以使用 Apache PDFBox 从 MS Office 文件格式转换(文档对此并不清楚,并且 javadoc 似乎表明不存在此类功能),还是我需要使用 Apache POI 进行一些繁琐的转换?

我问的原因是这个 StackOverflow 问题的答案:

https://stackoverflow.com/questions/10861227/convert-ms-office-to-pdf-in-java

我想我需要使用 Apache POI,但我想澄清一下。

4

2 回答 2

1

为了进行这种转换,您将需要 MS Office,或者可能需要 Google Drive。PDFBox 不会从任何东西转换为 PDF,反之亦然——它只是读取和写入 PDF 文件。Apache POI 也不会进行这种类型的转换——它只是读写 MS Office 文件。具体来说,它不会渲染它们。您可以自己为每种类型的 Office 文件实现一个渲染引擎,但这至少可以说是一项艰巨的任务。

于 2013-03-01T17:55:16.197 回答
0

看看https://angelozerr.wordpress.com/2012/12/06/how-to-convert-docxodt-to-pdfhtml-with-java/

它提到的可能选项之一是XWPFConverterPDFViaIText

org.apache.poi.xwpf.converter.pdf 提供基于Apache POI XWPFiText的 DOCX 2 Pdf 转换器。

您可以使用 REST 转换器服务http://xdocreport-converter.opensagres.cloudbees.net/测试此转换器

于 2016-11-23T16:48:09.930 回答