1

我在我的项目中使用 poppler 进行 pdf 到 html 的转换。是否有任何其他第三方插件可以将给定的 PDF 文档转换为 html 并提高转换质量?我们可以使用 apose.PDF java 库实现 pdf 到 html 的转换吗?

4

2 回答 2

2

查看JPedal,它能够将 PDF 转换为 HTML。我最近不得不将它用于另一个用例,结果非常好。它可以很好地处理嵌入的字体。不幸的是,它不是免费的。

另一个很棒的(免费)PDF 库是IcePDF,它是免费的,但它只能提取文本/图像或将 PDF 渲染为图像,但效果非常好。

于 2013-10-21T12:43:19.870 回答
1

如果你想要一个开源的,请查看pdfBox 。它提供了很好的提取工具。我为提取文本和图像而构建,直到现在,并且运行良好。

于 2014-03-18T06:42:54.037 回答