Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在我的项目中使用 poppler 进行 pdf 到 html 的转换。是否有任何其他第三方插件可以将给定的 PDF 文档转换为 html 并提高转换质量?我们可以使用 apose.PDF java 库实现 pdf 到 html 的转换吗?
查看JPedal,它能够将 PDF 转换为 HTML。我最近不得不将它用于另一个用例,结果非常好。它可以很好地处理嵌入的字体。不幸的是,它不是免费的。
另一个很棒的(免费)PDF 库是IcePDF,它是免费的,但它只能提取文本/图像或将 PDF 渲染为图像,但效果非常好。
如果你想要一个开源的,请查看pdfBox 。它提供了很好的提取工具。我为提取文本和图像而构建,直到现在,并且运行良好。