我需要最好使用批处理在 Java/J2EE 平台上的服务器端以编程方式将一组静态 HTML 文档转换为单个 PDF 文件。pdf 文件将分发给站点用户以供离线浏览网页。
要求主要有以下几点:
- 顶部的横幅不应出现在最终的 pdf 文档中。
- 左侧的导航栏应该从 html 超链接转换为 pdf 书签。
- 网页中出现的所有超链接内容(html/pdf/doc/docx 等)都应该是带有 pdf 书签的最终 pdf 文档的一部分。
有没有标准的开源方式来做到这一点?
试试Apache FOP。我只是用它来将 XML 转换为 PDF,我认为你可以用 HTML/DOM 做同样的事情。该网站有一整节关于在 Java 应用程序中运行 FOP 以及DOM 到 PDF 的示例代码。
您可以为此尝试www.alt-soft.com Xml2PDF
您可以尝试iText - 但我不确定它是否能满足您的所有需求。
此外,如果您探索许多选项,然后决定您能做什么和不能做什么,总是会更好。在许多情况下,不会有任何库/API 开箱即用地支持您所要求的一切。