PDF.js 是 Mozilla 的最新库,是一个完全用 Javascript 编写的基于标准的 PDF 渲染器。目前您无法访问生成的 HTML,并且该库只能用作查看器。是否可以使用 PDF.js 将 PDF 静态转换为其等效的 HTML?考虑到它在浏览器中呈现,它必须是 HTML+CSS,并且 JS 将仅用于导航。
将其转换为 HTML 后,我计划使用我们现有的 HTML 工作流程来导入/索引/使用页面,就好像它是一个普通的 HTML 网页一样。
PDF.js 是 Mozilla 的最新库,是一个完全用 Javascript 编写的基于标准的 PDF 渲染器。目前您无法访问生成的 HTML,并且该库只能用作查看器。是否可以使用 PDF.js 将 PDF 静态转换为其等效的 HTML?考虑到它在浏览器中呈现,它必须是 HTML+CSS,并且 JS 将仅用于导航。
将其转换为 HTML 后,我计划使用我们现有的 HTML 工作流程来导入/索引/使用页面,就好像它是一个普通的 HTML 网页一样。
注意:这是针对原始问题的,也适用于其他可能会访问此以获得相关帮助的人,就像我一样。;)
答:
您可以尝试:Poppler或 基于 Poppler 的pdf2htmlEX 。
我建议查看pdf2htmlEX 文档,它也有非常好的比较表。
pdf.js 呈现为 Canvas,因此不能用于将 PDF 静态转换为 HTML
DocPub由PDFNet提供支持,这是一个支持 C# 的 PDF SDK,它支持将 PDF 离线转换为 HTML。
来自同一家公司的WebViewer是基于 HTML5 的 PDF 查看器,可在浏览器中即时呈现文档。
WebViewer 适用于所有主要的 Web 平台;可以在任何 HTML5、Silverlight 或 Flash 应用程序中直接嵌入和自定义查看器。可以从任何系统或设备立即访问内容 - 包括 iPad/iPhone (iOS)、Android、Windows(台式机和平板电脑)、WP8、Linux、Mac 等 -演示
AccuSoft 有一个名为Prizm的基于 HTML5 的 PDF/DOC 查看器。我不认为这可以将 PDF 静态转换为 HTML,但它看起来像一个功能性的基于 HTML5 的查看器。我没有这方面的经验,但在线 HTML5 演示(链接)看起来非常令人印象深刻。他们声称它可以在 PC 和移动设备上用于此类文件的出色渲染。
Accusoft HTML5 查看技术可以通过几乎任何智能手机或平板电脑上的本机浏览器显示几乎任何文档文件——DOC、PDF、PPT、CAD 等等,无需用户设备上的其他应用程序或播放器。