将要在浏览器中查看的 PDF 文档转换为 HTML 的最佳解决方案是什么?该站点有几个 PDF 文档,访问者可以单击以 HTML 格式查看,这应该在屏幕上以 HTML 文件的形式查看。
运行 PHP、Linux、Apache 的标准网站。
将要在浏览器中查看的 PDF 文档转换为 HTML 的最佳解决方案是什么?该站点有几个 PDF 文档,访问者可以单击以 HTML 格式查看,这应该在屏幕上以 HTML 文件的形式查看。
运行 PHP、Linux、Apache 的标准网站。
pdftohtml 工作正常:快速、稳定,但 html 结果充其量是丑陋的。我已经为一个有很多工作简历的网站使用了很长一段时间。
然而,这是提取文本内容的一个很好的解决方案。
我会试试scribd API
或谷歌应用程序文档 API。GOogle 在显示和转换 pdf 文件方面做得很好
您是否考虑过将 PDF 数据保存在数据库中,然后根据访问者的选择动态创建 PDF 或 html 页面?
如果您在托管服务提供商处具有命令行访问权限,则 poppler_utils 包内有一个名为 pdftohtml 的实用程序。
http://poppler.freedesktop.org/
看起来很容易使用,没有从 PHP 内部调用它,但它应该可以工作。
如果您准备从 PHP 调用 Java,您可以查看http://www.jpedal.org/html_index.php