20

将要在浏览器中查看的 PDF 文档转换为 HTML 的最佳解决方案是什么?该站点有几个 PDF 文档,访问者可以单击以 HTML 格式查看,这应该在屏幕上以 HTML 文件的形式查看。

运行 PHP、Linux、Apache 的标准网站。

4

4 回答 4

6

pdftohtml 工作正常:快速、稳定,但 html 结果充其量是丑陋的。我已经为一个有很多工作简历的网站使用了很长一段时间。

然而,这是提取文本内容的一个很好的解决方案。

我会试试scribd API

或谷歌应用程序文档 API。GOogle 在显示和转换 pdf 文件方面做得很好

于 2010-02-12T06:01:02.647 回答
4

您是否考虑过将 PDF 数据保存在数据库中,然后根据访问者的选择动态创建 PDF 或 html 页面?

于 2009-06-05T16:08:17.703 回答
4

如果您在托管服务提供商处具有命令行访问权限,则 poppler_utils 包内有一个名为 pdftohtml 的实用程序。

http://poppler.freedesktop.org/

看起来很容易使用,没有从 PHP 内部调用它,但它应该可以工作。

于 2009-06-05T17:18:33.460 回答
1

如果您准备从 PHP 调用 Java,您可以查看http://www.jpedal.org/html_index.php

于 2012-01-17T08:00:38.057 回答