0

解决此问题的最佳方法是使用“xpdf”包中的“pdftotext”,但在我用谷歌搜索的所有共享主机中,shell_exec 已禁用。我找到了仅使用 php 的替代方法,例如一个名为 pdf2string() 的函数(在 php.net 上),但这些函数都没有按预期工作(对于一些 pdf 文件,它们只是没有输出正确的文本和其他一些 pdf他们没有输出任何内容,并且此功能的其他一些版本根本不起作用,因此我排除了此选项)。有什么方法可以将该开源 pdftotext 转换为 php 脚本?(我认为源代码在 c++ 中,可以在这里找到:http ://www.foolabs.com/xpdf/download.html )。只要它给我pdf的文本输出(正确的),任何其他解决方案都将被接受

4

1 回答 1

3

由于您的环境受到限制,因此您可能需要查看此内容。 http://webcheatsheet.com/php/reading_clean_text_from_pdf.php

这不使用外部库将 pdf 解析为文本格式。但是,由于这个解析文本是原始 pdf 格式的,我不确定它有多稳定。

于 2012-04-18T22:45:07.260 回答