0

我想使来自外部 URL 的 PDF 可搜索。我正在使用来自 XPDF 的 pdftotext。它适用于我的网络空间中已有的 PDF,但在尝试使用外部 PDF 时,我不断收到错误消息。具体来说,我得到:

“错误:无法打开文件'https://www.vericoa.com/sandbox/test2.pdf'”

这是我的代码

$path = 'https://www.vericoa.com/sandbox/test2.pdf'; 

echo shell_exec('pdftotext -enc UTF-8 '.$path.' pdf.txt 2>&1');  

$file = file_get_contents('pdf.txt');

echo $file;

甚至可以从外部 PDF 源中提取文本吗?有没有其他选择(我花了最后几个小时搜索,但一无所获)。

提前感谢马蒂亚斯

4

1 回答 1

0

您也许可以尝试在 php 中下载外部 URL,将其保存到文件中并将其传递给 pdftotext 脚本?

于 2012-10-21T19:19:42.067 回答