我想使来自外部 URL 的 PDF 可搜索。我正在使用来自 XPDF 的 pdftotext。它适用于我的网络空间中已有的 PDF,但在尝试使用外部 PDF 时,我不断收到错误消息。具体来说,我得到:
“错误:无法打开文件'https://www.vericoa.com/sandbox/test2.pdf'”
这是我的代码
$path = 'https://www.vericoa.com/sandbox/test2.pdf';
echo shell_exec('pdftotext -enc UTF-8 '.$path.' pdf.txt 2>&1');
$file = file_get_contents('pdf.txt');
echo $file;
甚至可以从外部 PDF 源中提取文本吗?有没有其他选择(我花了最后几个小时搜索,但一无所获)。
提前感谢马蒂亚斯