我有一个包含一些链接的 pdf。链接不会像http://www.example.com/abcd.pdf。但是有一些文本链接到一些 url。我只想提取该网址。
问问题
1822 次
1 回答
0
没有必要像我最初那样单独选择 pdf 阅读选项。我们可以通过 fopen() 方法或 file_get_contents() 方法简单地读取 pdf 文件。
$pdf_content = file_get_contents($actual_pdf_file, true);
preg_match_all('/URI\(([^,]*?)\)\/S\/URI/', $pdf_content, $matches);
我根据我的要求编写了这个 preg_match_all 函数。每个链接都有 URI。
现在我们将获取 $matches 数组中的 url(如果有)。我的情况是这个 url 是一个 pdf 下载链接。从链接下载pdf的代码如下...
foreach($matches[1] as $pdfurl)
{
$CurlConnect = curl_init();
curl_setopt($CurlConnect, CURLOPT_URL, $pdfurl);
curl_setopt($CurlConnect, CURLOPT_POST, 1);
curl_setopt($CurlConnect, CURLOPT_RETURNTRANSFER, 1);
@curl_setopt($CurlConnect, CURLOPT_POSTFIELDS, $request);
$Result = curl_exec($CurlConnect);
$new_down_pdf='new_pdf_name.pdf';
file_put_contents($new_down_pdf,$Result);
}
于 2013-07-26T05:29:16.893 回答