3

我有一个包含一些链接的 pdf。链接不会像http://www.example.com/abcd.pdf。但是有一些文本链接到一些 url。我只想提取该网址。

4

1 回答 1

0

没有必要像我最初那样单独选择 pdf 阅读选项。我们可以通过 fopen() 方法或 file_get_contents() 方法简单地读取 pdf 文件。

    $pdf_content = file_get_contents($actual_pdf_file, true);
    preg_match_all('/URI\(([^,]*?)\)\/S\/URI/', $pdf_content, $matches);

我根据我的要求编写了这个 preg_match_all 函数。每个链接都有 URI。

现在我们将获取 $matches 数组中的 url(如果有)。我的情况是这个 url 是一个 pdf 下载链接。从链接下载pdf的代码如下...

foreach($matches[1] as $pdfurl)
    {       
    $CurlConnect = curl_init();
    curl_setopt($CurlConnect, CURLOPT_URL, $pdfurl);
    curl_setopt($CurlConnect, CURLOPT_POST, 1);
    curl_setopt($CurlConnect, CURLOPT_RETURNTRANSFER, 1);
    @curl_setopt($CurlConnect, CURLOPT_POSTFIELDS, $request);
    $Result = curl_exec($CurlConnect);
    $new_down_pdf='new_pdf_name.pdf';
    file_put_contents($new_down_pdf,$Result);
    }
于 2013-07-26T05:29:16.893 回答