4

我正在编写一个 PHP 程序,它从后端下载 pdf 并保存到本地驱动器。现在如何在下载之前检查文件是否存在?

目前我正在使用 curl(见下面的代码)来检查和下载,但它仍然下载大小为 1KB 的文件。

$url = "http://wedsite/test.pdf";
$path = "C:\\test.pdf;"
downloadAndSave($url,$path);

function downloadAndSave($urlS,$pathS)
    {
        $fp = fopen($pathS, 'w');

        $ch = curl_init($urlS);

        curl_setopt($ch, CURLOPT_FILE, $fp);
        $data = curl_exec($ch);

        $httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);
        echo $httpCode;
        //If 404 is returned, then file is not found.
        if(strcmp($httpCode,"404") == 1)
        {
            echo $httpCode;
            echo $urlS; 
        }

        fclose($fp);

    }

我想在下载之前检查文件是否存在。知道怎么做吗?

4

4 回答 4

9

您可以使用单独的 curlHEAD请求来执行此操作:

curl_setopt($ch, CURLOPT_NOBODY, true);
$data = curl_exec($ch);

$httpCode = curl_getinfo($ch, CURLINFO_HTTP_CODE);

当你真正想要下载时,你可以使用 set NOBODYto false

于 2013-02-05T03:58:33.340 回答
2

由于您使用 HTTP 在 Internet 上获取资源,因此您真正要检查的是返回码是 404。

在某些 PHP 安装中,您可以直接使用file_exists($url)。然而,这并不适用于所有环境。http://www.php.net/manual/en/wrappers.http.php

这是一个非常类似于file_existsURL 的函数,但使用 curl:

<?php function curl_exists()
  $file_headers = @get_headers($url);
  if($file_headers[0] == 'HTTP/1.1 404 Not Found') {
    $exists = false;
  }
  else {
    $exists = true;
  }
} ?>

来源:http ://www.php.net/manual/en/function.file-exists.php#75064

有时 CURL 扩展没有随 PHP 一起安装。在这种情况下,您仍然可以在 PHP 核心中使用套接字库:

<?php function url_exists($url) {
       $a_url = parse_url($url);
       if (!isset($a_url['port'])) $a_url['port'] = 80;
       $errno = 0;
       $errstr = '';
       $timeout = 30;
       if(isset($a_url['host']) && $a_url['host']!=gethostbyname($a_url['host'])){
           $fid = fsockopen($a_url['host'], $a_url['port'], $errno, $errstr, $timeout);
           if (!$fid) return false;
           $page = isset($a_url['path'])  ?$a_url['path']:'';
           $page .= isset($a_url['query'])?'?'.$a_url['query']:'';
           fputs($fid, 'HEAD '.$page.' HTTP/1.0'."\r\n".'Host: '.$a_url['host']."\r\n\r\n");
           $head = fread($fid, 4096);
           $head = substr($head,0,strpos($head, 'Connection: close'));
           fclose($fid);
           if (preg_match('#^HTTP/.*\s+[200|302]+\s#i', $head)) {
            $pos = strpos($head, 'Content-Type');
            return $pos !== false;
           }
       } else {
           return false;
       }
   } ?>

来源:http ://www.php.net/manual/en/function.file-exists.php#73175

更快的功能可以在这里找到: http ://www.php.net/manual/en/function.file-exists.php#76246

于 2013-02-05T04:01:16.967 回答
2

在您的下载功能之前调用它并完成:

<?php function remoteFileExists($url) {
    $curl = curl_init($url);

    //don't fetch the actual page, you only want to check the connection is ok
    curl_setopt($curl, CURLOPT_NOBODY, true);

    //do request
    $result = curl_exec($curl);

    $ret = false;

    //if request did not fail
    if ($result !== false) {
        //if request was ok, check response code
        $statusCode = curl_getinfo($curl, CURLINFO_HTTP_CODE);  

        if ($statusCode == 200) {
            $ret = true;   
        }
    }

    curl_close($curl);

    return $ret;
}

?>

于 2016-02-28T00:27:04.787 回答
0

在上面的第一个示例中,$file_headers[0] 可能包含“HTTP/1.1 404 Not Found”以外的内容,例如:

HTTP/1.1 404 Document+%2Fdb%2Fscotbiz%2Freports%2FR20131212%2Exml+not+found

所以使用其他测试很重要,例如,正则表达式,因为'==' 不可靠。

于 2013-12-13T10:56:53.027 回答