0

我正在尝试在 PHP 中使用 Curl 来读取不可靠的网页。由于服务器错误,该页面通常不可用。但是,如果它可用,我仍然需要阅读它。此外,我不希望网页的不可靠性影响我的代码。我希望我的 PHP 能够优雅地失败并继续前进。这是我到目前为止所拥有的:

<?php
    function get_url_contents($url){
        $crl = curl_init();
        $timeout = 2;
        curl_setopt ($crl, CURLOPT_URL,$url);
        curl_setopt ($crl, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt ($crl, CURLOPT_CONNECTTIMEOUT, $timeout);
        $ret = curl_exec($crl);
        curl_close($crl);
        return $ret;
    }
    $handle = get_url_contents ( 'http://www.mydomain.com/mypage.html' );
?>
4

2 回答 2

3

改用它,CURL 不再像我听说的那样被超级推荐,因为 PHP 包装器提供了更好的性能,并且随时随地都可以使用:

$currentcontext = stream_context_get_default();
stream_context_set_default(stream_context_create(array('timeout' => 2)));
$content = file_get_contents('url', $context);
stream_context_set_default($currentcontext);

这会将默认流上下文设置为 2 秒后超时,并通过流包装器获取 url 的内容,该流包装器应该存在于 5.2 及更高版本的所有 php 版本中;

您没有义务根据您网站的代码恢复默认上下文,但这始终是一件好事。如果你不这样做,那么这个操作只需要 2 行代码就可以实现......

于 2012-06-22T12:59:39.173 回答
1

您可以通过测试 HTTP 响应代码来测试 HTTP 代码以查看页面是否成功检索。我不记得 >200 和 <302 是否是正确的代码范围,如果您使用此方法,请在http 响应代码处快速达到峰值。

<?php
    function get_url_contents($url){
        $crl = curl_init();
        $timeout = 2;
        curl_setopt ($crl, CURLOPT_URL,$url);
        curl_setopt ($crl, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt ($crl, CURLOPT_CONNECTTIMEOUT, $timeout);
        $ret['pagesource'] = curl_exec($crl);
        $httpcode = curl_getinfo($crl, CURLINFO_HTTP_CODE);
        curl_close($crl);

        if($httpcode >=200 && $httpcode<302) {
         $ret['response']=true;
        } else {
         $ret['response']=false;
        }

        return $ret;
    }
    $handle = get_url_contents ( 'http://192.168.1.118/newTest/mainBoss.php' );
    if($handle['response']==false){
          echo 'page is no good';
    } else {
             echo 'page is ok and here it is:' . $handle['pagesource'] . 'DONE.<br>';
    }

?>
于 2012-06-23T04:09:19.377 回答