0

我只想使用 curl 加载 head 的内容,目前我正在使用

<?php 

$url="www.facebook.com";

$title='';$keywords='';$description='';
    $ch = curl_init();
$timeout=5;
    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_URL, 'http://'.$url);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
    curl_setopt ($ch, CURLOPT_TIMEOUT,0);

    $html = curl_exec($ch);
    curl_close($ch);
echo htmlspecialchars($html);//gives the complete source.Why?

//parsing begins here:
$doc = new DOMDocument();
@$doc->loadHTML($html);

$nodes = $doc->getElementsByTagName('title');
$metas = $doc->getElementsByTagName('meta');

if($nodes->length>0)$title = $nodes->item(0)->nodeValue;

for ($i = 0; $i < $metas->length; $i++)
{
    $meta = $metas->item($i);
    if($meta->getAttribute('name') == 'description')
        $description = $meta->getAttribute('content');
    if($meta->getAttribute('name') == 'keywords')
        $keywords = $meta->getAttribute('content');
}
echo $title. '<br/>';
echo "&nbsp;&nbsp;&nbsp;&nbsp;$description". '<br/>';
echo "&nbsp;&nbsp;&nbsp;&nbsp;$keywords";
?>

此代码返回 url 的完整代码,但我只想要 head。不要将它与我之前的问题联系起来,因为这里没有必要使用 curlopt_writefunction()

4

2 回答 2

0

CURLOPT_HEADER 应该是 TRUE,而不是 0

CURLOPT_NOBODY 应该是 TRUE

curl_setopt($ch, CURLOPT_NOBODY, TRUE);
于 2012-05-26T15:33:48.793 回答
0

尽管名称相似,但 HEADER 与 html 不对应<head>,BODY 也不与 html 对应<body>CURLOPT_HEADER表示在返回值中包含 http 标头。CURLOPT_NOBODY表示不在返回值中包含 http 有效负载(带有 content-type:text/html 的 http 响应的有效负载将是整个 html 文档)。

于 2012-05-27T16:16:00.500 回答