尽管使用了 FOLLOWLOCATION 和 MAXREDIRS,但我收到 301 错误。我不知道该怎么做,我尽我所能:HEADER 为 0,FOLLOWLOCATION 为 1,MAXREDIRS 为 30,多次更改 USERAGENT,单独使用 COOKIEFILE,然后使用 COOKIEJAR,但没有。
这是最奇怪的部分:我试图抓取的同一个网站不会为其他页面提供 301,只是针对某些页面。有任何想法吗??
function curl_start($url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.3) Gecko/2008092417 Firefox/3.0.4");
curl_setopt($ch, CURLOPT_REFERER, "http://google.com/");
curl_setopt($ch, CURLOPT_HEADER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, "gzip");
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_FRESH_CONNECT, 1);
$html = curl_exec($ch);
curl_close($ch);
return $html;
}