我写了一个爬虫,它显然被一些网站阻止了。我想做的是获取带有假用户代理 ID(类似Mozilla/5.0 (Windows NT 6.1; WOW64; rv:7.0.1) Gecko/20100101 Firefox/7.0.12011-10-16 20:23:00
)的页面。请注意,fsockopen()
不支持这一点,所以我试图以不同的方式做到这一点。
这是我的代码:
$sock = fsockopen($host, 80, $errno, $errstr, 30);
然后在下面,这是我用指针做的事情:
$request = "HEAD " . $path . " HTTP/1.1\r\n";
$request .= 'Host: ' . $host . "\r\n";
$request .= "Connection: Close\r\n\r\n";
fwrite($sock, $request);
同样,如何设置假浏览器代理?我可以在$request
字符串中设置它吗?