我正在尝试从一个流行的新闻网站上抓取评论,以便使用 curl 进行学术研究。它适用于评论少于 300 条的文章,但在那之后它就很困难了。
$handle = curl_init($url);
curl_setopt($handle, CURLOPT_RETURNTRANSFER, true);
$html = curl_exec($handle);
curl_close($handle);
echo $html; //just to see what's been scraped
但是这个只返回 36 条评论,尽管总共有 700 多条评论:http ://www.guardian.co.uk/commentisfree/2012/aug/21/everyones-talking-about-rape?commentpage=all#start-of -注释
为什么它在为拥有大量评论的文章而苦苦挣扎?