TI 想要获取远程站点 html 代码,为此我使用 CURL,这是我的代码
$URL = "http://example.com/";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $URL);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_ENCODING, 'UTF-8');
$content = curl_exec($ch);
curl_close($ch);
这几乎适用于每个网站,我获得了完整的 HTML 内容。
但是有1个网站,抓取结果是html代码到</head>
,也就是结束head
标签之后,curl没有得到html源。
当我通过浏览器看到这个网站的 html 源代码时view source
,这里是整个 html(网站也很好)。
可能是什么原因,curl 没有得到整个 html 源代码?