我一直在使用 CURL 来抓取网站以及 Simple HTML DOM。我体验到 CURL 更适合抓取网站。不过我真的很喜欢 Simple HTML DOM 的简单性。所以我想为什么不将两者结合起来,我尝试了:
require_once('simple_html_dom.php');
$url = 'http://news.yahoo.com/';
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$curl_scraped_page = curl_exec($ch);
$html = new simple_html_dom();
$html->load($curl_scraped_page);
foreach($html->find('head') as $d) {
$d->innertext = "<base href='$url'>" . $d->innertext;
}
echo $html->save();
我尽力了,但它不起作用。我还能尝试什么?