因此,对于不熟悉简单 HTML DOM 的任何人,我已经使用 CURL 和 simple_html_dom 有一段时间了 - 它允许您轻松浏览元素,而无需使用 regex/exploding 的东西等等。
例如
$html = file_get_html($obj->loc);
$item['title'] = $html->find('#Prod-Name h1',0)->plaintext;
但是,据我所知,这不支持 cookie - 就像 CURL 一样,有什么可以做的吗?
有兴趣听听人们在此屏幕抓取/机器人创建方面的经验。