0

因此,对于不熟悉简单 HTML DOM 的任何人,我已经使用 CURL 和 simple_html_dom 有一段时间了 - 它允许您轻松浏览元素,而无需使用 regex/exploding 的东西等等。

例如

$html = file_get_html($obj->loc);
$item['title'] = $html->find('#Prod-Name h1',0)->plaintext;

但是,据我所知,这不支持 cookie - 就像 CURL 一样,有什么可以做的吗?

有兴趣听听人们在此屏幕抓取/机器人创建方面的经验。

4

1 回答 1

0

您可以使用 curl 下载并使用您选择的解析库对其进行解析。我有时会使用这种方法,但我对它不是很满意,如果 php 有一些像样的抓取库会很好,如果它们是内置的就更好了。

于 2012-09-05T02:39:54.540 回答