我正在尝试从该网站的搜索结果中抓取数据
有人告诉我,最好的方法是使用http://simplehtmldom.sourceforge.net/中的 simple_html_dom 类 。结果页面非常繁忙,我无法优化抓取的数据。
我通过以下方式获取页面内容:
$html = file_get_html('http://www.birthdatabase.com/cgi-bin/query.pl?textfield=' . $first . '&textfield2=' . $last . '&age=&affid=');
我收到的代码是:
$n = 0;
foreach($html->find('table tbody tr td div font b table tbody') as $element) {
@$row[$n]['tr'] = $element->find('tr')->text;
$n++;
}
// output your data
print_r($row);
这个 DOM 导航正确吗?有没有更好的方法来获取抓取的数据?
谢谢