实际上,我是 PHP 新手,我想抓取此链接以获取有关在我国提供服务的所有快递公司的信息。我需要的所有信息都在一个 div 标签中,即。我需要这个标签内的所有信息,包括图片、段落和链接。我已经对此进行了一些研究,并且能够抓取该页面。
<?php
function crawl_page($url, $depth = 1)
{
static $seen = array();
if (isset($seen[$url]) || $depth === 0) {
return;
}
$seen[$url] = true;
$dom = new DOMDocument('1.0');
@$dom->loadHTMLFile($url);
$xpath = new DomXpath($dom);
$divTag = $xpath->query('//div[@class="rescont"]');
foreach ($divTag as $val) {
echo $dom->saveXML($val).'<br />\n';// or
}
}
crawl_page("http://www.phonebook.com.pk/Dynamic/Search.aspx?k=courier&l=pakistan&SearchType=kl", 1);
?>
编辑:
现在我可以在我的网页上显示所有内容,但图像和其他一些信息不可用,因为它是相对于该服务器链接的。我也可以提取该信息吗?