我有以下代码从给定的网址中提取所有超链接(网址)。
<?php include "simple_html_dom.php";
$html=new simple_html_dom();
$html->load_file('http://www.indiastudychannel.com/colleges');
$links=$html->find('a');
foreach($links as $l)
{
$path='http://www.indiastudychannel.com/colleges'.$l->href;
//doScrape($path);
echo $path."<br>";
}
?>
上面的代码提取了所有超链接,但我只想提取具有以下模式的链接。
http://www.indiastudychannel.com/colleges/54499-Godavari-College-Nursing.aspx http://www.indiastudychannel.com/colleges/54489-Rvs-College-Arts-And-Science.aspx http:// www.indiastudychannel.com/colleges/54488-Sankara-Institute-Management.aspx
我知道这可以使用正则表达式来完成,但我不知道具体如何。请举个例子,让我很容易理解。