我正在尝试编写一个正则表达式来从 HTML 源中提取 URL 列表的href
和anchor
文本。anchor
文本可以是任何值。
HTML部分如下:
<div class="links"><a rel="nofollow" target="_blank" href="http://url1.com" class="get-all">URL1</a><a rel="nofollow" target="_blank" href="http://url2.com" class="get-all">This is Url-2</a><a rel="nofollow" target="_blank" href="http://url3.com" class="get-all">This is Url-3</a><a rel="nofollow" target="_blank" href="http://url4.com" class="get-all">Sweet URL 4</a></div>
我尝试了以下正则表达式,但它不起作用,因为它在</a>
标记之前抓取所有内容并失败。
preg_match_('/<a rel="nofollow" target="_blank" href="(.*)" class="see-all">(.*)<\/a>/', $source , $website_array);
提取所需数据的有效正则表达式是什么?