嘿伙计们,我需要正则表达式的帮助。
我正在使用 file_get_contents() 来获取页面的源代码,然后我想遍历源代码并找到所有并将所有 HREF 值提取到一个数组中。
谢谢
嘿伙计们,我需要正则表达式的帮助。
我正在使用 file_get_contents() 来获取页面的源代码,然后我想遍历源代码并找到所有并将所有 HREF 值提取到一个数组中。
谢谢
与正则表达式相比,您应该更好地使用像SimpleXML或DOMDocument这样的真正解析器。A
这是一个带有 DOMDocument 的示例,它将为您提供一个元素数组:
$doc = new DOMDocument();
$doc->loadHTML($str);
$aElements = $doc->getElementsByTagName("a");
foreach ($aElements as $aElement) {
if ($aElement->hasAttribute("href")) {
// link; use $aElement->getAttribute("href") to retrieve the value
} else {
// not a link
}
}