0

嘿伙计们,我需要正则表达式的帮助。

我正在使用 file_get_contents() 来获取页面的源代码,然后我想遍历源代码并找到所有并将所有 HREF 值提取到一个数组中。

谢谢

4

1 回答 1

1

与正则表达式相比,您应该更好地使用像SimpleXMLDOMDocument这样的真正解析器。A这是一个带有 DOMDocument 的示例,它将为您提供一个元素数组:

$doc = new DOMDocument();
$doc->loadHTML($str);
$aElements = $doc->getElementsByTagName("a");
foreach ($aElements as $aElement) {
    if ($aElement->hasAttribute("href")) {
        // link; use $aElement->getAttribute("href") to retrieve the value
    } else {
        // not a link
    }
}
于 2009-09-30T08:47:26.410 回答