1

我想要一个 preg_match 代码来检测给定的字符串并获取它的包装元素。我有一个字符串和一个 html 代码,例如:

$string = "My text";
$html = "<div><p class='text'>My text</p><span>My text</span></div>";

所以我需要创建一个函数,它将返回包装字符串的元素,如:

$element = get_wrapper($string, $html);

function get_wrapper($str, $code){
    //code here that has preg_match and return the wrapper element
}

返回值将是数组,因为它有 2 个可能的返回值,它们是<p class='text'></p><span></span>

任何人都可以给我一个关于如何获取包装给定字符串的 HTML 元素的正则表达式模式?

谢谢!非常感谢答案。

4

3 回答 3

0

即使正则表达式永远不是dom 解析领域的正确答案,我还是提出了另一个(非常简单的)解决方案

<[^>/]+?>My String</.+?>

如果 html 是好的(即它有结束标签,< 被替换为 < & 等等)。这样,您在第一个正则表达式组中有开始标记,在第二个组中有结束标记。

于 2012-07-31T09:34:36.207 回答
0

对这个任务使用正则表达式是个坏主意。您可以使用 DOMDocument

$oDom = new DOMDocument('1.0', 'UTF-8');
$oDom->loadXML("<div>" . $sHtml ."</div>");
get_wrapper($s, $oDom);

递归后做

function get_wrapper($s, $oDom) {
    foreach ($oDom->childNodes AS $oItem) {
        if($oItem->nodeValue == $s) {
            //needed tag - $oItem->nodeName
        }
        else {
            get_wrapper($s, $oItem);    
        }
    }
}
于 2012-07-31T07:05:13.063 回答
0

简单的模式如下,但它假设了很多事情。正则表达式不应该与这些一起使用。你应该看看像Simple HTML DOM parser这样更智能的东西。

无论如何,匹配包装标签和周围 html 元素的正则表达式如下。

 /[A-Za-z'= <]*>My text<[A-Za-z\/>]*/g
于 2012-07-31T07:06:19.500 回答