php - 使用 preg_match php 获取包装元素

Question

我想要一个 preg_match 代码来检测给定的字符串并获取它的包装元素。我有一个字符串和一个 html 代码，例如：

$string = "My text";
$html = "<div><p class='text'>My text</p><span>My text</span></div>";

所以我需要创建一个函数，它将返回包装字符串的元素，如：

$element = get_wrapper($string, $html);

function get_wrapper($str, $code){
    //code here that has preg_match and return the wrapper element
}

返回值将是数组，因为它有 2 个可能的返回值，它们是<p class='text'></p>和<span></span>

任何人都可以给我一个关于如何获取包装给定字符串的 HTML 元素的正则表达式模式？

谢谢！非常感谢答案。

score 0 · Accepted Answer

即使正则表达式永远不是dom 解析领域的正确答案，我还是提出了另一个（非常简单的）解决方案

<[^>/]+?>My String</.+?>

如果 html 是好的（即它有结束标签，< 被替换为 < & 等等）。这样，您在第一个正则表达式组中有开始标记，在第二个组中有结束标记。

score 0 · Accepted Answer

对这个任务使用正则表达式是个坏主意。您可以使用 DOMDocument

$oDom = new DOMDocument('1.0', 'UTF-8');
$oDom->loadXML("<div>" . $sHtml ."</div>");
get_wrapper($s, $oDom);

递归后做

function get_wrapper($s, $oDom) {
    foreach ($oDom->childNodes AS $oItem) {
        if($oItem->nodeValue == $s) {
            //needed tag - $oItem->nodeName
        }
        else {
            get_wrapper($s, $oItem);    
        }
    }
}

score 0 · Accepted Answer

简单的模式如下，但它假设了很多事情。正则表达式不应该与这些一起使用。你应该看看像Simple HTML DOM parser这样更智能的东西。

无论如何，匹配包装标签和周围 html 元素的正则表达式如下。

 /[A-Za-z'= <]*>My text<[A-Za-z\/>]*/g

php - 使用 preg_match php 获取包装元素

3 回答 3

Related

Reference