php - 如何保持
与 XPATH？

Question

我使用 XPATH 删除不整洁的 HTML 标签，

$nodeList = $xpath->query("//*[normalize-space(.)='' and not(self::br)]");
    foreach($nodeList as $node) 
    {
        $node->parentNode->removeChild($node);
    }

将删除像这些可怕的输入，

<p><em><br /></em></p>
<p><span style="text-decoration: underline;"><em><br /></em></span></p>

但它也消除了img tag我想保留的打击，

<p><img title="picture summit" src="images/32913430_127001_e.jpg" alt="picture summit" width="590" height="366" /></p>

如何img tag使用 XPATH 保留输入？

score 1 · Accepted Answer

1

使用：

//p[not(descendant::*[self::img or self::br]) and normalize-space()='']

于 2011-10-22T17:48:21.087 回答

score 0 · Accepted Answer

也许您可以使用如下所示的 XPath 1.0 表达式来删除不需要的段落：

//p[count(text())=0 and count(img)=0]

php - 如何保持与 XPATH？

2 回答 2

Related

Reference

php - 如何保持
与 XPATH？