1

我想在以下 test.html 中使用 xpath 查询仅检索一次“测试”

<html>
    <body>
        <div class="test1"></div>
        <div class="test2">
            <div><strong>Testing</strong></div>
        </div>
    </body>
</html>

这是我用来检索内容的 php 代码。

$uri='test.html';
$doc = new DOMDocument('1.0','utf-8');
$doc->loadHTMLFile($uri);
$xpath= new DOMXPath($doc);
$path="/html/body/div[2]//*"; 
$elements = $xpath->query($path);

if(!is_null($elements)){
    foreach($elements as $element){
        echo '<br>['.$element->nodeName.']';
        $nodes = $element->childNodes;
        foreach($nodes as $node){
            $nodeValue=$node->nodeValue;
            echo $nodeValue;
        }
    }
}

这是我得到的结果。

[div] Testing 
[strong] Testing

为什么即使在 [div] 节点中也会打印“Testing”?我希望它只在 [strong] 节点中检索“测试”。

4

2 回答 2

0

这就是它的工作原理 -nodeValue父节点将始终包含nodeValue其子节点。

nodeValue不太符合你的目标。相反,您应该在其子项中获取文本节点。请参阅此问题:Getting node's text in PHP DOM

于 2013-08-17T03:06:04.727 回答
0

您的 XPath返回包括子节点和孙节点在内/html/body/div[2]//*的所有后代。div[2]

只让孙子使用/html/body/div[2]/*/*

于 2013-08-18T03:07:47.993 回答