15

我正在使用 DOM 来解析字符串。我需要剥离跨度标签及其内容的功能。例如,如果我有:

This is some text that contains photo.
<span class='title'> photobyile</span>

我想要函数返回

This is some text that contains photo.

这是我尝试过的:

    $dom = new domDocument;
    $dom->loadHTML($string);
    $dom->preserveWhiteSpace = false;
    $spans = $dom->getElementsByTagName('span');

    foreach($spans as $span)
    {
        $naslov = $span->nodeValue; 
        echo $naslov;

        $string = preg_replace("/$naslov/", " ", $string);
    }

我知道$span->nodeValue返回 span 标签的值而不是整个标签,但我不知道如何获取整个标签以及类名。

谢谢,伊莱

4

2 回答 2

9

尝试直接从 DOM 树中删除跨度。

$dom = new DOMDocument();
$dom->loadHTML($string);
$dom->preserveWhiteSpace = false;

$elements = $dom->getElementsByTagName('span');
while($span = $elements->item(0)) {       
   $span->parentNode->removeChild($span);
}

echo $dom->saveHTML();
于 2009-10-04T10:18:20.587 回答
1

@ile - 我遇到了这个问题 - 这是因为 foreach 迭代器的索引愉快地不断增加,而在 DOM 上调用 removeChild() 似乎也从 DomNodeList ($spans) 中删除了节点。因此,对于您删除的每个跨度,节点列表都会缩小一个元素,然后将其 foreach 计数器加一。最终结果:它跳过了一个跨度。

我确信有一种更优雅的方式,但我就是这样做的——我将引用从 DomNodeList 移动到第二个数组,在那里它们不会被 removeChild() 操作删除。

    foreach($spans as $span) {
        $nodes[] = $span;
    }
    foreach($nodes as $span) {
        $span->parentNode->removeChild($span);
    }
于 2009-10-04T10:48:44.113 回答