2

我正在使用 DOMDocument 遍历 HTML 以获取<p>标签中的内容。但与此同时,我不想从标签中href获取任何内容divspan信息。<p>我应该如何从下面的代码开始:

$doc = new DOMDocument();
$doc->loadHTML($data);
$pas = $domDoc->getElementsByTagName("p");
foreach ($pas as $pa)
    $pa->textContent

我可以进一步getElementsByTagName() 为 div、span、href做一个 DOMDocument$pas吗?或者我需要做一个正则表达式吗?

4

1 回答 1

1

你可以这样使用

$doc = new DOMDocument();
$doc->loadHTML($data);
$rootElement = $document->documentElement;//selecting document root

$pTags = $rootElement->getElementsByTagName("p");//selecting all p tags from DOM
$pas = $pTags->item(0);// selecting first p tag

foreach ($pas as $pa) {
    if($pa->nodeName == 'div' || $pa->nodeName == 'span' || $pa->nodeName == 'a')
    continue;
    // do everything else here
}
于 2012-12-31T10:18:45.763 回答