2

我正在获取正文内容,但正文中没有 html 标签(已清理)。我需要在正文中包含所有 html 标签。我想对我的代码进行哪些更改?

$doc = new DOMDocument();
@$doc->loadHTMLFile($myURL);

$elements2 = $doc->getElementsByTagName('body');

        foreach ($elements2 as $el2) {
            echo $el2->nodeValue, PHP_EOL;
        echo "<br/>";
}   
4

1 回答 1

1

您需要将body子节点保存为 HTML。我建议使用 Xpath 来获取节点,这样可以避免外循环:

$html = <<<'HTML'
<html>
  <body>
    Foo
    <p>Bar</p>
  </body>
</html>
HTML;

$document = new DOMDocument();
$document->loadHtml($html);
$xpath = new DOMXpath($document);

$result = '';
foreach ($xpath->evaluate('//body/node()') as $node) {
  $result .= $document->saveHtml($node);
}
var_dump($result);

输出:

string(29) "
    Foo
    <p>Bar</p>
  "
于 2015-10-05T22:24:40.670 回答