使用 DOMDocument,我正在尝试读取 HTML 文件的一部分,并使用下面的代码将其显示在不同的 HTML 页面上。我试图访问的 DIV 部分有几个<p>
标签。问题是当 DOM 解析文件时,它只获取标签之间的文本内容<p>
- 剥离标签 - 并且段落格式丢失。它合并文本并将它们全部显示为一个段落。如何保持 HTML 格式,以便段落在源文件中显示?
HTML 代码
<div class="text_container">
<h3>Title</h3>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
DOMDocumnet 代码
<?php
$page = file_get_contents('word.php');
$doc = new DOMDocument();
$doc -> loadHTML($page);
$divs = $doc->getElementsByTagName('div');
foreach($divs as $div) {
if ($div->getAttribute('class') === 'text_container') {
echo '<p>',$div->nodeValue,'</p>';
}
?>