我正在尝试阅读某个网页的正文以显示在单独的网页上,但我遇到了一些麻烦。现在,我使用以下代码
<?php
@$doc = new DOMDocument();
@$doc->loadHTMLFile('http://foo.com');
@$tags = $doc->getElementsByTagName('body');
foreach ($tags as $tag) {
$index_text .= $tag->nodeValue;
print nl2br($tag->nodeValue).'<br />';
}
?>
这段代码有效,但是它似乎删除了很多格式,这对我很重要,例如换行符。我该如何阻止这种情况发生