3

我正在尝试阅读某个网页的正文以显示在单独的网页上,但我遇到了一些麻烦。现在,我使用以下代码

<?php
@$doc = new DOMDocument();
@$doc->loadHTMLFile('http://foo.com');
@$tags = $doc->getElementsByTagName('body');
foreach ($tags as $tag) {
    $index_text .= $tag->nodeValue;
    print nl2br($tag->nodeValue).'<br />';
}
?>

这段代码有效,但是它似乎删除了很多格式,这对我很重要,例如换行符。我该如何阻止这种情况发生

4

1 回答 1

7

DOMDocument的formatOutput属性将执行此操作。

$doc->formatOutput = true;

这将导致 DOM 输出更多地输出以供人类使用,在您需要它们的地方带有换行符和缩进,即“漂亮的打印”。

此值的默认值为false,因此您必须true在需要时将其显式设置为。

于 2009-08-11T13:45:11.097 回答