0

我想知道从以 XML 为目标的 PHP 字符串中去除换行符的建议方法。使用以下方法,我的 XML 标记之间留有 2-4 个不同的空格。

$current = $xml->saveXML();
$current = str_replace(array("\r\n", "\r", "\n"), "", $current);

删除换行符的正确语法是什么,以便 XML 标记端到端显示,而不在它们之间添加空格?

4

1 回答 1

2

首先是一些基本的东西:$xml->saveXML()建议您使用 SimpleXML。它在其输出中只使用一个行分隔符:"\n".

所以搜索"\r\n"and"\r"是错误的。也使用str_replace()不是一个好主意,您应该strtr()改用:

$current = strtr($current, array("\n" => ''));

由于这只替换了换行符,因此此处不会删除或更改 XML 元素之间的空格字符。

但是,这些空格字符很大程度上取决于您输入的 XML。在 XML 中,您可以有重要的(删除它会失败)和不重要的空白(保存以删除),但SimplexmlDOMDocument不(也不能)知道哪个是哪个。

由于图书馆本身不知道,因此需要告诉他们的是您。例如,您似乎正在寻找所有文本节点的修剪。由于SimpleXMLElement不允许访问文本节点,因此您需要使用DOMXPath。但不要害怕,它并没有那么复杂:

$doc   = dom_import_simplexml($xml)->ownerDocument;
$xpath = new DOMXPath($doc);
foreach ($xpath->query('//text()') as $text) {
    $text->data = trim($text->data);
}

这只是按文档顺序遍历所有文本节点并修剪它们。

然后您只需要获取以文档元素开头的 XML。这将去掉 XML 声明和任何前面的注释和处理指令(我假设你想要那个):

$current = $doc->saveXML($doc->documentElement);

如果不是,则适用上面的行分隔符规则。然后,您可以:

$current = $xml->saveXML();
$current = strtr($current, array("\n" => ''));

就是这样。我希望这是有帮助的。

于 2013-04-08T08:29:31.920 回答