我正在尝试解析从 Wordpress 的导出功能生成的 XML 文件。我已经从块中获取了文本,但是当我回显文本时它的格式错误,我认为是 ASCII。
<?php
header("Content-Type: text/plain; charset: UTF-8;");
$source = file_get_contents("blog.wordpress.2013-10-31.xml");
$xml = simplexml_load_string($source);
$items = $xml->channel->item;
foreach($items as $item) {
$namepsaces = $item->getNameSpaces(true);
$content = $item->children($namepsaces['content']);
if($content != '') {
echo '#' . $item->title . "#\n";
echo $content->encoded;
echo "\n\n\n";
}
}
所以As the BBC’s
会变成As the BBC’s
. 无论如何我可以阻止这一切吗?
编辑:我附加了 echo '“Test”'; 就在标题之后,我在浏览器中看到“测试”,所以这似乎不是 SimpleXML 问题。