35

我正在使用 PHP 库生成 XML,如下所示:

$dom = new DOMDocument("1.0","utf-8");

执行上述操作会产生一个页面,该页面在输出顶部显示一条消息。

此页面包含以下错误: 第 16 行第 274505 列的错误:PCDATA 无效字符值 27 下面是第一个错误之前的页面呈现。

我尝试使用 Tidy 库进行纠正.. 使用 iconv 来获取 UTF-8 中的汉字。

4

2 回答 2

106

本网站建议使用一个有用的功能来消除该错误。 http://www.phpwact.org/php/i18n/charsets#common_problem_areas_with_utf-8

当您将 utf-8 编码字符串放入 XML 文档时,您应该记住并非所有 utf-8 有效字符都被 XML 文档接受http://www.w3.org/TR/REC-xml/#charsets

所以你应该去掉不需要的字符,否则你会遇到像上面这样的 XML 致命解析错误

function utf8_for_xml($string)
{
    return preg_replace ('/[^\x{0009}\x{000a}\x{000d}\x{0020}-\x{D7FF}\x{E000}-\x{FFFD}]+/u', ' ', $string);
}

希望可以节省别人一些时间..

于 2012-09-04T14:44:20.517 回答
7

普拉尚特是绝对正确的。您还可以通过执行以下操作去除 Javascript 中的无效字符:

function utf8_for_xml(inputStr) {
  return inputStr.replace(/[^\x09\x0A\x0D\x20-\xFF\x85\xA0-\uD7FF\uE000-\uFDCF\uFDE0-\uFFFD]/gm, '');
}
于 2017-01-16T02:12:28.443 回答