我正在使用 PHP 库生成 XML,如下所示:
$dom = new DOMDocument("1.0","utf-8");
执行上述操作会产生一个页面,该页面在输出顶部显示一条消息。
此页面包含以下错误: 第 16 行第 274505 列的错误:PCDATA 无效字符值 27 下面是第一个错误之前的页面呈现。
我尝试使用 Tidy 库进行纠正.. 使用 iconv 来获取 UTF-8 中的汉字。
我正在使用 PHP 库生成 XML,如下所示:
$dom = new DOMDocument("1.0","utf-8");
执行上述操作会产生一个页面,该页面在输出顶部显示一条消息。
此页面包含以下错误: 第 16 行第 274505 列的错误:PCDATA 无效字符值 27 下面是第一个错误之前的页面呈现。
我尝试使用 Tidy 库进行纠正.. 使用 iconv 来获取 UTF-8 中的汉字。
本网站建议使用一个有用的功能来消除该错误。 http://www.phpwact.org/php/i18n/charsets#common_problem_areas_with_utf-8
当您将 utf-8 编码字符串放入 XML 文档时,您应该记住并非所有 utf-8 有效字符都被 XML 文档接受http://www.w3.org/TR/REC-xml/#charsets
所以你应该去掉不需要的字符,否则你会遇到像上面这样的 XML 致命解析错误
function utf8_for_xml($string)
{
return preg_replace ('/[^\x{0009}\x{000a}\x{000d}\x{0020}-\x{D7FF}\x{E000}-\x{FFFD}]+/u', ' ', $string);
}
希望可以节省别人一些时间..
普拉尚特是绝对正确的。您还可以通过执行以下操作去除 Javascript 中的无效字符:
function utf8_for_xml(inputStr) {
return inputStr.replace(/[^\x09\x0A\x0D\x20-\xFF\x85\xA0-\uD7FF\uE000-\uFDCF\uFDE0-\uFFFD]/gm, '');
}