好的,我希望有人可以提供帮助,因为我无法找到解决方案。
在数据库中,客户设法从不同的字符集中导入或添加字符数据,例如:
<E2><80><99>
我相信这是 UTF-16。
由于此数据(从数据库中提取字符串,例如“描述”字段并构建 XML 文件),我的脚本的 XML 输出会引发错误。
XML 解析错误:第 20 行第 50 列格式不正确。
还有其他一些更长的十六进制,例如 <80><99> (只是一个例子,我不确定这是否是一个实际字符)。
如何使我的 XML 文件有效,并缩小字符集或让它使用 UTF-32,如下所示:
AddType "application/xml; charset=UTF-32" xml (in .htaccess file along with filesmatch .xml)
<?xml version='1.0' encoding='UTF-32' ?> (placed in head of xml file)