1

我有一个包含一些奇怪格式的 XML 文件,例如:

<?xml version=3D3D"1.0" encoding=3D3D"ISO-8859-1"?>

注意“3D3D”。另外,在整个文件的其余部分,这些行在大约 78 个字符处中断,并包括更多的“3D”,沿着

Supercalifragilis=
=3D
ticexpialidocious=
=3D

起初我以为这一切都可能与 ISO-8859-1 编码有关,但通过 PHP 运行文本mb_convert_encoding($xml, "UTF-8", "ISO-8859-1")似乎并没有改变这一切。

有人熟悉这些特殊的奇怪字符和格式吗?如果是这样,您能否推荐任何快速清理它以进行转换的方法,以便我可以使用 SimpleXML 之类的东西干净地解析文件?

4

1 回答 1

2

奇怪的是 QP(引用打印)编码:=xx 代表具有十六进制代码 xx 的字符。例如,=3D 代表等号“=”。在 QP 中,软换行符是行尾的“=”。所以看起来数据被 QP 编码了两次

所以希望quoted_printable_decode会有所帮助。

于 2012-05-25T07:09:17.177 回答