我正在尝试查找以下 xml 片段的编码:
<?xml version="1.0" charset="UTF-8">
<name>Lo-Ve[]lo</name>
在哪里[]
显示为一个框。正确的标签内容是Lo-Vélo
. 关键是名称标签的内容不是 UTF-8 编码的。
hexdump -C
节目
00000000 3c 3f 78 6d 6c 20 76 65 72 73 69 6f 6e 3d 22 31 |<?xml version="1|
00000010 2e 30 22 20 63 68 61 72 73 65 74 3d 22 55 54 46 |.0" charset="UTF|
00000020 2d 38 22 3e 0a 3c 6e 61 6d 65 3e 4c 6f 2d 56 65 |-8">.<name>Lo-Ve|
00000030 01 6c 6f 3c 2f 6e 61 6d 65 3e 0a |.lo</name>.|
0000003b
所以原始编码Lo-Velo
应该显示为0x65 0x01
as é
。
我试图找出这个 URL上损坏的 XML 的第 299 行中艺术家姓名的编码是什么 ,因此可以采取一些对策。