我收到来自服务器的消息,它看起来像这样:
<?xml version="1.0" encoding="UTF-8"?>
<response>
<meta>
<code>0</code>
<message>ÐÑибка обÑабоÑки запÑоÑа</message>
</meta>
这不是UTF,对吧?我如何在java中阅读这个?
根据 Google的说法,它实际上看起来是有效的。
开玩笑。:)
此外,2cyr.com (http://2cyr.com/decode/) 的网站提供了一些线索,看起来可能是一些中欧编码(尤其是 ISO8859-2)
你最好的选择是依赖像 Mozillas 的 Chardet 这样的工具,特别是使用这个字符串——用纯 Java 伪代码:
new String(oldString.getBytes("ISO8859-2"), "UTF-8")
但它毕竟看起来像垃圾邮件。或者也许是 Stack Overflow 中的替代现实游戏 :)
<Message>
标签不包含有效的 UTF-8 。其内容由以下字节序列组成:
D0 D1 D0 B8 D0 B1 D0 BA D0 B0 20 D0 BE D0 B1 D1 D0 B0 D0 B1 D0 BE D1 D0 BA D0 B8 20 D0 B7 D0 B0 D0 BF D1 D0 BE D1 D0 B0
突出显示的字节不是有效的 UTF-8。