0

再会。

我从服务器得到这样的字符串

\u041a\u0438\u0441\u0435\u043b\u0435\u0432 \u0410\u043d\u0434\u0440\u0435\u0439

我需要将其转换为西里尔文 cp-1251 字符串。

我该怎么做?谢谢你。

4

1 回答 1

1

如果这是必须解码的字符的文字序列,您需要首先从这样的内容开始(假设您的输入在字符串input中):

StringBuffer decodedInput = new StringBuffer();
Matcher match = Pattern.compile("\\\\u([0-9a-fA-F]{4})| ").matcher(input);
while (match.find()) {
  String character = match.group(1);
  if (character == null)
    decodedInput.append(match.group());
  else
    decodedInput.append((char)Integer.parseInt(character, 16));
}

此时,您应该在decodedInput中有输入的 java 字符串表示形式。

如果您的系统支持 cp-1251 字符集,则可以使用以下内容将其转换为 cp-1251:

Charset cp1251charset = Charset.forName("cp-1251");
ByteBuffer output = cp1251charset.encode(decodedInput.toString());
于 2013-05-06T20:49:38.480 回答