3

通过 String.getBytes(charset) 到 EBCDIC 的字符串转换提供了至少一个错误结果。字符“a”变成 0x3f 但应该是 0x81。

public static void  convert() throws UnsupportedEncodingException {
    String data="abcABC";
    String ebcdic = "IBM-1047";
    String ascii  = "ISO-8859-1";

    System.out.printf("Charset %s is supported: %s\n", ebcdic, Charset.isSupported(ebcdic));
    String result= new String(data.getBytes(ebcdic));
    System.out.printf("EBCDIC: %s\n",asHex(result.getBytes()));

    System.out.printf("Charset %s is supported: %s\n", ascii, Charset.isSupported(ascii));
    result= new String(data.getBytes(ascii));
    System.out.printf("ASCII: %s\n",asHex(result.getBytes()));
}

public static String asHex(byte[] buf) {
    char[] HEX_CHARS = "0123456789abcdef".toCharArray();
    char[] chars = new char[2 * buf.length];
    for (int i = 0; i < buf.length; ++i)
    {
        chars[2 * i] = HEX_CHARS[(buf[i] & 0xF0) >>> 4];
        chars[2 * i + 1] = HEX_CHARS[buf[i] & 0x0F];
    }
    return new String(chars);
}

结果是:

  • 支持字符集 IBM-1047:true
  • EBCDIC: 3f8283c1c2c3
  • 支持字符集 ISO-8859-1:true
  • ASCII:616263414243

我能做些什么吗?

4

1 回答 1

4

你打电话时

data.getBytes(ebcdic)

您正在将数据中的文本编码为 EBCDIC 字节。然后从这些字节创建一个字符串,就好像它们代表系统默认字符编码中的某个字符串:这会导致损坏,因为字节不必以 EBCDIC 以外的任何其他编码对有效文本进行编码。

要解决此问题,请将字节保留为字节:

byte[] result= data.getBytes(ebcdic);
System.out.printf("EBCDIC: %s\n",asHex(result));
于 2013-08-11T09:51:09.300 回答