2

我想将代码值在 2 字节、3 字节范围内的 unicode 字符转换为十六进制。

我知道如何将字符转换为十六进制。为此,我首先通过使用 int 进行转换将字符转换为 ascii。然后我使用 Integer.tohexString 转换为十六进制。

但是,我不确定如何处理中文等Unicode字符。有人可以帮忙吗?

4

3 回答 3

1

您不应该将字符串作为 Java 中的字节数组处理...但是如果您愿意,可以使用getBytes()

byte[] bs = "中文".getBytes("utf-8");
for(byte b : bs)
    System.out.print(Integer.toHexString(b) + " ");
于 2012-09-05T06:41:34.617 回答
0

我的评论

不要“转换为 ASCII”;Javachar足够大,可以支持整个Basic Multilingual Plane,其中应该包含 CJK Han 脚本。

/* 七 -> 4e03 */
assert "4e03".equals(Integer.toHexString('七'));
于 2012-09-05T05:53:50.003 回答
0

我想你可能想重新考虑你的方法。

一般来说,听起来您想要对这些数据进行某种 I/O。通常,您可以使用字符编码和 java.io Reader/Writer API 来做到这一点。

请参阅 InputStreamReader 和 OutputStreamWriter。

您始终可以将编写器的输出发送到 FileOutputStream(或 ByteArrayOutputStream),以将字符作为二进制数据输出。

out = new PrintWriter(new OutputStreamWriter(new FileOutputStream("file"), "utf-8"));
out.println("...");

如果您想对该数据进行base64编码或仅将其表示为ascii hex,那是一件非常简单的事情。

于 2012-09-05T06:47:16.027 回答