我想将代码值在 2 字节、3 字节范围内的 unicode 字符转换为十六进制。
我知道如何将字符转换为十六进制。为此,我首先通过使用 int 进行转换将字符转换为 ascii。然后我使用 Integer.tohexString 转换为十六进制。
但是,我不确定如何处理中文等Unicode字符。有人可以帮忙吗?
我想将代码值在 2 字节、3 字节范围内的 unicode 字符转换为十六进制。
我知道如何将字符转换为十六进制。为此,我首先通过使用 int 进行转换将字符转换为 ascii。然后我使用 Integer.tohexString 转换为十六进制。
但是,我不确定如何处理中文等Unicode字符。有人可以帮忙吗?
您不应该将字符串作为 Java 中的字节数组处理...但是如果您愿意,可以使用getBytes()
byte[] bs = "中文".getBytes("utf-8");
for(byte b : bs)
System.out.print(Integer.toHexString(b) + " ");
见我的评论。
不要“转换为 ASCII”;Java
char
足够大,可以支持整个Basic Multilingual Plane,其中应该包含 CJK Han 脚本。
/* 七 -> 4e03 */
assert "4e03".equals(Integer.toHexString('七'));
我想你可能想重新考虑你的方法。
一般来说,听起来您想要对这些数据进行某种 I/O。通常,您可以使用字符编码和 java.io Reader/Writer API 来做到这一点。
请参阅 InputStreamReader 和 OutputStreamWriter。
您始终可以将编写器的输出发送到 FileOutputStream(或 ByteArrayOutputStream),以将字符作为二进制数据输出。
out = new PrintWriter(new OutputStreamWriter(new FileOutputStream("file"), "utf-8"));
out.println("...");
如果您想对该数据进行base64编码或仅将其表示为ascii hex,那是一件非常简单的事情。