java - 字符和字节缓冲区编码和解码

Question

我试图了解编码方式，这是我对字符串进行编码和解码的代码。

Charset utfset = Charset.forName("UTF-8");
CharsetEncoder encoder = utfset.newEncoder();

String text = "java.abcded.tocken";
CharBuffer cb = CharBuffer.wrap(text.toCharArray());
ByteBuffer bb = encoder.encode(cb);
byte[] bytes = bb.array();

CharsetDecoder isodecoder = utfset.newDecoder();

CharBuffer isodcb = isodecoder.decode(bb);
System.out.println(String.valueOf(cb.array()).equals(String.valueOf(isodcb.array())));

CharBuffer isodcb2 = isodecoder.decode(ByteBuffer.wrap(bytes));
System.out.println(String.valueOf(cb.array()).equals(String.valueOf(isodcb2.array())));

当使用 byteBuffer 本身执行解码时，字符串是相等的，但是，当使用 bytebuffer 中的字节数组的 bytebuffer.wrap 执行解码时，字符串不相等。它在末尾附加空格，这背后有什么原因吗？

score 0 · Accepted Answer

CharsetEncoder.encode不保证底层数组的大小，也不保证ByteBuffer实际由数组支持。支持缓冲区的数组大于其中包含的字节数。

如果您运行此代码，您应该会看到不同的数字：

CharsetEncoder encoder = StandardCharsets.UTF_8.newEncoder();

String text = "java.abcded.tocken";
CharBuffer cb = CharBuffer.wrap(text.toCharArray());
ByteBuffer bb = encoder.encode(cb);
System.out.println(bb.remaining());
System.out.println(bb.array().length);

java - 字符和字节缓冲区编码和解码

1 回答 1

Related

Reference