7

我看到您可以通过 指定 UTF-16 作为字符集Charset.forName("UTF-16"),并且可以通过 创建新的 UTF-16 解码器Charset.forName("UTF-16").newDecoder(),但我只看到指定 a CharsetDecoderonInputStreamReader的构造函数的能力。

那么如何在 Java 中读取任何流时指定使用 UTF-16?

4

1 回答 1

11

输入流处理原始字节。当您直接从输入流中读取时,您得到的只是与字符集无关的原始字节。

根据定义,将原始字节解释为字符需要某种翻译:如何将原始字节转换为可读字符串?该“翻译”以字符集的形式出现。

这个“添加”层是由 Readers 实现的。因此,要从流中读取字符(而不是字节),您需要Reader在流的顶部构造某种(取决于您的需要)。例如:

InputStream is = ...;
Reader reader = new InputStreamReader(is, Charset.forName("UTF-16"));

这将导致reader.read()使用您指定的字符集读取字符。如果您想阅读整行,请BufferedReader在顶部使用:

BufferedReader reader = new BufferedReader(new InputStreamReader(is, Charset.forName("UTF-16")));
String line = reader.readLine();
于 2013-02-26T20:04:58.820 回答