2

我有字节数组,它放入 InputStreamReader 并对其进行一些操作。

Reader reader = new InputStreamReader(new ByteArrayInputStream(byteArr));

JVM 具有默认的 cp1252 编码,但我翻译为字节数组的文件具有 utf-8 编码。这个文件也有德语变音符号。当我将字节数组放入 InputStreamReader 时,java 会将变音符号解码为错误的符号。例如 ü 表示为 ü。我试图把 "UTF-8" 和 Charset.forName("UTF-8").newDecoder()); 到 InputStreamReader 构造函数,通过 new String(oldStr.getBytes("cp1252"), "UTF-8); 将字符串从读取器转换为具有新编码的字符串;但这没有帮助。在读取器变量的调试器中,我看到 StreamDecoder 参数,它具有“解码器”与 MS1252$Decoder 值。也许它解决了我的问题,但我不明白,我该如何解决它。

4

2 回答 2

3

尝试使用InputStreamReader(InputStream in, String charsetName)构造函数并自己设置字符集。

Reader reader = new InputStreamReader(new ByteArrayInputStream(byteArr), "UTF-8");
于 2013-10-14T13:09:05.920 回答
1

我遇到了完全相同的错误,最后通过将其添加到 JVM 启动选项中解决了这个问题:

-Dfile.encoding=UTF8
于 2014-02-07T10:09:36.437 回答