8

我正在努力让 Eclipse 正确读取中文字符,而且我不确定我可能哪里出错了。

具体来说,在从控制台读取一串中文(简体或繁体)和输出之间的某个地方,它会出现乱码。即使在输出一大串混合文本(英文/中文字符)时,它似乎也只会改变中文字符的外观。

我已将其缩减为以下测试示例,并用我认为在每个阶段发生的事情明确注释它 - 请注意,我是一名学生,非常想确认我的理解(或其他):)

public static void main(String[] args) {    
    try 
    {
        boolean isRunning = true;

        //Raw flow of input data from the console
        InputStream inputStream = System.in;
        //Allows you to read the stream, using either the default character encoding, else the specified encoding;
        InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "UTF-8");
        //Adds functionality for converting the stream being read in, into Strings(?)
        BufferedReader input_BufferedReader = new BufferedReader(inputStreamReader);


        //Raw flow of outputdata to the console
        OutputStream outputStream = System.out;
        //Write a stream, from a given bit of text
        OutputStreamWriter outputStreamWriter = new OutputStreamWriter(outputStream, "UTF-8");
        //Adds functionality to the base ability to write to a stream
        BufferedWriter output_BufferedWriter = new BufferedWriter(outputStreamWriter);



        while(isRunning) {
            System.out.println();//force extra newline
            System.out.print("> ");

            //To read in a line of text (as a String):
            String userInput_asString = input_BufferedReader.readLine();

            //To output a line of text:
            String outputToUser_fromString_englishFromCode = "foo"; //outputs correctly
            output_BufferedWriter.write(outputToUser_fromString_englishFromCode);
            output_BufferedWriter.flush();

            System.out.println();//force extra newline

            String outputToUser_fromString_ChineseFromCode = "之謂甚"; //outputs correctly
            output_BufferedWriter.write(outputToUser_fromString_ChineseFromCode);
            output_BufferedWriter.flush();

            System.out.println();//force extra newline

            String outputToUser_fromString_userSupplied = userInput_asString; //outputs correctly when given English text, garbled when given Chinese text
            output_BufferedWriter.write(outputToUser_fromString_userSupplied);
            output_BufferedWriter.flush();

            System.out.println();//force extra newline

        }
    }
    catch (Exception e) {
        // TODO: handle exception
    }
}

样本输出:

> 之謂甚
foo
之謂甚
之謂甚

> oaea
foo
之謂甚
oaea

> mixed input - English: fubar; Chinese: 之謂甚;
foo
之謂甚
mixed input - English: fubar; Chinese: 之謂甚;

> 

在这篇 Stack Overflow 帖子上看到的内容与我在 Eclipse 控制台中看到的内容以及在 Eclipse 调试器中看到的内容完全一致(查看/编辑变量值时)。通过 Eclipse 调试器手动更改变量值会导致代码取决于该值的行为,就像我通常期望的那样,这表明文本是如何读取IN是一个问题。

我尝试了许多不同的扫描仪/缓冲流 [reader|writer] 等组合来读入和输出,无论是否有明确的字符类型,尽管这不是特别系统地完成的,而且很容易错过一些东西。

我已尝试将 Eclipse 环境设置为尽可能使用 UTF-8,但我想我可能错过了一两个地方。请注意,控制台将正确输出硬编码的汉字。

非常感谢您对此事的任何帮助/指导:)

4

3 回答 3

2

看起来控制台没有正确读取输入。这是我相信描述您的问题和工作回合的链接。

http://paranoid-engineering.blogspot.com/2008/05/getting-unicode-output-in-eclipse.html

简单答案:尝试在 eclipse.ini 中设置环境变量 -Dfile.encoding=UTF-8。(在为整个 Eclipse 启用此功能之前,您可以尝试在该程序的调试配置中设置它,看看它是否有效)

该链接有更多建议

于 2013-01-23T19:05:01.457 回答
1

试试这个:在 Eclipse 中,右键单击您的主类,然后单击运行方式 > 运行配置。然后转到常用选项卡并将编码更改为 UTF-8。那应该工作!

于 2012-12-14T16:20:46.277 回答
0

这似乎是一个编码问题。这里可能有两个问题: 1. 您没有激活编译器读取除 ASCII 字符之外的任何内容的能力,在您的情况下,您需要能够读取 UTF-8 字符。2.您可能删除了某些语言包?这不太可能,因为您可能会写汉字?

您应该四处搜索并了解如何让您的 IDE 正确编译非 ASCII 字符。在 python 中,这是在代码本身中完成的,我不确定它是如何在 Java 中完成的。

于 2013-01-29T11:36:08.810 回答