7

我有一个csv file包含英语单词的单词,然后是他们的印地语翻译。我正在尝试读取 csv 文件并对其进行进一步处理。csv 文件如下所示:

English,,Hindi,,,  
,,,,,  
Cat,,बिल्ली,,,  
Rat,,चूहा,,,  
abandon,,छोड़ देना,त्याग देना,लापरवाही की स्वतन्त्रता,जाने देना  

我正在尝试逐行读取 csv 文件并显示已写入的内容。代码片段(Java)如下:

   //Step 2. Read csv file and get the string.
            FileInputStream fis = null;
            BufferedReader br = null;
            try {
                fis = new FileInputStream(new File(csvFile));
            } catch (FileNotFoundException e1) {
                // TODO Auto-generated catch block
                e1.printStackTrace();
            }

            boolean startSeen = true;
            if(fis != null) {
                try {
                    br = new BufferedReader(new InputStreamReader(fis, "UTF-8"));
                } catch (UnsupportedEncodingException e2) {
                    // TODO Auto-generated catch block
                    e2.printStackTrace();
                    System.out.print("Unsupported encoding");
                }
                String line = null;
                if(br != null) {
                    try {
                        while((line = br.readLine()) != null) {
                            if(line.contains("English") == true) {
                                startSeen = true;
                            }

                            if((startSeen == true) && (line != null)) {
                                StringBuffer sbuf = new StringBuffer();
                                //Step 3. Parse the line.
                                sbuf.append(line);
                                System.out.println(sbuf.toString());
                            }
                        }
                    } catch (IOException e1) {
                        // TODO Auto-generated catch block
                        e1.printStackTrace();
                    }
                }  
}

但是,我得到以下输出:

English,,Hindi,,,
,,,,,
Cat,,??????,,,
Rat,,????,,,
abandon,,???? ????,????? ????,???????? ?? ???????????,???? ????  

我的 Java 不是那么好,虽然我已经阅读了许多关于 SO 的帖子,但我需要更多帮助来找出这个问题的确切原因。

4

3 回答 3

5

对于读取文本文件,最好使用字符流,例如直接使用 java.util.Scanner 而不是 FileInputStream。关于编码,您必须首先确保您要读取的文本文件保存为“UTF-8”,而不是其他方式。我还注意到在我的系统中,我必须将我的 java 源文件保存为“UTF-8”,以使其正确显示印地语字符。

但是我想建议更简单的方法来读取 csv 文件,如下所示:

Scanner scan = new Scanner(new File(csvFile));
while(scan.hasNext()){
   System.out.println(scan.nextLine());
}

查看输出

于 2013-01-16T06:32:26.420 回答
2

我认为您的控制台无法显示印地语字符。尝试

System.out.println("Cat,,बिल्ली,,,");

去测试

于 2013-01-16T06:30:39.700 回答
0

正如上面的答案所讨论的;解决方案是两个步骤 1)将您的 txt 文件保存为 UTF-8 2)更改 Java 代码的属性以在 Eclipse 中使用 UTF-8;右键单击Java文件;属性 -> 资源 -> 文本文件编码 -> 其他 -> UTF-8

请参阅http://howtodoinjava.com/2012/11/27/how-to-compile-and-run-java-program-written-in-another-language/上给出的屏幕截图

于 2015-01-10T11:36:01.703 回答