11

我正在研究 csv 解析器,我想分别读取标题和 csv 文件的其余部分。这是我读取 csv 的代码。

当前代码读取 csv 文件中的所有内容,但我需要单独读取标题。请帮助我解决这个问题。

public class csv {

private void csvRead(File file)
{
    try
    {
    BufferedReader br = new BufferedReader( new FileReader(file));
    String strLine = "";
    StringTokenizer st = null;
    File cfile=new File("csv.txt");
    BufferedWriter writer = new BufferedWriter(new FileWriter(cfile));
    int tokenNumber = 0;

    while( (strLine = br.readLine()) != null)
    {
            st = new StringTokenizer(strLine, ",");
            while(st.hasMoreTokens())
            {

                    tokenNumber++;
                    writer.write(tokenNumber+"  "+ st.nextToken());
                    writer.newLine();
            }


            tokenNumber = 0;
            writer.flush();
    }
}

    catch(Exception e)
    {
        e.getMessage();
    }
}
4

4 回答 4

8

我们有 CSVFormat 中可用的 withHeader() 方法。如果您使用此选项,那么您将能够使用标题读取文件。

CSVFormat format = CSVFormat.newFormat(',').withHeader();
Map<String, Integer> headerMap = dataCSVParser.getHeaderMap(); 

会给你所有的标题。

public class CSVFileReaderEx {
    public static void main(String[] args){
        readFile();
    }

    public static void readFile(){
         List<Map<String, String>> csvInputList = new CopyOnWriteArrayList<>();
         List<Map<String, Integer>> headerList = new CopyOnWriteArrayList<>();

         String fileName = "C:/test.csv";
         CSVFormat format = CSVFormat.newFormat(',').withHeader();

          try (BufferedReader inputReader = new BufferedReader(new FileReader(new File(fileName)));
                  CSVParser dataCSVParser = new CSVParser(inputReader, format); ) {

             List<CSVRecord> csvRecords = dataCSVParser.getRecords();

             Map<String, Integer> headerMap = dataCSVParser.getHeaderMap();
              headerList.add(headerMap);
              headerList.forEach(System.out::println);

             for(CSVRecord record : csvRecords){
                 Map<String, String> inputMap = new LinkedHashMap<>();

                 for(Map.Entry<String, Integer> header : headerMap.entrySet()){
                     inputMap.put(header.getKey(), record.get(header.getValue()));
                 }

                 if (!inputMap.isEmpty()) {
                     csvInputList.add(inputMap);
                } 
             }

             csvInputList.forEach(System.out::println);

          } catch (Exception e) {
             System.out.println(e);
          }
    }
}
于 2017-01-26T20:36:20.143 回答
6

请考虑使用Commons CSV。这个库是根据RFC 4180 - Common Format and MIME Type for Comma-Separated Values (CSV) Files编写的。什么是兼容阅读这样的行:

"aa,a","b""bb","ccc"

而且使用非常简单,只有 3 个类,以及文档中的一个小示例:

解析具有制表符作为分隔符、'"' 作为可选值封装器以及以 '#' 开头的注释的 csv 字符串:

 CSVFormat format = new CSVFormat('\t', '"', '#');
 Reader in = new StringReader("a\tb\nc\td");
 String[][] records = new CSVParser(in, format).getRecords();

此外,您还可以使用已作为常量使用的解析器:

  • DEFAULT - RFC 4180 定义的标准逗号分隔格式。
  • EXCEL - Excel 文件格式(使用逗号作为值分隔符)。
  • MYSQL - SELECT INTO OUTFILE 和 LOAD DATA INFILE 操作使用的默认 MySQL 格式。TDF - 制表分隔格式。
于 2012-06-26T16:37:11.293 回答
3

你考虑过 OpenCSV吗?

上一个问题在这里...

用于 Java 的 CSV API

看起来你可以很容易地拆分标题......

String fileName = "data.csv";
CSVReader reader = new CSVReader(new FileReader(fileName ));


// if the first line is the header
String[] header = reader.readNext();

// iterate over reader.readNext until it returns null
String[] line = reader.readNext();
于 2012-06-26T16:04:01.147 回答
0

你的代码在这里

while( (strLine = br.readLine()) != null)
    {
      //reads everything in your csv
    } 

将打印您的所有 CSV 内容。

例如,以下内容获取您的标头:

Reader in = ...;
 CSVFormat.EXCEL.withHeader("Col1", "Col2", "Col3").parse(in);

正如建议的那样,使用 apache commons 库中预定义的 CSVFormat 可以更轻松。链接在这里(https://commons.apache.org/proper/commons-csv/user-guide.html)。干杯。

于 2022-01-03T04:16:38.573 回答