0

这可能非常简单,但我无法找到执行此操作的选项。我正在尝试使用 Apache Commons CSV 读取文件以供以后验证。有问题的 CSV 作为输入流提交,它似乎在读取文件时向文件添加了一个附加列,其中包含行号。如果可能的话,我希望能够忽略它,因为标题行不包含数字,这会导致错误。InputStream 中是否已经有一个选项可以执行此操作,还是我必须设置某种后处理?

我正在使用的代码如下:

public String validateFile(InputStream filePath) throws Exception{
        System.out.println("Sending file to reader");
        System.out.println(filePath);
        InputStreamReader in = new InputStreamReader(filePath);
        //CSVFormat parse needs a reader object
        System.out.println("sending reader to CSV parse");
        for (CSVRecord record : CSVFormat.DEFAULT.withHeader().parse(in)) {
            for (String field : record) {
                System.out.print("\"" + field + "\", ");
            }
            System.out.println();
        }
        return null;
    }

使用时withHeader(),我最终遇到以下错误:

java.lang.IllegalArgumentException: A header name is missing in [, Employee_ID, Department, Email]

我不能简单地跳过它,因为我需要对标题行进行一些验证。

此外,这里是一个示例 CSV 文件:

"Employee_ID", "Department", "Email"
"0123456","Department of Hello World","John.Doe@gmail.com"

编辑:另外,最终目标是验证以下内容:

  1. 有名为“Employee_ID”、“Department”和“Email”的列。为此,我想我需要删除 .withHeader()。
  2. 每行以逗号分隔。
  3. 没有空单元格值
4

1 回答 1

1

较新版本的 Commons-CSV 存在空标题问题。也许这里也是这种情况?您刚刚提到“没有空单元格值”不确定这是否也包括标题...

另见:https ://issues.apache.org/jira/browse/CSV-257

设置.setAllowMissingColumnNames(true)对我有用。

final CSVFormat csvFormat = CSVFormat.Builder.create()
        .setHeader(HEADERS)
        .setAllowMissingColumnNames(true)
        .build();
final Iterable<CSVRecord> records = csvFormat.parse(reader);
于 2021-08-04T12:19:20.320 回答