1
String[] values = line.split(",");

Long locId = Long.parseLong(replaceQuotes(values[0]));
String country = replaceQuotes(values[1]);
String region = replaceQuotes(values[2]);
String city = replaceQuotes(values[3]);
String postalCode = replaceQuotes(values[4]);
String latitude = replaceQuotes(values[5]);
String longitude = replaceQuotes(values[6]);
String metroCode = replaceQuotes(values[7]);
String areaCode = replaceQuotes(values[8]);

//...

public String replaceQuotes(String txt){
    txt = txt.replaceAll("\"", "");
    return txt;
}

我正在使用上面的代码来解析带有这种格式数据的 CSV:

828,"US","IL","Melrose Park","60160",41.9050,-87.8641,602,708

但是,当我遇到如下一行数据时,我得到java.lang.ArrayIndexOutOfBoundsException: 7

1,"O1","","","",0.0000,0.0000,,

这是否意味着任何时候我什至尝试访问 的值values[7],都会抛出异常?

如果是这样,我如何解析在文本行的该位置不包含数据的行?

4

2 回答 2

6

首先,String.split()它不是一个出色的 CSV 解析器:它不知道引号,并且一旦您的一个引用值包含逗号就会搞砸。

话虽如此,默认情况下String.split()会忽略空的尾随元素。您可以通过使用两个参数变体来影响它:

String[] values = line.split(",", -1);
  • -1(或任何负值)意味着数组将尽可能大。
  • 使用正值给出了要完成的最大拆分数量(这意味着除此之外的所有内容都将是一个值,即使它包含逗号)。
  • 0(如果您使用单参数值,则为默认值)意味着数组将尽可能大,空的尾随值将被排除在数组之外(就像发生在您身上一样)。
于 2011-07-05T11:32:11.710 回答
1

作为一般规则,如果已经存在可用的解析器,则永远不应该破解您自己的(有故障的)解析器。CSV 不容易正确解析,并且 String.split 不会完成这项工作,因为 CSV 允许,"'s 之间使用而不用作分隔符。

考虑使用OpenCSV。这将解决您现在遇到的问题以及当用户使用 a,作为数据的一部分时您将面临的问题。

于 2011-07-05T11:39:23.363 回答