0

我正在从制表符分隔的文本文件中提取值到 groovy 中的列表中。但是我遇到了ArrayIndexOutOfBoundsException

代码

println("Reading File Contents")

def fullArray = new String[31721][4]
def availableArray = new String[1386][2]
def filteredFullArray = new String[1386][5]

String fileContents = new File('beliefs.txt').text
String availableContents = new File('available.txt').text

def count = 0

fileContents.eachLine { line ->

    String[] str
    str = line.split('\t')

    def subCount = 0
    for (subCount; subCount < str.length; subCount++) {
         fullArray[count][subCount] = str[subCount]
    }
    count++
}

信念.txt

1   Azerbaijan  hasOfficialLanguage Azerbaijani_language
2   Augustus    hasChild    Julia_the_Elder
3   Arthur_Aikin    isCitizenOf England
4   Arthur_Aikin    diedIn  London
5   Alexander_III_of_Russia isMarriedTo Maria_Feodorovna__Dagmar_of_Denmark_
6   Alexander_III_of_Russia hasChild    Nicholas_II_of_Russia
7   Alexander_III_of_Russia hasChild    Grand_Duke_Michael_Alexandrovich_of_Russia
8   Alexander_III_of_Russia hasChild    Grand_Duchess_Olga_Alexandrovna_of_Russia
9   Alexander_III_of_Russia hasChild    Grand_Duke_Alexander_Alexandrovich_of_Russia
10  Alexander_III_of_Russia hasChild    Grand_Duke_George_Alexandrovich_of_Russia
...
...
...
31719   Minqi_Li    isKnownFor  Chinese_New_Left
31720   Henry_Bates_Grubb   isKnownFor  Mount_Hope_Estate
31721   Thomas_Kuhn isKnownFor  Paradigm_shift  

运行它会给我以下错误。

捕获:java.lang.ArrayIndexOutOfBoundsException:4 java.lang.ArrayIndexOutOfBoundsException:4 在 extractBeliefs$_run_closure1.doCall(extractBeliefs.groovy:19) 在 extractBeliefs.run(extractBeliefs.groovy:12)

我知道可能发生上述错误的原因。但是由于我的数组没有超过最后一个索引,并且错误显示在 line fileContents.eachLine { line ->,所以我无法找到出错的地方。

在这方面的任何建议都将受到高度赞赏。

4

3 回答 3

2

您最初的错误来自这一行 (19):

fullArray[count][subCount] = str[subCount]

第 12 行只是在退出闭包时提升异常。这绝对表明您在一行上有一个额外的选项卡...出于调试目的,请在尝试将其加载到数组中之前尝试将该行打印到控制台。这将帮助您确定哪一行有错误。

于 2018-12-07T14:54:41.660 回答
-1

尝试用空格分割

str = line.split('\s+')

代替

str = line.split('\t')
于 2018-12-06T06:22:05.733 回答
-1

更好的方法是先用单个空格替换所有多空格或制表符,然后再按单个空格分割。

line = line.replace("\\s+/g", " ")
str = line.split('\\s+')
于 2018-12-06T06:34:52.563 回答