2

我正在使用while(matcher.find())循环并从文件中检索内容。我想知道如果我知道我找到的索引位于matcher.start().

我很困惑,有人可以解释一下吗?

 String expr = "<[^<?!>]+>";
     String[] response = new String[5];

        Pattern p = Pattern.compile(expr);
        Matcher m = p.matcher(xmlDocument);
        while (m.find()) {
        //  System.out.println(m.group() + " located at " + m.start());
       //   txtMatches.append(m.group() + " located at " + m.start() + "\n");
            if (itemStack.getCount() == 0 && m.group().contains("</")) {
                response[0] = "Orphan closing tag" ; 
                response[1] = stripUnwantedChars(m.group(), true); 
                response[2] =  String.valueOf(m.start()); //right here is where i want to return line number
                return response; 
            }
        //rest of code

itemStack是一堆推送的匹配项,然后我将它们进行比较以查看堆栈中是否没有更多项目,但有一个带有结束标记的匹配项。

4

2 回答 2

4

您可以使用反向方法通过创建一个从 0 到 start() 返回的字符号的区域来获取行号。

例如,

class MatchTest {
public static void main(String...args) {
    try {
        FileInputStream fis = new FileInputStream("source.txt");
        byte[] buffer = new byte[fis.available()];
        fis.read(buffer);
        String data = new String(buffer);
        fis.close();


        Pattern pattern = Pattern.compile(args[0]);
        Matcher matcher = pattern.matcher(data);
        while(matcher.find()) {
            out.println(matcher.group());
            out.println(getLine(data, matcher.start()));


        }
    }
    catch(Exception e) {
        e.printStackTrace();
    }
}

static int getLine(String data, int start) {
    int line = 1;
    Pattern pattern = Pattern.compile("\n");
    Matcher matcher = pattern.matcher(data);
    matcher.region(0, start);
    while(matcher.find()) {
        line++;
    }
    return(line);
}

}

在这里,getLine 方法将返回行号。

于 2014-10-11T12:07:28.190 回答
3

您需要单独创建每行开始的索引数组,然后可以将此数组与返回的索引一起使用start()来确定匹配在哪一行。该行索引数组的二进制搜索会做得很好。实际上,您也可以通过使用匹配行尾的正则表达式(仅匹配 '\n' 就可以)然后从下一个字符开始每一行来创建此行索引列表。

于 2011-10-24T03:22:39.427 回答