3

根据这个问题find,和之间存在很大差异matches(),仍然都以某种形式提供结果。

作为一种实用程序,该toMatchResult函数返回操作的当前结果matches()。我希望我的假设(1)是有效的。(正则表达式在这里

        String line = "aabaaabaaabaaaaaab";
        String regex = "(a*b)a{3}";
        Matcher matcher = Pattern.compile(regex).matcher(line);
        matcher.find();
//        matcher.matches();(1) --> returns false because the regex doesn't match the whole string
        String expectingAab = matcher.group(1);
        System.out.println("actually: " + expectingAab);

不幸的是,以下方法无论如何都不起作用(例外:未找到匹配项):

        String line = "aabaaabaaabaaaaaab";
        String regex = "(a*b)a{3}";
        String expectingAab = Pattern.compile(regex).matcher(line).toMatchResult().group(1);
        System.out.println("actually: " + expectingAab);

这是为什么?我的第一个假设是它不起作用,因为正则表达式应该匹配整个字符串;但是字符串值aabaaa也会抛出相同的异常......

当然,匹配器需要设置为正确的状态find(),但是如果我想使用 oneliner 怎么办?我实际上为此实现了一个实用程序类:


protected static class FindResult{
    private final Matcher innerMatcher;
    public FindResult(Matcher matcher){
        innerMatcher = matcher;
        innerMatcher.find();
    }
    public Matcher toFindResult(){
        return  innerMatcher;
    }
}

public static void main(String[] args){
    String line = "aabaaabaaabaaaaaab";
    String regex = "(a*b)a{3}";
    String expectingAab = new FindResult(Pattern.compile(regex).matcher(line)).toFindResult().group(1);
    System.out.println("actually: " + expectingAab);
}

我很清楚这不是创建 oneliner 的最佳解决方案,尤其是因为它给垃圾收集器带来了沉重的负担。

有没有更简单、更好的解决方案?

值得注意的是,我正在寻找解决方案 java8. 匹配逻辑在 java 9 之上的工作方式不同。

4

2 回答 2

7

toMatchResult()方法返回上一个匹配操作的状态,无论是find()lookingAt()还是matches()

你的线路

String expectingAab = Pattern.compile(regex).matcher(line).toMatchResult().group(1);

不会调用这些方法中的任何一个,因此,永远不会有以前的匹配并且总是产生一个IllegalStateException: No match found.

如果你想要一个单行来提取第一场比赛的第一组,你可以简单地使用

String expectingAab = line.replaceFirst(".*?(a*b)a{3}.*", "$1");

该模式需要在实际匹配模式.*?之前和.*之后,消耗剩余的字符串并且只留下第一组作为其内容。需要注意的是,如果不存在匹配项,它将评估为原始字符串。

所以如果你想要matches而不是find语义,你可以使用

String expectingNoMatch = line.replaceFirst("^(a*b)a{3}$", "$1");

它将使用示例输入评估为原始字符串,因为它不匹配。

如果您希望您的实用程序方法不创建FindResult实例,只需使用直接的static方法。

但是,这是过早优化的典型案例。Pattern.compile调用创建一个Pattern对象,加上一堆表示模式元素的内部节点对象,调用matcher创建一个Matcher实例加上数组来保存组,toMatchResult调用创建另一个对象实例,当然,group(1)调用不可避免地创建一个新的字符串实例代表结果。

实例的创建FindResult是这一行中最便宜的。如果您关心性能,则保留Pattern.compile多次使用该模式的结果,因为这是最昂贵的操作,并且Pattern实例是不可变的和可共享的,正如其文档中明确指出的那样。

当然,字符串方法replaceFirstreplaceAll没有什么魔力,只是在后台执行相同的步骤。

于 2021-04-07T09:50:39.287 回答
3

该方法不需要实例字段即可工作。它可以只是一个静态助手:

class MatcherUtils {
  public static MatchResult findResult(Matcher matcher) {
    matcher.find();
    return matcher.toMatchResult();
  }
}

用法:

MatchResult result = MatcherUtils.findResult(Pattern.compile("...").matcher("..."));

find请注意,当找不到任何东西时,您可能想要处理此案(感谢单线,霍尔格!):

class MatcherUtils {
  public static Optional<MatchResult> findResult(Matcher matcher) {
    return Optional.of(matcher)
             .filter(Matcher::find)
             .map(Matcher::toMatchResult);
    /*
    if (matcher.find()) {
      return Optional.of(matcher.toMatchResult());
    } else {
      return Optional.empty();
    }
    */
  }
}
于 2021-04-07T09:50:19.117 回答