3

如何获取带有星号的组的内容?

例如,我想削减一个逗号分隔的列表,例如1,2,3,4,5.

private static final String LIST_REGEX = "^(\\d+)(,\\d+)*$";
private static final Pattern LIST_PATTERN = Pattern.compile(LIST_REGEX);

public static void main(String[] args) {
    final String list = "1,2,3,4,5";
    final Matcher matcher = LIST_PATTERN.matcher(list);
    System.out.println(matcher.matches());
    for (int i = 0, n = matcher.groupCount(); i < n; i++) {
        System.out.println(i + "\t" + matcher.group(i));
    }
}

输出是

true
0   1,2,3,4,5
1   1

我怎样才能得到每一个条目,即1, 2, 3, ...?

我正在寻找一个通用的解决方案。这只是一个示范性的例子。
请想象一个更复杂的正则表达式,比如^\\[(\\d+)(,\\d+)*\\]$匹配一个列表[1,2,3,4,5]

4

2 回答 2

5

您可以使用String.split().

for (String segment : "1,2,3,4,5".split(","))
    System.out.println(segment);

或者您可以使用断言重复捕获:

Pattern pattern = Pattern.compile("(\\d),?");
for (Matcher m = pattern.matcher("1,2,3,4,5");; m.find())
     m.group(1);

对于您添加的第二个示例,您可以进行类似的匹配。

for (String segment : "!!!!![1,2,3,4,5] //"
                          .replaceFirst("^\\D*(\\d(?:,\\d+)*)\\D*$", "$1")
                          .split(","))
    System.out.println(segment);

我做了一个在线代码演示。我希望这是你想要的。


如何获得带有星号的任意组的所有匹配项(零个、一个或多个)(xyz)*[组重复,我想得到每一个重复的捕获。]

你不能。正则表达式捕获组和反向引用说明了原因:

给定组的返回值是最后捕获的值

由于带有量词的捕获组保留其编号,因此当您检查该组时引擎会返回什么值?所有引擎都返回最后捕获的值。例如,如果您将字符串A_B_C_D_与匹配([A-Z]_)+,当您检查匹配时,第 1 组将是D_。除 .NET 引擎外,所有中间值都将丢失。实质上,组 1 每次匹配其模式时都会被覆盖。

于 2014-09-15T23:21:12.423 回答
2

我假设您可能正在寻找类似以下的内容,这将处理您的两个示例。

private static final String LIST_REGEX = "^\\[?(\\d+(?:,\\d+)*)\\]?$";
private static final Pattern LIST_PATTERN = Pattern.compile(LIST_REGEX);

public static void main(String[] args) {
    final String list = "[1,2,3,4,5]";
    final Matcher matcher = LIST_PATTERN.matcher(list);

    matcher.find(); 
    int i = 0;

    String[] vals = matcher.group(1).split(",");

    System.out.println(matcher.matches());
    System.out.println(i + "\t" + matcher.group(1));

    for (String x : vals) {
       i++;
       System.out.println(i + "\t" + x);
    }
}

输出

true
0   1,2,3,4,5
1   1
2   2
3   3
4   4
5   5
于 2014-09-15T23:24:07.080 回答