93

我希望这行 JavaScript:

"foo bar baz".match(/^(\s*\w+)+$/)

返回类似的东西:

["foo bar baz", "foo", " bar", " baz"]

但它只返回最后捕获的匹配:

["foo bar baz", " baz"]

有没有办法获取所有捕获的匹配项?

4

5 回答 5

97

当您重复捕获组时,在大多数情况下,仅保留最后一次捕获;任何先前的捕获都将被覆盖。在某些方面,例如 .NET,您可以获得所有中间捕获,但 Javascript 并非如此。

也就是说,在 Javascript 中,如果您有一个包含N个捕获组的模式,那么每次匹配只能捕获N个字符串,即使其中一些组被重复。

所以一般来说,取决于你需要做什么:

  • 如果这是一个选项,请改为分隔分隔符
  • 而不是匹配/(pattern)+/,也许是匹配/pattern/g,也许是在一个exec循环 中
    • 请注意,这两者并不完全相同,但它可能是一种选择
  • 进行多级匹配:
    • 在一场比赛中捕获重复的组
    • 然后运行另一个正则表达式将匹配分开

参考


例子

这是一个在文本中匹配的示例<some;words;here>,使用exec循环,然后拆分;以获取单个单词(另请参见 ideone.com):

var text = "a;b;<c;d;e;f>;g;h;i;<no no no>;j;k;<xx;yy;zz>";

var r = /<(\w+(;\w+)*)>/g;

var match;
while ((match = r.exec(text)) != null) {
  print(match[1].split(";"));
}
// c,d,e,f
// xx,yy,zz

使用的模式是:

      _2__
     /    \
<(\w+(;\w+)*)>
 \__________/
      1

这匹配<word>, <word;another>,<word;another;please>等。重复第 2 组以捕获任意数量的单词,但它只能保留最后一次捕获。整个单词列表由第 1 组捕获;然后,此字符串位于split分号分隔符上。

相关问题

于 2010-08-21T14:24:13.090 回答
7

这个怎么样?"foo bar baz".match(/(\w+)+/g)

于 2010-08-21T14:10:34.480 回答
6

除非您对如何拆分字符串有更复杂的要求,否则您可以拆分它们,然后返回初始字符串:

var data = "foo bar baz";
var pieces = data.split(' ');
pieces.unshift(data);
于 2010-08-21T14:22:30.333 回答
4

尝试使用“g”:

"foo bar baz".match(/\w+/g)
于 2010-08-21T15:41:10.703 回答
0

您可以使用 LAZY 评估。因此,不要使用 * (GREEDY),而是尝试使用 ? (懒惰的)

正则表达式:(\s*\w+)?

结果:

第一场比赛:foo

比赛2:酒吧

第三场比赛:巴兹

于 2021-09-28T10:53:56.180 回答