我已经阅读了有关如何使用平衡组的多个来源,但所有示例都只匹配最外面的匹配项。是否可以使用一个 RegEx 匹配与模式匹配的所有子字符串?(平台为.NET 4.0)
这是我想要的一个例子:输入:
a + ((b + (c + d)) + (e + f))
所需的匹配项(“教科书”RegEx 仅生成第一个匹配项):
- ((b + (c + d)) + (e + f))
- (b + (c + d))
- (c + d)
- (e + f)
这可以通过正则表达式在前瞻的帮助下完成。但这并不是最优的,因为它会为每场比赛“重新解析”一些括号组。使用真正的解析器只会读取/解析字符串一次,并且效率更高。
示例(ideone):
using System;
using System.Text.RegularExpressions;
public class Example
{
public static void Main()
{
var re = @"(?x) # ignore spaces and comments
(?= # lookahead (zero width)
(
\( # first (
(?:
(?<open> \( )* # open++
[^()]+
(?<-open> \) )* # open--
)+
\) # last )
(?(open)(?!)) # fail if unblanaced: open > 0
)
)
\( # eat a (, to advance the match a char";
var str = "a + ((b + (c + d)) + (e + f)) + (x + ((y) + (z)) + x)";
var m = Regex.Matches(str, re);
Console.WriteLine("Matched: ");
foreach (Match i in m)
Console.WriteLine(i.Groups[1]);
}
}
输出:
Matched:
((b + (c + d)) + (e + f))
(b + (c + d))
(c + d)
(e + f)
(x + ((y) + (z)) + x)
((y) + (z))
(y)
(z)
如果您使用的是 javascript,这里有一个适用于上述输入的示例,
var rgx = /\([a-z]+\s*\+\s*(\([a-z]+\s*\+\s*[a-z]+\s*\))\s*\)/g;
var str = 'a + (b + (c + d))';
console.log(rgx.exec(str));
它不适用于像这样的更多变量,因为它只是一个简单的测试用例
a + (d + (c + e) + x)