2

我已经阅读了有关如何使用平衡组的多个来源,但所有示例都只匹配最外面的匹配项。是否可以使用一个 RegEx 匹配与模式匹配的所有子字符串?(平台为.NET 4.0)

这是我想要的一个例子:输入:

a + ((b + (c + d)) + (e + f))

所需的匹配项(“教科书”RegEx 仅生成第一个匹配项):

  • ((b + (c + d)) + (e + f))
  • (b + (c + d))
  • (c + d)
  • (e + f)
4

2 回答 2

2

这可以通过正则表达式在前瞻的帮助下完成。但这并不是最优的,因为它会为每场比赛“重新解析”一些括号组。使用真正的解析器只会读取/解析字符串一次,并且效率更高。

示例(ideone):

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      var re = @"(?x)  # ignore spaces and comments
(?=                    # lookahead (zero width)
  (
    \(                 # first (
    (?:
      (?<open> \( )*   # open++
      [^()]+
      (?<-open> \) )*  # open--
    )+
    \)                 # last )
    (?(open)(?!))      # fail if unblanaced: open > 0
  )
)
\(                     # eat a (, to advance the match a char";

      var str = "a + ((b + (c + d)) + (e + f)) + (x + ((y) + (z)) + x)";

      var m = Regex.Matches(str, re);

      Console.WriteLine("Matched: ");
      foreach (Match i in m)
        Console.WriteLine(i.Groups[1]);
   }
}

输出:

Matched: 
((b + (c + d)) + (e + f))
(b + (c + d))
(c + d)
(e + f)
(x + ((y) + (z)) + x)
((y) + (z))
(y)
(z)
于 2013-04-01T23:05:43.613 回答
0

如果您使用的是 javascript,这里有一个适用于上述输入的示例,

var rgx = /\([a-z]+\s*\+\s*(\([a-z]+\s*\+\s*[a-z]+\s*\))\s*\)/g;
var str = 'a + (b + (c + d))';  
console.log(rgx.exec(str));

它不适用于像这样的更多变量,因为它只是一个简单的测试用例

a + (d + (c + e) + x)
于 2013-04-01T22:35:36.143 回答