0

这个问题与 PCRE 有关。

我已经看到了对与此构造一起使用的嵌套括号的递归搜索:

\(((?>[^()]+)|(?R))*\)

这样做的问题是,虽然 ' [^()]+ ' 可以匹配任何字符,包括换行符,但您只能匹配单字符字符,例如大括号、方括号、标点符号、单个字母等。

我想要做的是用任何类型的模式(例如,'BEGIN' 和'END' 之类的关键字)替换'(' 和')' 字符。

我想出了以下构造:

(?xs)  (?# <-- 'xs' ignore whitespace in the search term, and allows '.'
               to match newline )
(?P<pattern1>BEGIN)
(
   (?> (?# <-- "once only" search )
      (
         (?! (?P=pattern1) | (?P<pattern2>END)).
      )+
   )
   | (?R)
)*
END

这实际上适用于如下所示的内容:

BEGIN <<date>>
  <<something>
    BEGIN
      <<something>>
    END <<comment>>
    BEGIN <<time>>
      <<more somethings>>
      BEGIN(cause we can)END
      BEGINEND
    END
  <<something else>>
END

这成功匹配任何嵌套的 BEGIN..END 对。

我分别为BEGINEND设置了命名模式pattern1pattern2。在搜索词中使用pattern1效果很好。但是,我不能在搜索结束时使用pattern2:我必须写出' END '。

知道如何重写这个正则表达式,所以我只需指定一次模式并在代码中“无处不在”使用它们吗?换句话说,所以我不必在搜索的中间和最后都写END 。

4

2 回答 2

3

要进一步扩展@Kobis 的答案,请参阅以下正则表达式:

(?xs)
(?(DEFINE)
        (?<pattern1>BEGIN)
        (?<pattern2>END)
)
(?=((?&pattern1)
(?:
   (?> (?# <-- "once only" search )
      (?:
         (?! (?&pattern1) | (?&pattern2)) .
      )+
   )*
   | (?3)
)*
(?&pattern2)
))

这个正则表达式甚至可以让您获取每个单独数据块的数据!使用第三个反向引用,因为前两个已在定义块中定义。

演示:http ://regex101.com/r/bX8mB6

于 2014-05-28T17:54:27.403 回答
0

(?(DEFINE))这看起来像是用于创建此类构造的块的一个很好的用例。Perl 的例子是:

(?xs)
(?(DEFINE)
        (?<pattern1>BEGIN)
        (?<pattern2>END)
)
(?&pattern1)
(
   (?> (?# <-- "once only" search )
      (
         (?! (?&pattern1) | (?&pattern2)).
      )+
   )
   | (?R)
)*
(?&pattern2)

示例:http: //ideone.com/8o9cg

(请注意我真的不知道任何 perl,并且无法让它在任何在线测试人员的 PHP 上工作)

另见:http ://www.pcre.org/pcre.txt (寻找(?(DEFINE)0 它看起来不像他们有页面)


适用于大多数风格的低技术解决方案是在模式开始时使用前瞻:

(?=.*?(?P<pattern1>BEGIN))
(?=.*?(?P<pattern2>END))
...
(?P=pattern1) (?# should work - it was captured )
于 2012-05-28T16:53:19.280 回答