2

我有一个带有模式的 preg_match_all 函数:

preg_match_all(
    '/\[(if) ([^\]]*)\]
    ((?:(?!\[if).|(?R))*?)
    \[endif\]/sx',
    $text,
    $matches
);

我猜这是很简单的模式,它寻找一个 syntax [if condition] sometext [endif],但它也支持嵌入 ifs fe [if condition1] aa [if condition2] bb [endif] [endif]。我使用 s 开关将换行符视为点(因为我想让它工作多行)和 x 以便于阅读(但删除 x 并不能解决问题)。

它适用于我拥有的大多数输入数据,但对于某些特定输入,它会在 nginx 服务器上导致 502 Bad gateway 错误,而日志中没有任何错误或异常。我正在使用 nginx + php-fpm (5.6.15-1+deb.sury.org~trusty+1),但 php7 也是如此。

这是导致 502 Bad gateway error 的 PHP 代码,您可以轻松检查它,非常简单,只是一个变量和正则表达式。

http://pastebin.com/G54Xa0as

请确保您以 1:1 的比例复制内容,其中包含所有空格、制表符等。

最奇怪的是,您可以删除几乎任何一行,甚至删除一个缩进(任何地方的任何几个空格)以使其正常工作。

我不知道这里出了什么问题,我能够创建这个文件来演示我的问题,但不知道如何解决它。

4

1 回答 1

2

您的正则表达式包含“缓和”点模式的负前瞻。但是,您未能为其添加结束分隔符,因此,它变得相当“沉重”。

我建议将结束分隔符 ( [endif]) 添加到前瞻检查中:

\[(if)\s+([^\]]*+)\]((?>(?!\[(?:end)?if\b).|(?R))*)\[endif\]
                             ^^^^^^^^

演示

或者,您甚至可以将经过调和的贪婪令牌展开为

\[(if)\s+([^\]]*+)\]((?>[^[]++(?:\[(?!(?:end)?if\b)[^[]*)*|(?R))*)\[endif\]

请参阅正则表达式演示(但是,如果 a[可以跟随[if...],它将不起作用)。

另外,请注意,您的正则表达式后面有一个空格,(if)并且由于您使用的是/x修饰符,因此它不被视为文字空格,而是被忽略。这就是为什么我将其更改为\s+.

于 2016-05-26T12:01:56.217 回答