以下正则表达式有什么区别?
(\2amigo|(go!))+
(amigo|(go!))+
它们都匹配相同的字符串。 https://regexr.com/3u62t
前向参考是如何工作的?
它实际上根本不起作用(尽管正如 Wiktor Stribiżew 指出的那样,它可以与其他正则表达式风格一起使用)。
当\n
引用一个没有捕获任何东西的捕获组时,它匹配空字符串。您可以在 eg 中看到这一点/(a)?b\1/
,它与b
.
当\n
指的是模式中稍后出现的捕获组时,它通常还不能捕获任何东西。您可以在 eg 中看到这一点/\1b(a)/
,它与ba
.
您可能会认为在重复中,先前的捕获被保留,因此/(\2a(b))*/
会 match abbab
,但这不是它的工作方式:在重复中,当新的匹配开始时,捕获被重置。所以相反,它匹配abab
,不 abbab
匹配。
因此,前向引用完全没有用处,并且只匹配空字符串。你的两种模式没有区别。
第二个“(amigo|(go!))+”捕获:amigoamigo
第一个 "(\2amigo|(go!))+ 没有。
行为取决于语言。
在 Ruby 和 Perl 中也可以使用前向引用,但要确保引用的括号在使用时匹配。这通常意味着前向引用在某个重复组内。例如,在 Ruby 中,此正则表达式train
仅在其前缀至少为 1 时才匹配choo
:
$ irb
irb(main):052:0> regex = /(\2train|(choo))+/
=> /(\2train|(choo))+/
irb(main):053:0> 'choochootrain' =~ regex
=> 0
irb(main):054:0> $&
=> "choochootrain"
irb(main):055:0> $1
=> "chootrain"
irb(main):056:0> $2
=> "choo"
irb(main):004:0> 'train' =~ regex
=> nil
在 JavaScript 中情况并非如此:
[~/.../github-actions/225-github-actions-demo(master)]$ node
Welcome to Node.js v13.5.0.
Type ".help" for more information.
> regex = /(\2train|(choo))+/
/(\2train|(choo))+/
> regex.exec('train')
[
'train',
'train',
undefined,
index: 0,
input: 'train',
groups: undefined
]
事实上,它确实匹配train
(\2
假设为空):