5

请解释一下,为什么match()只返回一个匹配,而不是四个(例如):

s = 'aaaa'
p /a/.match(s).to_a # => ["a"]

奇怪的是,分组match()返回两个匹配,独立于真实匹配计数:

s = 'aaaa'
p /(a)/.match(s).to_a # => ["a", "a"]

s = 'a aaa a'
p /(a)/.match(s).to_a # => ["a", "a"]

感谢您的回答。

4

2 回答 2

11

您需要.scan()多次匹配:

p s.scan(/a/).to_a

并且通过分组,您会得到一个整体匹配结果,每个组一个结果(使用时.match()。两个结果在您的正则表达式中是相同的。

一些例子:

> /(a)/.matc­h(s).to_a
=> ["a", "a"]           # First: Group 0 (overall match), second: Group 1
> /(a)+/.mat­ch(s).to_a­
=> ["aaaa", "a"]        # Regex matches entire string, group 1 matches the last a
> s.scan(/a/­).to_a
=> ["a", "a", "a", "a"] # Four matches, no groups
> s.scan(/(a­)/).to_a
=> [["a"], ["a"], ["a"], ["a"]] # Four matches, each containing one group
> s.scan(/(a­)+/).to_a
=> [["a"]]              # One match, the last match of group 1 is retained
> s.scan(/(a­+)(a)/).to­_a
=> [["aaa", "a"]]       # First group matches aaa, second group matches final a
> s.scan(/(a­)(a)/).to_­a
=> [["a", "a"], ["a", "a"]] # Two matches, both group participate once per match
于 2013-10-15T05:37:12.457 回答
3

按特征,match只匹配一次。单个匹配对应一个MatchData实例,并MatchData#to_a返回一个数组,其中第 0 个元素是整个匹配,其他第 n 个元素分别是第 n 个捕获。捕获是与内部匹配的任何内容()。如果您在正则表达式中没有任何内容(),则该数组将只有整个匹配项。

之所以有多个"a"in ["a", "a"]with/(a)/是因为单个 match 除了整个 match 之外还有一个 capture:第一个"a"表示整个 match,对应于/(a)/,第二个"a"表示第一个 capture,对应于ainside (a)

如果您想匹配任意多个匹配项,请使用scan.

于 2013-10-15T05:41:47.053 回答