请解释一下,为什么match()
只返回一个匹配,而不是四个(例如):
s = 'aaaa'
p /a/.match(s).to_a # => ["a"]
奇怪的是,分组match()
返回两个匹配,独立于真实匹配计数:
s = 'aaaa'
p /(a)/.match(s).to_a # => ["a", "a"]
s = 'a aaa a'
p /(a)/.match(s).to_a # => ["a", "a"]
感谢您的回答。
您需要.scan()
多次匹配:
p s.scan(/a/).to_a
并且通过分组,您会得到一个整体匹配结果,每个组一个结果(使用时.match()
。两个结果在您的正则表达式中是相同的。
一些例子:
> /(a)/.match(s).to_a
=> ["a", "a"] # First: Group 0 (overall match), second: Group 1
> /(a)+/.match(s).to_a
=> ["aaaa", "a"] # Regex matches entire string, group 1 matches the last a
> s.scan(/a/).to_a
=> ["a", "a", "a", "a"] # Four matches, no groups
> s.scan(/(a)/).to_a
=> [["a"], ["a"], ["a"], ["a"]] # Four matches, each containing one group
> s.scan(/(a)+/).to_a
=> [["a"]] # One match, the last match of group 1 is retained
> s.scan(/(a+)(a)/).to_a
=> [["aaa", "a"]] # First group matches aaa, second group matches final a
> s.scan(/(a)(a)/).to_a
=> [["a", "a"], ["a", "a"]] # Two matches, both group participate once per match
按特征,match
只匹配一次。单个匹配对应一个MatchData
实例,并MatchData#to_a
返回一个数组,其中第 0 个元素是整个匹配,其他第 n 个元素分别是第 n 个捕获。捕获是与内部匹配的任何内容()
。如果您在正则表达式中没有任何内容()
,则该数组将只有整个匹配项。
之所以有多个"a"
in ["a", "a"]
with/(a)/
是因为单个 match 除了整个 match 之外还有一个 capture:第一个"a"
表示整个 match,对应于/(a)/
,第二个"a"
表示第一个 capture,对应于a
inside (a)
。
如果您想匹配任意多个匹配项,请使用scan
.