我有一个 Python 正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在。例子:
re.search("(\w)*", "abcdefg").groups
()
这将返回列表 ('g',)
我需要它返回 ('a','b','c','d','e','f','g',)
那可能吗?我该怎么做?
我有一个 Python 正则表达式,其中包含一个可以出现零次或多次的组 - 但是当我之后检索组列表时,只有最后一个存在。例子:
re.search("(\w)*", "abcdefg").groups
()
这将返回列表 ('g',)
我需要它返回 ('a','b','c','d','e','f','g',)
那可能吗?我该怎么做?
re.findall(r"\w","abcdefg")
除了Douglas Leeder 的解决方案,这里是解释:
在正则表达式中,组数是固定的。将量词放在组后面不会增加组计数(想象所有其他组索引都会增加,因为更早的组匹配不止一次)。
当需要多次匹配时,带有量词的组是使复杂子表达式原子化的方式。正则表达式引擎除了将最后一个匹配项仅保存到组之外别无他法。简而言之:没有办法用一个“手无寸铁”的正则表达式来实现你想要的,你必须找到另一种方法。