4
i="<wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x2887828> >]], [[[41, 183], 'Button', <wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x28879d0> >]]]"

m = re.findall("<wx.(.*)> >", i)

会给我

["<wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x2887828> >]], [[[41, 183], 'Button', <wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x28879d0> >"]

然而我想要它给我,

["<wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x2887828> >","<wx._controls.Button; proxy of <Swig Object of type 'wxButton *' at 0x28879d0> >"]

正则表达式一直搜索到最后,我想取出与正则表达式匹配的所有部分,有没有人知道这个问题的解决方案?

4

1 回答 1

7

*操作员默认是贪婪的。您可以通过在其后添加一个来更改?它。还记得引用文字点。

我还使组不匹配,否则您将无法获得所需的输出(这似乎也是您原始代码的问题):

re.findall(r"<wx\.(?:.*?)> >", i)

另一种可能性如下(假设恰好一个<字符出现在第一个字符之前>),这比使用惰性*运算符的版本更快:

re.findall(r"<wx\.[^<]*<[^<]*> >", i)
于 2012-05-31T20:39:56.000 回答