"(.*)"
给定"a (b) c (d) e"
python 匹配"b"
而不是 ,如何制作这样的 python 正则表达式"b) c (d"
?
我知道我可以使用"[^)]"
而不是"."
,但我正在寻找一个更通用的解决方案,让我的正则表达式更简洁。有没有办法告诉python“嘿,尽快匹配这个”?
"(.*)"
给定"a (b) c (d) e"
python 匹配"b"
而不是 ,如何制作这样的 python 正则表达式"b) c (d"
?
我知道我可以使用"[^)]"
而不是"."
,但我正在寻找一个更通用的解决方案,让我的正则表达式更简洁。有没有办法告诉python“嘿,尽快匹配这个”?
>>> x = "a (b) c (d) e"
>>> re.search(r"\(.*\)", x).group()
'(b) c (d)'
>>> re.search(r"\(.*?\)", x).group()
'(b)'
根据文档:
'
*
'、'+
' 和 '?
' 限定符都是贪婪的;它们匹配尽可能多的文本。有时这种行为是不希望的;如果 RE<.*>
与 '<H1>title</H1>
' 匹配,它将匹配整个字符串,而不仅仅是 '<H1>
'。在限定符之后添加 '?
' 使其以非贪婪或最小方式执行匹配;将匹配尽可能少的字符。.*?
在前面的表达式中使用将只匹配 '<H1>
'。
行不通\\(.*?\\)
?那是非贪婪的语法。
使用不贪婪的匹配是一个好的开始,但我也建议您重新考虑使用.*
-- 这个怎么样?
groups = re.search(r"\([^)]*\)", x)
你想让它匹配“(b)”吗?按照 Zitrax 和 Paolo 的建议去做。你想让它匹配“b”吗?做
>>> x = "a (b) c (d) e"
>>> re.search(r"\((.*?)\)", x).group(1)
'b'
正如其他人所说,使用 ? * 量词上的修饰符将解决您的直接问题,但要小心,您开始误入正则表达式停止工作的区域,而您需要一个解析器。例如,字符串 "(foo (bar)) baz" 会给你带来麻烦。
首先,我不建议在正则表达式中使用“*”。是的,我知道,它是最常用的多字符分隔符,但它仍然是个坏主意。这是因为,虽然它确实匹配该字符的任何重复次数,但“任何”包含 0,这通常是您想要抛出语法错误而不是接受的东西。相反,我建议使用+
与长度 > 1 的任何重复匹配的符号。此外,据我所知,您正在处理固定长度的括号表达式。因此,您可能可以使用{x, y}
语法来专门指定所需的长度。
但是,如果你真的需要非贪婪的重复,我建议咨询全能的?
. 这,当放置在任何正则表达式重复说明符的末尾时,将强制正则表达式的该部分找到尽可能少的文本。
话虽这么说,我会非常小心?
,就像 Dr. Who 中的 Sonic 螺丝刀一样,如果不仔细校准,我应该怎么说,“有点”不受欢迎的东西。例如,要使用您的示例输入,它会将((1)
(注意缺少第二个 rparen)标识为匹配项。