python - Python正则表达式，从字符串中获取名称

Question

我有一个形式为：

"[NUM : NAME : NUM]: [NUM : NAME : NUM]:..."

我希望能够从该字符串中提取所有名称。NAME 可以有任何字符，从字母到标点符号和数字。NUM 只能是 [0-9]+ 的形式

我尝试发出这个命令：

re.findall(r"\[[0-9]+\:([.]+)\:[0-9]+\]", string)

但是它没有给出我的要求，而是将几个 [NUM : NAME : NUM] 聚集到 [.]+ 组中，这在这个正则表达式方面也是正确的，但不是我需要的。

任何帮助将非常感激。

score 2 · Accepted Answer

尝试这个：

re.findall(r"\[[0-9]+\:(.+?)\:[0-9]+\]", string)

?在之后添加+是非贪婪的。贪婪意味着+在仍然匹配的同时将尽可能多的字符，默认情况下是贪婪的。通过添加，?您告诉它是非贪婪的，这意味着+它将采用最少数量的字符来匹配。

如果 num、: 和 name 之间没有空格，上述方法将起作用。

如果有空格，则使用：

re.findall(r"\[[0-9]+ \: (.+?) \: [0-9]+\]", string)

score 1 · Accepted Answer

你可以试试这个： -

>>> re.findall(r'\[[0-9]+[ ]*:(.+?):[ ]*[0-9]+\]', string)
6: [' NAME ', ' NAME ']

2 回答 2