我有一个长字符串,看起来像:
s = 'label("id1","A") label("id1","B") label("id2", "C") label("id2","A") label("id2","D") label("id3","A")'
我想使用正则表达式来创建基于 id 的标签列表。
更清楚地说,从s
示例中的字符串中,我想得到一个结果列表,如下所示:
[("id1", ["A","B"]),
("id2", ["C","A","D"]),
("id3", ["A"])]
使用正则表达式,我设法获取了 id 和元素:
import re
regex = re.compile(r'label\((\S*),(\S*)\)')
results = re.findall(regex,s)
使用此代码,results
如下所示:
[('"id1"', '"A"'),
('"id1"', '"B"'),
('"id2"', '"A"'),
('"id2"', '"D"'),
('"id3"', '"A"')]
有没有一种简单的方法可以从正则表达式中获取已经正确分组的数据?