我有一个字母数字参考 ID 列表。它们有 3 个数字,左边补零,后跟一个字母,再后面是 3 个数字,同样,左边补零。
例如。
original_ref_list = ["005a004",
"018b003",
"007a029",
"105a015"]
如您所见,两组数字都用零填充。我想获得相同的引用,而字母两侧没有零填充,但不删除所有零。
例如。
fixed_ref_list = ["5a4",
"18b3",
"7a29",
"105a15"]
我可以通过搜索三个正则表达式模式、组合结果并将其附加到列表中来做到这一点:
fixed_ref_list = list()
for i in original_ref_list:
first_refpat = re.compile(r'[1-9]\d*[a-z]\d+')
first_refpatiter = first_refpat.finditer(gloss[2])
for first_ref_find in first_refpatiter:
first_ref = first_ref_find.group()
second_refpat = re.compile(r'[a-z]\d+')
second_refpatiter = second_refpat.finditer(first_ref)
for second_ref_find in second_refpatiter:
second_ref = second_ref_find.group()[1:]
third_refpat = re.compile(r'[1-9]\d*')
third_refpatiter = third_refpat.finditer(second_ref)
for third_ref_find in third_refpatiter:
third_ref = third_ref_find.group()
fixed_ref_list.append(first_ref[:-len(second_ref)] + third_ref)
但这似乎是一个尴尬的解决方案。是否有一种内置方法可以仅返回正则表达式模式的一部分,或者在返回结果之前删除填充?或者,有什么方法可以做我想要的不那么混乱的事情吗?