您可以对命名组使用正则表达式。
您基本上首先创建正则表达式(我为这两种情况创建了两个:数字优先或字母优先)。然后检查输入是否匹配。如果是这样,则调用groupdict()
生成的匹配对象以获取类似{'digits':'11547', 'letters':'QSD'}
. 然后你就用它(我打印了它)。
遵循上述建议的完整示例:
>>> import re
>>> checks = [
re.compile(r'^(?P<digits>\d+)(?P<letters>\D+)$'),
re.compile(r'^(?P<letters>\D+)(?P<digits>\d+)$'),
]
>>> inputs = ['11547QSD', 'ABC98765', '111ABC111']
>>> for item in inputs:
for check in checks:
if check.match(item):
print('Digits are {digits}, letters are {letters}'.format(
**check.search(item).groupdict()
))
break
else:
print('%s is incorrect' % (item,))
Digits are 11547, letters are QSD
Digits are 98765, letters are ABC
111ABC111 is incorrect
缩短版
如果您了解上述内容,您可以缩短代码并创建结果 dict(匹配字符串 - 结果组),如下所示:
>>> from itertools import product
>>> {item: check.search(item).groupdict()
for (item, check) in product(inputs, checks) if check.match(item)}
{'ABC98765': {'digits': '98765', 'letters': 'ABC'},
'11547QSD': {'digits': '11547', 'letters': 'QSD'}}
注意:
我使用了元字符\d
和\D
. 第一个基本上意味着“数字”,第二个意味着“非数字”。有关它们的含义的详细信息在这里。