4

我想断言一个字符串包含两个相同的子字符串。

我试过这个正则表达式: [A-ZA-Z]{2}

我要检测的内容:

AZAZ
CUCU
PIPI

但是这个正则表达式只是检查是否连续有 4 个大写字母,所以

ABCD --> it's good and it shouldn't be 

如果不清楚,我真的很抱歉,我不知道如何编写正则表达式来断言重复。

4

1 回答 1

2

使用 Python,您可以执行以下操作:

p="((?P<two_chars>[A-Z]{2})(?P=two_chars))"
s="AZAZABCDCUCUPIPI"
re.findall(p, s)
[('AZAZ', 'AZ'), ('CUCU', 'CU'), ('PIPI', 'PI')]

然后从列表中提取您想要的元素。或者您可以更快地执行以下操作:

[k for k,v in re.findall(p,s)]
['AZAZ', 'CUCU', 'PIPI']

希望能帮助到你。

于 2013-10-03T09:50:12.077 回答