我有一个混合了大写和小写字母的字符串。我需要找到每个被 3 个大写字母包围的小写字母并将其从字符串中提取出来。
例如ZZZaZZZ
,我想提取a
上一个字符串中的。
我写了一个能够提取ZZZaZZZ
但不是a
单独的脚本。我知道我需要使用嵌套的正则表达式来执行此操作,但我无法完全了解如何实现这一点。以下是我所拥有的:
import string, re
if __name__ == "__main__":
#open the file
eqfile = open("string.txt")
gibberish = eqfile.read()
eqfile.close()
r = re.compile("[A-Z]{3}[a-z][A-Z]{3}")
print r.findall(gibberish)
编辑:
谢谢你们的回答!我想我应该更具体一些。我需要找到被三个完全相同的大写字母包围的小写字母,例如在我的示例ZZZaZZZ
中。