我是正则表达式的新手。我有一个正则表达式,它从字符串中删除重复字符。
>>> self.repeat_regexp = re.compile(r'(\w*)(\w)\2(\w*)')
>>> self.repl = r'\1\2\3'
上面两行代码去掉了重复的字符。例如,loooooooove
转到love
。
但我想更改正则表达式模式,以便仅在重复字符重复超过 3 次时才替换。预期输出:
cannot ---> cannot
loooooooove ----> love
我不理解正则表达式r'(\w*)(\w)\2(\w*)'
,r'\1\2\3'
如果以可理解的方式解释上述正则表达式会很有帮助。