我想用'*'替换正则表达式,但前提是正则表达式在<>之外。重点是不要干扰 html 标签。
我用它来替换:
re.sub(r'SOMEREGEX(?=[^>]*(<|$))', '*', line)
但是我遇到了他的问题:如果我的正则表达式是:
f.*k
然后这个:
fzzzzzzzzz<HTMLTAG>zzzzzzzk
会变成一个'*',这是我不想要的。我该如何克服这个问题?
约束:
-所有括号都匹配
- 没有嵌套括号
-SOMEREGEX 由用户提供。我宁愿不改变这一点。