描述
通过正则表达式处理这个可能不是最好的方法,但是因为可能有使用正则表达式的原因,例如“我不允许安装 HTMLAgilityPack”,那么这个表达式将:
- 查找所有只是打开标签后跟关闭标签的标签
- 将避免许多使 HTML 中的模式匹配与正则表达式困难的边缘情况
正则表达式:(<(\w+)(?=\s|>)(?:[^'">=]*|='[^']*'|="[^"]*"|=[^'"][^\s>]*)*>)(<\/\2>)
用。。。来代替:$1~~~NewValue~~~$3
例子
现场演示
示例文本
注意第一行有一些非常困难的边缘情况
<a onmouseover=' str=" <a></a> " ; if ( 6 > 4 ) { funDoSomething(str); } '></a>
<div></div>
<span>test</span>
<a></a>
替换后的文本
<a onmouseover=' str=" <a></a> " ; if ( 6 > 4 ) { funDoSomething(str); } '>~~~NewValue~~~</a>
<div>~~~NewValue~~~</div>
<span>test</span>
<a>~~~NewValue~~~</a>