我有一个文件,其中包含数百个这样的链接:
<h3>aspnet</h3>
<a href="http://example.com/1" icon="data:image/png;base64,iwl1zecylifzn3fz9fr3l4cdjqhigcmjo9m">Ex 1</a>
<a href="http://example.com/2" icon="data:image/png;base64,ivborw0kggoaaaansuheugaaaqcayaaaaf8">Ex 2</a>
<a href="http://example.com/3" icon="data:image/png;base64,jmiaw+f2pwdohka6t+hnyfanbkwoa1olmug">Ex 3</a>
所以我想删除所有元素
icon="data:image/png;base64,ivborw0kggoaaaansuheugaaabaaaaaqcayaaaaf8..."
从所有的行。我浏览了官方的 Notepad++ 正则表达式 wiki,经过几次试验后得出了这个结论:
icon=\"[^\.]+\"
这样做的问题是,它选择了第二个双引号并在下一个出现的双引号处停止。为了说明,这将选择以下内容:
icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt...">EX 1</a> <a href="
如果我将上述正则表达式修改为,
icon=\"[^\.]+\">
然后它几乎是完美的,但它也在选择>
:
icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt...">
我正在寻找的正则表达式会像这样选择:
icon="data:image/png;base64,...jbvebich4sec9zgth1sfue1cdt..."
我也尝试了以下,但它根本不匹配任何东西
icon=\"[^\.]+\"$